ES2884155T3 - Serine protease variants and polynucleotides encoding the same - Google Patents

Serine protease variants and polynucleotides encoding the same Download PDF

Info

Publication number
ES2884155T3
ES2884155T3 ES17746004T ES17746004T ES2884155T3 ES 2884155 T3 ES2884155 T3 ES 2884155T3 ES 17746004 T ES17746004 T ES 17746004T ES 17746004 T ES17746004 T ES 17746004T ES 2884155 T3 ES2884155 T3 ES 2884155T3
Authority
ES
Spain
Prior art keywords
variant
protease
seq
substitution
positions
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17746004T
Other languages
Spanish (es)
Inventor
Dorte Klitgaard
Roland Pache
Martin Gudmand
Anders SANDSTRÖM
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Application granted granted Critical
Publication of ES2884155T3 publication Critical patent/ES2884155T3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Detergent Compositions (AREA)

Abstract

Una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3, en donde la variante comprende al menos una sustitución seleccionada del grupo que consiste en : A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, 139G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N1571, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4.A protease variant comprising a substitution at one or more positions corresponding to positions 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53 , 54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102 , 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161 , 167, 169, 175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258 , 262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325 , 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, and 364 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity with the polypeptide mature of SEQ ID NO: 3, and wherein the variant has increased thermostability as measured as enhancement factor, HIF, compared to the protease of SEQ ID NO: 3, wherein the variant comprises at least one substitution selected from the group that consists of : A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, 139G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V , F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P , K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A , E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109M, D109M, D109M , F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I 122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146I, T146I, T146I, T146. T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N1571, N1571, N1571. D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, V225Y, I22. S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314I, F314I, F314I, F314I, F314I, S317 A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, and V364I, and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 1.4 .

Description

DESCRIPCIÓNDESCRIPTION

Variantes de serina proteasa y polinucleótidos que codifican las mismasSerine protease variants and polynucleotides encoding the same

REFERENCIA A UN LISTADO DE SECUENCIASREFERENCE TO A SEQUENCE LISTING

Esta solicitud contiene un Listado de Secuencias en formato legible por computadora.This application contains a Sequence Listing in computer readable format.

ANTECEDENTES DE LA INVENCIÓNBACKGROUND OF THE INVENTION

La producción de productos de fermentación, tales como etanol, a partir de material que contiene almidón es bienThe production of fermentation products, such as ethanol, from starch-containing material is well

conocida en la técnica. Generalmente se utilizan dos tipos diferentes de procedimientos. El procedimiento másknown in the art. Two different types of procedures are generally used. The procedure more

comúnmente utilizado, al que se alude a menudo como un "procedimiento convencional", incluye licuar almidóncommonly used, often referred to as a "conventional procedure", includes liquefying starch

gelatinizado a alta temperatura utilizando típicamente una alfa-amilasa bacteriana, seguido de sacarificación ygelatinized at high temperature typically using a bacterial alpha-amylase, followed by saccharification and

fermentación simultáneas llevadas a cabo en presencia de una glucoamilasa y un organismo fermentador. OtroSimultaneous fermentation carried out in the presence of a glucoamylase and a fermenting organism. Other

procedimiento bien conocido, al que se alude a menudo como un procedimiento de "hidrólisis de almidón bruto"well-known process, often referred to as a "crude starch hydrolysis" process

(procedimiento RSH) incluye sacarificar y fermentar simultáneamente almidón granular por debajo de la temperatura(RSH procedure) includes simultaneously saccharifying and fermenting granular starch below temperature

de gelatinización inicial, típicamente en presencia de una alfa-amilasa fúngica ácida y una glucoamilasa.of initial gelatinization, typically in the presence of an acid fungal alpha-amylase and a glucoamylase.

La patente de EE.UU. N° 5.231.017-A describe el uso de una proteasa fúngica ácida durante la fermentación de etanolUS Patent No. 5,231,017-A describes the use of an acidic fungal protease during ethanol fermentation

en un procedimiento que comprende licuar almidón gelatinizado con una alfa-amilasa.in a process comprising liquifying gelatinized starch with an alpha-amylase.

El documento WO 2003/066826 describe un procedimiento de hidrólisis de almidón bruto (procedimiento RSH) llevadoDocument WO 2003/066826 describes a crude starch hydrolysis process (RSH process) carried out

a cabo en maceración no cocida en presencia de glucoamilasa fúngica, alfa-amilasa y proteasa fúngica.carried out in uncooked maceration in the presence of fungal glucoamylase, alpha-amylase and fungal protease.

El documento WO 2007/145912 describe un procedimiento para producir etanol que comprende poner en contactoWO 2007/145912 describes a process for producing ethanol comprising contacting

una suspensión que comprende almidón granular obtenido de material vegetal con una alfa-amilasa capaz dea suspension comprising granular starch obtained from plant material with an alpha-amylase capable of

solubilizar almidón granular a un pH de 3,5 a 7,0 y a una temperatura por debajo de la temperatura de gelatinizaciónsolubilize granular starch at a pH of 3.5 to 7.0 and at a temperature below the gelatinization temperature

del almidón durante un período. de 5 minutos a 24 horas; obtener un sustrato que comprende más del 20% de glucosa,of starch over a period. from 5 minutes to 24 hours; obtain a substrate comprising more than 20% glucose,

y fermentar el sustrato en presencia de un organismo fermentador y enzimas que hidrolizan el almidón a unaand fermenting the substrate in the presence of a fermenting organism and enzymes that hydrolyze starch to a

temperatura entre 10°C y 40°C durante un período de 10 horas a 250 horas. Enzimas adicionales añadidas durantetemperature between 10°C and 40°C for a period of 10 hours to 250 hours. Additional enzymes added during

la etapa de contacto pueden incluir proteasa.the contact step may include protease.

El documento WO 2014/037438 describe serina proteasas de tipo salvaje derivadas de Meripilus giganteus, Trametes WO 2014/037438 describes wild-type serine proteases derived from Meripilus giganteus, Trametes

versicolor, y Dichomitus squalens y su uso en la alimentación animal. La proteasa de T. versicolor comparte versicolor, and Dichomitus squalens and their use in animal feed. The T. versicolor protease shares

aproximadamente un 86% de identidad con las proteasas variantes de la invención.about 86% identity with the variant proteases of the invention.

El documento WO 2015/197871 describe una secuencia de aminoácidos madura de una proteasa de Meripilus WO 2015/197871 describes a mature amino acid sequence of a Meripilus protease

giganteus. Esta proteasa es idéntica a la proteasa parental de tipo salvaje utilizada como punto de partida de acuerdo giganteus. This protease is identical to the wild-type parental protease used as a starting point in agreement

con la presente invención para desarrollar proteasas variantes que tienen propiedades mejoradas.with the present invention to develop variant proteases having improved properties.

Es un objeto de la presente invención identificar variantes de las proteasas de M. giganteus S53 que darán comoIt is an object of the present invention to identify variants of the proteases of M. giganteus S53 that will give as

resultado una estabilidad de almacenamiento incrementada (p. ej., estabilidad térmica incrementada) y un rendimientoThis results in increased storage stability (i.e., increased thermal stability) and improved performance.

de expresión mejorado de la proteasa variante en comparación con la enzima parental de tipo salvaje.Enhanced expression of the variant protease compared to the wild-type parental enzyme.

La presente invención proporciona variantes de proteasa con propiedades mejoradas en comparación con su parental.The present invention provides protease variants with improved properties compared to their parent.

SUMARIO DE LA INVENCIÓNSUMMARY OF THE INVENTION

En un primer aspecto, la presente invención se refiere a variantes de proteasa que comprenden una sustitución enIn a first aspect, the present invention relates to protease variants comprising a substitution in

una o más posiciones correspondientes a las posiciones 1,5, 9, 25, 29,30, 32, 38, 39, 40, 41,42, 45, 46, 49, 50, 53,one or more positions corresponding to positions 1,5,9,25,29,30,32,38,39,40,41,42,45,46,49,50,53,

54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169,54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169,

175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258,175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258,

262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322,262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322,

324, 325, 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del324, 325, 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, and 364

polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, alpolypeptide of SEQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at

menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de laleast 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% identity of the

secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una termoestabilidad incrementadasequence with the mature polypeptide of SEQ ID NO: 3, and wherein the variant has increased thermostability

medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3, en donde la variantemeasured as enhancement factor, HIF, compared to the protease of SEQ ID NO: 3, wherein the variant

comprende al menos una sustitución seleccionada del grupo que consiste en : A1T, S5I, S5K, S5L, S5Y, T9H, K25P,comprises at least one substitution selected from the group consisting of: A1T, S5I, S5K, S5L, S5Y, T9H, K25P,

S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C,S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C,

F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V,F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V,

Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G,Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G,

T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L,T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L,

E81 P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V,

I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q161 E, T167F, I169F,I105Q, D109H, D109K, D109m, D109Y, F111H, F111K, F111S, F111Y, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146i, T146L, T146N, T146L T146N I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q167F E, T11661E,

I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L,I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F19M, Q207L, V209F, S210T, T213L, T213R, A216R, F217i, F217Y, V225Y, I228L, I228T, I228W, Y231i, I228W, Y231i S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L,

V271 R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, y en donde la sustitución en una o más posiciones proporciona una variante de proteasa que tiene un aumento en la termoestabilidad medida como factor de mejora, HIF, de al menosV271 R, S272i, S272K, S272L, S272R, S272Y, T276L, T276Y, G278P, D280N, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, R299N, K305S, L308V, P313L , F314i, F314L, S317E, S317N, S317W, S318P, A319F, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329L S329N, S329T, S329V, S329W, G330Q , S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S , L361M, T362L, T362N, A363G, A363L, and V364I, and wherein substitution at one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least

1,4.1.4.

En un segundo aspecto, la presente invención se refiere a variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61,In a second aspect, the present invention relates to protease variants comprising a substitution at one or more positions corresponding to positions 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55 , 58, 59, 60, 61,

62, 66, 69, 76, 81,87, 93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145,62, 66, 69, 76, 81,87, 93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145,

146, 148, 149, 150, 153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211,146, 148, 149, 150, 153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211,

213, 216, 219, 228, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 275, 276, 277, 280, 285, 294, 296, 299, 303, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 358, 359, 361,362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una actividad específica incrementada medida como factor de mejora, AIF, en comparación con la proteasa de SEQ213, 216, 219, 228, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 275, 276, 277, 280, 285, 294, 296, 299, 303, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 358, 359, 361,362, 363, and 364 of the polypeptide of SEQ ID NO: 3, and the variant has activity protease, and wherein the variant has at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the polypeptide mature of SEQ ID NO: 3, and wherein the variant has an increased specific activity measured as enhancement factor, AIF, compared to the protease of SEQ

ID NO: 3, en donde la variante comprende al menos una sustitución seleccionada del grupo que consiste en : G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101 F, P101L, P101M, P101 R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M,ID NO: 3, wherein the variant comprises at least one substitution selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y , K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N , S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R , T102C, T102I, T103V, D109P, D110W, N115A, N115D, E117F, E117G, E117L, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T , N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A , Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146Q, T146W, S148G, A149V, K150F, N153D, N153F, N153G, Q154C, Q154F, Q154G, Q154L, Q154M, Q154L, Q154V, Q154T, Q154V, Q154W, N157F, N157A, N157E, N157F, N157A, N154E N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, M200L, Q207F, G208H, V209F, V209G, V209W, V209Y, S210E, S210L, S210R, S210T S210Y, P211F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M,

I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364I, V364L, V364M, y V364S y en donde la sustitución en una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37.I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272Y, Q275A, Q275F, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280F, D280H, D280M, D280F D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S G304Y, K305C, K305F, K305H, K305i, K305L, K305M, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317i, S317K S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, D326P, V327C, V327T, S336T, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S , P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361E, L361M, L361P, L361R, L361S, L3 61T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364L, V364L, V364L, V364L, V364L, V364L wherein substitution at one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 1.37.

En un tercer aspecto, la presente invención se refiere a variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66,In a third aspect, the present invention relates to protease variants comprising a substitution at one or more positions corresponding to positions 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59 , 60, 61,62, 63, 64, 66,

69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211,69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211,

213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314,213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314,

329, 331, 333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene un nivel de expresión incrementado medido como factor de mejora, EIF, en comparación con la proteasa de SEQ ID329, 331, 333, 336, 362, and 363 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at least 95%, at least 96%, at at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the mature polypeptide of SEQ ID NO: 3, and wherein the variant has an increased expression level measured as an enhancement factor , EIF, compared to the protease of SEQ ID

NO: 3, y en donde la variante comprende una sustitución en una o más posiciones seleccionada del grupo que consiste NO: 3, and wherein the variant comprises a substitution at one or more positions selected from the group consisting

en : I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V2711, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en el nivel de expresión en Aspergillus oryzae medido como factor de mejora, EIF, de al menos 1,38.In : I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114LC, G114LC, G114LC, G114LC, G114LC, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F , I270L, I270S, V271F, V2711, V271K, V271M, S272A, S272N, G274R, G278S, V279i, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T , P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, and A363T, and wherein substitution at one or more positions provides a protease variant that has increased expression level in Aspergillus oryzae measured as enhancement factor, EIF, of at least 1.38.

La presente invención también se refiere a polinucleótidos que codifican las variantes; construcciones de ácido nucleico, vectores y células huésped que comprenden los polinucleótidos; y métodos para producir las variantes. En un aspecto adicional, la presente invención se refiere a composiciones que comprenden las variantes de la invención. The present invention also relates to polynucleotides encoding the variants; nucleic acid constructs, vectors, and host cells comprising the polynucleotides; and methods for producing the variants. In a further aspect, the present invention relates to compositions comprising the variants of the invention.

La presente invención también se refiere a un procedimiento para preparar un producto de fermentación a partir de material que contiene almidón, que comprende sacarificar y fermentar simultáneamente material que contiene almidón utilizando enzimas que generan una fuente de hidratos de carbono y un organismo fermentador a una temperatura por debajo de la temperatura de gelatinización inicial de dicho material que contiene almidón en presencia de una proteasa variante. En otro aspecto, la presente invención se refiere a un procedimiento para preparar un producto de fermentación a partir de material que contiene almidón, que comprende las etapas de:The present invention also relates to a process for preparing a fermentation product from starch-containing material, comprising simultaneously saccharifying and fermenting starch-containing material using enzymes that generate a carbohydrate source and a fermenting organism at a temperature below the initial gelatinization temperature of said starch-containing material in the presence of a variant protease. In another aspect, the present invention relates to a process for preparing a fermentation product from starch-containing material, comprising the steps of:

(a) licuar material que contiene almidón en presencia de una alfa-amilasa;(a) liquifying starch-containing material in the presence of an alpha-amylase;

(b) sacarificar el material licuado obtenido en la etapa (a) utilizando una glucoamilasa;(b) saccharifying the liquefied material obtained in step (a) using a glucoamylase;

(c) fermentar utilizando un organismo fermentador;(c) fermenting using a fermenting organism;

en donde una proteasa variante de la invención está presente durante la etapa b) y/o c).wherein a variant protease of the invention is present during step b) and/or c).

DEFINICIONESDEFINITIONS

Proteasa: El término "proteasa" (también denominada peptidasas, proteinasas, péptido hidrolasas o enzimas proteolíticas) significa una actividad proteolítica (EC 3.4) que cataliza la escisión de enlaces peptídicos. Para los fines de la presente invención, la actividad de la serina proteasa se determina de acuerdo con el procedimiento descrito en los Ejemplos. En un aspecto, las variantes de la presente invención tienen al menos el 20%, p. ej., al menos el 40%, al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos 95% o al menos 100% de la actividad de proteasa del polipéptido maduro de SEQ ID NO: 2. Protease: The term "protease" (also referred to as peptidases, proteinases, peptide hydrolases, or proteolytic enzymes) means a proteolytic activity (EC 3.4) that catalyzes the cleavage of peptide bonds. For purposes of the present invention, serine protease activity is determined according to the procedure described in the Examples. In one aspect, variants of the present invention have at least 20%, e.g. e.g., at least 40%, at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95% or at least 100% of the protease activity of the mature polypeptide of SEQ ID NO: 2.

Actividad de proteasa: La expresión "actividad de proteasa" significa actividad proteolítica (EC 3.4). Existen varios tipos de actividad de proteasa, tales como proteasas de tipo tripsina que se escinden en el lado carboxi-terminal de los residuos de Arg y Lys, y proteasas de tipo quimotripsina que se escinden en el lado carboxi-terminal de los residuos de aminoácidos hidrófobos. Las proteasas de la invención son serina endopeptidasas (EC 3.4.21) con pH óptimo ácido (pH óptimo < pH 7). Protease activity: The term "protease activity" means proteolytic activity (EC 3.4). There are several types of protease activity, such as trypsin-like proteases that cleave at the carboxy-terminal side of Arg and Lys residues, and chymotrypsin-like proteases that cleave at the carboxy-terminal side of amino acid residues. hydrophobic. The proteases of the invention are serine endopeptidases (EC 3.4.21) with an acidic pH optimum (pH optimum < pH 7).

La actividad de proteasa se puede medir utilizando cualquier ensayo, en el que se emplee un sustrato, que incluya enlaces peptídicos relevantes para la especificidad de la proteasa en cuestión. Asimismo, el pH del ensayo y la temperatura del ensayo deben adaptarse a la proteasa en cuestión. Ejemplos de valores de pH del ensayo son pH 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 o 12. Ejemplos de temperaturas de ensayo son 15, 20, 25, 30, 35, 37, 40, 45, 50, 55, 60, 65, 70, 80, 90 o 95°C. Ejemplos de sustratos de proteasa generales son caseína, albúmina de suero bovino y hemoglobina. En el método clásico de Anson y Mirsky se utiliza hemoglobina desnaturalizada como sustrato y, tras la incubación del ensayo con la proteasa en cuestión, se determina la cantidad de hemoglobina soluble en ácido tricloroacético como medida de la actividad de la proteasa (Anson, M.L. y Mirsky, A.E., 1932, J. Gen. Physiol. 16: 59 y Anson, M.L., 1938, J. Gen. Physiol. 22: 79).Protease activity can be measured using any assay, in which a substrate is employed, which includes peptide bonds relevant to the specificity of the protease in question. Also, the pH of the assay and the temperature of the assay must be adapted to the protease in question. Examples of test pH values are pH 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 or 12. Examples of test temperatures are 15, 20, 25, 30, 35, 37, 40 , 45, 50, 55, 60, 65, 70, 80, 90 or 95°C. Examples of general protease substrates are casein, bovine serum albumin, and hemoglobin. In the classic method of Anson and Mirsky, denatured hemoglobin is used as a substrate and, after incubation of the assay with the protease in question, the amount of hemoglobin soluble in trichloroacetic acid is determined as a measure of protease activity (Anson, ML and Mirsky, AE, 1932, J. Gen. Physiol. 16:59 and Anson, ML, 1938, J. Gen. Physiol. 22:79).

Para el fin de la presente invención, la actividad de proteasa se determinó utilizando ensayos que se describen en "Materiales y Métodos", tales como el ensayo Kinetic Suc-AAPF-pNA, ensayo Protazyme AK, ensayo Kinetic Suc-AAPX-pNA y o-ftaldialdehído (OPA). Para el ensayo de Protazyme AK, el sustrato insoluble de Protazyme AK (caseína reticulada con azurina) libera un color azul cuando se incuba con la proteasa y el color se determina como una medida de la actividad de proteasa. Para el ensayo de Suc-AAPF-pNA, el sustrato incoloro de Suc-AAPF-pNA libera paranitroanilina amarilla cuando se incuba con la proteasa y el color amarillo se determina como una medida de la actividad de proteasa. For the purpose of the present invention, protease activity was determined using assays described in "Materials and Methods", such as the Kinetic Suc-AAPF-pNA assay, Protazyme AK assay, Kinetic Suc-AAPX-pNA assay and or -phthaldialdehyde (OPA). For the Protazyme AK assay, the insoluble Protazyme AK substrate (azurin cross-linked casein) releases a blue color when incubated with the protease and the color is determined as a measure of protease activity. For the Suc-AAPF-pNA assay, the colorless Suc-AAPF-pNA substrate releases yellow paranitroaniline when incubated with the protease and the yellow color is determined as a measure of protease activity.

Endo-proteasas/Exo-proteasas: Polipéptidos que tienen actividad proteasa, o proteasas, a veces también se denominan peptidasas, proteinasas, péptido hidrolasas o enzimas proteolíticas. Las proteasas pueden ser del tipo exo (exopeptidasas) que hidrolizan péptidos comenzando en cualquiera de sus extremos, o del tipo endo que actúan internamente en cadenas polipeptídicas (endopeptidasas). Endo-Proteases/Exo-Proteases: Polypeptides that have protease activity, or proteases, are sometimes also called peptidases, proteinases, peptide hydrolases, or proteolytic enzymes. Proteases can be of the exo type (exopeptidases) that hydrolyze peptides starting at either end, or of the endo type that act internally on polypeptide chains (endopeptidases).

Proteasa S53: El término "S53" significa una actividad de proteasa seleccionada de: S53 Protease: The term "S53" means a protease activity selected from:

(a) proteasas que pertenecen al grupo de enzimas EC 3.4.21; y/o(a) proteases belonging to the EC 3.4.21 group of enzymes; me

(b) proteasas que pertenecen al grupo de enzimas EC 3.4.14; y/o(b) proteases belonging to the EC 3.4.14 group of enzymes; me

(c) serina proteasas de la familia de peptidasas S53 que comprende dos tipos diferentes de peptidasas: tripeptidil aminopeptidasas (tipo exo) y endo-peptidasas; tal como se describe en 1993, Biochem. J. 290: 205-218 y en la base de datos de proteasas MEROPS, versión 9.4 (31 de enero de 2011) (www.merops.ac.uk). La base de datos se describe en Rawlings, N.D., Barrett, A.J. and Bateman, A., 2010, "MEROPS: the peptidase database", Nucl. Acids Res. 38: D227-D233.(c) serine proteases of the S53 peptidase family comprising two different types of peptidases: tripeptidyl aminopeptidases (exo-type) and endo-peptidases; as described in 1993, Biochem. J. 290: 205-218 and in the MEROPS protease database, version 9.4 (January 31, 2011) (www.merops.ac.uk). The database is described in Rawlings, N.D., Barrett, A.J. and Bateman, A., 2010, "MEROPS: the peptidase database", Nucl. Acids Res. 38: D227-D233.

Para determinar si una proteasa dada es una Serina proteasa y una proteasa de la familia S53, se hace referencia al Manual anterior y los principios indicados en el mismo. Una determinación de este tipo se puede llevar a cabo para todos los tipos de proteasas, ya sean proteasas que se producen de forma natural o de tipo salvaje; o proteasas genéticamente modificadas o sintéticas.In determining whether a given protease is a Serine protease and an S53 family protease, reference is made to the above Manual and the principles stated therein. Such a determination can be carried out for all types of proteases, whether they are naturally occurring or wild-type proteases; or genetically modified or synthetic proteases.

Variante alélica: La expresión "variante alélica" significa cualquiera de dos o más formas alternativas de un gen que ocupa el mismo locus cromosómico. La variación alélica surge de forma natural a través de mutación y puede resultar en polimorfismo dentro de las poblaciones. Las mutaciones génicas pueden ser silenciosas (sin cambios en el polipéptido codificado) o pueden codificar polipéptidos que tienen secuencias de aminoácidos alteradas. Una variante alélica de un polipéptido es un polipéptido codificado por una variante alélica de un gen. Allelic Variant: The term "allelic variant" means any of two or more alternative forms of a gene that occupy the same chromosomal locus. Allelic variation arises naturally through mutation and can result in polymorphism within populations. Gene mutations may be silent (no change in the encoded polypeptide) or may encode polypeptides having altered amino acid sequences. An allelic variant of a polypeptide is a polypeptide encoded by an allelic variant of a gene.

ADNc: El término "ADNc" significa una molécula de ADN que puede prepararse mediante transcripción inversa a partir de una molécula de ARNm madura, cortada y empalmada, obtenida de una célula eucariota o procariota. El ADNc carece de secuencias intrónicas que pueden estar presentes en el ADN genómico correspondiente. La transcripción de ARN primaria inicial es un precursor del ARNm que se procesa a través de una serie de etapas, incluyendo el corte y empalme, antes de aparecer como ARNm maduro cortado y empalmado. cDNA: The term "cDNA" means a DNA molecule that can be prepared by reverse transcription from a spliced, mature mRNA molecule obtained from a eukaryotic or prokaryotic cell. The cDNA lacks intronic sequences that may be present in the corresponding genomic DNA. The initial primary RNA transcript is a precursor to mRNA that is processed through a series of steps, including splicing, before appearing as mature spliced mRNA.

Secuencia codificante La expresión "secuencia codificante" significa un polinucleótido, que especifica directamente la secuencia de aminoácidos de una variante. Los límites de la secuencia codificante se determinan generalmente mediante un marco de lectura abierto, que comienza con un codón de inicio tal como ATG, GTG o TTG y termina con un codón de terminación tal como TAA, TAG o TGA. La secuencia codificante puede ser un ADN genómico, ADNc, ADN sintético o una combinación de los mismos. Coding sequence The term "coding sequence" means a polynucleotide, which directly specifies the amino acid sequence of a variant. The boundaries of the coding sequence are generally determined by an open reading frame, beginning with a start codon such as ATG, GTG or TTG and ending with a stop codon such as TAA, TAG or TGA. The coding sequence may be genomic DNA, cDNA, synthetic DNA, or a combination thereof.

Secuencias de control: La expresión "secuencias de control" significa secuencias de ácido nucleico necesarias para la expresión de un polinucleótido que codifica una variante de la presente invención. Cada una de las secuencias de control puede ser nativa (es decir, del mismo gen) o heteróloga (es decir, de un gen diferente) al polinucleótido que codifica la variante o nativa o extraña entre sí. Secuencias de control de este tipo incluyen, pero no se limitan a una secuencia conductora, de poliadenilación, secuencia propeptídica, promotor, secuencia de péptido señal y terminador de la transcripción. Como mínimo, las secuencias de control incluyen un promotor y señales de parada de la transcripción y la traducción. Las secuencias de control se pueden proporcionar con enlazadores con el fin de introducir sitios de restricción específicos que faciliten el ligamiento con las secuencias de control con la región codificante del polinucleótido que codifica una variante. Control Sequences: The term "control sequences" means nucleic acid sequences necessary for the expression of a polynucleotide encoding a variant of the present invention. Each of the control sequences may be native ( ie, from the same gene) or heterologous ( ie, from a different gene) to the polynucleotide encoding the variant or native or foreign to each other. Such control sequences include, but are not limited to, a leader sequence, polyadenylation sequence, propeptide sequence, promoter, signal peptide sequence, and transcription terminator. At a minimum, control sequences include a promoter and transcriptional and translational stop signals. The control sequences can be provided with linkers in order to introduce specific restriction sites that facilitate ligation of the control sequences with the coding region of the polynucleotide encoding a variant.

Expresión: El término "expresión" incluye cualquier etapa implicada en la producción de una variante que incluye, pero no se limita a transcripción, modificación pos-transcripcional, traducción, modificación pos-traduccional y secreción. Expression: The term "expression" includes any step involved in the production of a variant including, but not limited to transcription, post-transcriptional modification, translation, post-translational modification, and secretion.

Vector de expresión: La expresión "vector de expresión" significa una molécula de ADN lineal o circular que comprende un polinucleótido que codifica una variante y está operativamente enlazado a secuencias de control que proporcionan su expresión. Expression Vector: The term "expression vector" means a linear or circular DNA molecule comprising a polynucleotide that encodes a variant and is operably linked to control sequences that provide for its expression.

Fragmento: El término "fragmento" significa un polipéptido que tiene uno o más (p. ej., varios) aminoácidos ausentes del extremo amino y/o carboxilo de un polipéptido maduro; en donde el fragmento tiene actividad proteasa. Fragment: The term "fragment" means a polypeptide that has one or more ( eg, several) amino acids absent from the amino and/or carboxyl terminus of a mature polypeptide; wherein the fragment has protease activity.

Condiciones de alta rigurosidad: La expresión "condiciones de alta rigurosidad" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 50 % de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 65°C. High stringency conditions: The term "high stringency conditions" means for probes at least 100 nucleotides in length, prehybridization and hybridization at 42°C in 5X SSPE, 0.3% SDS, 200 micrograms/ml sperm DNA of sheared and denatured salmon and 50% formamide following standard Southern blotting procedures for 12 to 24 hours. The support material is finally washed three times each for 15 minutes using 2X SSC, 0.2% SDS at 65°C.

Célula huésped: La expresión "célula huésped" significa cualquier tipo de célula que sea susceptible de transformación, transfección, transducción o similar con una construcción de ácido nucleico o vector de expresión que comprende un polinucleótido de la presente invención. La expresión "célula huésped" abarca cualquier progenie de una célula madre que no sea idéntica a la célula madre debido a mutaciones que se producen durante la replicación. Host cell: The term "host cell" means any type of cell that is amenable to transformation, transfection, transduction or the like with a nucleic acid construct or expression vector comprising a polynucleotide of the present invention. The term "host cell" encompasses any progeny of a stem cell that is not identical to the stem cell due to mutations that occur during replication.

Propiedad mejorada: La expresión "propiedad mejorada" significa una característica asociada con una variante que está mejorada en comparación con el parental. Propiedades mejoradas de este tipo incluyen, pero no se limitan a actividad específica incrementada, estabilidad incrementada en condiciones de almacenamiento, termoestabilidad incrementada y niveles de expresión incrementados en una célula huésped de expresión recombinante. Improved Property: The term "improved property" means a characteristic associated with a variant that is improved compared to the parent. Such improved properties include, but are not limited to, increased specific activity, increased stability under storage conditions, increased thermostability, and increased expression levels in a recombinant expression host cell.

Aislada: El término "aislado" significa una sustancia en una forma o entorno que no se produce en la naturaleza. Ejemplos no limitantes de sustancias aisladas incluyen (1) cualquier sustancia que se produce de forma no natural, (2) cualquier sustancia que incluya, pero no se limite a cualquier enzima, variante, ácido nucleico, proteína, péptido o cofactor, que se haya eliminado, al menos parcialmente, de uno o más o todos los constituyentes que se producen de forma natural con los que está asociado en la naturaleza; (3) cualquier sustancia modificada por la mano del hombre en relación con la sustancia que se encuentra en la naturaleza o (4) cualquier sustancia modificada al incrementar la cantidad de la sustancia en relación con otros componentes con los que está asociada de forma natural (p. ej., múltiples copias de un gen que codifica la sustancia; uso de un promotor más fuerte que el promotor asociado de forma natural con el gen que codifica la sustancia). . Una sustancia aislada puede estar presente en una muestra de caldo de fermentación. Isolated: The term "isolate" means a substance in a form or environment that does not occur in nature. Non-limiting examples of isolated substances include (1) any non-naturally occurring substance, (2) any substance including, but not limited to, any enzyme, variant, nucleic acid, protein, peptide, or cofactor, that has been removed, at least partially, from one or more or all of the naturally occurring constituents with which it is associated in nature; (3) any substance modified by man-made relative to the substance found in nature or (4) any substance modified by increasing the amount of the substance relative to other components with which it is naturally associated ( eg, multiple copies of a gene encoding the substance; use of a promoter stronger than the promoter naturally associated with the gene encoding the substance). . An isolated substance may be present in a fermentation broth sample.

Condiciones de baja rigurosidad: La expresión "condiciones de baja rigurosidad" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 25% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 50°C. Low stringency conditions: The term "low stringency conditions" means for probes at least 100 nucleotides in length, prehybridization and hybridization at 42°C in 5X SSPE, 0.3% SDS, 200 micrograms/ml sperm DNA of sheared and denatured salmon and 25% formamide, following standard Southern blotting procedures for 12 to 24 hours. The support material is finally washed three times each for 15 minutes using 2X SSC, 0.2% SDS at 50°C.

Polipéptido maduro: La expresión "polipéptido maduro" significa un polipéptido en su forma final después de la traducción y cualquier modificación pos-traduccional, tal como procesamiento N-terminal, truncamiento C-terminal, glicosilación, fosforilación, etc. En un aspecto, el polipéptido maduro es los aminoácidos 199 a 564 de SEQ ID NO: 2. Los aminoácidos 1 a 17 de SEQ ID NO: 2 son un péptido señal y los aminoácidos 18 a 198 son un propéptido. Los N-terminales de los polipéptidos S53 maduros utilizados de acuerdo con la presente invención se confirmaron experimentalmente basándose en los datos de secuenciación N-terminal de EDMAN y los datos de MS intacta. Los polipéptidos maduros también se incluyen como SEQ ID NO: 3 (proteasa 3 S53 madura de Meripilus giganteus. Se sabe en la técnica que una célula huésped puede producir una mezcla de dos o más polipéptidos maduros diferentes (es decir, con un aminoácido C.terminal y/o N-terminal diferente), expresado por el mismo polinucleótido. Mature polypeptide: The term "mature polypeptide" means a polypeptide in its final form after translation and any post-translational modifications, such as N-terminal processing, C-terminal truncation, glycosylation, phosphorylation, etc. In one aspect, the mature polypeptide is amino acids 199 to 564 of SEQ ID NO: 2. Amino acids 1 to 17 of SEQ ID NO: 2 are a signal peptide and amino acids 18 to 198 are a propeptide. The N-terminals of the mature S53 polypeptides used in accordance with the present invention were confirmed experimentally based on N-terminal EDMAN sequencing data and intact MS data. Mature polypeptides are also included as SEQ ID NO: 3 (Mature protease 3 S53 from Meripilus giganteus. It is known in the art that a host cell can produce a mixture of two or more different mature polypeptides ( i.e., with an amino acid C. different terminal and/or N-terminal), expressed by the same polynucleotide.

Secuencia codificante de polipéptido maduro: La expresión "secuencia codificante de polipéptido maduro" significa un polinucleótido que codifica un polipéptido maduro que tiene actividad de proteasa. En un aspecto, la secuencia codificante de polipéptido maduro son los nucleótidos 595 a 1692 de SEQ ID NO: 1. Los nucleótidos 1 a 51 de SEQ ID NO: 1 codifican un péptido señal y los nucleótidos 52 a 594 codifican un propéptido. Mature polypeptide coding sequence: The term "mature polypeptide coding sequence" means a polynucleotide that encodes a mature polypeptide having protease activity. In one aspect, the mature polypeptide coding sequence is nucleotides 595 to 1692 of SEQ ID NO: 1. Nucleotides 1 to 51 of SEQ ID NO: 1 encode a signal peptide and nucleotides 52 to 594 encode a propeptide.

Condiciones de rigurosidad media: La expresión "condiciones de rigurosidad" media significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 35% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 55°C. Medium stringency conditions: The term "medium stringency conditions" means for probes at least 100 nucleotides in length, prehybridization and hybridization at 42°C in 5X SSPE, 0.3% SDS, 200 micrograms/ml sperm DNA of sheared and denatured salmon and 35% formamide following standard Southern blotting procedures for 12 to 24 hours. The support material is finally washed three times each for 15 minutes using 2X SSC, 0.2% SDS at 55°C.

Condiciones de rigurosidad media-alta: La expresión "condiciones de rigurosidad media-alta" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 35% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 60°C. Medium-high stringency conditions: The term "medium-high stringency conditions" means for probes at least 100 nucleotides in length, prehybridization and hybridization at 42°C in 5X SSPE, 0.3% SDS, 200 micrograms/mL of sheared and denatured salmon sperm DNA and 35% formamide following standard Southern blot procedures for 12 to 24 hours. The support material is finally washed three times each for 15 minutes using 2X SSC, 0.2% SDS at 60°C.

Mutante: El término "mutante" significa un polinucleótido que codifica una variante. Mutant: The term "mutant" means a polynucleotide that encodes a variant.

Construcción de ácido nucleico: La expresión "construcción de ácido nucleico" significa una molécula de ácido nucleico, ya sea de cadena sencilla o de doble cadena, que se aísla de un gen que se produce de forma natural o se modifica para contener segmentos de ácidos nucleicos de una manera que de otra manera no existiría en la naturaleza o que es sintética, que comprende una o más secuencias de control. En una realización, la una o más secuencias de control son heterólogas (de diferente origen/especie) a la secuencia codificante que codifica el polipéptido de la invención. Nucleic Acid Construct: The term "nucleic acid construct" means a nucleic acid molecule, either single-stranded or double-stranded, that is isolated from a naturally occurring gene or modified to contain segments of nucleic acids. nucleic in a manner that would not otherwise exist in nature or that is synthetic, comprising one or more control sequences. In one embodiment, the one or more control sequences are heterologous (of different origin/species) to the coding sequence encoding the polypeptide of the invention.

Enlazada operativamente: La expresión "enlazada operativamente" significa una configuración en la que una secuencia de control está colocada en una posición apropiada con respecto a la secuencia codificante de un polinucleótido de manera que la secuencia de control dirige la expresión de la secuencia codificante. Operably Linked: The term "operably linked" means a configuration in which a control sequence is placed in an appropriate position relative to the coding sequence of a polynucleotide such that the control sequence directs expression of the coding sequence.

Parental o proteasa parental: El término "parental" o la expresión "proteasa parental" significa cualquier polipéptido con actividad de proteasa en el que se realiza una alteración para producir las variantes enzimáticas de la presente invención. Parental or Parental Protease: The term "parental" or the term "parental protease" means any polypeptide with protease activity in which an alteration is made to produce the enzyme variants of the present invention.

Identidad de la secuencia: La relación entre dos secuencias de aminoácidos o entre dos secuencias de nucleótidos se describe mediante el parámetro "identidad de la secuencia". Sequence identity: The relationship between two amino acid sequences or between two nucleotide sequences is described by the parameter "sequence identity".

Para los fines de la presente invención, la identidad de la secuencia entre dos secuencias de aminoácidos se determina utilizando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443-453) como se implementa en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), preferiblemente versión 5.0.0 o posterior. Los parámetros utilizados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5 y la matriz de sustitución EBLOSUM62 (versión EMBOSS de BLOSUM62). La salida de Needle marcada como "identidad más larga" (obtenida utilizando la opción -nobrief) se utiliza como el porcentaje de identidad y se calcula de la siguiente manera:For purposes of the present invention, sequence identity between two amino acid sequences is determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48:443-453) as implemented in the Needle program from the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276-277), preferably version 5.0.0 or later. The parameters used are gap opening penalty of 10, gap extension penalty of 0.5 and the substitution matrix EBLOSUM62 (EMBOSS version of BLOSUM62). The Needle output marked as "longest identity" (obtained using the -nobrief option) is used as the percent identity and is calculated as follows:

(Residuos Idénticos x 100)/(Longitud de Alineamiento - Número Total de Huecos en Alineamiento)(Identical Residuals x 100)/(Alignment Length - Total Number of Holes in Alignment)

Para los fines de la presente invención, la identidad de la secuencia entre dos secuencias de desoxirribonucleótidos se determina utilizando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, supra) implementado en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, supra), preferiblemente versión 5.0.0 o posterior. Los parámetros utilizados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5 y la matriz de sustitución EDNAFULL (versión EMBOSS de NCBI NUC4.4). La salida de Needle marcada como "identidad más larga" (obtenida utilizando la opción -nobrief) se utiliza como el porcentaje de identidad y se calcula de la siguiente manera: (Desoxirribonucleótidos Idénticos x 100)/(Longitud de Alineamiento - Número Total de Huecos en Alineamiento)For purposes of the present invention, sequence identity between two deoxyribonucleotide sequences is determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, supra) implemented in the Needle program of the EMBOSS package (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, supra), preferably version 5.0.0 or later. The parameters used are gap opening penalty of 10, gap extension penalty of 0.5, and the substitution matrix EDNAFULL (EMBOSS version of NCBI NUC4.4). The output of Needle marked "longest identity" (obtained using the -nobrief option) is used as the percent identity and is calculated as follows: (Identical Deoxyribonucleotides x 100)/(Alignment Length - Total Number of Gaps in Alignment)

Subsecuencia: El término "subsecuencia" significa un polinucleótido que tiene uno o más (p. ej., varios) nucleótidos ausentes del extremo 5’ y/o 3’ de una secuencia codificante de polipéptido maduro; en donde la subsecuencia codifica un fragmento que tiene actividad de proteasa. En un aspecto, una subsecuencia contiene al menos 1098 nucleótidos (p. ej., nucleótidos 595 a 1692 de SEQ ID NO: 1). Subsequence: The term "subsequence" means a polynucleotide having one or more (eg, several) nucleotides absent from the 5' and/or 3' end of a mature polypeptide coding sequence; wherein the subsequence encodes a fragment having protease activity. In one aspect, a subsequence contains at least 1098 nucleotides (eg, nucleotides 595 to 1692 of SEQ ID NO: 1).

Variante: El término "variante" significa un polipéptido que tiene actividad de proteasa que comprende una sustitución en una o más (p. ej., varias) posiciones. Una sustitución significa el reemplazo del aminoácido que ocupa una posición por un aminoácido diferente. Las variantes de la presente invención tienen al menos el 20%, p. ej., al menos el 40%, al menos el 50%, al menos el 60%, al menos el 70%, al menos el 80%, al menos el 90%, al menos 95% o al menos 100% de la actividad de proteasa del polipéptido maduro de SEQ ID NO: 2, descrita en esta memoria como SEQ ID NO: 3. Variant: The term "variant" means a polypeptide having protease activity that comprises a substitution at one or more ( eg, several) positions. A substitution means the replacement of the amino acid occupying one position with a different amino acid. Variants of the present invention have at least 20%, e.g. e.g., at least 40%, at least 50%, at least 60%, at least 70%, at least 80%, at least 90%, at least 95% or at least 100% of the protease activity of the mature polypeptide of SEQ ID NO: 2, described herein as SEQ ID NO: 3.

Condiciones de rigurosidad muy alta: La expresión "condiciones de rigurosidad muy alta" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 50% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 70°C. Very high stringency conditions: The term "very high stringency conditions" means for probes at least 100 nucleotides in length, prehybridization and hybridization at 42°C in 5X SSPE, 0.3% SDS, 200 micrograms/ml DNA of sheared and denatured salmon sperm and 50% formamide following standard Southern blotting procedures for 12 to 24 hours. The support material is finally washed three times each for 15 minutes using 2X SSC, 0.2% SDS at 70°C.

Condiciones de rigurosidad muy baja: La expresión "condiciones de rigurosidad muy baja" significa para sondas de al menos 100 nucleótidos de longitud, prehibridación e hibridación a 42°C en 5X SSPE, SDS al 0,3%, 200 microgramos/ml de ADN de esperma de salmón cizallado y desnaturalizado y 25% de formamida, siguiendo los procedimientos estándares de transferencia Southern durante 12 a 24 horas. El material de soporte se lava finalmente tres veces cada una durante 15 minutos utilizando 2X SSC, SDS al 0,2% a 45°C. Very low stringency conditions: The term "very low stringency conditions" means for probes at least 100 nucleotides in length, prehybridization and hybridization at 42°C in 5X SSPE, 0.3% SDS, 200 micrograms/ml DNA of sheared and denatured salmon sperm and 25% formamide following standard Southern blotting procedures for 12 to 24 hours. The support material is finally washed three times each for 15 minutes using 2X SSC, 0.2% SDS at 45°C.

Proteasa de tipo salvaje: La expresión proteasa "de tipo salvaje" significa una proteasa expresada por un microorganismo que se produce de forma natural, tal como una bacteria, levadura u hongo filamentoso que se encuentra en la naturaleza. Wild-Type Protease: The term "wild-type" protease means a protease expressed by a naturally occurring microorganism, such as a bacteria, yeast, or filamentous fungus found in nature.

Convenciones para la Designación de VariantesVariant Naming Conventions

Para los fines de la presente invención, el polipéptido maduro comprendido en SEQ ID NO: 2 se utiliza para determinar el residuo de aminoácido correspondiente en otra proteasa. La secuencia de aminoácidos de otra proteasa se alinea con el polipéptido maduro comprendido en SEQ ID NO: 2 (descrita en esta memoria como SEQ ID NO: 3), y basado en el alineamiento, el número de posición de aminoácido correspondiente a cualquier residuo de aminoácido en el polipéptido maduro descrito como SEQ ID NO: 3 se determina utilizando el algoritmo de Needleman-Wunsch (Needleman y Wunsch, 1970, J. Mol. Biol. 48: 443-453) como se implementa en el programa Needle del paquete EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16: 276­ 277), preferiblemente versión 5.0.0 o posterior. Los parámetros utilizados son penalización por apertura de hueco de 10, penalización por extensión de hueco de 0,5 y la matriz de sustitución EBLOSUM62 (versión EMBOSS de BLOSUM62).For the purposes of the present invention, the mature polypeptide comprised in SEQ ID NO: 2 is used to determine the corresponding amino acid residue in another protease. The amino acid sequence of another protease is aligned with the mature polypeptide comprised in SEQ ID NO: 2 (described herein as SEQ ID NO: 3), and based on the alignment, the amino acid position number corresponding to any residue of amino acid in the mature polypeptide described as SEQ ID NO: 3 is determined using the Needleman-Wunsch algorithm (Needleman and Wunsch, 1970, J. Mol. Biol. 48:443-453) as implemented in the Needle program of the package EMBOSS (EMBOSS: The European Molecular Biology Open Software Suite, Rice et al., 2000, Trends Genet. 16:276-277), preferably version 5.0.0 or later. The parameters used are gap opening penalty of 10, gap extension penalty of 0.5 and the substitution matrix EBLOSUM62 (EMBOSS version of BLOSUM62).

La identificación del residuo de aminoácido correspondiente en otra proteasa que no sea la proteasa S53 de Meripilus giganteus puede determinarse mediante un alineamiento de múltiples secuencias de polipéptidos utilizando varios programas informáticos que incluyen, pero no se limitan a MUSCLE (comparación de secuencias múltiples por expectativa de registro; versión 3.5 o posterior; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (versión 6.857 o posterior; Katoh y Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et a/., 2005, Nucleic Acids Research 33: 511-518; Katoh y Toh, 2007, Bioinformatics 23: 372-374; Katoh et a/., 2009, Methods in Molecular Biology 537: 39-64; Katoh y Toh, 2010, Bioinformatics 26:_1899-1900), y EMBOSS EMMA empleando ClustalW (1.83 o posterior; Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680), utilizando sus respectivos parámetros por defecto.Identification of the corresponding amino acid residue in a protease other than the Meripilus giganteus S53 protease can be determined by an alignment of multiple polypeptide sequences using various computer programs including, but not limited to MUSCLE (multiple sequence comparison by sequence expectation). registry; version 3.5 or later; Edgar, 2004, Nucleic Acids Research 32: 1792-1797), MAFFT (version 6.857 or later; Katoh and Kuma, 2002, Nucleic Acids Research 30: 3059-3066; Katoh et a/., 2005 , Nucleic Acids Research 33: 511-518; Katoh and Toh, 2007, Bioinformatics 23: 372-374; Katoh et a/., 2009, Methods in Molecular Biology 537: 39-64; Katoh and Toh, 2010, Bioinformatics 26: _1899-1900), and EMBOSS EMMA using ClustalW (1.83 or later; Thompson et al., 1994, Nucleic Acids Research 22: 4673-4680), using their respective default parameters.

Cuando la otra enzima ha divergido del polipéptido maduro de SEQ ID NO: 2 de manera que la comparación tradicional basada en secuencia no detecta su relación (Lindahl y Elofsson, 2000, J. Mol. Biol. 295: 613-615), se pueden utilizar otros algoritmos de comparación de secuencias. Se puede lograr una mayor sensibilidad en la búsqueda basada en secuencias utilizando programas de búsqueda que utilizan representaciones probabilísticas de familias (perfiles) de polipéptidos para buscar en bases de datos. Por ejemplo, el programa PSI-BLAST genera perfiles a través de un proceso de búsqueda de base de datos iterativo y es capaz de detectar homólogos remotos (Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402). Se puede lograr una sensibilidad incluso mayor si la familia o superfamilia del polipéptido tiene uno o más representantes en las bases de datos de estructura de proteínas. Programas tales como GenTHREADER (Jones, 1999, J. Mol. Biol. 287: 797-815; McGuffin y Jones, 2003, Bioinformatics 19: 874-881) utilizan información de una diversidad de fuentes (PSI-BLAST, predicción de estructura secundaria, perfiles de alineamiento estructural y potenciales de solvatación) como entrada a una red neuronal que predice el pliegue estructural de una secuencia de consulta. . De manera similar, el método de Gough et al., 2000, J. Mol. Biol. 313: 903-919, se puede utilizar para alinear una secuencia de estructura desconocida con los modelos de superfamilia presentes en la base de datos SCOP. Estos alineamientos, a su vez, pueden utilizarse para generar modelos de homología para el polipéptido, y la precisión de este tipo de modelos puede evaluarse utilizando una diversidad de herramientas desarrolladas para ese fin.When the other enzyme has diverged from the mature polypeptide of SEQ ID NO: 2 such that traditional sequence-based comparison does not detect their relationship (Lindahl and Elofsson, 2000, J. Mol. Biol. 295: 613-615), they can be use other sequence comparison algorithms. Greater sensitivity in sequence-based searching can be achieved by using search programs that use probabilistic representations of families (profiles) of polypeptides to search databases. For example, the PSI-BLAST program generates profiles through an iterative database search process and is capable of detecting remote homologues (Atschul et al., 1997, Nucleic Acids Res. 25: 3389-3402). Even higher sensitivity can be achieved if the polypeptide family or superfamily has one or more representatives in protein structure databases. Programs such as GenTHREADER (Jones, 1999, J. Mol. Biol. 287:797-815; McGuffin and Jones, 2003, Bioinformatics 19:874-881) use information from a variety of sources (PSI-BLAST, secondary structure prediction , structural alignment profiles and solvation potentials) as input to a neural network that predicts the structural folding of a query sequence. . Similarly, the method of Gough et al., 2000, J. Mol. Biol. 313:903-919, can be used to align a sequence of unknown structure with the superfamily models present in the SCOP database. These alignments, in turn, can be used to generate homology models for the polypeptide, and the accuracy of such models can be assessed using a variety of tools developed for that purpose.

Para proteínas de estructura conocida, se encuentran disponibles varias herramientas y recursos para recuperar y generar alineamientos estructurales. Por ejemplo, las superfamilias de proteínas SCOP se han alineado estructuralmente, y esos alineamientos son accesibles y descargables. Se pueden alinear dos o más estructuras de proteínas utilizando una diversidad de algoritmos tales como la matriz de alineamiento de distancia (Holm y Sander, 1998, Proteins 33: 88-96) o la extensión combinatoria (Shindyalov y Bourne, 1998, Protein Engineering 11: 739-747), y la implementación de estos algoritmos se puede utilizar adicionalmente para consultar bases de datos de estructura con una estructura de interés con el fin de descubrir posibles homólogos estructurales (p. ej., Holm y Park, 2000, Bioinformatics 16: 566-567).For proteins of known structure, various tools and resources are available to retrieve and generate structural alignments. For example, the SCOP protein superfamilies have been structurally aligned, and those alignments are accessible and downloadable. Two or more protein structures can be aligned using a variety of algorithms such as distance alignment matrix (Holm and Sander, 1998, Proteins 33:88-96) or combinatorial extension (Shindyalov and Bourne, 1998, Protein Engineering 11 : 739-747), and the implementation of these algorithms can be further used to query structure databases with a structure of interest in order to discover possible structural homologues ( e.g., Holm and Park, 2000, Bioinformatics 16 : 566-567).

Al describir las variantes de la presente invención, la nomenclatura descrita más adelante se adapta para facilitar la referencia. Se emplea la abreviatura de aminoácidos de una sola letra o de tres letras aceptada por la IUPAC. In describing variants of the present invention, the nomenclature described below is adapted for ease of reference. The IUPAC accepted single-letter or three-letter amino acid abbreviation is used.

Sustituciones. Para una sustitución de aminoácidos se utiliza la siguiente nomenclatura: aminoácido original, posición, aminoácido sustituido. Por consiguiente, la sustitución de treonina en la posición 226 con alanina se designa como "Thr226Ala" o "T226A". Las mutaciones múltiples están separadas por marcas de adición ("+"), p. ej., "Gly205Arg Ser411 Phe" o "G205R S411F", que representan sustituciones en las posiciones 205 y 411 de glicina (G) con arginina (R) y serina (S) con fenilalanina (F), respectivamente.substitutions. For an amino acid substitution the following nomenclature is used: original amino acid, position, substituted amino acid. Therefore, the substitution of threonine at position 226 with alanine is designated "Thr226Ala" or "T226A". Multiple mutations are separated by addition marks ("+"), e.g. eg, "Gly205Arg Ser411 Phe" or "G205R S411F", which represent substitutions at positions 205 and 411 of glycine (G) with arginine (R) and serine (S) with phenylalanine (F), respectively.

Deleciones. Para una deleción de aminoácidos se utiliza la siguiente nomenclatura: Aminoácido original, posición, *. Por consiguiente, la deleción de glicina en la posición 195 con se designa como "Gly195*" o "G195*". Las deleciones múltiples están separadas por marcas de adición («+»), p. ej., "Gly195* Ser411*" o "G195* S411 *".deletions. For an amino acid deletion the following nomenclature is used: Original amino acid, position, *. Accordingly, the glycine deletion at position 195 with is designated "Gly195*" or "G195*". Multiple deletions are separated by addition marks (“+”), e.g. g., "Gly195*Ser411*" or "G195*S411*".

Inserciones. Para una inserción de aminoácidos se utiliza la siguiente nomenclatura: Aminoácido original, posición, aminoácido original, aminoácido insertado. Por consiguiente la inserción de lisina después de glicina en la posición 195 se designa "Gly195GlyLys" o "G195GK". Una inserción de múltiples aminoácidos se designa [Aminoácido original, posición, aminoácido original, aminoácido insertado n° 1, aminoácido insertado n° 2; etc.]. Por ejemplo, la inserción de lisina después de glicina en la posición 195 se indica como "Gly195GlyLysAla" o "G195GKA".inserts. For an amino acid insertion the following nomenclature is used: Original amino acid, position, original amino acid, inserted amino acid. Therefore the insertion of lysine after glycine at position 195 is designated "Gly195GlyLys" or "G195GK". An insertion of multiple amino acids is designated [Parent amino acid, position, parent amino acid, inserted amino acid #1, inserted amino acid #2; etc.]. For example, the insertion of lysine after glycine at position 195 is indicated as "Gly195GlyLysAla" or "G195GKA".

En tales casos, el o los residuos de aminoácido insertados se numeran mediante la adición de letras minúsculas al número de posición del residuo de aminoácido que precede al o a los residuos de aminoácido insertado. En el ejemplo anterior, la secuencia sería: In such cases, the inserted amino acid residue(s) are numbered by adding lower case letters to the position number of the amino acid residue preceding the inserted amino acid residue(s). In the example above, the sequence would be:

Figure imgf000009_0001
Figure imgf000009_0001

Alteraciones múltiples. Variantes que comprenden múltiples alteraciones están separadas por marcas de adición ("+"), p. ej., "Arg170Tyr Gly195Glu" o "R170Y G195E" que representan una sustitución de arginina y glicina en las posiciones 170 y 195 con tirosina y ácido glutámico, respectivamente.multiple alterations. Variants comprising multiple alterations are separated by addition marks ("+"), e.g. eg, "Arg170Tyr Gly195Glu" or "R170Y G195E" representing a substitution of arginine and glycine at positions 170 and 195 with tyrosine and glutamic acid, respectively.

Alteraciones diferentes. En los casos en los que se pueden introducir diferentes alteraciones en una posición, las diferentes alteraciones se separan con una coma, p. ej., "Arg170Tyr, Glu" representa una sustitución de arginina en la posición 170 con tirosina o ácido glutámico. Por lo tanto, "Tyr167Gly,Ala Arg170Gly,Ala" designa las siguientes variantes:different alterations. In cases where different accidentals can be entered at one position, the different accidentals are separated by a comma, e.g. eg, "Arg170Tyr, Glu" represents a substitution of arginine at position 170 with tyrosine or glutamic acid. Therefore, "Tyr167Gly,Ala Arg170Gly,Ala" designates the following variants:

"Tyr167Gly+Arg170Gly", "Tyr167Gly+Arg170Ala", "Tyr167Ala+Arg170Gly" y "Tyr167Ala+Arg170Ala"."Tyr167Gly+Arg170Gly", "Tyr167Gly+Arg170Ala", "Tyr167Ala+Arg170Gly", and "Tyr167Ala+Arg170Ala".

DESCRIPCIÓN DETALLADA DE LA INVENCIÓNDETAILED DESCRIPTION OF THE INVENTION

La presente divulgación se refiere a variantes de proteasa que comprenden una sustitución en una o más (p. ej., varias) posiciones correspondientes a posiciones específicas del polipéptido maduro de SEQ ID NO: 2 (una proteasa parental), en donde la variante tiene actividad de proteasa. Como se explica en esta memoria, los números de posición específicos pueden cambiar en caso de que la proteasa parental madura sea diferente de la SEQ ID NO: 3. Las propiedades mejoradas de las variantes de la invención se incluyen en las siguientes categorías, p. ej., actividad específica incrementada, estabilidad incrementada, p. ej., estabilidad al almacenamiento incrementada o termoestabilidad incrementada (medida como incremento en la semivida después de estrés térmico (5 minutos a 60°C) como se describe en los ejemplos) y niveles de expresión incrementados en una célula huésped de expresión recombinante.The present disclosure relates to protease variants comprising a substitution at one or more ( eg, several) positions corresponding to specific positions in the mature polypeptide of SEQ ID NO: 2 (a parent protease), wherein the variant has protease activity. As explained herein, the specific position numbers may change in case the mature parent protease is different from SEQ ID NO: 3. The improved properties of the variants of the invention fall into the following categories, e.g. e.g., increased specific activity, increased stability, e.g. eg, increased storage stability or increased thermostability (measured as increase in half-life after heat stress (5 minutes at 60°C) as described in the examples) and increased expression levels in a recombinant expression host cell.

Variantesvariants

La presente divulgación proporciona variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41,42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61,The present disclosure provides protease variants that comprise a substitution at one or more positions corresponding to positions 1, 5, 9, 25, 29, 30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61,

62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200,62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200,

205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 331, 333, 336, 338, 341,343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad de proteasa. En una realización, la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3.205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 331, 333, 336, 338, 341,343, 345, 348, 347, 347 355, 358, 359, 361, 362, 363, and 364 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity. In one embodiment, the variant has increased thermostability measured as an enhancement factor, HIF, compared to the protease of SEQ ID NO: 3.

En un aspecto de la divulgación, la variante tiene una identidad de secuencia de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de la secuencia de aminoácidos de la proteasa parental madura.In one aspect of the disclosure, the variant has at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93% sequence identity. , at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100%, of the amino acid sequence of the mature parental protease.

En otro aspecto, las variantes tienen al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, tal como al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia con el polipéptido de SEQ ID NO: 3.In another aspect, the variants have at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at less than 95%, such as at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the polypeptide of SEQ ID NO: 3.

En un aspecto, el número de sustituciones en las variantes de la presente invención es 1-20 p. ej., 1-10 y 1-5, tales como 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.In one aspect, the number of substitutions in the variants of the present invention is 1-20p . eg, 1-10 and 1-5, such as 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 substitutions.

En un aspecto, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41,42, 45, 46, 49, 50, 53, 54, 55, 57,In one aspect, the disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 1, 5, 9, 25, 29, 30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57,

59, 60, 61,62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81,82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115,59, 60, 61,62, 64, 67, 68, 69, 74, 76, 77, 78, 79, 80, 81,82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115,

117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185,117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185,

199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 329, 330, 331,333, 336, 338, 341,343, 345, 347, 348, 355, 358, 359, 361,362, 363, y 364 del polipéptido de SEQ ID199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 329, 330, 331,333, 336, 338, 341,343, 345, 347, 35,3548 358, 359, 361,362, 363, and 364 of the polypeptide of SEQ ID

NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparación con la proteasa de SEQ ID NO: 3. NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the mature polypeptide of SEQ ID NO: 3, and wherein the variant has increased thermostability measured as enhancement factor, HIF, compared to the protease of SEQ ID NO: 3.

Más específicamente, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y2311, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.More specifically, the variant comprises a substitution at one or more positions selected from the group consisting of: A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C , E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L , T102V, T103i, T103K, T103V, I105Q, D109H, D109K, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115T, N115Y, E117D, E117G, E117H , E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, Q1421A, Q1421T, Q1421T, Q1421T, Q1421T N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, N157I, Q154N, Q154N, Q154N, Q154T Y159H, Q161E, T167F, I169F, I169S, D175I, Q175N, Q182C, H185P, F199L, F19M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217i, F217Y, V225Y, F217Y, V225Y, F217Y, V225Y, F217Y, V225Y, F217Y, V225Y, F217Y, V225Y, F217Y, V225Y, F217Y, V225A I228L, I228T, I228W, Y2311, S234Q, S237F, S237Q, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I , S272K, S272L, S272R, S272T, S272V, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296i, R299N, K305S, L308V, P313L, F314i, L308V, P313L, F314i, L308V, P313L, F314i, L308V, P313L, F314i , S317E, S317N, S317W, S318P, A319F, A319Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329L, S329I, S329L, S329W, G330Q, S331W, S331Y , P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A3 58P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, and V364I, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 1.4, and further, wherein the variants have at least 90 %, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización más específica, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, S5L, S5Y, T9H, K25P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81 P, E81Y, A82M, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115C, N115K, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122R, N124L, G128F, G128S, S130G, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146L, T146N, I147S, K150L, N153M, N153P, N153R, Q154I, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182T, Q182V, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213R, F217I, V225Y, I228L, I228T, I228W, S234Q, S237F, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272K, S272L, S272R, S272V, S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, R299N, K305S, L308V, F314L, S317E, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, D326P, S329C, S329H, S329I, S329L, S329N, S329W, G330Q, S331W, S331Y, S336K, S336N, P341S, K343A, K343H, K343S, K343T, G345S, D347I, P348Y, P355I, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, A363G, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,6, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a more specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: S5K, S5L, S5Y, T9H, K25P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F , D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M , Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82M, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109M, D109Y , F111H, F111K, F111S, Q112R, G114L, N115C, N115K, E117D, E117G, E117H, E117N, E117Q, E117S, I122R, N124L, G128F, G128S, S130G, S130N, S130P, L136K, G141T , Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146L, T146N, I147S, K150L, N153M, N153P, N153R, Q154I, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F F, D175N, Q182C, Q182T, Q182V, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213R, F217I, V225Y, I228L, I228T, I228W, S234Q, S237F, G245S, S248P, S2454S, S2454S, F258P S262P V266K V266R D267A D267H D267L V271 R S272K S272L S272R S272V S272Y , K305S, L308V, F314L, S317E, S317W, S318P, A319F, K321Q, K321S, A322D, L324Q, L324S, D326P, S329L, S329N, S329L, S329N, S329W, G330Q, S331W, S331Y, S336K , S336N, P341S, K343A, K343H, K343S, K343T, G345S, D347I, P348Y, P355I, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, A363G, A363L, and V364I, where positions correspond to amino acid positions in the amino acid sequence listed in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 1.6, and further, wherein the variants have at least 90 %, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, S5L, S5Y, T9H, K25P, S30E, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42K, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54L, Q54M, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61 P, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, E81A, E81K, E81L, E81P, E81Y, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115R, E117G, E117H, E117N, E117Q, E117S, I122R, N124L, G128S, S130G, S130N, S130P, L136K, Q142A, Q142L, Q142N, N145V, T146A, T146L, I147S, K150L, N153M, N153R, Q154I, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182V, F199L, F199M, M200S, Q207H, S210T, T213R, F217I, I228L, I228T, I228W, S237F, G244S, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267N, V271 R, S272K, S272L, S272R, S272V, S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, K305S, L308V, F314L, S317E, S317W, S318P, A319F, A319Q, L324S, D326P, S329C, S329I, S329L, S329N, S329W, G330Q, S331W, S331Y, S336N, P341S, K343H, K343S, K343T, G345S, D347I, P355I, A358P, A358R, A358Y, K359L, K359S, T362L, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,8, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: S5K, S5L, S5Y, T9H, K25P, S30E, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H , D40N, D40P, Q41I, Q41V, F42K, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54L, Q54M, F55H, F55L, K57P, K57S, I59G , I59M, I59P, S60P, S61P, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, E81A, E81K, E81L, E81P, E81Y, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115R, E17N, E17N, E17N, E17N, E17N, E17N, E17N, I122R, N124L, G128S, S130G, S130N, S130p, L136K, Q142A, N145V, T146A, T146L, I147S, K150L, N153M, N153R, Q154i, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F I169F, D175N, Q182C, Q182V, F199L, F199M, M200S, Q207H, S210T, T213R, F217I, I228L, I228T, I228W, S237F, G244S, T246S, S248Y, F258P, S2 62P, V266K, V266R, D267A, D267H, D267N, V271R, S272K, S272L, S272R, S272V, S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V31085L, L31085L, L31085L , S317W, S318p, A319F, A319Q, L324S, D326P, S329C, S329N, S329W, G330Q, S331W, S331Y, S336N, P341S, K343H, K343S, K343T, G345S, D347I, P355I, A358P, A358R, A358Y , K359L, K359S, T362L, A363L, and V364I, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 1.8, and further, in where the variants have at least 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% identity sequence with the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, S5Y, K25P, S30E, I39G, I39L, I39Y, D40F, D40G, D40H, D40N, D40P, Q411, Q41V, F42K, K45M, K45Y, A46C, S50I, S50L, S50M, S50Q, A53C, A53V, Q54M, F55H, F55L, K57P, K57S, I59M, I59P, S60P, S61P, T64I, Q68V, Q68Y, E74R, D76L, D76R, S78D, P79Y, E81A, E81K, E81L, E81P, A82P, N87S, T93L, V94S, T102L, T102V, T103I, T103K, T103V, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, G114L, N115R, E117G, E117H, E117N, I122R, G128S, S130G, S130N, L136K, Q142L, Q142N, N145V, T146A, T146L, I147S, K150L, N153M, N153R, Q154L, Q154N, Q154T, Q154V, N157L, I169F, D175N, F199L, M200S, S210T, T213R, F217I, I228L, I228W, S237F, G244S, T246S, S262P, V266K, D267H, D267N, V271R, S272L, S272V, S272Y, T276Y, G278P, D280S, D280T, C284G, F289Y, I293T, V296A, S317E, S317W, S318P, A319F, L324S, D326P, S329C, S329I, S329W, G330Q, S331Y, S336N, P341S, K343T, D347I, P355I, A358P, A358R, A358Y, K359L, T362L, y A363L, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 2,2, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: S5K, S5Y, K25P, S30E, I39G, I39L, I39Y, D40F, D40G, D40H, D40N, D40P, Q411, Q41V , F42K, K45M, K45Y, A46C, S50I, S50L, S50M, S50Q, A53C, A53V, Q54M, F55H, F55L, K57P, K57S, I59M, I59P, S60P, S61P, T64I, Q68V, Q68Y, E74R, D76L, D76R ,S78D,P79Y,E81A,E81K,E81L,E81P,A82P,N87S,T93L,V94S,T102L,T102V,T103I,T103K,T103V,D109H,D109K,D109M,D109Y,F111H,F111K,F115GL,N1114GL,N1111S,G115GL , E117H, E117N, I122R, G128S, S130G, S130N, L136K, Q142L, Q142N, T146L, I147S, K150L, N153M, Q154T, Q154V, N157L, I169F, D175N, F199L, M200S , S210T, T213R, F217i, I228L, I228W, T246S, S262P, V266K, D267H, D267N, V271R, S272L, S272V, S272Y, T276Y, G278P, D280S, D280T, C284G, F289Y, I293T, V296A, S317E , S317W, S318P, A319F, L324S, D326P, S329C, S329I, S329W, G330Q, S331Y, S336N, P341S, K343T, D347I, P355I, A358 P, A358R, A358Y, K359L, T362L, and A363L, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 2.2, and further, wherein the variants have at least 90 %, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización más específica, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S5K, I39G, I39L, I39Y, D40H, F42K, K45M, A46C, S50I, S50M, A53C, Q54M, F55H, F55L, K57P, K57S, I59M, I59P, T64I, Q68Y, E74R, D76L, S78D, P79Y, E81K, E81L, N87S, T93L, T102V, T103I, T103K, T103V, D109H, D109Y, F111H, F111K, F111S, N115R, E117G, E117H, I122R, L136K, Q142L, Q142N, T146L, I147S, N153R, Q154L, Q154N, Q154T, N157L, I169F, D175N, F199L, M200S, S210T, T213R, I228L, S237F, T246S, S262P, D267N, V271 R, S272V, S272Y, T276Y, D280S, D280T, C284G, F289Y, I293T, V296A, S317E, S317W, A319F, L324S, S329I, S329W, S331Y, S336N, P341S, D347I, P355I, y T362L, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 3,2, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a more specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: S5K, I39G, I39L, I39Y, D40H, F42K, K45M, A46C, S50I, S50M, A53C, Q54M, F55H, F55L , K57P, K57S, I59M, I59P, T64I, Q68Y, E74R, D76L, S78D, P79Y, E81K, E81L, N87S, T93L, T102V, T103I, T103K, T103V, D109H, D109Y, F111H, F111R, E1, F1171S , E117H, I122R, L136K, Q142L, Q142N, T146L, I147S, N153R, Q154L, Q154N, Q154T, N157L, I169F, D175N, F199L, M200S, S210T, T213R, I228L, S27R, V27R, D2626S, S2626S, S272V, S272Y, T276Y, D280S, D280T, C284G, F289Y, I293T, V296A, S317E, S317W, A319F, L324S, S329I, S329W, S331Y, S336N, P341S, D347I, P355I, and T362L positions, where positions of amino acids in the amino acid sequence collected in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 3.2, and further, wherein the variants have at least 90 %, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I39G, D40H, K45M, A46C, S50I, A53C, F55H, F55L, K57P, T64I, E74R, P79Y, T102V, N115R, E117H, I147S, N157L, D175N, F199L, S210T, I228L, D267N, D280T, C284G, V296A, S317E, A319F, S329I, P341S, D347I, y P355I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 6,4, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: I39G, D40H, K45M, A46C, S50I, A53C, F55H, F55L, K57P, T64I, E74R, P79Y, T102V, N115R , E117H, I147S, N157L, D175N, F199L, S210T, I228L, D267N, D280T, C284G, V296A, S317E, A319F, S329I, P341S, D347I, and P355I, where positions correspond to amino acid positions in the amino acid sequence collected in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 6.4, and further, wherein the variants have at least 90 %, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En otro aspecto, la variante comprende o consiste en una sustitución seleccionada del grupo que consiste en A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N157I, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4 en comparación con la proteasa parental. In another aspect, the variant comprises or consists of a substitution selected from the group consisting of A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103i, T103K, T103V, I105Q, D109H, D109K, D109m, D109Y, F111H, F111K, F111S, F111Y, N115C, N115K, N115P, E117D, E117G, E117H, E117N E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A T146i, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153P, N153R, N153Y, Q154A, Q154M, Q154L, Q154M, Q154N, Q154L, Y159H, Q161E, T167F I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217i, F217Y, V225Y, I228L, I228T, I228W, I228W Y231i, S234Q, S237F, S237Q, A242i, A242L, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R , S272T, S272V, S272Y, T276L, T276Y, D280S, D280N, C284A, C284G, F289Y, I293T, V296A, V296i, R299N, K305S, L308V, P313L, F314i, S317W , S318p, A319F, A319Q, K321L, K321Q, L321S, L324S, N325L, D326P, S329C, S329H, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N , N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y , K359L, K359S, L361M, T362L, T362N, A363G, A363L, and V364I, where the positions correspond to amino acid positions in the amino acid sequence listed in SEQ ID NO: 3, and where the substitution in one or more positions provides a protease variant having an increase in thermostability measured as enhancement factor, HIF, of at least 1.4 compared to the parent protease.

La presente divulgación proporciona variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61,62, 66, 69, 76, 81,87,The present disclosure provides protease variants that comprise a substitution at one or more positions corresponding to positions 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61.62, 66, 69, 76, 81.87,

93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145, 146, 148, 149, 150,93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145, 146, 148, 149, 150,

153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 275, 276,

Figure imgf000012_0001
277, 280, 285, 288, 291, 292, 293, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 344, 345, 348, 356, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad de proteasa. En una realización, las variantes tienen una actividad específica incrementada medida como factor de mejora, AIF, en comparación con la proteasa de153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 275, 276,
Figure imgf000012_0001
277, 280, 285, 288, 291, 292, 293, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 344, 345, 348, 356, 363, and 364 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity. In one embodiment, the variants have increased specific activity measured as enhancement factor, AIF, compared to the protease of

SEQ ID NO: 3.SEQ ID NO: 3.

En un aspecto de la divulgación, la variante tiene una identidad de secuencia de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de la secuencia de aminoácidos de la proteasa parental madura.In one aspect of the disclosure, the variant has at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93% sequence identity. , at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100%, of the amino acid sequence of the mature parental protease.

En otro aspecto, las variantes tienen al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, tal como al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia con el polipéptido de SEQ ID NO: 3.In another aspect, the variants have at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at less than 95%, such as at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the polypeptide of SEQ ID NO: 3.

En un aspecto, el número de sustituciones en las variantes de la presente invención es 1-20 p. ej., 1-10 y 1-5, tales como 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.In one aspect, the number of substitutions in the variants of the present invention is 1-20p . eg, 1-10 and 1-5, such as 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 substitutions.

En un aspecto específico, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50,In a specific aspect, the disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 20, 27, 29, 34, 40, 42, 45, 46, 50,

66, 69, 76, 81, 87, 93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127,66, 69, 76, 81, 87, 93, 96, 98, 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127,

146, 148, 149, 150, 153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 1 208, 209, 210, 213, 216, 219, 228, 231, 237, 244, 249, 252, 253, 261, 266, 267, 272, 2 288, 291, 292, 294, 296, 299, 303, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 3

Figure imgf000012_0002
344, 345, 348, 358, 359, 361,362, 363, y 364del polipéptido de SeQ ID NO: 3, y la variante tiene actividad de proteasa, y en donde la variante tiene al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el208, 209, 210, 213, 216, 219, 228, 231, 237, 244, 249 , 252, 253, 261, 266, 267, 272, 2 288, 291, 292, 294, 296, 299, 303, 304, 305, 306, 307, 308, 310, 317, 318, 319, 321, 3
Figure imgf000012_0002
344, 345, 348, 358, 359, 361,362, 363, and 364 of the polypeptide of SeQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 80%, at least 85%, at least 90%, at least 95%, at least 96%, at least

97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene una actividad específica incrementada medida como factor de mejora, AIF, en comparación con la proteasa de SEQ ID NO: 3.97%, at least 98%, or at least 99%, but less than 100% sequence identity to the mature polypeptide of SEQ ID NO: 3, and wherein the variant has increased specific activity measured as a factor of improvement, AIF, compared to the protease of SEQ ID NO: 3.

Más específicamente, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y,More specifically, the variant comprises a substitution at one or more positions selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y,

K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364i, V364L, V364m , y V364S, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37, y además, en donde las variantes tienen al menos el 90%, al menos el 95% K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P102C, T102i, T103V, D109P, D110W, N115A, N115D, E117F, E117G, E117L, E117W, E117 and I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142A, Q142L Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145V, N145W, T146A, T146M, T146I, T146M, T146V, T146W, T146V, T146W, S148G, A149V, K150F N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157FY, Y159M, Y159 59H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183M, A184D, A184F, A184H, A184I, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F , T213H, T213i, T213L, T213N, T213R, T213S, T213W, T216Y, S219m, I228F, I228H, I228L I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L , G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L , Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L , R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, F310A, S317A, S317C, S317K, S317L, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L , A358P, K359C, K359L, K359S, K359W, L361E, L361M, L361P, L361R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362RQ, T362RQ, T362P, T362RQ, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364i, V364L, V364m, and V364S, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 1.37, and further, wherein the variants have at least the 90%, at least 95%

de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.of identity, at least 96%, at least 97%, at least 98% or at least 99%, but less than 100%, sequence identity with the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, F42Y, K45L, K45Y, A46E, A46K, S50A, S50L, A53L, Q54L, F55R, I59M, I59P, S60E, S60P, S61 D, S61 P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153Y, Q154I, Q154K, Q154L, Q154M, Q154R, Q154W, N157F, N157Y, Y159H, Y159S, Q161A, T167D, Q182F, A184F, A184I, A184K, A184V, A184W, H185A, N188L, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211F, T213F, T213I, T213L, T213N, T213R, T213S, T213W, A216F, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, N252F, V261A, V261G, V266C, V266R, D267S, S272I, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285S, T288C, T288V, I293Y, S294T, S294V, A303F, G304H, G304K, G304P, G304R, G304S, K305C, K305F, K305H, K305I, K305S, K305T, S306L, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, K359W, L361P, L361R, T362C, T362H, T362I, T362K, T362M, T362R, T362Y, A363F, y V364M, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 2,0, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, F42Y, K45L , K45Y, A46E, A46K, S50A, S50L, A53L, Q54L, F55R, I59M, I59P, S60E, S60P, S61D, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P , D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, E117D, E117D, E1117D , E117L, E117N, E117P, E117S, E117W, E117Y, N124D, N124I, N124K, N124V, F125K, F125L, F125M, L127C, L127P, G128W, G128Y, S130D, S130F , S130I, S130N, L136C, G141A, G141C, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145L, N145G, N145R, N145S, N145V, N145W, N145S, N145V, N145R, N145S, N145V, N145R, N145S, N145V, N145W , T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153Y, Q154I, Q154K , Q154L, Q154M, Q154R, Q154W, N157F, Y159S, Q159H, T167D, Q182F, A184F, A184i, A184K, A184V, A184W, M200F, M200L, Q207F, G208H, G208Y, V209F , V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, T213F, T213i, T213L, T213N, T213R, T213S, T213W, A216F, S219m, I228F, I228H, I228L, I228M , I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, N252F, V261A, V261G, V266C, V266R, D267S, S272I, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275F , Q275K, Q275L, Q275R, Q275V, T276F, T276R, I276V, D280F, D280H, D280T, D280S, D280T, A285S, T288C, T288V, I293Y, S294T, S294V, A303F, G304H, G304K, G304p , G304R, G304S, K305C, K305F, K305H, K305i, K305S, K305T, S306L, S306R, P307C, L308P, L308T, F310M, S317C, S317G, S317H, S317i, S317K, S317L, S317R, S317W , S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341R, A34 4K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, K359W, L361P, L361R, T362C, T362H, T362I, T362K, T362M, T362FY, and T362FY, T362R, T362R where the positions correspond to amino acid positions in the amino acid sequence collected in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 2.0, and further, wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, K45Y, A46E, S50L, A53L, F55R, I59M, S60E, S60P, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124I, N124K, N124L, N124M, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, N153Y, Q154I, Q154L, Q154R, N157F, Y159H, Y159S, T167D, Q182F, A184F, A184I, A184K, A184W, F199L, M200L, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209Y, S210E, S210L, T213F, T213I, T213N, T213R, I228F, I228L, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, V261A, V266R, D267S, S272I, S272L, S272Q, S272R, S272T, S272Y, Q275K, Q275L, Q275R, Q275V, T276F, T276V, I277L, D280F, D280M, D280N, D280S, D280T, A285S, T288V, I293Y, S294T, S294V, G304H, G304K, G304P, G304R, G304S, K305F, K305H, K305I, K305T, S306L, P307C, L308P, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, L361P, L361R, T362C, T362H, T362I, T362Y, y V364M, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 2,2, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, K45Y, A46E , S50L, A53L, F55R, I59M, S60E, S60P, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T , T98L, P101F, P101L, P101M, P101R, T102C, D102i, D110W, N115A, N115D, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124I, N124K, N124L , N124M, N124V, F125K, F125L, F125M, L127C, L127P, G128W, G128S, S130F, S130i, S130N, L136C, G141A, G141C, G141F, G141L, G141V , Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V , N153Y, Q154I, Q154L, Q154R, N157F, Y159H, Y159S, T167D, Q182F, A184F, A184I, A184K, A184W, F199L, M200L, G208h, G208Y, V209F, V209G, V209H, V209L, V209N, V209Y, S210E, T213N, T213I, T213N, T213R, I228F, I228L, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237i, S237K, S237F, S237i, S237K S237L, G244N, G249C, V261A, V266R, D267S, S272I, S272L, S272T, S272Y, Q275K, Q275L, Q275R, Q275V, T276F, T276V, I277L, D280F, D280M, D285S, D280S, D280T, D285S T288V, I293Y, S294T, S294V, G304H, G304K, G304P, G304R, K305i, K305T, S306L, P307C, L308P, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317i, S317K, S317i, S317K S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, G345K, G345S, P348G , P348L, P348S, N356L, N356Y, A358L, K359S, L361P, L361R, T362C, T362H, T362I, T362Y, and V364M, where the positions correspond to amino acid positions in the amino acid sequence reported in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 2.2, and further, wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: G20L, G20R, S29A, S29C, S29N, S29P, A34N, A34R, A46E, S50L, F55R, I59M, S60E, S60P, S61P, S62N, S66M, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, N115A, N115D, N115G, E117D, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124I, N124K, N124V, F125L, F125M, L127P, G128N, G128S, G128W, G128Y, S130D, S130F, G141A, G141F, G141L, G141M, G141Q, G141R, Q142A, Q142L, Q142M, Q142S, Q142W, N145G, N145I, N145S, N145W, T146A, T146H, T146N, T146V, T146W, Q154R, Y159H, Y159S, T167D, Q182F, F199L, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209Y, S210L, T213I, I228L, I228Q, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, V261A, V266R, D267S, S272L, S272T, S272Y, Q275K, Q275R, T276F, T276V, I277L, D280F, D280N, D280S, D280T, A285S, S294T, G304H, G304K, G304P, G304R, G304S, K305H, K305I, L308P, F310M, F310P, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, A319F, K321S, D326P, V327C, S336R, N338H, P341I, P341N, P341R, G345K, G345S, P348G, P348S, N356Y, A358L, L361P, T362I, y V364M, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 2,6, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: G20L, G20R, S29A, S29C, S29N, S29P, A34N, A34R, A46E, S50L, F55R, I59M, S60E, S60P , S61P, S62N, S66M, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T109VI, T1093 , N115A, N115D, N115G, E117D, E117F, E117G, E117L, E117N, E114P, N124K, N124V, F125L, F125M, L127P, G128N, G128S, G128W, G128Y, S130D, S130F, G141A, G141F , G141L, G141M, G141Q, G141R, Q142A, Q142S, Q142W, N145G, N145i, N145S, N145W, T146A, T146H, T146N, Y159H, Y159S, T167D, Q182F, F159L, G208H , G208Y, V209F, V209G, V209H, V209L, V209N, V209Y, S210L, T213i, I228L, I228Q, Y231S, S237F, S237I, S237K, S237L, G244N, V261A, V266R, D267S, S272L, S272T, S272Y , Q275K, Q275R, T276F, T276V, I277L, D280F, D280N, D280S, D280T, A285S, S294T, G304H, G304K , G304P, G304R, G304S, K305H, K305I, L308P, F310M, F310P, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, A319F, K321S, D326P, V327C, S336R, N338H, P341I, P341N, P341R, G345K, G345S, P348G, P348S, N356Y, A358L, L361P, T362I, and V364M, where the positions correspond to amino acid positions in the amino acid sequence collected in SEQ ID NO : 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 2.6, and further, wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S29N, A34N, A34R, I59M, S60P, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, N87F, L96F, L96S, T98L, P101L, P101M, T102C, T102I, D109P, N115A, E117D, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124I, N124K, N124V, F125L, G128N, G128W, S130D, S130F, G141F, G141L, G141M, G141Q, G141R, Q142A, Q142L, Q142M, Q142S, Q142W, N145I, N145S, T146H, T146N, T146W, Q154R, Y159S, T167D, Q182F, V209F, V209H, V209L, I228Q, Y231S, S237I, S237L, D267S, S272T, S272Y, T276F, T276V, D280F, D280S, D280T, A285S, S294T, G304H, G304P, K305H, F310M, F310P, S317C, S317G, S317I, S317K, S317L, S317R, S317W, S317Y, A319F, D326P, V327C, N338H, P341N, P341 R, G345K, G345S, P348S, N356Y, y L361 P, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 3,0, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: S29N, A34N, A34R, I59M, S60P, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, N87F , L96F, L96S, T98L, P101L, P101M, T102C, T102I, D109P, N115A, E117D, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124I, N124K, N124V, S1, G1208F, G1328F , G141F, G141L, G141M, G141Q, G141R, Q142M, Q142S, Q142W, N145i, N145S, T146H, T146N, T146W, Q154R, Y159S, T167D, Q182F, V209F, V209H, S237I, I228Q, Y231S, S237I , S237L, D267S, S272T, S272Y, T276F, T276V, D280F, D280S, G304H, G304p, K305H, F310M, F310P, S317C, S317G, S317I, S317K, S317L, S317R, S317W, S317Y, A319F , D326P, V327C, N338H, P341N, P341R, G345K, G345S, P348S, N356Y, and L361P, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 3.0, and further, wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: S29N, A34N, A34R, I59M, S60P, D76A, D76K, D76L, D76N, D76P, D76Y, N87F, L96F, D109P, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124V, G141F, G141L, G141M, G141R, Q142L, Q142M, Q142S, Q142W, T146H, T146N, Q154R, V209F, V209H, I228Q, T276F, D280T, A285S, S294T, F310M, F310P, S317C, S317I, S317K, S317L, S317R, S317W, D326P, N338H, P341N, P341R, G345K, G345S, P348S, N356Y, y L361P, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 3,8, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: S29N, A34N, A34R, I59M, S60P, D76A, D76K, D76L, D76N, D76P, D76Y, N87F, L96F, D109P , E117F, E117G, E117L, E117N, E117P, E117W, E117Y, N124V, G141F, G141R, Q142L, Q142M, Q142S, Q142W, T146H, V209H, I228Q, T276F, D280T, A285S , S294T, F310M, F310P, S317C, S317I, S317K, S317L, S317R, S317W, D326P, N338H, P341N, P341R, G345K, G345S, P348S, N356Y, and L361P, where positions correspond to amino acid positions in the sequence of amino acids collected in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 3.8, and further, wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: A34N, A34R, D76A, D76K, D76L, D76N, D76Y, N87F, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, G141L, G141M, Q142L, Q142M, Q142S, Q142W, T146H, T146N, Q154R, V209H, T276F, A285S, S294T, F310M, F310P, S317I, S317K, S317R, S317W, N338H, y G345S, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 4,5, y además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: A34N, A34R, D76A, D76K, D76L, D76N, D76Y, N87F, E117F, E117G, E117L, E117N, E117P, E117W where the positions correspond to amino acid positions in the amino acid sequence collected in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 4.5, and further, wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En otro aspecto, la variante comprende o consiste en una sustitución seleccionada del grupo que consiste en: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101 F, P101L, P101M, P101 R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364I, V364L, V364M, y V364S, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37 en comparación con la proteasa parental.In another aspect, the variant comprises or consists of a substitution selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y, K45L , K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F , S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C , T102i, T103V, D109P, D110W, N115A, N115D, E117D, E117F, E117G, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V , F125K, F125L, F125m, L127C, L127P, G128N, G128R, G128S, S130F, S130i, S130N, L136C, G141A, G141C, G141F, G141L, G141V, Q142A, Q142L , Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146 N157AY N157m, N157y, Y159F, Y159G, Y159H, Y159S, T167D, T167V, Q182F, S183A, S183F, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184R, A184S, A184T A184V, A184W, A184 and H185A, H185L, H185P, H185S, N188L, M200F, M200L, Q207F, G208H, G208Y, V209L, V209N, V209W, V209Y, S210E, S210L, S210R S210T, S210Y, P211 F, T213F, T213H, T213i, T213L, T213N, T213R, T213Y, A216F, A216L, S219m, I228F, I228H, I228V, I228Q, I228V, I228Y, Y231F, Y231S, S237F , S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y A2 85S, T288C, T288i, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303V, G304H, G304K, G304p, G304R, G304S, G304Y, K305C, K305F, K305C, K305F K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317H, S317G, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, D326P, V327C V327T, S336R, N338h, N338S, N338T, P3411, P341N, P341 R, A344K, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359 , L361E, L361M, L361P, L361R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363M, A363E, A363F A363V, V364F, V364I, V364L, V364M, and V364S, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3, and where substitution at one or more positions provides a variant of protease having an increase in specific activity measured as enhancement factor, AIF, of at least 1.37 compared to the parent protease.

En un aspecto particular adicional, la presente divulgación se refiere a una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3.In an additional particular aspect, the present disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 or 280 of the polypeptide of SEQ ID NO: 3 and the variant has protease activity, and wherein the variant comprises a substitution selected from the group consisting of: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K , D280S, and further wherein the variants have at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity, but less than 100% identity of the amino acid sequence of SEQ ID NO: 3.

Particularmente, la divulgación se refiere a una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C.In particular, the disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 or 280 of the polypeptide of SEQ ID NO: 3 and the variant has protease activity, and wherein the variant comprises a substitution selected from the group consisting of: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S, and, furthermore, wherein the variants have at least 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% of amino acid sequence identity of SEQ ID NO: 3, and wherein the variant has residual activity measured by increased thermostability after heat stress for 20 min at 56°C.

En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.In another aspect, the disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 or 280 of the polypeptide of SEQ ID NO: 3 and the variant has protease activity, and wherein the variant comprises a substitution selected from the group consisting of: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S, and, furthermore, wherein the variants have at least 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% identity of the amino acid sequence of SEQ ID NO: 3, and wherein the variant has residual activity measured by increased thermostability after heat stress for 20 min at 56°C, wherein the residual activity is at least 50 %, particularly at least 60%, at least 70%, at least 80%.

En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 o 280 del polipéptido de SEQ ID NO: 3 y la variante tiene actividad de proteasa, y en donde la variante comprende al menos tres sustituciones seleccionadas del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S,y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.In another aspect, the disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 39, 57, 59, 66, 102, 111, 115, 267, 272, 275 or 280 of the polypeptide of SEQ ID NO: 3 and the variant has protease activity, and wherein the variant comprises at least three substitutions selected from the group consisting of: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S, and further wherein the variants have at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity, but less than 100% identity of the amino acid sequence of SEQ ID NO: 3, and wherein the variant has residual activity measured by increased thermostability after heat stress for 20 min at 56°C, wherein the residual activity is at least 50%, particularly at least 60%, at least 70%, at least 80%.

En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende las sustituciones correspondientes a I39L+S66T+T102V o D267N+S272Y Q275K+D280S del polipéptido de SEQ ID NO: 3 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.In another aspect, the disclosure relates to a protease variant comprising substitutions corresponding to I39L+S66T+T102V or D267N+S272Y Q275K+D280S of the polypeptide of SEQ ID NO: 3 and, furthermore, wherein the variants have at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the sequence of amino acids of SEQ ID NO: 3, and wherein the variant has an increased thermostability measured residual activity after heat stress for 20 min at 56°C, wherein the residual activity is at least 50%, particularly at least 60%, at least 70%, at least 80%.

En otro aspecto, la divulgación se refiere a una variante de proteasa que comprende las sustituciones correspondientes a:In another aspect, the disclosure relates to a protease variant comprising substitutions corresponding to:

I39L+ S66T T102V;I39L+ S66T T102V;

I39L+S66T+T102V+D267N S272Y+D280S;I39L+S66T+T102V+D267N S272Y+D280S;

I39L+K57P+I59M+S66T+T102V F111H+N115K+D267N+S272Y, I39L+K57P+I59M+S66T+T102V F111H+N115K+D267N+S272Y,

I39L+K57P+159M+S66T+T102V+F111H+N115K+D280S; o I39L+K57P+159M+S66T+T102V+F111H+N115K+D280S; or

D267N+S272Y+Q275K+D280S en el polipéptido de SEQ ID NO: 3 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3, y en donde la variante tiene una actividad residual medida de termoestabilidad incrementada después de estrés térmico durante 20 min a 56°C, en donde la actividad residual es al menos 50%, particularmente al menos 60%, al menos 70%, al menos 80%.D267N+S272Y+Q275K+D280S in the polypeptide of SEQ ID NO: 3 and, furthermore, wherein the variants have at least 90%, at least 95%, at least 96%, at least 97% identity , at least 98% or at least 99%, but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3, and wherein the variant has residual activity measured by increased thermostability after thermal stress for 20 min at 56°C, where the residual activity is at least 50%, particularly at least 60%, at least 70%, at least 80%.

La presente divulgación proporciona variantes de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las posiciones 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314, 329, 331, 333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad de proteasa. En una realización, las variantes tienen un nivel de expresión incrementado medido como factor de mejora, EIF, en comparación con la proteasa de SEQ ID NO: 3.The present disclosure provides protease variants that comprise a substitution at one or more positions corresponding to positions 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 304, 314, 314, 314 329, 331, 333, 336, 362, and 363 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity. In one embodiment, the variants have an increased expression level measured as enhancement factor, EIF, compared to the protease of SEQ ID NO: 3.

En un aspecto de la divulgación, la variante tiene una identidad de secuencia de al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de la secuencia de aminoácidos de la proteasa parental madura. In one aspect of the disclosure, the variant has at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95% sequence identity. , at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100%, of the amino acid sequence of the mature parent protease.

En otro aspecto, la variante tiene al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, tal como al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia con el polipéptido de SEQ ID NO: 3.In another aspect, the variant is at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, such as at least 96%. , at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the polypeptide of SEQ ID NO: 3.

En un aspecto, el número de sustituciones en las variantes de la presente invención es 1-20 p. ej., 1-10 y 1-5, tales como 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.In one aspect, the number of substitutions in the variants of the present invention is 1-20p . eg, 1-10 and 1-5, such as 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 substitutions.

En un aspecto específico, la divulgación se refiere a una variante de proteasa que comprende una sustitución en una o más posiciones correspondientes a las posiciones 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 294, 296, 301, 307, 314, 329, 331, 333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante tiene un nivel de expresión incrementado medido como factor de mejora, EIF, en comparación con la proteasa de SEQ ID NO: 3.In a specific aspect, the disclosure relates to a protease variant comprising a substitution at one or more positions corresponding to positions 2, 17, 22, 41,41,42, 45, 46, 54, 55, 57, 59 , 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169 , 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291, 292, 2964 , 301, 307, 314, 329, 331, 333, 336, 362, and 363 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at least 95% , at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the mature polypeptide of SEQ ID NO: 3, and wherein the variant has a level of increased expression measured as enhancement factor, EIF, compared to the protease of SEQ ID NO: 3.

Más específicamente, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271 F, V2711, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,38 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.More specifically, the variant comprises a substitution at one or more positions selected from the group consisting of: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103i, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, E129V, E129Y, N131i, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, Y159L, T167A T167L, T167S, T167W, I169S, F167W, M200L, A205S, Q207N, V209P, P211 F, P211S, T213, F217i, V266A, V266F, V266L, V266S, V267L, D267T, D267V , Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V2711, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L S336T, T362R, and A363T, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in expression level measured as enhancement factor, EIF, of at least 1.38, and further wherein the variants have at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the sequence of amino acids of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I2L, A17P, P22V, Q41L, Q41Y, F42R, Q54R, Q54S, Q54Y, F55N, F55T, K57L, K57V, I59D, I59S, I59V, S60L, S60Q, S60R, S60Y, S61F, S62L, S62V, T63A, T63E, T63R, T64C, T64D, T64M, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, T167A, T167S, T167W, F199Y, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271 F, V2711, V271K, V271M, S272A, G274R, G278S, T288A, T288C, T288G, V296P, V296R, V296T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, y S336T, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,6 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: I2L, A17P, P22V, Q41L, Q41Y, F42R, Q54R, Q54S, Q54Y, F55N, F55T, K57L, K57V, I59D , I59S, I59V, S60L, S60Q, S60R, S60Y, S61F, S62L, S62V, T63A, T63E, T63R, T64C, T64D, T64M, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G115LY, N115LY , E129S, E129V, E129Y, N131i, N131S, N134V, Q134R, A149D, T167A, T167S, T167W, F167S, V266F, V266L, V266S, V267L, D267F, D267L, D267T , D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V2711, V271K, V271M, S272A, G274R, G278S, V298A, T288C, T288C, T288C, T288C, V296T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, and S336T, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in expression level measured as enhancement factor, EIF, of at least 1.6, and further wherein the variants have at least the 90%, at least 95% identity, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: I2L, A17P, P22V, Q41Y, F42R, K57L, I59S, T63A, T63R, Q112H, Q112M, Q112R, Q112S, G114A, G114L, G114P, E129L, E129S, E129Y, N131I, N131S, N131V, Q134L, Q134R, T167W, K250R, V266A, V266L, V266T, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269T, Q269V, Q269X, I270A, I270L, I270S, V271I, V271M, G274R, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,75 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: I2L, A17P, P22V, Q41Y, F42R, K57L, I59S, T63A, T63R, Q112H, Q112M, Q112R, Q112S, G114A , G114L, G114P, E129L, E129S, E129Y, N131I, N131S, Q134R, T167W, K250R, V266A, V266L, V266T, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269T, Q269V, Q269T, Q269 , I270A, I270L, I270S, V271I, V271M, G274R, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein substitution at the one or more positions provides a protease variant having an increase in expression level measured as enhancement factor, EIF, of at least 1.75, and further wherein the variants have at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the sequence of amino acids of SEQ ID NO: 3.

En una realización específica adicional, la variante comprende una sustitución en una o más posiciones seleccionadas del grupo que consiste en: Q112M, Q112S, G114L, E129Y, N131I, Q134R, K250R, D267F, D267L, D267V, Q269C, Q269V, I270A, I270L, V271I, G274R, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3; y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,9 y, además, en donde las variantes tienen al menos el 90%, al menos el 95% de identidad, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, de identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.In a further specific embodiment, the variant comprises a substitution at one or more positions selected from the group consisting of: Q112M, Q112S, G114L, E129Y, N131I, Q134R, K250R, D267F, D267L, D267V, Q269C, Q269V, I270A, I270L , V271I, G274R, where the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3; and wherein the substitution at the one or more positions provides a protease variant having an increase in expression level measured as enhancement factor, EIF, of at least 1.9, and further wherein the variants have at least 90%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% but less than 100% sequence identity to the sequence of amino acids of SEQ ID NO: 3.

En otro aspecto, la variante comprende o consiste en una sustitución seleccionada del grupo que consiste en: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V271I, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, en donde las posiciones corresponden a posiciones de aminoácidos en la secuencia de aminoácidos recogida en SEQ ID NO: 3, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un incremento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,38 en comparación con la proteasa parental.In another aspect, the variant comprises or consists of a substitution selected from the group consisting of: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L , F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E , T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103I, T103I , T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, E129V, E129Y, N131i, N131S, N131V, Q134A, Q134L, Q154R, A149D, Y159F, Y159L, T167A, T167L , T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, D267V, D267V, D267L, D267L, D267L, D267Y, D267F Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V271I, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V 279i, D280Y and C284A, T288A, T288C, T288G, S291V, V292S, V296R, V296T, I301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, and A363T, wherein the positions correspond to amino acid positions in the amino acid sequence set forth in SEQ ID NO: 3, and wherein substitution at one or more positions provides a protease variant having increased expression level measured as enhancement factor, EIF, of at least 1.38 compared to the parent protease.

Las variantes pueden comprender, además, una o más alteraciones adicionales en una o más (p. ej., varias) otras posiciones.Variants may further comprise one or more additional alterations at one or more (eg, several) other positions.

Los cambios de aminoácidos pueden ser de naturaleza menor, es decir, sustituciones o inserciones conservadoras de aminoácidos que no afectan significativamente al plegamiento y/o a la actividad de la proteína; pequeñas deleciones, típicamente de 1-30 aminoácidos; pequeñas extensiones amino- o carboxilo-terminales, tales como un residuo metionina amino-terminal; un péptido enlazador pequeño de hasta 20-25 residuos; o una pequeña extensión que facilita la purificación cambiando la carga neta u otra función, tal como un tracto de poli-histidina, un epítopo antigénico o un dominio de unión.The amino acid changes may be of a minor nature, ie, conservative amino acid substitutions or insertions that do not significantly affect the folding and/or activity of the protein; small deletions, typically 1-30 amino acids; small amino- or carboxyl-terminal extensions, such as an amino-terminal methionine residue; a small linker peptide of up to 20-25 residues; or a small extension that facilitates purification by changing the net charge or other function, such as a poly-histidine tract, an antigenic epitope, or a binding domain.

Por lo tanto, incluso aunque las variantes de proteasa de acuerdo con la invención solo puedan comprender una sustitución específica que proporcione la propiedad mejorada de acuerdo con la invención, aún pueden tener modificaciones de adición que conduzcan a una proteasa variante que tenga al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100% de identidad de secuencia, con la secuencia de aminoácidos de la proteasa parental madura, p. ej., la proteasa de SEQ ID NO: 3. Preferiblemente, estas modificaciones adicionales no deberían cambiar significativamente las propiedades mejoradas de la proteasa variante.Therefore, even though protease variants according to the invention may only comprise a specific substitution that provides the improved property according to the invention, they may still have addition modifications leading to a variant protease having at least 80 %, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity, with the amino acid sequence of the mature parent protease, e.g. eg, the protease of SEQ ID NO: 3. Preferably, these additional modifications should not significantly change the improved properties of the variant protease.

Ejemplos de sustituciones conservadoras están dentro de los grupos de aminoácidos de carácter básico (arginina, lisina e histidina), aminoácidos de carácter ácido (ácido glutámico y ácido aspártico), aminoácidos polares (glutamina y asparagina), aminoácidos hidrófobos (leucina, isoleucina y valina), aminoácidos aromáticos (fenilalanina, triptófano y tirosina) y pequeños aminoácidos (glicina, alanina, serina, treonina y metionina). Las sustituciones de aminoácidos que generalmente no alteran la actividad específica son conocidas en la técnica y están descritas, por ejemplo, por H. Neurath y R.L. Hill, 1979, En, The Proteins, Academic Press, Nueva York. Sustituciones comunes son Ala/Ser, Val/Ile, Asp/Glu, Thr/Ser, Ala/Gly, Ala/Thr, Ser/Asn, Ala/Val, Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg, Asp/Asn, Leu/Ile, Leu/Val, Ala/Glu y Asp/Gly. Examples of conservative substitutions are within the groups of basic amino acids (arginine, lysine, and histidine), acidic amino acids (glutamic acid and aspartic acid), polar amino acids (glutamine and asparagine), hydrophobic amino acids (leucine, isoleucine, and valine). ), aromatic amino acids (phenylalanine, tryptophan and tyrosine) and small amino acids (glycine, alanine, serine, threonine and methionine). Amino acid substitutions that do not generally alter specific activity are known in the art and are described, for example, by H. Neurath and RL Hill, 1979, In, The Proteins, Academic Press, New York. Common substitutions are Ala/Ser, Val/Ile, Asp/Glu, Thr/Ser, Ala/Gly, Ala/Thr, Ser/Asn, Ala/Val, Ser/Gly, Tyr/Phe, Ala/Pro, Lys/Arg , Asp/Asn, Leu/Ile, Leu/Val, Ala/Glu and Asp/Gly.

Aminoácidos esenciales en un polipéptido pueden identificarse de acuerdo con procedimientos conocidos en la técnica, tales como mutagénesis dirigida al sitio o mutagénesis de exploración de alanina (Cunningham y Wells, 1989, Science 244: 1081 -1085). En esta última técnica, se introducen mutaciones únicas de alanina en cada uno de los residuos de la molécula, y las moléculas mutantes resultantes se testan para determinar la actividad de proteasa para identificar residuos de aminoácidos que son críticos para la actividad de la molécula. Véase también, Hilton et al., 1996, J. Biol. Chem. 271: 4699-4708. El sitio activo de la enzima u otra interacción biológica también se puede determinar mediante análisis físico de la estructura, según se determina mediante técnicas tales como resonancia magnética nuclear, cristalografía, difracción de electrones o marcaje por fotoafinidad, junto con la mutación de los aminoácidos del sitio de contacto putativo. Véase, por ejemplo, de Vos et al., 1992, Science 255: 306-312; Smith et al., 1992, J. Mol. Biol.Essential amino acids in a polypeptide can be identified according to methods known in the art, such as site-directed mutagenesis or alanine scanning mutagenesis (Cunningham and Wells, 1989, Science 244:1081-1085). In this latter technique, single alanine mutations are introduced into each of the molecule's residues, and the resulting mutant molecules are tested for protease activity to identify amino acid residues that are critical to the activity of the molecule. See also, Hilton et al., 1996, J. Biol. Chem. 271: 4699-4708. The active site of the enzyme or other biological interaction can also be determined by physical analysis of the structure, as determined by techniques such as nuclear magnetic resonance, crystallography, electron diffraction, or photoaffinity labeling, along with mutation of the amino acids of the enzyme. putative contact site. See, eg, de Vos et al., 1992, Science 255:306-312; Smith et al., 1992, J. Mol. Biol.

224: 899-904; Wlodaver et a/., 1992, FEBS Lett. 309: 59-64.224: 899-904; Wlodaver et al., 1992, FEBS Lett. 309: 59-64.

En un aspecto, la variante ha mejorado (incrementado) la actividad específica en comparación con la enzima parental. In one aspect, the variant has improved (increased) specific activity compared to the parent enzyme.

En un aspecto, la variante ha mejorado (incrementado) la estabilidad al almacenamiento en comparación con la enzima parental.In one aspect, the variant has improved (increased) storage stability compared to the parent enzyme.

En un aspecto, la variante ha mejorado (incrementado) la termoestabilidad en comparación con la enzima parental. In one aspect, the variant has improved (increased) thermostability compared to the parent enzyme.

En un aspecto, la variante ha mejorado (incrementado) los niveles de expresión en una célula huésped de expresión recombinante.In one aspect, the variant has enhanced (increased) expression levels in a recombinant expression host cell.

Proteasas parentalesParental proteases

La proteasa parental puede ser (a) un polipéptido que tiene al menos un 80% de identidad de secuencia con el polipéptido maduro de SEQ ID NO: 2; (b) un polipéptido codificado por un polinucleótido que se hibrida en condiciones de alta rigurosidad con (i) la secuencia codificante del polipéptido maduro de SEQ ID NO: 1, (ii) la secuencia de ADNc de la misma, o (iii) el complemento de longitud completa de ( i) o (ii); o (c) un polipéptido codificado por un polinucleótido que tiene al menos un 80% de identidad de secuencia con la secuencia codificante del polipéptido maduro de SEQ ID NO: 1.The parent protease can be (a) a polypeptide having at least 80% sequence identity to the mature polypeptide of SEQ ID NO: 2; (b) a polypeptide encoded by a polynucleotide that hybridizes under high stringency conditions to (i) the coding sequence of the mature polypeptide of SEQ ID NO: 1, (ii) the cDNA sequence thereof, or (iii) the full-length complement of (i) or (ii); or (c) a polypeptide encoded by a polynucleotide having at least 80% sequence identity to the coding sequence of the mature polypeptide of SEQ ID NO: 1.

En un aspecto, el parental tiene una identidad de secuencia con el polipéptido maduro de SEQ ID NO: 2 de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93% , al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o el 100%, que tienen actividad de proteasa. En un aspecto, la secuencia de aminoácidos del parental difiere hasta en 10 aminoácidos, p. ej., 1,2, 3, 4, 5, 6, 7, 8, 9 o 10, del polipéptido maduro de SEQ ID 2.In one aspect, the parent has a sequence identity to the mature polypeptide of SEQ ID NO: 2 of at least 80%, at least 85%, at least 90%, at least 91%, at least 92%. %, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99% or 100%, who have protease activity. In one aspect, the amino acid sequence of the parent differs by up to 10 amino acids, e.g. g., 1,2, 3, 4, 5, 6, 7, 8, 9, or 10, of the mature polypeptide of SEQ ID 2.

En otro aspecto, el parental comprende o consiste en la secuencia de aminoácidos de SEQ ID NO: 3. En otro aspecto, el parental comprende o consiste en los aminoácidos 199 a 564 de SEQ ID NO: 2.In another aspect, the parent comprises or consists of the amino acid sequence of SEQ ID NO: 3. In another aspect, the parent comprises or consists of amino acids 199 to 564 of SEQ ID NO: 2.

En otro aspecto, el parental es codificado por un polinucleótido que se hibrida en condiciones de alta rigurosidad, o condiciones de muy alta rigurosidad con (i) la secuencia codificante del polipéptido maduro de SEQ ID NO: 1, (ii) la secuencia de ADNc de la misma, o (iii) el complemento de longitud completa de (i) o (ii) (Sambrook et a/., 1989, Molecular Cloning, A Laboratory Manual, 2a edición, Cold Spring Harbor, Nueva York).In another aspect, the parent is encoded by a polynucleotide that hybridizes under high stringency conditions, or very high stringency conditions with (i) the coding sequence of the mature polypeptide of SEQ ID NO: 1, (ii) the cDNA sequence thereof, or (iii) the full-length complement of (i) or (ii) (Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, 2nd edition, Cold Spring Harbor, New York).

El polinucleótido de SEQ ID NO: 1 o una subsecuencia del mismo, así como el polipéptido de SEQ ID NO: 2 o un fragmento del mismo, se pueden utilizar para diseñar sondas de ácido nucleico para identificar y clonar ADN que codifica un parental de cepas de diferentes géneros o especies de acuerdo con métodos bien conocidos en la técnica. En particular, sondas de este tipo se pueden utilizar para la hibridación con el ADN genómico o el ADNc de una célula de interés, siguiendo procedimientos estándares de transferencia Southern, con el fin de identificar y aislar el gen correspondiente en la misma. Sondas de este tipo pueden ser considerablemente más cortas que la secuencia completa, pero deberían tener al menos 15, p. ej., al menos 25, al menos 35 o al menos 70 nucleótidos de longitud. Preferiblemente, la sonda de ácido nucleico tiene al menos 100 nucleótidos de longitud, p. ej., al menos 200 nucleótidos, al menos 300 nucleótidos, al menos 400 nucleótidos, al menos 500 nucleótidos, al menos 600 nucleótidos, al menos 700 nucleótidos, al menos 800 nucleótidos o al menos 900 nucleótidos de longitud. Se pueden utilizar sondas tanto de ADN como de ARN. Las sondas se marcan típicamente para detectar el gen correspondiente (por ejemplo, con 32P, 3H, 35S, biotina o avidina). Sondas de este tipo quedan abarcadas por la presente invención.The polynucleotide of SEQ ID NO: 1 or a subsequence thereof, as well as the polypeptide of SEQ ID NO: 2 or a fragment thereof, can be used to design nucleic acid probes to identify and clone DNA encoding a parent of strains from different genera or species according to methods well known in the art. In particular, such probes can be used for hybridization with the genomic DNA or cDNA of a cell of interest, following standard Southern blot procedures, in order to identify and isolate the corresponding gene therein. Such probes can be considerably shorter than the full sequence, but should be at least 15, e.g. g., at least 25, at least 35, or at least 70 nucleotides in length. Preferably, the nucleic acid probe is at least 100 nucleotides in length, e.g. eg, at least 200 nucleotides, at least 300 nucleotides, at least 400 nucleotides, at least 500 nucleotides, at least 600 nucleotides, at least 700 nucleotides, at least 800 nucleotides, or at least 900 nucleotides in length. Both DNA and RNA probes can be used. Probes are typically labeled to detect the corresponding gene (eg, with 32P, 3H, 35S, biotin, or avidin). Such probes are encompassed by the present invention.

Una colección de ADN genómico o ADNc preparada a partir de tales otras cepas puede rastrearse en busca de ADN que se hibrida con las sondas arriba descritas y codifica un parental. El ADN genómico o de otro tipo de estas otras cepas puede separarse mediante electroforesis en gel de agarosa o poliacrilamida u otras técnicas de separación. El ADN de las colecciones o el ADN separado puede transferirse e inmovilizarse en nitrocelulosa u otro material de soporte adecuado. Con el fin de identificar un clon o ADN que se hibrida con SEQ ID NO: 1 o una subsecuencia de la misma, el material de soporte se utiliza en un borrón de transferencia Southern. A library of genomic DNA or cDNA prepared from such other strains can be screened for DNA that hybridizes with the probes described above and encodes a parent. Genomic or other DNA from these other strains can be separated by agarose or polyacrylamide gel electrophoresis or other separation techniques. DNA from the libraries or separated DNA can be transferred and immobilized on nitrocellulose or other suitable support material. In order to identify a clone or DNA that hybridizes to SEQ ID NO: 1 or a subsequence thereof, the support material is used on a Southern blot.

Para los fines de la presente divulgación, la hibridación indica que el polinucleótido se híbrida a una sonda de ácido nucleico marcada correspondiente a (i) SEQ ID NO: 1; (ii) la secuencia codificante del polipéptido maduro de SEQ ID NO: 1; (iii) la secuencia de ADNc del mismo; (iv) el complemento de longitud completa del mismo; o (v) una subsecuencia del mismo; bajo condiciones de rigurosidad alta a muy alta. Moléculas con las que se hibrida la sonda de ácido nucleico bajo estas condiciones pueden detectarse utilizando, por ejemplo, película de rayos X o cualquier otro medio de detección conocido en la técnica.For purposes of the present disclosure, hybridization indicates that the polynucleotide hybridizes to a labeled nucleic acid probe corresponding to (i) SEQ ID NO: 1; (ii) the coding sequence of the mature polypeptide of SEQ ID NO: 1; (iii) the cDNA sequence thereof; (iv) the full length complement thereof; or (v) a subsequence thereof; under high to very high stringency conditions. Molecules to which the nucleic acid probe hybridizes under these conditions can be detected using, for example, X-ray film or any other means of detection known in the art.

En un aspecto, la sonda de ácido nucleico es la secuencia codificante del polipéptido maduro de SEQ ID NO: 1. En otro aspecto, la sonda de ácido nucleico son los nucleótidos 595 a 1692 de SEQ ID NO: 1. En otro aspecto, la sonda de ácido nucleico es un polinucleótido que codifica el polipéptido de SEQ ID NO: 2; el polipéptido maduro del mismo; o un fragmento del mismo. En otro aspecto, la sonda de ácido nucleico es SEQ ID NO: 1 o la secuencia de ADNc de la misma.In one aspect, the nucleic acid probe is the mature polypeptide coding sequence of SEQ ID NO: 1. In another aspect, the nucleic acid probe is nucleotides 595 to 1692 of SEQ ID NO: 1. In another aspect, the nucleic acid probe is a polynucleotide encoding the polypeptide of SEQ ID NO: 2; the mature polypeptide thereof; or a fragment of it. In another aspect, the nucleic acid probe is SEQ ID NO: 1 or the cDNA sequence thereof.

En otro aspecto de la divulgación, el parental es codificado por un polinucleótido que tiene una identidad de secuencia con la secuencia codificante del polipéptido maduro de SEQ ID NO: 1 de al menos el 80%, al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93% , al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o el 100%.In another aspect of the disclosure, the parent is encoded by a polynucleotide having a sequence identity with the coding sequence of the mature polypeptide of SEQ ID NO: 1 of at least 80%, at least 85%, at least 90%. %, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, at least 99% or 100%.

El polipéptido puede ser un polipéptido híbrido en el que una región de un polipéptido se fusiona en el extremo N o en el extremo C de una región de otro polipéptido.The polypeptide may be a hybrid polypeptide in which a region of one polypeptide is fused at the N-terminus or the C-terminus of a region of another polypeptide.

El parental puede ser un polipéptido de fusión o un polipéptido de fusión escindible en el que otro polipéptido se fusiona en el extremo N o en el extremo C del polipéptido de la presente invención. Un polipéptido de fusión se produce fusionando un polinucleótido que codifica otro polipéptido a un polinucleótido de la presente invención. Técnicas para producir polipéptidos de fusión se conocen en la técnica e incluyen ligar las secuencias codificantes que codifican los polipéptidos para que estén en el marco y que la expresión del polipéptido de fusión esté bajo el control del o de los mismos promotores y terminador. Polipéptidos de fusión también se pueden construir utilizando tecnología inteína, en la que los polipéptidos de fusión se crean post-traduccionalmente (Cooper et al., 1993, EMBO J. 12: 2575-2583; Dawson et al., 1994, Science 266: 776-779).The parent may be a fusion polypeptide or a cleavable fusion polypeptide in which another polypeptide is fused at the N-terminus or the C-terminus of the polypeptide of the present invention. A fusion polypeptide is produced by fusing a polynucleotide encoding another polypeptide to a polynucleotide of the present invention. Techniques for producing fusion polypeptides are known in the art and include ligating the coding sequences encoding the polypeptides so that they are in frame and expression of the fusion polypeptide is under the control of the same promoter and terminator(s). Fusion polypeptides can also be constructed using intein technology, in which the fusion polypeptides are created post-translationally (Cooper et al., 1993, EMBO J. 12:2575-2583; Dawson et al., 1994, Science 266: 776-779).

Un polipéptido de fusión puede comprender, además, un sitio de escisión entre los dos polipéptidos. Tras la secreción de la proteína de fusión, el sitio se escinde liberando los dos polipéptidos. Ejemplos de sitios de escisión incluyen, pero no se limitan a los sitios descritos en Martin et al., 2003, J. Ind. Microbiol. Biotechnol. 3: 568-576; Svetina et al., 2000, J. Biotechnol. 76: 245-251; Rasmussen-Wilson et al., 1997, Appl. Environ. Microbiol. 63: 3488-3493; Ward et al., 1995, Biotechnology 13: 498-503; y Contreras et al., 1991, Biotechnology 9: 378-381; Eaton et al., 1986, Biochemistry 25: 505-512; Collins-Racie et al., 1995, Biotechnology 13: 982-987; Carter et al., 1989, Proteins: Structure, Function, and Genetics 6: 240-248; y Stevens, 2003, Drug Discovery World 4: 35-48.A fusion polypeptide may further comprise a cleavage site between the two polypeptides. Upon secretion of the fusion protein, the site is cleaved releasing the two polypeptides. Examples of cleavage sites include, but are not limited to the sites described in Martin et al., 2003, J. Ind. Microbiol. Biotechnol. 3: 568-576; Svetina et al., 2000, J. Biotechnol. 76: 245-251; Rasmussen-Wilson et al., 1997, Appl. Environment. microbiol. 63: 3488-3493; Ward et al., 1995, Biotechnology 13: 498-503; and Contreras et al., 1991, Biotechnology 9: 378-381; Eaton et al., 1986, Biochemistry 25: 505-512; Collins-Racie et al., 1995, Biotechnology 13: 982-987; Carter et al., 1989, Proteins: Structure, Function, and Genetics 6: 240-248; and Stevens, 2003, Drug Discovery World 4: 35-48.

En otro aspecto, el parental es una proteasa S53 de Meripilus giganteus, p. ej., la proteasa de SEQ ID NO: 2 o el polipéptido maduro de la misma, descrito en esta memoria como SEQ ID NO: 3.In another aspect, the parent is an S53 protease from Meripilus giganteus, e.g. eg, the protease of SEQ ID NO: 2 or the mature polypeptide thereof, described herein as SEQ ID NO: 3.

Preparación de VariantesPreparation of Variants

Las variantes se pueden preparar utilizando cualquier proceso de mutagénesis conocido en la técnica, tal como mutagénesis dirigida al sitio, construcción de genes sintéticos, construcción de genes semi-sintéticos, mutagénesis aleatoria, transposición, etc.Variants can be prepared using any mutagenesis process known in the art, such as site-directed mutagenesis, synthetic gene construction, semi-synthetic gene construction, random mutagenesis, shuffling, etc.

La mutagénesis dirigida al sitio es una técnica en la que se introducen una o más (p. ej., varias) mutaciones en uno o más sitios definidos en un polinucleótido que codifica el parental.Site-directed mutagenesis is a technique in which one or more ( eg, several) mutations are introduced at one or more defined sites in a polynucleotide encoding the parent.

La mutagénesis dirigida al sitio se puede lograr in vitro mediante PCR que implica el uso de cebadores oligonucleotídicos que contienen la mutación deseada. La mutagénesis dirigida al sitio también se puede realizar in vitro mediante mutagénesis en casete que implica la escisión por una enzima de restricción en un sitio en el plásmido que comprende un polinucleótido que codifica el parental y ligamiento posterior de un oligonucleótido que contiene la mutación en el polinucleótido. Habitualmente, la enzima de restricción que digiere el plásmido y el oligonucleótido es la misma, lo que permite que los extremos pegajosos del plásmido y la inserción se liguen entre sí. Véase, p. ej., Scherer y Davis, 1979, Proc. Natl. Acad. Sci. USA 76: 4949-4955; y Barton et al., 1990, Nucleic Acids Res. 18: 7349­ 4966.Site-directed mutagenesis can be achieved in vitro by PCR involving the use of oligonucleotide primers containing the desired mutation. Site-directed mutagenesis can also be performed in vitro by cassette mutagenesis involving cleavage by a restriction enzyme at a site in the plasmid comprising a polynucleotide encoding the parent and subsequent ligation of an oligonucleotide containing the mutation into the plasmid. polynucleotide. Usually, the restriction enzyme that digests the plasmid and the oligonucleotide is the same, allowing the sticky ends of the plasmid and the insert to ligate together. See, p. eg, Scherer and Davis, 1979, Proc. Natl. Acad. Sci. USA 76: 4949-4955; and Barton et al., 1990, Nucleic Acids Res. 18:7349-4966.

La mutagénesis dirigida al sitio también se puede lograr in vivo mediante métodos conocidos en la técnica. Véase, p. ej., la Publicación de Solicitud de Patente de EE.UU. N° 2004/0171154; Storici et al., 2001, Nature Biotechnol. 19: 773­ 776; Kren et al., 1998, Nat. Med. 4: 285-290; y Calissano y Macino, 1996, Fungal Genet. Newslett. 43: 15-16.Site-directed mutagenesis can also be achieved in vivo by methods known in the art. See, p. eg, US Patent Application Publication No. 2004/0171154; Storici et al., 2001, Nature Biotechnol. 19: 773 776; Kren et al., 1998, Nat. Med. 4: 285-290; and Calissano and Macino, 1996, Fungal Genet. Newsletter. 43: 15-16.

En la presente invención se puede utilizar cualquier proceso de mutagénesis dirigida al sitio. Hay muchos kits comerciales disponibles que se pueden utilizar para preparar variantes. Any site-directed mutagenesis process can be used in the present invention. There are many commercial kits available that can be used to prepare variants.

La construcción de genes sintéticos implica la síntesis in vitro de una molécula de polinucleótido diseñada para codificar un polipéptido de interés. La síntesis de genes se puede realizar utilizando un cierto número de técnicas, tales como la tecnología basada en microchip multiplex descrita por Tian et al. (2004, Nature 432: 1050-1054) y tecnologías similares, en donde los oligonucleótidos se sintetizan y ensamblan en chips de microfluidos fotoprogramables.Synthetic gene construction involves the in vitro synthesis of a polynucleotide molecule designed to encode a polypeptide of interest. Gene synthesis can be performed using a number of techniques, such as the multiplex microchip-based technology described by Tian et al. (2004, Nature 432: 1050-1054) and similar technologies, where oligonucleotides are synthesized and assembled on photoprogrammable microfluidic chips.

Se pueden realizar y testar sustituciones, deleciones y/o inserciones de aminoácidos únicos o múltiples utilizando métodos conocidos de mutagénesis, recombinación y/o transposición, seguidos de un procedimiento de rastreo relevante, tales como los descritos por Reidhaar-Olson y Sauer, 1988, Science 241: 53-57; Bowie y Sauer, 1989, Proc. Natl. Acad. Sci. USA 86: 2152-2156; documentos WO 95/17413; o w O 95/22625. Otros métodos que pueden utilizarse incluyen PCR propensa a errores, presentación de fagos (p. ej., Lowman et a/., 1991, Biochemistry 30: 10832-10837; Patente de EE.UU. N° 5,223,409; documento WO 92/06204) y mutagénesis dirigida a la región (Derbyshire et al., 1986, Gene 46: 145; Ner et al., 1988, DNA 7: 127).Single or multiple amino acid substitutions, deletions, and/or insertions can be made and tested using known methods of mutagenesis, recombination, and/or rearrangement, followed by a relevant screening procedure, such as those described by Reidhaar-Olson and Sauer, 1988, Science 241: 53-57; Bowie and Sauer, 1989, Proc. Natl. Acad. Sci. USA 86: 2152-2156; WO 95/17413; ow O 95/22625. Other methods that can be used include error-prone PCR, phage display ( eg, Lowman et al., 1991, Biochemistry 30: 10832-10837; US Patent No. 5,223,409; WO 92/06204 ) and region-directed mutagenesis (Derbyshire et al., 1986, Gene 46:145; Ner et al., 1988, DNA 7:127).

Métodos de mutagénesis / transposición pueden combinarse con métodos de rastreo automatizados de alto rendimiento para detectar la actividad de polipéptidos mutagenizados clonados expresados por células huésped (Ness et al., 1999, Nature Biotechnology 17: 893-896). Moléculas de ADN mutagenizado que codifican polipéptidos activos pueden recuperarse de las células huésped y secuenciarse rápidamente utilizando métodos estándares en la técnica. Estos métodos permiten la determinación rápida de la importancia de los residuos de aminoácidos individuales en un polipéptido.Mutagenesis/shuffling methods can be combined with high-throughput automated screening methods to detect the activity of cloned mutagenized polypeptides expressed by host cells (Ness et al., 1999, Nature Biotechnology 17:893-896). Mutagenized DNA molecules encoding active polypeptides can be recovered from host cells and rapidly sequenced using methods standard in the art. These methods allow rapid determination of the importance of individual amino acid residues in a polypeptide.

La construcción de genes semisintéticos se logra combinando aspectos de la construcción de genes sintéticos y/o mutagénesis dirigida al sitio y/o mutagénesis aleatoria y/o transposición. La construcción semisintética se tipifica por un procedimiento que utiliza fragmentos de polinucleótidos que se sintetizan, en combinación con técnicas de PCR. Por lo tanto, regiones definidas de genes pueden sintetizarse de novo, mientras que otras regiones pueden amplificarse utilizando cebadores mutagénicos específicos para el sitio, mientras que aún otras regiones pueden someterse a amplificación por PCR propensa a errores o por PCR no propensa a errores. Las subsecuencias de polinucleótidos pueden luego transponerse.Semi-synthetic gene construction is achieved by combining aspects of synthetic gene construction and/or site-directed mutagenesis and/or random mutagenesis and/or shuffling. The semi-synthetic construct is typified by a method using polynucleotide fragments that are synthesized, in combination with PCR techniques. Thus, defined regions of genes can be synthesized de novo, while other regions can be amplified using mutagenic site-specific primers, while still other regions can be subjected to error-prone or non-error-prone PCR amplification. The polynucleotide subsequences can then rearrange.

Polinucleótidospolynucleotides

La presente invención también se refiere a polinucleótidos que codifican una variante de la presente invención. The present invention also relates to polynucleotides encoding a variant of the present invention.

Construcciones de Ácidos NucleicosNucleic Acid Constructs

La presente invención también se refiere a construcciones de ácidos nucleicos que comprenden un polinucleótido que codifica una variante de la presente invención operativamente enlazada a una o más secuencias de control que dirigen la expresión de la secuencia codificante en una célula huésped adecuada bajo condiciones compatibles con las secuencias de control.The present invention also relates to nucleic acid constructs comprising a polynucleotide encoding a variant of the present invention operatively linked to one or more control sequences that direct expression of the coding sequence in a suitable host cell under conditions compatible with those of the present invention. control sequences.

El polinucleótido puede manipularse de diversas formas para proporcionar la expresión de una variante. La manipulación del polinucleótido antes de su inserción en un vector puede ser deseable o necesaria dependiendo del vector de expresión. Las técnicas para modificar polinucleótidos utilizando métodos de ADN recombinante son bien conocidas en la técnica.The polynucleotide can be manipulated in a variety of ways to provide expression of a variant. Manipulation of the polynucleotide prior to its insertion into a vector may be desirable or necessary depending on the expression vector. Techniques for modifying polynucleotides using recombinant DNA methods are well known in the art.

La secuencia de control puede ser un promotor, un polinucleótido que es reconocido por una célula huésped para la expresión del polinucleótido. El promotor contiene secuencias de control de la transcripción que median en la expresión de la variante. El promotor puede ser cualquier polinucleótido que muestre actividad transcripcional en la célula huésped, incluyendo promotores mutantes, truncados e híbridos, y puede obtenerse de genes que codifican polipéptidos extracelulares o intracelulares homólogos o heterólogos a la célula huésped.The control sequence may be a promoter, a polynucleotide that is recognized by a host cell for expression of the polynucleotide. The promoter contains transcriptional control sequences that mediate expression of the variant. The promoter may be any polynucleotide that exhibits transcriptional activity in the host cell, including mutant, truncated, and hybrid promoters, and may be derived from genes encoding extracellular or intracellular polypeptides homologous or heterologous to the host cell.

Ejemplos de promotores adecuados para dirigir la transcripción de las construcciones de ácidos nucleicos de la presente invención en una célula huésped filamentosa fúngica son promotores obtenidos de los genes para acetamidasa de Aspergillus nidulans, alfa-amilasa neutra de Aspergillus niger, alfa-amilasa estable a los ácidos de Aspergillus niger, glucoamilasa de Aspergillus niger o Aspergillus awamori (glaA), TAKA amilasa de Aspergillus oryzae, proteasa alcalina de Aspergillus oryzae, triosa fosfato isomerasa de Aspergillus oryzae, proteasa tipo tripsina de Fusarium oxysporum (documento WO 96/00787), amiloglucosidasa de Fusarium venenatum (documento WO 00/56900), Daria de Fusarium venenatum (documento WO 00/56900), Quinn de Fusarium venenatum (documento WO 00/56900), lipasa de Rhizomucor miehei, proteinasa aspártica de Rhizomucor miehei, beta-glucosidasa de Trichoderma reesei, celiobiohidrolasa I de Trichoderma reesei, celiobiohidrolasa II de Trichoderma reesei, endoglucanasa I de Trichoderma reesei, endoglucanasa II deTrichoderma reesei, endoglucanasa III deTrichoderma reesei, endoglucanasa IV de Trichoderma reesei, endoglucanasa V de Trichoderma reesei, xilanasa I de Trichoderma reesei, xilanasa II de Trichoderma reesei, beta-xilosidasa de Trichoderma reesei, así como el promotor NA2-tpi (un promotor modificado de un gen de alfa-amilasa neutro de Aspergillus, en el que el conductor no traducido ha sido reemplazado por un conductor no traducido de un gen de triosa fosfato isomerasa de Aspergillus; ejemplos no limitantes incluyen promotores modificados de un gen de alfa-amilasa neutra de Aspergillus niger en el que el conductor no traducido ha sido reemplazado por un conductor no traducido de un gen de triosa fosfato isomerasa de Aspergillus nidulans o Aspergillus oryzae); y promotores mutantes, truncados e híbridos de los mismos.Examples of promoters suitable for directing transcription of the nucleic acid constructs of the present invention in a filamentous fungal host cell are promoters derived from the genes for Aspergillus nidulans acetamidase, Aspergillus niger neutral alpha-amylase, acid-stable alpha-amylase. Aspergillus niger acids , Aspergillus niger or Aspergillus awamori glucoamylase ( glaA), Aspergillus oryzae TAKA amylase, Aspergillus oryzae alkaline protease, Aspergillus oryzae triose phosphate isomerase , Fusarium oxysporum trypsin-like protease (WO 96/00787), Amyloglucosidase from Fusarium venenatum (WO 00/56900), Daria from Fusarium venenatum (WO 00/56900), Quinn from Fusarium venenatum (WO 00/56900), Lipase from Rhizomucor miehei, Aspartic proteinase from Rhizomucor miehei, Beta-glucosidase from Trichoderma reesei, Trichoderma reesei celiobiohydrolase I, Trichoderma reesei celiobiohydrolase II , Tr endoglucanase I ichoderma reesei, Trichoderma reesei endoglucanase II, Trichoderma reesei endoglucanase III , Trichoderma reesei endoglucanase IV, Trichoderma reesei endoglucanase V, Trichoderma reesei xylanase I, Trichoderma reesei xylanase II, Trichoderma reesei beta-xylosidase , as well as the promoter NA2- tpi (a modified promoter of an Aspergillus neutral alpha-amylase gene, in which the untranslated leader has been replaced by an untranslated leader of an Aspergillus triose phosphate isomerase gene; non-limiting examples include modified promoters from an Aspergillus niger neutral alpha-amylase gene in which the untranslated leader has been replaced by an untranslated leader from an Aspergillus nidulans or Aspergillus oryzae triose phosphate isomerase gene); and mutant, truncated and hybrid promoters thereof.

La secuencia de control también puede ser un terminador de la transcripción, que es reconocido por una célula huésped para terminar la transcripción. La secuencia del terminador está enlazada operativamente al extremo 3’ del polinucleótido que codifica la variante. Puede utilizarse cualquier terminador que sea funcional en la célula huésped. The control sequence may also be a transcription terminator, which is recognized by a host cell to terminate transcription. The terminator sequence is operably linked to the 3' end of the polynucleotide encoding the variant. Any terminator that is functional in the host cell can be used.

Terminadores preferidos para células huéspedes filamentosas fúngicas se obtienen de los genes para antranilato sintasa de Aspergillus nidulans, glucoamilasa de Aspergillus niger, alfa-glucosidasa de Aspergillus niger, TAKA amilasa de Aspergillus oryzae y proteasa tipo tripsina de Fusarium oxysporum. Preferred terminators for filamentous fungal host cells are derived from the genes for Aspergillus nidulans anthranilate synthase, Aspergillus niger glucoamylase, Aspergillus niger alpha-glucosidase , Aspergillus oryzae TAKA amylase, and Fusarium oxysporum trypsin-like protease.

La secuencia de control también puede ser una región estabilizadora de ARNm aguas abajo de un promotor y aguas arriba de la secuencia codificante de un gen que aumenta la expresión del gen.The control sequence can also be a stabilizing region of mRNA downstream of a promoter and upstream of the coding sequence of a gene that increases expression of the gene.

La secuencia de control también puede ser un conductor, una región no traducida de un ARNm que es importante para la traducción por parte de la célula huésped. La secuencia del conductor está enlazada operativamente al extremo 5’ del polinucleótido que codifica la variante. Puede utilizarse cualquier conductor que sea funcional en la célula huésped.The control sequence may also be a leader, an untranslated region of an mRNA that is important for translation by the host cell. The leader sequence is operably linked to the 5' end of the polynucleotide encoding the variant. Any leader that is functional in the host cell can be used.

Conductores preferidos para las células huésped fúngicas filamentosas se obtienen a partir de los genes de la TAKA amilasa de Aspergillus oryzae y la triosa fosfato isomerasa de Aspergillus nidulans. Preferred drivers for filamentous fungal host cells are derived from the Aspergillus oryzae TAKA amylase and Aspergillus nidulans triose phosphate isomerase genes.

La secuencia de control también puede ser una secuencia de poliadenilación, una secuencia enlazada operativamente al extremo 3’ de la secuencia que codifica la variante y, cuando se transcribe, es reconocida por la célula huésped como una señal para añadir residuos de poliadenosina al ARNm transcrito. Puede utilizarse cualquier secuencia de poliadenilación que sea funcional en la célula huésped.The control sequence may also be a polyadenylation sequence, a sequence operably linked to the 3' end of the variant coding sequence and, when transcribed, is recognized by the host cell as a signal to add polyadenosine residues to the transcribed mRNA. . Any polyadenylation sequence that is functional in the host cell can be used.

Secuencias de poliadenilación preferidas para células huéspedes filamentosas fúngicas se obtienen de los genes para antranilato sintasa de Aspergillus nidulans, glucoamilasa de Aspergillus niger, alfa-glucosidasa de Aspergillus niger, TAKA amilasa de Aspergillus oryzae y proteasa tipo tripsina de Fusarium oxysporum. Preferred polyadenylation sequences for filamentous fungal host cells are derived from the genes for Aspergillus nidulans anthranilate synthase, Aspergillus niger glucoamylase, Aspergillus niger alpha-glucosidase , Aspergillus oryzae TAKA amylase, and Fusarium oxysporum trypsin-like protease.

La secuencia de control también puede ser una región codificante de péptido señal que codifica un péptido señal enlazado al extremo N de una variante y dirige la variante hacia la vía secretora de la célula. El extremo 5’ de la secuencia codificante del polinucleótido puede contener inherentemente una secuencia codificante del péptido señal enlazada de forma natural en el marco de lectura de traducción con el segmento de la secuencia codificante que codifica la variante. Alternativamente, el extremo 5’ de la secuencia codificante puede contener una secuencia codificante del péptido señal que es extraña a la secuencia codificante. Puede ser necesaria una secuencia codificante de péptido señal extraña, en los casos en los que la secuencia codificante no contiene de forma natural una secuencia codificante de péptido señal. Alternativamente, una secuencia codificante del péptido señal extraña puede simplemente reemplazar la secuencia codificante del péptido señal natural con el fin de potenciar la secreción de la variante. Sin embargo, puede utilizarse cualquier secuencia codificante de péptido señal que dirija la variante expresada hacia la vía secretora de una célula huésped.The control sequence may also be a signal peptide coding region that encodes a signal peptide linked to the N-terminus of a variant and directs the variant into the cell's secretory pathway. The 5' end of the polynucleotide coding sequence may inherently contain a signal peptide coding sequence naturally linked in translational reading frame with the segment of the coding sequence encoding the variant. Alternatively, the 5' end of the coding sequence may contain a signal peptide coding sequence that is foreign to the coding sequence. A foreign signal peptide coding sequence may be required, in cases where the coding sequence does not naturally contain a signal peptide coding sequence. Alternatively, a foreign signal peptide coding sequence may simply replace the natural signal peptide coding sequence in order to enhance secretion of the variant. However, any signal peptide coding sequence that directs the expressed variant into the secretory pathway of a host cell can be used.

Secuencias codificantes para el péptido señal eficaces para las células huéspedes filamentosas fúngicas son las secuencias codificantes de péptido señal obtenidas de los genes para amilasa neutra de Aspergillus niger, nigerglucoamilasa de Aspergillus, TAKA amilasa de Aspergillus oryzae, celulasa de Humicola insolens, endoglucanasa V de Humicola insolens, lipasa de Humicola lanuginosa proteinasa aspártica de Rhizomucor miehei. Coding sequences for the signal peptide effective for filamentous fungal host cells are the sequences encoding the signal peptide obtained from the genes for neutral amylase , Aspergillus niger, nigerglucoamilasa of Aspergillus, TAKA amylase of Aspergillus oryzae, cellulase from Humicola insolens endoglucanase V Humicola insolens, lipase from Humicola lanuginosa aspartic proteinase from Rhizomucor miehei.

La secuencia de control también puede ser una secuencia codificante de propéptido que codifica un propéptido situado en el extremo N de una variante. El polipéptido resultante se conoce como una proenzima o propolipéptido (o un zimógeno en algunos casos). Un propolipéptido es generalmente inactivo y puede convertirse en un polipéptido activo por escisión catalítica o autocatalítica del propéptido del propolipéptido. La secuencia codificante del propéptido puede obtenerse de los genes de lacasa de Myceliophthora thermophila (documento WO 95/33836), proteinasa aspártica de Rhizomucor miehei.The control sequence may also be a propeptide coding sequence that encodes an N-terminal propeptide of a variant. The resulting polypeptide is known as a proenzyme or propolypeptide (or a zymogen in some cases). A propolypeptide is generally inactive and can be converted to an active polypeptide by catalytic or autocatalytic cleavage of the propeptide from the propolypeptide. The propeptide coding sequence can be obtained from the genes for Myceliophthora thermophila laccase (WO 95/33836), Rhizomucor miehei aspartic proteinase.

En los casos en los que están presentes tanto el péptido señal como las secuencias propéptido, la secuencia del propéptido está dispuesta junto al extremo N de la variante y la secuencia del péptido señal está dispuesta junto al extremo N de la secuencia del propéptido.In cases where both signal peptide and propeptide sequences are present, the propeptide sequence is disposed at the N-terminus of the variant and the signal peptide sequence is disposed at the N-terminus of the propeptide sequence.

También puede ser deseable añadir secuencias reguladoras que regulen la expresión de la variante en relación con el crecimiento de la célula huésped. Ejemplos de sistemas reguladores son aquellos que provocan que la expresión del gen se active o desactive en respuesta a un estímulo químico o físico, incluyendo la presencia de un compuesto regulador. Sistemas reguladores en los sistemas procarióticos incluyen los sistemas de operador lac, tac y trp. En levaduras se puede utilizar el sistema ADH2 o el sistema GAL1. En hongos filamentosos se pueden utilizar el promotor de glucoamilasa de Aspergillus niger, el promotor de TAKA alfa-amilasa de Aspergillus oryzae y el promotor de glucoamilasa de Aspergillus oryzae. Otros ejemplos de secuencias reguladoras son aquellas que permiten la amplificación de genes. En los sistemas eucariotas, estas secuencias reguladoras incluyen el gen de la dihidrofolato reductasa que se amplifica en presencia de metotrexato y los genes de metalotioneína que se amplifican con metales pesados. En estos casos, el polinucleótido que codifica la variante estaría operativamente enlazado con la secuencia reguladora.It may also be desirable to add regulatory sequences that regulate expression of the variant relative to host cell growth. Examples of regulatory systems are those that cause gene expression to be turned on or off in response to a chemical or physical stimulus, including the presence of a regulatory compound. Regulatory systems in prokaryotic systems include the lac, tac, and trp operator systems. In yeast, the ADH2 system or the GAL1 system can be used. In filamentous fungi , the Aspergillus niger glucoamylase promoter, the Aspergillus oryzae TAKA alpha-amylase promoter and the Aspergillus oryzae glucoamylase promoter can be used. Other examples of regulatory sequences are those that allow gene amplification. In eukaryotic systems, these regulatory sequences include the dihydrofolate reductase gene that is amplified in the presence of methotrexate and the metallothionein genes that are amplified by heavy metals. In these cases, the polynucleotide encoding the variant would be operatively linked to the regulatory sequence.

Vectores de ExpresiónExpression Vectors

La presente invención también se refiere a vectores de expresión recombinantes que comprenden un polinucleótido que codifica una variante de la presente invención, un promotor y señales de parada transcripcionales y traduccionales. Las diversas secuencias de nucleótidos y de control pueden unirse para producir un vector de expresión recombinante que puede incluir uno o más sitios de restricción convenientes para permitir la inserción o sustitución del polinucleótido que codifica la variante en dichos sitios. Alternativamente, el polinucleótido puede expresarse insertando el polinucleótido o una construcción de ácido nucleico que comprende el polinucleótido en un vector apropiado para la expresión. Al crear el vector de expresión, la secuencia codificante se localiza en el vector de modo que la secuencia codificante esté enlazada operativamente con las secuencias de control apropiadas para la expresión.The present invention also relates to recombinant expression vectors comprising a polynucleotide encoding a variant of the present invention, a promoter, and transcriptional and translational stop signals. The various nucleotide and control sequences can be joined to produce a recombinant expression vector which may include one or more convenient restriction sites to allow insertion or substitution of the polynucleotide encoding the variant at such sites. Alternatively, the polynucleotide can be expressed by inserting the polynucleotide or a nucleic acid construct comprising the polynucleotide into an appropriate vector for expression. In creating the expression vector, the coding sequence is located on the vector such that the coding sequence is operably linked to the appropriate control sequences for expression.

El vector de expresión recombinante puede ser cualquier vector (p..ej, un plásmido o virus) que pueda someterse convenientemente a procesos de ADN recombinante y pueda provocar la expresión del polinucleótido. La elección del vector dependerá típicamente de la compatibilidad del vector con la célula huésped en la que se ha de introducir el vector. El vector puede ser un plásmido lineal o circular cerrado.The recombinant expression vector can be any vector ( eg, a plasmid or virus) that can be conveniently subjected to recombinant DNA processes and can cause expression of the polynucleotide. The choice of vector will typically depend on the compatibility of the vector with the host cell into which the vector is to be introduced. The vector may be a linear or closed circular plasmid.

El vector puede ser un vector de replicación autónoma, es decir, un vector que existe como una entidad extracromosómica, cuya replicación es independiente de la replicación cromosómica, p..ej, un plásmido, un elemento extracromosómico, un minicromosoma o un cromosoma artificial. El vector puede contener cualquier medio para asegurar la autorreplicación. Alternativamente, el vector puede ser uno que, cuando se introduce en la célula huésped, se integra en el genoma y se replica junto con el o los cromosomas en los que se ha integrado. Además, se puede utilizar un solo vector o plásmido o dos o más vectores o plásmidos que juntos contienen el ADN total a introducir en el genoma de la célula huésped, o un transposón.The vector may be an autonomously replicating vector, that is, a vector that exists as an extrachromosomal entity, the replication of which is independent of chromosomal replication, eg, a plasmid, extrachromosomal element, minichromosome, or artificial chromosome. The vector may contain any means to ensure self-replication. Alternatively, the vector may be one which, when introduced into the host cell, integrates into the genome and replicates along with the chromosome(s) into which it has been integrated. In addition, a single vector or plasmid or two or more vectors or plasmids that together contain the total DNA to be introduced into the host cell genome, or a transposon, can be used.

El vector contiene preferiblemente uno o más marcadores seleccionables que permiten una fácil selección de células transformadas, transfectadas, transducidas o similares. Un marcador seleccionable es un gen cuyo producto proporciona resistencia a biocidas o virus, resistencia a metales pesados, prototrofia a auxótrofos y similares.The vector preferably contains one or more selectable markers that allow easy selection of transformed, transfected, transduced cells or the like. A selectable marker is a gene whose product provides biocide or virus resistance, heavy metal resistance, prototrophy to auxotrophs, and the like.

Marcadores seleccionables para el uso en una célula huésped filamentosa fúngica incluyen, pero no se limitan a amdS (acetamidasa), argB (ornitina carbamoiltransferasa), bar (fosfinotricina acetiltransferasa), hph (higromicina fosfotransferasa), niaD (nitrato reductasa), pyrG (orotidina -5’-fosfato descarboxilasa), sC (sulfato adeniltransferasa) y trpC (antranilato sintasa), así como equivalentes de los mismos. Uso preferido en una célula de Aspergillus son genes de Aspergillus nidulans o Aspergillus oryzae niaD, niiA, amdS y pyrG y un gen de Streptomyces hygroscopicus bar Selectable markers for use in a filamentous fungal host cell include, but are not limited to amdS (acetamidase), argB (ornithine carbamoyltransferase), bar (phosphinothricin acetyltransferase), hph (hygromycin phosphotransferase), niaD (nitrate reductase), pyrG (orotidine -5'-phosphate decarboxylase), sC (sulfate adenyltransferase) and trpC (anthranilate synthase), as well as equivalents thereof. Preferred use in an Aspergillus cell are Aspergillus nidulans or Aspergillus oryzae niaD, niiA, amdS and pyrG genes and a Streptomyces hygroscopicus bar gene.

El vector contiene preferiblemente un o unos elementos que permiten la integración del vector en el genoma de la célula huésped o la replicación autónoma del vector en la célula independientemente del genoma.The vector preferably contains one or more elements that allow integration of the vector into the genome of the host cell or autonomous replication of the vector in the cell independently of the genome.

Para la integración en el genoma de la célula huésped, el vector puede depender de la secuencia del polinucleótido que codifica la variante o cualquier otro elemento del vector para la integración en el genoma mediante recombinación homóloga o no homóloga. Alternativamente, el vector puede contener polinucleótidos adicionales para dirigir la integración mediante recombinación homóloga en el genoma de la célula huésped en una ubicación o ubicaciones precisas en el o los cromosomas. Para aumentar la probabilidad de integración en una ubicación precisa, los elementos integradores deben contener un número suficiente de ácidos nucleicos, tal como 100 a 10.000 pares de bases, 400 a 10.000 pares de bases y 800 a 10.000 pares de bases, que tienen un alto grado de identidad de secuencia con la secuencia diana correspondiente para potenciar la probabilidad de recombinación homóloga. Los elementos de integración pueden ser cualquier secuencia que sea homóloga a la secuencia diana en el genoma de la célula huésped. Además, los elementos de integración pueden ser polinucleótidos no codificantes o codificantes. Por otro lado, el vector puede integrarse en el genoma de la célula huésped mediante recombinación no homóloga.For integration into the host cell genome, the vector may be dependent on the polynucleotide sequence encoding the variant or any other element of the vector for integration into the genome by homologous or non-homologous recombination. Alternatively, the vector may contain additional polynucleotides to direct integration by homologous recombination into the host cell genome at a precise location(s) on the chromosome(s). To increase the probability of integration at a precise location, the integrating elements must contain a sufficient number of nucleic acids, such as 100 to 10,000 base pairs, 400 to 10,000 base pairs, and 800 to 10,000 base pairs, which have a high degree of sequence identity with the corresponding target sequence to enhance the probability of homologous recombination. Integrating elements can be any sequence that is homologous to the target sequence in the host cell genome. Furthermore, the integrating elements can be non-coding or coding polynucleotides. On the other hand, the vector can be integrated into the host cell genome by non-homologous recombination.

Para la replicación autónoma, el vector puede comprender, además, un origen de replicación que permite que el vector se replique de forma autónoma en la célula huésped en cuestión. El origen de la replicación puede ser cualquier replicador de plásmido que medie en la replicación autónoma que funcione en una célula. La expresión "origen de replicación" o "replicador de plásmido" significa un polinucleótido que permite que un plásmido o vector se replique in vivo. For autonomous replication, the vector may further comprise an origin of replication that enables the vector to replicate autonomously in the host cell in question. The origin of replication can be any plasmid replicator that mediates autonomous replication that functions in a cell. The term "origin of replication" or "plasmid replicator" means a polynucleotide that allows a plasmid or vector to replicate in vivo.

Ejemplos de orígenes de replicación útiles en una célula fúngica filamentosa son AMA1 y ANS1 (Gems et a/., 1991, Gene 98: 61-67; Cullen et al., 1987, Nucleic Acids Res. 15: 9163-9175; documento WO 00/24883). El aislamiento del gen AMA1 y la construcción de plásmidos o vectores que comprenden el gen se pueden lograr de acuerdo con los métodos descritos en el documento WO 00/24883. Examples of useful origins of replication in a filamentous fungal cell are AMA1 and ANS1 (Gems et al., 1991, Gene 98:61-67; Cullen et al., 1987, Nucleic Acids Res. 15:9163-9175; WO 00/24883). Isolation of the AMA1 gene and construction of plasmids or vectors comprising the gene can be achieved according to the methods described in WO 00/24883.

Puede insertarse más de una copia de un polinucleótido de la presente invención en una célula huésped para aumentar la producción de una variante. Se puede obtener un aumento en el número de copias del polinucleótido integrando al menos una copia adicional de la secuencia en el genoma de la célula huésped o incluyendo un gen marcador seleccionable amplificable con el polinucleótido en los casos en los que células que contienen copias amplificadas del gen marcador seleccionable y, con ello, copias adicionales del polinucleótido se pueden seleccionar cultivando las células en presencia del agente seleccionable apropiado.More than one copy of a polynucleotide of the present invention may be inserted into a host cell to increase production of a variant. An increase in the number of copies of the polynucleotide can be obtained by integrating at least one additional copy of the sequence into the genome of the host cell or by including an amplifiable selectable marker gene with the polynucleotide in cases where cells containing amplified copies of the selectable marker gene and thereby additional copies of the polynucleotide can be selected by culturing the cells in the presence of the appropriate selectable agent.

Los procesos utilizados para ligar los elementos arriba descritos para construir los vectores de expresión recombinantes de la presente invención son bien conocidos por los expertos en la técnica (véase, p. ej., Sambrook et al., 1989, supra). The processes used to ligate the elements described above to construct the recombinant expression vectors of the present invention are well known to those of skill in the art (see, eg, Sambrook et al., 1989, supra).

Célula HuéspedesHost Cell

La presente invención también se refiere a células huéspedes recombinantes que comprenden un polinucleótido que codifica una variante de la presente invención operativamente enlazada a una o más secuencias de control que dirigen la expresión de una variante de la presente invención. En una realización particular, la célula huésped recombinante comprende el polinucleótido que codifica un polipéptido de trehalasa de la presente invención, en el que dicho polinucleótido es heterólogo (de diferente origen/especie) a la célula huésped. Una construcción o vector que comprende un polinucleótido se introduce en una célula huésped, de modo que la construcción o el vector se mantenga como un integrante cromosómico o como un vector extra-cromosómico autorreplicante tal como se describió anteriormente. La expresión "célula huésped" abarca cualquier progenie de una célula madre que no sea idéntica a la célula madre debido a mutaciones que se producen durante la replicación. La elección de una célula huésped dependerá en gran medida del gen que codifica la variante y su fuente.The present invention also relates to recombinant host cells comprising a polynucleotide encoding a variant of the present invention operably linked to one or more control sequences directing expression of a variant of the present invention. In a particular embodiment, the recombinant host cell comprises the polynucleotide encoding a trehalase polypeptide of the present invention, wherein said polynucleotide is heterologous (of different origin/species) to the host cell. A construct or vector comprising a polynucleotide is introduced into a host cell such that the construct or vector is maintained as a chromosomal integrant or as a self-replicating extra-chromosomal vector as described above. The term "host cell" encompasses any progeny of a stem cell that is not identical to the stem cell due to mutations that occur during replication. The choice of a host cell will largely depend on the gene encoding the variant and its source.

La célula huésped puede ser cualquier célula útil en la producción recombinante de una variante, p. ej., un procariota o un eucariota.The host cell can be any cell useful in the recombinant production of a variant, e.g. eg, a prokaryote or a eukaryote.

La célula huésped puede ser una célula fúngica. "Hongos", tal como se utiliza en esta memoria incluye los filos Ascomycota, Basidiomycota, Chytridiomycota y Zygomycota, así como el Oomycota y todos los hongos mitospóricos (tal como se define por Hawksworth et al., En, Dictionary of The Fungi de Ainsworth y Bisby, 8a edición, 1995, CAB International, University Press, Cambridge, Reino Unido).The host cell may be a fungal cell. "Fungi" as used herein includes the phyla Ascomycota, Basidiomycota, Chytridiomycota, and Zygomycota, as well as the Oomycota and all mitosporic fungi (as defined by Hawksworth et al., In, Ainsworth's Dictionary of The Fungi and Bisby, 8th edition, 1995, CAB International, University Press, Cambridge, UK).

La célula huésped fúngica puede ser una célula de levadura. "Levadura", tal como se utiliza en esta memoria, incluye levadura ascosporógena (Endomycetales), levadura basidiosporógena y levadura perteneciente a los hongos imperfectos (Blastomycetes). Dado que la clasificación de las levaduras puede cambiar en el futuro, para los fines de esta invención la levadura se definirá como se describe en Biology and Activities of Yeast (Skinner, Passmore y Davenport, editores, Soc. App. Bacteriol. Symposium Series N°. 9, 1980).The fungal host cell may be a yeast cell. "Yeast" as used herein includes ascosporogenic yeast (Endomycetales), basidiosporogenic yeast, and yeast belonging to fungi imperfecta (Blastomycetes). Since the classification of yeasts may change in the future, for purposes of this invention yeast will be defined as described in Biology and Activities of Yeast (Skinner, Passmore and Davenport, eds., Soc. App. Bacteriol. Symposium Series N 9, 1980).

La célula huésped de levadura puede ser una célula de Candida, Hansenula, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, o Yarrowia , tal como una célula de Kluyveromyces lactis, Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, o Yarrowia lipolytica. The yeast host cell may be a Candida, Hansenula, Kluyveromyces, Pichia, Saccharomyces, Schizosaccharomyces, or Yarrowia cell, such as a Kluyveromyces lactis, Saccharomyces carlsbergensis, Saccharomyces cerevisiae, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis cell. , Saccharomyces oviformis, or Yarrowia lipolytica.

La célula huésped fúngica puede ser una célula fúngica filamentosa. "Hongos filamentosos" incluyen todas las formas filamentosas de la subdivisión Eumycota y Oomycota (tal como se define por Hawksworth et al., 1995, supra).. Los hongos filamentosos se caracterizan generalmente por una pared micelial compuesta de quitina, celulosa, glucano, quitosano, manano y otros polisacáridos complejos. El crecimiento vegetativo se produce por elongación de las hifas y el catabolismo de carbono es obligatoriamente aerobio. Por el contrario, el crecimiento vegetativo de levaduras tales como Saccharomyces cerevisiae se produce mediante la gemación de un talo unicelular y el catabolismo del carbono puede ser fermentativo.The fungal host cell may be a filamentous fungal cell. "Filamentous fungi" include all the filamentous forms of the subdivision Eumycota and Oomycota (as defined by Hawksworth et al., 1995, supra). Filamentous fungi are generally characterized by a mycelial wall composed of chitin, cellulose, glucan, chitosan, mannan and other complex polysaccharides. Vegetative growth is produced by elongation of the hyphae and carbon catabolism is obligatorily aerobic. In contrast, the vegetative growth of yeasts such as Saccharomyces cerevisiae occurs by budding from a unicellular thallus, and carbon catabolism may be fermentative.

La célula fúngica filamentosa puede ser una célula de Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes, o Trichoderma. The filamentous fungal cell may be a cell of Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filibasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia , Pyromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium, Trametes, or Trichoderma.

Por ejemplo, la célula fúngica filamentosa puede ser una célula de Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis pannocinta, Ceriporiopsis rivulosa, Ceriporiopsis subrufa, Ceriporiopsis subvermispora, Chrysosporium inops, Chrysosporium keratinophilum, Chrysosporium lucknowense, Chrysosporium merdarium, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium tropicum, Chrysosporium zonatum, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium trichothecioides, Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporíum, Phlebia radiata, Pleurotus eryngii, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, o Trichoderma viride For example, the filamentous fungal cell may be a cell of Aspergillus awamori, Aspergillus foetidus, Aspergillus fumigatus, Aspergillus japonicus, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Bjerkandera adusta, Ceriporiopsis aneirina, Ceriporiopsis caregiea, Ceriporiopsis gilvescens, Ceriporiopsis rivulosa pannocinta, , Ceriporiopsis subrufa, Ceriporiopsis subvermispora, inops Chrysosporium, Chrysosporium keratinophilum, Chrysosporium lucknowense, Chrysosporium merdarium, Chrysosporium pannicola, Chrysosporium queenslandicum, Chrysosporium tropicum, Chrysosporium zonatum, Coprinus cinereus, Coriolus hirsutus, Fusarium bactridioides, Fusarium cerealis, Fusarium crookwellense, Fusarium culmorum, Fusarium graminearum, Fusarium graminum, Fusarium heterosporum, Fusarium negundi, Fusarium oxysporum, Fusarium reticulatum, Fusarium roseum, Fusarium sambucinum, Fusarium sarcochroum, Fusarium sporotrichioides, Fusarium sulphureum, Fusarium torulosum, Fusarium um trichothecioides, Fusarium venenatum, Humicola insolens, Humicola lanuginosa, Mucor miehei, Myceliophthora thermophila, Neurospora crassa, Penicillium purpurogenum, Phanerochaete chrysosporium, Phlebia radiata, Pleurotus eryngii, Thielavia terrestris, Trametes villosa, Trametes versicolor, Trichoderma harzianum, Trichoderma koningii, Trichoderma longibrachiatum, Trichoderma reesei, or Trichoderma viride

Las células fúngicas se pueden transformar mediante un procedimiento que implica la formación de protoplastos, la transformación de los protoplastos y la regeneración de la pared celular de una manera conocida per se. Procesos adecuados para la transformación de células huésped de Aspergillus yTrichoderma se describen en el documento EP 238023, Yelton et al., 1984, Proc. Natl. Acad. Sci. USA 81: 1470-1474, y Christensen et al., 1988, Bio/Technology 6: 1419-1422. Métodos adecuados para transformar especies de Fusarium se describen por Malardier et al., 1989, Gene 78: 147-156, y documento WO 96/00787. La levadura se puede transformar utilizando los procesos descritos por Becker y Guarente, In Abelson, J.N. y Simon, M.I., editores, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volumen 194, pp 182-187, Academic Press, Inc., Nueva York; Ito et al., 1983, J. Bacteriol. 153: 163; y Hinnen et al., 1978, Proc. Natl. Acad. Sci. USA 75: 1920.Fungal cells can be transformed by a process involving protoplast formation, protoplast transformation and cell wall regeneration in a manner known per se. Suitable processes for the transformation of Aspergillus and Trichoderma host cells are described in EP 238023, Yelton et al., 1984, Proc. Natl. Acad. Sci. USA 81:1470-1474, and Christensen et al., 1988, Bio/Technology 6:1419-1422. Suitable methods for transforming Fusarium species are described by Malardier et al., 1989, Gene 78: 147-156, and WO 96/00787. Yeast can be transformed using the procedures described by Becker and Guarente, In Abelson, JN and Simon, MI, eds., Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, pp 182-187, Academic Press, Inc. , New York; Ito et al., 1983, J. Bacteriol. 153: 163; and Hinnen et al., 1978, Proc. Natl. Acad. Sci. USA 75: 1920.

Métodos de ProducciónProduction Methods

La presente invención también se refiere a métodos para producir una variante, que comprenden: (a) cultivar una célula huésped recombinante de la presente invención en condiciones adecuadas para la expresión de la variante; y (b) recuperar la variante.The present invention also relates to methods of producing a variant, comprising: (a) culturing a recombinant host cell of the present invention under conditions suitable for expression of the variant; and (b) recovering the variant.

Las células huésped se cultivan en un medio nutritivo adecuado para la producción de la variante utilizando métodos conocidos en la técnica. Por ejemplo, la célula puede cultivarse mediante cultivo en matraz de agitación o fermentación a pequeña o gran escala (incluyendo fermentaciones continuas, por lotes, por lotes alimentados o en estado sólido) en fermentadores de laboratorio o industriales realizados en un medio adecuado y en condiciones que permiten expresar y/o aislar la variante. El cultivo tiene lugar en un medio nutriente adecuado que comprende fuentes de carbono y nitrógeno y sales inorgánicas, utilizando procedimientos conocidos en la técnica. Medios adecuados están disponibles de proveedores comerciales o pueden prepararse de acuerdo con composiciones publicadas (p. ej., en catálogos de American Type Culture Collection). Si la variante se secreta en el medio nutritivo, la variante se puede recuperar directamente del medio. Si la variante no se secreta, se puede recuperar de los lisados celulares.Host cells are cultured in a suitable nutrient medium for variant production using methods known in the art. For example, the cell may be cultured by shake flask culture or small-scale or large-scale fermentation (including continuous, batch, fed-batch, or solid-state fermentations) in laboratory or industrial fermentors performed in a suitable medium and under suitable conditions. that allow expressing and/or isolating the variant. The cultivation takes place in a suitable nutrient medium comprising carbon and nitrogen sources and inorganic salts, using procedures known in the art. Suitable media are available from commercial suppliers or can be prepared according to published compositions ( eg, in American Type Culture Collection catalogs). If the variant is secreted into the nutrient medium, the variant can be recovered directly from the medium. If the variant is not secreted, it can be recovered from cell lysates.

La variante puede detectarse utilizando métodos conocidos en la técnica que son específicos para las variantes. Estos métodos de detección incluyen, pero no se limitan al uso de anticuerpos específicos, la formación de un producto enzimático o la desaparición de un sustrato enzimático. Por ejemplo, puede utilizarse un ensayo enzimático para determinar la actividad de la variante.The variant can be detected using methods known in the art that are specific for variants. These detection methods include, but are not limited to the use of specific antibodies, the formation of an enzyme product, or the disappearance of an enzyme substrate. For example, an enzyme assay can be used to determine the activity of the variant.

La variante se puede recuperar utilizando métodos conocidos en la técnica. Por ejemplo, la variante puede recuperarse del medio nutriente mediante procesos convencionales que incluyen, pero no se limitan a recogida, centrifugación, filtración, extracción, secado por pulverización, evaporación o precipitación.The variant can be recovered using methods known in the art. For example, the variant can be recovered from the nutrient medium by conventional processes including, but not limited to, collection, centrifugation, filtration, extraction, spray drying, evaporation, or precipitation.

La variante puede purificarse mediante una diversidad de procedimientos conocidos en la técnica que incluyen, pero no se limitan a cromatografía (p. ej., de intercambio iónico, de afinidad, hidrofóbica, de cromatoenfoque y de exclusión por tamaño), procesos electroforéticos (p. ej., enfoque isoeléctrico preparativo), solubilidad diferencial. (p. ej., precipitación con sulfato de amonio), SDS-PAGE, o extracción (véase, p. ej., Protein Purification, Janson y Ryden, editores, VCH Publishers, Nueva York, 1989) para obtener variantes sustancialmente puras.The variant can be purified by a variety of methods known in the art including, but not limited to chromatography ( eg, ion exchange, affinity, hydrophobic, chromatofocusing, and size exclusion), electrophoretic processes ( p. eg, preparative isoelectric focusing), differential solubility. ( eg, ammonium sulfate precipitation), SDS-PAGE, or extraction (see, eg, Protein Purification, Janson and Ryden, eds., VCH Publishers, New York, 1989) to obtain substantially pure variants.

En un aspecto alternativo, la variante no se recupera, sino que se utiliza una célula huésped de la presente invención que expresa la variante como una fuente de la variante.In an alternative aspect, the variant is not recovered, but rather a host cell of the present invention expressing the variant is used as a source of the variant.

Composiciones EnzimáticasEnzyme Compositions

La presente invención también se refiere a composiciones que comprenden una proteasa variante de la invención. Preferiblemente, las composiciones están enriquecidas en una proteasa de este tipo. El término "enriquecido" indica que la actividad pululanasa de la composición se ha incrementado, p. ej., con un factor de enriquecimiento de al menos 1,1.The present invention also relates to compositions comprising a variant protease of the invention. Preferably, the compositions are enriched for such a protease. The term "enriched" indicates that the pullulanase activity of the composition has been increased, e.g. g., with an enrichment factor of at least 1.1.

Las composiciones pueden comprender la proteasa variante S53 como componente enzimático principal, p. ej., una composición mono-componente. Alternativamente, las composiciones pueden comprender múltiples actividades enzimáticas, tales como la proteasa variante S53 y una o más (p. ej., varias) enzimas seleccionadas del grupo que consiste en hidrolasa, isomerasa, ligasa, liasa, oxidorreductasa o transferasa, p. ej., una alfa- galactosidasa, alfaglucosidasa, aminopeptidasa, alfa-amilasa, beta-amilasa, beta-galactosidasa, beta-glucosidasa, beta-xilosidasa, carbohidrasa, carboxipeptidasa, catalasa, celobiohidrolasa, celulasa, quitinasa, cutinasa, ciclodextrina glicosiltransferasa, glucoamilasa, invertasa, lacasa, lipasa, manosidasa, mutanasa, oxidasa, enzima pectinolítica, peroxidasa, fitasa, polifenoloxidasa, proteasa, ribonucleasa, transglutaminasa o xilanasa. En una realización, la composición comprende una proteasa S53 variante de la invención y una enzima generadora de fuente de hidratos de carbono y opcionalmente una alfa-amilasa. En una realización particular, la composición comprende una proteasa variante S53 y una glucoamilasa. Preferiblemente, las actividades enzimáticas comprendidas en la composición se seleccionan de la proteasa S53 variante de la invención y una o más enzimas seleccionadas del grupo que consiste en glucoamilasa, alfa-amilasa fúngica.The compositions may comprise the S53 variant protease as the main enzyme component, e.g. g., a one-component composition. Alternatively, the compositions may comprise multiple enzyme activities, such as the S53 variant protease and one or more ( eg, several) enzymes selected from the group consisting of hydrolase, isomerase, ligase, lyase, oxidoreductase, or transferase, e.g. g., an alpha-galactosidase, alpha-glucosidase, aminopeptidase, alpha-amylase, beta-amylase, beta-galactosidase, beta-glucosidase, beta-xylosidase, carbohydrase, carboxypeptidase, catalase, cellobiohydrolase, cellulase, chitinase, cutinase, cyclodextrin glycosyltransferase, glucoamylase , invertase, laccase, lipase, mannosidase, mutanase, oxidase, pectinolytic enzyme, peroxidase, phytase, polyphenoloxidase, protease, ribonuclease, transglutaminase, or xylanase. In one embodiment, the composition comprises a variant S53 protease of the invention and a carbohydrate source generating enzyme and optionally an alpha-amylase. In a particular embodiment, the composition comprises an S53 variant protease and a glucoamylase. Preferably, the enzyme activities comprised in the composition are selected from the variant S53 protease of the invention and one or more enzymes selected from the group consisting of glucoamylase, fungal alpha-amylase.

En una realización, la glucoamilasa comprendida en la composición es de origen fúngico, preferiblemente de una cepa de Aspergillus, preferiblemente A. niger, A. awamori, o A. oryzae; o una cepa de Trichoderma, preferiblemente T. reesei;o una cepa de Talaromyces, preferiblemente T. emersoniio una cepa de Trametes, preferiblemente T. cingulata, o una cepa de Pycnoporus, preferiblemente P. sanguineus, o una cepa de Gloeophyllum, tal como G. serpiarium o G. trabeum, o una cepa de Nigrofomes. In one embodiment, the glucoamylase comprised in the composition is of fungal origin, preferably from a strain of Aspergillus, preferably A. niger, A. awamori, or A. oryzae; or a strain of Trichoderma, preferably T. reesei; or a strain of Talaromyces, preferably T. emersonii, or a strain of Trametes, preferably T. cingulata, or a strain of Pycnoporus, preferably P. sanguineus, or a strain of Gloeophyllum, such as G. serpiarium or G. trabeum, or a Nigrofomes strain.

En una realización, la glucoamilasa se deriva de Trametes, tal como una cepa de Trametes cingulata, tal como la que se muestra en la SEQ ID NO: 4 en esta memoria.In one embodiment, the glucoamylase is derived from Trametes, such as a Trametes cingulata strain, such as that shown in SEQ ID NO: 4 herein.

En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 4 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 4 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.(ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 4 en esta memoria.e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 4 herein.

En una realización, la glucoamilasa se deriva de Talaromyces, tal como una cepa de Talaromyces emersonii, tal como la que se muestra en la SEQ ID NO: 5 en esta memoria.In one embodiment, the glucoamylase is derived from Talaromyces, such as a Talaromyces emersonii strain, such as that shown in SEQ ID NO: 5 herein.

En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 5 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 5 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.(ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 5 en esta memoria.e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 5 herein.

En una realización, la glucoamilasa se deriva de una cepa del género Pycnoporus, en particular una cepa de Pycnoporus sanguineus descrita en el documento WO 2011/066576 (SEQ ID NOs 2, 4 o 6), tal como la que se muestra como SEQ ID NO: 4 en el documento WO 2011/066576.In one embodiment, the glucoamylase is derived from a strain of the genus Pycnoporus, in particular a strain of Pycnoporus sanguineus described in WO 2011/066576 (SEQ ID NOs 2, 4 or 6), such as that shown as SEQ ID NO: 4 in WO 2011/066576.

En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 6 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 6 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.(ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 6 en esta memoria.e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 6 herein.

En una realización, la glucoamilasa se deriva de una cepa del género Gloeophyllum, tal como una cepa de Gloeophyllum sepiarium o Gloeophyllum trabeum, en particular una cepa de Gloeophyllum, tal como se describe en el documento WO 2011/068803 (SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 o 16). En una realización preferida, la glucoamilasa es Gloeophyllum sepiarium mostrada en SEQ iD NO: 2 en el documento WO 2011/068803 o SEQ ID NO: 7 en esta memoria.In one embodiment, the glucoamylase is derived from a strain of the genus Gloeophyllum, such as a strain of Gloeophyllum sepiarium or Gloeophyllum trabeum, in particular a strain of Gloeophyllum, as described in WO 2011/068803 (SEQ ID NO: 2 , 4, 6, 8, 10, 12, 14 or 16). In a preferred embodiment, the glucoamylase is Gloeophyllum sepiarium shown in SEQ ID NO: 2 in WO 2011/068803 or SEQ ID NO: 7 in this specification.

En una realización, la glucoamilasa se deriva de Gloeophyllum serpiarium, tal como la que se muestra en la SEQ ID NO: 7 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is derived from Gloeophyllum serpiarium, such as that shown in SEQ ID NO: 7 herein. In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 7 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 7 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.(ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 7 en esta memoria.e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 7 herein.

En otra realización, la glucoamilasa se deriva de Gloeophyllum trabeum tal como la que se muestra en la SEQ ID NO: 8 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:In another embodiment, the glucoamylase is derived from Gloeophyllum trabeum such as that shown in SEQ ID NO: 8 herein. In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 8 en esta memoria; (i) a glucoamylase comprising the polypeptide of SEQ ID NO: 8 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 8 en esta memoria.(ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g. e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 8 herein.

En una realización, la glucoamilasa se deriva de una cepa del género Nigrofomes,, en particular una cepa de Nigrofomes sp. descrita en el documento WO 2012/064351.In one embodiment, the glucoamylase is derived from a strain of the genus Nigrofomes, in particular a strain of Nigrofomes sp. described in WO 2012/064351.

En una realización, las glucoamilasas pueden añadirse a la sacarificación y/o fermentación en una cantidad de 0,0001­ 20 AGU/g DS, preferiblemente 0,001 -10 AGU/g DS, especialmente entre 0,01 -5 AGU/g DS, tal como 0,1-2 AGU/g DS. In one embodiment, glucoamylases can be added to the saccharification and/or fermentation in an amount of 0.0001-20 AGU/g DS, preferably 0.001-10 AGU/g DS, especially between 0.01-5 AGU/g DS, such as 0.1-2 AGU/g DS.

Composiciones disponibles comercialmente que comprenden glucoamilasa incluyen AMG 200L; AMG 300 L; SAN™ SUPER, SAN™ EXTRA L, SPIRIZYME™ PLUS, SPIRIZYME™ FUEL, SPIRIZYME™ B4U, SPIRIZYME™ ULTRA, SPIRIZYME™ EXCEL y AMG™ E (de Novozymes A/S); OPTIDEX™ 300, GC480, GC417 (de DuPont.); AMIGASE™ y AMIGASE™ PLUS (de DSM); G-ZYME™ G900, G-ZYME™ y G990 ZR (de DuPont).Commercially available compositions comprising glucoamylase include AMG 200L; AMG 300L; SAN™ SUPER, SAN™ EXTRA L, SPIRIZYME™ PLUS, SPIRIZYME™ FUEL, SPIRIZYME™ B4U, SPIRIZYME™ ULTRA, SPIRIZYME™ EXCEL and AMG™ E (from Novozymes A/S); OPTIDEX™ 300, GC480, GC417 (from DuPont.); AMIGASE™ and AMIGASE™ PLUS (from DSM); G-ZYME™ G900, G-ZYME™ and G990 ZR (from DuPont).

Además de una glucoamilasa, la composición puede comprender, además, una alfa-amilasa. Particularmente, la alfaamilasa es una alfa-amilasa fúngica ácida. Una alfa-amilasa estable al ácido fúngico es una alfa-amilasa que tiene actividad en el intervalo de pH de 3,0 a 7,0 y preferiblemente en el intervalo de pH de 3,5 a 6,5, incluida la actividad a un pH de aproximadamente 4,0, 4,5, 5,0, 5,5 y 6,0.In addition to a glucoamylase, the composition may further comprise an alpha-amylase. Particularly, alpha-amylase is an acidic fungal alpha-amylase. A fungal acid-stable alpha-amylase is an alpha-amylase having activity in the pH range of 3.0 to 7.0 and preferably in the pH range of 3.5 to 6.5, including activity at a pH of approximately 4.0, 4.5, 5.0, 5.5 and 6.0.

Preferiblemente, la alfa-amilasa fúngica ácida se deriva del género Aspergillus, especialmente una cepa de A. terreus, A. niger, A. oryzae, A. awamori, o Aspergillus kawachii, o del género Rhizomucor, preferiblemente una cepa de Rhizomucorpusillus,, o el género Meripilus,, preferiblemente una cepa de Meripilus giganteus. Preferably, the fungal acid alpha-amylase is derived from the genus Aspergillus, especially a strain of A. terreus, A. niger, A. oryzae, A. awamori, or Aspergillus kawachii, or from the genus Rhizomucor, preferably a strain of Rhizomucorpusillus, or the genus Meripilus, preferably a strain of Meripilus giganteus.

En una realización preferida, la alfa-amilasa se deriva de una cepa del género Rhizomucor, preferiblemente una cepa de Rhizomucor pusillus, tal como la que se muestra en la SEQ ID NO: 3 en el documento WO 2013/006756, tal como un híbrido de alfa-amilasa de Rhizomucor pusillus que tiene un enlazador de Aspergillus niger y un dominio de unión a almidón, tal como el que se muestra en la SEQ ID NO: 9 en esta memoria, o una variante del mismo.In a preferred embodiment, the alpha-amylase is derived from a strain of the genus Rhizomucor, preferably a strain of Rhizomucor pusillus, such as that shown in SEQ ID NO: 3 in WO 2013/006756, such as a hybrid Rhizomucor pusillus alpha-amylase enzyme having an Aspergillus niger linker and starch-binding domain, such as that shown in SEQ ID NO: 9 herein, or a variant thereof.

En una realización, la alfa-amilasa se selecciona del grupo que consiste en:In one embodiment, the alpha-amylase is selected from the group consisting of:

(i) una alfa-amilasa que comprende el polipéptido de SEQ ID NO: 9 en esta memoria;(i) an alpha-amylase comprising the polypeptide of SEQ ID NO: 9 herein;

(ii) una alfa-amilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.(ii) an alpha-amylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 9 herein.

En una realización preferida, la alfa-amilasa es una variante de la alfa-amilasa mostrada en SEQ ID NO: 9 que tiene al menos una de las siguientes sustituciones o combinaciones de sustituciones: D165M; Y141W; Y141R; K136F; K192R; P224A; P224R; S123H Y141W; G20S Y141W; A76G Y141W; G128D Y141W; G128D D143N; P219C Y141W; N142D D143N; Y141W K192R; Y141W D143N; Y141W N383R; Y141W P219C A265C; Y141W N142D D143N; Y141W K192R V410A; G128D Y141W D143N; Y141W D143N P219C; Y141W D143N K192R; G128D D143N K192R; Y141W D143N K192R P219C; G128D Y141W D143N K192R; o G128D Y141W D143N K192R P219C (utilizando la SEQ ID NO: 9 para la numeración).In a preferred embodiment, the alpha-amylase is a variant of the alpha-amylase shown in SEQ ID NO: 9 having at least one of the following substitutions or combinations of substitutions: D165M; Y141W; Y141R; K136F; K192R; P224A; P224R; S123H Y141W; G20S Y141W; A76G Y141W; G128D Y141W; G128D D143N; P219C Y141W; N142D D143N; Y141W K192R; Y141W D143N; Y141W N383R; Y141W P219C A265C; Y141W N142D D143N; Y141W K192R V410A; G128D Y141W D143N; Y141W D143N P219C; Y141W D143N K192R; G128D D143N K192R; Y141W D143N K192R P219C; G128D Y141W D143N K192R; or G128D Y141W D143N K192R P219C (using SEQ ID NO: 9 for numbering).

En una realización, la alfa-amilasa se deriva de un Rhizomucor pusillus con un enlazador de glucoamilasa de Aspergillus niger y un dominio de unión a almidón (SBD), preferiblemente descrito como SEC ID NO: 9 en esta memoria, preferiblemente con una o más de las siguientes sustituciones: G128D, D143N, preferiblemente G128D D143N (utilizando SEQ ID NO: 9 para numeración), y en donde la variante de alfa-amilasa tiene al menos 75% de identidad preferiblemente al menos 80%, más preferiblemente al menos 85%, más preferiblemente al menos 90%, más preferiblemente al menos 91%, más preferiblemente al menos 92%, incluso más preferiblemente al menos 93%, lo más preferiblemente al menos 94%, e incluso lo más preferiblemente al menos 95%, tal como incluso al menos 96%, al menos 97% , al menos 98%, al menos 99%, pero menos del 100% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.In one embodiment, the alpha-amylase is derived from a Rhizomucor pusillus with an Aspergillus niger glucoamylase linker and starch-binding domain (SBD), preferably described as SEQ ID NO: 9 herein, preferably with one or more of the following substitutions: G128D, D143N, preferably G128D D143N (using SEQ ID NO: 9 for numbering), and wherein the alpha-amylase variant has at least 75% identity, preferably at least 80%, more preferably at least 85 %, more preferably at least 90%, more preferably at least 91%, more preferably at least 92%, even more preferably at least 93%, most preferably at least 94%, and even most preferably at least 95%, such such as even at least 96%, at least 97%, at least 98%, at least 99%, but less than 100% identity to the polypeptide of SEQ ID NO: 9 herein.

En una realización preferida, la relación entre glucoamilasa y alfa-amilasa presente y/o añadida durante la sacarificación y/o fermentación puede estar preferiblemente en el intervalo de 500:1 a 1:1, tal como de 250:1 a 1:1, tal como como de 100:1 a 1: 1, tal como de 100: 2 a 100:50, tal como de 100:3 a 100:70.In a preferred embodiment, the ratio of glucoamylase to alpha-amylase present and/or added during saccharification and/or fermentation may preferably be in the range of 500:1 to 1:1, such as 250:1 to 1:1. such as 100:1 to 1:1, such as 100:2 to 100:50, such as 100:3 to 100:70.

Las composiciones se pueden preparar de acuerdo con métodos conocidos en la técnica y pueden estar en forma de una composición líquida o seca. Por ejemplo, la composición puede estar en forma de granulado o microgranulado. La variante puede estabilizarse de acuerdo con métodos conocidos en la técnica. The compositions can be prepared according to methods known in the art and can be in the form of a liquid or dry composition. For example, the composition may be in the form of granules or microgranules. The variant can be stabilized according to methods known in the art.

Las composiciones se pueden preparar de acuerdo con métodos conocidos en la técnica y pueden estar en forma de una composición líquida o seca. Las composiciones se pueden estabilizar de acuerdo con métodos conocidos en la técnica.The compositions can be prepared according to methods known in the art and can be in the form of a liquid or dry composition. The compositions can be stabilized according to methods known in the art.

La composición enzimática de la presente invención puede estar en cualquier forma adecuada para su uso, tal como, por ejemplo, un caldo de fermentación bruto con o sin células eliminadas, un lisado celular con o sin desechos celulares, una composición enzimática semi-purificada o purificada, o una célula huésped, como fuente de las enzimas.The enzyme composition of the present invention may be in any form suitable for use, such as, for example, a crude fermentation broth with or without cells removed, a cell lysate with or without cell debris, a semi-purified enzyme composition or purified, or a host cell, as the source of the enzymes.

La composición enzimática puede ser un polvo o granulado seco, un granulado que no espolvorea, un líquido, un líquido estabilizado o una enzima protegida estabilizada. Composiciones líquidas de enzimas pueden, por ejemplo, estabilizarse añadiendo estabilizadores tales como un azúcar, un alcohol de azúcar u otro poliol y/o ácido láctico u otro ácido orgánico de acuerdo con procesos establecidos.The enzyme composition may be a dry powder or granule, a non-dusting granule, a liquid, a stabilized liquid or a stabilized protected enzyme. Liquid enzyme compositions can, for example, be stabilized by adding stabilizers such as a sugar, sugar alcohol or other polyol and/or lactic acid or other organic acid according to established procedures.

Uso de las proteasas variantes de la invenciónUse of the variant proteases of the invention

Procesamiento de AlmidónStarch Processing

El almidón nativo consiste en gránulos microscópicos, que son insolubles en agua a temperatura ambiente. Cuando se calienta la suspensión acuosa de almidón, los gránulos se hinchan y finalmente estallan, dispersando las moléculas de almidón en la solución. A temperaturas de hasta aproximadamente 50°C a 75°C, el hinchamiento puede ser reversible. Sin embargo, con temperaturas más altas comienza un hinchamiento irreversible denominado "gelatinización". Durante este proceso de "gelatinización" hay un aumento drástico de la viscosidad. El almidón granular a procesar puede ser una calidad de almidón altamente refinado, preferiblemente al menos 90%, al menos 95%, al menos 97% o al menos 99,5% puro o puede ser materiales que contengan almidón más bruto que comprenda (p. ej., molidos) cereales integrales, incluyendo las fracciones que no contienen almidón, tales como residuos de gérmenes y fibras. El material bruto, como los cereales integrales, puede reducirse en tamaño de partícula, p. ej., mediante molienda, con el fin de abrir la estructura y permitir un procesamiento adicional. En la molienda en seco, se muelen y utilizan granos enteros. La molienda húmeda da una buena separación de germen y harina (gránulos de almidón y proteína) y a menudo se aplica en lugares en los que el hidrolizado de almidón se utiliza en la producción de, p. ej., jarabes. Tanto la trituración en seco como en húmedo es bien conocida en la técnica del procesamiento de almidón y puede utilizarse en un procedimiento de la invención. Los métodos para reducir el tamaño de partícula del material que contiene almidón son bien conocidos por los expertos en la técnica.Native starch consists of microscopic granules, which are insoluble in water at room temperature. When the aqueous suspension of starch is heated, the granules swell and eventually burst, dispersing the starch molecules in solution. At temperatures up to about 50°C to 75°C, the swelling may be reversible. However, at higher temperatures an irreversible swelling called "gelatinization" begins. During this "gelatinization" process there is a drastic increase in viscosity. The granular starch to be processed may be a highly refined grade of starch, preferably at least 90%, at least 95%, at least 97%, or at least 99.5% pure or may be cruder starch-containing materials comprising ( p .g., ground) whole grains, including non-starchy fractions such as germ residues and fibers. Raw material such as whole grains can be reduced in particle size, e.g. eg., by milling, in order to open up the structure and allow further processing. In dry milling, whole grains are ground and used. Wet milling gives a good separation of germ and flour (starch and protein granules) and is often applied where starch hydrolyzate is used in the production of e.g. eg syrups. Both dry and wet milling are well known in the art of starch processing and can be used in a process of the invention. Methods for reducing the particle size of starch-containing material are well known to those skilled in the art.

Como el nivel de sólidos es del 30-40% en un procedimiento industrial típico, el almidón debe diluirse o "licuarse" para que pueda procesarse adecuadamente. Esta reducción de la viscosidad se logra principalmente mediante la degradación enzimática en la práctica comercial actual.As the solids level is 30-40% in a typical industrial process, the starch must be diluted or "liquefied" so that it can be processed properly. This viscosity reduction is achieved primarily by enzymatic degradation in current commercial practice.

La licuefacción se lleva a cabo en presencia de una alfa-amilasa, preferiblemente una alfa-amilasa bacteriana y/o alfaamilasa fúngica ácida. En una realización, también está presente una fitasa durante la licuefacción. En una realización, también están presentes durante la licuefacción enzimas reductoras de la viscosidad tales como xilanasa y/o betaglucanasa.Liquefaction is carried out in the presence of an alpha-amylase, preferably a bacterial alpha-amylase and/or acid fungal alpha-amylase. In one embodiment, a phytase is also present during liquefaction. In one embodiment, viscosity-reducing enzymes such as xylanase and/or beta-glucanase are also present during liquefaction.

Durante la licuefacción, el almidón de cadena larga se degrada en unidades más cortas ramificadas y lineales (maltodextrinas) mediante una alfa-amilasa. La licuefacción se puede llevar a cabo como un procedimiento de suspensión caliente de tres etapas. La suspensión se calienta entre 60-95°C (p. ej., 70-90°C, tal como 77-86°C, 80-85°C, 83-85°C) y se añade una alfa-amilasa para iniciar la licuefacción (dilución).During liquefaction, long-chain starch is broken down into shorter branched and linear units (maltodextrins) by alpha-amylase. Liquefaction can be carried out as a three stage hot slurry process. The suspension is heated to 60-95°C ( eg, 70-90°C, such as 77-86°C, 80-85°C, 83-85°C) and an alpha-amylase is added to initiate liquefaction (dilution).

En una realización, la suspensión se puede cocer a chorro a entre 95-140°C, p. ej., 105-125°C, durante aproximadamente 1-15 minutos, p.ej., aproximadamente 3-10 minutos, especialmente alrededor de 5 minutos. Luego, la suspensión se enfría a 60-95°C y se añade más alfa-amilasa para obtener la hidrólisis final (licuefacción secundaria). El procedimiento de cocción a chorro se lleva a cabo a pH 4,5-6,5, típicamente a un pH entre 5 y 6. La alfa-amilasa se puede añadir como una dosis única, p. ej., antes de la cocción a chorro.In one embodiment, the slurry can be jet-cooked to between 95-140°C, eg. eg, 105-125°C, for about 1-15 minutes, eg, about 3-10 minutes, especially about 5 minutes. The suspension is then cooled to 60-95°C and more alpha-amylase is added to obtain the final hydrolysis (secondary liquefaction). The jet cooking process is carried out at pH 4.5-6.5, typically between pH 5 and 6. The alpha-amylase can be added as a single dose, e.g. e.g. before jet cooking.

El procedimiento de licuefacción se lleva a cabo entre 70-95°C, tal como 80-90°C, tal como alrededor de 85°C, durante aproximadamente 10 minutos a 5 horas, típicamente durante 1-2 horas. El pH está entre 4 y 7, tal como entre 4,5 y 5,5. Con el fin de asegurar una estabilidad enzimática óptima bajo estas condiciones, se puede añadir opcionalmente calcio (para proporcionar 1 -60 ppm de iones calcio libres, tales como aproximadamente 40 ppm de iones calcio libres). Después de un tratamiento de este tipo, el almidón licuado tendrá típicamente un "equivalente de dextrosa" (DE) de 10-15.The liquefaction process is carried out at 70-95°C, such as 80-90°C, such as about 85°C, for about 10 minutes to 5 hours, typically 1-2 hours. The pH is between 4 and 7, such as between 4.5 and 5.5. In order to ensure optimal enzyme stability under these conditions, calcium may optionally be added (to provide 1-60 ppm free calcium ions, such as about 40 ppm free calcium ions). After such a treatment, the liquefied starch will typically have a "dextrose equivalent" (DE) of 10-15.

Generalmente, la licuefacción y las condiciones de licuefacción son bien conocidas en la técnica.Generally, liquefaction and liquefaction conditions are well known in the art.

Alfa-amilasas para uso en licuefacción son preferiblemente alfa-amilasas estables a los ácidos bacterianas. Particularmente, la alfa-amilasa es de una Exiguobacterium sp. o una Bacillus sp., tal como, p, ej., Bacillus stearothermophilus o Bacillus licheniformis.. Alpha-amylases for use in liquefaction are preferably bacterial acid-stable alpha-amylases. Particularly, the alpha-amylase is from an Exiguobacterium sp. or a Bacillus sp., such as, eg, Bacillus stearothermophilus or Bacillus licheniformis.

En una realización, la alfa-amilasa es del género Bacillus,, tal como una cepa de Bacillus stearothermophilus, en particular una variante de una alfa-amilasa de Bacillus stearothermophilus, tal como la que se muestra en SEQ ID NO: 3 en el documento WO 99/019467 o SEQ ID NO: 10 en esta memoria.In one embodiment, the alpha-amylase is from the genus Bacillus, such as a strain of Bacillus stearothermophilus, in particular a variant of a Bacillus stearothermophilus alpha-amylase, such as that shown in SEQ ID NO: 3 in document WO 99/019467 or SEQ ID NO: 10 in this specification.

En una realización, la alfa-amilasa de Bacillus stearothermophilus tiene una deleción doble de dos aminoácidos en la región de la posición 179 a 182, más particularmente una deleción doble en las posiciones 1181 G182, R179 G180, G180 1181, R179 1181 o G180 G182, preferiblemente 1181 G182, y opcionalmente una sustitución N193F (utilizando la SEQ ID NO: 10 para la numeración).In one embodiment, the Bacillus stearothermophilus alpha-amylase has a double deletion of two amino acids in the region from position 179 to 182, more particularly a double deletion at positions 1181 G182, R179 G180, G180 1181, R179 1181 or G180 G182. , preferably 1181 G182, and optionally a N193F substitution (using SEQ ID NO: 10 for numbering).

En una realización, la alfa-amilasa de Bacillus stearothermophilus tiene una sustitución en la posición S242, preferiblemente una sustitución S242Q.In one embodiment, the Bacillus stearothermophilus alpha-amylase has a substitution at position S242, preferably an S242Q substitution.

En una realización, la alfa-amilasa de Bacillus stearothermophilus tiene una sustitución en la posición E188, preferiblemente una sustitución E188P.In one embodiment, the Bacillus stearothermophilus alpha-amylase has a substitution at position E188, preferably an E188P substitution.

En una realización, la alfa-amilasa se selecciona del grupo de variantes de alfa-amilasa de Bacillus stearothermophilus con las siguientes mutaciones:In one embodiment, the alpha-amylase is selected from the group of Bacillus stearothermophilus alpha-amylase variants with the following mutations:

• I181*+G182*+N193F+E129V+K177L+R179E;• I181*+G182*+N193F+E129V+K177L+R179E;

• I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L Q254S;• I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L Q254S;

• I181*+G182*+N193F V59A Q89R+ E129V+ K177L+ R179E+ Q254S+ M284V; y• I181*+G182*+N193F V59A Q89R+ E129V+ K177L+ R179E+ Q254S+ M284V; Y

• I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S (utilizando la SEQ ID NO: 10 para la numeración).• I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S (using SEQ ID NO: 10 for numbering).

En una realización, la variante de alfa-amilasa tiene al menos 75% de identidad, preferiblemente al menos 80%, más preferiblemente al menos 85%, más preferiblemente al menos 90%, más preferiblemente al menos 91%, más preferiblemente al menos 92%, incluso más preferiblemente al menos 93%, lo más preferiblemente al menos 94%, e incluso lo más preferiblemente al menos 95%, tal como incluso al menos 96%, al menos 97% , al menos 98%, al menos 99%, pero menos del 100% de identidad con el polipéptido de SEQ ID NO: 10.In one embodiment, the alpha-amylase variant has at least 75% identity, preferably at least 80%, more preferably at least 85%, more preferably at least 90%, more preferably at least 91%, more preferably at least 92%. %, even more preferably at least 93%, most preferably at least 94%, and even most preferably at least 95%, such as even at least 96%, at least 97%, at least 98%, at least 99% , but less than 100% identity with the polypeptide of SEQ ID NO: 10.

Debe entenderse que cuando se hace referencia a la alfa-amilasa de Bacillus stearothermophilus y variantes de la misma, normalmente se producen en forma truncada. En particular, el truncamiento puede ser tal que la alfa-amilasa de Bacillus stearothermophilus mostrada en SEQ ID NO: 3 en el documento WO 99/19467 o SEQ ID NO: 10 en esta memoria, o variantes de la misma, se truncan en el C terminal preferiblemente para tener alrededor de 490 aminoácidos, tal como 482-493 aminoácidos. Preferiblemente, la alfa-amilasa variante de Bacillus stearothermophilus está truncada, preferiblemente después de la posición 484 de SEQ ID NO: 10, particularmente después de la posición 485, particularmente después de la posición 486, particularmente después de la posición 487, particularmente después de la posición 488, particularmente después de la posición 489, particularmente después de la posición 490, particularmente después de la posición 491, particularmente después de la posición 492, más particularmente después de la posición 493.It should be understood that when referring to Bacillus stearothermophilus alpha-amylase and variants thereof, they are normally produced in a truncated form. In particular, the truncation may be such that the Bacillus stearothermophilus alpha-amylase shown in SEQ ID NO: 3 in WO 99/19467 or SEQ ID NO: 10 herein, or variants thereof, are truncated at the C-terminal preferably to be about 490 amino acids, such as 482-493 amino acids. Preferably, the Bacillus stearothermophilus variant alpha-amylase is truncated, preferably after position 484 of SEQ ID NO: 10, particularly after position 485, particularly after position 486, particularly after position 487, particularly after position 488, particularly after position 489, particularly after position 490, particularly after position 491, particularly after position 492, more particularly after position 493.

La sacarificación se puede llevar a cabo utilizando condiciones bien conocidas en la técnica con una enzima generadora de fuente de hidratos de carbono, en particular una glucoamilasa o una beta-amilasa y opcionalmente una enzima desramificante, tal como una isoamilasa o una pululanasa. Por ejemplo, una etapa de sacarificación completa puede durar de aproximadamente 24 a aproximadamente 72 horas. Sin embargo, es común hacer una pre­ sacarificación de típicamente 40-90 minutos a una temperatura entre 30-65°C, típicamente alrededor de 60°C, seguida de sacarificación completa durante la fermentación en un procedimiento de sacarificación y fermentación simultánea (SSF). La sacarificación se lleva a cabo típicamente a una temperatura en el intervalo de 20-75°C, p. ej., 25-65°C y 40-70°C, típicamente alrededor de 60°C, y a un pH entre aproximadamente 4 y 5, normalmente a aproximadamente pH 4,5.Saccharification can be carried out using conditions well known in the art with a carbohydrate source generating enzyme, in particular a glucoamylase or a beta-amylase and optionally a debranching enzyme, such as an isoamylase or a pullulanase. For example, a complete saccharification step can take from about 24 to about 72 hours. However, it is common to do pre-saccharification for typically 40-90 minutes at a temperature between 30-65°C, typically around 60°C, followed by full saccharification during fermentation in a simultaneous saccharification and fermentation (SSF) process. . Saccharification is typically carried out at a temperature in the range of 20-75°C, eg. eg, 25-65°C and 40-70°C, typically about 60°C, and at a pH between about 4 and 5, usually about pH 4.5.

Las etapas de sacarificación y fermentación se pueden llevar a cabo de forma secuencial o simultánea. En una forma de realización, la sacarificación y la fermentación se realizan simultáneamente (a lo que se alude como "SSF"). Sin embargo, es común realizar una etapa de pre-sacarificación durante aproximadamente 30 minutos a 2 horas (p. e j, 30 a 90 minutos) a una temperatura de 30 a 65°C, típicamente alrededor de 60°C, seguido de una sacarificación completa durante la fermentación, conocida como sacarificación y fermentación simultáneas (SSF). El pH está habitualmente entre 4,2 y 4,8, p. ej., pH 4,5. En un procedimiento de sacarificación y fermentación simultáneas (SSF), no hay una fase de retención para la sacarificación, más bien la levadura y las enzimas se añaden juntas.The saccharification and fermentation steps can be carried out sequentially or simultaneously. In one embodiment, saccharification and fermentation are performed simultaneously (referred to as "SSF"). However, it is common to perform a pre-saccharification step for approximately 30 minutes to 2 hours ( eg, 30 to 90 minutes) at a temperature of 30 to 65°C, typically around 60°C, followed by a saccharification. complete during fermentation, known as simultaneous saccharification and fermentation (SSF). The pH is usually between 4.2 and 4.8, e.g. g., pH 4.5. In a simultaneous saccharification and fermentation (SSF) process, there is no holding phase for the saccharification, rather the yeast and enzymes are added together.

En un procedimiento de sacarificación típico, las maltodextrinas producidas durante la licuefacción se convierten en dextrosa mediante la adición de una glucoamilasa y una enzima desramificante, tal como una isoamilasa (Patente de EE.UU. N° 4.335.208) o una pululanasa. La temperatura se reduce a 60°C antes de la adición de glucoamilasa y enzima desramificante. El procedimiento de sacarificación continúa durante 24-72 horas. Antes de la adición de las enzimas sacarificantes, el pH se reduce por debajo de 4,5, mientras se mantiene una temperatura alta (por encima de 95°C), para inactivar la alfa-amilasa licuante. Este procedimiento reduce la formación de oligosacáridos cortos denominados "precursores de panosa", que no pueden ser hidrolizados adecuadamente por la enzima desramificante. Normalmente, aproximadamente el 0,2-0,5% del producto de sacarificación es el trisacárido panosa ramificado (Glc pa1-6Glc pa1-4Glc), que no puede ser degradado por una pululanasa. Si la amilasa activa de la licuefacción permanece presente durante la sacarificación ( es decir, sin desnaturalización), la cantidad de panosa puede ser tan alta como 1-2%, lo cual es altamente indeseable, ya que reduce significativamente el rendimiento de sacarificación. In a typical saccharification process, maltodextrins produced during liquefaction are converted to dextrose by the addition of a glucoamylase and debranching enzyme, such as isoamylase (US Patent No. 4,335,208) or pullulanase. The temperature is reduced to 60°C before the addition of glucoamylase and debranching enzyme. The saccharification process continues for 24-72 hours. Before the addition of the saccharifying enzymes, the pH is lowered below 4.5, while maintaining a high temperature (above 95°C), to inactivate the liquefying alpha-amylase. This procedure reduces the formation of short oligosaccharides called "panose precursors", which cannot be adequately hydrolyzed by the debranching enzyme. Typically, about 0.2-0.5% of the saccharification product is the branched panose trisaccharide (Glc pa1-6Glc pa1-4Glc), which cannot be degraded by a pullulanase. If liquefaction active amylase remains present during saccharification ( ie without denaturation), the amount of panose can be as high as 1-2%, which is highly undesirable as it significantly reduces the saccharification yield.

Otros productos de fermentación pueden fermentarse en condiciones y temperaturas bien conocidas por las personas expertas en la técnica, adecuadas para el organismo fermentador en cuestión.Other fermentation products can be fermented under conditions and temperatures well known to those skilled in the art, suitable for the fermenting organism in question.

El producto de la fermentación puede recuperarse mediante métodos bien conocidos en la técnica, p. ej., mediante destilación. Se describen ejemplos de enzimas generadoras de fuentes de hidratos de carbono en la sección "Enzimas" que figura más adelante.The fermentation product can be recovered by methods well known in the art, e.g. g., by distillation. Examples of carbohydrate source generating enzymes are described in the "Enzymes" section below.

En un aspecto particular, el procedimiento de la invención comprende, además, antes de la conversión de un material que contiene almidón en azúcares/dextrinas las etapas de:In a particular aspect, the method of the invention further comprises, before the conversion of a starch-containing material into sugars/dextrins, the steps of:

(x) reducir el tamaño de partícula del material que contiene almidón; e(x) reducing the particle size of the starch-containing material; and

(y) formar una suspensión que comprende el material que contiene almidón y agua.(y) forming a suspension comprising the starch-containing material and water.

En una realización, el material que contiene almidón se muele para reducir el tamaño de partícula. En una realización, el tamaño de partícula se reduce a entre 0,05-3,0 mm, preferiblemente 0,1-0,5 mm, o de modo que al menos el 30%, preferiblemente al menos el 50%, más preferiblemente al menos el 70%, incluso más preferiblemente al menos el 90% del material que contiene almidón pase a través de un tamiz con una malla de 0,05-3,0 mm, preferiblemente una malla de 0,1-0,5 mm.In one embodiment, the starch-containing material is milled to reduce the particle size. In one embodiment, the particle size is reduced to between 0.05-3.0mm, preferably 0.1-0.5mm, or so that at least 30%, preferably at least 50%, more preferably at least 70%, even more preferably at least 90% of the starch-containing material passes through a sieve with a mesh size of 0.05-3.0 mm, preferably a mesh size of 0.1-0.5 mm .

La suspensión acuosa puede contener de 10-55% en peso de sólidos secos (DS), preferiblemente 25-45% en peso de sólidos secos (DS), más preferiblemente 30-40% en peso de sólidos secos (DS) de material que contiene almidón. Procedimientos de conversión de almidón convencionales, tales como procedimientos de licuefacción y sacarificación, se describen, p. ej., en la Patente de EE.UU. N° 3.912.590, los documentos EP 252730 y EP 063909.The aqueous suspension may contain 10-55 wt% dry solids (DS), preferably 25-45 wt% dry solids (DS), more preferably 30-40 wt% dry solids (DS) of material that contains starch. Conventional starch conversion processes, such as liquefaction and saccharification processes, are described, e.g. eg, in US Patent No. 3,912,590, EP 252730 and EP 063909.

En una realización, el procedimiento de conversión que degrada el almidón en componentes de hidratos de carbono de menor peso molecular, tales como azúcares o sustitutos de grasas, incluye una etapa de desramificación.In one embodiment, the conversion process that degrades starch into lower molecular weight carbohydrate components, such as sugars or fat substitutes, includes a debranching step.

En el caso de convertir almidón en un azúcar, el almidón se despolimeriza. Un procedimiento de despolimerización de este tipo consiste, p. ej., en una etapa de pretratamiento y dos o tres etapas de procedimiento consecutivas, es decir, un procedimiento de licuefacción, un procedimiento de sacarificación y, dependiendo del producto final deseado, un procedimiento de isomerización opcional.In the case of converting starch to a sugar, the starch is depolymerized. Such a depolymerization process consists, e.g. in a pretreatment step and two or three consecutive process steps, ie a liquefaction process, a saccharification process and, depending on the desired final product, an optional isomerization process.

Cuando el producto de azúcar final deseado es, p. ej., un jarabe con alto contenido en fructosa, el jarabe de dextrosa se puede convertir en fructosa. Después del procedimiento de sacarificación, el pH se incrementa a un valor en el intervalo de 6-8, p. ej., pH 7,5, y el calcio se elimina mediante intercambio iónico. El jarabe de dextrosa se convierte luego en jarabe de alto contenido en fructosa utilizando, p. ej., una glucosa isomerasa inmovilizada.When the final desired sugar product is e.g. For example, a high fructose syrup, dextrose syrup can be converted to fructose. After the saccharification process, the pH is increased to a value in the range of 6-8, eg. g., pH 7.5, and calcium is removed by ion exchange. The dextrose syrup is then converted to high fructose syrup using e.g. eg, an immobilized glucose isomerase.

Producción de Productos de FermentaciónProduction of Fermentation Products

Los azúcares fermentables (p. ej., dextrinas, monosacáridos, particularmente glucosa) se producen a partir de la sacarificación enzimática. Estos azúcares fermentables pueden purificarse adicionalmente y/o convertirse en productos azucarados útiles. Además, los azúcares se pueden utilizar como material de alimentación de la fermentación en un procedimiento de fermentación microbiana para producir productos finales, tales como alcohol (p. ej., etanol y butanol), ácidos orgánicos (p. ej.,, ácido succínico, 3-HP y ácido láctico), alcoholes de azúcar (p. ej., glicerol), compuestos intermedios del ácido ascórbico (p. ej., gluconato, 2-ceto-D-gluconato, 2,5-diceto-D-gluconato y ácido 2-ceto-L-glucónico), aminoácidos (p. ej.,, lisina), proteínas (p. ej., anticuerpos y fragmentos de los mismos). En una realización, los azúcares fermentables obtenidos durante las etapas del procedimiento de licuefacción se utilizan para producir alcohol y particularmente etanol. En la producción de etanol se utiliza comúnmente un procedimiento SSF, en el que las enzimas sacarificantes y los organismos fermentadores (p. ej., levadura) se añaden juntos y luego se llevan a cabo a una temperatura de 30-40°C.Fermentable sugars ( eg, dextrins, monosaccharides, particularly glucose) are produced from enzymatic saccharification. These fermentable sugars can be further purified and/or converted to useful sugar products. In addition, sugars can be used as a fermentation feedstock in a microbial fermentation process to produce end products such as alcohol ( eg, ethanol and butanol), organic acids ( eg, succinic acid , 3-HP, and lactic acid), sugar alcohols ( eg, glycerol), ascorbic acid intermediates ( eg, gluconate, 2-keto-D-gluconate, 2,5-diketo-D- gluconate and 2-keto-L-gluconic acid), amino acids ( eg, lysine), proteins ( eg, antibodies and fragments thereof). In one embodiment, the fermentable sugars obtained during the liquefaction process steps are used to produce alcohol and particularly ethanol. An SSF process is commonly used in ethanol production, in which saccharifying enzymes and fermenting organisms ( eg yeast) are added together and then carried out at a temperature of 30-40°C.

El organismo utilizado en la fermentación dependerá del producto final deseado. Típicamente, si el etanol es el producto final deseado, se utilizará levadura como organismo fermentador. En algunas realizaciones preferidas, el microorganismo productor de etanol es una levadura y específicamente Saccharomyces tal como cepas de S. cerevisiae (Patente de EE.UU. N° 4.316.956). Está disponible comercialmente una diversidad de S. cerevisiae y éstas incluyen, pero no se limitan a FALI (levadura de Fleischmann), SUPERSTART (Alltech), FERMIOL (DSM Specialties), RED STAR (Lesaffre) y levadura de alcohol Angel (Angel Yeast Company, China) . La cantidad de levadura inicial empleada en los métodos es una cantidad eficaz para producir una cantidad comercialmente significativa de etanol en una cantidad de tiempo adecuada, (p. ej.,, para producir al menos un 10% de etanol a partir de un sustrato que tiene entre 25-40% de DS en menos de 72 horas). Las células de levadura se suministran generalmente en cantidades de aproximadamente 104 a aproximadamente 1012 , y preferiblemente de aproximadamente 107 a aproximadamente 1010 recuento de levaduras viables por mL de caldo de fermentación. Después de añadir la levadura al macerado, esto se somete típicamente a fermentación durante aproximadamente 24-96 horas, p. ej., 35-60 horas. La temperatura está entre aproximadamente 26-34°C, típicamente a aproximadamente 32°C, y el pH es de pH 3-6, p. ej., alrededor de pH 4-5.The organism used in the fermentation will depend on the desired end product. Typically, if ethanol is the desired end product, yeast will be used as the fermenting organism. In some preferred embodiments, the ethanol-producing microorganism is a yeast and specifically Saccharomyces such as S. cerevisiae strains (US Patent No. 4,316,956). A variety of S. cerevisiae are commercially available and these include, but are not limited to FALI (Fleischmann's yeast), SUPERSTART (Alltech), FERMIOL (DSM Specialties), RED STAR (Lesaffre), and Angel alcohol yeast (Angel Yeast Company). , China) . The amount of initial yeast used in the methods is an amount effective to produce a commercially significant amount of ethanol in a suitable amount of time ( e.g., to produce at least 10% ethanol from a substrate that is between 25-40 % DS in less than 72 hours). The yeast cells are generally supplied in amounts of from about 104 to about 1012, and preferably from about 107 to about 1010 viable yeast counts per mL of fermentation broth. After the yeast is added to the mash, this is typically fermented for about 24-96 hours, e.g. eg, 35-60 hours. The temperature is between about 26-34°C, typically about 32°C, and the pH is pH 3-6, eg. eg, around pH 4-5.

La fermentación puede incluir, además de microorganismos fermentadores (p. ej., levadura), nutrientes y enzimas adicionales, incluyendo fitasas. El uso de levadura en la fermentación es bien conocido en la técnica.Fermentation may include, in addition to fermenting microorganisms ( eg, yeast), additional nutrients and enzymes, including phytases. The use of yeast in fermentation is well known in the art.

En realizaciones adicionales, el uso de microorganismos fermentadores apropiados, como se conoce en la técnica, puede resultar en un producto final de la fermentación que incluye, p. ej., glicerol, 1,3-propanodiol, gluconato, 2-ceto-D-gluconato, 2,5-diceto-D-gluconato, ácido 2-ceto-L-glucónico, ácido succínico, ácido láctico, aminoácidos y derivados de los mismos. Más específicamente, cuando el ácido láctico es el producto final deseado, puede utilizarse un Lactobacillus sp. (L. casei) cuando los productos finales deseados son glicerol o 1,3-propanodiol, se puede utilizar E. coli; y cuando los productos finales deseados son 2-ceto-D-gluconato, 2,5-diceto-D-gluconato y ácido 2-ceto-L-glucónico, se puede utilizar Pantoea citrea como el microorganismo fermentador. La lista arriba enumerada es solo ejemplos y un experto en la técnica conocerá un cierto número de microorganismos fermentadores que pueden utilizarse para obtener un producto final deseado.In further embodiments, the use of appropriate fermenting microorganisms, as known in the art, can result in a fermentation end product including, e.g. g., glycerol, 1,3-propanediol, gluconate, 2-keto-D-gluconate, 2,5-diketo-D-gluconate, 2-keto-L-gluconic acid, succinic acid, lactic acid, amino acids and derivatives of the same. More specifically, when lactic acid is the desired end product, a Lactobacillus sp. ( L. casei) when the desired end products are glycerol or 1,3-propanediol, E. coli can be used; and when 2-keto-D-gluconate, 2,5-diketo-D-gluconate and 2-keto-L-gluconic acid are the desired end products, Pantoea citrea can be used as the fermenting microorganism. The above listed list is exemplary only and one skilled in the art will be aware of a number of fermenting microorganisms that can be used to obtain a desired end product.

Procedimientos para producir productos de la fermentación a partir de material que contiene almidón no gelatinizadoProcedures for producing fermentation products from ungelatinized starch-containing material

La invención se refiere a procedimientos para producir productos de la fermentación a partir de material que contiene almidón sin gelatinización ( es decir, sin cocción) del material que contiene almidón (al que a menudo se alude como procedimiento de "hidrólisis de almidón bruto"). El producto de la fermentación, tal como etanol, se puede producir sin licuar la suspensión acuosa que contiene el material que contiene almidón y agua. En una realización, un procedimiento de la invención incluye sacarificar material que contiene almidón (p. ej., molido), p. ej., almidón granular, por debajo de la temperatura de gelatinización inicial, preferiblemente en presencia de alfa-amilasa y/o enzimas generadoras de fuentes de hidratos de carbono para producir azúcares que puedan ser fermentados en el producto de la fermentación por un organismo de fermentación adecuado. En esta realización, el producto de fermentación deseado, p. ej., etanol, se produce a partir de granos de cereales sin gelatinizar ( es decir, sin cocer), preferiblemente molidos, tales como maíz.The invention relates to processes for producing fermentation products from starch-containing material without gelatinizing ( ie without cooking) the starch-containing material (often referred to as a "crude starch hydrolysis" process). . The fermentation product, such as ethanol, can be produced without liquefying the aqueous suspension containing the starch-containing material and water. In one embodiment, a method of the invention includes saccharifying ( eg, ground) starch-containing material, e.g. g., granular starch, below the initial gelatinization temperature, preferably in the presence of alpha-amylase and/or carbohydrate source-generating enzymes to produce sugars that can be fermented into the fermentation product by a fermentation organism. proper fermentation. In this embodiment, the desired fermentation product, e.g. eg, ethanol, is produced from ungelatinized ( ie, uncooked) cereal grains, preferably ground, such as corn.

Por consiguiente, en un aspecto, la invención se refiere a procedimientos para producir un producto de fermentación a partir de material que contiene almidón, que comprende sacarificar y fermentar simultáneamente material que contiene almidón utilizando una fuente de hidratos de carbono que genera enzimas y un organismo fermentador a una temperatura por debajo de la temperatura de gelatinización inicial de dicho material que contiene almidón en presencia de una proteasa variante de la invención. La sacarificación y la fermentación también pueden estar separadas. Así, en otro aspecto, la invención se refiere a procedimientos de preparar productos de la fermentación, que comprende las siguientes etapas:Accordingly, in one aspect, the invention relates to processes for producing a fermentation product from starch-containing material, comprising simultaneously saccharifying and fermenting starch-containing material using an enzyme-generating carbohydrate source and an organism. fermenter at a temperature below the initial gelatinization temperature of said starch-containing material in the presence of a variant protease of the invention. Saccharification and fermentation can also be separate. Thus, in another aspect, the invention relates to processes for preparing fermentation products, comprising the following steps:

(i) sacarificar un material que contiene almidón a una temperatura por debajo de la temperatura de gelatinización inicial utilizando una enzima generadora de fuente de hidratos de carbono, p. ej., una glucoamilasa; y (i) saccharifying a starch-containing material at a temperature below the initial gelatinization temperature using a carbohydrate source-generating enzyme, e.g. eg, a glucoamylase; Y

(ii) fermentar utilizando un organismo de la fermentación;(ii) fermenting using a fermenting organism;

en donde la etapa (i) se lleva a cabo utilizando al menos una glucoamilasa y una proteasa variante de la invención. wherein step (i) is carried out using at least one glucoamylase and one variant protease of the invention.

En una realización, el organismo fermentador expresa la proteasa variante de la invención.In one embodiment, the fermenting organism expresses the variant protease of the invention.

En una realización, también se añade una alfa amilasa en la etapa (i). Las etapas (i) y (ii) pueden realizarse simultáneamente.In one embodiment, an alpha amylase is also added in step (i). Steps (i) and (ii) can be performed simultaneously.

El producto de la fermentación, p. ej., etanol, puede recuperarse opcionalmente después de la fermentación, p. ej., mediante destilación. Típicamente, la o las amilasas, tales como glucoamilasa(s) y/u otras enzimas generadoras de fuentes de hidratos de carbono, y/o alfa-amilasa(s), están presentes durante la fermentación. Ejemplos de glucoamilasas y otras enzimas generadoras de fuentes de hidratos de carbono incluyen glucoamilasas que hidrolizan almidón bruto. Ejemplos de alfa-amilasa(s) incluyen alfa-amilasas ácidas, tales como alfa-amilasas fúngicas ácidas. Ejemplos de organismos fermentadores incluyen levaduras, p. ej., una cepa de Saccharomyces cerevisiae. La expresión "temperatura de gelatinización inicial" significa la temperatura más baja a la que comienza la gelatinización del almidón. En general, el almidón calentado en agua comienza a gelatinizar entre aproximadamente 50°C y 75°C; la temperatura exacta de gelatinización depende del almidón específico y puede ser determinada fácilmente por el experto en la materia. Por lo tanto, la temperatura de gelatinización inicial puede variar de acuerdo con la especie vegetal, la variedad particular de la especie vegetal, así como con las condiciones de crecimiento. En el contexto de esta invención, la temperatura de gelatinización inicial de un material que contiene almidón dado se puede determinar como la temperatura a la que se pierde la birrefringencia en el 5% de los gránulos de almidón utilizando el método descrito por Gorinstein y Lii, 1992, Starch/Starke 44(12): 461-466. Antes de iniciar el procedimiento, se puede preparar una suspensión de material que contiene almidón, tal como almidón granulado, que tiene 10-55% p/p de sólidos secos (DS), preferiblemente 25-45% p/p de sólidos secos, más preferiblemente 30-40% p/p de sólidos secos de material que contiene almidón. La suspensión puede incluir agua y/o aguas de procedimiento, tales como vinaza (retroceso), agua de depuración, condensado o destilado del evaporador, agua de extracción lateral de destilación o agua de procedimiento de otras plantas de productos de la fermentación. Debido a que el procedimiento de la invención se lleva a cabo por debajo de la temperatura de gelatinización inicial y, por lo tanto, no tiene lugar un aumento significativo de la viscosidad, se pueden usar altos niveles de vinaza si se desea. En una realización, la suspensión acuosa contiene de aproximadamente 1 a aproximadamente 70% en vol., preferiblemente 15-60% en vol., especialmente de aproximadamente 30 a 50% en vol. de agua y/o aguas del procedimiento, tales como vinaza (retroceso), agua de lavado, condensado o destilado del evaporador, agua de extracción lateral de destilación o agua de procedimiento de otras plantas de productos de la fermentación, o combinaciones de los mismos, o similares. El material que contiene almidón se puede preparar reduciendo el tamaño de partícula, preferiblemente mediante molienda en seco o en húmedo, a 0,05 a 3,0 mm, preferiblemente 0,1-0,5 mm. Después de haber sido sometido a un procedimiento de la invención, al menos el 85%, al menos el 86%, al menos el 87%, al menos el 88%, al menos el 89%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, o preferiblemente al menos el 99% de los sólidos secos en el material que contiene almidón se convierten en un hidrolizado de almidón soluble. Un procedimiento en este aspecto de la invención se realiza a una temperatura por debajo de la temperatura de gelatinización inicial, lo que significa que la temperatura se encuentra típicamente en el intervalo entre 30-75°C, preferiblemente entre 45-60°C. En una realización preferida, el procedimiento se llevó a cabo a una temperatura de 25°C a 40°C, tal como de 28°C a 35°C, tal como de 30°C a 34°C, preferiblemente alrededor de 32°C. En una realización, el procedimiento se lleva a cabo de manera que el nivel de azúcar, tal como el nivel de glucosa, se mantenga a un nivel bajo, tal como por debajo del 6% p/p, tal como por debajo de aproximadamente el 3% p/p, tal como por debajo de aproximadamente 2% p/p, tal como por debajo de aproximadamente 1% p/p., tal como por debajo de aproximadamente 0,5% p/p, o por debajo de 0,25% p/p, tal como por debajo de aproximadamente 0,1% p/p. Niveles bajos de azúcar de este tipo se pueden lograr simplemente empleando cantidades ajustadas de enzima y organismo fermentador. Una persona experta en la técnica puede determinar fácilmente qué dosis/cantidades de enzima y organismo fermentador utilizar. Las cantidades empleadas de enzima y organismo fermentador también pueden seleccionarse para mantener bajas concentraciones de maltosa en el caldo de fermentación. Por ejemplo, el nivel de maltosa puede mantenerse por debajo de aproximadamente 0,5% p/p, tal como por debajo de aproximadamente 0,2% p/p. El procedimiento de la invención se puede llevar a cabo a un pH de aproximadamente 3 y 7, preferiblemente de pH 3,5 a 6, o más preferiblemente de pH 4 a 5. En una realización, la fermentación está en curso durante 6 a 120 horas, en particular 24 a 96 horas.The fermentation product, e.g. eg ethanol, can optionally be recovered after fermentation, e.g. g., by distillation. Typically, amylase(s), such as glucoamylase(s) and/or other carbohydrate source-generating enzymes, and/or alpha-amylase(s), are present during fermentation. Examples of glucoamylases and other carbohydrate source-generating enzymes include glucoamylases that hydrolyze crude starch. Examples of alpha-amylase(s) include acid alpha-amylases, such as fungal acid alpha-amylases. Examples of fermentative organisms include yeasts, e.g. eg, a strain of Saccharomyces cerevisiae. The term "initial gelatinization temperature" means the lowest temperature at which starch gelatinization begins. In general, starch heated in water begins to gelatinize between about 50°C and 75°C; the exact gelatinization temperature depends on the specific starch and can be readily determined by those skilled in the art. Therefore, the initial gelatinization temperature may vary according to the species. plant, the particular variety of the plant species, as well as the growing conditions. In the context of this invention, the initial gelatinization temperature of a given starch-containing material can be determined as the temperature at which birefringence is lost in 5% of the starch granules using the method described by Gorinstein and Lii, 1992, Starch/Starke 44(12): 461-466. Before starting the process, a suspension of starch-containing material can be prepared, such as granulated starch, having 10-55% w/w dry solids (DS), preferably 25-45% w/w dry solids, more preferably 30-40% w/w dry solids of starch-containing material. The slurry may include water and/or process waters, such as stillage (backflow), scrubbing water, evaporator condensate or distillate, distillation side draw water, or process water from other fermentation products plants. Because the process of the invention is carried out below the initial gelatinization temperature and therefore no significant increase in viscosity occurs, high levels of vinasse can be used if desired. In one embodiment, the aqueous suspension contains from about 1 to about 70 vol.%, preferably 15-60 vol.%, especially from about 30 to 50 vol. of water and/or process waters, such as stillage (backflow), wash water, evaporator condensate or distillate, distillation side draw water, or process water from other fermentation product plants, or combinations thereof , or the like. The starch-containing material can be prepared by reducing the particle size, preferably by wet or dry milling, to 0.05 to 3.0 mm, preferably 0.1-0.5 mm. After having undergone a procedure of the invention, at least 85%, at least 86%, at least 87%, at least 88%, at least 89%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or preferably at least 99% of the dry solids in the starch-containing material are converted to a soluble starch hydrolyzate. A process in this aspect of the invention is carried out at a temperature below the initial gelatinization temperature, which means that the temperature is typically in the range between 30-75°C, preferably between 45-60°C. In a preferred embodiment, the process is carried out at a temperature of from 25°C to 40°C, such as from 28°C to 35°C, such as from 30°C to 34°C, preferably around 32°C. c. In one embodiment, the process is carried out such that the sugar level, such as the glucose level, is maintained at a low level, such as below 6% w/w, such as below about 3% w/w, such as below about 2% w/w, such as below about 1% w/w, such as below about 0.5% w/w, or below 0 0.25% w/w, such as below about 0.1% w/w. Such low sugar levels can be achieved simply by employing adjusted amounts of enzyme and fermenting organism. A person skilled in the art can easily determine what dose/amounts of enzyme and fermenting organism to use. The amounts of enzyme and fermenting organism employed can also be selected to maintain low maltose concentrations in the fermentation broth. For example, the maltose level can be kept below about 0.5% w/w, such as below about 0.2% w/w. The process of the invention can be carried out at a pH of from about 3 to 7, preferably from pH 3.5 to 6, or more preferably from pH 4 to 5. In one embodiment, the fermentation is ongoing for 6 to 120 hours, in particular 24 to 96 hours.

Procedimientos para producir productos de la fermentación a partir de material que contiene almidón gelatinizadoProcedures for producing fermentation products from gelatinized starch-containing material

En este aspecto, la invención se refiere a procedimientos para producir productos de la fermentación, especialmente etanol, a partir de material que contiene almidón, procedimiento que incluye una etapa de licuefacción y etapas de sacarificación y fermentación realizadas secuencial o simultáneamente. En consecuencia,, la invención se refiere a un procedimiento para preparar un producto de la fermentación a partir de material que contiene almidón, que comprende las etapas de:In this aspect, the invention relates to processes for producing fermentation products, especially ethanol, from starch-containing material, which process includes a liquefaction step and saccharification and fermentation steps performed sequentially or simultaneously. Consequently, the invention relates to a process for preparing a fermentation product from starch-containing material, comprising the steps of:

(a) licuar material que contiene almidón en presencia de una alfa-amilasa;(a) liquifying starch-containing material in the presence of an alpha-amylase;

(b) sacarificar el material licuado obtenido en la etapa (a) utilizando una enzima generadora de una fuente de hidratos de carbono;(b) saccharifying the liquefied material obtained in step (a) using an enzyme that generates a source of carbohydrates;

(c) fermentar utilizando un organismo fermentador;(c) fermenting using a fermenting organism;

en donde una proteasa variante de la invención está presente durante la etapa b) o c).wherein a variant protease of the invention is present during step b) or c).

En una realización, el organismo fermentador expresa la proteasa variante de la invención.In one embodiment, the fermenting organism expresses the variant protease of the invention.

El producto de la fermentación, tal como especialmente etanol, puede recuperarse opcionalmente después de la fermentación, p. ej., mediante destilación. El organismo fermentador es preferiblemente levadura, preferiblemente una cepa de Saccharomyces cerevisiae. En un aspecto particular, el procedimiento de la invención comprende, además, antes de la etapa (a), las etapas de:The fermentation product, such as especially ethanol, can optionally be recovered after the fermentation, e.g. g., by distillation. The fermenting organism is preferably yeast, preferably a strain of Saccharomyces cerevisiae. In a particular aspect, the process of the invention further comprises, before step (a), the steps of:

x) reducir el tamaño de partícula del material que contiene almidón, preferiblemente moliendo (p. ej., utilizando un molino de martillos);x) reducing the particle size of the starch-containing material, preferably by grinding (eg using a hammer mill);

y) formar una suspensión que comprende el material que contiene almidón y agua. y) forming a suspension comprising the starch-containing material and water.

En una realización, el tamaño de partícula es más pequeño que un tamiz n° 7, p. ej., un tamiz n° 6. En los procedimientos convencionales de la técnica anterior se utiliza habitualmente un tamiz n° 7. La suspensión acuosa puede contener de 10 a 55, p. ej., 25-45 y 30-40% p/p de sólidos secos (DS) de material que contiene almidón. La suspensión se calienta por encima de la temperatura de gelatinización y se puede añadir una variante de alfa-amilasa para iniciar la licuefacción (dilución). En una realización, la suspensión se puede cocer a chorro para gelatinizar adicionalmente la suspensión antes de someterla a alfa-amilasa en la etapa (a). La licuefacción se puede llevar a cabo, en una realización, como un procedimiento en suspensión caliente de tres etapas. La suspensión se calienta entre 60-95°C, preferiblemente entre 70-90°C, tal como preferiblemente entre 80-85°C a pH 4-6, preferiblemente 4,5-5,5, y variante de alfa-amilasa, opcionalmente junto con una pululanasa. y/o proteasa, preferiblemente metaloproteasa, se añaden para iniciar la licuefacción (dilución). En una realización, la suspensión se puede entonces cocer a chorro a una temperatura entre 95-140°C, preferiblemente 100-135°C, tal como 105-125°C, durante aproximadamente 1-15 minutos, preferiblemente durante aproximadamente 3-10 minutos, especialmente alrededor de aproximadamente 5 minutos. La suspensión se enfría a 60-95°C y se añade más variante de alfa-amilasa y opcionalmente variante de pululanasa y/o proteasa, preferiblemente metaloproteasa, para finalizar la hidrólisis (licuefacción secundaria). El procedimiento de licuefacción se lleva a cabo habitualmente a pH 4,0-6, en particular a un pH de 4,5 a 5,5. La etapa de sacarificación (b) se puede llevar a cabo utilizando condiciones bien conocidas en la técnica. Por ejemplo, un procedimiento de sacarificación completo puede durar de aproximadamente 24 a aproximadamente 72 horas, sin embargo, es habitual hacer solo una pre-sacarificación de típicamente 40-90 minutos a una temperatura entre 30-65°C, típicamente de aproximadamente 60°C, seguida de sacarificación completa durante la fermentación en un procedimiento simultáneo de sacarificación y fermentación (procedimiento SSF). La sacarificación se lleva a cabo típicamente a una temperatura de 20-75°C, preferiblemente de 40-70°C, típicamente alrededor de 60°C, y a un pH entre 4 y 5, normalmente a aproximadamente pH 4,5. El procedimiento más ampliamente utilizado para producir un producto de la fermentación, especialmente etanol, es un procedimiento de sacarificación y fermentación simultánea (SSF), en el que no hay una fase de retención para la sacarificación, lo que significa que pueden sumarse un organismo fermentador, tal como la levadura, y enzima o enzimas. La SSF se puede llevar a cabo típicamente a una temperatura de 25°C a 40°C, tal como de 28°C a 35°C, tal como de 30°C a 34°C, preferiblemente alrededor de aproximadamente 32°C. En una realización, la fermentación se lleva a cabo durante 6 a 120 horas, en particular 24 a 96 horas.In one embodiment, the particle size is smaller than a #7 sieve, eg. eg, a No. 6 sieve. A No. 7 sieve is commonly used in conventional prior art processes. The slurry may contain from 10 to 55, mp. eg, 25-45 and 30-40% w/w dry solids (DS) of starch-containing material. The suspension is heated above the gelatinization temperature and an alpha-amylase variant can be added to initiate liquefaction (dilution). In one embodiment, the suspension may be jet-cooked to further gelatinize the suspension prior to subjecting it to alpha-amylase in step (a). The liquefaction can be carried out, in one embodiment, as a three-stage hot slurry process. The suspension is heated to 60-95°C, preferably 70-90°C, such as preferably 80-85°C at pH 4-6, preferably 4.5-5.5, and alpha-amylase variant, optionally together with a pullulanase. and/or protease, preferably metalloprotease, are added to initiate liquefaction (dilution). In one embodiment, the suspension may then be jet-cooked at a temperature between 95-140°C, preferably 100-135°C, such as 105-125°C, for about 1-15 minutes, preferably about 3-10 minutes. minutes, especially around about 5 minutes. The suspension is cooled to 60-95°C and more alpha-amylase variant and optional pullulanase variant and/or protease, preferably metalloprotease, are added to complete the hydrolysis (secondary liquefaction). The liquefaction process is usually carried out at pH 4.0-6, in particular at pH 4.5 to 5.5. Saccharification step (b) can be carried out using conditions well known in the art. For example, a complete saccharification process can last from about 24 to about 72 hours, however, it is usual to do only a pre-saccharification of typically 40-90 minutes at a temperature between 30-65°C, typically about 60°C. C, followed by complete saccharification during fermentation in a simultaneous saccharification and fermentation process (SSF process). Saccharification is typically carried out at a temperature of 20-75°C, preferably 40-70°C, typically about 60°C, and at a pH between 4 and 5, usually about pH 4.5. The most widely used process for producing a fermentation product, especially ethanol, is a simultaneous saccharification and fermentation (SSF) process, in which there is no holding phase for saccharification, meaning that a fermenting organism can be added. , such as yeast, and enzyme(s). SSF can typically be carried out at a temperature of 25°C to 40°C, such as 28°C to 35°C, such as 30°C to 34°C, preferably about 32°C. In one embodiment, the fermentation is carried out for 6 to 120 hours, in particular 24 to 96 hours.

Glucoamilasa Presente y/o Añadida En La Sacarificación y/o La FermentaciónGlucoamylase Present and/or Added in Saccharification and/or Fermentation

La enzima generadora de la fuente de hidratos de carbono presente durante la sacarificación puede ser, en una realización, una glucoamilasa. Una glucoamilasa está presente y/o se añade en la sacarificación y/o la fermentación, preferiblemente sacarificación y fermentación simultáneas (SSF), en un procedimiento de la invención (es decir, sacarificación y fermentación de material de almidón no gelatinizado o gelatinizado).The carbohydrate source-generating enzyme present during saccharification may, in one embodiment, be a glucoamylase. A glucoamylase is present and/or added in the saccharification and/or fermentation, preferably simultaneous saccharification and fermentation (SSF), in a process of the invention (ie, saccharification and fermentation of ungelatinized or gelatinized starch material).

En una realización, la glucoamilasa presente y/o añadida en la sacarificación y/o fermentación es de origen fúngico, preferiblemente de una cepa de Aspergillus, preferiblemente A. niger, A. awamori, or A. oryzae; o una cepa de Trichoderma, preferiblemente T. reesei; o una cepa de Talaromyces, preferiblemente T. emersonii o una cepa de Trametes, preferiblemente T. cingulata, o una cepa de Pycnoporus, preferiblemente P. sanguineus, o una cepa de Gloeophyllum,, tales como G. serpiarium o G. trabeum, o una cepa de Nigrofomes. In one embodiment, the glucoamylase present and/or added in the saccharification and/or fermentation is of fungal origin, preferably from an Aspergillus strain, preferably A. niger, A. awamori, or A. oryzae; or a strain of Trichoderma, preferably T. reesei; or a Talaromyces strain, preferably T. emersonii or a Trametes strain, preferably T. cingulata, or a Pycnoporus strain, preferably P. sanguineus, or a Gloeophyllum strain, such as G. serpiarium or G. trabeum, or a strain of Nigrofomes.

En una realización, la glucoamilasa se deriva de Trametes, tal como una cepa de Trametes cingulata, tal como la que se muestra en la SEQ ID NO: 4 en esta memoria.In one embodiment, the glucoamylase is derived from Trametes, such as a Trametes cingulata strain, such as that shown in SEQ ID NO: 4 herein.

En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 4 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 4 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p.(ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 4 en esta memoria.e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 4 herein.

En una realización, la glucoamilasa se deriva de Talaromyces, tal como una cepa de Talaromyces emersonii, tal como la que se muestra en la SEQ ID NO: 5 en esta memoria.In one embodiment, the glucoamylase is derived from Talaromyces, such as a Talaromyces emersonii strain, such as that shown in SEQ ID NO: 5 herein.

En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 5 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 5 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. (ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 5 en esta memoria. e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 5 herein.

En una realización, la glucoamilasa se deriva de una cepa del género Pycnoporus, en particular una cepa de Pycnoporus sanguineus descrita en el documento WO 2011/066576 (SEQ ID NOs 2, 4 o 6), tal como la que se muestra como SEQ ID NO: 4 en el documento WO 2011/066576.In one embodiment, the glucoamylase is derived from a strain of the genus Pycnoporus, in particular a strain of Pycnoporus sanguineus described in WO 2011/066576 (SEQ ID NOs 2, 4 or 6), such as that shown as SEQ ID NO: 4 in WO 2011/066576.

En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 6 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 6 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. (ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 6 en esta memoria. e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 6 herein.

En una realización, la glucoamilasa se deriva de una cepa del género Gloeophyllum, tal como una cepa de Gloeophyllum sepiarium o Gloeophyllum trabeum, en particular una cepa de Gloeophyllum, tal como se describe en el documento WO 2011/068803 (SEQ ID NO: 2, 4, 6, 8, 10, 12, 14 o 16). En una realización preferida, la glucoamilasa es Gloeophyllum sepiarium mostrada en SeQ iD No : 2 en el documento WO 2011/068803 o SEQ ID NO: 7 en esta memoria.In one embodiment, the glucoamylase is derived from a strain of the genus Gloeophyllum, such as a strain of Gloeophyllum sepiarium or Gloeophyllum trabeum, in particular a strain of Gloeophyllum, as described in WO 2011/068803 (SEQ ID NO: 2 , 4, 6, 8, 10, 12, 14 or 16). In a preferred embodiment, the glucoamylase is Gloeophyllum sepiarium shown in SeQ ID No: 2 in WO 2011/068803 or SEQ ID NO: 7 herein.

En una realización, la glucoamilasa se deriva de Gloeophyllum serpiarium, tal como la que se muestra en la SEQ ID NO: 7 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:In one embodiment, the glucoamylase is derived from Gloeophyllum serpiarium, such as that shown in SEQ ID NO: 7 herein. In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 7 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 7 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. (ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 7 en esta memoria. e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 7 herein.

En otra realización, la glucoamilasa se deriva de Gloeophyllum trabeum tal como la que se muestra en la SEQ ID NO: 8 en esta memoria. En una realización, la glucoamilasa se selecciona del grupo que consiste en:In another embodiment, the glucoamylase is derived from Gloeophyllum trabeum such as that shown in SEQ ID NO: 8 herein. In one embodiment, the glucoamylase is selected from the group consisting of:

(i) una glucoamilasa que comprende el polipéptido de SEQ ID NO: 8 en esta memoria;(i) a glucoamylase comprising the polypeptide of SEQ ID NO: 8 herein;

(ii) una glucoamilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. (ii) a glucoamylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 8 en esta memoria. e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 8 herein.

En una realización, la glucoamilasa se deriva de una cepa del género Nigrofomes,, en particular una cepa de Nigrofomes sp. descrita en el documento WO 2012/064351.In one embodiment, the glucoamylase is derived from a strain of the genus Nigrofomes, in particular a strain of Nigrofomes sp. described in WO 2012/064351.

En una realización, las glucoamilasas pueden añadirse a la sacarificación y/o fermentación en una cantidad de 0,0001 -20 AGU/g DS, preferiblemente 0,001 -10 AGU/g DS, especialmente entre 0,01 -5 AGU/g DS, tal como 0,1-2 AGU/g DS. Composiciones disponibles comercialmente que comprenden glucoamilasa incluyen AMG 200L; AMG 300 L; SAN™ SUPER, SAN™ EXTRA L, SPIRIZYME™ PLUS, SPIRIZYME™ FUEL, SPIRIZYME™ B4U, SPIRIZYME™ ULTRA, SPIRIZYME™ EXCEL y AMG™ E (de Novozymes A/S); OPTIDEX™ 300, GC480, GC417 (de DuPont.); AMIGASE™ y AMIGASE™ PLUS (de DSM); G-ZYME™ G900, G-ZYME™ y G990 ZR (de DuPont).In one embodiment, glucoamylases can be added to the saccharification and/or fermentation in an amount of 0.0001-20 AGU/g DS, preferably 0.001-10 AGU/g DS, especially between 0.01-5 AGU/g DS, such as 0.1-2 AGU/g DS. Commercially available compositions comprising glucoamylase include AMG 200L; AMG 300L; SAN™ SUPER, SAN™ EXTRA L, SPIRIZYME™ PLUS, SPIRIZYME™ FUEL, SPIRIZYME™ B4U, SPIRIZYME™ ULTRA, SPIRIZYME™ EXCEL and AMG™ E (from Novozymes A/S); OPTIDEX™ 300, GC480, GC417 (from DuPont.); AMIGASE™ and AMIGASE™ PLUS (from DSM); G-ZYME™ G900, G-ZYME™ and G990 ZR (from DuPont).

De acuerdo con una realización preferida de la invención, la glucoamilasa está presente y/o se añade en la sacarificación y/o la fermentación en combinación con una alfa-amilasa. A continuación se describen ejemplos de alfa-amilasa adecuada.According to a preferred embodiment of the invention, the glucoamylase is present and/or added in the saccharification and/or the fermentation in combination with an alpha-amylase. Examples of suitable alpha-amylase are described below.

Alfa-Amilasa Presente y/o Añadida En La Sacarificación y/o La FermentaciónAlpha-Amylase Present and/or Added in Saccharification and/or Fermentation

En una realización, una alfa-amilasa está presente y/o se añade en la sacarificación y/o la fermentación en los procedimientos de la invención. En una realización preferida, la alfa-amilasa es de origen fúngico o bacteriano. En una realización preferida, la alfa-amilasa es una alfa-amilasa fúngica estable a los ácidos. Una alfa-amilasa estable al ácido fúngico es una alfa-amilasa que tiene actividad en el intervalo de pH de 3,0 a 7,0 y preferiblemente en el intervalo de pH de 3,5 a 6,5, incluida la actividad a un pH de aproximadamente 4,0, 4,5, 5,0, 5,5 y 6,0.In one embodiment, an alpha-amylase is present and/or added in the saccharification and/or fermentation processes of the invention. In a preferred embodiment, the alpha-amylase is of fungal or bacterial origin. In a preferred embodiment, the alpha-amylase is an acid-stable fungal alpha-amylase. A fungal acid-stable alpha-amylase is an alpha-amylase having activity in the pH range of 3.0 to 7.0 and preferably in the pH range of 3.5 to 6.5, including activity at a pH of approximately 4.0, 4.5, 5.0, 5.5 and 6.0.

En una realización preferida, la alfa-amilasa presente y/o añadida en la sacarificación y/o fermentación se deriva de una cepa del género Rhizomucor, preferiblemente una cepa de Rhizomucorpusillus, tal como la que se muestra en la SEQ ID NO: 3 en el documento WO 2013/006756, tal como un híbrido de alfa-amilasa de Rhizomucor pusillus que tiene un enlazador de Aspergillus nigery un dominio de unión a almidón, tal como el que se muestra en la SEQ ID NO: 9 en esta memoria, o una variante del mismo.In a preferred embodiment, the alpha-amylase present and/or added in the saccharification and/or fermentation is derived from a strain of the Rhizomucor genus, preferably a Rhizomucorpusillus strain, such as that shown in SEQ ID NO: 3 in WO 2013/006756, such as a Rhizomucor pusillus alpha-amylase hybrid that has an Aspergillus niger linker and starch-binding domain, such as that shown in SEQ ID NO: 9 herein, or a variant thereof.

En una realización, la alfa-amilasa está presente y/o se añade en la sacarificación y/o la fermentación se selecciona del grupo que consiste en:In one embodiment, the alpha-amylase is present and/or added in the saccharification and/or fermentation is selected from the group consisting of:

(i) una alfa-amilasa que comprende el polipéptido de SEQ ID NO: 9 en esta memoria;(i) an alpha-amylase comprising the polypeptide of SEQ ID NO: 9 herein;

(ii) una alfa-amilasa que comprende una secuencia de aminoácidos que tiene al menos 60%, al menos 70%, p. (ii) an alpha-amylase comprising an amino acid sequence having at least 60%, at least 70%, e.g.

ej., al menos 75%, al menos 80%, al menos 85%, al menos 90%, al menos 91%, al menos 92%, al menos 93%, al menos 94%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria. e.g., at least 75%, at least 80%, at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96%, at least 97%, at least 98%, or at least 99% identity to the polypeptide of SEQ ID NO: 9 herein.

En una realización preferida, la alfa-amilasa es una variante de la alfa-amilasa mostrada en SEQ ID NO: 9 que tiene al menos una de las siguientes sustituciones o combinaciones de sustituciones: D165M; Y141W; Y141R; K136F; K192R; P224A; P224R; S123H Y141W; G20S Y141W; A76G Y141W; G128D Y141W; G128D D143N; P219C Y141W; N142D D143N; Y141W K192R; Y141W D143N; Y141W N383R; Y141W P219C A265C; Y141W N142D D143N; Y141W K192R V410A; G128D Y141W D143N; Y141W D143N P219C; Y141W D143N K192R; G128D D143N K192R; Y141W D143N K192R P219C; G128D Y141W D143N K192R; o G128D Y141W D143N K192R P219C (utilizando la SEQ ID NO: 9 para la numeración).In a preferred embodiment, the alpha-amylase is a variant of the alpha-amylase shown in SEQ ID NO: 9 having at least one of the following substitutions or combinations of substitutions: D165M; Y141W; Y141R; K136F; K192R; P224A; P224R; S123H Y141W; G20S Y141W; A76G Y141W; G128D Y141W; G128D D143N; P219C Y141W; N142D D143N; Y141W K192R; Y141W D143N; Y141W N383R; Y141W P219C A265C; Y141W N142D D143N; Y141W K192R V410A; G128D Y141W D143N; Y141W D143N P219C; Y141W D143N K192R; G128D D143N K192R; Y141W D143N K192R P219C; G128D Y141W D143N K192R; or G128D Y141W D143N K192R P219C (using SEQ ID NO: 9 for numbering).

En una realización, la alfa-amilasa se deriva de un Rhizomucor pusillus con un enlazador de glucoamilasa de Aspergillus niger y un dominio de unión a almidón (SBD), preferiblemente descrito como SEC ID NO: 9 en esta memoria, preferiblemente con una o más de las siguientes sustituciones: G128D, D143N, preferiblemente G128D D143N (utilizando SEQ ID NO: 9 para numeración), y en donde la variante de alfa-amilasa presente y/o añadida en la sacarificación y/o la fermentación tiene al menos 75% de identidad, preferiblemente al menos 80%, más preferiblemente al menos 85%, más preferiblemente al menos 90%, más preferiblemente al menos 91%, más preferiblemente al menos 92%, incluso más preferiblemente al menos 93%, lo más preferiblemente al menos 94%, e incluso lo más preferiblemente al menos 95%, tal como incluso al menos 96%, al menos 97% , al menos 98%, al menos 99%, pero menos del 100% de identidad con el polipéptido de SEQ ID NO: 9 en esta memoria.In one embodiment, the alpha-amylase is derived from a Rhizomucor pusillus with an Aspergillus niger glucoamylase linker and starch-binding domain (SBD), preferably described as SEQ ID NO: 9 herein, preferably with one or more of the following substitutions: G128D, D143N, preferably G128D D143N (using SEQ ID NO: 9 for numbering), and wherein the alpha-amylase variant present and/or added in the saccharification and/or fermentation is at least 75% of identity, preferably at least 80%, more preferably at least 85%, more preferably at least 90%, more preferably at least 91%, more preferably at least 92%, even more preferably at least 93%, most preferably at least 94%, and even more preferably at least 95%, such as even at least 96%, at least 97%, at least 98%, at least 99%, but less than 100% identity to the polypeptide of SEQ ID NO : 9 in this memory.

En una realización preferida, la relación entre glucoamilasa y alfa-amilasa presente y/o añadida durante la sacarificación y/o fermentación puede estar preferiblemente en el intervalo de 500:1 a 1:1, tal como de 250:1 a 1:1, tal como como de 100:1 a 1: 1, tal como de 100: 2 a 100:50, tal como de 100:3 a 100:70.In a preferred embodiment, the ratio of glucoamylase to alpha-amylase present and/or added during saccharification and/or fermentation may preferably be in the range of 500:1 to 1:1, such as 250:1 to 1:1. such as 100:1 to 1:1, such as 100:2 to 100:50, such as 100:3 to 100:70.

Materiales que Contienen AlmidónStarch-Containing Materials

Se puede usar cualquier material de partida que contenga almidón adecuado en un procedimiento de la presente invención. El material de partida se selecciona generalmente en base al producto de fermentación deseado. Ejemplos de materiales de partida que contienen almidón, adecuados para uso en los procedimientos de la presente invención, incluyen cebada, habas, mandioca, cereales, maíz, milo, guisantes, patatas, arroz, centeno, sagú, sorgo, batatas, tapioca, trigo. y cereales integrales o cualquier mezcla de los mismos. El material que contiene almidón también puede ser un tipo de maíz y cebada céreo o no céreo. En una realización preferida, el material que contiene almidón es maíz. En una realización preferida, el material que contiene almidón es trigo.Any suitable starch-containing starting material may be used in a process of the present invention. The starting material is generally selected based on the desired fermentation product. Examples of starch-containing starting materials suitable for use in the methods of the present invention include barley, lima beans, cassava, cereals, corn, milo, peas, potatoes, rice, rye, sago, sorghum, sweet potatoes, tapioca, wheat . and whole grains or any mixture thereof. The starch-containing material may also be a waxy or non-waxy type of corn and barley. In a preferred embodiment, the starch-containing material is corn. In a preferred embodiment, the starch-containing material is wheat.

Productos de la FermentaciónFermentation Products

La expresión "producto de fermentación" significa un producto producido mediante un método o procedimiento que incluye la fermentación utilizando un organismo fermentador. Los productos de fermentación incluyen alcoholes (p. ej., etanol, metanol, butanol); ácidos orgánicos (p. ej., ácido cítrico, ácido acético, ácido itacónico, ácido láctico, ácido succínico, ácido glucónico); cetonas (p. ej., acetona); aminoácidos (p. ej., ácido glutámico); gases (p. ej., H2 y CO2 ); antibióticos (p. ej., penicilina y tetraciclina); enzimas; vitaminas (p. ej., riboflavina, B12 , betacaroteno); y hormonas. En una realización preferida, el producto de fermentación es etanol, p. ej., etanol combustible; etanol bebible, es decir, bebidas espirituosas neutras potables; o etanol industrial o productos utilizados en la industria del alcohol consumible (p. ej., cerveza y vino), industria láctea (p. ej., productos lácteos fermentados), industria del cuero e industria del tabaco. Tipos de cerveza preferidos comprenden ales, stouts, porters, lagers, bitters, licores de malta, happoushu, cerveza con alto contenido de alcohol, cerveza con bajo contenido de alcohol, cerveza con bajo contenido de calorías o cerveza light. En una realización preferida, el producto de fermentación es etanol.The term "fermentation product" means a product produced by a method or process that includes fermentation using a fermenting organism. Fermentation products include alcohols ( eg, ethanol, methanol, butanol); organic acids ( eg, citric acid, acetic acid, itaconic acid, lactic acid, succinic acid, gluconic acid); ketones ( eg, acetone); amino acids ( eg, glutamic acid); gases ( eg, H 2 and CO 2 ); antibiotics ( eg, penicillin and tetracycline); enzymes; vitamins (e.g., riboflavin, B12, beta - carotene..); and hormones. In a preferred embodiment, the fermentation product is ethanol, e.g. eg, fuel ethanol; drinkable ethanol, ie drinkable neutral spirits; o Industrial ethanol or products used in the consumable alcohol industry ( eg, beer and wine), dairy industry ( eg, fermented milk products), leather industry, and tobacco industry. Preferred types of beer include ales, stouts, porters, lagers, bitters, malt spirits, happoushu, high-alcohol beer, low-alcohol beer, low-calorie beer, or light beer. In a preferred embodiment, the fermentation product is ethanol.

Organismos FermentadoresFermenting Organisms

La expresión «organismo fermentador» se refiere a cualquier organismo, incluyendo organismos bacterianos y fúngicos, tales como levaduras y hongos filamentosos, adecuados para producir un producto de la fermentación deseado. Organismos de fermentación adecuados son capaces de fermentar, es decir, convertir, azúcares fermentables, tales como arabinosa, fructosa, glucosa, maltosa, manosa o xilosa, directa o indirectamente en el producto de la fermentación deseado. The term "fermenting organism" refers to any organism, including bacterial and fungal organisms, such as yeasts and filamentous fungi, suitable for producing a desired fermentation product. Suitable fermentation organisms are capable of fermenting, ie converting, fermentable sugars, such as arabinose, fructose, glucose, maltose, mannose or xylose, directly or indirectly to the desired fermentation product.

Ejemplos de organismos termentadores incluyen organismos fúngicos tales como la levadura. Levaduras preferidas incluyen cepas de Saccharomyces, en particular Saccharomyces cerevisiae o Saccharomyces uvarum; cepas de Pichia, en particular Pichia stipitis tales como Pichia stipitis CBS 5773 o Pichia pastoris;cepas de Candida, en particular Candida arabinofermentans, Candida boidinii, Candida diddensii, Candida shehatae, Candida sonorensis, Candida tropicalis, o Candida utilis. Otros organismos termentadores incluyen cepas de Hansenula, en particular Hansenula anomala o Hansenula polymorpha; cepas de Kluyveromyces, en particular Kluyveromyces fragilis o Kluyveromyces marxianus; y cepas de Schizosaccharomyces, en particular Schizosaccharomyces pombe. Examples of fermentative organisms include fungal organisms such as yeast. Preferred yeasts include strains of Saccharomyces, in particular Saccharomyces cerevisiae or Saccharomyces uvarum; Pichia strains, in particular Pichia stipitis such as Pichia stipitis CBS 5773 or Pichia pastoris; Candida strains, in particular Candida arabinofermentans, Candida boidinii, Candida diddensii, Candida shehatae, Candida sonorensis, Candida tropicalis, or Candida utilis. Other fermentative organisms include strains of Hansenula, particularly Hansenula anomala or Hansenula polymorpha; Kluyveromyces strains, in particular Kluyveromyces fragilis or Kluyveromyces marxianus; and strains of Schizosaccharomyces, in particular Schizosaccharomyces pombe.

Organismos termentadores bacterianos preferidos incluyen cepas de Escherichia, en particular Escherichia coli, cepas de Zymomonas, en particular Zymomonas mobilis, cepas de Zymobacter, en particular Zymobactorpalmae, cepas de Klebsiella en particular Klebsiella oxytoca, cepas de Leuconostoc, en particular Leuconostoc mesenteroides, cepas de Clostridium, en particular Clostridium butyricum, cepas de Enterobacter, en particular Enterobacteraerogenes, y cepas de Thermoanaerobacter, en particular Thermoanaerobacter BG1L1 (Appl. Microbiol. Biotech. 77: 61-86), Thermoanarobacter ethanolicus, Thermoanaerobacter mathranii, o Thermoanaerobacter thermosaccharolyticum. También se prevén cepas de Lactobacillus, así como cepas de Corynebacterium glutamicum R, Bacillus thermoglucosidaisus, y Geobacillus thermoglucosidasius. Preferred bacterial spoilage organisms include Escherichia strains, in particular Escherichia coli, Zymomonas strains, in particular Zymomonas mobilis, Zymobacter strains, in particular Zymobactorpalmae, Klebsiella strains in particular Klebsiella oxytoca, Leuconostoc strains, in particular Leuconostoc mesenteroides, Clostridium, in particular Clostridium butyricum, Enterobacter strains, in particular Enterobacteraerogenes, and Thermoanaerobacter strains, in particular Thermoanaerobacter BG1L1 (Appl. Microbiol. Biotech. 77: 61-86), Thermoanarobacter ethanolicus, Thermoanaerobacter mathranii, or Thermoanaerobacter thermosaccharolyticum. Strains of Lactobacillus are also envisioned, as well as strains of Corynebacterium glutamicum R, Bacillus thermoglucosidaisus, and Geobacillus thermoglucosidasius.

En una realización, el organismo termentador es un organismo termentador de azúcar C6, tal como una cepa de, p. ej., Saccharomyces cerevisiae. In one embodiment, the fermenting organism is a C6 sugar fermenting organism, such as a strain of, e.g. eg, Saccharomyces cerevisiae.

En una realización, el organismo termentador es un organismo termentador de azúcar C5, tal como una cepa de, p. ej., Saccharomyces cerevisiae. In one embodiment, the fermenting organism is a C5 sugar fermenting organism, such as a strain of, e.g. eg, Saccharomyces cerevisiae.

En una realización, el organismo termentador se añade al medio de termentación de modo que el recuento de organismos de termentación viables, tales como levaduras, por mL de medio de termentación esté en el intervalo de 105 a 1012, preteriblemente de 107 a 1010, especialmente de aproximadamente 5x107.In one embodiment, the fermentation organism is added to the fermentation medium such that the count of viable fermentation organisms, such as yeast, per mL of fermentation medium is in the range of 105 to 1012, preferably 107 to 1010, especially approximately 5x107.

La levadura es el organismo termentador preterido para la termentación del etanol. Se pretieren las cepas de Saccharomyces,, especialmente cepas de la especie Saccharomyces cerevisiae,, preteriblemente las cepas que son resistentes a niveles elevados de etanol, es decir, hasta, p. ej., aproximadamente 10, 12, 15 o 20% en vol. o más de etanol.Yeast is the preferred fermenting organism for ethanol fermentation. Saccharomyces strains, especially strains of the species Saccharomyces cerevisiae, are preferred, preferably strains that are resistant to high levels of ethanol, ie up to, e.g. g., about 10, 12, 15, or 20% by vol. or more of ethanol.

En una realización, la levadura que utiliza C5 es una cepa de Saccharomyces cerevisiae descrita en el documento WO 2004/085627.In one embodiment, the yeast using C5 is a strain of Saccharomyces cerevisiae described in WO 2004/085627.

En una realización, el organismo termentador es una célula microbiana eucariota C5 a la que se retiere el documento WO 2010/074577 (Nedalco).In one embodiment, the fermenting organism is a C5 eukaryotic microbial cell to which WO 2010/074577 (Nedalco) refers.

En una realización, el organismo termentador es una célula eucariota C5 transformada capaz de isomerizar directamente la xilosa en xilulosa descrita en el documento US 2008/0014620.In one embodiment, the fermenting organism is a transformed C5 eukaryotic cell capable of directly isomerizing xylose to xylulose described in US 2008/0014620 .

En una realización, el organismo termentador es una célula termentadora de azúcar C5 descrita en el documento WO 2009/109633.In one embodiment, the fermenting organism is a C5 sugar fermenting cell described in WO 2009/109633.

Levaduras comercialmente disponibles incluyen LNF SA-1, LNF BG-1, LNF PE-2 y LNF CAT-1 (disponible de LNF Brazil), RED STAR™ y levadura ETHANOL RED™ (disponible de Fermentis/Lesattre, EE.UU.), Fa LI (disponible de Fleischmann’s Yeast, Ee .UU.), levadura tresca SUPERSTART y THERMOSACC™ (disponible de Ethanol Technology, Wl, EE.UU.), BIOFERM AFT y XR (disponible de NABC - North American Bioproducts Corporation, GA, EE.UU.), GERT STrAn D (disponible de Gert Strand AB, Suecia) y FERMIOL (disponible de DSM Specialties).Commercially available yeasts include LNF SA-1, LNF BG-1, LNF PE-2 and LNF CAT-1 (available from LNF Brazil), RED STAR™ and ETHANOL RED™ yeast (available from Fermentis/Lesattre, USA). , Fa LI (available from Fleischmann's Yeast, USA), Tresca yeast SUPERSTART and THERMOSACC™ (available from Ethanol Technology, Wl, USA), BIOFERM AFT and XR (available from NABC - North American Bioproducts Corporation, GA , USA), GERT STrAn D (available from Gert Strand AB, Sweden) and FERMIOL (available from DSM Specialties).

El organismo termentador capaz de producir un producto de la termentación deseado a partir de azúcares termentables se cultiva preteriblemente bajo condiciones precisas a una tasa de crecimiento particular. Cuando el organismo termentador se introduce o se añade al medio de termentación, el organismo termentador inoculado pasa por una serie de tases. Inicialmente no se produce crecimiento. Este período se denomina "tase de retraso" y puede considerarse un período de adaptación. Durante la siguiente tase, denominada "tase exponencial", la tasa de crecimiento aumenta gradualmente. Después de un período de crecimiento máximo, la velocidad cesa y el organismo termentador entra en la "tase estacionaria". Después de un período de tiempo adicional, el organismo termentador entra en la "tase de muerte" en donde disminuye el número de células viables.The fermentation organism capable of producing a desired fermentation product from fermentable sugars is preferably cultured under precise conditions at a particular growth rate. When the fermentation organism is introduced or added to the fermentation medium, the inoculated fermentation organism goes through a series of stages. Initially no growth occurs. This period is called the "lag rate" and can be considered an adaptation period. During the next phase, called the "exponential phase", the growth rate gradually increases. After a period of maximum growth, the rate ceases and the termentator organism enters the "steady rate". After an additional period of time, the fermenting organism enters "death rate" where the number of viable cells decreases.

FermentaciónFermentation

Las condiciones de termentación se determinan basándose, p. ej., en el tipo de material vegetal, los azúcares termentables disponibles, el organismo u organismos termentadores y/o el producto de la termentación deseado. Un experto en la técnica puede determinar tácilmente las condiciones de termentación adecuadas. La termentación se puede llevar a cabo en las condiciones de uso convencional. Procedimientos de fermentación preferidos son los procedimientos anaerobios.The heating conditions are determined based on e.g. eg, on the type of plant material, the available heatable sugars, the heatable organism(s), and/or the desired heatable product. One skilled in the art can readily determine the proper heating conditions. The fermentation is can be carried out under the conditions of conventional use. Preferred fermentation procedures are anaerobic procedures.

Por ejemplo, las fermentaciones se pueden llevar a cabo a temperaturas tan altas como 75°C, p. ej., entre 40-70°C, tal como entre 50-60°C. Sin embargo, también se conocen bacterias con una temperatura óptima significativamente más baja hasta alrededor de la temperatura ambiente (alrededor de 20°C). Se pueden encontrar ejemplos de organismos fermentadores adecuados en la sección anterior "Organismos Fermentadores''.For example, fermentations can be carried out at temperatures as high as 75°C, eg. eg, between 40-70°C, such as between 50-60°C. However, bacteria with a significantly lower optimum temperature down to around room temperature (around 20°C) are also known. Examples of suitable fermenting organisms can be found in the "Fermenting Organisms" section above.

Para la producción de etanol utilizando levadura, la fermentación puede durar de 24 a 96 horas, en particular de 35 a 60 horas. En una realización, la fermentación se lleva a cabo a una temperatura entre 20 y 40°C, preferiblemente entre 26 y 34°C, en particular alrededor de 32°C. En una realización, el pH es de 3 a 6, preferiblemente alrededor de pH 4 a 5.For the production of ethanol using yeast, the fermentation can last from 24 to 96 hours, in particular from 35 to 60 hours. In one embodiment, the fermentation is carried out at a temperature between 20 and 40°C, preferably between 26 and 34°C, in particular around 32°C. In one embodiment, the pH is from 3 to 6, preferably around pH 4 to 5.

Otros productos de la fermentación pueden fermentarse a temperaturas conocidas por la persona experta en la técnica, adecuadas para el organismo fermentador en cuestión.Other fermentation products can be fermented at temperatures known to the person skilled in the art, suitable for the fermenting organism in question.

La fermentación se lleva a cabo típicamente a un pH en el intervalo entre 3 y 7, preferiblemente de pH 3,5 a 6, tal como alrededor de pH 5. Las fermentaciones se llevan a cabo típicamente durante 6-96 horas.Fermentation is typically carried out at a pH in the range of 3 to 7, preferably pH 3.5 to 6, such as around pH 5. Fermentations are typically carried out for 6-96 hours.

Los procedimientos de la invención se pueden realizar como un procedimiento por lotes o como un procedimiento continuo. Las fermentaciones se pueden realizar en un sistema de ultrafiltración en el que el material retenido se mantiene en recirculación en presencia de sólidos, agua y el organismo fermentador, y en donde el material permeado es el líquido que contiene el producto de la fermentación deseado. Igualmente se contemplan métodos/procedimientos llevados a cabo en reactores de membrana continua con membranas de ultrafiltración y en que el material retenido se mantiene en recirculación en presencia de sólidos, agua y el organismo o los organismos fermentadores y en que el material permeado es el producto de fermentación que contiene líquido. Después de la fermentación, el organismo fermentador puede separarse de la suspensión fermentada y reciclarse.The processes of the invention can be carried out as a batch process or as a continuous process. The fermentations can be carried out in an ultrafiltration system in which the retentate is kept in recirculation in the presence of solids, water and the fermenting organism, and in which the permeate material is the liquid containing the desired fermentation product. Likewise, methods/procedures carried out in continuous membrane reactors with ultrafiltration membranes and in which the retained material is kept in recirculation in the presence of solids, water and the fermenting organism or organisms and in which the permeated material is the product are contemplated. fermentation containing liquid. After fermentation, the fermenting organism can be separated from the fermented suspension and recycled.

Medio de FermentaciónFermentation Medium

La expresión "medios de fermentación" o "medio de fermentación" se refiere al entorno en el que se lleva a cabo la fermentación y comprende el sustrato de fermentación, es decir, la fuente de hidratos de carbono que es metabolizada por el organismo u organismos fermentadores.The term "fermentation media" or "fermentation medium" refers to the environment in which the fermentation is carried out and includes the fermentation substrate, that is, the source of carbohydrates that is metabolized by the organism or organisms fermenters.

El medio de fermentación puede comprender otros nutrientes y un estimulador o estimuladores del crecimiento para el organismo o los organismos fermentadores. Nutriente y estimuladores del crecimiento se utilizan ampliamente en la técnica de la fermentación e incluyen fuentes de nitrógeno, tales como amoniaco; vitaminas y minerales, o combinaciones de los mismos.The fermentation medium may comprise other nutrients and a growth stimulator(s) for the fermenting organism(s). Nutrient and growth stimulators are widely used in the fermentation art and include nitrogen sources such as ammonia; vitamins and minerals, or combinations thereof.

RecuperaciónRecovery

Después de la fermentación, el producto de fermentación puede separarse del medio de fermentación. El medio de fermentación puede destilarse para extraer el producto de la fermentación deseado o el producto de la fermentación deseado puede extraerse del medio de fermentación mediante técnicas de microfiltración o filtración por membrana. Alternativamente, el producto de la fermentación se puede recuperar mediante extracción. Métodos de recuperación son bien conocidos en la técnica.After fermentation, the fermentation product can be separated from the fermentation medium. The fermentation medium can be distilled to extract the desired fermentation product or the desired fermentation product can be extracted from the fermentation medium by microfiltration or membrane filtration techniques. Alternatively, the fermentation product can be recovered by extraction. Recovery methods are well known in the art.

La presente invención se describe adicionalmente mediante los siguientes ejemplos.The present invention is further described by the following examples.

EJEMPLOSEXAMPLES

Ejemplo 1: Clonación y expresión de la proteasa III de Meripilus giganteus de tipo salvaje en A soeraillus oryzae Example 1: Cloning and expression of wild-type Meripilus giganteus protease III in A soeraillus oryzae

La clonación y expresión de la serina proteasa III de tipo salvaje de Meripilus giganteus (MgP3) perteneciente a la familia S53 se describió en el documento WO 2014/037438. El gen clonado se transfirió posteriormente como un producto de la reacción en cadena de la polimerasa (PCR) con colgantes adecuadas para la inserción en P_BGMH0016, descrito en el documento WO2013/119302 (ejemplo 18 y figura 10), mediante la clonación USER™ (New England Biolabs, Ipswich, MA, EE.UU.) para su expresión en Aspergillus oryzae. Se utilizó ADN plasmídico como molde en la reacción PCR. La secuencia del cebador directo fue 5’-AGAGCGAUaccatggtcgccaccagc-3’ (SEQ ID NO: 11), y la secuencia del cebador inverso fue 5’- AACGTCACGUtcacaggccgaccgcggt-3’ (SEQ ID NO: 12). Se utilizó ADN polimerasa Phusion U (Thermo Fischer Scientific, Grand Island, NY, EE. UU.) para la reacción PCRThe cloning and expression of wild-type serine protease III from Meripilus giganteus (MgP3) belonging to the S53 family was described in WO 2014/037438. The cloned gene was subsequently transferred as a polymerase chain reaction (PCR) product with suitable pendants for insertion into P_BGMH0016, described in WO2013/119302 (example 18 and figure 10), by cloning USER™ ( New England Biolabs, Ipswich, MA, USA) for expression in Aspergillus oryzae. Plasmid DNA was used as a template in the PCR reaction. The forward primer sequence was 5'-AGAGCGAUaccatggtcgccaccagc-3' (SEQ ID NO: 11), and the reverse primer sequence was 5'-AACGTCACGUtcacaggccgaccgcggt-3' (SEQ ID NO: 12). Phusion U DNA polymerase (Thermo Fischer Scientific, Grand Island, NY, USA) was used for the PCR reaction

La reacción de PCR consistió en: 10 ng de ADN del molde, 0,5 pM de cada uno de los cebadores, 1 U de polimerasa Phusion U, dNTP 0,25 mM, tampón 1x Phusion HF, agua hasta 50 pl. El programa de PCR consistió en una desnaturalización inicial durante 30 segundos a 98°C, 35 ciclos de amplificación (20 segundos a 98°C; 20 segundos a 60°C; 2 minutos a 72°C) y una extensión final de 5 minutos a 72°C. The PCR reaction consisted of: 10 ng template DNA, 0.5 pM each of the primers, 1 U Phusion U polymerase, 0.25 mM dNTPs, 1x Phusion HF buffer, water to 50 pl. The PCR program consisted of an initial denaturation for 30 seconds at 98°C, 35 cycles of amplification (20 seconds at 98°C; 20 seconds at 60°C; 2 minutes at 72°C) and a final extension of 5 minutes. at 72°C.

El gen amplificado se purificó (QIAquick, QIAGEN) y se insertó en P_BGMH0016 mediante la clonación USER™. La reacción contenía: 100 ng de vector P_BGMH0016 como un producto de la PCR, 500 ng de producto de la PCR purificado, 1 gl de enzima USER™, 1 gl de tampón Phusion HF, agua hasta 10 gl. El programa consistió en 25 minutos a 37°C y 25 minutos a 25°C. La mezcla se transformó en 50 gl de células de Escherichia coli TOP10 (DH10p) químicamente competentes , seleccionadas por su resistencia a ampicilina, y los clones correctos se verificaron mediante secuenciación. El plásmido se transformó en protoplastos de Aspergillus oryzae Cols1300 descritos en el documento WO2013/119302, seleccionados por crecimiento en nitrato como única fuente de nitrógeno, y los clones correctos se verificaron mediante secuenciación de Sanger. El uso del plásmido BGMH0016The amplified gene was purified (QIAquick, QIAGEN) and inserted into P_BGMH0016 by USER™ cloning. The reaction contained: 100ng P_BGMH0016 vector as a PCR product, 500ng purified PCR product, 1gl USER™ enzyme, 1gl Phusion HF buffer, water to 10gl. The program consisted of 25 minutes at 37°C and 25 minutes at 25°C. The mixture was transformed into 50 gl of chemically competent Escherichia coli TOP10 (DH10p) cells, selected for their resistance to ampicillin, and the correct clones were verified by sequencing. The plasmid was transformed into Aspergillus oryzae Cols1300 protoplasts described in WO2013/119302, selected by growth on nitrate as sole nitrogen source, and correct clones were verified by Sanger sequencing. The use of the BGMH0016 plasmid

aprovecha el denominado sistema de marcador doble dividido (DSMS) o sistema de marcador de selección bi-partita (Nielsen et al. 2006, (Efficient PCR-based gene targeting with a reciclable marker for Aspergillus nidulans, Fungal Genetics and Biology, 2006(43) 54 a 64)). El sistema de marcador de doble división en pBGMH0016 consiste en dos marcadores doble divididos en la cepa COLS1300 de Aspergillus oryzae: niaüú and niiAú, que flanquean el marcador de selección amdS. Solo la inserción correcta del ADN del donante a través de una doble recombinación homóloga en los genes niaD y niiA parciales, respectivamente, en la célula huésped COLS1300 restaurará la funcionalidad de ambos genes y ambos genes son necesarios para que la célula crezca en un medio que contenga nitrato de sodio como única fuente de nitrógeno. Esto también asegura una inserción fijada como objetivo en lugar del gen amdS en una sola copiatakes advantage of the so-called double split marker system (DSMS) or bi-partite selection marker system (Nielsen et al. 2006, (Efficient PCR-based gene targeting with a recyclable marker for Aspergillus nidulans, Fungal Genetics and Biology, 2006(43 ) 54 to 64)). The double-cleaved marker system in pBGMH0016 consists of two double-cleaved markers in Aspergillus oryzae strain COLS1300: niaüú and niiAú, which flank the amdS selection marker. Only correct insertion of donor DNA via double homologous recombination into the partial niaD and niiA genes, respectively, in the COLS1300 host cell will restore the functionality of both genes, and both genes are required for the cell to grow in a medium that contains sodium nitrate as the sole source of nitrogen. This also ensures a targeted insert instead of the amdS gene in a single copy.

Cada una de las variantes específicas de MgP3 de acuerdo con la invención puede clonarse y expresarse como se describe arriba.Each of the specific variants of MgP3 according to the invention can be cloned and expressed as described above.

Ejemplo 2: Ensayo de estabilidad para variantes específicas de acuerdo con la invenciónExample 2: Stability test for specific variants according to the invention

La estabilidad de las variantes de sustitución de MgP3 con respecto a MgP3 que tiene la secuencia de aminoácidos de SEQ ID NO: 3 se determina incubando las muestras de proteasa en condiciones definidas ("condiciones de estrés") en una solución tamponada. La temperatura y la duración de la incubación se eligen de modo que la actividad restante del tipo salvaje después de la incubación sea igual a aproximadamente el 20% de la actividad de una muestra similar incubada bajo condiciones definidas ("condiciones de referencia") que no conducen a pérdida de actividad cuando se incuba durante la misma duración. La actividad después de la incubación bajo condiciones de estrés o condiciones de referencia se determina utilizando el ensayo Suc-AAPF-pNA descrito a continuación.The stability of MgP3 substitution variants relative to MgP3 having the amino acid sequence of SEQ ID NO: 3 is determined by incubating the protease samples under defined conditions ("stress conditions") in a buffered solution. The temperature and duration of incubation are chosen such that the remaining wild-type activity after incubation is equal to approximately 20% of the activity of a similar sample incubated under defined conditions ("reference conditions") that do not lead to loss of activity when incubated for the same duration. Activity after incubation under stress or reference conditions is determined using the Suc-AAPF-pNA assay described below.

A. Determinación de la actividad de proteasa utilizando el ensayo Suc-AAPF-pNAA. Determination of protease activity using the Suc-AAPF-pNA assay

Con el fin de determinar la actividad de proteasa de la proteasa MgP3 y variantes de la misma, se midió la hidrólisis de N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida (Suc-AAPF-pNA).In order to determine the protease activity of the MgP3 protease and variants thereof, the hydrolysis of N-succinyl-L-alanyl-L-alanyl-L-propyl-L-phenyl-p-nitroanilide (Suc- AAPF-pNA).

Las soluciones de reactivo utilizadas son:The reagent solutions used are:

Tampón de Dilución: Ácido succínico 100 mM, CaCl2 1 mM, KCI 150 mM, Triton X-100 al 0,01% , pH 4,5. Tampón de Ensayo: Tampón de dilución con Suc-AAPF-pNA (N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida 1 mM, Bachem 4002299.1000), 12.5 gL mL-1 DMSO (Amresco 0231).Dilution Buffer: 100 mM succinic acid, 1 mM CaCl 2 , 150 mM KCl, 0.01% Triton X-100, pH 4.5. Assay Buffer: Dilution buffer with Suc-AAPF-pNA (1 mM N-succinyl-L-alanyl-L-alanyl-L-propyl-L-phenyl-p-nitroanilide, Bachem 4002299.1000), 12.5 gL mL-1 DMSO (Amresco 0231).

Se cultivaron variantes de MgP3 en placas de microtitulación de 96 pocillos para producir sobrenadante de cultivo. En cada una de las placas, cuatro pocillos contenían sobrenadante de cultivo con MgP3 de tipo salvaje (SEQ ID NO: 3). MgP3 variants were grown in 96-well microtiter plates to produce culture supernatant. In each of the plates, four wells contained wild-type MgP3 culture supernatant (SEQ ID NO: 3).

El ensayo Suc-AAPF-pNA se realiza en microplacas desechables de poliestireno de fondo plano de 384 pocillos (Perkin-Elmer 6007649). Primero, muestras de proteasa (sobrenadante de cultivo) se diluyen 5 veces en Tampón de Dilución. Posteriormente, se añaden 25 gL de la muestra de proteasa diluida a cada uno de los pocillos de la microplaca de ensayo de 384 pocillos, seguido de la adición de 25 gL de Tampón de Ensayo. Las soluciones se mezclan a fondo y la absorbancia se registró a 405 nm durante 5 minutos, y se calculó la velocidad inicial por pocillo a partir de la velocidad máxima de una ventana de 270 segundos.The Suc-AAPF-pNA assay is performed in 384-well flat bottom polystyrene disposable microplates (Perkin-Elmer 6007649). First, protease samples (culture supernatant) are diluted 5-fold in Dilution Buffer. Subsequently, 25 gL of the diluted protease sample is added to each well of the 384-well assay microplate, followed by the addition of 25 gL of Assay Buffer. The solutions are mixed thoroughly and the absorbance recorded at 405nm for 5 minutes, and the initial rate per well calculated from the maximum rate of a 270 second window.

B. Ensayo de estabilidadB. Stability test

La estabilidad de las variantes de MgP3 en tampón se determina determinando la semivida de estabilidad de las variantes de proteasa como el valor negativo del tiempo de estrés en horas, dividido por el logaritmo en base 2 de la relación de la actividad de proteasa de las variantes bajo condiciones de desestabilización. ("condiciones de estrés") a la actividad de proteasa de las mismas variantes en condiciones no desestabilizadoras ("condiciones de referencia"). Las pendientes cinéticas se sometieron a control de calidad y se eliminaron muestras variantes que 1) mostraban un R2 de ajuste lineal que estaba por debajo del cuartil del 25% del ajuste R2 del control de tipo salvaje en a) condición estresada o b) condición no estresada, o 2) mostraban una Vmáx por debajo del cuartil del 75% de Vmáx de los controles que no expresan, en a) la condición estresada o b) la condición no estresada. La relación de la tasa inicial de los sobrenadantes estresados y no estresados que proceden del mismo clon se definió como The stability of the MgP3 variants in buffer is determined by determining the stability half-life of the protease variants as the negative value of the stress time in hours, divided by the logarithm to base 2 of the ratio of the protease activity of the variants under unstable conditions. ("stress conditions") to the protease activity of the same variants under non-destabilizing conditions ("reference conditions"). Kinetic slopes were quality controlled and variant samples were removed that 1) showed a linear fit R2 that was below the 25% quartile of the wild-type control R2 fit in a) stressed condition or b) unstressed condition , or 2) showed Vmax below the 75% quartile of Vmax from non-expressing controls, in a) the stressed condition or b) the unstressed condition. The ratio of the initial rate of stressed and unstressed supernatants originating from the same clone was defined as

Vmáx EstresadaVmax Stressed

Relación =Ratio =

Vmáx No estresadaVmax Unstressed

Las muestras que mostraban una relación por encima del cuantil del 90% del control de tipo salvaje se contaron como aciertos, y se recogieron, se volvieron a cultivar y se secuenciaron. La semivida a 60°C i v t 5 V 0 ¿ . c) /se calculó en base a laSamples showing a ratio above the 90% quantile of the wild-type control were counted as hits, and were harvested, recultured, and sequenced. The half-life at 60°C i v t 5 V 0 ¿ . c ) / was calculated based on the

Ln (0.5 ) Ln (0.5)

L 7 l ( Relación)^L 7 l ( Ratio)^

5 ' ecuación, en que la semivida se proporciona en minutos.5 ' equation, where half-life is given in minutes.

Las soluciones de reactivo utilizadas son:The reagent solutions used are:

Tampón de Dilución: como se describe en A.Dilution Buffer: as described in A.

Tampón de Ensayo: como se describe en A.Assay Buffer: as described in A.

El ensayo se realiza en placas de PCR desechables de poliestireno de 96 pocillos (p. ej., Thermo Scientific AB-0601), excepto el ensayo Suc-AAPF-pNA descrito en A, que se realiza en microplacas de 384 pocillos.The assay is performed in 96-well polystyrene disposable PCR plates (eg, Thermo Scientific AB-0601), except for the Suc-AAPF-pNA assay described in A, which is performed in 384-well microplates.

Primero se transfieren 25 pl de los sobrenadantes del cultivo que contienen la proteasa a dos placas nuevas: una denominada "Placa de Estrés" y otra denominada "Placa de Referencia". La Placa de Estrés está dotada con una tapa y se incuba en un termociclador durante 5 minutos a 60°C. La Placa de Referencia está dotada con una tapa y mientras tanto se incuba a 21°C (temperatura ambiente). Después de la incubación, los sobrenadantes de cultivo de la Placa de Estrés y la Placa de Referencia se transfieren a placas de 384 pocillos y se añaden 25 pL de tampón de ensayo a cada uno de los pocillos de la Placa de Estrés y de la Placa de Referencia, y se mezclan bien.First, 25 pl of the culture supernatants containing the protease are transferred to two new plates: one designated "Stress Plate" and one designated "Reference Plate". The Stress Plate is fitted with a lid and is incubated in a thermocycler for 5 minutes at 60°C. The Reference Plate is provided with a lid and meanwhile incubated at 21°C (room temperature). After incubation, culture supernatants from the Stress Plate and Reference Plate are transferred to 384-well plates and 25 pL of assay buffer is added to each well of the Stress Plate and Reference Plate. Reference, and mix well.

Factor de Mejora de la Semivida (HIF)Half-Life Enhancement Factor (HIF)

El factor de mejora de la semivida (HIF) correlaciona la Semivida de Estabilidad de una proteasa variante con la de la proteasa de referencia. El cálculo del factor de mejora basado en la Semivida de Estabilidad (SH) se realizó de acuerdo con la siguiente ecuación: HIF = (SH de la variante) / (SH de MgP3 (SEQ ID NO: 3)).The half-life enhancement factor (HIF) correlates the Stability Half-Life of a variant protease with that of the reference protease. The calculation of the improvement factor based on the Stability Half-life (SH) was performed according to the following equation: HIF = (SH of the variant) / (SH of MgP3 (SEQ ID NO: 3)).

Un factor de mejora de la semivida mayor que 1 (HIF > 1) indica una estabilidad mejorada de una variante en comparación con la referencia, mientras que un HIF de 1 (HIF = 1) identifica una variante que está a la par con la referencia. y un HIF de menos de 1 (HIF < 1) identifica una variante que es menos estable que la referencia. E1HIF de todas las mutaciones con estabilidad mejorada se muestra en la tabla 1 que figura más adelante. Si se observó una sustitución dada más de una vez, se muestra la HIF mediana de todas las observaciones.A half-life enhancement factor greater than 1 (HIF > 1) indicates improved stability of a variant compared to the reference, while a HIF of 1 (HIF = 1) identifies a variant that is on par with the reference . and an HIF of less than 1 (HIF < 1) identifies a variant that is less stable than the reference. E1HIF of all mutations with enhanced stability is shown in Table 1 below. If a given substitution was observed more than once, the median HIF of all observations is shown.

Tabla 1Table 1

Figure imgf000038_0001
Figure imgf000038_0001

Figure imgf000039_0001
Figure imgf000039_0001

Figure imgf000040_0001
Figure imgf000040_0001

Figure imgf000041_0001
Figure imgf000041_0001

Figure imgf000042_0001
Figure imgf000042_0001

Figure imgf000043_0001
Figure imgf000043_0001

Figure imgf000044_0001
Figure imgf000044_0001

Figure imgf000045_0001
Figure imgf000045_0001

Ejemplo 3: Ensayo de actividad específica para variantes específicas de acuerdo con la invenciónExample 3: Specific activity assay for specific variants according to the invention

La actividad específica de las variantes de sustitución de MgP3 con respecto a MgP3 que tiene la secuencia de aminoácidos de SEQ ID NO: 3 se determina comparando la actividad total de las muestras de proteasa con la cantidad de proteína en la muestra. La actividad en los sobrenadantes del cultivo se determina utilizando el ensayo Suc-AAPF-pNA y la concentración de proteína se determinó mediante el ensayo inmunoabsorbente ligado a enzimas (ELISA), ambos descritos a continuación.The specific activity of the MgP3 substitution variants relative to MgP3 having the amino acid sequence of SEQ ID NO: 3 is determined by comparing the total activity of the protease samples to the amount of protein in the sample. Activity in culture supernatants is determined using the Suc-AAPF-pNA assay and protein concentration determined by enzyme-linked immunosorbent assay (ELISA), both described below.

A. Determinación de la actividad de proteasa utilizando el ensayo Suc-AAPF-pNAA. Determination of protease activity using the Suc-AAPF-pNA assay

Con el fin de determinar la actividad de proteasa de la proteasa MgP3 y variantes de la misma, se midió la hidrólisis de N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida (Suc-AAPF-pNA).In order to determine the protease activity of the MgP3 protease and variants thereof, the hydrolysis of N-succinyl-L-alanyl-L-alanyl-L-propyl-L-phenyl-p-nitroanilide (Suc- AAPF-pNA).

Las soluciones de reactivo utilizadas son:The reagent solutions used are:

Tampón de Dilución: Ácido succínico 100 mM, CaCl2 1 mM, KCI 150 mM, Triton X-100 al 0,01% , pH 4,5. Tampón de Ensayo: Tampón de dilución con Suc-AAPF-pNA (N-succinil-L-alanil-L-alanil-L-propil-L-fenil-p-nitroanilida 1 mM, Bachem 4002299.1000), 12.5 pL mL-1 DMSO (Amresco 0231).Dilution Buffer: 100 mM succinic acid, 1 mM CaCl 2 , 150 mM KCl, 0.01% Triton X-100, pH 4.5. Assay Buffer: Dilution buffer with Suc-AAPF-pNA (1 mM N-succinyl-L-alanyl-L-alanyl-L-propyl-L-phenyl-p-nitroanilide, Bachem 4002299.1000), 12.5 pL mL-1 DMSO (Amresco 0231).

Se cultivaron variantes de MgP3 en placas de microtitulación de 96 pocillos para producir sobrenadante de cultivo. En cada una de las placas, cuatro pocillos contenían sobrenadante de cultivo con MgP3 de tipo salvaje (SEQ ID NO: 3). El ensayo Suc-AAPF-pNA se realiza en microplacas desechables de poliestireno de fondo plano de 384 pocillos (Perkin-Elmer 6007649). Primero, muestras de proteasa (sobrenadante de cultivo) se diluyen 5 veces en Tampón de Dilución. Posteriormente, se añaden 25 pL de la muestra de proteasa diluida a cada uno de los pocillos de la microplaca de ensayo de 384 pocillos, seguido de la adición de 25 pL de Tampón de Ensayo. Las soluciones se mezclan a fondo y la absorbancia se registró a 405 nm durante 5 minutos, y se calculó la velocidad inicial por pocillo a partir de la velocidad máxima de una ventana de 270 segundos.MgP3 variants were grown in 96-well microtiter plates to produce culture supernatant. In each of the plates, four wells contained wild-type MgP3 culture supernatant (SEQ ID NO: 3). The Suc-AAPF-pNA assay is performed in 384-well flat bottom polystyrene disposable microplates (Perkin-Elmer 6007649). First, protease samples (culture supernatant) are diluted 5-fold in Dilution Buffer. Subsequently, 25 pL of the diluted protease sample is added to each well of the 384-well assay microplate, followed by the addition of 25 pL of Assay Buffer. The solutions are mixed thoroughly and the absorbance recorded at 405nm for 5 minutes, and the initial rate per well calculated from the maximum rate of a 270 second window.

B. Cuantificación de proteínas mediante ensayo inmunoabsorbente ligado a enzima (ELISA)B. Protein quantification by enzyme-linked immunosorbent assay (ELISA)

Las soluciones de reactivo utilizadas son:The reagent solutions used are:

TBS-T: Tris 20 mM , NaCl 150 mM, Tween-20 al 0,1% , pH 7,5.TBS-T: 20 mM Tris, 150 mM NaCl, 0.1% Tween-20, pH 7.5.

Tampón PBS: NaCl 137 mM , KCI 2,7 mM, Na2HPO410 mM , KH2 PO4 1,8 mMPBS buffer: 137 mM NaCl, 2.7 mM KCI, Na2HPO410 mM KH 2 PO 4 1.8 mM

TMB plus 2 (KemEnTech diagnostics A/S) está prefabricado y listo para su uso.TMB plus 2 (KemEnTech diagnostics A/S) is prefabricated and ready for use.

La muestra de proteasa (sobrenadante de cultivo) se diluyó 2000 veces en TBS-T y se analizó mediante ELISA, utilizando un anticuerpo MgP3 conjugado con HRP producido en conejo. La cuantificación ELISA se lleva a cabo en una placa de microtitulación 384 bloqueada (Nunc MaxiSorp) recubierta con anticuerpos policlonales anti-MgP3 de conejo purificados con "proteína A". Las muestras de enzima diluidas (así como los patrones y controles) se transfieren a la placa de anticuerpos, se incubaron y, a continuación, se lavaron repetidamente enérgicamente con tampón PBS. La detección se lleva a cabo utilizando los mismos anticuerpos policlonales, pero en una forma marcada con HRP (conjugación LL-HRP). Se añade conjugado anti-MgP3: HRP en TBS-T en la dilución apropiada, seguido de lavado con PBS. La señal se lee como el punto final OD-(620 nM) después de la adición de sustrato TMB plus 2.The protease sample (culture supernatant) was diluted 2000-fold in TBS-T and analyzed by ELISA, using a rabbit-produced HRP-conjugated MgP3 antibody. ELISA quantitation is carried out in a blocked 384 microtiter plate (Nunc MaxiSorp) coated with "protein A" purified rabbit anti-MgP3 polyclonal antibodies. Diluted enzyme samples (as well as standards and controls) are transferred to the antibody plate, incubated, and then repeatedly washed vigorously with PBS buffer. Detection is carried out using the same polyclonal antibodies, but in an HRP-labelled form (LL-HRP conjugation). Anti-MgP3:HRP conjugate in TBS-T is added at the appropriate dilution, followed by washing with PBS. The signal is read as the OD-endpoint (620 nM) after the addition of TMB plus 2 substrate.

Las concentraciones se calcularon a partir del uso de una función no lineal que se derivó de las muestras estándares que contenían MgP3 que se ubicaron en placas externas, así como de los pocillos estándares de MgP3 que se añadieron a cada una de las placas en el flujo de rastreo. Concentrations were calculated using a nonlinear function that was derived from the standard MgP3-containing samples that were placed in external plates, as well as from the standard MgP3 wells that were added to each of the plates in the flow. tracking.

C.Cálculo de la actividad específica de proteasa para variantesC. Calculation of specific protease activity for variants

Se calculó un ajuste lineal por placa en base a la tasa inicial y las concentraciones estándares de las muestras estándares. Se eliminaron las placas que estaban fuera del intervalo de cuantiles de 2,5-97,5% para los parámetros de ajuste pendiente e intersección. Se derivó una predicción de concentración a partir de la Vmáx introduciéndola en el ajuste lineal invertido de los patrones (por placa). La actividad específica se calculó comoA linear fit per plate was calculated based on the initial rate and standard concentrations of the standard samples. Plaques outside the 2.5-97.5% quantile range for the slope and intercept fit parameters were removed. A concentration prediction was derived from the Vmax by plugging it into the inverted linear fit of the standards (per plate). The specific activity was calculated as

Concentración (Predicha)Concentration (Predicted)

Actividad específica =Specific activity =

Concentración [ELISA}Concentration [ELISA}

Para la selección de aciertos, solo se consideraron las muestras que mostraron una concentración de ELISA < 30 pg mL-1. Las muestras que mostraban una actividad específica por encima del cuantil del 95% del control de tipo salvaje se contaron como aciertos, y se secuenciaron.For the selection of hits, only the samples that showed an ELISA concentration < 30 pg mL-1 were considered. Samples showing specific activity above the 95% quantile of the wild-type control were counted as hits, and sequenced.

Factor de mejora para actividad específica (AIF)Activity Specific Enhancement Factor (AIF)

El factor de mejora para la actividad específica (AIF) se correlaciona con al actividad específica de una proteasa variante con la de la proteasa de referencia. El cálculo del factor de mejora basado en la actividad específica (SA) se realizó de acuerdo con la siguiente ecuación: AIF = (SA de la variante) / (SA de MgP3 (SEQ ID NO: 3)).The specific activity enhancement factor (AIF) correlates the specific activity of a variant protease with that of the reference protease. The calculation of the enhancement factor based on the specific activity (SA) was performed according to the following equation: AIF = (SA of the variant) / (SA of MgP3 (SEQ ID NO: 3)).

Un factor de mejora de la actividad específica mayor que 1 (AIF > 1) indica una actividad específica mejorada de una variante en comparación con la referencia, mientras que un AIF de 1 (AIF = 1) identifica una variante que está a la par con la referencia. y un AIF de menos de 1 (AIF < 1) identifica una variante con una actividad específica menor que la referencia. El AIF de todas las mutaciones con actividad específica mejorada se muestra en la tabla 2 que figura más adelante. Si se observó una sustitución dada más de una vez, se muestra la AIF mediana de todas las observaciones.A specific activity enhancement factor greater than 1 (AIF > 1) indicates improved specific activity of a variant compared to the reference, while an AIF of 1 (AIF = 1) identifies a variant that is on par with The reference. and an AIF of less than 1 (AIF < 1) identifies a variant with a lower specific activity than the reference. The AIF of all mutations with enhanced specific activity is shown in Table 2 below. If a given substitution was observed more than once, the median AIF of all observations is shown.

Tabla 2Table 2

Figure imgf000046_0001
Figure imgf000046_0001

Figure imgf000047_0001
Figure imgf000047_0001

Figure imgf000048_0001
Figure imgf000048_0001

Figure imgf000049_0001
Figure imgf000049_0001

Figure imgf000050_0001
Figure imgf000050_0001

Figure imgf000051_0001
Figure imgf000051_0001

Figure imgf000052_0001
Figure imgf000052_0001

Figure imgf000053_0001
Figure imgf000053_0001

Figure imgf000054_0001
Figure imgf000054_0001

Figure imgf000055_0001
Figure imgf000055_0001

Ejemplo 4: Determinación del nivel de expresión para variantes específicas de acuerdo con la invención Los niveles de expresión de variantes de sustitución de MgP3 con respecto a MgP3 que tiene la secuencia de aminoácidos de SEQ ID NO: 3 se determinan por la cantidad total de proteína MgP3 en el sobrenadante del cultivo. Utilizando un sistema en el que precisamente una copia de la variante está integrada en un locus definido, y dicho locus es idéntico para todas las variantes, permite la comparación directa de los niveles de expresión entre variantes específicas. Un sistema de este tipo podría ser el sistema DSMS descrito en el ejemplo 1. La concentración de proteína se determinó mediante un ensayo inmunoabsorbente ligado a enzimas (ELISA), que se describe más adelante. Example 4: Determination of the expression level for specific variants according to the invention The expression levels of substitution variants of MgP3 with respect to MgP3 having the amino acid sequence of SEQ ID NO: 3 are determined by the total amount of protein MgP3 in the culture supernatant. Using a system where precisely one copy of the variant is integrated at a defined locus, and that locus is identical for all variants, allows direct comparison of expression levels between specific variants. Such a system could be the DSMS system described in Example 1. Protein concentration was determined by enzyme-linked immunosorbent assay (ELISA), described below.

A.TO.

Cuantificación de proteínas mediante ensayo inmunoabsorbente ligado a enzimas (ELISA)Protein quantification by enzyme-linked immunosorbent assay (ELISA)

Las soluciones de reactivo utilizadas son:The reagent solutions used are:

TBS-T: Tris 20 mM , NaCl 150 mM, Tween-20 al 0,1% , pH 7,5.TBS-T: 20 mM Tris, 150 mM NaCl, 0.1% Tween-20, pH 7.5.

Tampón PBS: NaCl 137 mM , KCI 2,7 mM, Na2HPO410 mM , KH2 PO4 1,8 mMPBS buffer: 137 mM NaCl, 2.7 mM KCI, Na2HPO410 mM KH 2 PO 4 1.8 mM

TMB plus 2 (KemEnTech diagnostics A/S) está prefabricado y listo para su uso.TMB plus 2 (KemEnTech diagnostics A/S) is prefabricated and ready for use.

La muestra de proteasa (sobrenadante de cultivo) se diluyó 2000 veces en TBS-T y se analizó mediante ELISA, utilizando un anticuerpo MgP3 conjugado con HRP producido en conejo. La cuantificación ELISA se lleva a cabo en una placa de microtitulación 384 bloqueada (Nunc MaxiSorp) recubierta con anticuerpos policlonales anti-MgP3 de conejo purificados con "proteína A". Las muestras de enzima diluidas (así como los patrones y controles) se transfieren a la placa de anticuerpos, se incubaron y, a continuación, se lavaron repetidamente enérgicamente con tampón PBS. La detección se lleva a cabo utilizando los mismos anticuerpos policlonales, pero en una forma marcada con HRP (conjugación LL-HRP). Se añade conjugado anti-MgP3: HRP en TBS-T en la dilución apropiada, seguido de lavado con PBS. La señal se lee como el punto final OD-(620 nM) después de la adición de sustrato TMB plus 2.The protease sample (culture supernatant) was diluted 2000-fold in TBS-T and analyzed by ELISA, using a rabbit-produced HRP-conjugated MgP3 antibody. ELISA quantitation is carried out in a blocked 384 microtiter plate (Nunc MaxiSorp) coated with "protein A" purified rabbit anti-MgP3 polyclonal antibodies. Diluted enzyme samples (as well as standards and controls) are transferred to the antibody plate, incubated, and then repeatedly washed vigorously with PBS buffer. Detection is carried out using the same polyclonal antibodies, but in an HRP-labelled form (LL-HRP conjugation). Anti-MgP3:HRP conjugate in TBS-T is added at the appropriate dilution, followed by washing with PBS. The signal is read as the OD-endpoint (620 nM) after the addition of TMB plus 2 substrate.

Las concentraciones se calcularon a partir del uso de una función no lineal que se derivó de las muestras estándares que contenían MgP3 que se ubicaron en placas externas, así como de los pocillos estándares de MgP3 que se añadieron a cada una de las placas en el flujo de rastreo.Concentrations were calculated using a nonlinear function that was derived from the standard MgP3-containing samples that were placed in external plates, as well as from the standard MgP3 wells that were added to each of the plates in the flow. tracking.

Factor de mejora para el nivel de expresión (EIF)Expression level enhancement factor (EIF)

El factor de mejora del nivel de expresión (EIF) correlaciona el nivel de expresión de una proteasa variante con el de la proteasa de referencia. El cálculo del factor de mejora EIF basado en el nivel de expresión (EL) se realizó de acuerdo con la siguiente ecuación: ID = (EL de la variante) / (EL de MgP3 (SEQ ID NO: 3)).The expression level enhancement factor (EIF) correlates the expression level of a variant protease with that of the reference protease. Calculation of the enhancement factor EIF based on expression level (EL) was performed according to the following equation: ID = (EL of variant) / (EL of MgP3 (SEQ ID NO: 3)).

Un factor de mejora del nivel de expresión que es mayor que 1 (EIF > 1) indica un nivel de expresión mejorado de una variante en comparación con la referencia, mientras que un EIF de 1 (EIF = 1) identifica una variante que está a la par con la referencia. y un EIF de menos de 1 (EIF < 1) identifica una variante que tiene un nivel de expresión menor que la referencia. El EIF de todas las mutaciones con niveles de expresión mejorados se muestra en la tabla 3 que figura más adelante. Si se observó una sustitución dada más de una vez, se muestra la EIF mediana de todas las observaciones.An expression level enhancement factor that is greater than 1 (EIF > 1) indicates an improved expression level of a variant compared to the reference, while an EIF of 1 (EIF = 1) identifies a variant that is less than the reference. par with the reference. and an EIF of less than 1 (EIF < 1) identifies a variant that has a lower expression level than the reference. The EIF of all mutations with enhanced expression levels is shown in Table 3 below. If a given substitution was observed more than once, the median EIF of all observations is shown.

Tabla 3Table 3

Figure imgf000055_0002
Figure imgf000055_0002

Figure imgf000056_0001
Figure imgf000056_0001

Figure imgf000057_0001
Figure imgf000057_0001

Figure imgf000058_0001
Figure imgf000058_0001

Figure imgf000059_0001
Figure imgf000059_0001

Ejemplo 5: Variantes que tienen termoestabilidad incrementada según se determina por la actividad residual para combinaciones específicas de sustituciones después de estrés térmicoExample 5: Variants Having Increased Thermostability As Determined By Residual Activity For Specific Combinations Of Substitutions After Thermal Stress

En base a los datos obtenidos para variantes de sustitución únicas de acuerdo con la invención, varias variantes que tienen múltiples sustituciones y muestran un aumento en la actividad residual después de la incubación a temperaturas seleccionadas en el intervalo de 56°C a 70°C durante 20 min.Based on the data obtained for single substitution variants according to the invention, several variants that have multiple substitutions and show an increase in residual activity after incubation at selected temperatures in the range of 56°C to 70°C for 20 minutes

Las variantes que albergan sustituciones en comparación con MgP3 de tipo salvaje (SEQ ID NO: 3) como se muestra en la Tabla 4, se construyeron y expresaron en A. oryzae. Las cepas de MgP3 de A. oryzae que albergan y expresan las variantes de combinación de MgP3, se cultivaron en placas de microtitulación (MTP) en MDU-2 (225 pL / pocillo de MTP) para expresión, durante 5 días a 30°C en MTP con tapa de 96 pocillos sin agitación. Las placas de expresión también contenían MgP3 control de tipo salvaje expresado en A. oryzae. El material filamentoso se eliminó presionando una placa Biopress® hacia abajo en los pocillos. El sobrenadante se diluyó en tampón de ensayo (ácido succínico 100 mM, CaCh1 mM, KCl 150 mM, Triton X-100 al 0,01%, pH 4,5). Una fracción del sobrenadante diluido se transfirió a una placa termocicladora de 96 pocillos. La placa de 96 pocillos se transfirió a un termociclador TRobot® (Biometra) y se calentó a las temperaturas anotadas en la Tabla 4 (56°C, 60°C o 70°C) durante 20 min, seguido de un enfriamiento a 25°C durante 2 min. Se transfirieron volúmenes (25 pL) del sobrenadante estresado y no estresado a una placa MTP transparente de 384 pocillos. La solución de ensayo (25 pL, tampón de ensayo, con succinil-AAPF-pNA 1 mM, 12,5 pL mL-1 DMSO) se distribuye en la MTP de 384 pocillos. Se registró la absorbancia a 405 nm durante 10 minutos y se calculó la velocidad inicial por pocillo a partir de la velocidad máxima de una ventana de 9 min. La relación de la tasa inicial de los sobrenadantes estresados y no estresados que proceden del mismo clon se definió comoVariants harboring substitutions compared to wild-type MgP3 (SEQ ID NO: 3) as shown in Table 4, were constructed and expressed in A. oryzae. A. oryzae MgP3 strains harboring and expressing the MgP3 combination variants were grown in microtiter plates (MTP) in MDU-2 (225 pL/well MTP) for expression, for 5 days at 30°C. in 96-well capped MTP without shaking. Expression plates also contained wild-type control MgP3 expressed in A. oryzae. Stringy material was removed by pressing a Biopress® plate down into the wells. The supernatant was diluted in assay buffer (100 mM succinic acid, mM CaCh1, 150 mM KCl, 0.01% Triton X-100, pH 4.5). A fraction of the diluted supernatant was transferred to a 96-well thermal cycler plate. The 96-well plate was transferred to a TRobot® thermocycler (Biometra) and heated at the temperatures noted in Table 4 (56°C, 60°C, or 70°C) for 20 min, followed by cooling to 25°C. C for 2 min. Volumes (25 pL) of the stressed and unstressed supernatant were transferred to a clear 384-well MTP plate. Assay solution (25 pL, assay buffer, with 1 mM succinyl-AAPF-pNA, 12.5 pL mL-1 DMSO) is dispensed into the 384-well MTP. Absorbance at 405 nm was recorded for 10 min and the initial rate per well was calculated from the maximum rate of a 9 min window. The ratio of the initial rate of stressed and unstressed supernatants originating from the same clone was defined as

Vmáx EstresadaVmax Stressed

Relación =Ratio =

Vmáx No estresadaVmax Unstressed

que se traduce en actividad residual (%), que se muestra en la Tabla 4. which translates into residual activity (%), which is shown in Table 4.

Claims (27)

REIVINDICACIONES 1. Una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las1. A protease variant comprising a substitution at one or more positions corresponding to the posiciones 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61, 62, 64, 67, 68, 69, 74,positions 1, 5, 9, 25, 29,30, 32, 38, 39, 40, 41, 42, 45, 46, 49, 50, 53, 54, 55, 57, 59, 60, 61, 62, 64 , 67, 68, 69, 74, 76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130,76, 77, 78, 79, 80, 81, 82, 87, 93, 94, 96, 99, 102, 103, 105, 109, 111, 112, 114, 115, 117, 122, 123, 124, 128, 130, 136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200, 205, 207, 209, 210,136, 141, 142, 145, 146, 147, 150, 153, 154, 157, 159, 161, 167, 169, 175, 182, 185, 199, 200, 205, 207, 209, 210, 213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 269, 271, 272, 276, 278, 280,213, 216, 217, 225, 228, 231, 234, 237, 242, 244, 245, 246, 248, 258, 262, 266, 267, 269, 271, 272, 276, 278, 280, 284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 329, 330, 331, 333, 336, 338,284, 289, 293, 296, 299, 305, 308, 313, 314, 317, 318, 319, 321, 322, 324, 325, 326, 329, 330, 331, 333, 336, 338, 341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, y 364 del polipéptido de SEQ ID NO: 3, y la variante tiene341, 343, 345, 347, 348, 355, 358, 359, 361, 362, 363, and 364 of the polypeptide of SEQ ID NO: 3, and the variant has actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menosprotease activity, and wherein the variant has at least 90%, at least 95%, at least 96%, at least 97%, at least 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y98% or at least 99%, but less than 100% sequence identity to the mature polypeptide of SEQ ID NO: 3, and en donde la variante tiene una termoestabilidad incrementada medida como factor de mejora, HIF, en comparaciónwherein the variant has increased thermostability measured as enhancement factor, HIF, compared to con la proteasa de SEQ ID NO: 3, en donde la variante comprende al menos una sustitución seleccionada del grupowith the protease of SEQ ID NO: 3, wherein the variant comprises at least one substitution selected from the group que consiste en : A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, 139G, I39L, I39V,consisting of: A1T, S5I, S5K, S5L, S5Y, T9H, K25P, S29I, S29P, S29R, S30E, K32W, F38L, 139G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E,I39Y, D40F, D40G, D40H, D40N, D40P, Q41I, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, A46E, K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S,K49P, S50C, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L,I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74H, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L,D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82F, A82L, A82M, A82P, N87S, T93L, T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H,T93S, V94S, L96W, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G,F111K, F111S, F111Y, Q112R, G114L, N115A, N115C, N115K, N115P, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D,E117H, E117N, E117Q, E117S, I122K, I122R, I123A, N124L, N124V, G128A, G128E, G128F, G128L, G128S, S130D, S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N,S130G, S130L, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146I, T146L, T146N, I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M,I147S, K150F, K150L, K150R, N153A, N153L, N153M, N153P, N153R, N153Y, Q154A, Q154I, Q154L, Q154M, Q154N, Q154T, Q154V, N1571, N157L, Y159H, Q161 E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V,Q154N, Q154T, Q154V, N1571, N157L, Y159H, Q161E, T167F, I169F, I169S, D175I, D175N, Q182C, Q182T, Q182V, H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y,H185P, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213L, T213R, A216R, F217I, F217Y, V225Y, I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P,I228L, I228T, I228W, Y231I, S234Q, S237F, S237Q, A242I, A242L, A242V, G244S, S245P, T246S, S248Y, F258P, S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272I, S272K, S272L, S272R, S272T, S272V,S262P, V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271R, S272I, S272K, S272L, S272R, S272T, S272V, S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N,S272Y, T276L, T276Y, G278P, D280N, D280S, D280T, D280Y, C284A, C284G, F289Y, I293T, V296A, V296I, R299N, K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D,K305S, L308V, P313L, F314I, F314L, S317E, S317N, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W,L324Q, L324S, N325L, D326P, S329C, S329H, S329I, S329L, S329N, S329T, S329V, S329W, G330Q, S331W, S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S,S331Y, P333R, S336K, S336N, N338M, N338Q, N338R, P341S, K343A, K343H, K343S, K343T, K343V, G345S, D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L,D347I, P348Y, P355I, P355R, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, T362N, A363G, A363L, y V364I, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene unand V364I, and wherein the substitution at the one or more positions provides a protease variant having a aumento en la termoestabilidad medida como factor de mejora, HIF, de al menos 1,4.increase in thermostability measured as enhancement factor, HIF, of at least 1.4. 2. La variante de la reivindicación 1, que comprende al menos una sustitución seleccionada del grupo que consiste2. The variant of claim 1, comprising at least one substitution selected from the group consisting en : S5K, S5L, S5Y, T9H, K25P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P,In : S5K, S5L, S5Y, T9H, K25P, S29R, S30E, K32W, F38L, I39G, I39L, I39V, I39Y, D40F, D40G, D40H, D40N, D40P, Q411, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E,Q411, Q41V, F42C, F42K, F42S, F42Y, K45L, K45M, K45Y, A46C, K49P, S50I, S50L, S50M, S50Q, A53C, A53E, A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61 P, S62C, S62N, S62P,A53V, Q54I, Q54L, Q54M, Q54V, F55H, F55L, K57P, K57S, I59G, I59M, I59P, S60P, S61L, S61P, S62C, S62N, S62P, T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L,T64G, T64I, L67V, Q68V, Q68Y, T69C, E74R, D76L, D76R, Q77L, S78D, P79Y, S80L, E81A, E81H, E81K, E81L, E81P, E81Y, A82M, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K,E81P, E81Y, A82M, A82P, N87S, T93L, V94S, G99C, T102L, T102V, T103I, T103K, T103V, I105Q, D109H, D109K, D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115C, N115K, N115R, N115T, N115Y, E117D, E117G,D109M, D109Y, F111H, F111K, F111S, Q112R, G114L, N115C, N115K, N115R, N115T, N115Y, E117D, E117G, E117H, E117N, E117Q, E117S, I122R, N124L, G128F, G128S, S130G, S130N, S130P, L136K, G141T, Q142A,E117H, E117N, E117Q, E117S, I122R, N124L, G128F, G128S, S130G, S130N, S130P, L136K, G141T, Q142A, Q142F, Q142L, Q142N, N145V, T146A, T146L, T146N, I147S, K150L, N153M, N153P, N153R, Q154I, Q154L, Q154N,Q142F, Q142L, Q142N, N145V, T146A, T146L, T146N, I147S, K150L, N153M, N153P, N153R, Q154I, Q154L, Q154N, Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182T, Q182V, F199L, F199M, M200S, A205S,Q154T, Q154V, N157L, Q161E, T167F, I169F, D175N, Q182C, Q182T, Q182V, F199L, F199M, M200S, A205S, Q207H, Q207L, V209F, S210T, T213R, F217I, V225Y, I228L, I228T, I228W, S234Q, S237F, G244S, S245P, T246S,Q207H, Q207L, V209F, S210T, T213R, F217I, V225Y, I228L, I228T, I228W, S234Q, S237F, G244S, S245P, T246S, S248Y, F258P, S262P,V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271 R, S272K, S272L, S272R, S272V,S248Y, F258P, S262P,V266K, V266R, D267A, D267H, D267L, D267N, Q269L, V271R, S272K, S272L, S272R, S272V, S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, R299N, K305S, L308V, F314L, S317E,S272Y, T276Y, G278P, D280N, D280S, D280T, C284G, F289Y, I293T, V296A, R299N, K305S, L308V, F314L, S317E, S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, D326P, S329C, S329H, S329I, S329L,S317W, S318P, A319F, A319Q, K321L, K321Q, K321S, A322D, L324Q, L324S, D326P, S329C, S329H, S329I, S329L, S329N, S329W, G330Q, S331W, S331Y, S336K, S336N, P341S, K343A, K343H, K343S, K343T, G345S, D347I,S329N, S329W, G330Q, S331W, S331Y, S336K, S336N, P341S, K343A, K343H, K343S, K343T, G345S, D347I, P348Y, P355I, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, A363G, A363L, y V364I, y en donde laP348Y, P355I, A358L, A358P, A358R, A358Y, K359L, K359S, L361M, T362L, A363G, A363L, and V364I, and where the sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en lasubstitution at one or more positions provides a protease variant that has an increase in termoestabilidad medida como factor de mejora, HIF, de al menos 1,6.thermostability measured as enhancement factor, HIF, of at least 1.6. 3. Una variante de proteasa que comprenden una sustitución en una o más posiciones correspondientes a las3. A protease variant comprising a substitution at one or more positions corresponding to the posiciones 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61, 62, 66, 69, 76, 81, 87, 93, 96, 98, 101, 102,positions 20, 27, 29, 34, 40, 42, 45, 46, 50, 53, 54, 55, 58, 59, 60, 61, 62, 66, 69, 76, 81, 87, 93, 96, 98 , 101, 102, 103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145, 146, 148, 149, 150, 153, 154, 157, 159,103, 109, 110, 115, 117, 122, 124, 125, 127, 128, 130, 136, 141, 142, 145, 146, 148, 149, 150, 153, 154, 157, 159, 161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211, 213, 216, 219, 228, 231, 252, 253, 261, 266, 267, 272, 275, 276, 277, 280, 285, 288, 291, 292, 293, 294, 296, 299, 303,161, 164, 167, 182, 183, 184, 185, 188, 199, 200, 207, 208, 209, 210, 211, 213, 216, 219, 228, 231, 252, 253, 261, 266, 267, 272, 275, 276, 277, 280, 285, 288, 291, 292, 293, 294, 296, 299, 303, 308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 344, 345, 348, 356, 358, 359, 361, 362, 363, y 364 del308, 310, 317, 318, 319, 321, 326, 327, 336, 338, 341, 344, 345, 348, 356, 358, 359, 361, 362, 363, and 364 polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, alpolypeptide of SEQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de laleast 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% identity of the secuencia con el polipéptido maduro de SEQ ID NO: 3, en donde la variante comprende al menos una sustituciónsequence with the mature polypeptide of SEQ ID NO: 3, wherein the variant comprises at least one substitution seleccionada del grupo que consiste en : G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, N153R, N153Y, Q154C, Q154F, Q154G, Q154I, Q154K, Q154L, Q154M, Q154R, Q154T, Q154V, Q154W, Q154Y, N157A, N157E, N157F, N157M, N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, S183L, S183M, A184D, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211 F, T213F, T213H, T213I, T213L, T213N, T213R, T213S, T213W, T213Y, A216F, A216L, S219M, I228F, I228H, I228L, I228M, I228Q, 1228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y, S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361 E, L361M, L361 P, L361 R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362L, T362M, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364i, V364L, V364M, y V364S, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 1,37.A34R, D40S, D40Y, F42Y, K45L, K45Y, A46E, A46K, S50A, S50C, S50I, S50L, S50T, A53I, A53K, A53L, A53S, Q54L, F55R, D58M, I59M, I59P, S60C, S60E, S60P, S61D, S61P, S62C, S62N, S66F, S66L, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101F, P101L, P101M, P101R, T102C, T102I, T103V, D109P, D110W, N115P, E117D, E117F, E117G, E117L, E117W, E117Y, I122L, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153D, N153F, N153G, Q154C, Q154F, Q154G, Q154L, Q154M, Q154L, Q154V, Q154T, Q154V, Q154W, N157F, N157A, N157E, N157F, N157A, N154E N157Y, Y159F, Y159G, Y159H, Y159S, Q161A, A164L, T167D, T167V, Q182F, S183A, S183F, A184F, A184H, A184I, A184K, A184L, A184Q, A184R, A184S, A184T, A184V, A184W, A184Y, H185A, H185L, H185P, H185S, N188L, N188Q, M200L, Q207F, G208H, V209F, V209G, V209W, V209Y, S210E, S210L, S210R, S210T S210Y, P211 F, T213F, T213H, T213i, T213L, T213N, T213R, T216F, A216L, S219m, I228F, I228H, I228L, I228M, I228Q, 1228V, I228Y, Y231F, Y231S, S237F, S237I , S237K, S237L, G244L, G244N, G244P, G244R, G249C, N252F, N252K, N252S, R253C, V261A, V261G, V266C, V266R, D267S, S272I, S272K, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275A , Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, I277V, D280F, D280H, D280T, A285L, A285S, T288C, T288I, T288V, S291V, V292C, I293M, I293Y , S294T, S294V, V296L, R299P, A303C, A303F, A303H, A303S, A303V, G304H, G304K, G304P, G304R, G304S, G304Y, K305C, K305F, K305 H, K305I, K305L, K305M, K305S, K305T, K305Y, S306L, S306M, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317W, S317LK, S317LK, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S , N356L, N356Y, A358F, A358L, A358P, K359C, K359L, K359S, K359W, L361E, L361M, L361P, L361R, L361S, L361T, L361V, T362A, T362C, T362H, T362I, T362K, T362P, T362Q, T362R, T362V, T362Y, A363E, A363F, A363L, A363M, A363V, V364F, V364i, V364L, V364M, and V364S, and wherein substitution at one or more positions provides a protease variant having a increase in specific activity measured as enhancement factor, AIF, of at least 1.37. 4. La variante de la reivindicación 3, que comprende al menos una sustitución seleccionada del grupo que consiste en : G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, F42Y, K45L, K45Y, A46E, A46K, S50A, S50L, A53L, Q54L, F55R, I59M, I59P, S60E, S60P, S61D, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, D76Y, E81S, N87F, T93S, L96F, L96S, L96T, T98L, P101 F, P101L, P101M, P101 R, T102C, T102I, T103V, D109P, D110W, N115A, N115D, N115G, N115P, E117D, E117F, E117G, E117L, E117N, E117P, E117S, E117W, E117Y, N124D, N124I, N124K, N124L, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F, S130I, S130N, L136C, G141A, G141C, G141F, G141L, G141M, G141Q, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145F, N145G, N145I, N145L, N145P, N145R, N145S, N145V, N145W, T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153Y, Q154I, Q154K, Q154L, Q154M, Q154R, Q154W, N157F, N157Y, Y159H, Y159S, Q161A, T167D, Q182F,A184F,A184I, A184K, A184V, A184W, H185A, N188L, F199L, M200F, M200L, Q207F, G208H, G208Y, V209F, V209G, V209H, V209L, V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211F, T213F, T213I, T213L, T213N, T213R, T213S, T213W, A216F, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y, Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, N252F, V261A, V261G, V266C, V266R, D267S, S272I, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280M, D280N, D280S, D280T, A285S, T288C, T288V, I293Y, S294T, S294V, A303F, G304H, G304K, G304P, G304R, G304S, K305C, K305F, K305H, K305I, K305S, K305T, S306L, S306R, P307C, L308P, L308T, F310M, F310P, F310Y, S317A, S317C, S317G, S317H, S317I, S317K, S317L, S317R, S317W, S317Y, S318N, S318R, A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341 R, A344K, A344L, A344P, G345K, G345S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, K359W, L361 P, L361 R, T362C, T362H, T362I, T362K, T362M, T362R, T362Y, A363F, y V364M, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 2,0.4. The variant of claim 3, comprising at least one substitution selected from the group consisting of: G20L, G20R, T27S, S29A, S29C, S29L, S29N, S29P, S29R, A34L, A34N, A34R, F42Y, K45L, K45Y, A46E, A46K, S50A, S50L, A53L, Q54L, F55R, I59M, I59P, S60E, S60P, S61D, S61P, S62N, S66M, S66T, T69C, D76A, D76G, D76K, D76L, D76N, D76P, D76V, E117F E117L, E117N, E117P, E117S, E117W, E117Y, N124D, N124M, N124T, N124V, F125K, F125L, F125M, L127C, L127P, G128N, G128R, G128S, G128W, G128Y, S130D, S130F S130i, S130N, L136C, G141A, G141C, G141M, G141L, G141R, G141V, Q142A, Q142L, Q142M, Q142S, Q142W, N145L, N145P, N145R, N145S, N145V, N145W, N145V, N145W, N145V, N145W T146A, T146C, T146H, T146I, T146M, T146N, T146Q, T146R, T146V, T146W, S148G, A149V, K150F, N153Y, Q154I, Q154K, Q154L, Q154M, Q154R, Q1 54W, N157F, N157Y, Y159H, Y159S, Q161A, T167D, Q182F, A184F, A184I, A184W, H185A, N188L, F199L, M200F, M200L, Q207F, G209G, V209H, V209L, V209G V209N, V209W, V209Y, S210E, S210L, S210R, S210T, S210Y, P211F, T213L, T213N, T213R, T213S, T213W, A216F, S219M, I228F, I228H, I228L, I228M, I228Q, I228V, I228Y Y231F, Y231S, S237F, S237I, S237K, S237L, G244N, G249C, N252F, V261A, V261G, V266C, V266R, D267S, S272I, S272L, S272M, S272Q, S272R, S272T, S272Y, Q275F, Q275K, Q275L, Q275R, Q275V, T276F, T276R, T276V, I277L, I277V, D280F, D280H, D280T, A285S, T288C, T288V, I293Y, S294T, S294V, A303F, G304H, G304K, G304P, G304R, G304S, K305C, G304S K305F, K305H, K305i, K305S, K305T, S306L, S306R, P307C, L308P, L308T, F310M, S317C, S317G, S317H, S317R, S317L, S317R, S317W, S317Y, S318N, S318R, S318N, S318R, S318N, S318R A319F, A319W, K321R, K321S, D326P, V327C, V327T, S336R, N338H, N338S, N338T, P3411, P341N, P341R, A344K, A344L, A344P, G345K, G3 45S, P348G, P348L, P348S, N356L, N356Y, A358L, K359S, K359W, L361 P, L361 R, T362C, T362H, T362I, T362K, T362M, T362R, T362Y, A363F, and V364M, and where the substitution in the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 2.0. 5. La variante de la reivindicación 3, que comprende al menos una sustitución seleccionada del grupo que consiste en : A34N, A34R, D76A, D76K, D76L, D76N, D76Y, N87F, E117F, E117G, E117L, E117N, E117P, E117W, E117Y, G141L, G141M, Q142L, Q142M, Q142S, Q142W, T146H, T146N, Q154R, V209H, T276F, A285S, S294T, F310M, F310P, S317I, S317K, S317R, S317W, N338H, y G345S, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en la actividad específica medida como factor de mejora, AIF, de al menos 4,5.5. The variant of claim 3, comprising at least one substitution selected from the group consisting of: A34N, A34R, D76A, D76K, D76L, D76N, D76Y, N87F, E117F, E117G, E117L, E117N, E117P, E117W, Where the replacement at the one or more positions provides a protease variant having an increase in specific activity measured as enhancement factor, AIF, of at least 4.5. 6. La variante de cualquiera de las reivindicaciones 1-3, en donde la variante comprende una sustitución seleccionada del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S.6. The variant of any of claims 1-3, wherein the variant comprises a substitution selected from the group consisting of: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S. 7. La variante de acuerdo con la reivindicación 6, en donde la variante tiene una termoestabilidad incrementada medida como actividad residual después de estrés térmico durante 20 min a 56°C. 7. The variant according to claim 6, wherein the variant has increased thermostability measured as residual activity after thermal stress for 20 min at 56°C. 8. La variante de acuerdo con la reivindicación 7, en donde la actividad residual es de al menos el 50%, en particular al menos el 60%, al menos el 70%, al menos el 80%.8. The variant according to claim 7, wherein the residual activity is at least 50%, in particular at least 60%, at least 70%, at least 80%. 9. La variante de cualquiera de las reivindicaciones 6-8, en donde la variante comprende al menos tres sustituciones seleccionadas del grupo que consiste en: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S.9. The variant of any of claims 6-8, wherein the variant comprises at least three substitutions selected from the group consisting of: I39L, K57P, I59M, S66T, T102V, F111H, N115K, D267N, S272Y, Q275K, D280S . 10. La variante de la reivindicación 9, que comprende las sustituciones I39L+S66T+T102V o D267N+S272Y Q275K+D280S.10. The variant of claim 9, comprising the substitutions I39L+S66T+T102V or D267N+S272Y Q275K+D280S. 11. Las variantes de la reivindicación 10, que comprenden las sustituciones:11. The variants of claim 10, comprising the substitutions: 139L+S66T T102V;139L+S66T T102V; 139L+S66T+T102V+D267N S272Y+D280S;139L+S66T+T102V+D267N S272Y+D280S; I39L+K57P+I59M+S66T+T102V F111H+N115K+D267N+S272Y,I39L+K57P+I59M+S66T+T102V F111H+N115K+D267N+S272Y, 139L+K57P+I59M+S66T+T102V+ F111H+N115K+D280S; o139L+K57P+I59M+S66T+T102V+F111H+N115K+D280S; or D267N+S272Y+Q275K+D280S.D267N+S272Y+Q275K+D280S. 12. Una variante de proteasa que comprende al menos una sustitución correspondiente a las posiciones 2, 17, 22, 41, 41,42, 45, 46, 54, 55, 57, 59, 60, 61,62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291,292, 294, 296, 301, 307, 314, 329, 331,333, 336, 362, y 363 del polipéptido de SEQ ID NO: 3, y la variante tiene actividad proteasa, y en donde la variante tiene al menos 90%, al menos 95%, al menos 96%, al menos 97%, al menos 98% o al menos 99%, pero menos de 100% identidad de la secuencia con el polipéptido maduro de SEQ ID NO: 3, y en donde la variante comprende una sustitución en una o más posiciones seleccionada del grupo que consiste en : I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, F199Y, M200L, A205S, Q207N, V209P, P211 F, P211S, T213S, F217I, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271 F, V271I, V271K, V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, C284A, T288A, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, 1301T, P307T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, S336T, T362R, y A363T, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en el nivel de expresión en Aspergillus oryzae medido como factor de mejora, EIF, de al menos 1,38.12. A protease variant comprising at least one substitution corresponding to positions 2, 17, 22, 41, 41, 42, 45, 46, 54, 55, 57, 59, 60, 61, 62, 63, 64, 66, 69, 80, 82, 84, 87, 98, 99, 102, 103, 112, 114, 115, 129, 131, 134, 149, 159, 167, 169, 199, 200, 205, 207, 209, 211, 213, 217,242, 250, 266, 267, 269, 270, 271, 272, 274, 278, 279, 280, 284, 288, 291,292, 294, 296, 301, 307, 314, 329, 3,363 362, and 363 of the polypeptide of SEQ ID NO: 3, and the variant has protease activity, and wherein the variant has at least 90%, at least 95%, at least 96%, at least 97%, at least 98% or at least 99%, but less than 100% sequence identity to the mature polypeptide of SEQ ID NO: 3, and wherein the variant comprises a substitution at one or more positions selected from the group consisting of: I2L, A17P, P22V, Q41L, Q41T, Q41V, Q41Y, F42R, K45S, A46L, A46W, Q54R, Q54S, Q54V, Q54Y, F55L, F55N, F55T, F55Y, K57H, K57L, K57V, I59D, I59K, I59R, I59S, I59V, S60I, S60L, S60Q, S 60R, S60Y, S61A, S61F, S62H, S62I, S62L, S62R, S62V, T63A, T63E, T63G, T63R, T63V, T64C, T64D, T64M, S66G, T69A, T69F, T69P, T69R, T69Y, S80G, S80L, S80N, S80T, A82H, I84G, N87P, T98C, G99V, T102A, T102H, T103F, T103I, T103V, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129VS, E129VS, E129VS, E129VS, E129VS, E129VS, E129VS, E129VS, E129VS N131i, N131S, N131V, Q134A, Q134L, Q134R, A149D, Y159F, Y159L, T167A, T167L, T167S, T167W, I169S, Q207N, V209P, P211 F, P211S, T216, F217i, A242E, K250R I271I V271M, V271S, V271Y, S272A, S272N, G274R, G278S, V279I, D280Y, T288C, T288G, S291V, V292S, S294G, V296P, V296R, V296T, 1301T, P307T, F314L, S329D, S329V, S331A, S329D, S329V, S331A S331G, S331T, P333V, S336G, S336L, S336T, T362R, and A363T, and wherein substitution at one or more positions provides a protease variant having an au increase in expression level in Aspergillus oryzae measured as enhancement factor, EIF, of at least 1.38. 13. La variante de la reivindicación 12, que comprende al menos una sustitución seleccionada del grupo que consiste en : I2L, A17P, P22V, Q41L, Q41Y, F42R, Q54R, Q54S, Q54Y, F55N, F55T, K57L, K57V, I59D, I59S, I59V, S60L, S60Q, S60R, S60Y, S61F, S62L, S62V, T63A, T63E, T63R, T64C, T64D, T64M, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, N115Y, E129L, E129S, E129V, E129Y, N131I, N131S, N131V, Q134A, Q134L, Q134R, A149D, T167A, T167S, T167W, F199Y, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T, D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V271I, V271K, V271M, S272A, G274R, G278S, T288A, T288C, T288G, V296P, V296R, V296T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, y S336T, y en donde la sustitución en la una o más posiciones proporciona una variante de proteasa que tiene un aumento en el nivel de expresión medido como factor de mejora, EIF, de al menos 1,6.13. The variant of claim 12, comprising at least one substitution selected from the group consisting of: I2L, A17P, P22V, Q41L, Q41Y, F42R, Q54R, Q54S, Q54Y, F55N, F55T, K57L, K57V, I59D, I59S, I59V, S60L, S60Q, S60R, S60Y, S61F, S62L, S62V, T63A, T63E, T63R, T64C, T64D, T64M, Q112H, Q112M, Q112R, Q112S, G114A, G114C, G114L, G114P, E115LY, E115LY, N115LY, E129S, E129V, E129y, N131i, N131S, N131V, Q134R, A149D, T167A, T167S, T167W, F19y, A242E, K250R, V266A, V266F, V266L, V266S, V266T, V266Y, D267F, D267L, D267T D267V, Q269C, Q269F, Q269I, Q269S, Q269T, Q269V, Q269X, I270A, I270C, I270L, I270S, V271F, V271I, V271K, V271M, S272A, G274R, G278S, T288A, T288C, T288G, V296P, V296R, V296T, F314L, S329D, S329V, S331A, S331G, S331T, P333V, S336G, S336L, and S336T, and wherein the substitution at the one or more positions provides a protease variant that has an increased expression level measured as a factor of improvement, EIF, of at least 1.6. 14. Las variantes de cualquiera de las reivindicaciones 1-13, que tiene al menos el 85%, al menos el 90%, al menos el 91%, al menos el 92%, al menos el 93%, al menos el 94%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99%, pero menos del 100%, identidad de secuencia con la secuencia de aminoácidos de SEQ ID NO: 3.14. The variants of any of claims 1-13, having at least 85%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94% , at least 95%, at least 96%, at least 97%, at least 98%, or at least 99%, but less than 100% sequence identity to the amino acid sequence of SEQ ID NO: 3. 15. La variante de cualquiera de las reivindicaciones 1-14, en donde el número de sustituciones es 1-20, p. ej., 1-10 y 1 -5, tal como 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 sustituciones.15. The variant of any of claims 1-14, wherein the number of substitutions is 1-20, e.g. eg, 1-10 and 1-5, such as 1,2, 3, 4, 5, 6, 7, 8, 9, or 10 substitutions. 16. Un polinucleótido que codifica la variante de cualquiera de las reivindicaciones 1 -15.16. A polynucleotide encoding the variant of any of claims 1-15. 17. Una construcción de ácido nucleico que comprende el polinucleótido de la reivindicación 16. 17. A nucleic acid construct comprising the polynucleotide of claim 16. 18. Un vector de expresión, que comprende el polinucleótido de la reivindicación 16.18. An expression vector, comprising the polynucleotide of claim 16. 19. Una célula huésped recombinante que comprende el polinucleótido de la reivindicación 16.19. A recombinant host cell comprising the polynucleotide of claim 16. 20. Un método para producir una variante de proteasa, que comprende: cultivar la célula huésped de la reivindicación 19 bajo condiciones adecuadas para la expresión de la variante y, opcionalmente, recuperar la variante.20. A method of producing a protease variant, comprising: culturing the host cell of claim 19 under conditions suitable for expression of the variant and, optionally, recovering the variant. 21. Una composición que comprende una variante de cualquiera de las reivindicaciones 1 -15.21. A composition comprising a variant of any of claims 1-15. 22. La composición de la reivindicación 21, que comprende, además, una glucoamilasa y opcionalmente una alfaamilasa fúngica.22. The composition of claim 21, further comprising a glucoamylase and optionally a fungal alpha-amylase. 23. Un procedimiento para preparar un producto de la fermentación a partir de material que contiene almidón, que comprende sacarificar y fermentar simultáneamente material que contiene almidón utilizando enzimas que generan una fuente de hidratos de carbono y un organismo fermentador a una temperatura por debajo de la temperatura de gelatinización inicial de dicho material que contiene almidón en presencia de una proteasa variante de cualquiera de las reivindicaciones 1-15.23. A process for preparing a fermentation product from starch-containing material, comprising simultaneously saccharifying and fermenting starch-containing material using enzymes that generate a carbohydrate source and a fermenting organism at a temperature below initial gelatinization temperature of said starch-containing material in the presence of a variant protease of any of claims 1-15. 24. Un procedimiento para preparar un producto de la fermentación a partir de material que contiene almidón, que comprende las etapas de:24. A process for preparing a fermentation product from starch-containing material, comprising the steps of: (a) licuar material que contiene almidón en presencia de una alfa-amilasa;(a) liquifying starch-containing material in the presence of an alpha-amylase; (b) sacarificar el material licuado obtenido en la etapa (a) utilizando una glucoamilasa;(b) saccharifying the liquefied material obtained in step (a) using a glucoamylase; (c) fermentar utilizando un organismo fermentador;(c) fermenting using a fermenting organism; en donde una proteasa variante de cualquiera de las reivindicaciones 1 -15 está presente durante la etapa b) y/o c).wherein a variant protease of any of claims 1-15 is present during step b) and/or c). 25. El procedimiento de cualquiera de las reivindicaciones 23-24, en el que el producto de la fermentación es etanol y el organismo de fermentación es Saccharomyces cerevisiae.25. The process of any of claims 23-24, wherein the fermentation product is ethanol and the fermentation organism is Saccharomyces cerevisiae. 26. Célula huésped de acuerdo con la reivindicación 19, que expresa las variantes de cualquiera de las reivindicaciones 1-15, en donde la célula huésped es una célula de levadura, particularmente un Saccharomyces, tal como Saccharomyces cerevisiae. 26. Host cell according to claim 19, expressing the variants of any of claims 1-15, wherein the host cell is a yeast cell, particularly a Saccharomyces, such as Saccharomyces cerevisiae. 27. El procedimiento de cualquiera de las reivindicaciones 23-24, en el que la célula huésped de la reivindicación 26 se aplica como el organismo fermentador en la etapa de fermentación y el producto de fermentación es etanol. 27. The method of any of claims 23-24, wherein the host cell of claim 26 is applied as the fermenting organism in the fermentation step and the fermentation product is ethanol.
ES17746004T 2016-07-21 2017-07-14 Serine protease variants and polynucleotides encoding the same Active ES2884155T3 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16180498 2016-07-21
EP16195087 2016-10-21
PCT/EP2017/067881 WO2018015303A1 (en) 2016-07-21 2017-07-14 Serine protease variants and polynucleotides encoding same

Publications (1)

Publication Number Publication Date
ES2884155T3 true ES2884155T3 (en) 2021-12-10

Family

ID=59501395

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17746004T Active ES2884155T3 (en) 2016-07-21 2017-07-14 Serine protease variants and polynucleotides encoding the same

Country Status (8)

Country Link
US (1) US11891645B2 (en)
EP (1) EP3487995B1 (en)
CN (1) CN109661465A (en)
CA (1) CA3029479A1 (en)
DK (1) DK3487995T3 (en)
ES (1) ES2884155T3 (en)
MX (1) MX2019000743A (en)
WO (1) WO2018015303A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3028875A1 (en) * 2016-07-21 2018-01-25 Novozymes A/S Serine protease variants and polynucleotides encoding same
CA3029479A1 (en) 2016-07-21 2018-01-25 Novozymes A/S Serine protease variants and polynucleotides encoding same
KR102316445B1 (en) * 2019-11-29 2021-10-26 씨제이제일제당 주식회사 A novel serine protease variant
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3912590A (en) 1973-01-03 1975-10-14 Novo Industri As Procedure for liquefying starch
US4316956A (en) 1980-02-06 1982-02-23 Novo Industri A/S Fermentation process
US4335208A (en) 1980-03-11 1982-06-15 Novo Industri A/S Saccharification of starch hydrolysates
JPS57174089A (en) 1981-04-20 1982-10-26 Novo Industri As Chain dividing enzyme product
DK122686D0 (en) 1986-03-17 1986-03-17 Novo Industri As PREPARATION OF PROTEINS
ES2052565T3 (en) 1986-07-09 1994-07-16 Novo Nordisk As A PROCEDURE FOR LIQUIDATING A SUSPENSION OF STARCH OR GRAIN YELLOWS.
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
JP3016587B2 (en) 1989-12-04 2000-03-06 ザ・リサーチ・ファンデーション・オブ・ステート・ユニバーシティ・オブ・ニューヨーク Combination of non-steroidal anti-inflammatory drug and tetracycline
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
US5231017A (en) 1991-05-17 1993-07-27 Solvay Enzymes, Inc. Process for producing ethanol
DE4343591A1 (en) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Process for the evolutionary design and synthesis of functional polymers based on shape elements and shape codes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
JP3649338B2 (en) 1994-06-03 2005-05-18 ノボザイムス バイオテック,インコーポレイティド Purified Myserioftra laccase and nucleic acid encoding it
EP1559776A3 (en) 1994-06-30 2006-01-11 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic Fusarium expression system and promoters and terminators for use therein
ES2536878T3 (en) 1997-10-13 2015-05-29 Novozymes A/S Alpha-amylase mutants
DK1124949T3 (en) 1998-10-26 2006-11-06 Novozymes As Construction and screening of a DNA library of interest in filamentous fungal cells
CN100482801C (en) 1999-03-22 2009-04-29 诺沃奇梅兹有限公司 Promoters for expressing genes in fungal cell
US7314712B2 (en) 2001-07-27 2008-01-01 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Systems for in vivo site-directed mutagenesis using oligonucleotides
CN100448996C (en) 2002-01-23 2009-01-07 皇家奈达尔科股份有限公司 Fermentation of pentose sugars
WO2003066826A2 (en) 2002-02-08 2003-08-14 Genencor International, Inc. Methods for producing ethanol from carbon substrates
WO2004085627A1 (en) 2003-03-26 2004-10-07 Forskarpatent I Syd Ab New saccharomyces cerevisiae strains utilizing xylose
US7968318B2 (en) 2006-06-06 2011-06-28 Genencor International, Inc. Process for conversion of granular starch to ethanol
CN101965401B (en) 2008-03-07 2014-06-04 帝斯曼知识产权资产管理有限公司 A pentose sugar fermenting cell
CN102186982A (en) 2008-08-20 2011-09-14 诺维信公司 Processes for producing fermentation products
EP3415613A1 (en) 2008-12-24 2018-12-19 DSM IP Assets B.V. Xylose isomerase genes and their use in fermentation of pentose sugars
WO2011066576A1 (en) 2009-11-30 2011-06-03 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
ES2534067T3 (en) 2009-12-01 2015-04-17 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding them
US9040280B2 (en) 2009-12-11 2015-05-26 Novozymes A/S Protease variants
CA2815804A1 (en) 2010-11-08 2012-05-18 Novozymes A/S Polypeptides having glucoamylase activity and polynucleotides encoding same
ES2729385T3 (en) 2011-07-06 2019-11-04 Novozymes As Variants of alpha-amylase and polynucleotides that encode them
US10351834B2 (en) 2011-11-21 2019-07-16 Novozymes, Inc. GH61 polypeptide variants and polynucleotides encoding same
CN104884615B (en) * 2012-09-05 2019-07-12 诺维信公司 Polypeptide with proteinase activity
AU2015279057B2 (en) * 2014-06-27 2019-02-28 Dsm Ip Assets B.V. A method for improving the nutritional value of animal feed
CN108350444A (en) 2015-09-25 2018-07-31 诺维信公司 Serine protease is used to improve the purposes of ethanol production
CA3028875A1 (en) 2016-07-21 2018-01-25 Novozymes A/S Serine protease variants and polynucleotides encoding same
CA3029479A1 (en) 2016-07-21 2018-01-25 Novozymes A/S Serine protease variants and polynucleotides encoding same

Also Published As

Publication number Publication date
MX2019000743A (en) 2019-05-20
US20230193327A1 (en) 2023-06-22
WO2018015303A1 (en) 2018-01-25
EP3487995A1 (en) 2019-05-29
US11891645B2 (en) 2024-02-06
DK3487995T3 (en) 2021-07-26
CN109661465A (en) 2019-04-19
EP3487995B1 (en) 2021-05-26
CA3029479A1 (en) 2018-01-25

Similar Documents

Publication Publication Date Title
CA2904022C (en) Glucoamylase variants and polynucleotides encoding same
ES2656556T3 (en) Variants of glucoamylase and polynucleotides encoding them
US11447763B2 (en) Serine protease variants and polynucleotides encoding same
US11203790B2 (en) Glucoamylase variants and polynucleotides encoding same
US10724054B2 (en) Use of serine proteases for improving ethanol yield
ES2884155T3 (en) Serine protease variants and polynucleotides encoding the same
US20200165591A1 (en) Combined use of at least one endo-protease and at least one exo-protease in an ssf process for improving ethanol yield
US10316308B2 (en) Glucoamylase variants and polynucleotides encoding same and uses thereof
US11279921B2 (en) Glucoamylase variants and polynucleotides encoding same