ES2368285T3 - NEW GENES THAT CODIFY NEW PROTEOLITHIC ENZYMES. - Google Patents

NEW GENES THAT CODIFY NEW PROTEOLITHIC ENZYMES. Download PDF

Info

Publication number
ES2368285T3
ES2368285T3 ES08168496T ES08168496T ES2368285T3 ES 2368285 T3 ES2368285 T3 ES 2368285T3 ES 08168496 T ES08168496 T ES 08168496T ES 08168496 T ES08168496 T ES 08168496T ES 2368285 T3 ES2368285 T3 ES 2368285T3
Authority
ES
Spain
Prior art keywords
protease
protein
sequence
proteases
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES08168496T
Other languages
Spanish (es)
Inventor
Luppo Edens
Albertus Alard Van Dijk
Philipp Krusbasik
Kaj Albermann
Alexander Stock
Erik Kimpel
Sabine Klugbauer
Christian Wagner
Andreas Fritz
Wilk Von Gustedt
Oliver Heinrich
Dieter Maier
Fabio Spreafico
Ulrike Folkers
Sylvia Hopper
Wolfram Kemmner
Pamela Tan
Josephine Stiebler
Richard Albang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Application granted granted Critical
Publication of ES2368285T3 publication Critical patent/ES2368285T3/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Un polinucleótido aislado hibridable en condiciones muy restrictivas a polinucleótido SEC ID NO: 10 o a la secuencia SEC ID NO: 67, en el que dicho polinucleótido codifica una proteína que tiene actividad de proteasa.An isolated polynucleotide hybridizable under conditions very restrictive to polynucleotide SEQ ID NO: 10 or to the sequence SEQ ID NO: 67, wherein said polynucleotide encodes a protein that has protease activity.

Description

Nuevos genes que codifican nuevas enzimas proteolíticas New genes encoding new proteolytic enzymes

Campo de la invención Field of the Invention

La invención se refiere a secuencias polinucleotídicas nuevamente identificadas que comprenden genes que The invention relates to newly identified polynucleotide sequences comprising genes that

5 codifican nuevas proteasas aisladas de Aspergillus niger. La invención se refiere a la secuencia nucleotídica de longitud completa de los nuevos genes, a las secuencias de ADNc que comprenden las secuencias codificantes de longitud completa de las nuevas proteasas, así como a las secuencias de aminoácidos de las proteínas funcionales de longitud completa y fragmentos y variantes de las mismas. La invención también se refiere a métodos para usar estas enzimas en procesos industriales, y a métodos para diagnosticar infecciones fúngicas. También se incluyen en la invención células transformadas con un polinucleótido según la invención, y células en las que una proteasa según la invención se modifica genéticamente para potenciar o reducir su actividad y/o nivel de expresión. 5 encode new proteases isolated from Aspergillus niger. The invention relates to the full-length nucleotide sequence of the new genes, to the cDNA sequences comprising the full-length coding sequences of the new proteases, as well as to the amino acid sequences of the full-length functional proteins and fragments. and variants thereof. The invention also relates to methods for using these enzymes in industrial processes, and to methods for diagnosing fungal infections. Also included in the invention are cells transformed with a polynucleotide according to the invention, and cells in which a protease according to the invention is genetically modified to enhance or reduce its activity and / or level of expression.

Antecedentes de la invención Background of the invention

Enzimas proteolíticas Proteolytic enzymes

Las proteínas se pueden considerar heteropolímeros que consisten en bloques constructores de aminoácidos Proteins can be considered heteropolymers that consist of amino acid building blocks

15 conectados mediante un enlace peptídico. La unidad repetitiva en las proteínas es el átomo de carbono alfa central con un grupo amino y un grupo carboxilo. Excepto para la glicina, una denominada cadena lateral de aminoácidos sustituye uno de los dos átomos de hidrógeno del carbono alfa que quedan. La cadena lateral de aminoácidos hace asimétrico al carbono alfa central. En general, en las proteínas se encuentra el enantiómero L del aminoácido. Los siguientes términos describen los diversos tipos de aminoácidos polimerizados. Péptidos son cadenas cortas de restos de aminoácidos con una secuencia definida. Aunque realmente no hay un máximo al número de restos, el término indica habitualmente una cadena cuyas propiedades están determinadas principalmente por su composición de aminoácidos y que no tiene una conformación tridimensional fija. El término polipéptido se usa habitualmente para las cadenas más largas, habitualmente de secuencia y longitud definidas, y en principio de la longitud apropiada para plegarse en una estructura tridimensional. Proteína se reserva para polipéptidos que aparecen de 15 connected via a peptide link. The repetitive unit in proteins is the central alpha carbon atom with an amino group and a carboxyl group. Except for glycine, a so-called amino acid side chain replaces one of the two hydrogen atoms in the remaining alpha carbon. The amino acid side chain makes the central alpha carbon asymmetric. In general, the L-enantiomer of the amino acid is found in the proteins. The following terms describe the various types of polymerized amino acids. Peptides are short chains of amino acid residues with a defined sequence. Although there really is not a maximum to the number of residues, the term usually indicates a chain whose properties are mainly determined by its amino acid composition and which does not have a fixed three-dimensional conformation. The term polypeptide is usually used for longer chains, usually of defined sequence and length, and in principle of the appropriate length to fold into a three-dimensional structure. Protein is reserved for polypeptides that appear from

25 forma natural y que muestran una estructura tridimensional definida. En el caso en el que la función principal de las proteínas sea catalizar una reacción química, habitualmente se denomina una enzima. Las proteasas son las enzimas que catalizan la hidrólisis del enlace peptídico en (poli)péptidos y proteínas. 25 naturally and showing a defined three-dimensional structure. In the case where the main function of proteins is to catalyze a chemical reaction, it is usually called an enzyme. Proteases are the enzymes that catalyze the hydrolysis of the peptide bond in (poly) peptides and proteins.

En condiciones fisiológicas, las proteasas catalizan la hidrólisis del enlace peptídico. La Unión Internacional de Bioquímica y Biología Molecular (1984) ha recomendado usar el término peptidasa para el conjunto de hidrolasas del enlace peptídico (Subclase E.C 3.4.). Los términos proteasa y hidrolasa peptídica son sinónimos de peptidasa, y también se pueden usar aquí. Las proteasas comprenden dos clases de enzimas: las endopeptidasas y las exopeptidasas, que escinden enlaces peptídicos en puntos dentro de la proteína, y eliminan aminoácidos secuencialmente del término N o C respectivamente. Proteinasa se usa como sinónimo de endopeptidasa. El enlace peptídico se puede producir en el contexto de di-, tri-, tetrapéptidos, péptidos, polipéptidos o proteínas. En general, la Under physiological conditions, proteases catalyze the hydrolysis of the peptide bond. The International Union of Biochemistry and Molecular Biology (1984) has recommended using the term peptidase for the hydrolase set of the peptide bond (Subclass E.C 3.4.). The terms protease and peptide hydrolase are synonymous with peptidase, and can also be used here. Proteases comprise two classes of enzymes: endopeptidases and exopeptidases, which cleave peptide bonds at points within the protein, and remove amino acids sequentially from the term N or C respectively. Proteinase is used as a synonym for endopeptidase. The peptide bond can be produced in the context of di-, tri-, tetrapeptides, peptides, polypeptides or proteins. In general, the

35 composición de aminoácidos de péptidos y polipéptidos naturales comprende 20 aminoácidos diferentes, que muestran la configuración L (excepto para la glicina, que no tiene ningún centro quiral). Sin embargo, la actividad proteolítica de las proteasas no está limitada a péptidos que contienen sólo los 20 aminoácidos naturales. También se pueden escindir enlaces peptídicos entre los denominados aminoácidos no naturales, así como enlaces peptídicos entre aminoácidos modificados o análogos de aminoácidos. Algunas proteasas no aceptan los enantiómeros D de los aminoácidos en ciertas posiciones. En general, la notable estereoselectividad de las proteasas las hacen muy útiles en el proceso de la resolución química. Muchas proteasas muestran actividades secundarias interesantes, tales como actividad de esterasa, actividad de tiol esterasa y actividad de (des)amidasa. Estas actividades secundarias habitualmente no se limitan a aminoácidos solamente, y pueden ser muy útiles en bioconversiones en el área de productos químicos finos. The amino acid composition of natural peptides and polypeptides comprises 20 different amino acids, which show the L configuration (except for glycine, which has no chiral center). However, the proteolytic activity of proteases is not limited to peptides containing only the 20 natural amino acids. Peptide bonds can also be cleaved between so-called unnatural amino acids, as well as peptide bonds between modified amino acids or amino acid analogs. Some proteases do not accept the D enantiomers of amino acids in certain positions. In general, the remarkable stereoselectivity of proteases makes them very useful in the chemical resolution process. Many proteases show interesting secondary activities, such as esterase activity, thiol esterase activity and (des) amidase activity. These secondary activities are usually not limited to amino acids only, and can be very useful in bioconversions in the area of fine chemicals.

45 Hay un número de razones por las cuales las proteasas de hongos filamentosos, microorganismos eucariotas, son de particular interés. El proceso básico de escisión hidrolítica de enlaces peptídicos en las proteínas parece costosa y potencialmente perjudicial para un organismo si no se controla apropiadamente. Los límites deseados a la acción proteolítica se logran a través de la especificidad de proteinasas, mediante compartimentalización de proteasas y sustratos en la célula, a través de la modificación de los sustratos que permiten el reconocimiento por las proteasas respectivas, mediante regulación vía activación de cimógenos, y la presencia o ausencia de inhibidores específicos, así como a través de la regulación de la expresión génica de proteasas. En hongos, las proteasas también están implicadas en otros procesos celulares fundamentales, incluyendo el recambio proteico intracelular, el procesamiento, la translocación, la esporulación, la germinación y la diferenciación. De hecho, Aspergillus nidulans y Neurospora crassa se han usado como organismos modelo para analizar la base molecular de un abanico de 45 There are a number of reasons why filamentous fungal proteases, eukaryotic microorganisms, are of particular interest. The basic process of hydrolytic cleavage of peptide bonds in proteins seems costly and potentially harmful to an organism if not properly controlled. The desired limits to proteolytic action are achieved through the specificity of proteinases, by compartmentalization of proteases and substrates in the cell, through the modification of the substrates that allow recognition by the respective proteases, by regulation via activation of cytogens , and the presence or absence of specific inhibitors, as well as through the regulation of protease gene expression. In fungi, proteases are also involved in other fundamental cellular processes, including intracellular protein turnover, processing, translocation, sporulation, germination and differentiation. In fact, Aspergillus nidulans and Neurospora crassa have been used as model organisms to analyze the molecular basis of a range of

55 procesos fisiológicos y de desarrollo. Su genética permite el acceso directo a estudios bioquímicos y genéticos, en condiciones de nutrientes y de cultivo definidas. Además, se ha aislado un gran grupo de hongos patógenos para seres humanos, ganado y cosechas, y se ha sugerido que la proteolisis desempeña un papel en su patogenicidad (penetración del hospedante, mecanismos de defensa del hospedante opuestos y/o nutrición durante la infección). Las proteasas también se usan frecuentemente en procesos de laboratorio, clínicos e industriales; las proteasas 55 physiological and developmental processes. Its genetics allow direct access to biochemical and genetic studies, under defined nutrient and culture conditions. In addition, a large group of pathogenic fungi for humans, livestock and crops have been isolated, and it has been suggested that proteolysis plays a role in their pathogenicity (host penetration, opposing host defense mechanisms and / or nutrition during infection ). Proteases are also frequently used in laboratory, clinical and industrial processes; the proteases

tanto microbianas como no microbianas se usan ampliamente en la industria alimentaria (cocción, elaboración de cerveza, fabricación de quesos, ablandamiento de la carne), en la industria del curtido, y en la fabricación de detergentes biológicos (Aunstrup, 1980). El interés comercial a la hora de explotar ciertos hongos filamentosos, especialmente los Aspergilli, como hospedantes para la producción de proteínas tanto homólogas como heterólogas también ha renovado recientemente los intereses en las proteasas fúngicas (van Brunt, 1986ab). Las proteasas provocan a menudo problemas en la expresión heteróloga y en la sobreexpresión homóloga de proteínas en hongos. En particular, la expresión heteróloga está impedida por la degradación proteolítica de los productos expresados por proteasas homólogas. Estos intereses comerciales han dado como resultado estudios detallados de espectros proteolíticos y construcción de cepas deficientes en proteasas, y han mejorado el conocimiento sobre la expresión y regulación de las proteasas en estos organismos. En consecuencia, existe una gran necesidad de identificar y eliminar nuevas proteasas en hongos filamentosos. Both microbial and non-microbial are widely used in the food industry (cooking, brewing, cheese making, meat softening), in the tanning industry, and in the manufacture of biological detergents (Aunstrup, 1980). Commercial interest in exploiting certain filamentous fungi, especially Aspergilli, as hosts for the production of both homologous and heterologous proteins has also recently renewed the interests in fungal proteases (van Brunt, 1986ab). Proteases often cause problems in heterologous expression and homologous overexpression of protein in fungi. In particular, heterologous expression is prevented by proteolytic degradation of products expressed by homologous proteases. These commercial interests have resulted in detailed studies of proteolytic spectra and construction of protease deficient strains, and have improved knowledge about the expression and regulation of proteases in these organisms. Consequently, there is a great need to identify and eliminate new proteases in filamentous fungi.

Los microorganismos tales como, por ejemplo, hongos son particularmente útiles en la producción a gran escala de proteínas. En particular, cuando tales proteínas se segregan al medio. Las enzimas proteolíticas desempeñan un papel en estos procesos de producción. Por otro lado, en general se necesitan enzimas proteolíticas particulares para el procesamiento apropiado de la proteína diana y el bienestar metabólico del hospedante de la producción. Por otro lado, la degradación proteolítica puede disminuir significativamente el rendimiento de las proteínas segregadas. Un mal plegamiento en la ruta de secreción puede conducir a la degradación mediante proteasas intracelulares. Esto puede ser un problema particular a la hora de producir proteínas heterólogas. Los detalles de los procesos proteolíticos, que son responsables de la degradación de las proteínas que se desvían del proceso secretor en hongos, no se conocen exactamente. En eucariotas, la degradación de las proteínas celulares se logra mediante un proteasoma, y habitualmente implica el marcado con ubiquitina de las proteínas a degradar. En hongos, las proteasas proteasómicas y vaculares son también candidatos probables para la degradación proteolítica de proteínas secretoras malamente plegadas. La degradación proteolítica es probablemente citoplásmica, pero no se pueden excluir proteasas residentes en el retículo endoplásmico. Desde el punto de vista de la mejora de la cepa del hospedante de producción, el sistema proteolítico puede ser una diana interesante para la manipulación genética y mejora de la cepa de producción. Copias adicionales de genes de proteasas, la sobreexpresión de ciertas proteasas, la modificación del control transcripcional, así como los procedimientos de eliminación para la supresión de genes de proteasas pueden proporcionar una idea más detallada de la función de una proteasa dada. La supresión de genes que codifican proteasas puede ser una estrategia valiosa para la mejora de la cepa del hospedante, a fin de mejorar el rendimiento de producción para proteínas homólogas así como heterólogas. Microorganisms such as, for example, fungi are particularly useful in large-scale protein production. In particular, when such proteins are secreted to the medium. Proteolytic enzymes play a role in these production processes. On the other hand, in particular particular proteolytic enzymes are needed for the proper processing of the target protein and the metabolic well-being of the production host. On the other hand, proteolytic degradation can significantly decrease the yield of secreted proteins. Misfolding in the secretion pathway can lead to degradation by intracellular proteases. This can be a particular problem when it comes to producing heterologous proteins. The details of proteolytic processes, which are responsible for the degradation of proteins that deviate from the fungal secretory process, are not known exactly. In eukaryotes, the degradation of cellular proteins is achieved by a proteasome, and usually involves ubiquitin labeling of the proteins to be degraded. In fungi, proteasomal and vascular proteases are also likely candidates for proteolytic degradation of poorly folded secretory proteins. Proteolytic degradation is probably cytoplasmic, but proteases resident in the endoplasmic reticulum cannot be excluded. From the point of view of improving the strain of the production host, the proteolytic system can be an interesting target for genetic manipulation and improvement of the production strain. Additional copies of protease genes, overexpression of certain proteases, modification of transcriptional control, as well as elimination procedures for suppression of protease genes can provide a more detailed idea of the function of a given protease. The suppression of genes encoding proteases can be a valuable strategy for the improvement of the host strain, in order to improve the production yield for homologous as well as heterologous proteins.

Las proteasas microbianas eucariotas han sido revisadas por North (1982). Más recientemente, Suarez Rendueles y Wolf (1988) han repasado las proteasas de S. cerevisiae y su función. Eukaryotic microbial proteases have been reviewed by North (1982). More recently, Suarez Rendueles and Wolf (1988) have reviewed S. cerevisiae proteases and their function.

Aparte de la escisión hidrolítica de los enlaces, las proteasas también se pueden aplicar en la formación de enlaces. Enlaces, en este aspecto, comprenden no sólo enlaces peptídicos y amídicos, sino también enlaces de tipo éster. El hecho de que una proteasa catalice la escisión o la formación de un enlace particular depende en primer lugar de la termodinámica de la reacción. Una enzima tal como una proteasa no afecta el equilibrio de la reacción. El equilibrio depende de las condiciones particulares bajo las que se produce la reacción. En condiciones fisiológicas, la termodinámica de las reacciones favorece la hidrólisis del péptido, debido a la estructura termodinámicamente muy estable del producto zwitteriónico. Mediante la aplicación de principios físico-químicos a la influencia del equilibrio, o manipulando las concentraciones o la naturaleza de los agentes reaccionantes y productos, o explotando los parámetros cinéticos de la reacción enzimática, es posible aplicar proteasas con el fin de sintetizar enlaces peptídicos. La adición de disolventes orgánicos miscibles con agua disminuye el grado de ionización del componente carboxílico, incrementando de ese modo la concentración de sustrato disponible para la reacción. A menudo se emplean sistemas bifásicos, miméticos acuosos, micelas inversas, medios anhidros, o grupos amino y carboxilo modificados para invocar la precipitación de productos para mejorar los rendimientos. Cuando están disponibles las proteasas con las propiedades correctas, la aplicación de proteasas para la síntesis ofrece ventajas sustanciales. Puesto que las proteasas son estereoselectivas así como regioselectivas, los grupos sensibles en los agentes reaccionantes habitualmente no necesitan protección, y los agentes reaccionantes no necesitan ser ópticamente puros. Puesto que las condiciones de la síntesis enzimática son suaves, se puede evitar la racemización y descomposición de agentes reaccionantes o productos lábiles. Aparte de los enlaces entre aminoácidos, también otros compuestos que presentan un grupo amino primario, un grupo tiol o un grupo carboxilo se pueden enlazar mediante proteasas apropiadamente seleccionadas. Además, se pueden sintetizar ésteres, ésteres de tiol, y amidas, mediante ciertas proteasas. Se ha demostrado que la proteasa presenta regioselectividad en la acilación de mono-, di- y trisacáridos, nucleósidos, y riboflavina. Mediante la formulación apropiada, se pueden evitar problemas con la estabilidad en las condiciones de reacción algunas veces duras. El encapsulamiento y la inmovilización no sólo estabilizan enzimas, sino también permiten la recuperación y separación fáciles a partir del medio de reacción. La reticulación amplia, el tratamiento con aldehídos, o el recubrimiento de la superficie con ciertos polímeros, tales como dextranos, polietilenglicol, poliiminas, pueden prolongar sustancialmente el tiempo de vida del biocatalizador. Apart from the hydrolytic cleavage of the bonds, proteases can also be applied in bond formation. Links, in this aspect, comprise not only peptide and amide links, but also ester type links. The fact that a protease catalyzes the cleavage or the formation of a particular bond depends primarily on the thermodynamics of the reaction. An enzyme such as a protease does not affect the equilibrium of the reaction. The balance depends on the particular conditions under which the reaction occurs. Under physiological conditions, the thermodynamics of the reactions favors the hydrolysis of the peptide, due to the thermodynamically very stable structure of the zwitterionic product. By applying physical-chemical principles to the influence of equilibrium, or by manipulating the concentrations or the nature of the reactants and products, or by exploiting the kinetic parameters of the enzymatic reaction, it is possible to apply proteases in order to synthesize peptide bonds. The addition of water-miscible organic solvents decreases the degree of ionization of the carboxylic component, thereby increasing the concentration of substrate available for the reaction. Biphasic systems, aqueous mimetics, reverse micelles, anhydrous media, or modified amino and carboxyl groups are often employed to invoke the precipitation of products to improve yields. When proteases with the correct properties are available, the application of proteases for synthesis offers substantial advantages. Since proteases are stereoselective as well as regioselective, sensitive groups in the reactants do not usually need protection, and the reactants do not need to be optically pure. Since the conditions of enzymatic synthesis are mild, racemization and decomposition of reactants or labile products can be avoided. Apart from the linkages between amino acids, also other compounds that have a primary amino group, a thiol group or a carboxyl group can be linked by appropriately selected proteases. In addition, esters, thiol esters, and amides can be synthesized by certain proteases. The protease has been shown to show regioselectivity in the acylation of mono-, di- and trisaccharides, nucleosides, and riboflavin. By proper formulation, problems with stability in the sometimes harsh reaction conditions can be avoided. Encapsulation and immobilization not only stabilize enzymes, but also allow easy recovery and separation from the reaction medium. Extensive crosslinking, treatment with aldehydes, or surface coating with certain polymers, such as dextrans, polyethylene glycol, polyimines, can substantially prolong the lifetime of the biocatalyst.

Los papeles naturales de las proteasas The natural roles of proteases

Tradicionalmente, las proteasas se han considerado como enzimas degradantes, capaces de escindir proteínas en pequeños péptidos y/o aminoácidos, y cuyo papel es digerir la proteína nutriente o participar en el recambio de las proteínas celulares. Además, se ha demostrado que las proteasas también desempeñan papeles importantes en una Traditionally, proteases have been considered as degrading enzymes, capable of cleaving proteins into small peptides and / or amino acids, and whose role is to digest the nutrient protein or participate in the turnover of cellular proteins. In addition, it has been shown that proteases also play important roles in a

amplia variedad de procesos celulares, vía mecanismos de modificación selectiva mediante proteolisis limitada, y de este modo pueden tener funciones reguladoras esenciales (Holzer y Tschensche 1979; Holzer y Heinrich, 1980). Se supone que la especificidad de una proteinasa está estrechamente relacionada con su función fisiológica y su modo de expresión. Con respecto a la función de una proteasa particular, su localizaciones es a menudo muy importante; por ejemplo, una gran cantidad de las proteasas vacuolares y periplásmicas están implicadas en la degradación proteica, mientras que muchas de las proteasas unidas a la membrana son importantes en el procesamiento proteico (Suarez Rendueles y Wolf, 1988). Los diferentes papeles de las proteasas en muchos procesos celulares se pueden dividir en cuatro funciones principales de las proteasas: 1) degradación proteica, 2) procesamiento posttraduccional e (in)activación de proteínas específicas, 3) morfogénesis, y 4) patogénesis. wide variety of cellular processes, via mechanisms of selective modification by limited proteolysis, and thus can have essential regulatory functions (Holzer and Tschensche 1979; Holzer and Heinrich, 1980). It is assumed that the specificity of a proteinase is closely related to its physiological function and its mode of expression. With regard to the function of a particular protease, its locations are often very important; for example, a large number of vacuolar and periplasmic proteases are involved in protein degradation, while many of the membrane-bound proteases are important in protein processing (Suarez Rendueles and Wolf, 1988). The different roles of proteases in many cellular processes can be divided into four main protease functions: 1) protein degradation, 2) post-translational processing and (in) activation of specific proteins, 3) morphogenesis, and 4) pathogenesis.

Un papel obvio para las proteasas en organismos que utilizan proteína como fuente nutriente está en la hidrólisis de los nutrientes. En hongos, esto implicaría la degradación fuera de las células mediante proteasas de amplia especificidad extracelulares. La degradación proteica también es importante para el recambio rápido de las proteínas celulares, y permite que las células eliminen proteínas anormales y adapten su complemento de proteína a las condiciones fisiológicas cambiantes. Generalmente, las proteasas de especificidad más bien amplia deberían ser extremadamente bien controladas a fin de proteger a la célula de la degradación aleatoria de proteínas diana distintas de las correctas. An obvious role for proteases in organisms that use protein as a nutrient source is in the hydrolysis of nutrients. In fungi, this would involve degradation outside the cells by means of proteases of broad extracellular specificity. Protein degradation is also important for the rapid turnover of cellular proteins, and allows cells to eliminate abnormal proteins and adapt their protein complement to changing physiological conditions. Generally, rather broad specificity proteases should be extremely well controlled in order to protect the cell from random degradation of target proteins other than the correct ones.

Contrariamente a la hidrólisis, la síntesis de polipéptidos se produce in vivo mediante un proceso conducido por ATP en el ribosoma. A fin de cuentas, la secuencia en la que se enlazan los aminoácidos está dictada por la información derivada del genoma. Este proceso se conoce como transcripción. Los productos primarios de la traducción son a menudo más largos que los productos funcionales finales, y después de la transcripción habitualmente se necesita un procesamiento adicional de tales proteínas precursoras mediante proteasas. Las proteasas desempeñan un papel clave en la maduración de tales proteínas precursoras para obtener la proteína funcional final. En contraste con el recorte y remodelado muy controlados de las proteínas, las proteasas pueden ser también muy destructivas, y pueden degradar completamente polipéptidos en péptidos y aminoácidos. A fin de evitar que la actividad proteolítica se dispare antes de lo necesario, las proteasas se someten a una intensa regulación. Muchas proteasas se sintetizan como precursores más grandes, conocidos como cimógenos, que se activarán cuando se necesite. De forma notable, esta activación siempre se produce mediante proteolisis. Aparte de la implicación directa en el procesamiento, la activación e inactivación selectivas de proteínas individuales son fenómenos bien conocidos catalizados por proteasas específicas. Contrary to hydrolysis, polypeptide synthesis occurs in vivo by an ATP driven process in the ribosome. After all, the sequence in which the amino acids are linked is dictated by the information derived from the genome. This process is known as transcription. The primary translation products are often longer than the final functional products, and after transcription, additional processing of such precursor proteins by proteases is usually required. Proteases play a key role in the maturation of such precursor proteins to obtain the final functional protein. In contrast to the highly controlled clipping and remodeling of proteins, proteases can also be very destructive, and can completely degrade polypeptides into peptides and amino acids. In order to prevent proteolytic activity from firing earlier than necessary, proteases are subject to intense regulation. Many proteases are synthesized as larger precursors, known as cytogens, which will be activated when needed. Notably, this activation always occurs by proteolysis. Apart from direct involvement in processing, selective activation and inactivation of individual proteins are well known phenomena catalyzed by specific proteases.

La selectividad de la proteolisis limitada parece residir más directamente en la interacción proteinasa-sustrato. La especificidad puede derivar de la enzima proteolítica, que sólo reconoce secuencias diana de aminoácidos específicas. Por otro lado, pueden ser el resultado de la exposición selectiva del “sitio de procesamiento” en ciertas condiciones, tales como pH, fuerza iónica o modificaciones secundarias, permitiendo así que una proteasa de otro modo no específica catalice un suceso muy específico. Un ejemplo de este último tipo lo da la activación de cimógenos vaculares por proteolisis limitada. The limited proteolysis selectivity seems to reside more directly in the proteinase-substrate interaction. The specificity can be derived from the proteolytic enzyme, which only recognizes specific amino acid target sequences. On the other hand, they may be the result of selective exposure of the "processing site" under certain conditions, such as pH, ionic strength or secondary modifications, thus allowing a non-specific protease to catalyze a very specific event. An example of the latter type is the activation of vascular cymogens by limited proteolysis.

La morfogénesis o diferenciación se puede definir como una serie regulada de sucesos que conducen a cambios de un estado a otro en un organismo. Aunque en muchos casos no se podrían establecer relaciones directas entre proteasas y efectos morfológicos, los signos presentes sugieren una implicación significativa de las proteasas en la morfogénesis fúngica; aparte del recambio proteico amplio observado durante la diferenciación, esporulación, y germinación de las esporas, se piensa que las proteasas están implicadas directamente en procesos normales como la ramificación de la punta hífica y formación del tabique (Deshpande, 1992). Morphogenesis or differentiation can be defined as a regulated series of events that lead to changes from one state to another in an organism. Although in many cases direct relationships between proteases and morphological effects could not be established, the signs present suggest a significant implication of proteases in fungal morphogenesis; Apart from the wide protein turnover observed during the differentiation, sporulation, and germination of spores, it is thought that proteases are directly involved in normal processes such as branching of the water tip and formation of the septum (Deshpande, 1992).

Las especies de Aspergillus, en particular A. fumigatus y A. flavus, han estado implicadas como agentes etiológicos de un número de enfermedades en seres humanos y animales, denominadas aspergilosis (Bodey y Vartivarian, 1989). Se ha sugerido repetidamente que las proteasas están implicadas en la virulencia de A. fumigatus y A. flavus, puesto que hay muchos estudios que relacionan las proteasas segregadas y la virulencia de las bacterias. De hecho, la mayoría de las infecciones humanas debidas a la especie Aspergillus se caracterizan por una degradación amplia del parénquima del pulmón, que está compuesto principalmente de colágeno y elastina (Campbell et al., 1994). La investigación se ha centrado en el papel putativo de las proteasas segregadas en la virulencia de A. fumigatus y A. flavus, que son los patógenos humanos principales y se sabe que poseen actividades elastinolítica y colagénica (Kolattukudy et al., 1993). Se demostró que estas actividades elastinolíticas se correlacionan in vitro con la infectividad en ratones (Kothary et al., 1984). Se sabe que dos proteasas segregadas son producidas por A. fumigatus y A. flavus, una serina proteasa alcalina (ALP) y una metaloproteasa neutra (MEP). En, A. fumigatus, los dos genes que codifican estas proteasas, se aislaron, caracterizaron y rompieron (Reicherd et al, 1990; Tang et al, 1992, 1993; Jaton-Ogay et al., 1994). Sin embargo, mutantes dobles alp mep no mostraron diferencias en la patogenicidad cuando se compararon con cepas de tipo salvaje. Por lo tanto, se debe de concluir que las proteasas de A. fumigatus segregadas identificadas in vitro no son factores esenciales para la invasión de tejido (Jaton Ogay et al., 1994). Aunque A. fumigatus da cuenta sólo de una pequeña proporción de las esporas del moho portadas por el aire, es el hongo aislado más frecuentemente del pulmón y del esputo (Schmitt et al., 1991). Otras explicaciones para la virulencia del hongo podría ser que las condiciones en los bronquios (temperatura y nutrientes) sean favorables para el crecimiento parasitario de A. fumigatus. Como consecuencia, la aspergilosis invasiva podría ser un suceso circunstancial, cuando las defensas patógenas del hospedante se han debilitado por tratamientos inmunosupresores o enfermedades como SIDA. Aspergillus species, in particular A. fumigatus and A. flavus, have been implicated as etiologic agents of a number of diseases in humans and animals, called aspergillosis (Bodey and Vartivarian, 1989). It has been repeatedly suggested that proteases are involved in the virulence of A. fumigatus and A. flavus, since there are many studies that relate segregated proteases and the virulence of bacteria. In fact, most human infections due to the Aspergillus species are characterized by extensive degradation of the lung parenchyma, which is mainly composed of collagen and elastin (Campbell et al., 1994). Research has focused on the putative role of segregated proteases in the virulence of A. fumigatus and A. flavus, which are the main human pathogens and are known to possess elastinolytic and collagenic activities (Kolattukudy et al., 1993). It was shown that these elastinolytic activities correlate in vitro with infectivity in mice (Kothary et al., 1984). It is known that two secreted proteases are produced by A. fumigatus and A. flavus, an alkaline serine protease (ALP) and a neutral metalloprotease (MEP). In, A. fumigatus, the two genes encoding these proteases, were isolated, characterized and broken (Reicherd et al, 1990; Tang et al, 1992, 1993; Jaton-Ogay et al., 1994). However, double alp mep mutants showed no differences in pathogenicity when compared to wild type strains. Therefore, it must be concluded that the secreted A. fumigatus proteases identified in vitro are not essential factors for tissue invasion (Jaton Ogay et al., 1994). Although A. fumigatus accounts for only a small proportion of airborne mold spores, it is the fungus most frequently isolated from the lung and sputum (Schmitt et al., 1991). Other explanations for the virulence of the fungus could be that the conditions in the bronchi (temperature and nutrients) are favorable for the parasitic growth of A. fumigatus. As a consequence, invasive aspergillosis could be a circumstantial event, when the host's pathogenic defenses have been weakened by immunosuppressive treatments or diseases such as AIDS.

Se conocen cuatro clases importantes de proteasas, y se designan por los grupos funcionales principales en su sitio activo: las “serina”, las “tiol” o “cisteína”, las “aspártico” o “carboxil” y las “metalo” proteasas. En Methods in Enzymology parte 244 y 248 (A.J. Barrett ed., 1994 y 1995) se puede encontrar un repaso detallado del estado de la técnica de estas clases principales de proteasas, clases minoritarias y proteasas sin clasificar. Four important classes of proteases are known, and they are designated by the main functional groups in their active site: the "serine", the "thiol" or "cysteine", the "aspartic" or "carboxyl" and the "metallo" proteases. In Methods in Enzymology part 244 and 248 (A.J. Barrett ed., 1994 and 1995) a detailed review of the state of the art of these main classes of proteases, minor classes and unclassified proteases can be found.

Especificidad de las proteasas Protease specificity

Aparte de la maquinaria catalítica de las proteasas, otro aspecto importante de las enzimas proteolíticas es la especificidad de las proteasas. La especificidad de una proteasa indica qué sustratos es probable que hidrolice la proteasa. Los veinte aminoácidos naturales ofrecen un gran número de posibilidades para construir péptidos. Por ejemplo, con veinte aminoácidos, se pueden construir alrededor de 400 dipéptidos y 800 tripéptidos diferentes, etc. Con péptidos más largos, el número de posibilidades será casi ilimitado. Ciertas proteasas hidrolizan sólo secuencias particulares en una posición muy específica. La interacción de la proteasa con el sustrato peptídico puede englobar uno hasta diez restos de aminoácidos del sustrato peptídico. Con sustratos proteinosos grandes, puede haber incluso más restos del sustrato que interaccionen con las proteasas. Sin embargo, esto implica probablemente interacciones menos específicas con restos de proteasas fuera de la hendidura de unión del sitio activo. En general, el reconocimiento específico está restringido al péptido lineal, que se une al sitio activo de la proteasa. Apart from the catalytic machinery of proteases, another important aspect of proteolytic enzymes is the specificity of proteases. The specificity of a protease indicates which substrates are likely to hydrolyse the protease. The twenty natural amino acids offer a large number of possibilities to build peptides. For example, with twenty amino acids, about 400 dipeptides and 800 different tripeptides, etc. can be constructed. With longer peptides, the number of possibilities will be almost unlimited. Certain proteases hydrolyse only particular sequences in a very specific position. The interaction of the protease with the peptide substrate can encompass one to ten amino acid residues of the peptide substrate. With large protein substrates, there may be even more substrate residues that interact with proteases. However, this probably implies less specific interactions with protease residues outside the binding slit of the active site. In general, specific recognition is restricted to the linear peptide, which binds to the active site of the protease.

La nomenclatura para describir la interacción de un sustrato con una proteasa ha sido introducida en 1967 por Schechter y Berger (Biochem. Biophys. Res. Com., 1967, 27, 157-162), y ahora se usa ampliamente en la bibliografía. En este sistema, se considera que los restos de aminoácidos del sustrato polipeptídico se unen a los denominados subsitios en el sitio activo. Por convención, estos subsitios en la proteasa se denominan S (para subsitios), y los restos de aminoácidos correspondientes se denominan P (por péptido). Los restos de aminoácidos del lado N-terminal del enlace escindible se numeran P3, P2, P1, y aquellos restos del lado C-terminal se numeran P1’, P2’, P3’. Los restos de P1 o P1’ son los restos de aminoácidos situados cerca del enlace escindible. Los restos del sustrato alrededor del sitio de escisión se pueden numerar entonces hasta P8. Los subsitios correspondientes en la proteasa que complementan a los restos de unión del sustrato se numeran S3, S2, S1, S1’, S2’, S3’, etc. Las preferencias de los subsitios en el sitio de unión al péptido determinan la preferencia de la proteasa para escindir ciertas secuencias de aminoácidos específicas en un punto particular. La secuencia de aminoácidos del sustrato se debería conformar con las preferencias mostradas por los subsitios. La especificidad por un cierto sustrato depende claramente tanto de la afinidad de unión por el sustrato como por la velocidad a la que subsiguientemente se hidroliza el enlace escindible. Por lo tanto, la especificidad de una proteasa por cierto sustrato está indicada habitualmente por su relación kcat/Km, mejor conocida como la constante de especificidad. En esta constante de especificidad, kcat representa la velocidad de recambio, y Km es la constante de disociación. The nomenclature to describe the interaction of a substrate with a protease has been introduced in 1967 by Schechter and Berger (Biochem. Biophys. Res. Com., 1967, 27, 157-162), and is now widely used in the literature. In this system, the amino acid residues of the polypeptide substrate are considered to bind to the so-called active site subsites. By convention, these protease subsites are called S (for subsites), and the corresponding amino acid residues are called P (per peptide). The amino acid residues on the N-terminal side of the cleavable link are numbered P3, P2, P1, and those residues on the C-terminal side are numbered P1 ’, P2’, P3 ’. The P1 or P1 ’residues are the amino acid residues located near the cleavable link. The remains of the substrate around the cleavage site can then be numbered up to P8. The corresponding subsites in the protease that complement the substrate binding residues are numbered S3, S2, S1, S1 ’, S2’, S3 ’, etc. The preferences of the subsites at the peptide binding site determine the preference of the protease to cleave certain specific amino acid sequences at a particular point. The amino acid sequence of the substrate should conform to the preferences shown by the subsites. The specificity for a certain substrate clearly depends both on the binding affinity for the substrate and on the rate at which the cleavable link is subsequently hydrolyzed. Therefore, the specificity of a protease by a certain substrate is usually indicated by its ratio kcat / Km, better known as the specificity constant. In this specificity constant, kcat represents the replacement speed, and Km is the dissociation constant.

Aparte de los restos de aminoácidos implicados en la catálisis y unión, las proteasas contienen muchos otros restos de aminoácidos esenciales. Algunos restos son críticos en el plegamiento, algunos restos mantienen la arquitectura tridimensional global de la proteasa, algunos restos pueden estar implicados en la regulación de la actividad proteolítica, y algún resto puede dirigir a la proteasa hacia una localización particular. Muchas proteasas contienen, fuera del sitio activo, uno o más sitios de unión para iones metálicos. Estos iones metálicos desempeñan a menudo un papel en la estabilización de la estructura. Además las proteasas microbianas eucariotas segregadas se pueden glucosilar ampliamente. Se produce tanto en la glucosilación enlazada mediante N como mediante O. La glucosilación puede ayudar al plegamiento de las proteínas, puede incrementar la solubilidad, prevenir la agregación y, como tal, estabilizar la proteína madura. Además, el grado de glucosilación puede influir en la secreción así como en la unión a agua por la proteína. Apart from the amino acid residues involved in catalysis and binding, proteases contain many other essential amino acid residues. Some residues are critical in folding, some residues maintain the overall three-dimensional architecture of the protease, some residues may be involved in the regulation of proteolytic activity, and some remainder may direct the protease to a particular location. Many proteases contain, outside the active site, one or more binding sites for metal ions. These metal ions often play a role in the stabilization of the structure. In addition, segregated eukaryotic microbial proteases can be widely glycosylated. It occurs both in N-linked and O-linked glycosylation. Glycosylation can help protein folding, increase solubility, prevent aggregation and, as such, stabilize the mature protein. In addition, the degree of glycosylation can influence secretion as well as water binding by the protein.

Regulación de la actividad proteolítica Regulation of proteolytic activity

Un número sustancial de proteasas están sometidas a regulación amplia de la actividad proteolítica a fin de evitar daño proteolítico indeseado. Hasta cierto grado, esta regulación tiene lugar a nivel transcripcional. Por ejemplo, en hongos, parece que la transcripción de genes de proteasas segregados es sensible a fuentes externas de carbono y nitrógeno, mientras que los genes que codifican proteasas intracelulares son insensibles. El pH extracelular es sentido por los hongos, y algunos genes están regulados por el pH. En este proceso, las proteínas reguladoras transcripcionales desempeñan un papel crucial. A menudo, el procesamiento proteolítico de tales proteínas reguladoras es el interruptor que enciende o apaga a las proteínas reguladoras. A substantial number of proteases are subject to broad regulation of proteolytic activity in order to avoid unwanted proteolytic damage. To some extent, this regulation takes place at the transcriptional level. For example, in fungi, it seems that the transcription of secreted protease genes is sensitive to external sources of carbon and nitrogen, while genes encoding intracellular proteases are insensitive. Extracellular pH is felt by fungi, and some genes are regulated by pH. In this process, transcriptional regulatory proteins play a crucial role. Often, proteolytic processing of such regulatory proteins is the switch that turns the regulatory proteins on or off.

Las proteasas están sometidas a regulación intra- así como intermolecular. Esto implica ciertos aminoácidos en la molécula enzimática proteolítica que son esenciales para tal regulación. Las proteasas se sintetizan típicamente como precursores más grandes, conocidos como cimógenos, que son catalíticamente inactivos. Habitualmente, la extensión de la cadena peptídica que hace inactiva a la proteasa precursora está localizada en el término amino de la proteasa. El precursor se conoce mejor como pro-proteína. Puesto que muchas de las proteasas procesadas de esta manera son segregadas desde las células, contienen además una secuencia señal (presecuencia), de manera que el precursor completo se sintetiza como una pre-pro-proteína. Aparte de hacer inactiva a la proteasa, el propéptido es a menudo esencial para mediar el plegamiento productivo. Los ejemplos de proteasas incluyen serina proteasas (proteasa lítica alfa, subtilisina, acualisina, prohormona convertasa), tiol proteasas (catepsina L y cruciano), proteasas aspárticas (proteinasa A y catepsina D), y metaloproteasas. Además, el pro-péptido puede Proteases are subject to intra-as well as intermolecular regulation. This implies certain amino acids in the proteolytic enzyme molecule that are essential for such regulation. Proteases are typically synthesized as larger precursors, known as cytogens, that are catalytically inactive. Usually, the extension of the peptide chain that inactivates the precursor protease is located in the amino terminus of the protease. The precursor is better known as pro-protein. Since many of the proteases processed in this way are secreted from the cells, they also contain a signal sequence (pre-sequence), so that the entire precursor is synthesized as a pre-pro-protein. Apart from making the protease inactive, the propeptide is often essential to mediate productive folding. Examples of proteases include serine proteases (lytic protease alpha, subtilisin, acualisin, prohormone convertase), thiol proteases (cathepsin L and crucian), aspartic proteases (proteinase A and cathepsin D), and metalloproteases. In addition, the pro-peptide can

desempeñar un papel en el transporte celular, ya sea solo o conjuntamente con péptidos señal. Esto puede facilitar la interacción con chaperonas celulares, o puede facilitar el transporte a lo largo de la membrana. El tamaño de la extensión en la pre-pro-proteína precursora puede variar sustancialmente, oscilando desde un fragmento peptídico corto hasta un polipéptido, que puede existir como una unidad de plegamiento autónoma. En particular, a menudo se observa que estas extensiones más grandes son inhibidores potentes de la proteasa, incluso después de la escisión a partir de la proteasa. Se observó que, incluso después de la escisión, tales pro-péptidos podrían ayudar en el plegamiento apropiado de las proteasas. Como tales, se podría considerar que los pro-péptidos funcionan como chaperonas moleculares, y la coexpresión separada o adicional de tales pro-péptidos podría ser ventajosa para la producción de proteasas. play a role in cell transport, either alone or in conjunction with signal peptides. This may facilitate interaction with cell chaperones, or may facilitate transport along the membrane. The size of the extension in the pre-pro-precursor protein can vary substantially, ranging from a short peptide fragment to a polypeptide, which can exist as an autonomous folding unit. In particular, it is often observed that these larger extensions are potent protease inhibitors, even after cleavage from the protease. It was noted that, even after cleavage, such pro-peptides could help in the proper folding of proteases. As such, it could be considered that pro-peptides function as molecular chaperones, and separate or additional co-expression of such pro-peptides could be advantageous for the production of proteases.

Hay una diferencia sustancial en el nivel de regulación entre proteasas que son segregadas en el medio y proteasas que quedan intracelularmente. Las proteasas segregadas en el medio habitualmente ya no están sujetas, después de la activación, a control, y por lo tanto son habitualmente relativamente simples en su arquitectura molecular, que consiste en un módulo globular. Las proteasas intracelulares están sujetas necesariamente a control continuo, a fin de evitar el daño a las células. En contraste con cimógenos de proteasas segregadas, en proteasas reguladoras más complejas se pueden insertar segmentos polipeptídicos muy grandes entre la señal y el dominio de activación del cimógeno del módulo proteolítico. Estudios de estructura-función indican que tales partes no proteásicas pueden estar implicadas en interacciones con estructuras macroscópicas, membranas, cofactores, sustratos, efectores, inhibidores, iones, que regulan la actividad y activación del módulo o módulos proteolíticos o su (sus) cimógeno(s). Los módulos no proteolíticos presentan una notable variación en tamaño y estructura. Muchos de los módulos pueden existir como tales, independientemente del módulo proteolítico. Por lo tanto, se puede considerar que tales módulos corresponden a unidades estructurales y funcionales independientes que son autónomas con respecto al plegamiento. El valor de tal organización modular es que la adquisición de nuevos módulos puede dotar a la proteasa receptora de recientes especificidades de unión noveles, y puede conducir a cambios drásticos en su actividad, regulación y selección de dianas. El principio de enzimas proteolíticas organizadas modulares también se puede explotar aplicando herramientas de biología molecular a fin de crear nuevas interacciones, regulación, especificidad, y/o selección de dianas mediante el barajado de módulos. Aunque en general tales módulos adicionales se observan como extensión N o C terminal, también se han observado grandes inserciones dentro de los bucles exteriores del dominio catalítico. Se cree que, también en este caso, el plegamiento principal de la proteasa representa todavía la topología esencial para formar una entidad proteolítica funcional, y que la inserción se puede considerar como una subestructura plegada sobre la superficie del módulo proteolítico. There is a substantial difference in the level of regulation between proteases that are secreted in the medium and proteases that remain intracellularly. Segregated proteases in the medium are usually no longer subject, after activation, to control, and therefore are usually relatively simple in their molecular architecture, which consists of a globular module. Intracellular proteases are necessarily subject to continuous control, in order to avoid damage to the cells. In contrast to segregated protease cymogens, in very complex regulatory proteases very large polypeptide segments can be inserted between the signal and the cytogen activation domain of the proteolytic module. Structure-function studies indicate that such non-proteasic parts may be involved in interactions with macroscopic structures, membranes, cofactors, substrates, effectors, inhibitors, ions, which regulate the activity and activation of the proteolytic module or modules or their (its) cytogen ( s). The non-proteolytic modules have a notable variation in size and structure. Many of the modules may exist as such, regardless of the proteolytic module. Therefore, it can be considered that such modules correspond to independent structural and functional units that are autonomous with respect to folding. The value of such a modular organization is that the acquisition of new modules can provide the recipient protease with recent novel binding specificities, and can lead to drastic changes in its activity, regulation and target selection. The principle of modular organized proteolytic enzymes can also be exploited by applying molecular biology tools to create new interactions, regulation, specificity, and / or target selection by shuffling modules. Although in general such additional modules are observed as terminal N or C extension, large insertions have also been observed within the outer loops of the catalytic domain. It is believed that, also in this case, the main folding of the protease still represents the essential topology for forming a functional proteolytic entity, and that the insertion can be considered as a folded substructure on the surface of the proteolytic module.

Estructura molecular Molecular structure

En principio, la organización modular de proteínas más grandes es un tema general en la naturaleza. En particular dentro de las redes multimodulares más grandes, los módulos proteolíticos típicos muestran tamaños de 100 a 400 aminoácidos de media. Esto se corresponde con el tamaño medio de la mayoría de las enzimas proteolíticas globulares que son segregadas al medio. Como se explica anteriormente, los módulos polipeptídicos son fragmentos polipeptídicos, que se pueden plegar y funcionar como entidades independientes. Otro término para tales módulos es dominios. Sin embargo, el dominio se usa en un contexto más amplio que el módulo. El término dominio, como se usa aquí, se refiere habitualmente a una parte de la cadena polipeptídica que representa en la estructura tridimensional una topología de plegamiento típica. En una proteína, los dominios interaccionan en grados variables, pero de forma menos frecuente que lo que lo hacen los elementos estructurales dentro de los dominios. También se usan en la bibliografía otros términos tales como subdominio y unidad de plegamiento. Como tal, se observa que muchas proteínas que comparten una funcionalidad particular pueden compartir los mismos dominios. Tales dominios se pueden reconocer a partir de la estructura primaria, que puede mostrar ciertos patrones de secuencia, que son típicos para un dominio particular. Ejemplos típicos son el plegamiento de unión a mononucleótidos, dominios de unión a celulosa, el motivo de unión a ADN de hélice-vuelta-hélice, dedos de cinc, manos de EF, anclajes de membrana. Los módulos se refieren a aquellos dominios que se espera que sean capaces de plegarse y funcionar de forma autónoma. La persona experta en la técnica sabe cómo identificar dominios particulares en una estructura primaria aplicando software de ordenador disponible habitualmente a dicha estructura y secuencias homólogas procedentes de otros organismos o especies. In principle, the modular organization of larger proteins is a general theme in nature. In particular within larger multimodular networks, typical proteolytic modules show sizes of 100 to 400 amino acids on average. This corresponds to the average size of most globular proteolytic enzymes that are secreted into the medium. As explained above, the polypeptide modules are polypeptide fragments, which can be folded and operated as independent entities. Another term for such modules is domains. However, the domain is used in a wider context than the module. The term domain, as used herein, usually refers to a part of the polypeptide chain that represents in the three-dimensional structure a typical folding topology. In a protein, domains interact in varying degrees, but less frequently than structural elements do within domains. Other terms such as subdomain and folding unit are also used in the literature. As such, it is noted that many proteins that share a particular functionality can share the same domains. Such domains can be recognized from the primary structure, which can show certain sequence patterns, which are typical for a particular domain. Typical examples are mononucleotide binding folding, cellulose binding domains, helix-turn-helix DNA binding motif, zinc fingers, EF hands, membrane anchors. The modules refer to those domains that are expected to be able to fold and operate autonomously. The person skilled in the art knows how to identify particular domains in a primary structure by applying commonly available computer software to said structure and homologous sequences from other organisms or species.

Aunque las proteínas multimodulares o multidominios pueden parecer como una cadena de perlas, se han observado montajes de arquitectura más compleja sustancial. En el caso en el que las diversas perlas residan en la misma cadena polipeptídica, las perlas se denominan generalmente módulos o dominios. Cuando las perlas no residen en una misma cadena polipeptídica, sino que forman montajes vía interacciones no covalentes, entonces se usa el término subunidad para designar a la perla. Las subunidades se pueden transcribir por un mismo gen, o por diferentes genes. La proteína multimodular se puede procesar proteolíticamente después de la transcripción, conduciendo a múltiples subunidades. Las subunidades individuales pueden consistir en múltiples dominios. Típicamente, las proteínas globulares más pequeñas de 100-300 aminoácidos consisten habitualmente sólo en un dominio. Although multimodular or multidomain proteins may seem like a string of pearls, assemblies of more complex substantial architecture have been observed. In the case where the different beads reside in the same polypeptide chain, the beads are generally referred to as modules or domains. When the pearls do not reside in the same polypeptide chain, but form assemblies via non-covalent interactions, then the term subunit is used to designate the pearl. Subunits can be transcribed by the same gene, or by different genes. The multimodular protein can be proteolytically processed after transcription, leading to multiple subunits. Individual subunits can consist of multiple domains. Typically, globular proteins smaller than 100-300 amino acids usually consist of only one domain.

Clasificación molecular de las enzimas proteolíticas Molecular classification of proteolytic enzymes

En general, las proteasas se clasifican según sus propiedades moleculares, o según sus propiedades funcionales. La clasificación molecular se basa en la estructura primaria de la proteasa. La estructura primaria de una proteína In general, proteases are classified according to their molecular properties, or according to their functional properties. The molecular classification is based on the primary structure of the protease. The primary structure of a protein

representa su secuencia de aminoácidos, que puede derivar de la secuencia nucleotídica del gen correspondiente. El rastreo extensivo de las similitudes en las estructuras primarias puede permitir la observación de similitudes en el mecanismo catalítico y otras propiedades, las cuales se pueden extender incluso a propiedades funcionales. El término familia se usa para describir un grupo de proteasas que muestran una relación evolutiva basándose en la similitud entre sus estructuras primarias. Se cree que los miembros de tal familia han surgido mediante evolución divergente a partir del mismo ancestro. Dentro de una familia, el subagrupamiento adicional de las estructuras primarias basado en un refinamiento más detallado de las comparaciones de las secuencias da como resultado subfamilias. La clasificación según el plegamiento tridimensional de las proteasas puede comprender la estructura secundaria, la estructura terciaria y la estructura cuaternaria. En general, la clasificación en la estructura secundaria está limitada al contenido y a la orientación gruesa de elementos de la estructura secundaria. Las similitudes en la estructura terciaria han conducido al reconocimiento de superfamilias o clanes. Una superfamilia o un clan es un grupo de familias que se piensa que tiene un ancestro común, puesto que muestran un plegamiento tridimensional común. En general, la estructura terciaria está más conservada que la estructura primaria. Como consecuencia, la similitud de la estructura primaria no siempre refleja propiedades funcionales similares. De hecho, las propiedades funcionales pueden haber divergido sustancialmente, dando como resultado nuevas propiedades interesantes. En el presente, la estructura cuaternaria no se ha aplicado para clasificar diversas proteasas. Esto puede ser debido a cierto sesgo de las bases de datos estructurales con respecto a proteasas globulares simples. Es probable que muchos sistemas proteolíticos que están sujetos a activación, regulación, o a cascadas de reacciones complejas, consistan en múltiples dominios o subunidades. Los temas generales en la organización estructural de tales sistemas de proteasas pueden conducir a nuevos tipos de clasificación. represents its amino acid sequence, which can be derived from the nucleotide sequence of the corresponding gene. Extensive tracking of similarities in primary structures can allow the observation of similarities in the catalytic mechanism and other properties, which can be extended even to functional properties. The term family is used to describe a group of proteases that show an evolutionary relationship based on the similarity between their primary structures. It is believed that members of such a family have emerged through divergent evolution from the same ancestor. Within a family, additional subgrouping of primary structures based on more detailed refinement of sequence comparisons results in subfamilies. The classification according to the three-dimensional folding of the proteases can comprise the secondary structure, the tertiary structure and the quaternary structure. In general, the classification in the secondary structure is limited to the content and the coarse orientation of elements of the secondary structure. Similarities in tertiary structure have led to the recognition of superfamilies or clans. A superfamily or a clan is a group of families that are thought to have a common ancestor, since they show a common three-dimensional folding. In general, the tertiary structure is more conserved than the primary structure. As a consequence, the similarity of the primary structure does not always reflect similar functional properties. In fact, the functional properties may have diverged substantially, resulting in new interesting properties. At present, the quaternary structure has not been applied to classify various proteases. This may be due to some bias of the structural databases with respect to simple globular proteases. It is likely that many proteolytic systems that are subject to activation, regulation, or cascades of complex reactions, consist of multiple domains or subunits. General issues in the structural organization of such protease systems can lead to new types of classification.

Clasificación según la especificidad Classification according to specificity

En ausencia de la información de secuencia, las proteasas se han sometido a diversos tipos de clasificación funcional. La clasificación y nomenclatura de las enzimas mediante referencia a las reacciones que son catalizadas es un principio general en la nomenclatura enzimática. Este enfoque es también el principio subyacente de la numeración EC de las enzimas (Enzyme Nomenclature 1992 Academic Press, Orlando). En la Enzyme Nomenclature 1992 se pueden reconocer dos tipos de proteasas (EC 3.4): las de las exopeptidasas (EC 3.4.11-19), y las de las endopeptidasas (EC 3.4.21-24, 3.4.99). Las endopeptidasas escinden enlaces peptídicos en las regiones internas de la cadena peptídica, lejos de los términos. Las exopeptidasas escinden sólo restos de los extremos de la cadena peptídica. Las exopeptidasas que actúan en el término N libre pueden liberar un único resto de aminoácido, un dipéptido o un tripéptido, y se denominan respectivamente aminopeptidasas (EC 3.4.11), dipeptidil peptidasas (EC 3.4.14) y tripeptidil peptidasa (EC 3.3.14). Las proteasas que comienzan el procesamiento peptídico a partir del término carboxilo, que liberan un único aminoácido, se denominan carboxipeptidasas (EC 3.4.16-18). Las peptidil dipeptidasas (EC 3.4.15) eliminan un dipéptido del término carboxilo. La exo- y endopeptidasa en conjunto son las dipeptidasas (EC 3.4.13), que escinden específicamente sólo dipéptidos en sus dos mitades de aminoácidos. Las omega peptidasas (EC 3.4.19) eliminan restos terminales que están sustituidos, son cíclicos, o están enlazados mediante enlaces isopeptídicos. In the absence of sequence information, proteases have undergone various types of functional classification. The classification and nomenclature of enzymes by reference to reactions that are catalyzed is a general principle in enzymatic nomenclature. This approach is also the underlying principle of EC numbering of enzymes (Enzyme Nomenclature 1992 Academic Press, Orlando). In the Enzyme Nomenclature 1992 two types of proteases can be recognized (EC 3.4): those of exopeptidases (EC 3.4.11-19), and those of endopeptidases (EC 3.4.21-24, 3.4.99). Endopeptidases cleave peptide bonds in the internal regions of the peptide chain, far from the terms. Exopeptidases cleave only remnants of the ends of the peptide chain. Exopeptidases that act in the free N term can release a single amino acid residue, a dipeptide or a tripeptide, and are called respectively aminopeptidases (EC 3.4.11), dipeptidyl peptidases (EC 3.4.14) and tripeptidyl peptidase (EC 3.3. 14). Proteases that begin peptide processing from the term carboxyl, which release a single amino acid, are called carboxypeptidases (EC 3.4.16-18). Peptidyl dipeptidases (EC 3.4.15) remove a dipeptide from the term carboxyl. The exo- and endopeptidase together are dipeptidases (EC 3.4.13), which specifically cleave only dipeptides into their two amino acid halves. Omega peptidases (EC 3.4.19) eliminate terminal residues that are substituted, cyclic, or linked by isopeptide bonds.

Aparte de la posición en la que la proteasa escinde una cadena peptídica, para cada tipo de proteasa es posible una división adicional basada en la naturaleza de los restos de aminoácidos preferidos en el sustrato. En general, se pueden distinguir proteasas con una especificidad amplia, media y estrecha. Algunas proteasas se denominan simplemente después de las proteínas o polipéptidos específicos que hidrolizan, por ejemplo queratinasa, colagenasa, elastasa. Se puede fijar una especificidad estrecha a un aminoácido particular o a una secuencia particular, que se elimina o que se escinde respectivamente. Cuando la proteasa muestra una preferencia particular por un aminoácido en la posición P1 o P1’, el nombre de este aminoácido puede ser un calificador. Por ejemplo, la prolil amino peptidasa elimina prolina del término amino de un péptido (la prolina es el resto P1). Se usa X-Pro o prolina cuando se escinde el enlace en el lado imino de la prolina (la prolina es el resto P1’); por ejemplo, la prolina carboxipeptidasa elimina prolina del término carboxilo. La prolil endopeptidasa (o Pro-X) escinde detrás de la prolina, mientras que la prolina endopeptidasa (X-Pro) escinde antes de una prolina. El resto de aminoácido delante de el enlace peptídico escindible se refiere al resto de aminoácido que aporta el grupo carboxilo al enlace peptídico. El resto de aminoácido detrás del enlace peptídico escindible se refiere al resto de aminoácido que aporta el grupo amino al enlace peptídico. Según la convención general, una cadena de aminoácidos va desde el término amino (el principio) al término carboxilo (el final), y se numera en consecuencia. Las endoproteasas también pueden mostrar una clara preferencia por un aminoácido particular en la posición P1 o P1’, por ejemplo glicil endopeptidasa, peptidillisina endopeptidasa, glutamil endopeptidasa. Además, las proteasas pueden mostrar una preferencia por cierto grupo de aminoácidos que comparten un cierto parecido. Tal grupo de aminoácidos preferidos puede comprender los aminoácidos hidrófobos, sólo los aminoácidos hidrófobos voluminosos, aminoácidos hidrófobos pequeños, o sólo aminoácidos pequeños, aminoácidos grandes cargados positivamente, etc. Aparte de las preferencias por los restos de P1 y P1’, también pueden existir preferencias o exclusiones particulares por restos preferidos por otros subsitios en la proteasa. Tales preferencias múltiples pueden dar como resultado proteasas que son muy específicas para sólo aquellas secuencias que satisfacen múltiples requisitos de unión al mismo tiempo. En general, se debería observar que las proteasas son enzimas más bien promiscuas. Incluso una proteasa muy específica puede escindir péptidos que no cumplen con la preferencia generalmente observada de la proteasa. Además, se debería observar que las condiciones medioambientales tales como pH, temperatura, fuerza iónica, actividad acuosa, preferencia de disolventes, presencia de sustratos o inhibidores competidores, pueden influir en las preferencias de las proteasas. Apart from the position in which the protease cleaves a peptide chain, for each type of protease an additional division based on the nature of the preferred amino acid residues in the substrate is possible. In general, proteases with a broad, medium and narrow specificity can be distinguished. Some proteases are simply named after specific hydrolyzing proteins or polypeptides, for example keratinase, collagenase, elastase. A narrow specificity can be fixed to a particular amino acid or to a particular sequence, which is removed or cleaved respectively. When the protease shows a particular preference for an amino acid at the P1 or P1 ’position, the name of this amino acid can be a qualifier. For example, prolyl amino peptidase removes proline from the amino terminus of a peptide (proline is the P1 moiety). X-Pro or proline is used when the bond is cleaved on the imino side of the proline (the proline is the remainder P1 ’); for example, proline carboxypeptidase removes proline from the term carboxyl. The prolyl endopeptidase (or Pro-X) cleaves behind the proline, while the proline endopeptidase (X-Pro) cleaves before a proline. The amino acid residue in front of the cleavable peptide bond refers to the amino acid residue that the carboxyl group brings to the peptide bond. The amino acid residue behind the cleavable peptide bond refers to the amino acid residue that the amino group brings to the peptide bond. According to the general convention, an amino acid chain ranges from the term amino (the beginning) to the term carboxyl (the end), and is numbered accordingly. Endoproteases can also show a clear preference for a particular amino acid in the P1 or P1 ’position, for example glycyl endopeptidase, peptidillisin endopeptidase, glutamyl endopeptidase. In addition, proteases may show a preference for a certain group of amino acids that share a certain resemblance. Such a preferred group of amino acids may comprise hydrophobic amino acids, only bulky hydrophobic amino acids, small hydrophobic amino acids, or only small amino acids, positively charged large amino acids, etc. Apart from the preferences for the P1 and P1 ’residues, there may also be particular preferences or exclusions for preferred residues by other protease subsites. Such multiple preferences may result in proteases that are very specific for only those sequences that satisfy multiple binding requirements at the same time. In general, it should be noted that proteases are rather promiscuous enzymes. Even a very specific protease can cleave peptides that do not meet the generally observed preference of the protease. In addition, it should be noted that environmental conditions such as pH, temperature, ionic strength, aqueous activity, solvent preference, presence of competing substrates or inhibitors, can influence protease preferences.

La condición medioambiental puede no sólo influir en la proteasa, sino también influir en la forma en la que se presente el sustrato proteinoso a la proteasa. The environmental condition can not only influence the protease, but also influence the way in which the protease substrate is presented to the protease.

Clasificación mediante mecanismo catalítico Classification by catalytic mechanism

Las proteasas se pueden subdividir basándose en su mecanismo catalítico. Se debería entender que para cada Proteases can be subdivided based on their catalytic mechanism. It should be understood that for each

5 mecanismo catalítico, la clasificación anterior basada en la especificidad conduce a una subdivisión adicional para cada tipo de mecanismo. Se conocen cuatro clases importantes de proteasas, y se designan por el grupo funcional principal en el sitio activo: las serina proteasas (endopeptidasa EC 3.4.21, carboxipeptidasa EC 3.4.16), las tiol o cisteína proteasas (endopeptidasa EC 3.4.22, carboxipeptidasa EC 3.4.18), las carboxil o aspártico proteasas (endopeptidasa EC 3.4.23), y las metaloproteasas (endopeptidasa EC 3.4.24, carboxipeptidasa EC 3.4.18). Hay inhibidores característicos de los miembros de cada tipo catalítico de proteasa. Estos pequeños inhibidores modifican irreversiblemente un resto de aminoácido del sitio activo de la proteasa. Por ejemplo, las serinas proteasas son inactivadas por fluoruro de fenilmetanosulfonilo (PMSF) y fluorofosfato de diisopropilo (DFP), que reaccionan con la serina activa, mientras que los derivados de clorometilcetona reaccionan con la histidina de la tríada catalítica. El fosforamidón y 1,10-fenantrolina inhiben típicamente metaloproteasas. La inhibición por 5 Catalytic mechanism, the previous classification based on specificity leads to an additional subdivision for each type of mechanism. Four important classes of proteases are known, and they are designated by the main functional group in the active site: serine proteases (endopeptidase EC 3.4.21, carboxypeptidase EC 3.4.16), thiol or cysteine proteases (endopeptidase EC 3.4.22, carboxypeptidase EC 3.4.18), carboxyl or aspartic proteases (endopeptidase EC 3.4.23), and metalloproteases (endopeptidase EC 3.4.24, carboxypeptidase EC 3.4.18). There are characteristic inhibitors of the members of each catalytic type of protease. These small inhibitors irreversibly modify an amino acid residue of the active protease site. For example, serine proteases are inactivated by phenylmethanesulfonyl fluoride (PMSF) and diisopropyl fluorophosphate (DFP), which react with active serine, while chloromethyl ketone derivatives react with histidine in the catalytic triad. Phosphoramidon and 1,10-phenanthroline typically inhibit metalloproteases. Inhibition by

15 pepstatina indica generalmente una proteasa aspártica. E64 inhibe específicamente la tiol proteasa. La amastatina y la bestatina inhiben diversas aminopeptidasas. Se observan variaciones sustanciales en la susceptibilidad de las proteasas a los inhibidores, incluso dentro de una clase catalítica. En cierto grado, esto puede estar relacionado con la especificidad de la proteasa. En el caso de que la arquitectura del sitio de unión evite que un inhibidor basado en el mecanismo se acerque al sitio catalítico, entonces tal proteasa escapa de la inhibición, y la identificación del tipo de mecanismo basado en la inhibición está prohibida. Chymostation, por ejemplo, es un potente inhibidor para serina proteasa, con especificidad similar a quimiotripsina; Elastatinal inhibe serina proteasas similares a elastasa, y no reacciona con tripsina o quimiotripsina; la 4-amido PMSF (APMSF) inhibe sólo serina proteasas con especificidad similar a tripsina. Informes extensos del uso de inhibidores en la clasificación de proteasas incluyen Barret y Salvesen, Proteinase Inhibitors, Elsevier Amstardam, 1986; Bond y Beynon (eds.), Proteolytic Enzymes, A Practical Pepstatin generally indicates an aspartic protease. E64 specifically inhibits thiol protease. Amastatin and bestatin inhibit various aminopeptidases. Substantial variations in the susceptibility of proteases to inhibitors are observed, even within a catalytic class. To some extent, this may be related to the specificity of the protease. In the event that the binding site architecture prevents an inhibitor based on the mechanism from approaching the catalytic site, then such a protease escapes the inhibition, and identification of the type of mechanism based on the inhibition is prohibited. Chymostation, for example, is a potent inhibitor for serine protease, with specificity similar to chymotrypsin; Elastatinal inhibits serine proteases similar to elastase, and does not react with trypsin or chymotrypsin; 4-amido PMSF (APMSF) inhibits only serine proteases with specificity similar to trypsin. Extensive reports of the use of inhibitors in the classification of proteases include Barret and Salvesen, Proteinase Inhibitors, Elsevier Amstardam, 1986; Bond and Beynon (eds.), Proteolytic Enzymes, A Practical

25 Approach, IRL Press, Oxford, 1989; Methods in Enzymology, eds. E.J. Barret, volumen 244, 1994 y volumen 248, 1995; E. Shaw, Cysteinyl proteinases and their selective inactivation, Adv Enzymol. 63:271-347 (1990). 25 Approach, IRL Press, Oxford, 1989; Methods in Enzymology, eds. E.J. Barret, volume 244, 1994 and volume 248, 1995; E. Shaw, Cysteinyl proteinases and their selective inactivation, Adv Enzymol. 63: 271-347 (1990).

Clasificación según condiciones óptimas de comportamiento Classification according to optimal behavioral conditions

El mecanismo catalítico de las proteasas, y el requisito de su integridad conformacional, determinan principalmente las condiciones en las que se puede utilizar la proteasa. Encontrar la proteasa que se comporta óptimamente en condiciones de aplicación es un reto importante. A menudo, las condiciones en las que han de funcionar las proteasas no son óptimas, y representan un compromiso entre las condiciones ideales para una aplicación particular y las condiciones que se adecuarían mejor a la proteasa. Aparte de las propiedades particulares de la proteasa, se debería observar que también la presentación de sustratos proteinosos depende de las condiciones, y como tal determina también qué condiciones son las más eficaces para la proteolisis. Las especificaciones para la enzima The catalytic mechanism of proteases, and the requirement of their conformational integrity, mainly determine the conditions under which the protease can be used. Finding the protease that behaves optimally under application conditions is an important challenge. Often, the conditions under which proteases are to function are not optimal, and represent a compromise between the ideal conditions for a particular application and the conditions that would best suit the protease. Apart from the particular properties of the protease, it should be noted that also the presentation of protein substrates depends on the conditions, and as such also determines which conditions are the most effective for proteolysis. The specifications for the enzyme

35 que son relevantes para la aplicación comprenden, por ejemplo, la dependencia del pH, la dependencia de la temperatura, la sensibilidad a o la dependencia de iones metálicos, la fuerza iónica, la concentración de sal, la compatibilidad con disolventes. Otro factor de vital importancia es la actividad específica de una proteasa. Cuanta mayor sea la actividad específica de la enzima, se necesita menos enzima para una conversión específica. Menores requisitos de enzima implican menores costes y menores niveles de contaminación proteica. 35 which are relevant for the application include, for example, the pH dependence, temperature dependence, sensitivity to or dependence on metal ions, ionic strength, salt concentration, solvent compatibility. Another vitally important factor is the specific activity of a protease. The higher the specific activity of the enzyme, the less enzyme is needed for a specific conversion. Lower enzyme requirements imply lower costs and lower levels of protein contamination.

El pH es un parámetro importante que determina el comportamiento de la proteasa en una aplicación. Por lo tanto, la dependencia del pH es un parámetro importante para agrupar a las proteasas. Los grupos principales que son reconocidos son las proteasas ácidas, las proteasas neutras, las proteasas alcalinas, y las proteasas muy alcalinas. El pH óptimo iguala sólo en cierto grado el mecanismo proteolítico; por ejemplo, la proteasa aspártica muestra a menudo un óptimo a pH ácido; las metaloproteasas y tiol proteasas a menudo se comportan óptimamente alrededor 45 de pH neutro a ligeramente alcalino; las serina peptidasas son principalmente activas en la región alcalina y muy alcalina. Para cada clase, se conocen excepciones. Además, también desempeña un papel la actividad acuosa global del sistema. El pH óptimo de una proteasa se define como el intervalo de pH en el que la proteasa muestra una velocidad óptima de hidrólisis para la mayoría de sus sustratos en un entorno particular en condiciones particulares. Este intervalo puede ser estrecho, por ejemplo una unidad de pH, así como bastante amplio, 3-4 unidades de pH. En general, el pH óptimo también depende de la naturaleza del sustrato proteinoso. Tanto la velocidad de recambio como la especificidad pueden variar en función del pH. Para cierta eficacia, puede ser deseable usar la proteasa lejos de su pH óptimo, debido a que se evita la producción de péptidos menos deseados. Los péptidos menos deseados pueden ser, por ejemplo, péptidos muy cortos, o péptidos que provocan un sabor amargo. Además, una especificidad más estrecha puede ser una razón para elegir condiciones que se desvían de The pH is an important parameter that determines the behavior of the protease in an application. Therefore, pH dependence is an important parameter for grouping proteases. The main groups that are recognized are acid proteases, neutral proteases, alkaline proteases, and very alkaline proteases. The optimum pH equals only to a certain extent the proteolytic mechanism; for example, aspartic protease often shows an optimum at acidic pH; metalloproteases and thiol proteases often behave optimally around neutral to slightly alkaline pH; Serine peptidases are mainly active in the alkaline and very alkaline region. For each class, exceptions are known. In addition, the overall water activity of the system also plays a role. The optimal pH of a protease is defined as the pH range in which the protease shows an optimal rate of hydrolysis for most of its substrates in a particular environment under particular conditions. This range can be narrow, for example a unit of pH, as well as quite ample, 3-4 units of pH. In general, the optimum pH also depends on the nature of the protein substrate. Both the replacement rate and the specificity may vary depending on the pH. For some efficacy, it may be desirable to use the protease away from its optimum pH, because the production of less desired peptides is avoided. The less desired peptides may be, for example, very short peptides, or peptides that cause a bitter taste. In addition, a narrower specificity may be a reason for choosing conditions that deviate from

55 las condiciones óptimas con respecto a la velocidad de recambio. Dependiendo del pH, la especificidad puede ser estrecha, por ejemplo escindiendo sólo la cadena peptídica en una posición particular, o antes o después de un aminoácido particular, o puede ser más amplia, por ejemplo escindiendo una cadena en múltiples posiciones, o escindiendo antes o después de tipos más diferentes de aminoácidos. De hecho, la dependencia del pH puede ser una herramienta importante para regular la actividad proteolítica en una aplicación. En el caso de que el pH se desplace durante el proceso, la proteolisis puede cesar espontáneamente sin la necesidad de tratamiento adicional para inactivar la proteasa. En algunos casos, la propia proteolisis puede ser la conductora del desplazamiento de pH. 55 the optimal conditions with respect to the replacement speed. Depending on the pH, the specificity may be narrow, for example by cleaving only the peptide chain at a particular position, or before or after a particular amino acid, or it may be broader, for example by cleaving a chain at multiple positions, or by cleaving before or after more different types of amino acids. In fact, pH dependence can be an important tool to regulate proteolytic activity in an application. In the event that the pH moves during the process, the proteolysis can cease spontaneously without the need for additional treatment to inactivate the protease. In some cases, the proteolysis itself may be the driver of the pH shift.

Muy crucial para la aplicación de proteasas es su estabilidad durante la manipulación y operación. Puesto que la estabilidad de la proteasa se ve fuertemente afectada por la temperatura de trabajo, la estabilidad también se denomina a menudo como termoestabilidad. En general, la estabilidad de una proteasa indica cuánto tiempo retiene una proteasa su actividad proteolítica en condiciones particulares. Las condiciones particulares pueden comprender condiciones de fermentación, condiciones durante el aislamiento y procesamiento aguas abajo de la enzima, condiciones de almacenamiento, condiciones formulación y de operación o aplicación. En el caso en el que las condiciones particulares engloben temperaturas elevadas, la estabilidad se refiere en general a termoestabilidad. Aparte de las causas generales para la inactivación enzimática, tales como modificación química, falta de plegamiento, agregación, etc., un problema principal con las proteasas es que se someten fácilmente a autodegradación. Especialmente para la utilización de proteasas, la temperatura óptima es un criterio relevante para agrupar a proteasas. Aunque hay diferentes definiciones, económicamente la definición más útil es la temperatura o el intervalo de temperaturas en el que la proteasa es más productiva en cierta aplicación. La productividad de la proteasa es una función tanto de la estabilidad como de la velocidad de recambio. Cuando la temperatura elevada en general incrementará la velocidad de recambio, la rápida inactivación contractuará el incremento en la velocidad de recambio, y finalmente conducirá a una baja productividad. La estabilidad conformacional de la proteasa bajo una condición del proceso dada determinará su temperatura máxima de funcionamiento. La temperatura a la que la proteasa pierde su conformación activa, a menudo indicado como pérdida de plegamiento o punto de fusión, se puede determinar según diversos métodos, por ejemplo RMN, espectroscopía de dicroísmo circular, calorimetría diferencial de barrido, etc. Para la proteasa, la pérdida de plegamiento viene acompañada habitualmente por un incremento tremendo en la velocidad de autodegradación. Very crucial for the application of proteases is its stability during handling and operation. Since protease stability is strongly affected by working temperature, stability is also often referred to as thermostability. In general, the stability of a protease indicates how long a protease retains its proteolytic activity under particular conditions. Particular conditions may include fermentation conditions, conditions during isolation and processing downstream of the enzyme, storage conditions, formulation and operating or application conditions. In the case where the particular conditions encompass high temperatures, stability generally refers to thermostability. Apart from the general causes for enzymatic inactivation, such as chemical modification, lack of folding, aggregation, etc., a major problem with proteases is that they easily undergo self-degradation. Especially for the use of proteases, the optimum temperature is a relevant criterion for grouping proteases. Although there are different definitions, economically the most useful definition is the temperature or temperature range in which the protease is most productive in a certain application. Protease productivity is a function of both stability and turnover rate. When the elevated temperature in general will increase the replacement speed, the rapid inactivation will contract the increase in the replacement speed, and will eventually lead to low productivity. The conformational stability of the protease under a given process condition will determine its maximum operating temperature. The temperature at which the protease loses its active conformation, often indicated as loss of folding or melting point, can be determined according to various methods, for example NMR, circular dichroism spectroscopy, differential scanning calorimetry, etc. For the protease, the loss of folding is usually accompanied by a tremendous increase in the rate of self-degradation.

En aplicaciones en las que se requieren temperaturas bajas, la proteasa se puede seleccionar con énfasis en una actividad intrínseca elevada a temperatura baja a moderada. Puesto que en tales condiciones la inactivación es relativamente lenta, en estas condiciones la actividad puede determinar enormemente la productividad. En procesos en los que se requiere una actividad de la proteasa sólo durante un corto período, se puede usar la estabilidad de la proteasa como un enchufe para apagar la proteasa. En tal caso, puede ser preferible una proteasa más lábil en lugar de una proteasa muy termoestable. In applications where low temperatures are required, the protease can be selected with emphasis on high intrinsic activity at low to moderate temperature. Since under such conditions inactivation is relatively slow, under these conditions activity can greatly determine productivity. In processes where a protease activity is required only for a short period, the stability of the protease can be used as a plug to turn off the protease. In such a case, a more labile protease may be preferable instead of a very thermostable protease.

Otros parámetros medioambientales que pueden desempeñar un papel a la hora de seleccionar la proteasa apropiada pueden ser su sensibilidad a sales. La compatibilidad con iones metálicos que se encuentran frecuentemente en concentraciones bajas en diversos materiales naturales puede ser crucial para ciertas aplicaciones. En particular con metaloproteasas, ciertos iones pueden sustituir al ion metálico catalítico y reducir o incluso anular completamente la actividad. En algunas aplicaciones, los iones metálicos han de ser añadidos a propósito con el fin de evitar la eliminación por lavado de los iones metálicos coordinados a la proteasa. Es bien conocido que en aras de la estabilidad enzimática y tiempo de vida, se han de suministrar iones calcio a fin de evitar la disociación de calcio unido a proteína. Other environmental parameters that may play a role in selecting the appropriate protease may be its salt sensitivity. Compatibility with metal ions that are frequently found in low concentrations in various natural materials can be crucial for certain applications. In particular with metalloproteases, certain ions can replace the catalytic metal ion and reduce or even completely cancel the activity. In some applications, metal ions have to be added on purpose in order to avoid the removal of coordinated metal ions to the protease by washing. It is well known that for the sake of enzymatic stability and lifetime, calcium ions have to be supplied in order to avoid the dissociation of calcium bound to protein.

La mayoría de los microorganismos muestran una cierta tolerancia con respecto a la adaptación a cambios en la condición medioambiental. Como consecuencia, es probable que al menos el espectro proteolítico que el organismo es capaz de producir muestre al menos tolerancias similares. Tal espectro proteolítico puede ser cubierto por muchas proteasas que cubren juntas todo el espectro, o por sólo unas pocas proteasas de un amplio espectro. Teniendo en cuenta el espectro proteolítico completo de un microorganismo, puede ser muy importante tener en cuenta la localización. Most microorganisms show a certain tolerance with respect to adaptation to changes in the environmental condition. As a consequence, it is likely that at least the proteolytic spectrum that the organism is capable of producing shows at least similar tolerances. Such a proteolytic spectrum can be covered by many proteases that cover the entire spectrum together, or by only a few broad-spectrum proteases. Given the full proteolytic spectrum of a microorganism, it can be very important to consider the location.

Localización celular y caracterización del procesamiento y degradación proteolítica Cellular location and characterization of proteolytic degradation and processing

Desde un punto de vista industrial, las proteasas que se excretan de la célula tienen ventajas específicas con respecto a la productividad a gran escala y a la tolerancia al estrés, puesto que tienen que sobrevivir sin la protección de la célula. El gran grupo de proteasa celular se puede subdividir además en soluble y unido a la membrana. Unido a la membrana puede comprender una proteasa en el interior así como en el exterior de la membrana. La proteasa soluble intracelular se puede subdividir además según compartimientos específicos de la célula en la que aparecen. Puesto que la célula protege a las proteasas en cierto grado del entorno, y debido a que la célula controla las condiciones en la célula, la proteasa intracelular puede ser más sensible a cambios medioambientales grandes, y sus óptimos se pueden correlacionar mejor con las condiciones intracelulares específicas. Conocer las condiciones del departamento celular en el que reside la proteasa puede indicar sus preferencias. Allí donde la proteasa extracelular en general no requiere ya ninguna otra regulación una vez excretada de la célula, las proteasas intracelulares a menudo se someten a un control y regulación más complicados. From an industrial point of view, proteases that are excreted from the cell have specific advantages over large-scale productivity and stress tolerance, since they have to survive without the protection of the cell. The large group of cellular protease can be further subdivided into soluble and membrane bound. Attached to the membrane can comprise a protease inside as well as outside the membrane. The soluble intracellular protease can be further subdivided according to specific compartments of the cell in which they appear. Since the cell protects proteases to a certain degree from the environment, and because the cell controls the conditions in the cell, the intracellular protease may be more sensitive to large environmental changes, and its optimum can be better correlated with intracellular conditions. specific. Knowing the conditions of the cell department in which the protease resides can indicate your preferences. Where extracellular protease in general no longer requires any other regulation once excreted from the cell, intracellular proteases often undergo more complicated control and regulation.

Con respecto a la función de una proteasa particular, su localización es a menudo muy importante; por ejemplo, una gran cantidad de las proteasas vacuolares y periplásmicas están implicadas en la degradación proteica, mientras que muchas de las proteasas unidas a membrana son importantes en el procesamiento de proteínas (Suarez Rendueles y Wolf, 1988). With regard to the function of a particular protease, its location is often very important; for example, a large number of vacuolar and periplasmic proteases are involved in protein degradation, while many of the membrane-bound proteases are important in protein processing (Suarez Rendueles and Wolf, 1988).

En van den Hombergh: Thesis Landbouwuniversiteit Wageningen: An analysis of the proteolytic system in Aspergillus in order to improve protein production ISBN 90-5485-545-2, se ha publicado un repaso amplio sobre las propiedades biológicas y la evolución de proteasas. In van den Hombergh: Thesis Landbouwuniversiteit Wageningen: An analysis of the proteolytic system in Aspergillus in order to improve protein production ISBN 90-5485-545-2, a comprehensive review of the biological properties and evolution of proteases has been published.

El problema de las proteasas The protease problem

Una razón importante por el interés en proteasas microbianas es el problema de la expresión relacionada con proteasas observado en varios hospedantes de expresión usados en la industria del bioprocesamiento. El uso creciente de hospedantes heterólogos para la producción de proteínas, mediante tecnología de ADN recombinante, ha puesto recientemente este problema en el centro de atención, puesto que parece que las proteínas heterólogas son más tendentes a la proteolisis (Archer et al., 1992; van den Hombergh et al., 1996b). An important reason for the interest in microbial proteases is the problem of protease-related expression observed in several expression hosts used in the bioprocessing industry. The increasing use of heterologous hosts for protein production, using recombinant DNA technology, has recently put this problem in the spotlight, since it seems that heterologous proteins are more prone to proteolysis (Archer et al., 1992; van den Hombergh et al., 1996b).

En S. cerevisiae, ya a principios de los ochenta se reconoció el problema de las proteasas y la implicación de varias proteasas, complicando así los enfoques de ruptura de genes seleccionados como dianas para resolver este problema. Durante la secreción, una proteína se expone a varias actividades proteolíticas que residen en la ruta secretora. Adicionalmente, en un microorganismo prototrófico como Aspergillus, las proteínas segregadas se pueden exponer a varias actividades proteolíticas extracelulares. In S. cerevisiae, at the beginning of the eighties the problem of proteases and the implication of several proteases were recognized, thus complicating the breakdown approaches of genes selected as targets to solve this problem. During secretion, a protein is exposed to several proteolytic activities that reside in the secretory pathway. Additionally, in a prototrophic microorganism such as Aspergillus, secreted proteins can be exposed to various extracellular proteolytic activities.

El problema de la degradación de proteínas heterólogamente expresadas está bien documentado en Aspergillus (van den Hombergh Thesis Landbouwuniversiteit Wageningen: An analysis of the proteolytic system in Aspergillus in order to improve protein production ISBN 90-5485-545-2), y se ha dado a conocer en la expresión de proquimiosina de vaca, interferón D-2 humano, tPA, GMCSF, IL6, lactoferrina, lisozima de clara de huevo de pollo, PLA2 porcina, pectina liasa B de A. niger, enterotoxina B de E. coli y E-glucuronidasa, y pectato liasa 3 de Erwinia carotovora. The problem of heterologously expressed protein degradation is well documented in Aspergillus (van den Hombergh Thesis Landbouwuniversiteit Wageningen: An analysis of the proteolytic system in Aspergillus in order to improve protein production ISBN 90-5485-545-2), and it has been given to be known in the expression of cow prochymyosin, human D-2 interferon, tPA, GMCSF, IL6, lactoferrin, lysozyme from egg white, porcine PLA2, pectin lyase B from A. niger, enterotoxin B from E. coli and E-glucuronidase, and pectate lyase 3 from Erwinia carotovora.

El problema de la proteolisis se puede resolver en diversas etapas en la producción proteica. Los ingenieros del bioproceso pueden resolver el problema de la proteolisis procesando aguas abajo a bajas temperaturas, mediante separación temprana de producto y proteasa o proteasas, o mediante uso de inhibidores de proteasas. Todo esto puede conducir a la reducción exitosa del problema. Sin embargo, ciertamente no está eliminado, debido a que gran parte de la degradación se produce in vivo durante la producción de la proteína. The problem of proteolysis can be solved at various stages in protein production. Bioprocess engineers can solve the problem of proteolysis by processing downstream at low temperatures, by early separation of product and protease or proteases, or by use of protease inhibitors. All this can lead to the successful reduction of the problem. However, it is certainly not eliminated, because much of the degradation occurs in vivo during protein production.

A la hora de comprender cómo la proteolisis es controlada en la célula, una cuestión importante se refiere al mecanismo de reconocimiento mediante el cual se pone en marcha la proteolisis. En qué grado son reconocidas las proteínas proteolíticamente susceptibles (heterólogas) como aberrantes debido al plegamiento erróneo, o, si están correctamente plegadas, como “extrañas”, debido a que no poseen rasgos esenciales para estabilidad que son específicos del hospedante. Diversos tipos de estrés pueden provocar que la proteolisis global en una célula aumente significativamente. Los factores que se sabe que incrementan la velocidad de proteolisis incluyen la falta de nutrientes y otros diversos tipos de estrés (es decir, elevación de la temperatura, estrés osmótico, sustancias tóxicas, y expresión de ciertas proteínas heterólogas). Para manejar los problemas de la expresión relacionados con la proteolisis in vivo, varios enfoques han demostrado ser exitosos, como se explicará más abajo. Sin embargo, se tiene que tener en cuenta que las “células no proteolíticas” verdaderas no pueden existir, puesto que la proteolisis mediante proteasas intracelulares está implicada en muchas reacciones metabólicas y de “mantenimiento y conservación domésticos” esenciales. Por lo tanto, la reducción de la proteolisis será un proceso en el que se han de analizar los antecedentes genéticos cambiados que dan como resultado una proteolisis reducida, en busca de efectos secundarios potenciales que podrían conducir a una producción reducida de proteína (por ejemplo, velocidad reducida de crecimiento o esporulación reducida). When it comes to understanding how proteolysis is controlled in the cell, an important issue refers to the recognition mechanism by which proteolysis is started. To what extent are proteolytically susceptible (heterologous) proteins recognized as aberrant due to misfolding, or, if correctly folded, as "strange", because they do not possess essential stability traits that are specific to the host. Various types of stress can cause the overall proteolysis in a cell to increase significantly. Factors known to increase the speed of proteolysis include lack of nutrients and other various types of stress (i.e. temperature rise, osmotic stress, toxic substances, and expression of certain heterologous proteins). To handle expression problems related to proteolysis in vivo, several approaches have proven successful, as will be explained below. However, it must be borne in mind that true “non-proteolytic cells” cannot exist, since proteolysis by intracellular proteases is involved in many essential metabolic reactions and “domestic maintenance and conservation”. Therefore, the reduction of proteolysis will be a process in which the changed genetic background that results in a reduced proteolysis has to be analyzed, looking for potential side effects that could lead to reduced protein production (for example, reduced growth rate or reduced sporulation).

Ruptura de proteasas en hospedantes de expresión fúngicos filamentosos Rupture of proteases in filamentous fungal expression hosts

Berka y colaboradores (1990) describen la clonación y ruptura del gen pepA de A. awamori. Más recientemente, se han descrito tres aspartil proteasas rotas en A. niger. Se describieron destructores para tanto las aspartil proteasas extracelulares principales como la aspartil proteasa vacuolar principal. Se generaron destructores dobles y triples vía recombinación, y se ensayaron en busca de los espectros de proteasas y la expresión y secreción de la proteína pectina liasa PELB de A. niger, que es muy susceptible a la degradación proteolítica (van den Hombergh et al., 1995). La ruptura de pepA y pepB dio como resultado la reducción en ambos casos de actividades de proteasas extracelulares, 80% y 6%, respectivamente. En el destructor 'pepE, también otras actividades de proteasas (vacuolares) se vieron afectadas de forma importante, provocado por la inactivación de la cascada proteolítica para otras proteasas vacuolares. Las actividades extracelulares reducidas se correlacionaron con la degradación in vitro reducida de PELB y la expresión in vivo mejorada de pelB (van den Hombergh et al., 1996f). Berka et al. (1990) describe the cloning and rupture of the pepA gene from A. awamori. More recently, three broken aspartyl proteases have been described in A. niger. Destroyers were described for both the main extracellular aspartyl proteases and the main vacuolar aspartyl protease. Double and triple destroyers were generated via recombination, and tested for protease spectra and the expression and secretion of the PELB pectin lyase protein from A. niger, which is very susceptible to proteolytic degradation (van den Hombergh et al. , nineteen ninety five). The rupture of pepA and pepB resulted in the reduction in both cases of extracellular protease activities, 80% and 6%, respectively. In the 'pepE destroyer, other protease activities (vacuolar) were also significantly affected, caused by the inactivation of the proteolytic cascade for other vacuolar proteases. Reduced extracellular activities were correlated with reduced in vitro degradation of PELB and improved in vivo expression of pelB (van den Hombergh et al., 1996f).

Hongos filamentosos con mutantes deficientes en proteasas (prt) Filamentous fungi with protease deficient mutants (prt)

Se han estudiado varios mutantes deficientes en proteasas de Aspergillus para saber si se mejora la producción proteica. Archer y colaboradores describen la proteolisis reducida de lisozima de clara de huevo de gallina en sobrenadantes de un mutante prt doble de A. niger generado por Mattern y colaboradores (1992), y concluyen que, aunque la degradación no está ausente, está significativamente reducida. Van den Hombergh et al., (1995) muestran que la degradación in vitro de PELB de A. niger está reducida en los siete grupos de complementación de prt que han aislado. Virtualmente no se observa degradación en los mutantes prtB, prtF y prtG. Recientemente, se demostró que la expresión del gen pelB estaba mejorada en seis grupos de complementación ensayados (prtA-F), y se observaron los mayores niveles de expresión en los mutantes prtB, prtF y prtG. Además de los mutantes individuales, que contenían actividades proteolíticas extracelulares residuales que varían de 2-80% en comparación con la actividad de tipo salvaje, se generaron mutantes dobles tanto mediante recombinación como mediante rondas Several mutants deficient in Aspergillus proteases have been studied to know if protein production is improved. Archer et al. Describe the reduced proteolysis of chicken egg white lysozyme in supernatants of a double prt mutant of A. niger generated by Mattern et al. (1992), and conclude that, although degradation is not absent, it is significantly reduced. Van den Hombergh et al., (1995) show that the in vitro degradation of PELB from A. niger is reduced in the seven prt complementation groups that they have isolated. Virtually no degradation is observed in the prtB, prtF and prtG mutants. Recently, it was shown that pelB gene expression was improved in six complementation groups tested (prtA-F), and the highest levels of expression were observed in the prtB, prtF and prtG mutants. In addition to the individual mutants, which contained residual extracellular proteolytic activities ranging from 2-80% compared to wild-type activity, double mutants were generated both by recombination and by rounds.

adicionales de mutagénesis. Vía este enfoque, se seleccionaron varios mutantes de prt dobles y se caracterizaron posteriormente, lo que mostró una reducción adicional de la degradación de PELB en comparación con sus cepas parentales. additional mutagenesis. Via this approach, several double prt mutants were selected and subsequently characterized, which showed an additional reduction in PELB degradation compared to their parental strains.

En lugar de eliminar las actividades de proteasas vía ruptura o mutagénesis, la proteolisis reducida también se puede lograr vía disminución de las actividades proteolíticas que interfieren. Esto se puede lograr alterando genéticamente el promotor u otras secuencias reguladoras del gen. Como se muestra mediante Fraissinet-Tachet y colaboradores (1996), las proteasas extracelulares en A. niger están todas reguladas por la represión del catabolito de carbono y la represión del metabolito de nitrógeno. La falta de nutrientes también provoca que aumente enormemente la velocidad global de proteolisis en una célula, lo que tiene sentido para una célula que carece de nutrientes pero que posee proteínas, que, en condiciones de hambruna, no son necesarios o sólo son necesarios en cantidades más pequeñas. En estrategias de expresión que permiten la expresión elevada en medios que contienen concentraciones elevadas de glucosa y amoníaco, se ha dado a conocer proteolisis reducida. Varios promotores glucolíticos constitutivos (gpd y pkiA) están muy expresados en estas condiciones, y también se pueden usar para conducir la expresión génica (heteróloga) en fermentaciones continuas. El tipo de falta de nutrientes impuesto puede influir en grados variables en las diferentes proteasas, lo que significa que la importancia de las condiciones del nutriente en un proceso dado depende del tipo de proteolisis que está implicado. Por lo tanto, se pueden inducir proteolisis específicas mediante condiciones de limitación de sustrato, que se usan frecuentemente en muchos procesos de fermentación a gran escala. Instead of eliminating protease activities via disruption or mutagenesis, reduced proteolysis can also be achieved via decreased interfering proteolytic activities. This can be achieved by genetically altering the promoter or other regulatory sequences of the gene. As shown by Fraissinet-Tachet et al. (1996), the extracellular proteases in A. niger are all regulated by the repression of the carbon catabolite and the repression of the nitrogen metabolite. The lack of nutrients also causes the overall rate of proteolysis in a cell to increase dramatically, which makes sense for a cell that lacks nutrients but has proteins, which, under famine conditions, are not necessary or only necessary in amounts smaller. In expression strategies that allow high expression in media containing high concentrations of glucose and ammonia, reduced proteolysis has been disclosed. Several constitutive glycolytic promoters (gpd and pkiA) are highly expressed under these conditions, and can also be used to drive gene expression (heterologous) in continuous fermentations. The type of lack of nutrients imposed can influence varying degrees in different proteases, which means that the importance of nutrient conditions in a given process depends on the type of proteolysis that is involved. Therefore, specific proteolysis can be induced by substrate limiting conditions, which are frequently used in many large-scale fermentation processes.

El problema de la proteasa se puede resolver actualmente en parte mediante una o más de las estrategias anteriores. Sin embargo, la actividad proteolítica residual de enzimas proteolíticas todavía no identificadas constituye aún un problema importante en la técnica. A fin de reducir adicionalmente el nivel de proteolisis indeseada, existe una gran necesidad en la técnica de identificar nuevas proteasas responsables de la degradación de proteínas expresadas homóloga y heterólogamente. Esta invención proporciona tales nuevas secuencias génicas de proteasas que codifican nuevas proteasas. Una vez que se conoce la secuencia primaria de una nueva proteasa, se puede emplear una o más de las estrategias de ADN recombinante anteriores para producir mutantes (carentes de un gen) con actividad proteolítica reducida. The protease problem can now be partially resolved by one or more of the above strategies. However, the residual proteolytic activity of proteolytic enzymes not yet identified is still a major problem in the art. In order to further reduce the level of unwanted proteolysis, there is a great need in the art to identify new proteases responsible for the degradation of homologous and heterologously expressed proteins. This invention provides such new protease gene sequences that encode new proteases. Once the primary sequence of a new protease is known, one or more of the above recombinant DNA strategies can be employed to produce mutants (lacking a gene) with reduced proteolytic activity.

A pesar de las aplicaciones ampliamente extendidas de las proteasas en un gran número de procesos industriales, las enzimas actuales también tienen puntos débiles significativos con respecto a al menos una de las siguientes propiedades. Despite the widespread applications of proteases in a large number of industrial processes, current enzymes also have significant weaknesses with respect to at least one of the following properties.

Cuando se añaden al pienso animal, las proteasas actuales no son suficientemente resistentes a las enzimas digestivas presentes en el tubo digestivo (GI) de, por ejemplo, cerdos y aves de corral. When added to animal feed, current proteases are not sufficiently resistant to the digestive enzymes present in the digestive tract (GI) of, for example, pigs and poultry.

Con respecto a otro aspecto, las enzimas actualmente disponibles no son suficientemente resistentes a condiciones específicas de temperaturas (elevadas) y presiones (elevadas) que se aplican durante las operaciones de extrusión With respect to another aspect, currently available enzymes are not sufficiently resistant to specific conditions of (high) temperatures and (high) pressures that are applied during extrusion operations

o formación de peletes. or pellet formation.

También, las enzimas actuales no son suficientemente activas en un intervalo de pH de 3-7, condiciones que prevalecen en muchos productos alimentarios, de bebidas, así como en el tubo digestivo de la mayoría de los animales. Also, current enzymes are not sufficiently active in a pH range of 3-7, conditions that prevail in many food products, beverages, as well as in the digestive tract of most animals.

Según todavía otro aspecto, la especificidad de las proteasas actualmente disponibles es muy limitada, lo que da como resultado la incapacidad de las enzimas existentes para degradar o disolver ciertas proteínas “resistentes a proteasas”, dando como resultado así rendimientos peptídicos o de aminoácidos bajos. Además, las proteasas con nuevas especificidades permiten la síntesis de nuevos péptidos. According to yet another aspect, the specificity of currently available proteases is very limited, which results in the inability of existing enzymes to degrade or dissolve certain "protease resistant" proteins, thus resulting in low peptide or amino acid yields. In addition, proteases with new specificities allow the synthesis of new peptides.

Aún otro inconveniente de las enzimas actualmente disponibles es su baja actividad específica. Still another drawback of the enzymes currently available is their low specific activity.

Por lo tanto, está claro que, para un gran número de aplicaciones, existe un fuerte deseo de proteasas que sean más resistentes a enzimas digestivas, a temperatura y/o presión elevada, y que muestren nuevas especificidades con respecto a sus sitios de hidrólisis. La presente invención proporciona tales enzimas. Therefore, it is clear that, for a large number of applications, there is a strong desire for proteases that are more resistant to digestive enzymes, at elevated temperature and / or pressure, and that show new specificities with respect to their hydrolysis sites. The present invention provides such enzymes.

Objeto de la invención Object of the invention

Es un objeto de la invención proporcionar nuevos polinucleótidos que codifican nuevas proteasas. Un objeto adicional es proporcionar proteasas producidas natural y recombinantemente, así como cepas recombinantes que las producen. Tales cepas también se pueden usar para producir de forma más rápida o con mayores rendimientos productos clásicos de fermentación. Todavía otro objeto de la invención es proporcionar una cepa de hongo filamentoso que es defectuosa a la hora de producir una proteasa según la invención. Tales cepas se pueden usar para una producción más eficiente de proteínas heterólogas u homólogas. También los anticuerpos y polipéptidos de fusión son parte de la invención, así como métodos para obtener y usar los polinucleótidos y polipéptidos según la invención. It is an object of the invention to provide new polynucleotides encoding new proteases. A further object is to provide naturally and recombinantly produced proteases, as well as recombinant strains that produce them. Such strains can also be used to produce classic fermentation products faster or with higher yields. Still another object of the invention is to provide a filamentous fungus strain that is defective in producing a protease according to the invention. Such strains can be used for more efficient production of heterologous or homologous proteins. Also the antibodies and fusion polypeptides are part of the invention, as well as methods for obtaining and using the polynucleotides and polypeptides according to the invention.

Sumario de la invención Summary of the invention

La invención proporciona nuevos polinucleótidos que codifican nuevas proteasas. The invention provides new polynucleotides encoding new proteases.

Más en particular, la invención proporciona polinucleótidos que tienen una secuencia nucleotídica que se hibrida (preferiblemente en condiciones muy restrictivas) a una secuencia según una secuencia seleccionada del grupo que consiste en SEC ID NO: 10 ó 67. En consecuencia, la invención proporciona ácidos nucleicos que tienen alrededor de 80%, 85%, 90%, 95%, 96%, 97%, 98% o 99% de homología con las secuencias según una secuencia seleccionada del grupo que consiste en SEC ID NO: 10 ó 67. More particularly, the invention provides polynucleotides having a nucleotide sequence that hybridizes (preferably under very restrictive conditions) to a sequence according to a sequence selected from the group consisting of SEQ ID NO: 10 or 67. Accordingly, the invention provides acids Nuclei having about 80%, 85%, 90%, 95%, 96%, 97%, 98% or 99% homology to the sequences according to a sequence selected from the group consisting of SEQ ID NO: 10 or 67.

En una realización más preferida, la invención proporciona tal polinucleótido aislado obtenible de un hongo filamentoso, preferiblemente Aspergilli, en particular se prefiere A. niger. In a more preferred embodiment, the invention provides such an isolated polynucleotide obtainable from a filamentous fungus, preferably Aspergilli, in particular A. niger is preferred.

En una realización, la invención proporciona un polinucleótido aislado que comprende una secuencia de ácidos nucleicos que codifica un polipéptido con una secuencia de aminoácidos de SEC ID NO: 124 o sus equivalentes funcionales. In one embodiment, the invention provides an isolated polynucleotide comprising a nucleic acid sequence encoding a polypeptide with an amino acid sequence of SEQ ID NO: 124 or its functional equivalents.

En una realización preferida adicional, la invención proporciona un polinucleótido aislado que codifica al menos un dominio funcional de un polipéptido según una secuencia de SEC ID NO: 124 o sus equivalentes funcionales. In a further preferred embodiment, the invention provides an isolated polynucleotide encoding at least one functional domain of a polypeptide according to a sequence of SEQ ID NO: 124 or its functional equivalents.

En una realización preferida, la invención proporciona un gen de proteasa según una secuencia de SEC ID NO: 10. En otro aspecto, la invención proporciona un polinucleótido, preferiblemente un ADNc que codifica una proteasa de In a preferred embodiment, the invention provides a protease gene according to a sequence of SEQ ID NO: 10. In another aspect, the invention provides a polynucleotide, preferably a cDNA encoding a protease of

A. niger de SEC ID NO: 67, o variantes o fragmentos de ese polipéptido. En una realización preferida, el ADNc tiene una secuencia seleccionada del grupo que consiste en SEC ID NO: 67 o sus equivalentes funcionales. A. niger of SEQ ID NO: 67, or variants or fragments of that polypeptide. In a preferred embodiment, the cDNA has a sequence selected from the group consisting of SEQ ID NO: 67 or its functional equivalents.

También se puede obtener un clon genómico que codifica un polipéptido según la invención seleccionando sondas adecuadas para amplificar específicamente una región genómica que corresponde a las secuencias según SEC ID NO: 10 o sus fragmentos, hibridando esa sonda en condiciones adecuadas a ADN genómico obtenido de un organismo adecuado, tal como Aspergillus, por ejemplo A. niger, amplificando el fragmento deseado, por ejemplo mediante PCR (reacción en cadena de la polimerasa), seguido de la purificación y clonación del fragmento amplificado. A genomic clone encoding a polypeptide according to the invention can also be obtained by selecting suitable probes to specifically amplify a genomic region corresponding to the sequences according to SEQ ID NO: 10 or its fragments, hybridizing that probe under conditions suitable to genomic DNA obtained from a suitable organism, such as Aspergillus, for example A. niger, amplifying the desired fragment, for example by PCR (polymerase chain reaction), followed by purification and cloning of the amplified fragment.

En incluso una realización preferida adicional, la invención proporciona un polinucleótido que comprende la secuencia codificante de los polinucleótidos genómicos según la invención; se prefiere una secuencia polinucleotídica de SEC ID NO: 10. In even a further preferred embodiment, the invention provides a polynucleotide comprising the coding sequence of the genomic polynucleotides according to the invention; a polynucleotide sequence of SEQ ID NO: 10 is preferred.

En otra realización preferida, la invención proporciona un ADNc obtenible clonando y expresando una secuencia de SEC ID NO: 67 en un organismo hospedante adecuado, tal como A. niger. In another preferred embodiment, the invention provides a cDNA obtainable by cloning and expressing a sequence of SEQ ID NO: 67 in a suitable host organism, such as A. niger.

También se puede obtener un polipéptido según la invención clonando y expresando una secuencia de SEC ID NO: 10 en un organismo hospedante adecuado, tal como A. niger. A polypeptide according to the invention can also be obtained by cloning and expressing a sequence of SEQ ID NO: 10 in a suitable host organism, such as A. niger.

La invención también se refiere a vectores que comprenden una secuencia polinucleotídica según la invención y cebadores, sondas y fragmentos que se pueden usar para amplificar o detectar el ADN según la invención. The invention also relates to vectors comprising a polynucleotide sequence according to the invention and primers, probes and fragments that can be used to amplify or detect the DNA according to the invention.

En una realización preferida adicional, se proporciona un vector en el que la secuencia polinucleotídica según la invención está ligada funcionalmente con secuencias reguladoras adecuadas para la expresión de la secuencia de aminoácidos codificada en una célula hospedante adecuada, tal como A. niger o A. oryzea. La invención también proporciona métodos para preparar polinucleótidos y vectores según la invención. In a further preferred embodiment, a vector is provided in which the polynucleotide sequence according to the invention is functionally linked with regulatory sequences suitable for the expression of the amino acid sequence encoded in a suitable host cell, such as A. niger or A. oryzea . The invention also provides methods for preparing polynucleotides and vectors according to the invention.

La invención también se refiere a células hospedantes producidas recombinantemente que contienen polinucleótidos heterólogos u homólogos según la invención. The invention also relates to recombinantly produced host cells containing heterologous or homologous polynucleotides according to the invention.

En una realización, la invención proporciona células hospedantes recombinantes en las que la expresión de una proteasa según la invención está significativamente reducida, o en las que la actividad de la proteasa está reducida, In one embodiment, the invention provides recombinant host cells in which the expression of a protease according to the invention is significantly reduced, or in which the protease activity is reduced,

o en las que la proteasa está incluso inactivada. Tales recombinantes son especialmente útiles para la expresión de proteínas homólogas o heterólogas. or in which the protease is even inactivated. Such recombinants are especially useful for the expression of homologous or heterologous proteins.

En otra realización, la invención proporciona células hospedantes recombinantes en las que la expresión de una proteasa según la invención está incrementada significativamente, o en las que la actividad de la proteasa está incrementada. Tales recombinantes son especialmente útiles para la expresión de proteínas homólogas o heterólogas en las que la maduración está seriamente impedida en el caso en el que la escisión proteolítica requerida se convierta en la etapa limitante de la velocidad. In another embodiment, the invention provides recombinant host cells in which the expression of a protease according to the invention is significantly increased, or in which the protease activity is increased. Such recombinants are especially useful for the expression of homologous or heterologous proteins in which maturation is seriously impeded in the case where the required proteolytic cleavage becomes the speed limiting stage.

En otra realización, la invención proporciona una célula hospedante producida recombinantemente que contiene ADN heterólogo u homólogo según la invención, preferiblemente ADN que codifica proteínas que poseen secuencias señal, y en la que la célula es capaz de producir una proteasa funcional según la invención, preferiblemente una célula capaz de sobreexpresar la proteasa según la invención, por ejemplo una cepa de Aspergillus que comprende un número creciente de copias de un gen o ADNc según la invención. In another embodiment, the invention provides a recombinantly produced host cell containing heterologous or homologous DNA according to the invention, preferably DNA encoding proteins that possess signal sequences, and in which the cell is capable of producing a functional protease according to the invention, preferably a cell capable of overexpressing the protease according to the invention, for example an Aspergillus strain comprising an increasing number of copies of a gene or cDNA according to the invention.

En otra realización, la invención proporciona una célula hospedante producida recombinantemente que contiene ADN heterólogo u homólogo según la invención, y en la que la célula es capaz de segregar una proteasa funcional según la invención, preferiblemente una célula capaz de sobreexpresar y segregar la proteasa según la invención, por ejemplo una cepa de Aspergillus que comprende un número creciente de copias de un gen o ADNc según la invención. In another embodiment, the invention provides a recombinantly produced host cell containing heterologous or homologous DNA according to the invention, and wherein the cell is capable of secreting a functional protease according to the invention, preferably a cell capable of overexpressing and secreting the protease according the invention, for example an Aspergillus strain comprising an increasing number of copies of a gene or cDNA according to the invention.

En todavía otro aspecto de la invención, se proporciona un polipéptido purificado. Los polipéptidos según la invención incluyen los polipéptidos codificados por los polinucleótidos según la invención. Se prefiere especialmente un polipéptido según una secuencia seleccionada del grupo que consiste en SEC ID NO: 115 a SEC ID NO: 171 o sus equivalentes funcionales. In yet another aspect of the invention, a purified polypeptide is provided. Polypeptides according to the invention include polypeptides encoded by polynucleotides according to the invention. A polypeptide according to a sequence selected from the group consisting of SEQ ID NO: 115 to SEQ ID NO: 171 or its functional equivalents is especially preferred.

La invención también proporciona anticuerpos que reaccionan con un polipéptido según la invención. Estos anticuerpos pueden ser policlonales, aunque se prefiere especialmente que sean anticuerpos monoclonales. Tales anticuerpos son particularmente útiles para purificar los polipéptidos según la invención. The invention also provides antibodies that react with a polypeptide according to the invention. These antibodies may be polyclonal, although it is especially preferred that they are monoclonal antibodies. Such antibodies are particularly useful for purifying the polypeptides according to the invention.

También están dentro del alcance de la invención las proteínas de fusión que comprenden un polipéptido según la invención. La invención también proporciona métodos para obtener los polipéptidos según la invención. Fusion proteins comprising a polypeptide according to the invention are also within the scope of the invention. The invention also provides methods for obtaining the polypeptides according to the invention.

La invención se refiere además a un método para diagnosticar aspergilosis detectando la presencia de un polipéptido según la invención o sus equivalentes funcionales, o detectando la presencia de un ADN según la invención o sus fragmentos o equivalentes funcionales. The invention further relates to a method for diagnosing aspergillosis by detecting the presence of a polypeptide according to the invention or its functional equivalents, or by detecting the presence of a DNA according to the invention or its fragments or functional equivalents.

La invención también se refiere al uso de la proteasa según la invención en un proceso industrial como se describe aquí. The invention also relates to the use of the protease according to the invention in an industrial process as described herein.

Descripción detallada de la invención Detailed description of the invention

Polinucleótidos Polynucleotides

La presente invención proporciona polinucleótidos que codifican proteasas que tienen una secuencia de aminoácidos de SEC ID NO: 124 o sus equivalentes funcionales. La secuencia de estos genes se determinó secuenciando un clon genómico obtenido a partir de Aspergillus niger. La invención proporciona secuencias polinucleotídicas que comprenden el gen que codifica estas proteasas, así como su secuencia de ADNc completa y su secuencia codificante. En consecuencia, la invención se refiere a un polinucleótido aislado que comprende una secuencia nucleotídica de SEC ID NO: 10, o una secuencia de SEC ID NO: 67, o sus equivalentes funcionales. The present invention provides polynucleotides encoding proteases that have an amino acid sequence of SEQ ID NO: 124 or its functional equivalents. The sequence of these genes was determined by sequencing a genomic clone obtained from Aspergillus niger. The invention provides polynucleotide sequences comprising the gene that encodes these proteases, as well as their complete cDNA sequence and their coding sequence. Accordingly, the invention relates to an isolated polynucleotide comprising a nucleotide sequence of SEQ ID NO: 10, or a sequence of SEQ ID NO: 67, or its functional equivalents.

Más en particular, la invención se refiere a un polinucleótido aislado hibridable en condiciones restrictivas a un polinucleótido de SEC ID NO: 10 o una secuencia de SEC ID NO: 67, preferiblemente en condiciones muy restrictivas. Ventajosamente, tales polinucleótidos se pueden obtener a partir de hongos filamentosos, en particular a partir de Aspergillus niger. Más específicamente, la invención se refiere a un polinucleótido aislado que tiene una secuencia nucleotídica según una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67. More particularly, the invention relates to an isolated polynucleotide hybridizable under restrictive conditions to a polynucleotide of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, preferably under very restrictive conditions. Advantageously, such polynucleotides can be obtained from filamentous fungi, in particular from Aspergillus niger. More specifically, the invention relates to an isolated polynucleotide having a nucleotide sequence according to a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67.

La invención también se refiere a un polinucleótido aislado que codifica al menos un dominio funcional de un polipéptido según SEC ID NO: 124 o sus equivalentes funcionales. The invention also relates to an isolated polynucleotide encoding at least one functional domain of a polypeptide according to SEQ ID NO: 124 or its functional equivalents.

Como se usan aquí, los términos “gen” y “gen recombinante” se refieren a moléculas de ácidos nucleicos que se pueden aislar a partir de ADN cromosómico, que incluyen un marco de lectura abierto que codifica una proteína, por ejemplo una proteasa de A. niger. Un gen puede incluir secuencias codificantes, secuencias no codificantes, intrones y secuencias reguladoras. Además, un gen se refiere a una molécula de ácido nucleico aislada como se define aquí. As used herein, the terms "gene" and "recombinant gene" refer to nucleic acid molecules that can be isolated from chromosomal DNA, which include an open reading frame encoding a protein, for example a protease of A niger A gene can include coding sequences, non-coding sequences, introns and regulatory sequences. In addition, a gene refers to an isolated nucleic acid molecule as defined herein.

Una molécula de ácido nucleico de la presente invención, tal como una molécula de ácido nucleico que tiene la secuencia nucleotídica de una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67, o un equivalente funcional de las mismas, se puede aislar usando técnicas estándar de biología molecular y la información de secuencia proporcionada aquí. Por ejemplo, usando toda o parte de la secuencia de ácido nucleico de una secuencia de SEC ID NO: 10, o la secuencia nucleotídica de una secuencia de SEC ID NO: 67, como sonda de hibridación, se pueden aislar moléculas de ácidos nucleicos según la invención usando técnicas de hibridación y clonación estándar (por ejemplo, como se describe en Sambrook, J., Fritsh, E. F., y Maniatis, T. Molecular Cloning: A Laboratory Manual 2ª, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989). A nucleic acid molecule of the present invention, such as a nucleic acid molecule having the nucleotide sequence of a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, or a functional equivalent thereof, is You can isolate using standard molecular biology techniques and the sequence information provided here. For example, using all or part of the nucleic acid sequence of a sequence of SEQ ID NO: 10, or the nucleotide sequence of a sequence of SEQ ID NO: 67, as a hybridization probe, nucleic acid molecules can be isolated according to the invention using standard hybridization and cloning techniques (for example, as described in Sambrook, J., Fritsh, EF, and Maniatis, T. Molecular Cloning: A Laboratory Manual 2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989).

Además, una molécula de ácido nucleico que engloba toda o una porción de una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67 se puede aislar mediante la reacción en cadena de la polimerasa (PCR) usando cebadores oligonucleótidos sintéticos diseñados basándose en la información de secuencia contenida en una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67. In addition, a nucleic acid molecule that encompasses all or a portion of a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67 can be isolated by polymerase chain reaction (PCR) using synthetic oligonucleotide primers designed based on the sequence information contained in a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67.

Un ácido nucleico de la invención se puede amplificar usando ADNc, ARNm, o, como alternativa, ADN genómico, como molde, y cebadores oligonucleotídicos apropiados según técnicas de amplificación mediante PCR estándar. El A nucleic acid of the invention can be amplified using cDNA, mRNA, or, alternatively, genomic DNA, as a template, and appropriate oligonucleotide primers according to standard PCR amplification techniques. He

ácido nucleico así amplificado se puede clonar en un vector apropiado y se puede caracterizar mediante análisis de secuencia de ADN. Nucleic acid thus amplified can be cloned into an appropriate vector and characterized by DNA sequence analysis.

Además, se pueden preparar oligonucleótidos que corresponden a o son hibridables a secuencias nucleotídicas según la invención mediante técnicas sintéticas estándar, por ejemplo usando un sintetizador de ADN automatizado. In addition, oligonucleotides that correspond to or are hybridizable to nucleotide sequences according to the invention can be prepared by standard synthetic techniques, for example using an automated DNA synthesizer.

5 En una realización preferida, una molécula de ácido nucleico aislada de la invención comprende la secuencia nucleotídica mostrada en una secuencia de SEC ID NO: 67. La secuencia de una secuencia de SEC ID NO: 67 corresponde a la región codificante del ADNc de proteasa de A. niger. Este ADNc comprende secuencias que codifican el polipéptido de proteasa de A. niger según una secuencia de SEC ID NO: 124. In a preferred embodiment, an isolated nucleic acid molecule of the invention comprises the nucleotide sequence shown in a sequence of SEQ ID NO: 67. The sequence of a sequence of SEQ ID NO: 67 corresponds to the coding region of the protease cDNA. of A. niger. This cDNA comprises sequences encoding the A. niger protease polypeptide according to a sequence of SEQ ID NO: 124.

En otra realización preferida, una molécula de ácido nucleico aislada de la invención comprende una molécula de ácido nucleico que es un complemento de la secuencia nucleotídica mostrada en una secuencia de SEC ID NO: 10 In another preferred embodiment, an isolated nucleic acid molecule of the invention comprises a nucleic acid molecule that is a complement to the nucleotide sequence shown in a sequence of SEQ ID NO: 10

o una secuencia de SEC ID NO: 57, o un equivalente funcional de estas secuencias nucleotídicas. or a sequence of SEQ ID NO: 57, or a functional equivalent of these nucleotide sequences.

Una molécula de ácido nucleico que es complementaria a otra secuencia de ácido nucleico es aquella que es suficientemente complementaria a la otra secuencia nucleotídica, de forma que se puede hibridar a la otra secuencia nucleotídica formando de ese modo un dúplex estable. A nucleic acid molecule that is complementary to another nucleic acid sequence is one that is sufficiently complementary to the other nucleotide sequence, so that it can hybridize to the other nucleotide sequence thereby forming a stable duplex.

15 Un aspecto de la invención se refiere a moléculas de ácidos nucleicos aisladas que codifican un polipéptido de la invención o un equivalente funcional del mismo, tal como un fragmento o dominio biológicamente activo, así como moléculas de ácidos nucleicos suficientes para uso como sonda de hibridación para identificar moléculas de ácidos nucleicos que codifican un polipéptido de la invención y fragmentos de tales moléculas de ácidos nucleicos adecuados para uso como cebadores de la PCR para la amplificación o mutación de moléculas de ácidos nucleicos. One aspect of the invention relates to isolated nucleic acid molecules encoding a polypeptide of the invention or a functional equivalent thereof, such as a biologically active fragment or domain, as well as nucleic acid molecules sufficient for use as a hybridization probe. to identify nucleic acid molecules encoding a polypeptide of the invention and fragments of such nucleic acid molecules suitable for use as PCR primers for amplification or mutation of nucleic acid molecules.

Un “polinucleótido aislado” o “ácido nucleico aislado” es un ADN o ARN que no está inmediatamente contiguo a ambas secuencias codificantes con las que está inmediatamente contiguo (una en el extremo 5’ y una en el extremo 3’) en el genoma de origen natural del organismo a partir del que deriva. De este modo, en una realización, un ácido nucleico aislado incluye algunas o todas las secuencias no codificantes en 5’ (por ejemplo, promotoras) que están inmediatamente contiguas a la secuencia codificante. Por lo tanto, el término incluye, por ejemplo, un ADN An "isolated polynucleotide" or "isolated nucleic acid" is a DNA or RNA that is not immediately adjacent to both coding sequences with which it is immediately contiguous (one at the 5 'end and one at the 3' end) in the genome of natural origin of the organism from which it derives. Thus, in one embodiment, an isolated nucleic acid includes some or all of the 5 ’non-coding sequences (e.g., promoters) that are immediately adjacent to the coding sequence. Therefore, the term includes, for example, a DNA

25 recombinante que se incorpora en un vector, en un plásmido o virus que se replica autónomamente, o en el ADN genómico de un procariota o eucariota, o que existe como molécula separada (por ejemplo, un ADNc o un fragmento de ADN genómico producido mediante PCR o tratamiento con endonucleasa de restricción) independiente de otras secuencias. También incluye un ADN recombinante que es parte de un gen híbrido que codifica un polipéptido adicional que está sustancialmente libre de material celular, material vírico, o medio de cultivo (cuando se produce mediante técnicas de ADN recombinante), o precursores víricos u otros productos químicos (cuando se sintetiza químicamente). Además, un “fragmento de ácido nucleico aislado” es un fragmento de ácido nucleico que no es de origen natural como fragmento, y que no se encontraría en el estado natural. A recombinant that is incorporated into a vector, in a plasmid or virus that replicates autonomously, or in the genomic DNA of a prokaryotic or eukaryotic, or that exists as a separate molecule (for example, a cDNA or a genomic DNA fragment produced by PCR or restriction endonuclease treatment) independent of other sequences. It also includes a recombinant DNA that is part of a hybrid gene that encodes an additional polypeptide that is substantially free of cellular material, viral material, or culture medium (when produced by recombinant DNA techniques), or viral precursors or other chemicals. (when chemically synthesized). In addition, an "isolated nucleic acid fragment" is a nucleic acid fragment that is not naturally occurring as a fragment, and would not be found in the natural state.

Como se usa aquí, los términos “polinucleótido” o “molécula de ácido nucleico” están destinados a incluir moléculas de ADN (por ejemplo, ADNc o ADN genómico) y moléculas de ARN (por ejemplo, ARNm), y análogos del ADN o As used herein, the terms "polynucleotide" or "nucleic acid molecule" are intended to include DNA molecules (e.g., cDNA or genomic DNA) and RNA molecules (e.g., mRNA), and DNA analogs or

35 ARN generados usando análogos nucleotídicos. La molécula de ácido nucleico puede ser monocatenaria o bicatenaria, pero preferiblemente es ADN bicatenario. El ácido nucleico se puede sintetizar usando análogos o derivados oligonucleotídicos (por ejemplo, inosina o nucleótidos de fosforotioato). Tales oligonucleótidos se pueden usar, por ejemplo, para preparar ácidos nucleicos que tienen capacidades alteradas de emparejamiento de bases, o que tienen resistencia incrementada a nucleasas. 35 RNAs generated using nucleotide analogs. The nucleic acid molecule may be single stranded or double stranded, but preferably it is double stranded DNA. The nucleic acid can be synthesized using oligonucleotide analogs or derivatives (for example, inosine or phosphorothioate nucleotides). Such oligonucleotides can be used, for example, to prepare nucleic acids that have altered base matching capabilities, or that have increased resistance to nucleases.

Otra realización de la invención proporciona una molécula de ácido nucleico aislada que es antisentido a una molécula de ácido nucleico de proteasa, por ejemplo la hebra codificante de una molécula de ácido nucleico de proteasa. También se incluyen en el alcance de la invención las hebras complementarias de las moléculas de ácidos nucleicos descritas aquí. Another embodiment of the invention provides an isolated nucleic acid molecule that is antisense to a protease nucleic acid molecule, for example the coding strand of a protease nucleic acid molecule. Also complementary to the nucleic acid molecules described herein are included within the scope of the invention.

Errores de secuenciación Sequencing errors

45 La información de secuencia, como se proporciona aquí, no se debería de interpretar tan estrechamente como para requerir la inclusión de bases erróneamente identificadas. Las secuencias específicas descritas aquí se pueden usar fácilmente para aislar el gen completo a partir de hongos filamentosos, en particular A. niger, que a su vez se puede someter fácilmente a análisis de secuencia adicionales, identificando de ese modo errores de secuenciación. 45 Sequence information, as provided here, should not be interpreted so closely as to require the inclusion of erroneously identified bases. The specific sequences described herein can be easily used to isolate the entire gene from filamentous fungi, in particular A. niger, which in turn can easily be subjected to additional sequence analysis, thereby identifying sequencing errors.

Excepto que se indique de otro modo, todas las secuencias nucleotídicas determinadas secuenciando una molécula de ADN aquí se determinaron usando un secuenciador automatizado de ADN, y todas las secuencias de aminoácidos de los polipéptidos codificados por moléculas de ADN determinadas aquí se predijeron mediante traducción de una secuencia de ADN determinada como antes. Por lo tanto, como se sabe en la técnica para cualquier secuencia de ADN determinada mediante este enfoque automatizado, cualquier secuencia nucleotídica determinada aquí puede contener algunos errores. Las secuencias nucleotídicas determinadas mediante 55 automatización son típicamente al menos alrededor de 90% idénticas, más típicamente al menos alrededor de 95% hasta al menos alrededor de 99,9% idénticas a la secuencia nucleotídica real de la molécula de ADN secuenciada. La secuencia real se puede determinar de forma más precisa mediante otros enfoques, incluyendo métodos de Except as otherwise indicated, all nucleotide sequences determined by sequencing a DNA molecule here were determined using an automated DNA sequencer, and all amino acid sequences of the polypeptides encoded by DNA molecules determined herein were predicted by translation of a DNA sequence determined as before. Therefore, as is known in the art for any DNA sequence determined by this automated approach, any nucleotide sequence determined herein may contain some errors. Nucleotide sequences determined by automation are typically at least about 90% identical, more typically at least about 95% to at least about 99.9% identical to the actual nucleotide sequence of the sequenced DNA molecule. The actual sequence can be determined more precisely by other approaches, including methods of

secuenciación manual de ADN, bien conocidos en la técnica. Como también se sabe en la técnica, una inserción o supresión individual en una secuencia nucleotídica determinada comparada con la secuencia real provocará un desplazamiento del marco en la traducción de la secuencia nucleotídica, de manera que la secuencia de aminoácidos predicha codificada por una secuencia nucleotídica determinada será completamente diferente de la secuencia de aminoácidos realmente codificada por la molécula de ADN secuenciada, comenzando en el punto de tal inserción o supresión. Manual DNA sequencing, well known in the art. As is also known in the art, an individual insertion or deletion in a particular nucleotide sequence compared to the actual sequence will cause a shift of the frame in the translation of the nucleotide sequence, so that the predicted amino acid sequence encoded by a particular nucleotide sequence it will be completely different from the amino acid sequence actually encoded by the sequenced DNA molecule, starting at the point of such insertion or deletion.

La persona experta en la técnica es capaz de identificar tales bases, identificadas erróneamente, y sabe cómo corregir tales errores. The person skilled in the art is able to identify such bases, erroneously identified, and knows how to correct such errors.

Fragmentos de ácidos nucleicos, sondas y cebadores Fragments of nucleic acids, probes and primers

Una molécula de ácido nucleico según la invención puede comprender sólo una porción o un fragmento de la secuencia de ácido nucleico mostrada en una secuencia seleccionada del grupo que consiste en SEC ID NO: 1 a SEC ID NO: 57, o una secuencia seleccionada del grupo que consiste de SEC ID NO: 58 a SEC ID NO: 114, por ejemplo un fragmento que se puede usar como una sonda o cebador, o un fragmento que codifica una porción de una proteína de tipo proteasa. La secuencia nucleotídica determinada a partir de la clonación del gen de proteasa y ADNc permite la generación de sondas y cebadores diseñados para uso en identificar y/o clonar otros miembros de la familia de proteasas, así como homólogos de proteasa procedentes de otras especies. La sonda/cebador comprende típicamente oligonucleótido sustancialmente purificado, el cual comprende típicamente una región de secuencia nucleotídica que se hibrida preferentemente en condiciones muy restrictivas a al menos alrededor de 12 ó 15, preferiblemente alrededor de 18 ó 20, preferiblemente alrededor de 22 ó 25, más preferiblemente alrededor de 30, 35, 40, 45, 50, 55, 60, 65, ó 75 o más nucleótidos consecutivos de una secuencia nucleotídica mostrada en una secuencia seleccionada del grupo que consiste en SEC ID NO: 1 a SEC ID NO: 57, o una secuencia seleccionada del grupo que consiste en SEC ID NO: 58 a SEC ID NO: 114, o en un equivalente funcional de la misma. A nucleic acid molecule according to the invention may comprise only a portion or a fragment of the nucleic acid sequence shown in a sequence selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 57, or a sequence selected from the group consisting of SEQ ID NO: 58 to SEQ ID NO: 114, for example a fragment that can be used as a probe or primer, or a fragment encoding a portion of a protease-like protein. The nucleotide sequence determined from the cloning of the protease and cDNA gene allows the generation of probes and primers designed for use in identifying and / or cloning other members of the protease family, as well as protease homologs from other species. The probe / primer typically comprises substantially purified oligonucleotide, which typically comprises a region of nucleotide sequence that preferentially hybridizes under very restrictive conditions to at least about 12 or 15, preferably about 18 or 20, preferably about 22 or 25, more preferably about 30, 35, 40, 45, 50, 55, 60, 65, or 75 or more consecutive nucleotides of a nucleotide sequence shown in a sequence selected from the group consisting of SEQ ID NO: 1 to SEQ ID NO: 57, or a sequence selected from the group consisting of SEQ ID NO: 58 to SEQ ID NO: 114, or a functional equivalent thereof.

Las sondas basadas en las secuencias nucleotídicas de las proteasas se pueden usar para detectar transcritos o secuencias de proteasas genómicas que codifican las mismas proteínas o proteínas homólogas, por ejemplo en otros organismos. En realizaciones preferidas, la sonda comprende además un grupo lábil unido a ella, por ejemplo el grupo lábil puede ser un radioisótopo, un compuesto fluorescente, una enzima, o un cofactor enzimático. Tales sondas se pueden usar como parte de un kit de ensayo de diagnóstico para identificar células que expresan una proteína de tipo proteasa. Probes based on the nucleotide sequences of the proteases can be used to detect transcripts or genomic protease sequences encoding the same homologous proteins or proteins, for example in other organisms. In preferred embodiments, the probe further comprises a labile group attached thereto, for example the labile group may be a radioisotope, a fluorescent compound, an enzyme, or an enzymatic cofactor. Such probes can be used as part of a diagnostic assay kit to identify cells that express a protease-like protein.

Identidad y homología Identity and homology

Los términos “homología” o “porcentaje de identidad” se usan de forma intercambiable aquí. Para los fines de esta invención, se define aquí que, a fin de determinar el porcentaje de identidad de dos secuencias de aminoácidos o de dos secuencias de ácidos nucleicos, las secuencias se alinean con fines de comparación óptima (por ejemplo, se pueden introducir saltos en la secuencia de una primera secuencia de aminoácidos o de ácidos nucleicos para el alineamiento óptimo con una segunda secuencia de aminoácidos o de ácidos nucleicos). Entonces se comparan los restos de aminoácidos o nucleótidos en las posiciones de los aminoácidos o posiciones nucleotídicas correspondientes. Cuando una posición en la primera secuencia está ocupada por el mismo resto de aminoácido o nucleótido que la posición correspondiente a la segunda secuencia, entonces las moléculas son idénticas en esa posición. El porcentaje de identidad entre las dos secuencias es una función del número de posiciones idénticas compartidas por las secuencias (es decir, % de identidad = número de posiciones idénticas/número total de posiciones (es decir, posiciones que solapan) x 100). The terms "homology" or "percent identity" are used interchangeably here. For the purposes of this invention, it is defined herein that, in order to determine the percent identity of two amino acid sequences or two nucleic acid sequences, the sequences are aligned for optimal comparison purposes (e.g., jumps may be introduced in the sequence of a first amino acid or nucleic acid sequence for optimal alignment with a second amino acid or nucleic acid sequence). The amino acid or nucleotide residues are then compared at the corresponding amino acid positions or nucleotide positions. When a position in the first sequence is occupied by the same amino acid or nucleotide residue as the position corresponding to the second sequence, then the molecules are identical in that position. The percentage of identity between the two sequences is a function of the number of identical positions shared by the sequences (ie,% identity = number of identical positions / total number of positions (i.e. overlapping positions) x 100).

Preferiblemente, las dos secuencias tienen la misma longitud. Preferably, the two sequences have the same length.

La persona experta estará al tanto del hecho de que existen varios programas de ordenador diferentes para determinar la homología entre dos secuencias. Por ejemplo, una comparación de secuencias y la determinación del porcentaje de identidad entre dos secuencias se puede lograr usando un algoritmo matemático. En una realización preferida, el porcentaje de identidad entre dos secuencias de aminoácidos se determina usando el algoritmo de Needleman y Wunsch (J. Mol. Biol. (48):444-453 (1970)), que se ha incorporado en el programa GAP en el paquete de software de GCG (disponible en http://www.gcg.com), usando una matriz Blossom 62 o una matriz PAM250, y un peso de salto de 16, 14, 12, 10, 8, 6, ó 4 y un peso de longitud de 1, 2, 3, 4, 5, ó 6. La persona experta apreciará que todos estos parámetros diferentes producirán resultados ligeramente diferentes, pero que el porcentaje global de identidad de dos secuencias no se altera significativamente cuando se usan algoritmos diferentes. The skilled person will be aware of the fact that there are several different computer programs to determine the homology between two sequences. For example, a sequence comparison and the determination of the percentage of identity between two sequences can be achieved using a mathematical algorithm. In a preferred embodiment, the percent identity between two amino acid sequences is determined using the algorithm of Needleman and Wunsch (J. Mol. Biol. (48): 444-453 (1970)), which has been incorporated into the GAP program in the GCG software package (available at http://www.gcg.com), using a Blossom 62 matrix or a PAM250 matrix, and a jump weight of 16, 14, 12, 10, 8, 6, or 4 and a length weight of 1, 2, 3, 4, 5, or 6. The skilled person will appreciate that all these different parameters will produce slightly different results, but that the overall percentage identity of two sequences is not significantly altered when They use different algorithms.

En todavía otra realización, el porcentaje de identidad entre dos secuencias nucleotídicas se determina usando el programa GAP en el paquete de software de GCG (disponible en http://www.gcg.com), usando una matriz NWSgapdna.CMP y un peso de salto de 40, 50, 60, 70 u 80 y un peso de longitud de 1, 2, 3, 4, 5, ó 6. En otra realización, el porcentaje de identidad de dos secuencias de aminoácidos o nucleotídicas se determina usando el algoritmo de E. Meyers y W. Miller (CABIOS, 4:11-17 (1989), que se ha incorporado en el programa ALIGN (versión 2.0) (disponible en http://vega(igh.cnrs.fr/bin/align-guess.cgi), usando una tabla de restos de peso de PAM120, una penalización de longitud de salto de 12, y una penalización de salto de 4. In yet another embodiment, the percent identity between two nucleotide sequences is determined using the GAP program in the GCG software package (available at http://www.gcg.com), using an NWSgapdna.CMP matrix and a weight of jump of 40, 50, 60, 70 or 80 and a length weight of 1, 2, 3, 4, 5, or 6. In another embodiment, the percent identity of two amino acid or nucleotide sequences is determined using the algorithm by E. Meyers and W. Miller (CABIOS, 4: 11-17 (1989), which has been incorporated into the ALIGN program (version 2.0) (available at http: // vega (igh.cnrs.fr/bin/align -guess.cgi), using a weight remnants table of PAM120, a jump length penalty of 12, and a jump penalty of 4.

Las secuencias de ácidos nucleicos y proteicas de la presente invención se pueden usar además como una “secuencia de interrogación” para llevar a cabo una búsqueda frente a bases de datos públicas para, por ejemplo, identificar otros miembros de la familia o secuencias relacionadas. Tales búsquedas se pueden llevar a cabo usando los programas NBLAST y XBLAST (versión 2.0) de Altschul, et al. (1990) J. Mol. Biol. 215:403-10. Las búsquedas nucleotídicas de BLAST se pueden llevar a cabo con el programa NBLAST, puntuación = 100, longitud de la palabra = 12, para obtener secuencias nucleotídicas homólogas a moléculas de ácidos nucleicos de proteasas de la invención. Las búsquedas de proteínas de BLAST se pueden realizar con el programa XBLAST, puntuación = 50, longitud de la palabra = 3, para obtener secuencias de aminoácidos homólogas a moléculas proteicas de proteasas de la invención. Para obtener alineamientos con saltos con fines de comparación, se puede utilizar Gapped BLAST, como se describe en Altschul et al., (1997) Nucleic Acids Res. 25(17):3389-3402. Cuando se utilizan los programas BLAST y Gapped BLAST, se pueden usar los parámetros por defecto de los programas respectivos (por ejemplo, XBLAST y NBLAST). Véase http://www.ncbi.nlm.nih.gov. The nucleic and protein acid sequences of the present invention can also be used as an "interrogation sequence" to conduct a search against public databases to, for example, identify other family members or related sequences. Such searches can be carried out using the NBLAST and XBLAST programs (version 2.0) of Altschul, et al. (1990) J. Mol. Biol. 215: 403-10. BLAST nucleotide searches can be carried out with the NBLAST program, score = 100, word length = 12, to obtain nucleotide sequences homologous to protease nucleic acid molecules of the invention. BLAST protein searches can be performed with the XBLAST program, score = 50, word length = 3, to obtain amino acid sequences homologous to protease protein molecules of the invention. To obtain alignment with jumps for comparison purposes, Gapped BLAST can be used, as described in Altschul et al., (1997) Nucleic Acids Res. 25 (17): 3389-3402. When the BLAST and Gapped BLAST programs are used, the default parameters of the respective programs (for example, XBLAST and NBLAST) can be used. See http://www.ncbi.nlm.nih.gov.

Hibridación Hybridization

Como se usa aquí, el término “hibridar” pretende describir condiciones para la hibridación y lavado, en las que las secuencias nucleotídicas al menos alrededor de 50%, al menos alrededor de 60%, al menos alrededor de 70%, más preferiblemente al menos alrededor de 80%, incluso más preferiblemente al menos alrededor de 85% a 90%, más preferiblemente al menos 95% homólogas entre sí, permanecen típicamente hibridadas entre sí. As used herein, the term "hybridize" is intended to describe conditions for hybridization and washing, in which the nucleotide sequences at least about 50%, at least about 60%, at least about 70%, more preferably at least around 80%, even more preferably at least about 85% to 90%, more preferably at least 95% homologous to each other, typically remain hybridized to each other.

Un ejemplo preferido no limitante de tales condiciones de hibridación es la hibridación en 6X cloruro de sodio/citrato de sodio (SSC) a alrededor de 45ºC, seguido de uno o más lavados en 1 X SSC, 0,1% de SDS a 50ºC, preferiblemente a 55ºC, preferiblemente a 60ºC, e incluso más preferiblemente a 65ºC. A preferred non-limiting example of such hybridization conditions is hybridization in 6X sodium chloride / sodium citrate (SSC) at about 45 ° C, followed by one or more washes in 1 X SSC, 0.1% SDS at 50 ° C, preferably at 55 ° C, preferably at 60 ° C, and even more preferably at 65 ° C.

Las condiciones muy restrictivas incluyen, por ejemplo, hibridar a 68ºC en 5x SSC/5x de disolución de Denhardt/1,0% de SDS, y lavar en 0,2x SSC/0,1% de SDS a temperatura ambiente. Como alternativa, el lavado se puede llevar a cabo a 42ºC. Very restrictive conditions include, for example, hybridizing at 68 ° C in 5x SSC / 5x Denhardt solution / 1.0% SDS, and washing in 0.2x SSC / 0.1% SDS at room temperature. Alternatively, washing can be carried out at 42 ° C.

El experto sabrá qué condiciones aplicar para las condiciones de hibridación restrictivas y muy restrictivas. En la técnica hay fácilmente una guía adicional con relación a tales condiciones, por ejemplo en Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; y Ausubel et al. (eds.), 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.). The expert will know what conditions to apply for the restrictive and very restrictive hybridization conditions. In the art there is easily additional guidance in relation to such conditions, for example in Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y .; and Ausubel et al. (eds.), 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.).

Por supuesto, un polinucleótido que se hibrida sólo a una secuencia poly A (tal como el tramo poly(A) terminal de 3’ de los ARNm), o a un trecho complementario de restos T (o U), no se incluirá en un polinucleótido de la invención usado para hibridarse específicamente a una porción de un ácido nucleico de la invención, puesto que tal polinucleótido se hibridaría a cualquier molécula de ácido nucleico que contenga un tramo de poly(A) o su complemento (por ejemplo, prácticamente cualquier clon de ADNc bicatenario). Of course, a polynucleotide that hybridizes only to a poly A sequence (such as the 3 'terminal poly (A) stretch of mRNAs), or to a complementary stretch of T (or U) moieties, will not be included in a polynucleotide of the invention used to specifically hybridize to a portion of a nucleic acid of the invention, since such a polynucleotide would hybridize to any nucleic acid molecule that contains a stretch of poly (A) or its complement (eg, virtually any clone of Double stranded cDNA).

Obtención de ADN de longitud completa a partir de otros organismos Obtaining full-length DNA from other organisms

En un enfoque típico, se identificarán librerías de ADNc construidas a partir de otros organismos, por ejemplo hongos filamentosos, en particular de la especie Aspergillus. In a typical approach, cDNA libraries constructed from other organisms will be identified, for example filamentous fungi, in particular of the Aspergillus species.

Por ejemplo, las cepas de Aspergillus se pueden identificar en busca de polinucleótidos de proteasas homólogas mediante análisis de transferencia Northern. Con la detección de transcritos homólogos a polinucleótidos según la invención, se pueden construir librerías de ADNc a partir de ARN aislado de la cepa apropiada, utilizando técnicas estándar bien conocidas para los expertos en la técnica. Como alternativa, se puede identificar una librería de ADN genómico total usando una sonda que se puede hibridar a un polinucleótido de proteasa según la invención. For example, Aspergillus strains can be identified for homologous protease polynucleotides by Northern blot analysis. With the detection of polynucleotide homologous transcripts according to the invention, cDNA libraries can be constructed from RNA isolated from the appropriate strain, using standard techniques well known to those skilled in the art. Alternatively, a library of total genomic DNA can be identified using a probe that can hybridize to a protease polynucleotide according to the invention.

Se pueden aislar secuencias génicas homólogas, por ejemplo llevando a cabo PCR usando dos cebadores oligonucleotídicos o conjuntos de dos cebadores oligonucleotídicos degenerados diseñados en base a las secuencias nucleotídicas enseñadas aquí. Homologous gene sequences can be isolated, for example by carrying out PCR using two oligonucleotide primers or sets of two degenerate oligonucleotide primers designed based on the nucleotide sequences taught herein.

El molde para la reacción puede ser ADNc obtenido mediante transcripción inversa de ARNm preparado a partir de cepas que se sabe o que se sospecha que expresan un polinucleótido según la invención. El producto de la PCR se puede subclonar y secuenciar para asegurarse de que las secuencias amplificadas representan las secuencias de una nueva secuencia de ácido nucleico de proteasa, o un equivalente funcional de la misma. The template for the reaction can be cDNA obtained by reverse transcription of mRNA prepared from strains known or suspected to express a polynucleotide according to the invention. The PCR product can be subcloned and sequenced to ensure that the amplified sequences represent the sequences of a new protease nucleic acid sequence, or a functional equivalent thereof.

El fragmento de la PCR se puede usar entonces para aislar un clon de ADNc de longitud completa mediante una variedad de métodos conocidos. Por ejemplo, el fragmento amplificado se puede marcar y usar para identificar una librería de ADNc de bacteriófago o de cósmido. Como alternativa, el fragmento marcado se puede usar para identificar una librería genómica. The PCR fragment can then be used to isolate a full length cDNA clone by a variety of known methods. For example, the amplified fragment can be labeled and used to identify a bacteriophage or cosmid cDNA library. Alternatively, the labeled fragment can be used to identify a genomic library.

La tecnología de la PCR también se puede usar para aislar secuencias de ADNc de longitud completa a partir de otros organismos. Por ejemplo, se puede aislar ARN, siguiendo procedimientos estándar, a partir de una fuente celular o tisular apropiada. Se puede llevar a cabo una reacción de transcripción inversa sobre el ARN usando un PCR technology can also be used to isolate full-length cDNA sequences from other organisms. For example, RNA can be isolated, following standard procedures, from an appropriate cellular or tissue source. A reverse transcription reaction on the RNA can be carried out using a

cebador oligonucleotídico específico para la mayoría del extremo 5’ del fragmento amplificado para cebar la síntesis de la primera hebra. oligonucleotide primer specific for most of the 5 ′ end of the amplified fragment to prime the synthesis of the first strand.

El híbrido de ARN/ADN resultante se puede “colear” (por ejemplo, con guaninas) usando una reacción de transferasa terminal estándar, el híbrido se puede digerir con ARNasa H, y entonces se puede cebar la síntesis de la segunda hebra (por ejemplo, con un cebador poly-C). De este modo, se pueden aislar fácilmente secuencias de ADNc en dirección 5’ del fragmento amplificado. Para un repaso de estrategias de clonación útiles, véase por ejemplo Sambrook et al., más arriba; y Ausubel et al., más arriba. The resulting RNA / DNA hybrid can be "colear" (for example, with guanines) using a standard terminal transferase reaction, the hybrid can be digested with RNase H, and then the synthesis of the second strand can be primed (for example , with a poly-C primer). In this way, cDNA sequences can be easily isolated in the 5 'direction of the amplified fragment. For a review of useful cloning strategies, see for example Sambrook et al., Above; and Ausubel et al., above.

Vectores Vectors

Otro aspecto de la invención se refiere a vectores, preferiblemente vectores de expresión, que contienen un ácido nucleico que codifica una proteína de proteasa o un equivalente funcional de la misma. Como se usa aquí, el término “vector” se refiere a una molécula de ácido nucleico capaz de transportar otro ácido nucleico al que está enlazada. Un tipo de vector es un “plásmido”, que se refiere a un bucle de ADN bicatenario circular, en el que se pueden ligar segmentos de ADN adicionales. Otro tipo de vector es un vector vírico, en el que se pueden ligar segmentos de ADN adicionales en el genoma vírico. Ciertos vectores son capaces de una replicación autónoma en una célula hospedante en la que se introducen (por ejemplo, vectores bacterianos que tienen un origen de replicación bacteriano, y vectores de mamíferos episómicos). Otros vectores (por ejemplo, vectores de mamíferos no episómicos) se integran en el genoma de una célula hospedante con la introducción en la célula hospedante, y de ese modo se replican junto con el genoma del hospedante. Además, ciertos vectores son capaces de dirigir la expresión de genes a los cuales están ligados operativamente. Tales vectores se denominan aquí como “vectores de expresión”. En general, los vectores de expresión de utilidad en técnicas de ADN recombinante están a menudo en forma de plásmidos. Los términos “plásmido” y “vector” se usan aquí de forma intercambiable, ya que el plásmido es la forma más comúnmente usada de vector. Sin embargo, la invención pretende incluir tales otras formas de vectores de expresión, tales como vectores víricos (por ejemplo, retrovirus defectuosos en la replicación, adenovirus y virus adenoasociados), que tienen funciones equivalentes. Another aspect of the invention relates to vectors, preferably expression vectors, which contain a nucleic acid encoding a protease protein or a functional equivalent thereof. As used herein, the term "vector" refers to a nucleic acid molecule capable of transporting another nucleic acid to which it is linked. One type of vector is a "plasmid", which refers to a circular double stranded DNA loop, in which additional segments of DNA can be ligated. Another type of vector is a viral vector, in which additional segments of DNA can be ligated into the viral genome. Certain vectors are capable of autonomous replication in a host cell into which they are introduced (for example, bacterial vectors having an origin of bacterial replication, and episomic mammalian vectors). Other vectors (eg, non-episomic mammalian vectors) are integrated into the genome of a host cell with introduction into the host cell, and thereby replicate together with the host genome. In addition, certain vectors are capable of directing the expression of genes to which they are operatively linked. Such vectors are referred to herein as "expression vectors." In general, expression vectors useful in recombinant DNA techniques are often in the form of plasmids. The terms "plasmid" and "vector" are used interchangeably herein, since the plasmid is the most commonly used form of vector. However, the invention is intended to include such other forms of expression vectors, such as viral vectors (eg, replication defective retroviruses, adenoviruses and adeno-associated viruses), which have equivalent functions.

Los vectores de expresión recombinantes de la invención comprenden un ácido nucleico de la invención en una forma adecuada para la expresión del ácido nucleico en una célula hospedante, lo que significa que el vector de expresión recombinante incluye una o más secuencias reguladoras, seleccionadas basándose en las células hospedantes a usar para la expresión, que están operativamente enlazadas a la secuencia de ácido nucleico a expresar. Dentro de un vector de expresión recombinante, “operativamente enlazado” quiere decir que la secuencia nucleotídica de interés está enlazada a la secuencia o secuencias reguladoras de una manera que permite la expresión de la secuencia nucleotídica (por ejemplo, en un sistema de transcripción/traducción in vitro, o en una célula hospedante cuando el vector se introduce en la célula hospedante). La expresión “secuencia reguladora” pretende incluir promotores, potenciadores y otros elementos de control de la expresión (por ejemplo, señal de poliadenilación). Tales secuencias reguladoras se describen, por ejemplo, en Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). Las secuencias reguladoras incluyen aquellas que dirigen la expresión constitutiva de una secuencia nucleotídica en muchos tipos de células hospedantes, y aquellas que dirigen la expresión de la secuencia nucleotídica sólo en una cierta célula hospedante (por ejemplo, secuencias reguladoras específicas de tejidos). Se apreciará por los expertos en la técnica que el diseño del vector de expresión puede depender de factores tales como la elección de la célula hospedante a transformar, el nivel de expresión de proteína deseado, etc. Los vectores de expresión de la invención se pueden introducir en células hospedantes para producir de ese modo proteínas o péptidos, codificados por ácidos nucleicos como se describe aquí (por ejemplo proteínas de proteasas, formas mutantes de proteínas de proteasas, fragmentos, variantes o equivalentes funcionales de las mismas, proteínas de fusión, etc.). The recombinant expression vectors of the invention comprise a nucleic acid of the invention in a form suitable for the expression of the nucleic acid in a host cell, which means that the recombinant expression vector includes one or more regulatory sequences, selected based on the Host cells to be used for expression, which are operatively linked to the nucleic acid sequence to be expressed. Within a recombinant expression vector, "operably linked" means that the nucleotide sequence of interest is linked to the regulatory sequence or sequences in a manner that allows the expression of the nucleotide sequence (eg, in a transcription / translation system in vitro, or in a host cell when the vector is introduced into the host cell). The term "regulatory sequence" is intended to include promoters, enhancers and other expression control elements (eg, polyadenylation signal). Such regulatory sequences are described, for example, in Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). Regulatory sequences include those that direct the constitutive expression of a nucleotide sequence in many types of host cells, and those that direct the expression of the nucleotide sequence only in a certain host cell (e.g., tissue-specific regulatory sequences). It will be appreciated by those skilled in the art that the design of the expression vector may depend on factors such as the choice of the host cell to be transformed, the level of expression of the desired protein, etc. Expression vectors of the invention can be introduced into host cells to thereby produce proteins or peptides, encoded by nucleic acids as described herein (for example protease proteins, mutant forms of protease proteins, fragments, variants or functional equivalents. thereof, fusion proteins, etc.).

Los vectores de expresión recombinantes de la invención se pueden diseñar para la expresión de proteínas de proteasas en células procariotas o eucariotas. Por ejemplo, las proteínas de proteasas se pueden expresar en células bacterianas tales como E. coli, células de insectos (usando vectores de expresión de baculovirus), células de levadura o células de mamíferos. Las células hospedantes adecuadas se explican adicionalmente en Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). Como alternativa, el vector de expresión recombinante se puede transcribir y traducir in vitro, por ejemplo usando secuencias reguladoras del promotor T7 y T7 polimerasa. The recombinant expression vectors of the invention can be designed for the expression of protease proteins in prokaryotic or eukaryotic cells. For example, protease proteins can be expressed in bacterial cells such as E. coli, insect cells (using baculovirus expression vectors), yeast cells or mammalian cells. Suitable host cells are further explained in Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). Alternatively, the recombinant expression vector can be transcribed and translated in vitro, for example using T7 and T7 polymerase promoter regulatory sequences.

Los vectores de expresión útiles de la presente invención incluyen vectores derivados de cromosomas, de episomas, y de virus, por ejemplo vectores derivados de plásmidos bacterianos, bacteriófagos, episoma de levadura, elementos cromosómicos de levaduras, virus tales como baculovirus, virus de papova, virus de la vacuna, adenovirus, virus de la viruela aviar, virus de la pseudorrabia, y retrovirus, y vectores derivados de sus combinaciones, tales como los derivados de elementos genéticos de plásmidos y de bacteriófagos, tales como cósmidos y fagémidos. Useful expression vectors of the present invention include vectors derived from chromosomes, episomes, and viruses, for example vectors derived from bacterial plasmids, bacteriophages, yeast episoma, chromosomal elements of yeasts, viruses such as baculovirus, papova virus, vaccine virus, adenovirus, avian smallpox virus, pseudorabies virus, and retroviruses, and vectors derived from their combinations, such as those derived from genetic elements of plasmids and bacteriophages, such as cosmids and phagemids.

El inserto de ADN se debería enlazar operativamente a un promotor apropiado, tal como el promotor PL del fago lambda, los promotores lac, trp y tac de E. coli, los promotores tempranos y tardíos de SV40, y promotores de LTR retrovíricas, por citar unos pocos. Otros promotores adecuados serán conocidos por la persona experta. En una realización específica, se prefieren promotores que son capaces de dirigir un nivel elevado de expresión de proteasas en hongos filamentosos. Tales promotores son conocidos en la técnica. Los constructos de expresión The DNA insert should be operatively linked to an appropriate promoter, such as the phage lambda PL promoter, E. coli lac, trp and tac promoters, SV40 early and late promoters, and retroviral LTR promoters, to cite a few. Other suitable promoters will be known by the skilled person. In a specific embodiment, promoters that are capable of directing a high level of protease expression in filamentous fungi are preferred. Such promoters are known in the art. The expression constructs

pueden contener sitios para la iniciación de la transcripción, la terminación, y, en la región transcrita, un sitio de unión a ribosoma para la traducción. La porción codificante de los transcritos maduros expresados por los constructos incluirá un AUG iniciador de la traducción al comienzo, y un codón de terminación situado apropiadamente al final del polipéptido a traducir. they may contain sites for transcription initiation, termination, and, in the transcribed region, a ribosome binding site for translation. The coding portion of mature transcripts expressed by the constructs will include a translation initiating AUG at the beginning, and a termination codon properly located at the end of the polypeptide to be translated.

El ADN vectorial se puede introducir en células procariotas o eucariotas, vía técnicas de transformación o transfección convencionales. Como se usan aquí, los términos “transformación” y “transfección” se refieren a una variedad de técnicas reconocidas en la técnica para introducir ácido nucleico extraño (por ejemplo, ADN) en una célula hospedante, incluyendo coprecipitación con fosfato de calcio o cloruro de calcio, transfección mediada por DEAE-dextrano, transducción, infección, lipofección, transfección mediada por lípidos catiónicos, o electroporación. Los métodos adecuados para transformar o transfectar células hospedantes se pueden encontrar en Sambrook, et al. (Molecular Cloning: A Laboratory Manual, 2ª, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), Davis et al., Basic Methods in Molecular Biology (1986), y otros manuales de laboratorio. Vector DNA can be introduced into prokaryotic or eukaryotic cells, via conventional transformation or transfection techniques. As used herein, the terms "transformation" and "transfection" refer to a variety of techniques recognized in the art for introducing foreign nucleic acid (eg, DNA) into a host cell, including coprecipitation with calcium phosphate or calcium chloride. calcium, DEAE-dextran-mediated transfection, transduction, infection, lipofection, cationic lipid-mediated transfection, or electroporation. Suitable methods for transforming or transfecting host cells can be found in Sambrook, et al. (Molecular Cloning: A Laboratory Manual, 2nd, ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), Davis et al., Basic Methods in Molecular Biology (1986), and other manuals laboratory.

Para la transfección estable de células de mamíferos, se sabe que, dependiendo del vector de expresión y de la técnica de transfección usados, sólo una pequeña fracción de células puede integrar el ADN extraño en su genoma. A fin de identificar y seleccionar estos integrantes, generalmente se introduce en las células hospedantes, junto con el gen de interés, un gen que codifica un marcador seleccionable (por ejemplo, resistencia a antibióticos). Los marcadores seleccionables preferidos incluyen aquellos que confieren resistencia a fármacos, tales como G418, higromicina y metotrexato. El ácido nucleico que codifica un marcador seleccionable se puede introducir en una célula hospedante en el mismo vector que aquel que codifica una proteína de proteasa, o se puede introducir en un vector separado. Las células transfectadas de forma estable con el ácido nucleico introducido se pueden identificar mediante selección por fármacos (por ejemplo, las células que han incorporado el gen del marcador seleccionable sobrevivirán, mientras que las otras células morirán). For stable transfection of mammalian cells, it is known that, depending on the expression vector and the transfection technique used, only a small fraction of cells can integrate the foreign DNA into their genome. In order to identify and select these members, a gene encoding a selectable marker (for example, antibiotic resistance) is generally introduced into the host cells, together with the gene of interest. Preferred selectable markers include those that confer resistance to drugs, such as G418, hygromycin and methotrexate. The nucleic acid encoding a selectable marker can be introduced into a host cell in the same vector as that encoding a protease protein, or it can be introduced into a separate vector. Stably transfected cells with the introduced nucleic acid can be identified by drug selection (for example, cells that have incorporated the selectable marker gene will survive, while the other cells will die).

La expresión de proteínas en procariotas se lleva a cabo a menudo en E. coli con vectores que contienen promotores constitutivos o inducibles que dirigen la expresión de proteínas de fusión o proteínas que no son de fusión. Los vectores de fusión añaden un número de aminoácidos a una proteína codificada allí, por ejemplo el término amino de la proteína recombinante. Tales vectores de fusión sirven típicamente para tres fines: 1) para incrementar la expresión de la proteína recombinante; 2) para incrementar la solubilidad de la proteína recombinante; y 3) para ayudar en la purificación de la proteína recombinante actuando como un ligando en la purificación por afinidad. A menudo, en vectores de expresión de fusión, se introduce un sitio de escisión proteolítica en la unión del resto de fusión y la proteína recombinante, para permitir la separación de la proteína recombinante del resto de fusión tras la purificación de la proteína de fusión. Tales enzimas, y sus secuencias de reconocimiento cognatas, incluyen el Factor Xa, trombina y enterocinasa. Protein expression in prokaryotes is often carried out in E. coli with vectors containing constitutive or inducible promoters that direct the expression of fusion proteins or non-fusion proteins. Fusion vectors add a number of amino acids to a protein encoded there, for example the amino acid term of the recombinant protein. Such fusion vectors typically serve three purposes: 1) to increase the expression of the recombinant protein; 2) to increase the solubility of the recombinant protein; and 3) to aid in the purification of the recombinant protein acting as a ligand in affinity purification. Often, in fusion expression vectors, a proteolytic cleavage site is introduced at the junction of the fusion moiety and the recombinant protein, to allow separation of the recombinant protein from the fusion moiety after purification of the fusion protein. Such enzymes, and their cognate recognition sequences, include Factor Xa, thrombin and enterokinase.

Como se indica, los vectores de expresión contendrán preferiblemente marcadores seleccionables. Tales marcadores incluyen dihidrofolato reductasa o resistencia a neomicina para el cultivo de las células eucariotas, y resistencia a tetraciclina o ampicilina para el cultivo en E. coli y otras bacterias. Los ejemplos representativos de hospedante apropiado incluyen células bacterianas, tales como E. coli, Streptomyces y Salmonella typhimurium; células fúngicas, tales como levadura; células de insectos, tales como Drosophila S2 y Spodoptera Sf9; células de animales, tales como CHO, COS y melanoma de Bowes; y células vegetales. Los medios y condiciones de cultivo apropiados para las células hospedantes descritas anteriormente son conocidas en la técnica. As indicated, the expression vectors will preferably contain selectable markers. Such markers include dihydrofolate reductase or resistance to neomycin for the culture of eukaryotic cells, and resistance to tetracycline or ampicillin for culture in E. coli and other bacteria. Representative examples of appropriate host include bacterial cells, such as E. coli, Streptomyces and Salmonella typhimurium; fungal cells, such as yeast; insect cells, such as Drosophila S2 and Spodoptera Sf9; animal cells, such as CHO, COS and Bowes melanoma; and plant cells. Appropriate culture media and conditions for the host cells described above are known in the art.

Entre los vectores preferidos para uso en bacterias están pQE70, pQE60 y PQE9, disponibles de Qiagen; los vectores pBS, vectores Phagescript, vectores Bluescript, pNH8A, pNH16A, pNH18A, pNH46A, disponibles de Stratagene; y ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 disponibles de Pharmacia. Entre los vectores eucariotas preferidos están PWLNEO, pSV2CAT, pOG44, pZT1 y pSG disponibles de Stratagene; y pSVK3, pBPV, pMSG y pSVL disponibles de Pharmacia. Otros vectores adecuados serán fácilmente manifiestos para el experto. Among the preferred vectors for use in bacteria are pQE70, pQE60 and PQE9, available from Qiagen; pBS vectors, Phagescript vectors, Bluescript vectors, pNH8A, pNH16A, pNH18A, pNH46A, available from Stratagene; and ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 available from Pharmacia. Among the preferred eukaryotic vectors are PWLNEO, pSV2CAT, pOG44, pZT1 and pSG available from Stratagene; and pSVK3, pBPV, pMSG and pSVL available from Pharmacia. Other suitable vectors will be readily apparent to the expert.

Entre los promotores bacterianos conocidos para uso en la presente invención están incluidos los promotores lacI y lacZ de E. coli, los promotores T3 y T7, el promotor gpt, los promotores PR, PL del fago lambda, y el promotor trp, el promotor de timidina cinasa de HSV, los promotores temprano y tardío de SV40, los promotores de las LTR retrovíricas, tales como los del virus del sarcoma de Rous (“RSV”), y promotores de metalotioneína, tales como el promotor de metalotioneína I de ratón. Among the bacterial promoters known for use in the present invention are the E. coli lacI and lacZ promoters, the T3 and T7 promoters, the gpt promoter, the PR, PL phage promoters of the lambda phage, and the trp promoter, the promoter of HSV thymidine kinase, the SV40 early and late promoters, retroviral LTR promoters, such as those of Rous sarcoma virus ("RSV"), and metallothionein promoters, such as the mouse metallothionein I promoter.

La transcripción del ADN que codifica los polipéptidos de la presente invención por eucariotas superiores se puede incrementar insertando una secuencia potenciadora en el vector. Los potenciadores son elementos que actúan en cis de ADN, habitualmente de alrededor de 10 a 300 pb, que actúan para incrementar la actividad transcripcional de un promotor en un tipo de célula hospedante dado. Los ejemplos de potenciadores incluyen el potenciador de SV40, que está situado en el lado tardío del origen de replicación a pb 100 a 270, el potenciador del promotor temprano de citomegalovirus, el potenciador de polioma en el lado tardío del origen de replicación, y los potenciadores de adenovirus. The transcription of the DNA encoding the polypeptides of the present invention by higher eukaryotes can be increased by inserting an enhancer sequence into the vector. Enhancers are elements that act in cis of DNA, usually around 10 to 300 bp, that act to increase the transcriptional activity of a promoter in a given type of host cell. Examples of enhancers include the SV40 enhancer, which is located on the late side of the 100 to 270 bp origin of replication, the cytomegalovirus early promoter enhancer, the polyoma enhancer on the late side of the origin of replication, and the adenovirus enhancers.

Para la secreción de la proteína traducida en la luz del retículo endoplásmico, en el espacio periplásmico o en el entorno extracelular, se puede incorporar en el polipéptido expresado una señal de secreción apropiada. Las señales pueden ser endógenas al polipéptido, o pueden ser señales heterólogas. For secretion of the translated protein in the lumen of the endoplasmic reticulum, in the periplasmic space or in the extracellular environment, an appropriate secretion signal can be incorporated into the expressed polypeptide. The signals may be endogenous to the polypeptide, or they may be heterologous signals.

El polipéptido se puede expresar en una forma modificada, tal como una proteína de fusión, y puede incluir no sólo señales de secreción sino también regiones funcionales heterólogas adicionales. De este modo, por ejemplo, se puede añadir al término N del polipéptido una región de aminoácidos adicionales, particularmente aminoácidos cargados, para mejorar la estabilidad y persistencia en la célula hospedante, durante la purificación o durante la manipulación y almacenamiento subsiguientes. También, se pueden añadir restos peptídicos al polipéptido, para facilitar la purificación. The polypeptide can be expressed in a modified form, such as a fusion protein, and can include not only secretion signals but also additional heterologous functional regions. Thus, for example, a region of additional amino acids, particularly charged amino acids, can be added to the N terminus of the polypeptide to improve stability and persistence in the host cell, during purification or during subsequent handling and storage. Also, peptide moieties can be added to the polypeptide, to facilitate purification.

Polipéptidos según la invención Polypeptides according to the invention

La invención proporciona un polipéptido aislado que tiene una secuencia de aminoácidos de SEC ID NO: 124, una secuencia de aminoácidos obtenible expresando un polinucleótido según la invención o en una realización preferida de una secuencia de SEC ID NO: 10 en un hospedante apropiado, así como una secuencia de aminoácidos obtenible expresando una secuencia polinucleotídica de SEC ID NO: 67 en un hospedante apropiado. También, dentro de la presente invención está comprendido un péptido o polipéptido que comprende un equivalente funcional de los polipéptidos anteriores. Los polipéptidos anteriores están comprendidos colectivamente en la expresión “polipéptidos según la invención”. The invention provides an isolated polypeptide having an amino acid sequence of SEQ ID NO: 124, an amino acid sequence obtainable by expressing a polynucleotide according to the invention or in a preferred embodiment of a sequence of SEQ ID NO: 10 in an appropriate host, thus as an amino acid sequence obtainable by expressing a polynucleotide sequence of SEQ ID NO: 67 in an appropriate host. Also, within the present invention a peptide or polypeptide comprising a functional equivalent of the above polypeptides is comprised. The above polypeptides are collectively included in the expression "polypeptides according to the invention".

Los términos “péptido” y “oligopéptido” se consideran sinónimos (como se reconoce normalmente), y cada término se puede usar de forma intercambiable según lo requiera el contexto para indicar una cadena de al menos dos aminoácidos acoplados mediante enlaces peptidílicos. La palabra “polipéptido” se usa aquí para cadenas que contienen más de siete restos de aminoácidos. Todas las fórmulas o secuencias oligopeptídicas y polipeptídicas aquí están escritas de izquierda a derecha, y en la dirección desde el término amino al término carboxi. Habitualmente se conoce en la técnica el código de una letra de aminoácidos usado aquí, y se puede encontrar en Sambrook, et al. (Molecular Cloning: A Laboratory Manual, 2ª ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989). The terms "peptide" and "oligopeptide" are considered synonymous (as is normally recognized), and each term can be used interchangeably as the context requires to indicate a chain of at least two amino acids coupled by peptide bonds. The word "polypeptide" is used here for chains containing more than seven amino acid residues. All oligopeptide and polypeptide formulas or sequences herein are written from left to right, and in the direction from the amino term to the carboxy term. The one-letter amino acid code used herein is commonly known in the art, and can be found in Sambrook, et al. (Molecular Cloning: A Laboratory Manual, 2nd ed. Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989).

Por polipéptido o proteína “aislado” se quiere decir un polipéptido o proteína retirado de su entorno nativo. Por ejemplo, los polipéptidos y proteínas producidos recombinantemente, expresados en células hospedantes, se consideran aislados para los fines de la invención como lo son los polipéptidos nativos o recombinantes que se han purificado sustancialmente por cualquier técnica adecuada, tal como, por ejemplo, el método de purificación de una sola etapa descrito en Smith y Johnson, Gene 67:31-40 (1988). By "isolated" polypeptide or protein is meant a polypeptide or protein removed from its native environment. For example, recombinantly produced polypeptides and proteins, expressed in host cells, are considered isolated for the purposes of the invention such as native or recombinant polypeptides that have been substantially purified by any suitable technique, such as, for example, the method. single stage purification described in Smith and Johnson, Gene 67: 31-40 (1988).

La proteasa según la invención se puede recuperar y purificar a partir de cultivos de células recombinantes por métodos bien conocidos, que incluyen precipitación con sulfato de amonio o etanol, extracción con ácidos, cromatografía de intercambio aniónico o catiónico, cromatografía en fosfocelulosa, cromatografía de interacción hidrófoba, cromatografía de afinidad, cromatografía de hidroxilapatito, y cromatografía de lecitina. Para los fines analíticos, se emplea muy preferiblemente la cromatografía de líquidos de altas prestaciones (“HPLC”) para la purificación. The protease according to the invention can be recovered and purified from recombinant cell cultures by well known methods, including precipitation with ammonium or ethanol sulfate, acid extraction, anionic or cationic exchange chromatography, phosphocellulose chromatography, interaction chromatography hydrophobic, affinity chromatography, hydroxylapatite chromatography, and lecithin chromatography. For analytical purposes, high performance liquid chromatography ("HPLC") is most preferably used for purification.

Los polipéptidos de la presente invención incluyen productos purificados de forma natural, productos de procedimientos sintéticos químicos, y productos producidos mediante técnicas recombinantes a partir de un hospedante procariota o eucariota, incluyendo, por ejemplo, células bacterianas, de levadura, de plantas superiores, de insectos y de mamíferos. Dependiendo del hospedante empleado en un procedimiento de producción recombinante, los polipéptidos de la presente invención pueden estar glucosilados, o pueden estar no glucosilados. Además, los polipéptidos de la invención pueden incluir también un resto de metionina modificado inicial, en algunos casos como resultado de procesos mediados por el hospedante. The polypeptides of the present invention include naturally purified products, products of chemical synthetic processes, and products produced by recombinant techniques from a prokaryotic or eukaryotic host, including, for example, bacterial, yeast, higher plant cells, of Insects and mammals. Depending on the host employed in a recombinant production process, the polypeptides of the present invention may be glycosylated, or they may be non-glycosylated. In addition, the polypeptides of the invention may also include an initial modified methionine moiety, in some cases as a result of host-mediated processes.

Además, una proteína según la invención puede ser una proteína precursora tal como un cimógeno, una proteína híbrida, una proteína obtenida como una prosecuencia o una pre-prosecuencia, o cualquier otro tipo de forma inmadura. Furthermore, a protein according to the invention can be a precursor protein such as a cymogen, a hybrid protein, a protein obtained as a prosequence or a pre-prosequence, or any other type of immature form.

Fragmentos proteicos Protein fragments

La invención también se refiere a fragmentos biológicamente activos de los polipéptidos según la invención. The invention also relates to biologically active fragments of the polypeptides according to the invention.

Los fragmentos biológicamente activos de un polipéptido de la invención incluyen polipéptidos que comprenden secuencias de aminoácidos suficientemente idénticas a o derivadas de la secuencia de aminoácidos de la proteína de proteasa (por ejemplo, la secuencia de aminoácidos de una secuencia seleccionada del grupo que consiste en SEC ID NO: 115 a SEC ID NO: 171), que incluye un menor número de aminoácidos que la proteína de longitud completa, y muestra al menos una actividad biológica de la proteína de longitud completa correspondiente. Típicamente, los fragmentos biológicamente activos comprenden un dominio o motivo con al menos una actividad de la proteína de proteasa. Un fragmento biológicamente activo de una proteína de la invención puede ser un polipéptido que tiene, por ejemplo, una longitud de 10, 25, 50, 100 o más aminoácidos. Además, se pueden preparar mediante técnicas recombinantes otras porciones biológicamente activas, en las que están suprimidas otras Biologically active fragments of a polypeptide of the invention include polypeptides comprising amino acid sequences sufficiently identical to or derived from the amino acid sequence of the protease protein (eg, the amino acid sequence of a sequence selected from the group consisting of SEQ ID NO: 115 to SEQ ID NO: 171), which includes a smaller number of amino acids than the full length protein, and shows at least one biological activity of the corresponding full length protein. Typically, biologically active fragments comprise a domain or motif with at least one protease protein activity. A biologically active fragment of a protein of the invention can be a polypeptide having, for example, a length of 10, 25, 50, 100 or more amino acids. In addition, other biologically active portions can be prepared by recombinant techniques, in which other suppressed

regiones de la proteína, y se pueden evaluar en busca de una o más de las actividades biológicas de la forma nativa de un polipéptido de la invención. regions of the protein, and can be evaluated for one or more of the biological activities of the native form of a polypeptide of the invention.

La invención también se refiere a fragmentos de ácidos nucleicos que codifican los fragmentos biológicamente activos anteriores de la proteína de proteasa. The invention also relates to nucleic acid fragments encoding the above biologically active fragments of the protease protein.

5 Proteínas de fusión 5 Fusion Proteins

Las proteínas de la presente invención o sus equivalentes funcionales, por ejemplo sus porciones biológicamente activas, se pueden ligar operativamente a un polipéptido que no sea de proteasa (por ejemplo, secuencias de aminoácidos heterólogas), para formar proteínas de fusión. Como se usa aquí, una “proteína quimérica” o “proteína de fusión” de proteasa comprende un polipéptido de proteasa ligado operablemente a un polipéptido que no es de proteasa. Un “polipéptido de proteasa” se refiere a un polipéptido que tiene una secuencia de aminoácidos que corresponde a una secuencia polipeptídica según la invención, mientras que un “polipéptido que no es de proteasa” se refiere a un polipéptido que tiene una secuencia de aminoácidos que corresponde a una proteína que no es sustancialmente homóloga a una proteína según la invención, por ejemplo una proteína que es diferente de la proteína de proteasa y que deriva del mismo organismo o de un organismo diferente. Dentro de una proteína de The proteins of the present invention or their functional equivalents, for example their biologically active portions, can be operably linked to a non-protease polypeptide (eg, heterologous amino acid sequences), to form fusion proteins. As used herein, a "chimeric protein" or "fusion protein" of protease comprises a protease polypeptide operably linked to a non-protease polypeptide. A "protease polypeptide" refers to a polypeptide having an amino acid sequence corresponding to a polypeptide sequence according to the invention, while a "non-protease polypeptide" refers to a polypeptide having an amino acid sequence that corresponds to a protein that is not substantially homologous to a protein according to the invention, for example a protein that is different from the protease protein and that is derived from the same organism or from a different organism. Within a protein of

15 fusión de proteasa, el polipéptido de proteasa puede corresponder a toda o a una porción de una proteína según la invención. En una realización preferida, una proteína de fusión de proteasa comprende al menos un fragmento biológicamente activo de una proteína según la invención. En otra realización preferida, una proteína de fusión de proteasa comprende al menos dos porciones biológicamente activas de una proteína según la invención. Dentro de la proteína de fusión, la expresión “ligado operativamente” pretende indicar que el polipéptido de proteasa y el polipéptido que no es de proteasa están fusionados en el marco entre sí. El polipéptido que no es de proteasa se puede fusionar al término N o al término C del polipéptido de proteasa. In protease fusion, the protease polypeptide may correspond to all or a portion of a protein according to the invention. In a preferred embodiment, a protease fusion protein comprises at least one biologically active fragment of a protein according to the invention. In another preferred embodiment, a protease fusion protein comprises at least two biologically active portions of a protein according to the invention. Within the fusion protein, the expression "operably linked" is intended to indicate that the protease polypeptide and the non-protease polypeptide are fused within each other. The non-protease polypeptide can be fused to the N-terminus or the C-terminus of the protease polypeptide.

Por ejemplo, en una realización, la proteína de fusión es una proteína de fusión de GST-proteasa en la que las secuencias de la proteasa se fusionan al término C de las secuencias de GST. Tales proteínas de fusión pueden facilitar la purificación de proteasa recombinante. En otra realización, la proteína de fusión es una proteína de For example, in one embodiment, the fusion protein is a GST-protease fusion protein in which the protease sequences are fused to the C-terminus of the GST sequences. Such fusion proteins can facilitate the purification of recombinant protease. In another embodiment, the fusion protein is a protein of

25 proteasa que contiene una secuencia señal heteróloga en su término N. En ciertas células hospedantes (por ejemplo, células hospedantes de mamíferos y de levaduras), la expresión y/o secreción de la proteasa se puede incrementar a través del uso de una secuencia señal heteróloga. 25 protease containing a heterologous signal sequence at its N terminus. In certain host cells (eg, mammalian and yeast host cells), protease expression and / or secretion can be increased through the use of a signal sequence heterologous

En otro ejemplo, como secuencia señal heteróloga se puede usar la secuencia secretora de gp67 de la proteína de cubierta de baculovirus (Current Protocols in Molecular Biology, Ausubel et al., eds., John Wiley & Sons, 1992). Otros ejemplos de secuencias señales heterólogas eucariotas incluyen las secuencias secretoras de melitina y de fosfatasa alcalina de la placenta humana (Stratagene; La Jolla, California). En todavía otro ejemplo, las secuencias señal heterólogas procariotas útiles incluyen la señal secretora de phoA (Sambrook et al., más arriba) y la señal secretora de la proteína A (Pharmacia Biotech; Piscataway, New Jersey). In another example, as the heterologous signal sequence, the gp67 secretory sequence of the baculovirus envelope protein (Current Protocols in Molecular Biology, Ausubel et al., Eds., John Wiley & Sons, 1992) can be used. Other examples of eukaryotic heterologous signal sequences include the secretory sequences of melitin and alkaline phosphatase of the human placenta (Stratagene; La Jolla, California). In yet another example, useful prokaryotic heterologous signal sequences include the phoA secretory signal (Sambrook et al., Above) and the protein A secretory signal (Pharmacia Biotech; Piscataway, New Jersey).

Una secuencia señal se puede usar para facilitar la secreción y aislamiento de una proteína o polipéptido de la A signal sequence can be used to facilitate the secretion and isolation of a protein or polypeptide from the

35 invención. Las secuencias señal se caracterizan típicamente por un núcleo de aminoácidos hidrófobos que se escinden generalmente de la proteína madura durante la secreción en uno o más sucesos de escisión. Tales péptidos señal contienen sitios de procesamiento que permiten la escisión de la secuencia señal a partir de las proteínas maduras a medida que pasan a través de la ruta secretora. La secuencia señal dirige la secreción de la proteína, tal como desde un hospedante eucariota en el que se transforma el vector de expresión, y la secuencia señal se escinde subsiguiente o concurrentemente. La proteína se puede purificar entonces fácilmente del medio extracelular por métodos reconocidos en la técnica. Como alternativa, la secuencia señal se puede ligar a la proteína de interés usando una secuencia que facilita la purificación, tal como con un dominio de GST. De este modo, por ejemplo, la secuencia que codifica el polipéptido se puede fusionar a una secuencia marcadora, tal como una secuencia que codifica un polipéptido, que facilita la purificación del polipéptido fusionado. En ciertas realizaciones Invention. Signal sequences are typically characterized by a nucleus of hydrophobic amino acids that are generally cleaved from the mature protein during secretion in one or more cleavage events. Such signal peptides contain processing sites that allow cleavage of the signal sequence from mature proteins as they pass through the secretory pathway. The signal sequence directs the secretion of the protein, such as from a eukaryotic host in which the expression vector is transformed, and the signal sequence is subsequently or concurrently cleaved. The protein can then be easily purified from the extracellular medium by methods recognized in the art. Alternatively, the signal sequence can be ligated to the protein of interest using a sequence that facilitates purification, such as with a GST domain. Thus, for example, the sequence encoding the polypeptide can be fused to a marker sequence, such as a sequence encoding a polypeptide, which facilitates purification of the fused polypeptide. In certain embodiments

45 preferidas de este aspecto de la invención, la secuencia marcadora es un péptido de hexahistidina, tal como la etiqueta proporcionada en el vector pQE (Qiagen, Inc.), entre otros, muchos de los cuales están comercialmente disponibles. Como se describe en Gentz et al., Proc. Natl. Acad. Sci. USA 86:821-824 (1989), por ejemplo, la hexahistidina proporciona una purificación conveniente de la proteína de fusión. La etiqueta de HA es otro péptido útil para la purificación que corresponde a un epítopo derivado de la proteína de hemaglutinina de la gripe, que ha sido descrita por Wilson et al., Cell 37:767 (1984), por ejemplo. Preferred of this aspect of the invention, the marker sequence is a hexahistidine peptide, such as the label provided in the pQE vector (Qiagen, Inc.), among others, many of which are commercially available. As described in Gentz et al., Proc. Natl Acad. Sci. USA 86: 821-824 (1989), for example, hexahistidine provides convenient purification of the fusion protein. The HA tag is another peptide useful for purification that corresponds to an epitope derived from influenza hemagglutinin protein, which has been described by Wilson et al., Cell 37: 767 (1984), for example.

Preferiblemente, una proteína quimérica o de fusión de proteasa de la invención se produce mediante técnicas de ADN recombinante estándar. Por ejemplo, fragmentos de ADN que codifican las diferentes secuencias polipeptídicas se ligan juntos en el marco según técnicas convencionales, por ejemplo empleando términos con extremos romos o extremos escalonados para la ligación, digestión mediante enzimas de restricción para proporcionar términos 55 apropiados, llenado de los extremos cohesivos según sea apropiado, tratamiento con fosfatasa alcalina para evitar la unión indeseable, y ligación enzimática. En otra realización, el gen de fusión se puede sintetizar mediante técnicas convencionales, incluyendo sintetizadores de ADN automatizados. Como alternativa, se puede llevar la amplificación mediante PCR de fragmentos génicos usando cebadores de anclaje, que dan lugar a salientes complementarios entre dos fragmentos génicos consecutivos que se pueden hibridar subsiguientemente y reamplificar para generar una secuencia génica quimérica (véase, por ejemplo, Current Protocols in Molecular Biology, eds. Ausubel et al. Preferably, a chimeric or protease fusion protein of the invention is produced by standard recombinant DNA techniques. For example, DNA fragments encoding the different polypeptide sequences are linked together in the frame according to conventional techniques, for example using terms with blunt ends or stepped ends for ligation, digestion by restriction enzymes to provide appropriate terms, filled with the cohesive ends as appropriate, treatment with alkaline phosphatase to avoid undesirable binding, and enzymatic ligation. In another embodiment, the fusion gene can be synthesized by conventional techniques, including automated DNA synthesizers. Alternatively, PCR amplification of gene fragments can be carried out using anchor primers, which give rise to complementary protrusions between two consecutive gene fragments that can subsequently be hybridized and reamplified to generate a chimeric gene sequence (see, for example, Current Protocols in Molecular Biology, eds. Ausubel et al.

John Wiley & Sons: 1992). Además, hay comercialmente disponibles muchos vectores de expresión que ya codifican un resto de fusión (por ejemplo, un polipéptido de GST). Se puede clonar un ácido nucleico que codifica la proteasa en tal vector de expresión, de manera que el resto de fusión esté ligado en el marco a la proteína de proteasa. John Wiley & Sons: 1992). In addition, many expression vectors that already encode a fusion moiety (for example, a GST polypeptide) are commercially available. A nucleic acid encoding the protease can be cloned into such an expression vector, so that the fusion moiety is linked in the frame to the protease protein.

Equivalentes funcionales Functional equivalents

5 Las expresiones “equivalentes funcionales” y “variantes funcionales” se usan aquí de forma intercambiable. Los equivalentes funcionales de un ADN según la invención son fragmentos de ADN aislados que codifican un polipéptido que muestra una función particular de una proteasa de A. niger como se define aquí. Un equivalente funcional de un polipéptido según la invención es un polipéptido que muestra al menos una función de una proteasa de A. niger como se define aquí. 5 The terms "functional equivalents" and "functional variants" are used interchangeably here. The functional equivalents of a DNA according to the invention are isolated DNA fragments encoding a polypeptide that shows a particular function of an A. niger protease as defined herein. A functional equivalent of a polypeptide according to the invention is a polypeptide that shows at least one function of an A. niger protease as defined herein.

Los equivalentes proteicos o polipeptídicos funcionales pueden contener sólo sustituciones conservativas de uno o más aminoácidos de una secuencia de SEC ID NO: 124 o sustituciones, inserciones o supresiones de aminoácidos no esenciales. En consecuencia, un aminoácido no esencial es un resto que se puede alterar en una secuencia de SEC ID NO: 124 sin alterar sustancialmente la función biológica. Por ejemplo, se predice que los restos de aminoácidos que están conservados entre las proteínas de proteasas de la presente invención son particularmente Functional protein or polypeptide equivalents may contain only conservative substitutions of one or more amino acids of a sequence of SEQ ID NO: 124 or substitutions, insertions or deletions of nonessential amino acids. Consequently, a non-essential amino acid is a moiety that can be altered in a sequence of SEQ ID NO: 124 without substantially altering the biological function. For example, it is predicted that amino acid residues that are conserved among the protease proteins of the present invention are particularly

15 no susceptibles a alteración. Además, no es probable que los aminoácidos conservados entre las proteínas de proteasas según la presente invención y otras proteasas sean susceptibles a alteración. 15 not susceptible to alteration. Furthermore, it is not likely that the amino acids conserved between the protease proteins according to the present invention and other proteases are susceptible to alteration.

La expresión “sustitución conservativa” quiere decir aquella sustitución en la que el resto de aminoácido se sustituye por un resto de aminoácido que tiene una cadena lateral similar. Estas familias son conocidas en la técnica, e incluyen aminoácidos con cadenas laterales básicas (por ejemplo lisina, arginina e histidina), cadenas laterales ácidas (por ejemplo ácido aspártico, ácido glutámico), cadenas laterales polares sin carga (por ejemplo, glicina, asparaginas, glutamina, serina, treonina, tirosina, cisteína), cadenas laterales no polares (por ejemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptófano), cadenas laterales ramificadas en beta (por ejemplo, treonina, valina, isoleucina) y cadenas laterales aromáticas (por ejemplo, tirosina, fenilalanina, triptófano, histidina). The term "conservative substitution" means that substitution in which the amino acid residue is replaced by an amino acid residue having a similar side chain. These families are known in the art, and include amino acids with basic side chains (for example lysine, arginine and histidine), acid side chains (for example aspartic acid, glutamic acid), uncharged polar side chains (for example, glycine, asparagine , glutamine, serine, threonine, tyrosine, cysteine), non-polar side chains (e.g., alanine, valine, leucine, isoleucine, proline, phenylalanine, methionine, tryptophan), beta branched side chains (e.g. threonine, valine, isoleucine) and aromatic side chains (for example, tyrosine, phenylalanine, tryptophan, histidine).

25 Los equivalentes de ácidos nucleicos funcionales pueden contener típicamente mutaciones silenciosas o mutaciones que no alteran la función biológica del polipéptido codificado. En consecuencia, la invención proporciona moléculas de ácidos nucleicos que codifican proteínas de proteasas que contienen cambios en restos de aminoácidos que no son esenciales para una actividad biológica particular. Tales proteínas de proteasas difieren en la secuencia de aminoácidos de una secuencia de SEC ID NO: 124 aunque retienen al menos una actividad biológica. En una realización, la molécula de ácido nucleico aislada comprende una secuencia nucleotídica que codifica una proteína, en la que la proteína comprende una secuencia de aminoácidos sustancialmente homóloga de al menos alrededor de 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% o más homóloga a la secuencia de aminoácidos mostrada en una secuencia de SEC ID NO: 124. The equivalents of functional nucleic acids may typically contain silent mutations or mutations that do not alter the biological function of the encoded polypeptide. Accordingly, the invention provides nucleic acid molecules that encode protease proteins that contain changes in amino acid residues that are not essential for a particular biological activity. Such protease proteins differ in the amino acid sequence of a sequence of SEQ ID NO: 124 although they retain at least one biological activity. In one embodiment, the isolated nucleic acid molecule comprises a nucleotide sequence encoding a protein, wherein the protein comprises a substantially homologous amino acid sequence of at least about 80%, 85%, 90%, 95%, 96%. , 97%, 98%, 99% or more homologous to the amino acid sequence shown in a sequence of SEQ ID NO: 124.

Por ejemplo, en Bowie, J.U. et al., Science 247:1306-1310 (1990) se proporciona una guía que se refiere a cómo For example, in Bowie, J.U. et al., Science 247: 1306-1310 (1990) provides a guide that refers to how

35 obtener sustituciones de aminoácidos fenotípicamente silenciosas, referencia en la que los autores indican que hay dos enfoques principales para estudiar la tolerancia al cambio de una secuencia de aminoácidos. El primer método se basa en el proceso de evolución, en el que las mutaciones se aceptan o se rechazan mediante selección natural. El segundo enfoque usa manipulación genética para introducir cambios de aminoácidos en posiciones específicas de un gen clonado, y selecciona o identifica secuencias que mantienen la funcionalidad. Como afirman los autores, estos estudios han revelado que las proteínas son sorprendentemente tolerantes a sustituciones de aminoácidos. Los autores indican además qué cambios son probablemente permisivos en una cierta posición de la proteína. Por ejemplo, los restos de aminoácidos más enterrados requieren cadenas laterales no polares, mientras que generalmente se conservan pocos rasgos de las cadenas laterales de la superficie. Otras de tales sustituciones fenotípicamente silenciosas se describen en Bowie et al., más arriba, y las referencias citadas allí. 35 obtain phenotypically silent amino acid substitutions, a reference in which the authors indicate that there are two main approaches to study the tolerance to change of an amino acid sequence. The first method is based on the evolution process, in which mutations are accepted or rejected by natural selection. The second approach uses genetic manipulation to introduce amino acid changes at specific positions of a cloned gene, and selects or identifies sequences that maintain functionality. As the authors state, these studies have revealed that proteins are surprisingly tolerant of amino acid substitutions. The authors also indicate what changes are probably permissive in a certain position of the protein. For example, more buried amino acid residues require non-polar side chains, while few features of the surface side chains are generally preserved. Other such phenotypically silent substitutions are described in Bowie et al., Above, and the references cited therein.

45 Una molécula de ácido nucleico aislada que codifica una proteína de proteasa homóloga a la proteína de SEC ID NO: 124 se puede crear introduciendo una o más sustituciones, adiciones o supresiones nucleotídicas en las secuencias nucleotídicas codificantes según SEC ID NO: 10 o una secuencia de SEC ID NO: 67, de manera que se introducen en la proteína codificada una o más sustituciones, supresiones o inserciones de aminoácidos. Tales mutaciones se pueden introducir mediante técnicas estándar, tales como mutagénesis dirigida al sitio y mutagénesis mediada por PCR. An isolated nucleic acid molecule encoding a protease protein homologous to the protein of SEQ ID NO: 124 can be created by introducing one or more nucleotide substitutions, additions or deletions into the nucleotide sequences encoding according to SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, so that one or more amino acid substitutions, deletions or insertions are introduced into the encoded protein. Such mutations can be introduced by standard techniques, such as site-directed mutagenesis and PCR-mediated mutagenesis.

La expresión “equivalentes funcionales” también engloba ortólogos de la proteína de proteasa de A. niger. Los ortólogos de la proteína de proteasa de A. niger son proteínas que se pueden aislar de otras cepas o especies, y poseen una actividad biológica similar o idéntica. Tales ortólogos se pueden identificar fácilmente ya que comprenden una secuencia de aminoácidos que es sustancialmente homóloga a una secuencia de SEC ID NO: 124. The term "functional equivalents" also encompasses orthologs of the A. niger protease protein. The orthologs of the A. niger protease protein are proteins that can be isolated from other strains or species, and possess a similar or identical biological activity. Such orthologs can be easily identified as they comprise an amino acid sequence that is substantially homologous to a sequence of SEQ ID NO: 124.

55 Como se define aquí, la expresión “sustancialmente homóloga” se refiere a una primera secuencia de aminoácidos o nucleotídica que contiene un número suficiente o mínimo de aminoácidos o nucleótidos idénticos o equivalentes (por ejemplo, con cadena lateral similar) a una segunda secuencia de ácidos nucleicos o nucleotídica, de forma que las secuencias de aminoácidos o nucleotídicas primera y segunda tienen un dominio común. Por ejemplo, las As defined herein, the term "substantially homologous" refers to a first amino acid or nucleotide sequence containing a sufficient or minimum number of identical or equivalent amino acids or nucleotides (eg, with similar side chain) to a second sequence of nucleic or nucleotide acids, so that the first and second amino acid or nucleotide sequences have a common domain. For example, the

secuencias de aminoácidos o nucleotídicas que contienen un dominio común que tienen alrededor de 60%, preferiblemente 65%, más preferiblemente 70%, incluso más preferiblemente 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, o 99% de identidad o más, se definen aquí como suficientemente idénticas. amino acid or nucleotide sequences containing a common domain having about 60%, preferably 65%, more preferably 70%, even more preferably 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% identity or more, are defined here as sufficiently identical.

También, los ácidos nucleicos que codifican otros miembros de la familia de proteasas, que tienen así una secuencia nucleotídica que difieren de una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67, están dentro del alcance de la invención. Además, los ácidos nucleicos que codifican proteínas de proteasas a partir de diferentes especies, que tienen así una secuencia nucleotídica que difiere de una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67, están dentro del alcance de la invención. Also, nucleic acids encoding other members of the protease family, thus having a nucleotide sequence that differ from a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, are within the scope of the invention. In addition, nucleic acids encoding protease proteins from different species, which thus have a nucleotide sequence that differs from a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, are within the scope of the invention. .

Las moléculas de ácidos nucleicos que corresponden a variantes (por ejemplo variantes alélicas naturales) y homólogos del ADN de proteasa de la invención se pueden aislar basándose en su homología con los ácidos nucleicos de proteasas descritos aquí usando los ADNc descritos aquí o un fragmento adecuado de los mismos, como una sonda de hibridación según técnicas de hibridación estándar, preferiblemente en condiciones de hibridación muy restrictivas. Nucleic acid molecules corresponding to variants (for example natural allelic variants) and homologs of the protease DNA of the invention can be isolated based on their homology with the protease nucleic acids described herein using the cDNAs described herein or a suitable fragment of they, as a hybridization probe according to standard hybridization techniques, preferably under very restrictive hybridization conditions.

Además de las variantes alélicas de origen natural de la secuencia de proteasa, la persona experta reconocerá que se pueden introducir cambios mediante mutación en las secuencias nucleotídicas de una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67, conduciendo de ese modo a cambios en la secuencia de aminoácidos de la proteína de proteasa sin alterar sustancialmente la función de la proteína de proteasa. In addition to the naturally occurring allelic variants of the protease sequence, the skilled person will recognize that changes can be made by mutation in the nucleotide sequences of a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, leading from that way to changes in the amino acid sequence of the protease protein without substantially altering the function of the protease protein.

En otro aspecto de la invención, se proporcionan proteínas de proteasas mejoradas. Las proteínas de proteasas mejoradas son proteínas en las que al menos se mejora una actividad biológica. Tales proteínas se pueden obtener introduciendo al azar mutaciones a lo largo de toda o parte de la secuencia codificante de la proteasa, tal como mediante mutagénesis de saturación, y los mutantes resultantes se pueden expresar recombinantemente y se pueden identificar en busca de la actividad biológica. Por ejemplo, la técnica proporciona ensayos estándar para medir la actividad enzimática de proteasas, y de este modo se pueden seleccionar fácilmente proteínas mejoradas. In another aspect of the invention, improved protease proteins are provided. Enhanced protease proteins are proteins in which at least one biological activity is improved. Such proteins can be obtained by randomly introducing mutations throughout all or part of the protease coding sequence, such as by saturation mutagenesis, and the resulting mutants can be expressed recombinantly and can be identified for biological activity. For example, the technique provides standard assays to measure the enzymatic activity of proteases, and thus improved proteins can be easily selected.

En una realización preferida, la proteína de proteasa tienen una secuencia de aminoácidos según una secuencia de SEC ID NO: 124. En otra realización, el polipéptido de proteasa es sustancialmente homólogo a la secuencia de aminoácidos según una secuencia de SEC ID NO: 124, y retiene al menos una actividad biológica de un polipéptido según una secuencia de SEC ID NO: 124, aunque difiere en la secuencia de aminoácidos debido a variación natural In a preferred embodiment, the protease protein has an amino acid sequence according to a sequence of SEQ ID NO: 124. In another embodiment, the protease polypeptide is substantially homologous to the amino acid sequence according to a sequence of SEQ ID NO: 124, and retains at least one biological activity of a polypeptide according to a sequence of SEQ ID NO: 124, although it differs in the amino acid sequence due to natural variation

o mutagénesis como se describe anteriormente. or mutagenesis as described above.

En una realización preferida adicional, la proteína de proteasa tiene una secuencia de aminoácidos codificada por un fragmento de ácido nucleico aislado capaz de hibridarse a un ácido nucleico según una secuencia de SEC ID NO: 10 o una secuencia de SEC ID NO: 67, preferiblemente en condiciones de hibridación muy restrictivas. In a further preferred embodiment, the protease protein has an amino acid sequence encoded by an isolated nucleic acid fragment capable of hybridizing to a nucleic acid according to a sequence of SEQ ID NO: 10 or a sequence of SEQ ID NO: 67, preferably in very restrictive hybridization conditions.

En consecuencia, la proteína de proteasa es una proteína que comprende una secuencia de aminoácidos de al menos alrededor de 80%, 85%, 90%, 95%, 96%, 97%, 98%, o 99% o más de homología con la secuencia de aminoácidos mostrada en una secuencia de SEC ID NO: 124, y retiene al menos una actividad funcional del polipéptido según una secuencia seleccionada del grupo que consiste en SEC ID NO: 124. Consequently, the protease protein is a protein that comprises an amino acid sequence of at least about 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% or more homology with the amino acid sequence shown in a sequence of SEQ ID NO: 124, and retains at least one functional activity of the polypeptide according to a sequence selected from the group consisting of SEQ ID NO: 124.

Los equivalentes funcionales de una proteína según la invención también se pueden identificar, por ejemplo, detectando librerías combinatorias de mutantes, por ejemplo mutantes de truncamiento, de la proteína de la invención en busca de actividad de proteasa. En una realización, una librería variada de variantes se genera mediante mutagénesis combinatoria a nivel de ácido nucleico. Una librería variada de variantes se puede producir, por ejemplo, ligando enzimáticamente una mezcla de oligonucleótidos sintéticos en secuencias génicas de forma que un conjunto degenerado de secuencias proteicas potenciales es expresable como polipéptidos individuales, o, como alternativa, como un conjunto de proteínas de fusión más grandes (por ejemplo, para la presentación de fagos). Existe una variedad de métodos que se pueden usar para producir librerías de variantes potenciales de los polipéptidos de la invención a partir de una secuencia oligonucleotídica degenerada. En la técnica se conocen métodos para sintetizar oligonucleótidos degenerados (véanse, por ejemplo, Narang (1983) Tetrahedron 39:3; Itakura et al. (1984) Annu. Rev. Biochem. 53:323; Itakura et al. (1984) Science 198:1056; Ike et al. (1983) Nucleic Acid Res. 11:477). The functional equivalents of a protein according to the invention can also be identified, for example, by detecting combinatorial libraries of mutants, for example truncation mutants, of the protein of the invention in search of protease activity. In one embodiment, a varied library of variants is generated by combinatorial mutagenesis at the nucleic acid level. A varied library of variants can be produced, for example, by enzymatically linking a mixture of synthetic oligonucleotides into gene sequences such that a degenerate set of potential protein sequences is expressible as individual polypeptides, or, alternatively, as a set of fusion proteins. larger (for example, for phage display). There are a variety of methods that can be used to produce libraries of potential variants of the polypeptides of the invention from a degenerate oligonucleotide sequence. Methods for synthesizing degenerate oligonucleotides are known in the art (see, for example, Narang (1983) Tetrahedron 39: 3; Itakura et al. (1984) Annu. Rev. Biochem. 53: 323; Itakura et al. (1984) Science 198: 1056; Ike et al. (1983) Nucleic Acid Res. 11: 477).

Además, se pueden usar librerías de fragmentos de la secuencia codificante de un polipéptido de la invención para generar una población variada de polipéptidos para identificar una selección subsiguiente de variantes. Por ejemplo, se puede generar una librería de fragmentos de secuencias codificantes tratando un fragmento de PCR bicatenario de la secuencia codificante de interés con una nucleasa en condiciones en las que el mellado se produce sólo alrededor de una vez por molécula, desnaturalizando el ADN bicatenario, renaturalizando el ADN para formar ADN bicatenario, que puede incluir pares sentido/antisentido de diferentes productos mellados, eliminando las porciones monocatenarias de los dúplex reformados mediante tratamiento con nucleasa S1, y ligando la librería del fragmento resultante en un vector de expresión. Mediante este método, se puede derivar una librería de expresión que codifica fragmentos N-terminales e internos de diversos tamaños de la proteína de interés. In addition, fragment libraries of the coding sequence of a polypeptide of the invention can be used to generate a varied population of polypeptides to identify a subsequent selection of variants. For example, a library of fragments of coding sequences can be generated by treating a double-stranded PCR fragment of the coding sequence of interest with a nuclease under conditions where the nicking occurs only about once per molecule, denaturing the double-stranded DNA, by renaturing the DNA to form double-stranded DNA, which may include sense / antisense pairs of different indented products, removing the single-stranded portions of the reformed duplexes by treatment with S1 nuclease, and ligating the library of the resulting fragment into an expression vector. By this method, an expression library encoding N-terminal and internal fragments of various sizes of the protein of interest can be derived.

En la técnica se conocen varias técnicas para identificar productos génicos de librerías combinatorias obtenidas mediante mutaciones de punto de truncamiento, y para identificar librerías de ADNc en busca de productos génicos Several techniques are known in the art to identify gene products from combinatorial libraries obtained by truncation point mutations, and to identify cDNA libraries in search of gene products.

que tienen una propiedad seleccionada. Las técnicas usadas más ampliamente, que son susceptibles de análisis de rendimiento elevado, para identificar grandes librerías génicas incluyen típicamente clonar la librería génica en vectores de expresión replicables, transformar células apropiadas con la librería resultante de vectores, y expresar los genes combinatorios en condiciones en las que la detección de una actividad deseada facilita el aislamiento del vector que codifica el gen cuyo producto se detectó. Se puede usar mutagénesis de ensamblaje recurrente (REM), una técnica que potencia la frecuencia de mutantes funcionales en las librerías, en combinación con los ensayos de identificación para identificar variantes de una proteína de la invención (Arkin y Yourvan (1992) Proc. Natl. Acad. Sci. USA 89:7811-7815; Delgrave et al. (1993) Protein Engineering 6(3):327-331). that have a selected property. The most widely used techniques, which are susceptible to high throughput analysis, to identify large gene libraries typically include cloning the gene library into replicable expression vectors, transforming appropriate cells with the resulting vector library, and expressing combinatorial genes under conditions in which which the detection of a desired activity facilitates the isolation of the vector encoding the gene whose product was detected. Recurrent assembly mutagenesis (REM), a technique that enhances the frequency of functional mutants in libraries, can be used in combination with identification assays to identify variants of a protein of the invention (Arkin and Yourvan (1992) Proc. Natl Acad. Sci. USA 89: 7811-7815; Delgrave et al. (1993) Protein Engineering 6 (3): 327-331).

Además de la secuencia génica de la proteasa mostrada en una secuencia de SEC ID NO: 10, será manifiesto para la persona experta en la técnica que pueden existir en una población dada polimorfismos de la secuencia de ADN que pueden conducir a cambios en la secuencia de aminoácidos de la proteína de proteasa. Tales polimorfismos genéticos pueden existir en células procedentes de diferentes poblaciones, o en una población, debido a variación alélica natural. Las variantes alélicas también pueden incluir equivalentes funcionales. In addition to the protease gene sequence shown in a sequence of SEQ ID NO: 10, it will be apparent to the person skilled in the art that polymorphisms of the DNA sequence may exist in a given population that can lead to changes in the sequence of Protease protein amino acids. Such genetic polymorphisms may exist in cells from different populations, or in a population, due to natural allelic variation. Allelic variants can also include functional equivalents.

Los fragmentos de un polinucleótido según la invención también pueden comprender polinucleótidos que no codifican polipéptidos funcionales. Tales polinucleótidos pueden funcionar como sondas o cebadores para una reacción de PCR. Tales polinucleótidos también pueden ser útiles cuando se desea abolir la actividad funcional de una proteasa en un organismo particular (mutantes carentes de genes). Fragments of a polynucleotide according to the invention may also comprise polynucleotides that do not encode functional polypeptides. Such polynucleotides can function as probes or primers for a PCR reaction. Such polynucleotides can also be useful when it is desired to abolish the functional activity of a protease in a particular organism (gene lacking mutants).

Los ácidos nucleicos según la invención, independientemente de si codifican polipéptidos funcionales o no funcionales, se pueden usar como sondas de hibridación o cebadores de la reacción en cadena de polimerasa (PCR). Los usos de las moléculas de ácidos nucleicos de la presente invención que no codifican un polipéptido que tiene una actividad de proteasa incluyen, entre otros, (1) aislar el gen que codifica la proteína de proteasa, o sus variantes alélicas, a partir de una librería de ADNc, por ejemplo a partir de otros organismos distintos de A. niger; (2) la hibridación in situ (por ejemplo FISH) a extensiones cromosómicas metafásicas, para proporcionar una localización cromosómica precisa del gen de proteasa como se describe en Verma et al., Human Chromosomes: a Manual of Basic Techniques, Pergamon Press, New York (1988); (3) el análisis de transferencia Northern, para detectar la expresión de ARNm de proteasa en tejidos y/o células específicos, y (4) sondas y cebadores que se pueden usar como una herramienta de diagnóstico para analizar la presencia de un ácido nucleico hibridable a la sonda de proteasa en una muestra biológica dada (por ejemplo, tejido). The nucleic acids according to the invention, regardless of whether they encode functional or non-functional polypeptides, can be used as hybridization probes or polymerase chain reaction (PCR) primers. Uses of the nucleic acid molecules of the present invention that do not encode a polypeptide having a protease activity include, among others, (1) isolating the gene encoding the protease protein, or its allelic variants, from a cDNA library, for example from organisms other than A. niger; (2) in situ hybridization (eg FISH) to metaphase chromosomal extensions, to provide a precise chromosomal location of the protease gene as described in Verma et al., Human Chromosomes: a Manual of Basic Techniques, Pergamon Press, New York (1988); (3) Northern blot analysis, to detect the expression of protease mRNA in specific tissues and / or cells, and (4) probes and primers that can be used as a diagnostic tool to analyze the presence of a hybridizable nucleic acid to the protease probe in a given biological sample (for example, tissue).

También está englobado por la invención un método para obtener un equivalente funcional de un gen o ADNc de proteasa. Tal método supone obtener una sonda marcada que incluye un ácido nucleico aislado que codifica toda o una porción de la secuencia según una secuencia de SEC ID NO: 124 o una variante de la misma; identificar una librería de fragmentos de ácidos nucleicos con la sonda marcada, en condiciones que permitan la hibridación de la sonda a los fragmentos de ácidos nucleicos en la librería, formando de ese modo dúplex de ácidos nucleicos, y preparar una secuencia génica de longitud completa a partir de los fragmentos de ácidos nucleicos en cualquier dúplex marcado, para obtener un gen relacionado con el gen de proteasa. A method for obtaining a functional equivalent of a protease gene or cDNA is also encompassed by the invention. Such a method involves obtaining a labeled probe that includes an isolated nucleic acid encoding all or a portion of the sequence according to a sequence of SEQ ID NO: 124 or a variant thereof; identify a library of nucleic acid fragments with the labeled probe, under conditions that allow hybridization of the probe to the nucleic acid fragments in the library, thereby forming duplexes of nucleic acids, and preparing a full length gene sequence to from the nucleic acid fragments in any labeled duplex, to obtain a gene related to the protease gene.

En una realización, un ácido nucleico de proteasa de la invención es al menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más homólogo a una secuencia de ácido nucleico mostrada en una secuencia de SEC ID NO: 10, una secuencia de SEC ID NO: 67, o el complemento de las mismas. In one embodiment, a protease nucleic acid of the invention is at least 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more homologous to a nucleic acid sequence shown in a sequence of SEQ ID NO: 10, a sequence of SEQ ID NO: 67, or the complement thereof.

En otra realización preferida, un polipéptido de proteasa de la invención es al menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o más, homólogo a la secuencia de aminoácidos mostrada en una secuencia de SEC ID NO: 124. In another preferred embodiment, a protease polypeptide of the invention is at least 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more, homologous to the amino acid sequence shown in a sequence of SEQ ID NO: 124.

Células hospedantes Host cells

En otra realización, la invención se refiere a células, por ejemplo células hospedantes transformadas o células hospedantes recombinantes, que contienen un ácido nucleico englobado por la invención. Una “célula transformada” In another embodiment, the invention relates to cells, for example transformed host cells or recombinant host cells, which contain a nucleic acid encompassed by the invention. A "transformed cell"

o “célula recombinante” es una célula en la que (o un ancestro en el que) se ha introducido, por medio de técnicas de ADN recombinante, un ácido nucleico según la invención. Se incluyen células tanto procariotas como eucariotas, por ejemplo bacterias, hongos, levaduras, y similares; se prefieren especialmente células de hongos filamentosos, en particular Aspergillus niger. or "recombinant cell" is a cell in which (or an ancestor in which) a nucleic acid according to the invention has been introduced by means of recombinant DNA techniques. Both prokaryotic and eukaryotic cells are included, for example bacteria, fungi, yeasts, and the like; filamentous fungal cells, in particular Aspergillus niger, are especially preferred.

Se puede escoger una célula hospedante que modula la expresión de las secuencias insertadas, o modifica y procesa el producto génico de una manera específica y deseada. Tales modificaciones (por ejemplo, glucosilación) y procesamiento (por ejemplo, escisión) de productos proteicos pueden facilitar el funcionamiento óptimo de la proteína. A host cell can be chosen that modulates the expression of the inserted sequences, or modifies and processes the gene product in a specific and desired manner. Such modifications (for example, glycosylation) and processing (for example, cleavage) of protein products can facilitate the optimal functioning of the protein.

Diversas células hospedantes tienen mecanismos característicos y específicos para el procesamiento posttraduccional y la modificación de proteínas y productos génicos. Se pueden escoger estirpes celulares o sistemas de hospedantes apropiados, familiares para aquellos expertos en la técnica de biología molecular y/o microbiología, para asegurar la modificación y procesamiento deseados y correctos de la proteína extraña expresada. Para este fin, se pueden usar células hospedantes eucariotas que poseen la maquinaria celular para el procesamiento apropiado Various host cells have characteristic and specific mechanisms for post-translational processing and the modification of proteins and gene products. Appropriate cell lines or host systems, familiar to those skilled in the art of molecular biology and / or microbiology, may be chosen to ensure the desired and correct modification and processing of the expressed foreign protein. For this purpose, eukaryotic host cells that possess the cellular machinery for proper processing can be used

del transcrito primario, glucosilación, y fosforilación del producto génico. Tales células hospedantes son bien conocidas en la técnica. of the primary transcript, glycosylation, and phosphorylation of the gene product. Such host cells are well known in the art.

Las células hospedantes también incluyen, pero no se limitan a, estirpes celulares de mamíferos, tales como CHO, VERO, BHK, HeLa, COS, MDCK, 293, 3T3, WI38, y estirpes celulares del plexo coroideo. Host cells also include, but are not limited to, mammalian cell lines, such as CHO, VERO, BHK, HeLa, COS, MDCK, 293, 3T3, WI38, and choroidal plexus cell lines.

5 Si se desea, los polipéptidos según la invención se pueden producir mediante una estirpe celular transfectada de forma estable. Hay disponibles al público un número de vectores adecuados para la transfección estable de células de mamíferos; también se conocen públicamente métodos para construir tales células, por ejemplo en Ausubel et al. (más arriba). 5 If desired, the polypeptides according to the invention can be produced by a stably transfected cell line. A number of vectors suitable for stable transfection of mammalian cells are available to the public; methods for constructing such cells are also publicly known, for example in Ausubel et al. (higher).

Anticuerpos Antibodies

10 La invención se refiere además a anticuerpos, tales como anticuerpos monoclonales o policlonales, que se unen específicamente a proteínas de proteasas según la invención. The invention further relates to antibodies, such as monoclonal or polyclonal antibodies, which specifically bind to protease proteins according to the invention.

Como se usa aquí, el término “anticuerpo” (Ab) o “anticuerpo monoclonal” (Mab) incluye moléculas intactas así como fragmentos de anticuerpos (tales como, por ejemplo, los fragmentos Fab y F(ab’)2) que son capaces de unirse específicamente a proteína de proteasa. Los fragmentos Fab y F(ab’)2 carecen del fragmento Fc del anticuerpo As used herein, the term "antibody" (Ab) or "monoclonal antibody" (Mab) includes intact molecules as well as antibody fragments (such as, for example, Fab and F (ab ') 2 fragments) that are capable of specifically binding to protease protein. Fab and F (ab ’) 2 fragments lack the Fc fragment of the antibody

15 intacto, se aclaran más rápidamente de la circulación, y pueden tener menos unión no específica a tejidos de un anticuerpo intacto (Wahl et al., J. Nucl. Med. 24:316-325 (1983)). De este modo, se prefieren estos fragmentos. 15 intact, they clear up more rapidly from the circulation, and may have less non-specific binding to tissues of an intact antibody (Wahl et al., J. Nucl. Med. 24: 316-325 (1983)). Thus, these fragments are preferred.

Los anticuerpos de la presente invención se pueden preparar mediante cualquiera de una variedad de métodos. Por ejemplo, se pueden administrar células que expresan la proteína de proteasa o un fragmento antigénico de la misma a un mamífero, a fin de inducir la producción de sueros que contienen anticuerpos policlonales. En un método The antibodies of the present invention can be prepared by any of a variety of methods. For example, cells expressing the protease protein or an antigen fragment thereof can be administered to a mammal, in order to induce the production of sera containing polyclonal antibodies. In a method

20 preferido, se prepara una preparación de proteína de proteasa y se purifica para hacerla sustancialmente libre de contaminantes naturales. Tal preparación se introduce entonces en un animal a fin de producir antisueros policlonales de mayor actividad específica. 20 preferred, a protease protein preparation is prepared and purified to make it substantially free of natural contaminants. Such preparation is then introduced into an animal in order to produce polyclonal antisera of greater specific activity.

En el método más preferido, los anticuerpos de la presente invención son anticuerpos monoclonales (o sus fragmentos de unión a proteína de proteasa). Tales anticuerpos monoclonales se pueden preparar usando 25 tecnología de hibridoma (Kohler et al., Nature 256:495 (1975); Kohler et al., Eur. J. Immunol. 6:511 (1976); Hammerling et al., en: Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., p. 563-681 (1981)). En general, tales procedimientos implican inmunizar a un animal (preferiblemente un ratón) con un antígeno de la proteína de proteasa, o con una célula que expresa la proteína de proteasa. Se extraen los esplenocitos de tales ratones y se fusionan con una estirpe celular de mieloma adecuada. Se puede emplear cualquier estirpe celular de mieloma 30 adecuada según la presente invención; sin embargo, es preferible emplear la estirpe celular de mieloma progenitora (SP2O), disponible de la American Type Culture Collection, Rockville, Maryland. Tras la fusión, las células de hibridoma resultantes se mantienen selectivamente en medio HAT, y después se clonan mediante dilución limitante como se describe por Wands et al. (Gastro-enterology 80:225-232 (1981)). Las células de hibridoma obtenidas a través de tal selección se evalúan entonces para identificar clones que segregan anticuerpos capaces de unirse al In the most preferred method, the antibodies of the present invention are monoclonal antibodies (or their protease protein binding fragments). Such monoclonal antibodies can be prepared using hybridoma technology (Kohler et al., Nature 256: 495 (1975); Kohler et al., Eur. J. Immunol. 6: 511 (1976); Hammerling et al., In: Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, NY, p. 563-681 (1981)). In general, such procedures involve immunizing an animal (preferably a mouse) with a protease protein antigen, or with a cell that expresses the protease protein. Splenocytes from such mice are removed and fused with a suitable myeloma cell line. Any suitable myeloma cell line 30 according to the present invention can be used; however, it is preferable to use the progenitor myeloma cell line (SP2O), available from the American Type Culture Collection, Rockville, Maryland. After fusion, the resulting hybridoma cells are selectively maintained in HAT medium, and then cloned by limiting dilution as described by Wands et al. (Gastro-enterology 80: 225-232 (1981)). The hybridoma cells obtained through such selection are then evaluated to identify clones that secrete antibodies capable of binding to the

35 antígeno de la proteína de proteasa. En general, los polipéptidos se pueden acoplar a una proteína portadora, tal como KLH, como se describe en Ausubel et al., más arriba, mezclada con un adyuvante, y se pueden inyectar en un mamífero hospedante. 35 protease protein antigen. In general, the polypeptides can be coupled to a carrier protein, such as KLH, as described in Ausubel et al., Above, mixed with an adjuvant, and can be injected into a host mammal.

En particular, diversos animales hospedantes se pueden inmunizar mediante inyección de un polipéptido de interés. Los ejemplos de animales hospedantes adecuados incluyen conejos, ratones, cobayas, y ratas. Se pueden usar 40 diversos adyuvantes para incrementar la respuesta inmunológica, dependiendo de la especie hospedante, incluyendo, pero sin limitarse a, adyuvante de Freund (completo e incompleto), geles minerales adyuvantes tales como hidróxido de aluminio, sustancias tensioactivas tales como lisolecitina, polioles de tipo Pluronic, polianiones, péptidos, emulsiones oleosas, hemocianina de lapa californiana, dinitrofenol, BCG (bacilo Calmette-Guerin) y Corynebacterium parvum. Los anticuerpos policlonales son poblaciones heterogéneas de moléculas de anticuerpos In particular, various host animals can be immunized by injection of a polypeptide of interest. Examples of suitable host animals include rabbits, mice, guinea pigs, and rats. 40 various adjuvants can be used to increase the immune response, depending on the host species, including, but not limited to, Freund's adjuvant (complete and incomplete), adjuvant mineral gels such as aluminum hydroxide, surfactants such as lysolecithin, polyols of the Pluronic type, polyanions, peptides, oily emulsions, hemocyanin of California limpe, dinitrophenol, BCG (bacillus Calmette-Guerin) and Corynebacterium parvum. Polyclonal antibodies are heterogeneous populations of antibody molecules

45 derivadas de los sueros de los animales inmunizados. 45 derived from the sera of immunized animals.

Tales anticuerpos pueden ser cualquier clase de inmunoglobulina, incluyendo IgG, IgM, IgE, IgA, IgD, y cualquier subclase de las mismas. Los hibridomas que producen los mAb de esta invención se pueden cultivar in vitro o in vivo. Such antibodies can be any kind of immunoglobulin, including IgG, IgM, IgE, IgA, IgD, and any subclass thereof. The hybridomas that produce the mAbs of this invention can be cultured in vitro or in vivo.

Una vez producidos, los anticuerpos policlonales o monoclonales se ensayan en busca del reconocimiento Once produced, polyclonal or monoclonal antibodies are tested for recognition

50 específico de un polipéptido de proteasa o equivalente funcional del mismo en un inmunoensayo, tal como un análisis de transferencia Western o un análisis de inmunoprecipitación, usando técnicas estándar, por ejemplo como se describe en Ausubel et al., más arriba. Los anticuerpos que se unen específicamente a proteínas de proteasas o sus equivalentes funcionales son útiles en la invención. Por ejemplo, tales anticuerpos se pueden usar en un inmunoensayo para detectar proteasa en cepas patógenas o no patógenas de Aspergillus (por ejemplo, en extractos A specific protease polypeptide or functional equivalent thereof in an immunoassay, such as a Western blot analysis or an immunoprecipitation analysis, using standard techniques, for example as described in Ausubel et al., Above. Antibodies that specifically bind protease proteins or their functional equivalents are useful in the invention. For example, such antibodies can be used in an immunoassay to detect protease in pathogenic or non-pathogenic strains of Aspergillus (for example, in extracts

55 de Aspergillus). Aspergillus 55).

Preferiblemente, los anticuerpos de la invención se producen usando fragmentos de los polipéptidos de proteasas que parecen probablemente antigénicos, mediante criterios tales como frecuencia elevada de restos cargados. Por Preferably, the antibodies of the invention are produced using fragments of protease polypeptides that probably appear to be antigenic, by criteria such as high frequency of charged moieties. By

ejemplo, tales fragmentos se pueden generar mediante técnicas estándar de PCR, y después se pueden clonar en el vector de expresión pGEX (Ausubel et al., más arriba). Entonces, las proteínas de fusión se pueden expresar en E. coli y se pueden purificar usando una matriz de afinidad en gel de agarosa con glutationa, como se describe en Ausubel et al., más arriba. Si se desea, se pueden generar varias (por ejemplo, dos o tres) fusiones para cada proteína, y cada fusión se puede inyectar en al menos dos conejos. Los anticuerpos se pueden producir mediante inyecciones en serie, incluyendo típicamente al menos tres revacunaciones. Típicamente, los anticuerpos se comprueban en busca de su capacidad para inmunoprecipitar un polipéptido de proteasa recombinante o sus equivalentes funcionales, mientras que las proteínas no relacionadas pueden servir como un control para la especificidad de la reacción inmunitaria. For example, such fragments can be generated by standard PCR techniques, and then can be cloned into the pGEX expression vector (Ausubel et al., above). Then, the fusion proteins can be expressed in E. coli and can be purified using an affinity matrix in agarose gel with glutathione, as described in Ausubel et al., Above. If desired, several (for example, two or three) fusions can be generated for each protein, and each fusion can be injected into at least two rabbits. Antibodies can be produced by serial injections, typically including at least three revaccination. Typically, antibodies are tested for their ability to immunoprecipitate a recombinant protease polypeptide or its functional equivalents, while unrelated proteins can serve as a control for the specificity of the immune reaction.

Como alternativa, las técnicas descritas para la producción de anticuerpos monocatenarios (patentes U.S. 4.946.778 y 4.704.692) se pueden adaptar para producir anticuerpos monocatenarios frente a un polipéptido de proteasa o sus equivalentes funcionales. Los kits para generar e identificar librerías de presentación de fagos están comercialmente disponibles, por ejemplo, de Pharmacia. Alternatively, the techniques described for the production of single chain antibodies (U.S. Patents 4,946,778 and 4,704,692) can be adapted to produce single chain antibodies against a protease polypeptide or its functional equivalents. Kits for generating and identifying phage display libraries are commercially available, for example, from Pharmacia.

Adicionalmente, los ejemplos de métodos y reactivos particularmente susceptibles para uso en generar e identificar la librería de presentación de anticuerpos se pueden encontrar, por ejemplo, en la patente U.S. nº 5.223.409; en la Publicación PCT nº WO 92/18619; en la Publicación PCT nº WO 91/17271; en la Publicación PCT nº WO 20791; en la Publicación PCT nº WO 92/20791; en la Publicación PCT nº WO 92/15679; en la Publicación PCT nº WO 93/01288; en la Publicación PCT nº WO 92/01047; en la Publicación PCT nº WO 92/09690; en la Publicación PCT nº WO 90/02809; Fuchs et al. (1991) Bio/Technology 9:1370-1372; Hay et al. (1992) Hum. Antibod. Hybridomas 3:8185; Huse et al. (1989) Science 246:1275-1281; Griffiths et al. (1993) EMBO J. 12:725-734. Additionally, examples of methods and reagents particularly susceptible for use in generating and identifying the antibody presentation library can be found, for example, in U.S. Pat. No. 5,223,409; in PCT Publication No. WO 92/18619; in PCT Publication No. WO 91/17271; in PCT Publication No. WO 20791; in PCT Publication No. WO 92/20791; in PCT Publication No. WO 92/15679; in PCT Publication No. WO 93/01288; in PCT Publication No. WO 92/01047; in PCT Publication No. WO 92/09690; in PCT Publication No. WO 90/02809; Fuchs et al. (1991) Bio / Technology 9: 1370-1372; There et al. (1992) Hum. Antibod Hybridomas 3: 8185; Huse et al. (1989) Science 246: 1275-1281; Griffiths et al. (1993) EMBO J. 12: 725-734.

Los anticuerpos policlonales y monoclonales que se unen específicamente a polipéptidos de proteasas o sus equivalentes funcionales se pueden usar, por ejemplo, para detectar la expresión de un gen de proteasa o un equivalente funcional del mismo, por ejemplo, en otra cepa de Aspergillus. Por ejemplo, el polipéptido de proteasa se puede detectar fácilmente en inmunoensayos convencionales de células o extractos de Aspergillus. Los ejemplos de ensayos adecuados incluyen, sin limitación, transferencia Western, los ELISA, radioinmunoensayos, y similares. Polyclonal and monoclonal antibodies that specifically bind to protease polypeptides or their functional equivalents can be used, for example, to detect the expression of a protease gene or a functional equivalent thereof, for example, in another strain of Aspergillus. For example, the protease polypeptide can be readily detected in conventional immunoassays of Aspergillus cells or extracts. Examples of suitable assays include, without limitation, Western blotting, ELISAs, radioimmunoassays, and the like.

Por “se une específicamente” se quiere decir que un anticuerpo reconoce y se une a un antígeno particular, por ejemplo un polipéptido de proteasa, pero no reconoce ni se une sustancialmente a otras moléculas no relacionadas en una muestra. By "specifically binds" is meant that an antibody recognizes and binds to a particular antigen, for example a protease polypeptide, but does not recognize or bind substantially to other unrelated molecules in a sample.

Los anticuerpos se pueden purificar, por ejemplo, mediante métodos de cromatografía de afinidad, en los que el antígeno polipeptídico se inmoviliza sobre una resina. The antibodies can be purified, for example, by affinity chromatography methods, in which the polypeptide antigen is immobilized on a resin.

Se puede usar un anticuerpo dirigido frente a un polipéptido de la invención (por ejemplo, anticuerpo monoclonal) para aislar el polipéptido mediante técnicas estándar, tales como cromatografía de afinidad o inmunoprecipitación. Además, tal anticuerpo se puede usar para detectar la proteína (por ejemplo, en un lisado celular o un sobrenadante celular) a fin de evaluar la abundancia y el patrón de expresión del polipéptido. Los anticuerpos también se pueden usar de forma diagnóstica para monitorizar los niveles proteicos en células o tejido como parte de un procedimiento de ensayo clínico, por ejemplo para determinar la eficacia de un régimen de tratamiento dado, o en el diagnóstico de aspergilosis. An antibody directed against a polypeptide of the invention (eg, monoclonal antibody) can be used to isolate the polypeptide by standard techniques, such as affinity chromatography or immunoprecipitation. In addition, such an antibody can be used to detect the protein (for example, in a cell lysate or a cell supernatant) in order to evaluate the abundance and expression pattern of the polypeptide. Antibodies can also be used diagnosticly to monitor protein levels in cells or tissue as part of a clinical trial procedure, for example to determine the efficacy of a given treatment regimen, or in the diagnosis of aspergillosis.

La detección se puede facilitar acoplando el anticuerpo a una sustancia detectable. Los ejemplos de sustancias detectables incluyen diversas enzimas, grupos prostéticos, materiales fluorescentes, materiales luminiscentes, materiales bioluminiscentes, y materiales radioactivos. Los ejemplos de enzimas adecuadas incluyen peroxidasa de rábano picante, fosfatasa alcalina, E-galactosidasa o acetilcolinesterasa; los ejemplos de materiales fluorescentes incluyen umbeliferona, fluoresceína, isotiocianato de fluoresceína, rodamina, diclorotriazinilamin fluoresceína, cloruro de dansilo o ficoeritrina; un ejemplo de un material luminiscente incluye luminol; los ejemplos de materiales bioluminiscentes incluyen luciferasa, luciferina, y aecuorina; y los ejemplos de materiales radioactivos adecuados incluyen 125I, 131I, 35S o 3H. Detection can be facilitated by coupling the antibody to a detectable substance. Examples of detectable substances include various enzymes, prosthetic groups, fluorescent materials, luminescent materials, bioluminescent materials, and radioactive materials. Examples of suitable enzymes include horseradish peroxidase, alkaline phosphatase, E-galactosidase or acetylcholinesterase; Examples of fluorescent materials include umbelliferone, fluorescein, fluorescein isothiocyanate, rhodamine, dichlorotriazinylamin fluorescein, dansyl chloride or phycoerythrin; An example of a luminescent material includes luminol; Examples of bioluminescent materials include luciferase, luciferin, and aecuorin; and examples of suitable radioactive materials include 125I, 131I, 35S or 3H.

Los epítopos preferidos englobados por el péptido antigénico son regiones que están localizadas sobre la superficie de la proteína, por ejemplo regiones hidrófilas. Se pueden usar gráficas de hidrofobia de las proteínas de la invención para identificar regiones hidrófilas. Preferred epitopes encompassed by the antigenic peptide are regions that are located on the surface of the protein, for example hydrophilic regions. Hydrophobic plots of the proteins of the invention can be used to identify hydrophilic regions.

El péptido antigénico de una proteína de la invención comprende al menos 7 (preferiblemente 10, 15, 20, ó 30) restos de aminoácidos contiguos de la secuencia de aminoácidos de una secuencia seleccionada del grupo que consiste en SEC ID NO: 115 a SEC ID NO: 171, y engloba un epítopo de la proteína de manera que un anticuerpo provocado frente al péptido forma un complejo inmunitario específico con la proteína. The antigenic peptide of a protein of the invention comprises at least 7 (preferably 10, 15, 20, or 30) contiguous amino acid residues of the amino acid sequence of a sequence selected from the group consisting of SEQ ID NO: 115 to SEQ ID NO: 171, and encompasses an epitope of the protein so that an antibody raised against the peptide forms a specific immune complex with the protein.

Los epítopos preferidos englobados por el péptido antigénico son regiones de proteasa que están localizadas en la superficie de la proteína, por ejemplo regiones hidrófilas, regiones hidrófobas, regiones alfa, regiones beta, regiones de enrollamiento, regiones de vuelta y regiones flexibles. Preferred epitopes encompassed by the antigenic peptide are protease regions that are located on the surface of the protein, for example hydrophilic regions, hydrophobic regions, alpha regions, beta regions, winding regions, back regions and flexible regions.

Inmunoensayos Immunoassays

La determinación cualitativa o cuantitativa de un polipéptido según la presente invención en una muestra biológica se puede realizar usando cualquier método conocido en la técnica. Las técnicas basadas en anticuerpos proporcionan ventajas especiales para ensayar niveles polipeptídicos específicos en una muestra biológica. The qualitative or quantitative determination of a polypeptide according to the present invention in a biological sample can be performed using any method known in the art. Antibody-based techniques provide special advantages to test specific polypeptide levels in a biological sample.

5 En éstas, el reconocimiento específico se proporciona mediante el anticuerpo primario (policlonal o monoclonal), pero el sistema de detección secundario puede utilizar materiales fluorescentes, enzimas, u otros anticuerpos secundarios conjugados. Como resultado, se obtiene un inmunocomplejo. In these, specific recognition is provided by the primary antibody (polyclonal or monoclonal), but the secondary detection system can use fluorescent materials, enzymes, or other conjugated secondary antibodies. As a result, an immunocomplex is obtained.

En consecuencia, la invención proporciona un método para diagnosticar si cierto organismo está infectado con Aspergillus, que comprende las etapas de: Accordingly, the invention provides a method for diagnosing whether a certain organism is infected with Aspergillus, which comprises the steps of:

10 x aislar una muestra biológica de dicho organismo sospechoso de estar infectado con Aspergillus, 10 x isolate a biological sample from said organism suspected of being infected with Aspergillus,

x hacer reaccionar dicha muestra biológica con un anticuerpo según la invención, x reacting said biological sample with an antibody according to the invention,

x determinar si se forman inmunocomplejos. x determine if immunocomplexes are formed.

Los tejidos también se pueden extraer, por ejemplo, con urea y detergente neutro, para la liberación de proteína para el ensayo de transferencia Western o de punto/ranura. Este técnica también se puede aplicar a fluidos corporales. The tissues can also be extracted, for example, with urea and neutral detergent, for protein release for the Western blot or dot / groove assay. This technique can also be applied to body fluids.

15 Otros métodos basados en anticuerpos, útiles para detectar la expresión del gen de proteasa, incluyen inmunoensayos, tales como el ensayo inmunosorbente ligado a enzima (ELISA) y el radioinmunoensayo (RIA). Por ejemplo, los anticuerpos monoclonales específicos de proteasas se pueden usar tanto como un inmunoabsorbente como como una sonda marcada enzimáticamente, para detectar y cuantificar la proteína de proteasa. La cantidad de proteína de proteasa presente en la muestra se puede calcular haciendo referencia a la cantidad presente en una Other antibody-based methods, useful for detecting protease gene expression, include immunoassays, such as the enzyme-linked immunosorbent assay (ELISA) and radioimmunoassay (RIA). For example, protease-specific monoclonal antibodies can be used both as an immunoabsorbent and as an enzymatically labeled probe, to detect and quantify the protease protein. The amount of protease protein present in the sample can be calculated by referring to the amount present in a sample.

20 preparación estándar usando un algoritmo de ordenador de regresión lineal. En otro ensayo ELISA, se pueden usar dos anticuerpos monoclonales específicos distintos para detectar la proteína de proteasa en un fluido biológico. En este ensayo, uno de los anticuerpos se usa como el inmunoabsorbente, y el otro como la sonda marcada enzimáticamente. 20 standard preparation using a linear regression computer algorithm. In another ELISA assay, two different specific monoclonal antibodies can be used to detect the protease protein in a biological fluid. In this assay, one of the antibodies is used as the immunoabsorbent, and the other as the enzymatically labeled probe.

Las técnicas anteriores se pueden llevar a cabo esencialmente como un ensayo de “una etapa” o de “dos etapas”. El The above techniques can be carried out essentially as a "one stage" or "two stage" assay. He

25 ensayo de “una etapa” implica poner en contacto la proteína de proteasa con anticuerpo inmovilizado, y, sin lavar, poner en contacto la mezcla con el anticuerpo marcado. El ensayo de “dos etapas” implica lavar antes de poner en contacto la mezcla con el anticuerpo marcado. También se pueden emplear otros métodos convencionales según sea adecuado. Habitualmente es deseable inmovilizar un componente del sistema de ensayo sobre un soporte, permitiendo de ese modo que otros componentes del sistema se pongan en contacto con el componente y que sean "One step" assay involves contacting the protease protein with immobilized antibody, and, without washing, contacting the mixture with the labeled antibody. The "two stage" assay involves washing before contacting the mixture with the labeled antibody. Other conventional methods may also be employed as appropriate. It is usually desirable to immobilize a component of the test system on a support, thereby allowing other components of the system to contact the component and to be

30 eliminados fácilmente de la muestra. 30 easily removed from the sample.

Los marcadores enzimáticos adecuados incluyen, por ejemplo, aquellos del grupo oxidasa, que catalizan la producción de peróxido de hidrógeno reaccionando con sustrato. La actividad de un marcador de oxidasa se puede evaluar midiendo la concentración de peróxido de hidrógeno formado por la reacción de anticuerpo marcado con la enzima/sustrato. Suitable enzyme markers include, for example, those of the oxidase group, which catalyze the production of hydrogen peroxide by reacting with substrate. The activity of an oxidase label can be evaluated by measuring the concentration of hydrogen peroxide formed by the reaction of antibody labeled with the enzyme / substrate.

35 Además de las enzimas, otros marcadores adecuados incluyen radioisótopos, tales como yodo (125I, 121I), carbono (14C), azufre (35S), tritio (3H), indio (112In), y tecnecio (99mTc), y marcadores fluorescentes, tales como fluoresceína y rodamina, y biotina. In addition to enzymes, other suitable markers include radioisotopes, such as iodine (125I, 121I), carbon (14C), sulfur (35S), tritium (3H), indium (112In), and technetium (99mTc), and fluorescent markers , such as fluorescein and rhodamine, and biotin.

La unión específica de un compuesto de ensayo a un polipéptido de proteasa se puede detectar, por ejemplo, in vitro inmovilizando reversible o irreversiblemente el polipéptido de proteasa sobre un sustrato, por ejemplo la superficie 40 de un pocillo de una placa de microtitulación de poliestireno de 96 pocillos. Los métodos para inmovilizar polipéptidos y otras pequeñas moléculas son conocidos en la técnica. Por ejemplo, las placas de microtitulación se pueden revestir con un polipéptido de proteasa añadiendo el polipéptido en una disolución (típicamente, a una concentración de 0,05 a 1 mg/ml en un volumen de 1-100 ul) a cada pocillo, e incubando las placas a temperatura ambiente hasta 37ºC durante 0,1 a 36 horas. Los polipéptidos que no se unen a la placa se pueden eliminar 45 agitando la disolución en exceso de la placa, y lavando después la placa (una vez, o repetidamente) con agua o con un tampón. Típicamente, el polipéptido está contenido en agua o en un tampón. La placa se lava entonces con un tampón que carece del polipéptido unido. Para bloquear los sitios de unión a proteína libres en las placas, las placas se bloquean con una proteína que no está relacionada con el polipéptido unido. Por ejemplo, son adecuados 300 ul de seroalbúmina bovina (BSA) a una concentración de 2 mg/ml en Tris-HCl. Los sustratos adecuados incluyen Specific binding of a test compound to a protease polypeptide can be detected, for example, in vitro by reversibly or irreversibly immobilizing the protease polypeptide on a substrate, for example the surface 40 of a well of a polystyrene microtiter plate of 96 wells Methods for immobilizing polypeptides and other small molecules are known in the art. For example, microtiter plates can be coated with a protease polypeptide by adding the polypeptide in a solution (typically, at a concentration of 0.05 to 1 mg / ml in a volume of 1-100 ul) to each well, and incubating the plates at room temperature up to 37 ° C for 0.1 to 36 hours. Polypeptides that do not bind to the plate can be removed by stirring the excess solution of the plate, and then washing the plate (once, or repeatedly) with water or with a buffer. Typically, the polypeptide is contained in water or in a buffer. The plate is then washed with a buffer lacking the bound polypeptide. To block free protein binding sites in the plates, the plates are blocked with a protein that is not related to the bound polypeptide. For example, 300 ul of bovine serum albumin (BSA) at a concentration of 2 mg / ml in Tris-HCl is suitable. Suitable substrates include

50 aquellos sustratos que contienen una química de reticulación definida (por ejemplo, sustratos plásticos, tales como poliestireno, estireno, o sustratos de polipropileno de Corning Costar Corp. (Cambridge, MA), por ejemplo). Si se desea, como sustrato, se puede usar una partícula en forma de perla, por ejemplo agarosa en perlas o sefarosa en perlas. 50 those substrates containing a defined cross-linking chemistry (for example, plastic substrates, such as polystyrene, styrene, or polypropylene substrates from Corning Costar Corp. (Cambridge, MA), for example). If desired, as a substrate, a particle in the form of a pearl can be used, for example agarose in pearls or sepharose in pearls.

La unión del compuesto de ensayo a los polipéptidos según la invención se puede detectar mediante cualquiera de 55 una variedad de métodos conocidos en la técnica. Por ejemplo, se puede usar un anticuerpo específico en un The binding of the test compound to the polypeptides according to the invention can be detected by any of a variety of methods known in the art. For example, a specific antibody can be used in a

inmunoensayo. Si se desea, el anticuerpo se puede marcar (por ejemplo, fluorescentemente o con un radioisótopo) y detectar directamente (véase, por ejemplo, West y McMahon, J. Cell Biol. 74:264, 1977). Como alternativa, se puede usar un segundo anticuerpo para la detección (por ejemplo, un anticuerpo marcado que se une a la porción Fc de un anticuerpo anti-AN97). En un método de detección alternativo, el polipéptido de proteasa se marca, y se detecta el marcador (por ejemplo, marcando un polipéptido de proteasa con un radioisótopo, fluoróforo, cromóforo, o similar). En todavía otro método, el polipéptido de proteasa se produce como una proteína de fusión con una proteína que se puede detectar ópticamente, por ejemplo la proteína fluorescente verde (que se puede detectar bajo luz UV). En un método alternativo, el polipéptido de proteasa se puede unir covalentemente a o fusionar con una enzima que tiene una actividad enzimática detectable, tal como peroxidasa de rábano picante, fosfatasa alcalina, a-galactosidasa, o glucosa oxidasa. Los genes que codifican todas estas enzimas se han clonado y están fácilmente disponibles para uso por los expertos en la técnica. Si se desea, la proteína de fusión puede incluir un antígeno, y tal antígeno se puede detectar y medir con un anticuerpo policlonal o monoclonal usando métodos convencionales. Los antígenos adecuados incluyen enzimas (por ejemplo, peroxidasa de rábano picante, fosfatasa alcalina, y a-galactosidasa) y polipéptidos no enzimáticos (por ejemplo, proteínas séricas, tal como BSA y globulinas, y proteínas lácteas, tales como caseínas). immunoassay If desired, the antibody can be labeled (for example, fluorescently or with a radioisotope) and detected directly (see, for example, West and McMahon, J. Cell Biol. 74: 264, 1977). Alternatively, a second antibody can be used for detection (for example, a labeled antibody that binds to the Fc portion of an anti-AN97 antibody). In an alternative detection method, the protease polypeptide is labeled, and the label is detected (for example, by labeling a protease polypeptide with a radioisotope, fluorophore, chromophore, or the like). In yet another method, the protease polypeptide is produced as a fusion protein with a protein that can be detected optically, for example the green fluorescent protein (which can be detected under UV light). In an alternative method, the protease polypeptide can be covalently linked to or fused with an enzyme that has a detectable enzymatic activity, such as horseradish peroxidase, alkaline phosphatase, a-galactosidase, or glucose oxidase. The genes encoding all these enzymes have been cloned and are readily available for use by those skilled in the art. If desired, the fusion protein can include an antigen, and such antigen can be detected and measured with a polyclonal or monoclonal antibody using conventional methods. Suitable antigens include enzymes (for example, horseradish peroxidase, alkaline phosphatase, and a-galactosidase) and non-enzymatic polypeptides (eg, serum proteins, such as BSA and globulins, and milk proteins, such as caseins).

Epítopos, antígenos e inmunógenos Epitopes, antigens and immunogens

En otro aspecto, la invención proporciona un péptido o polipéptido que comprende una porción que posee un epítopo de un polipéptido de la invención. El epítopo de esta porción del polipéptido es un epítopo inmunógeno o antigénico de un polipéptido de la invención. Un “epítopo inmunógeno” se define como una parte de una proteína que provoca una respuesta de anticuerpo cuando la proteína completa es el inmunógeno. Se cree que estos epítopos inmunógenos están confinados en unos pocos loci en la molécula. Por otro lado, una región de una molécula proteica a la que se puede unir un anticuerpo se define como un “epítopo antigénico”. El número de epítopos inmunógenos de una proteína generalmente es menor que el número de epítopos antigénicos. Véase, por ejemplo, Geysen, H. M. et al., Proc. Natl. Acad, Sci. USA 81:3998-4002 (1984). In another aspect, the invention provides a peptide or polypeptide comprising a portion that possesses an epitope of a polypeptide of the invention. The epitope of this portion of the polypeptide is an immunogenic or antigenic epitope of a polypeptide of the invention. An "immunogenic epitope" is defined as a part of a protein that elicits an antibody response when the complete protein is the immunogen. It is believed that these immunogenic epitopes are confined to a few loci in the molecule. On the other hand, a region of a protein molecule to which an antibody can bind is defined as an "antigenic epitope." The number of immunogenic epitopes of a protein is generally less than the number of antigenic epitopes. See, for example, Geysen, H. M. et al., Proc. Natl Acad, Sci. USA 81: 3998-4002 (1984).

En cuanto a la selección de péptidos o polipéptidos que poseen un epítopo antigénico (es decir, que contienen una región de una molécula proteica a la que se puede unir un anticuerpo), es bien sabido en esa técnica que los péptidos sintéticos relativamente cortos que imitan parte de una secuencia proteica son capaces de forma habitual de provocar un antisuero que reacciona con la proteína parcialmente imitada. Véase, por ejemplo, Sutcliffe, J. G. et al., Science 219:660-666 (1984). Los péptidos capaces de provocar sueros reactivos con la proteína están representados frecuentemente en la secuencia primaria de una proteína, se pueden caracterizar mediante un conjunto de reglas químicas simples, y no están confinados en regiones inmunodominantes de proteínas intactas (es decir, epítopos inmunógenos) ni en los terminales amino o carboxilo. Los péptidos que son extremadamente hidrófobos, y aquellos de seis restos o menos, generalmente son ineficaces induciendo anticuerpos que se unen a la proteína imitada; habitualmente son eficaces los péptidos más largos, solubles, especialmente aquellos que contienen restos de prolina. Sutcliffe et al., más arriba?. Por ejemplo, 18 a 20 péptidos diseñados según estas guías, que contienen 8-39 restos que cubren el 75% de la secuencia de la cadena polipeptídica de HAI de hemaglutinina del virus de la gripe, indujeron anticuerpos que reaccionaron con la proteína HA1 o virus intacto; y 12/12 péptidos procedentes de la polimerasa de MuLV y 18/18 de la glucoproteína de la rabia indujeron anticuerpos que precipitaron las proteínas respectivas. As for the selection of peptides or polypeptides that possess an antigenic epitope (i.e., that contain a region of a protein molecule to which an antibody can bind), it is well known in that technique that the relatively short synthetic peptides that mimic Part of a protein sequence are usually able to elicit an antiserum that reacts with partially imitated protein. See, for example, Sutcliffe, J. G. et al., Science 219: 660-666 (1984). Peptides capable of causing sera reactive with the protein are frequently represented in the primary sequence of a protein, can be characterized by a set of simple chemical rules, and are not confined in immunodominant regions of intact proteins (i.e., immunogenic epitopes) or at the amino or carboxyl terminals. Peptides that are extremely hydrophobic, and those of six residues or less, are generally ineffective in inducing antibodies that bind to the imitated protein; usually the longest, most soluble peptides are effective, especially those that contain proline residues. Sutcliffe et al., Above ?. For example, 18 to 20 peptides designed according to these guidelines, which contain 8-39 residues that cover 75% of the sequence of the HAI polypeptide chain of influenza virus hemagglutinin, induced antibodies that reacted with the HA1 protein or virus intact; and 12/12 peptides from MuLV polymerase and 18/18 from rabies glycoprotein induced antibodies that precipitated the respective proteins.

Los péptidos y polipéptidos de la invención que poseen epítopos antigénicos son útiles por lo tanto para provocar anticuerpos, incluyendo anticuerpos monoclonales, que se unen específicamente a un polipéptido de la invención. De este modo, una proporción elevada de hibridomas obtenidos mediante fusión de esplenocitos procedentes de donantes inmunizados con un péptido que posee un epítopo antigénico segrega generalmente anticuerpo reactivo con la proteína nativa. Sutcliffe et al., más arriba, en 663. Los anticuerpos provocados por péptidos o polipéptidos que poseen epítopos antigénicos son útiles para detectar la proteína imitada, y los anticuerpos dirigidos contra diferentes péptidos se pueden usar para rastrear el destino de diversas regiones de un precursor proteico que sufre un procesamiento de post-traducción. Los péptidos y los anticuerpos antipeptídicos se pueden usar en una variedad de ensayos cualitativos o cuantitativos para la proteína imitada, por ejemplo en ensayos de competición, puesto que se ha demostrado que incluso péptidos cortos (por ejemplo, alrededor de 9 aminoácidos) se pueden unir y desplazar a los péptidos más grandes en ensayos de inmunoprecipitación. Véase, por ejemplo, Wilson, I.A. et al., Cell 37:767778 en 777 (1984). Los anticuerpos antipeptídicos de la invención también son útiles para la purificación de la proteína imitada, por ejemplo mediante cromatografía de adsorción, usando métodos bien conocidos en la técnica. Peptides and polypeptides of the invention that possess antigenic epitopes are therefore useful for eliciting antibodies, including monoclonal antibodies, that specifically bind to a polypeptide of the invention. Thus, a high proportion of hybridomas obtained by fusion of splenocytes from donors immunized with a peptide that possesses an antigenic epitope generally secretes antibody reactive with the native protein. Sutcliffe et al., Above, in 663. Antibodies caused by peptides or polypeptides possessing antigenic epitopes are useful for detecting mimicked protein, and antibodies directed against different peptides can be used to track the fate of various regions of a precursor. protein that undergoes post-translation processing. Peptides and antipeptide antibodies can be used in a variety of qualitative or quantitative assays for the mimicked protein, for example in competition assays, since it has been shown that even short peptides (e.g., about 9 amino acids) can bind and displace larger peptides in immunoprecipitation assays. See, for example, Wilson, I.A. et al., Cell 37: 767778 in 777 (1984). The antipeptide antibodies of the invention are also useful for purification of the imitated protein, for example by adsorption chromatography, using methods well known in the art.

Los péptidos y polipéptidos de la invención que poseen epítopos antigénicos diseñados según las guías anteriores contienen preferiblemente una secuencia de al menos siete, más preferiblemente al menos nueve, y lo más preferible entre alrededor de 15 y alrededor de 30 aminoácidos contenidos en la secuencia de aminoácidos de un polipéptido de la invención. Sin embargo, los péptidos o polipéptidos que comprenden una porción más grande de una secuencia de aminoácidos de un polipéptido de la invención, que contienen alrededor de 30 a alrededor de 50 aminoácidos, o cualquier longitud hasta e incluyendo la secuencia completa de aminoácidos de un polipéptido de la invención, también se consideran péptidos o polipéptidos de la invención que poseen epítopos, y también son útiles para inducir anticuerpos que reaccionan con la proteína imitada. Preferiblemente, la secuencia de aminoácidos del péptido que posee epítopos se selecciona para proporcionar solubilidad sustancial en disolventes acuosos (es decir, The peptides and polypeptides of the invention possessing antigenic epitopes designed according to the above guidelines preferably contain a sequence of at least seven, more preferably at least nine, and most preferably between about 15 and about 30 amino acids contained in the amino acid sequence. of a polypeptide of the invention. However, peptides or polypeptides comprising a larger portion of an amino acid sequence of a polypeptide of the invention, containing about 30 to about 50 amino acids, or any length up to and including the complete amino acid sequence of a polypeptide of the invention, they are also considered peptides or polypeptides of the invention that possess epitopes, and are also useful for inducing antibodies that react with the imitated protein. Preferably, the amino acid sequence of the epitope-possessing peptide is selected to provide substantial solubility in aqueous solvents (i.e.,

la secuencia incluye restos relativamente hidrófilos, y preferiblemente se evitan secuencias muy hidrófobas); y se prefieren particularmente secuencias que contienen restos de prolina. the sequence includes relatively hydrophilic moieties, and very hydrophobic sequences are preferably avoided); and sequences containing proline residues are particularly preferred.

Los péptidos y polipéptidos de la invención que poseen epítopos se pueden producir por cualquier medio convencional para obtener péptidos o polipéptidos, incluyendo medios recombinantes que usan moléculas de ácidos nucleicos de la invención. Por ejemplo, una secuencia corta de aminoácidos que posee epítopos se puede fusionar a un polipéptido más grande que actúa como un portador durante la producción y purificación recombinante, así como durante la inmunización para producir anticuerpos antipeptídicos. Peptides and polypeptides of the invention that possess epitopes can be produced by any conventional means to obtain peptides or polypeptides, including recombinant means using nucleic acid molecules of the invention. For example, a short sequence of amino acids that possess epitopes can be fused to a larger polypeptide that acts as a carrier during recombinant production and purification, as well as during immunization to produce antipeptide antibodies.

Los péptidos que poseen epítopos también se pueden sintetizar usando métodos conocidos de síntesis química. Por ejemplo, Houghten ha descrito un método simple para la síntesis de gran número de péptidos, tal como 10-20 mg de 248 péptidos de 13 restos diferentes que representan variantes de aminoácidos individuales de un segmento de polipéptido HAI que se prepararon y caracterizaron (mediante estudios de unión de tipo ELISA) en menos de cuatro semanas. Houghten, R. A., Proc. Nati. Acad. Sci. USA 82:5131-5135 (1985). Este proceso de “síntesis peptídica múltiple simultánea (SMPS)” se describe adicionalmente en la patente U.S. nº 4.631.211 de Houghten et al. (1986). En este procedimiento, las resinas individuales para la síntesis en fase sólida de diversos péptidos están contenidas en paquetes permeables a disolventes separados, que permiten el uso óptimo de las muchas etapas repetitivas idénticas implicadas en los métodos de fase sólida. Peptides that possess epitopes can also be synthesized using known methods of chemical synthesis. For example, Houghten has described a simple method for the synthesis of large number of peptides, such as 10-20 mg of 248 peptides from 13 different residues representing individual amino acid variants of a HAI polypeptide segment that were prepared and characterized (by ELISA type binding studies) in less than four weeks. Houghten, R. A., Proc. Nati Acad. Sci. USA 82: 5131-5135 (1985). This "simultaneous multiple peptide synthesis (SMPS)" process is further described in U.S. Pat. No. 4,631,211 to Houghten et al. (1986). In this procedure, the individual resins for solid phase synthesis of various peptides are contained in separate solvent-permeable packages, which allow the optimal use of the many identical repetitive stages involved in solid phase methods.

Un procedimiento manual permite que se lleven a cabo simultáneamente 500-1000 o más síntesis. Houghten et al., más arriba en 5134. A manual procedure allows 500-1000 or more syntheses to be carried out simultaneously. Houghten et al., Above in 5134.

Los péptidos y polipéptidos de la invención que poseen epítopos se usan para inducir anticuerpos según métodos bien conocidos en la técnica. Véase, por ejemplo, Sutcliffe et al., más arriba; Wilson et al., más arriba; Chow, M. et al., Proc. Natl. Acad. Sci. USA 82:910-914; y Bittle, F.J. et al., J. Gen. Virol. 66:2347-2354 (1985). Peptides and polypeptides of the invention that possess epitopes are used to induce antibodies according to methods well known in the art. See, for example, Sutcliffe et al., Above; Wilson et al., Above; Chow, M. et al., Proc. Natl Acad. Sci. USA 82: 910-914; and Bittle, F.J. et al., J. Gen. Virol. 66: 2347-2354 (1985).

Generalmente, los animales se pueden inmunizar con péptido libre; sin embargo, el título de anticuerpo antipeptídico se puede incrementar acoplando el péptido a un portador macromolecular, tal como hemocianina de lapa californiana (KLH) o toxoide tetánico. Por ejemplo, los péptidos que contienen cisteína se pueden acoplar a un portador usando un ligador tal como éster de maleimidobenzoil-N-hidroxisuccinimida (MBS), mientras que otros péptidos se pueden acoplar a un portador usando un agente ligante más general, tal como glutaraldehído. Generally, animals can be immunized with free peptide; however, the antipeptide antibody titer can be increased by coupling the peptide to a macromolecular carrier, such as Californian limpet hemocyanin (KLH) or tetanus toxoid. For example, cysteine-containing peptides can be coupled to a carrier using a linker such as maleimidobenzoyl-N-hydroxysuccinimide ester (MBS), while other peptides can be coupled to a carrier using a more general binding agent, such as glutaraldehyde. .

Los animales tales como conejos, ratas y ratones se inmunizan con péptidos libres o acoplados al portador, por ejemplo mediante inyección intraperitoneal y/o intradérmica de emulsiones que contienen alrededor de 100 ug de péptido o proteína portadora y adyuvante de Freund. Pueden ser necesarias varias revacunaciones, por ejemplo a intervalos de alrededor de dos semanas, para proporcionar un título útil de anticuerpo antipeptídico que se puede detectar, por ejemplo, mediante ensayo ELISA usando un péptido libre adsorbido a una superficie sólida. El título de anticuerpos antipeptídicos en el suero procedente de un animal inmunizado se puede incrementar seleccionando anticuerpos antipeptídicos, por ejemplo mediante adsorción al péptido sobre un soporte sólido y elución de los anticuerpos seleccionados según métodos bien conocidos en la técnica. Animals such as rabbits, rats and mice are immunized with free or carrier-coupled peptides, for example by intraperitoneal and / or intradermal injection of emulsions containing about 100 ug of Freund's carrier protein or peptide and adjuvant protein. Several revaccinations may be necessary, for example at intervals of about two weeks, to provide a useful antipeptide antibody titer that can be detected, for example, by ELISA using a free peptide adsorbed to a solid surface. The titer of antipeptide antibodies in the serum from an immunized animal can be increased by selecting antipeptide antibodies, for example by adsorption to the peptide on a solid support and elution of the selected antibodies according to methods well known in the art.

Los péptidos de la invención que poseen epítopos inmunógenos, es decir, aquellas partes de una proteína que provocan una respuesta de anticuerpo cuando la proteína completa es el inmunógeno, se identifican según métodos conocidos en la técnica. Por ejemplo, Geysen et al., 1984, más arriba, describen un procedimiento para la síntesis concurrente rápida sobre soportes sólidos de cientos de péptidos de suficiente pureza para que reaccionen en un ensayo inmunosorbente ligado a enzimas. La interacción de los péptidos sintetizados con los anticuerpos se detecta entonces fácilmente sin retirarlos del soporte. De esta manera, un péptido que posee un epítopo inmunógeno de una proteína deseada se puede identificar de forma habitual por cualquier experto en la técnica. Por ejemplo, el epítopo inmunológicamente importante en la proteína de recubrimiento del virus de la glosopeda fue localizado por Geysen et al. con una resolución de siete aminoácidos mediante síntesis de un conjunto solapante de todos los 208 hexapéptidos posibles que cubren toda la secuencia de 213 aminoácidos de la proteína. Después, se sintetizó un conjunto de sustitución completo de péptidos en el que los 20 aminoácidos se sustituyeron a su vez en cada posición dentro del epítopo, y se determinaron los aminoácidos particulares que confieren especificidad para la reacción con el anticuerpo. De este modo, mediante este método se pueden obtener de forma habitual análogos peptídicos de los péptidos de la invención que poseen epítopos. La patente U.S. nº 4.708.781 de Geysen (1987) describe además este método para identificar un péptido que posee un epítopo inmunógeno de una proteína deseada. Peptides of the invention that possess immunogenic epitopes, that is, those parts of a protein that elicit an antibody response when the complete protein is the immunogen, are identified according to methods known in the art. For example, Geysen et al., 1984, above, describe a procedure for rapid concurrent synthesis on solid supports of hundreds of peptides of sufficient purity to react in an enzyme-linked immunosorbent assay. The interaction of the peptides synthesized with the antibodies is then easily detected without removing them from the support. In this manner, a peptide that possesses an immunogenic epitope of a desired protein can be routinely identified by any person skilled in the art. For example, the immunologically important epitope in the gloss protein coat protein was located by Geysen et al. with a resolution of seven amino acids by synthesis of an overlapping set of all 208 possible hexapeptides that cover the entire 213 amino acid sequence of the protein. Then, a complete peptide substitution set was synthesized in which the 20 amino acids were in turn substituted at each position within the epitope, and particular amino acids conferring specificity for the reaction with the antibody were determined. Thus, by this method, peptide analogs of the peptides of the invention possessing epitopes can be obtained routinely. U.S. Patent No. 4,708,781 to Geysen (1987) further describes this method for identifying a peptide that possesses an immunogenic epitope of a desired protein.

Todavía más, la patente U.S. nº 5.194.392 de Geysen (1990) describe un método general para detectar o determinar la secuencia de monómeros (aminoácidos u otros compuestos) que es un equivalente topológico del epítopo (es decir, un “mimétopo”) que es complementario a un paratopo particular (sitio de unión a antígeno) de un anticuerpo de interés. Más generalmente, la patente U.S. nº 4.433.092 de Geysen (1989) describe un método para detectar o determinar una secuencia de monómeros que es un equivalente topográfico de un ligando que es complementario al sitio de unión a ligando de un receptor particular de interés. De forma similar, la patente U.S. nº 5.480.971 de Houghten, R.A. et al. (1996) en Mezclas Oligopeptídicas Peralquiladas describe oligopéptidos peralquilados de alquilo C1-C7 lineales, y conjuntos y librerías de tales péptidos, así como métodos para usar tales conjuntos y librerías de oligopéptidos para determinar la secuencia de un oligopéptido peralquilado que se une preferentemente Even more, U.S. Patent No. 5,194,392 to Geysen (1990) describes a general method for detecting or determining the sequence of monomers (amino acids or other compounds) that is a topological equivalent of the epitope (ie, a "mimetope") that is complementary to a particular paratope (antigen binding site) of an antibody of interest. More generally, U.S. Pat. No. 4,433,092 to Geysen (1989) describes a method for detecting or determining a monomer sequence that is a topographic equivalent of a ligand that is complementary to the ligand binding site of a particular receptor of interest. Similarly, U.S. Pat. No. 5,480,971 to Houghten, R.A. et al. (1996) in Peralkylated Oligopeptide Mixtures describes linear C1-C7 alkyl oligopeptides, and sets and libraries of such peptides, as well as methods for using such sets and libraries of oligopeptides to determine the sequence of a peralkylated oligopeptide that preferentially binds

a una molécula aceptora de interés. De este modo, mediante estos métodos se pueden obtener de forma habitual análogos no peptídicos de los péptidos de la invención que poseen epítopos. to an acceptor molecule of interest. Thus, by these methods, non-peptide analogs of the peptides of the invention possessing epitopes can be obtained routinely.

Eliminación o reducción de la actividad de proteasa Elimination or reduction of protease activity

La presente invención también se refiere a métodos para producir una célula mutante de una célula progenitora, que 5 comprende destruir o suprimir una secuencia de ácido nucleico que codifica la proteasa o una secuencia de control de la misma, que da como resultado que la célula mutante produzca menos proteasa que la célula progenitora. The present invention also relates to methods for producing a mutant cell of a progenitor cell, which comprises destroying or suppressing a nucleic acid sequence encoding the protease or a control sequence thereof, which results in the mutant cell produce less protease than the progenitor cell.

La construcción de cepas que tienen actividad reducida de proteasa se puede lograr convenientemente modificando The construction of strains that have reduced protease activity can be conveniently achieved by modifying

o inactivando una secuencia de ácido nucleico necesaria para la expresión de la actividad de proteasa en la célula. La secuencia de ácido nucleico a modificar o inactivar puede ser, por ejemplo, una secuencia de ácido nucleico que codifica la proteasa o una parte de la misma esencial para mostrar actividad de proteasa; o la secuencia de ácido nucleico puede tener una función reguladora necesaria para la expresión de la proteasa a partir de la secuencia codificante de la secuencia de ácido nucleico. Un ejemplo de tal secuencia reguladora o de control puede ser una secuencia promotora o una parte funcional de la misma, es decir, una parte que es suficiente para afectar a la expresión de la proteasa. Otras secuencias de control para la posible modificación incluyen, pero no se limitan a, or inactivating a nucleic acid sequence necessary for the expression of protease activity in the cell. The nucleic acid sequence to be modified or inactivated can be, for example, a nucleic acid sequence encoding the protease or a part thereof essential to show protease activity; or the nucleic acid sequence may have a regulatory function necessary for the expression of the protease from the coding sequence of the nucleic acid sequence. An example of such a regulatory or control sequence may be a promoter sequence or a functional part thereof, that is, a part that is sufficient to affect protease expression. Other control sequences for possible modification include, but are not limited to,

15 una secuencia líder, una secuencia de poliadenilación, una secuencia de propéptido, una secuencia señal, y un sitio de terminación. 15 a leader sequence, a polyadenylation sequence, a propeptide sequence, a signal sequence, and a termination site.

La modificación o inactivación de la secuencia de ácido nucleico se puede realizar sometiendo a la célula a mutagénesis y seleccionando células en las que se ha reducido o eliminado la capacidad de producir proteasa. La mutagénesis, que puede ser específica o aleatoria, se puede llevar a cabo, por ejemplo, usando un agente mutagenizante físico o químico adecuado, mediante uso de un oligonucleótido adecuado, o sometiendo a la secuencia de ADN a mutagénesis generada por PCR. Además, la mutagénesis se puede llevar a cabo mediante uso de cualquier combinación de estos agentes mutagenizantes. Los ejemplos de un agente mutagenizante físico o químico adecuado para el presente fin incluyen irradiación ultravioleta (UV), hidroxilamina, N-metil-N’-nitro-Nnitrosoguanidina (MNNG), O-metilhidroxilamina, ácido nitroso, metanosulfonato de etilo (EMS), bisulfito de sodio, Modification or inactivation of the nucleic acid sequence can be performed by subjecting the cell to mutagenesis and selecting cells in which the ability to produce protease has been reduced or eliminated. Mutagenesis, which can be specific or random, can be carried out, for example, using a suitable physical or chemical mutagenizing agent, by use of a suitable oligonucleotide, or by subjecting the DNA sequence to PCR-generated mutagenesis. In addition, mutagenesis can be carried out by use of any combination of these mutagenizing agents. Examples of a physical or chemical mutagenizing agent suitable for the present purpose include ultraviolet (UV) irradiation, hydroxylamine, N-methyl-N'-nitro-Nnitrosoguanidine (MNNG), O-methylhydroxylamine, nitrous acid, ethyl methanesulfonate (EMS) , sodium bisulfite,

25 ácido fórmico, y análogos nucleotídicos. Cuando se usan tales agentes, la mutagénesis se lleva a cabo típicamente incubando la célula a mutagenizar en presencia del agente mutagenizante de elección, en condiciones adecuadas, y seleccionando células que presentan una expresión reducida o ninguna expresión de la actividad de proteasa. 25 formic acid, and nucleotide analogs. When such agents are used, mutagenesis is typically carried out by incubating the cell to be mutagenized in the presence of the mutagenizing agent of choice, under suitable conditions, and selecting cells that exhibit reduced expression or no expression of protease activity.

La modificación o inactivación de la producción de una proteasa de la presente invención se puede lograr mediante introducción, sustitución, o eliminación de uno o más nucleótidos en la secuencia de ácido nucleico que codifica la proteasa o un elemento regulador requerido para la transcripción o traducción de la misma. Por ejemplo, se pueden insertar o eliminar nucleótidos para dar como resultado la introducción de un codón de parada, la eliminación del codón de parada, o un cambio del marco de lectura abierto. Tal modificación o inactivación se puede lograr mediante mutagénesis dirigida al sitio o mutagénesis generada por PCR, según métodos conocidos en la técnica. Modification or inactivation of the production of a protease of the present invention can be achieved by introduction, substitution, or elimination of one or more nucleotides in the nucleic acid sequence encoding the protease or a regulatory element required for transcription or translation of the same. For example, nucleotides can be inserted or removed to result in the introduction of a stop codon, the removal of the stop codon, or a change of the open reading frame. Such modification or inactivation can be achieved by site-directed mutagenesis or PCR-generated mutagenesis, according to methods known in the art.

Aunque, en principio, la modificación se puede llevar a cabo in vivo, es decir, directamente sobre la célula que Although, in principle, the modification can be carried out in vivo, that is, directly on the cell that

35 expresa la secuencia de ácido nucleico a modificar, se prefiere que la modificación se lleve a cabo in vitro, como se ejemplifica a continuación. 35 expressing the nucleic acid sequence to be modified, it is preferred that the modification be carried out in vitro, as exemplified below.

Un ejemplo de una manera conveniente para inactivar o reducir la producción mediante una célula hospedante de elección se basa en técnicas de sustitución génica o interrupción génica. Por ejemplo, en el método de interrupción génica, se mutageniza in vitro una secuencia de ácido nucleico que corresponde al gen endógeno o fragmento génico de interés para producir una secuencia de ácido nucleico defectuosa, la cual se transforma entonces en la célula hospedante para producir un gen defectuoso. Mediante recombinación homóloga, la secuencia de ácido nucleico defectuosa sustituye al gen endógeno o fragmento génico. Puede ser deseable que el gen o fragmento génico defectuoso también codifique un marcador que se puede usar para la selección de transformantes en los que el gen que codifica la proteasa se ha modificado o destruido. An example of a convenient way to inactivate or reduce production by a host cell of choice is based on gene replacement or gene disruption techniques. For example, in the gene disruption method, a nucleic acid sequence corresponding to the endogenous gene or gene fragment of interest is mutagenized in vitro to produce a defective nucleic acid sequence, which is then transformed into the host cell to produce a defective gene. By homologous recombination, the defective nucleic acid sequence replaces the endogenous gene or gene fragment. It may be desirable that the defective gene or gene fragment also encodes a marker that can be used for the selection of transformants in which the gene encoding the protease has been modified or destroyed.

45 Como alternativa, la modificación o inactivación de la secuencia de ácido nucleico que codifica una proteasa de la presente invención se puede llevar a cabo mediante técnicas antisentido consolidadas, usando una secuencia nucleotídica complementaria a la secuencia que codifica la proteasa. Más específicamente, la producción de la proteasa por una célula se puede reducir o eliminar introduciendo una secuencia nucleotídica complementaria a la secuencia de ácido nucleico que codifica la proteasa, que se puede transcribir en la célula y es capaz de hibridarse al ARNm de proteasa producido en la célula. Se reduce o elimina así la cantidad de proteasa traducida, en condiciones que permiten que la secuencia nucleotídica antisentido complementaria se hibride al ARNm de proteasa. Alternatively, the modification or inactivation of the nucleic acid sequence encoding a protease of the present invention can be carried out by consolidated antisense techniques, using a nucleotide sequence complementary to the sequence encoding the protease. More specifically, the production of protease by a cell can be reduced or eliminated by introducing a nucleotide sequence complementary to the nucleic acid sequence encoding the protease, which can be transcribed into the cell and is capable of hybridizing to the protease mRNA produced in the cell. The amount of translated protease is thus reduced or eliminated, under conditions that allow the complementary antisense nucleotide sequence to hybridize to the protease mRNA.

Se prefiere que la célula a modificar según los métodos de la presente invención sea de origen microbiano, por ejemplo una cepa fúngica que es adecuada para la producción de productos proteicos deseados, ya sea homólogos It is preferred that the cell to be modified according to the methods of the present invention be of microbial origin, for example a fungal strain that is suitable for the production of desired protein products, whether homologous

55 o heterólogos a la célula. 55 or heterologous to the cell.

La presente invención se refiere además a una célula mutante de una célula progenitora que comprende una interrupción o supresión de una secuencia de ácido nucleico que codifica la proteasa o una secuencia de control de la misma, lo que da como resultado que la célula mutante produzca menos proteasa que la célula progenitora. The present invention further relates to a mutant cell of a progenitor cell comprising an interruption or deletion of a nucleic acid sequence encoding the protease or a control sequence thereof, which results in the mutant cell producing less protease than the progenitor cell.

Las células mutantes así creadas, deficientes en proteasa, son particularmente útiles como células hospedantes para la expresión de polipéptidos homólogos y/o heterólogos. Por lo tanto, la presente invención se refiere además a métodos para producir un polipéptido homólogo o heterólogo, que comprenden (a) cultivar la célula mutante en condiciones que conduzcan a la producción del polipéptido; y (b) recuperar el polipéptido. En el presente contexto, la expresión “polipéptidos heterólogos” se define aquí como polipéptidos que no son nativos a la célula hospedante, una proteína nativa en la que se han realizado modificaciones que alteran la secuencia nativa, o una proteína nativa cuya expresión está alterada cuantitativamente como resultado de la manipulación de la célula hospedante mediante técnicas de ADN recombinante. The mutant cells thus created, deficient in protease, are particularly useful as host cells for the expression of homologous and / or heterologous polypeptides. Therefore, the present invention further relates to methods for producing a homologous or heterologous polypeptide, comprising (a) culturing the mutant cell under conditions that lead to the production of the polypeptide; and (b) recover the polypeptide. In the present context, the expression "heterologous polypeptides" is defined herein as polypeptides that are not native to the host cell, a native protein in which modifications have been made that alter the native sequence, or a native protein whose expression is quantitatively altered. as a result of manipulation of the host cell by recombinant DNA techniques.

Los métodos de la presente invención para producir un producto esencialmente libre de proteasa son de particular interés en la producción de polipéptidos eucariotas, en particular proteínas fúngicas tales como enzimas. Las células deficientes en proteasa también se pueden usar para expresar proteínas heterólogas de interés para la industria alimentaria, o de interés farmacéutico. The methods of the present invention for producing an essentially protease-free product are of particular interest in the production of eukaryotic polypeptides, in particular fungal proteins such as enzymes. Protease-deficient cells can also be used to express heterologous proteins of interest to the food industry, or of pharmaceutical interest.

Uso de proteasas en procesos industriales Use of proteases in industrial processes

La invención también se refiere al uso de la proteasa según la invención en un número selecto de procesos industriales y farmacéuticos. A pesar de la experiencia a largo plazo obtenida con estos procesos, la proteasa según la invención posee un número de ventajas significativas con respecto a las enzimas usadas actualmente. Dependiendo de la aplicación específica, estas ventajas pueden incluir aspectos como menores costes de producción, mayor especificidad frente al sustrato, menor antigenicidad, menos actividades secundarias indeseables, mayores rendimientos cuando se producen en un organismo adecuado, intervalos de pH y temperatura más adecuados, mejores sabores del producto final, así como aspectos de kósher y grado alimentario. The invention also relates to the use of the protease according to the invention in a select number of industrial and pharmaceutical processes. Despite the long-term experience obtained with these processes, the protease according to the invention has a number of significant advantages over the enzymes currently used. Depending on the specific application, these advantages may include aspects such as lower production costs, greater specificity against the substrate, lower antigenicity, less undesirable secondary activities, higher yields when produced in a suitable organism, more adequate pH and temperature ranges, better flavors of the final product, as well as aspects of kosher and food grade.

En aplicaciones industriales a gran escala dirigidas a la producción de alimentos o de piensos, las enzimas proteolíticas se usan habitualmente para mejorar aspectos como la solubilidad de la proteína, rendimientos de la extracción, viscosidad o sabor, textura, valor nutricional, minimización de la antigenicidad o factores antinutricionales, color o funcionalidad, así como aspectos del procesamiento como capacidad de filtración de la materia prima proteinosa. En estas aplicaciones, la materia prima proteinosa puede ser de origen animal o vegetal, y los ejemplos incluyen proteínas vegetales tales como proteína de soja, gluten de trigo, proteína de colza, proteína de guisante, proteína de alfalfa, proteína de girasol, proteína de haba, proteína de semilla de algodón o de sésamo, proteína de maíz, proteína de cebada, proteína de sorgo, proteína de patata, proteína de arroz, proteínas de café, y proteína derivada de animales, tales como proteína láctea (por ejemplo caseína, proteína del suero), clara de huevo, proteína de pescado, proteína de carne, incluyendo gelatina, colágeno, proteína de la sangre (por ejemplo hemoglobina), pelo, plumas y harina de pescado. In large-scale industrial applications aimed at food or feed production, proteolytic enzymes are commonly used to improve aspects such as protein solubility, yields of extraction, viscosity or taste, texture, nutritional value, minimization of antigenicity or antinutritional factors, color or functionality, as well as aspects of the processing such as filtering capacity of the protein raw material. In these applications, the protein raw material may be of animal or vegetable origin, and examples include vegetable proteins such as soy protein, wheat gluten, rapeseed protein, pea protein, alfalfa protein, sunflower protein, protein bean, cottonseed or sesame seed protein, corn protein, barley protein, sorghum protein, potato protein, rice protein, coffee protein, and animal derived protein, such as milk protein (e.g. casein, whey protein), egg white, fish protein, meat protein, including gelatin, collagen, blood protein (eg hemoglobin), hair, feathers and fishmeal.

Un aspecto importante de las proteasas según la invención es que cubren un intervalo completo de óptimos de pH y temperatura que son adecuados idealmente para una variedad de aplicaciones. Por ejemplo, muchos procesos a gran escala se benefician de temperaturas de procesamiento relativamente elevadas, de 50 grados C o superiores, para controlar los riesgos de infecciones microbianas. Varias proteasas según la invención cumplen con esta demanda, pero al mismo tiempo muestran estabilidades térmicas no extremas, de manera que resisten los intentos para inactivar la enzima mediante un tratamiento térmico adicional. Este último rasgo permite rutas de producción que producen productos finales libres de actividad proteolítica residual. De forma similar, muchos productos de piensos y de alimentos tienen valores de pH ligeramente ácidos, de forma que se prefieren, para su procesamiento, proteasas con óptimos de pH ácidos o casi neutros. Una proteasa según la invención cumple igualmente con este requisito. An important aspect of the proteases according to the invention is that they cover a full range of pH and temperature optimum that are ideally suited for a variety of applications. For example, many large-scale processes benefit from relatively high processing temperatures, 50 degrees C or higher, to control the risks of microbial infections. Several proteases according to the invention meet this demand, but at the same time show non-extreme thermal stability, so that they resist attempts to inactivate the enzyme by an additional heat treatment. This last feature allows production routes that produce final products free of residual proteolytic activity. Similarly, many feed and food products have slightly acidic pH values, so that proteases with acidic or near neutral pH optimum are preferred for processing. A protease according to the invention also meets this requirement.

La especificidad de las endoproteasas se define habitualmente en términos de escisiones preferentes de enlaces entre el carboxilo del resto del aminoácido en la posición P1 y el grupo amino del resto en la posición P1’, respectivamente. La preferencia puede estar condicionada predominantemente por P1 (por ejemplo restos cargados positivamente en sustratos para tripsina), por P1’ (por ejemplo restos hidrófobos en escisiones mediante termolisina), o por tanto P1 como P2 (por ejemplo escisiones específicas entre dos restos cargados positivamente mediante serina endoproteasa de la médula suprarrenal). En algunos casos, restos más distantes pueden determinar la preferencia de la escisión, por ejemplo P2 para peptidasa A estreptocócica. Se sabe que algunos restos influyen negativamente sobre las escisiones; es bien conocido que los enlaces con prolina en la posición P1’ son resistentes a la acción de muchas proteasas. La mayoría de las endoproteasas escinden preferentemente en un entorno hidrófobo o en la cercanía de restos cargados negativamente. Por ejemplo, las endoproteasas disponibles industrialmente como quimiotripsina (obtenida de páncreas bovino) o subtilisina, metaloproteasa neutra o termolisina (todas obtenidas de la especie Bacillus) tienden a favorecer la escisión “por detrás” de los aminoácidos hidrófobos como –Phe, -Leu y –Tyr. Otras endoproteasas disponibles industrialmente (obtenidas de páncreas bovino) escinden preferentemente detrás de –Arg y –Lys, y la papaína (una mezcla compleja de diversas enzimas que incluyen proteasas obtenidas de las frutas de la papaya) escinden preferentemente por detrás de –Arg. The specificity of endoproteases is usually defined in terms of preferential cleavage of bonds between the carboxyl of the amino acid residue at position P1 and the amino group of the residue at position P1 ', respectively. The preference may be predominantly conditioned by P1 (for example positively charged moieties in trypsin substrates), by P1 '(for example hydrophobic moieties in thermolysin cleavage), or therefore P1 and P2 (for example specific cleavages between two positively charged moieties by serine endoprotease of the adrenal medulla). In some cases, more distant residues can determine the preference of cleavage, for example P2 for streptococcal peptidase A. It is known that some remains have a negative influence on splits; It is well known that proline bonds in the P1 ’position are resistant to the action of many proteases. Most endoproteases preferentially cleave in a hydrophobic environment or in the vicinity of negatively charged residues. For example, industrially available endoproteases such as chymotrypsin (obtained from bovine pancreas) or subtilisin, neutral metalloprotease or thermolysin (all obtained from the Bacillus species) tend to favor excision “behind” hydrophobic amino acids such as –Phe, -Leu and –Tyr. Other industrially available endoproteases (obtained from bovine pancreas) preferentially cleave behind –Arg and –Lys, and papain (a complex mixture of various enzymes that include proteases obtained from papaya fruits) preferentially cleave behind –Arg.

En contraste, los enlaces peptídicos formados por restos de pequeño tamaño tales como Ala, Gly, Ser, Thre, así como Ile y Pro, son malos sustratos (Keil, B et al.; Protein Seq Data Anal (1993) 5; 401-407). Esta situación tiene profundas implicaciones para la industria farmacéutica, la industria de bebidas y de alimentos, la agroindustria e incluso para la industria química. Una proteasa según la invención presenta preferencias de escisión no habituales. In contrast, peptide bonds formed by small size residues such as Ala, Gly, Ser, Thre, as well as Ile and Pro, are poor substrates (Keil, B et al .; Protein Seq Data Anal (1993) 5; 401- 407). This situation has profound implications for the pharmaceutical industry, the beverage and food industry, agribusiness and even the chemical industry. A protease according to the invention has unusual cleavage preferences.

Las exopeptidasas actúan sólo cerca de los extremos de las cadenas polipeptídicas. Aquellas que actúan en el término N libre liberan un resto de aminoácido individual (denominadas aminopeptidasas) o un dipéptido o un tripéptido (denominadas dipeptidil-peptidasas y tripeptidil-peptidasas). Aquellas que actúan en el término C libre liberan un único resto (las denominadas carboxipeptidasas) o un dipéptido (las denominadas peptidil-dipeptidasas). Las carboxipeptidasas están destinadas a tres grupos en base al mecanismo catalítico, es decir, carboxipeptidasas de tipo serina, metalocarboxipeptidasas, y carboxipeptidasas de tipo cisteína. Otras exopeptidasas son específicas para dipéptidos (las denominadas dipeptidasas), o son capaces de escindir enlaces peptídicos diferentes de aquellos de los grupos alfa-carboxílico o alfa-amínico (las denominadas omega peptidasas). Los ejemplos de tales nuevas omega peptidasas son la piroglutamil-peptidasa y la acilaminoacil-peptidasa como se identifica en la presente invención (véase la Tabla 1, genes 18 y 45, respectivamente). Exopeptidases act only near the ends of the polypeptide chains. Those that act in the free N term release an individual amino acid residue (called aminopeptidases) or a dipeptide or a tripeptide (called dipeptidyl peptidases and tripeptidyl peptidases). Those that act in the free C term release a single moiety (the so-called carboxypeptidases) or a dipeptide (the so-called peptidyl dipeptidases). Carboxypeptidases are intended for three groups based on the catalytic mechanism, that is, carboxypeptidases of the serine type, metallocarboxypeptidases, and carboxypeptidases of the cysteine type. Other exopeptidases are specific for dipeptides (so-called dipeptidases), or are capable of cleaving peptide bonds different from those of the alpha-carboxylic or alpha-amino groups (so-called omega peptidases). Examples of such new omega peptidases are pyroglutamyl peptidase and acylaminoacyl peptidase as identified in the present invention (see Table 1, genes 18 and 45, respectively).

Los ejemplos típicos de aplicación industrial que dependen del uso de endoproteasas puras y en los que se puede esperar que la proteasa según la invención suministre un comportamiento superior incluyen el procesamiento de materiales de origen vegetal o animal. Estas etapas de procesamiento se pueden dirigir a modificar un gran conjunto de características del material bruto o de la fracción proteica (parcialmente) purificada. Por ejemplo, estas etapas de procesamiento se pueden dirigir a maximizar las solubilidades de los productos, las capacidades de filtración, las capacidades de separación, los rendimientos de la extracción proteica y las capacidades de digestión, o a minimizar toxicidades, malos sabores y viscosidades. Además, el tratamiento se puede dirigir a alterar características físico-químicas del material crudo o de la proteína purificada (o parcialmente purificada). Estas ventajas se aplican no sólo si la endoproteasa según la invención se aplica como un auxiliar del procesamiento en aplicaciones industriales, sino también si se aplica como un componente enzimático activo en el pienso para animales. Específicamente, la endoproteasa según la invención se puede aplicar como un mejorador del pan en la industria panadera, por ejemplo para retardar el endurecimiento del pan, o para disminuir la viscosidad de las masas. O la endoproteasa se puede usar en la industria cervecera y vinícola, para prevenir o minimizar la formación de enturbiamientos proteicos indeseables. Como alternativa, se puede usar en la industria cervecera para optimizar los rendimientos de extracción de la proteína de cereales usados en la preparación del mosto. Además, se puede usar también ventajosamente en la industria láctea como agente de coagulación de la leche, con características superiores, o para optimizar las características de texturización, espumación o endurecimiento de diversos componentes de la leche. Otra aplicación en la industria láctea es el uso de la nueva proteasa en la preparación de quesos modificados con enzimas (EMC). Typical examples of industrial application that depend on the use of pure endoproteases and in which the protease according to the invention can be expected to provide superior performance include the processing of materials of plant or animal origin. These processing steps can be directed to modify a large set of characteristics of the raw material or the (partially) purified protein fraction. For example, these processing steps can be aimed at maximizing product solubilities, filtration capacities, separation capacities, yields of protein extraction and digestion capacities, or minimizing toxicities, bad flavors and viscosities. In addition, the treatment can be directed to alter physical-chemical characteristics of the raw material or of the purified (or partially purified) protein. These advantages apply not only if the endoprotease according to the invention is applied as a processing aid in industrial applications, but also if it is applied as an active enzyme component in animal feed. Specifically, the endoprotease according to the invention can be applied as a bread improver in the bakery industry, for example to retard the hardening of the bread, or to decrease the viscosity of the dough. Or the endoprotease can be used in the beer and wine industry, to prevent or minimize the formation of undesirable protein cloudiness. As an alternative, it can be used in the brewing industry to optimize the extraction yields of cereal protein used in the preparation of must. In addition, it can also be used advantageously in the dairy industry as a milk coagulation agent, with superior characteristics, or to optimize the texturing, foaming or hardening characteristics of various milk components. Another application in the dairy industry is the use of the new protease in the preparation of enzyme modified cheeses (EMC).

Además, diversos sustratos proteinosos se pueden someter a una endoproteasa según la invención, habitualmente en combinación con otras enzimas proteolíticas, para obtener hidrolizados para aplicaciones médicas o no médicas. Aquí, la endoproteasa según la invención es sorprendentemente eficaz logrando una hidrólisis completa del sustrato proteinoso de manera que se hidrolizan completamente incluso las partes resistentes a proteasas; la endoproteasa también es sorprendentemente activa minimizando la alergenicidad del hidrolizado final, o suprimiendo la formación de sabores amargos desagradables. In addition, various protein substrates can be subjected to an endoprotease according to the invention, usually in combination with other proteolytic enzymes, to obtain hydrolysates for medical or non-medical applications. Here, the endoprotease according to the invention is surprisingly effective in achieving complete hydrolysis of the protein substrate so that even the protease resistant parts are completely hydrolyzed; The endoprotease is also surprisingly active minimizing the allergenicity of the final hydrolyzate, or suppressing the formation of unpleasant bitter flavors.

Más específicamente, la endoproteasa según la invención se caracteriza por su preferencia por escindir proteínas en enlaces peptídicos no habituales, especialmente con los restos de aminoácidos de pequeño tamaño de Ala, Gly, Ser y Thr, o los restos de Ile y Pro en la posición P1 o la P1’ (Keil, B et al.; Protein Seq Data Anal (1993) 5; 401-407). Como resultado, aquellas fracciones de los materiales de partida proteinosos que resisten la hidrólisis al usar endoproteasas de la técnica anterior, se pueden disolver e hidrolizar usando la endoproteasa según la invención. Los ejemplos no limitantes de tales fracciones resistentes a proteasas incluyen las denominadas extensinas en materiales vegetales y colágeno, gelatina pero también componentes lácteos específicos en el material de origen animal. More specifically, the endoprotease according to the invention is characterized by its preference for cleaving proteins in unusual peptide bonds, especially with the small amino acid residues of Ala, Gly, Ser and Thr, or the Ile and Pro residues in the position P1 or P1 '(Keil, B et al .; Protein Seq Data Anal (1993) 5; 401-407). As a result, those fractions of the proteinaceous starting materials that resist hydrolysis by using endoproteases of the prior art can be dissolved and hydrolyzed using the endoprotease according to the invention. Non-limiting examples of such protease-resistant fractions include so-called extensins in plant materials and collagen, gelatin but also specific dairy components in material of animal origin.

Diversos productos alimentarios, tales como, por ejemplo, habas de soja, contienen inhibidores de tripsina. Estas proteínas inhiben la actividad de tripsina en el tubo digestivo de, por ejemplo, cerdos y aves de corral. Esta actividad inhibidora de tripsina da como resultado una digestibilidad proteica subóptima en estos animales, dando como resultado un aumento de la producción de desechos y una mala economía. Este problema se puede superar en parte tostando habas de soja a temperaturas elevadas. Se han identificado en habas de soja dos tipos diferentes de inhibidores de tripsina, es decir, los inhibidores de tripsina de tipo Bowman-Birk, y los inhibidores de tripsina de tipo Kunitz. Various food products, such as, for example, soy beans, contain trypsin inhibitors. These proteins inhibit the trypsin activity in the digestive tract of, for example, pigs and poultry. This trypsin inhibitory activity results in suboptimal protein digestibility in these animals, resulting in increased waste production and poor economy. This problem can be overcome in part by roasting soy beans at elevated temperatures. Two different types of trypsin inhibitors have been identified in soy beans, that is, trypsin inhibitors of the Bowman-Birk type, and trypsin inhibitors of the Kunitz type.

La invención proporciona ahora una manera alternativa para degradar la actividad inhibidora de tripsina con respecto al tostado, por cuanto proporciona una cisteína proteasa (EC 3.4.22, tabla 1) capaz de escindir el enlace peptídico de leucina 176-aspartato 177 cerca del término carboxílico del inhibidor de tripsina de tipo Kunitz (según se repasa en Wilson (1988) en CRC Critical Reviews in Biotechnology 8 (3): 197-216). Esto da como resultado la inactivación de este inhibidor de tripsina en haba de soja. Se encontró sorprendentemente que las cisteína proteasas segregadas por el hongo Aspergillus niger satisficieron estos criterios mucho mejor que enzimas similares derivadas de otros organismos. The invention now provides an alternative way to degrade trypsin inhibitory activity with respect to roasting, because it provides a cysteine protease (EC 3.4.22, table 1) capable of cleaving the leucine 176-aspartate 177 peptide bond near the carboxylic terminus of the Kunitz-type trypsin inhibitor (as reviewed in Wilson (1988) in CRC Critical Reviews in Biotechnology 8 (3): 197-216). This results in the inactivation of this trypsin inhibitor in soybeans. It was surprisingly found that cysteine proteases secreted by the fungus Aspergillus niger met these criteria much better than similar enzymes derived from other organisms.

Las proteasas también se usan ampliamente en la técnica de obtención de quesos. En la producción de quesos, es necesario coagular la leche del queso para ser capaces de separar las materias del queso, por ejemplo caseína, del suero de la leche. Se han descrito varias enzimas que coagulan la leche, también denominadas como coagulantes, e incluyen quimiosina (bovina), pepsina bovina, pepsina porcina, así como enzimas microbianas como proteasa de Rhizomucor miehei, proteasa de Rhizomucor pusillus, y proteasa de Cryptonectria parasitica. La quimiosina se Proteases are also widely used in the art of cheese making. In cheese production, it is necessary to coagulate the milk from the cheese to be able to separate the materials from the cheese, for example casein, from the whey of the milk. Several milk coagulating enzymes have been described, also referred to as coagulants, and include chemosin (bovine), bovine pepsin, porcine pepsin, as well as microbial enzymes such as Rhizomucor miehei protease, Rhizomucor pusillus protease, and parasitic Cryptonectria protease. The chemosin is

puede obtener de estómagos de ternera, pero también se puede producir de forma microbiana, por ejemplo, mediante Kluyveromyces lactis. Todas estas enzimas se caracterizan por tener una especificidad por el enlace peptídico entre el resto 105 (fenilalanina) y el resto 106 (metionina), o el enlace adyacente a aquel en N-caseína. Esto significa que, empleando estas enzimas en la obtención de quesos, la N-caseína se divide en la unión entre para-N-caseína y el resto macropeptídico denominado glucomacropéptido (GMP) que posee las cargas negativas. Cuando esto ocurre, el macropéptido se difunde en el suero lácteo, se pierde su efecto estabilizante sobre la solubilidad de las micelas de caseína, y las micelas de caseína pueden comenzar a agregarse una vez que se ha hidrolizado suficiente kappa-caseína. Para una elaboración adicional sobre la coagulación enzimática de la leche (por ejemplo D.G. Dalgleish en Advanced Dairy Chemistry vol. 1 editado por P.F. Fox, Elsevier, Londres, 1992). It can be obtained from calf stomachs, but it can also be produced microbially, for example, by Kluyveromyces lactis. All these enzymes are characterized by having a specificity for the peptide bond between residue 105 (phenylalanine) and residue 106 (methionine), or the bond adjacent to that in N-casein. This means that, using these enzymes to obtain cheeses, N-casein is divided into the junction between para-N-casein and the macropeptide moiety called glucomacropeptide (GMP) that has negative charges. When this occurs, the macropeptide diffuses into the whey, its stabilizing effect on the solubility of casein micelles is lost, and casein micelles can begin to be added once enough kappa-casein has been hydrolyzed. For further elaboration on the enzymatic coagulation of milk (for example D.G. Dalgleish in Advanced Dairy Chemistry vol. 1 edited by P.F. Fox, Elsevier, London, 1992).

Los coagulantes actualmente disponibles permiten un rendimiento más bien elevado de quesos; sin embargo, se debería observar que, debido a los enormes volúmenes de queso producidos, un aumento del rendimiento del orden de magnitud de decenas de puntos porcentuales puede constituir una ventaja económica sustancial. En consecuencia, existe una gran necesidad en la técnica de coagulantes con un rendimiento (incluso ligeramente) mejorado. The coagulants currently available allow a rather high yield of cheeses; however, it should be noted that, due to the enormous volumes of cheese produced, an increase in yield of the order of magnitude of tens of percentage points may constitute a substantial economic advantage. Consequently, there is a great need in the coagulant technique with an (even slightly) improved performance.

Los coagulantes se caracterizan por su elevada especificidad por el sustrato, que, sin embargo, depende del pH y de la temperatura. En un proceso típico de obtención de queso, el pH cambiará desde el pH inicial de 6,3 a valores de pH más bajos, en el intervalo de 4,5-5,5, dependiendo el valor final de las condiciones usadas durante el proceso de producción del queso. Algunos coagulantes son más sensibles a los cambios de pH que otros. La proteasa de Rhizomucor pusillus, por ejemplo, es más sensible a cambios de pH que la quimiosina. Además del pH, también otros parámetros, como la temperatura y el contenido de agua, pueden afectar a la especificidad de la proteasa. Es bien sabido que la mayoría de los coagulantes muestran una especificidad cambiante por el sustrato cuando cambia el pH, dando como resultado una actividad proteolítica alterada en las etapas finales del proceso de obtención del queso. También es bien conocido que los coagulantes difieren en el grado de proteolisis de la caseína; pueden mostrar también diferencias en los patrones peptídicos producidos durante la proteolisis. Hay factores relevantes durante la maduración del queso, y pueden afectar a las propiedades del queso como sabor, aroma y textura. En algunos casos, los coagulantes dan lugar a efectos indeseados, como la formación de péptidos de sabor amargo, o malos sabores. Además, los cambios en la especificidad proteolítica pueden conducir a una reducción del rendimiento. La pepsina, un componente bien conocido en muchas preparaciones de quimiosina bovina, es un ejemplo de una proteasa que da lugar a menores rendimientos y efectos de sabor cuando se compara con la quimiosina pura. Todavía existe la necesidad de coagulantes que den lugar a una nueva textura y sabor mejorados del queso. Tales nuevos coagulantes dan como resultado el desarrollo acelerado de perfiles de sabor y textura relacionados con el envejecimiento de los quesos, proporcionando con ello un beneficio económico sustancial. Coagulants are characterized by their high specificity for the substrate, which, however, depends on the pH and temperature. In a typical cheese making process, the pH will change from the initial pH of 6.3 to lower pH values, in the range of 4.5-5.5, depending on the final value of the conditions used during the process of cheese production. Some coagulants are more sensitive to pH changes than others. Rhizomucor pusillus protease, for example, is more sensitive to pH changes than chemosin. In addition to pH, other parameters, such as temperature and water content, can also affect the specificity of the protease. It is well known that most coagulants show a changing specificity for the substrate when the pH changes, resulting in an altered proteolytic activity in the final stages of the cheese making process. It is also well known that coagulants differ in the degree of proteolysis of casein; They may also show differences in peptide patterns produced during proteolysis. There are relevant factors during cheese maturation, and they can affect the properties of cheese such as taste, aroma and texture. In some cases, coagulants give rise to unwanted effects, such as the formation of bitter-tasting peptides, or bad flavors. In addition, changes in proteolytic specificity can lead to a reduction in yield. Pepsin, a well known component in many bovine chemosin preparations, is an example of a protease that results in lower yields and taste effects when compared to pure chemosin. There is still a need for coagulants that give rise to a new improved cheese texture and flavor. Such new coagulants result in the accelerated development of flavor and texture profiles related to cheese aging, thereby providing a substantial economic benefit.

Es bien sabido que los aminoácidos libres son muy importantes en la generación de sabor y aroma. Especialmente, los aminoácidos leucina, fenilalanina, metionina y valina desempeñan un papel importante en la generación de componentes de sabor y aroma típicos del queso. Los aminoácidos libres se convierten, vía fermentación por microorganismos que son añadidos durante el proceso de fabricación del queso, en los compuestos reales generadores de aroma y sabor, como metanodiol, disulfuro de dimetilo, ácido metilpropanoico y metilpropanal. Las exopeptidasas desempeñan un papel importante en la generación de aminoácidos libres. Sin embargo, sólo pueden ser eficaces cuando se combinan con una endoproteasa de especificidad apropiada. Se pueden usar combinaciones apropiadas de exo- y endopeptidasas en la obtención de quesos, dando como resultado la fabricación de quesos con perfiles de sabor nuevos y mejorados. It is well known that free amino acids are very important in the generation of flavor and aroma. Especially, the amino acids leucine, phenylalanine, methionine and valine play an important role in the generation of flavor and aroma components typical of cheese. Free amino acids are converted, via fermentation by microorganisms that are added during the cheese manufacturing process, into the real aroma and flavor generating compounds, such as methanediol, dimethyl disulfide, methylpropanoic acid and methylpropanal. Exopeptidases play an important role in the generation of free amino acids. However, they can only be effective when combined with an appropriate specificity endoprotease. Appropriate combinations of exo- and endopeptidases can be used in cheese making, resulting in the manufacture of cheeses with new and improved flavor profiles.

Las enzimas según la invención se pueden usar para hidrolizar materiales proteinosos de origen animal, tales como leche entera, leche desnatada, caseína, proteína del suero, o mezclas de caseína y proteína de suero. Tales mezclas de caseína y proteína de suero se pueden usar, por ejemplo, en relaciones similares a las encontradas en la leche humana. Además, la mezcla enzimática según la invención se puede usar para hidrolizar materiales proteinosos de origen vegetal, tales como, por ejemplo, gluten de trigo, cebada malteada o sin maltear u otros cereales usados para obtener cerveza, leche de soja, sus concentrados o aislados, concentrados proteicos de maíz y sus aislados, y proteínas de arroz. The enzymes according to the invention can be used to hydrolyze protein materials of animal origin, such as whole milk, skim milk, casein, whey protein, or mixtures of casein and whey protein. Such mixtures of casein and whey protein can be used, for example, in ratios similar to those found in human milk. In addition, the enzyme mixture according to the invention can be used to hydrolyze plant-derived protein materials, such as, for example, wheat gluten, malted or malted barley or other cereals used to obtain beer, soy milk, its concentrates or isolates. , corn protein concentrates and their isolates, and rice proteins.

Dentro del área de procesos industriales a gran escala, algunas aplicaciones se basan sólo en el uso de endoproteasas, mientras que en otras aplicaciones son esenciales las combinaciones de endoproteasas con exoproteasas. Los ejemplos típicos que dependen del uso de endoproteasas puras y en los que la proteasa según la invención puede proporcionar un comportamiento superior incluyen aplicaciones como el procesamiento de proteínas de soja o de guisantes o de cereales dirigido a minimizar viscosidades u optimizar la espumación u otras características físico-químicas, mejoradores del pan en la industria panadera también dirigidos a disminuir la viscosidad de las masas, auxiliares del procesamiento en la industria cervecera y vinícola dirigidos a la prevención de enturbiamientos proteicos o a optimizar los rendimientos de extracción de cereales, aditivos alimentarios en la bioindustria dirigidos a potenciar la absorción intestinal o a modular las actividades microbianas en el intestino, auxiliares del procesamiento en la industria láctea dirigidos a optimizar las características de coagulación, espumación o endurecimiento de diversos componentes de la leche. Además, para segmentos de mercados específicos, las proteínas derivadas de la leche o de la soja o del colágeno se exponen a proteasas para producir los denominados hidrolizados proteicos. Aunque los principales mercados de estos hidrolizados proteicos son fórmulas infantiles y productos alimentarios para personas hospitalizadas, los productos destinados a personas sin Within the area of large-scale industrial processes, some applications are based only on the use of endoproteases, while in other applications combinations of endoproteases with exoproteases are essential. Typical examples that depend on the use of pure endoproteases and in which the protease according to the invention can provide superior performance include applications such as processing of soy or pea or cereal proteins aimed at minimizing viscosities or optimizing foaming or other characteristics. physicochemical, bread improvers in the bakery industry also aimed at reducing the viscosity of the dough, processing aids in the beer and wine industry aimed at preventing protein cloudiness or optimizing cereal extraction yields, food additives in the bioindustry aimed at enhancing intestinal absorption or modulating microbial activities in the intestine, auxiliary to processing in the dairy industry aimed at optimizing the coagulation, foaming or hardening characteristics of various milk components. In addition, for specific market segments, proteins derived from milk or soy or collagen are exposed to proteases to produce so-called protein hydrolysates. Although the main markets for these protein hydrolysates are infant formulas and food products for hospitalized people, products intended for people without

necesidades médicas, tales como atletas, o personas en una dieta de adelgazamiento, forman un segmento que crece rápidamente. En todas estas aplicaciones, los hidrolizados proteicos ofrecen ventajas atractivas, tales como alergenicidades reducidas, captación gastrointestinal facilitada, menor deterioro químico de aminoácidos deseables como glutamina y cisteína, y, finalmente, ausencia de precipitación proteinosas en bebidas ácidas durante períodos de almacenamiento prolongados. Todas estas ventajas se pueden combinar si el hidrolizado se ofrece como una mezcla de di-y tripéptidos. Sin embargo, actualmente todos los hidrolizados comercialmente disponibles se producen combinando varias endoproteasas. Este último enfoque implica una degradación no uniforme e incompleta de la proteína. Para obtener la mezcla deseada de di- y tripéptidos, sería ideal un proceso de hidrólisis que implicase una combinación de diversos di- y tripeptidil peptidasas. Desafortunadamente, sólo se conocen unas pocas de estas enzimas procedentes de microorganismos de grado alimentario e industrialmente aceptables, sin mencionar industrialmente disponibles. Según la invención, varias de las di- y tripeptidil peptidasas enormemente útiles son obtenibles económicamente en un estado relativamente puro. Se prefieren aquellas di- o tripeptidil peptidasas que presentan una baja selectividad por el sustrato a escindir, es decir, presentan sólo mínimas preferencias por la escisión de restos de aminoácidos. Se prefieren las combinaciones de aquellas di- o tripeptidil peptidasas que hidrolizan un porcentaje elevado de los enlaces peptídicos de origen natural. A pesar de esta elevada actividad hacia enlaces peptídicos de origen natural, se evita la hidrólisis total hasta aminoácidos libres por la naturaleza de las di- y tripeptidil peptidasas. También se prefieren aquellas di- o tripeptidil peptidasas que son óptimamente activas entre pH 4 y 8, y muestran una estabilidad adecuada de temperatura. La estabilidad adecuada de temperatura implica que al menos 40%, preferiblemente al menos 60%, más preferiblemente entre 70 y 100% de la actividad hidrolítica inicial sobrevive después de calentar la enzima junto con el sustrato durante 1 hora a 50 grados C. Medical needs, such as athletes, or people on a slimming diet, form a rapidly growing segment. In all these applications, protein hydrolysates offer attractive advantages, such as reduced allergenicities, facilitated gastrointestinal uptake, less chemical deterioration of desirable amino acids such as glutamine and cysteine, and, finally, absence of protein precipitation in acidic beverages during prolonged storage periods. All these advantages can be combined if the hydrolyzate is offered as a mixture of di-and tripeptides. However, currently all commercially available hydrolysates are produced by combining several endoproteases. This last approach implies a non-uniform and incomplete degradation of the protein. To obtain the desired mixture of di- and tripeptides, a hydrolysis process involving a combination of various di- and tripeptidyl peptidases would be ideal. Unfortunately, only a few of these enzymes from food grade and industrially acceptable microorganisms are known, not to mention industrially available. According to the invention, several of the enormously useful di- and tripeptidyl peptidases are economically obtainable in a relatively pure state. Those di- or tripeptidyl peptidases that have low selectivity for the substrate to be cleaved are preferred, that is, they have only minimal preferences for cleavage of amino acid residues. Combinations of those di- or tripeptidyl peptidases that hydrolyze a high percentage of naturally occurring peptide bonds are preferred. Despite this high activity towards naturally occurring peptide bonds, total hydrolysis to free amino acids is avoided due to the nature of di- and tripeptidyl peptidases. Also preferred are those di- or tripeptidyl peptidases that are optimally active between pH 4 and 8, and show adequate temperature stability. Proper temperature stability implies that at least 40%, preferably at least 60%, more preferably between 70 and 100% of the initial hydrolytic activity survives after heating the enzyme together with the substrate for 1 hour at 50 degrees C.

Aunque el proceso con respecto a una producción eficiente de mezclas de di- o tripéptidos o di-y tripéptidos depende de la disponibilidad de las enzimas según la invención, la primera incubación enzimática con el sustrato proteinoso será habitualmente una endoproteasa. Preferiblemente, una endoproteasa con una endopeptidasa de amplio espectro adecuada para la situación, por ejemplo subtilisina (Delvolase de DSM), metaloproteasa neutra (Neutrase de NOVO) o termolisina (Thermoase de Daiwa Kasei) para las condiciones casi neutras, y pepsina o aspergilopepsina (por ejemplo Sumizyme AP de Shin Nihon, Japón) para las condiciones ácidas. El objetivo de esta primera digestión es mejorar la solubilidad, reducir la viscosidad, y reducir las características de termoendurecimiento de la mezcla de agua/proteína. Además, este pretratamiento con una endonucleasa es esencial para crear suficientes puntos de partida para las di- y tripeptidil peptidasas, acelerando con ello el proceso de la formación de di- o tripéptidos. Opcionalmente, en esta etapa del proceso, o más tarde, se puede incluir una proteasa destinada a desamargar el hidrolizado, junto con las di- o tripeptidil peptidasas. Although the process with respect to an efficient production of mixtures of di- or tripeptides or di-and tripeptides depends on the availability of the enzymes according to the invention, the first enzymatic incubation with the protein substrate will usually be an endoprotease. Preferably, an endoprotease with a broad-spectrum endopeptidase suitable for the situation, for example subtilisin (DSM Delvolase), neutral metalloprotease (NOVO Neutrase) or thermolysin (Daiwa Kasei Thermoase) for almost neutral conditions, and pepsin or aspergilopepsin ( for example Sumizyme AP of Shin Nihon, Japan) for acidic conditions. The objective of this first digestion is to improve the solubility, reduce the viscosity, and reduce the thermosetting characteristics of the water / protein mixture. In addition, this pretreatment with an endonuclease is essential to create sufficient starting points for di- and tripeptidyl peptidases, thereby accelerating the process of di- or tripeptide formation. Optionally, at this stage of the process, or later, a protease intended to detach the hydrolyzate may be included, together with the di- or tripeptidyl peptidases.

El objetivo principal de estos últimos hidrolizados es minimizar la alergenicidad del producto, o facilitar la captación gastrointestinal. En la producción de tales hidrolizados, es de especial importancia el uso de dipeptidil-y tripeptidilpeptidasas, puesto que estas ofrecen una forma eficiente de producir hidrolizados. The main objective of the latter hydrolysates is to minimize the allergenicity of the product, or facilitate gastrointestinal uptake. In the production of such hydrolysates, the use of dipeptidyl- and tripeptidylpeptidases is especially important, since they offer an efficient way of producing hydrolysates.

Otras aplicaciones en estas industrias alimentaria y de piensos se basan totalmente en combinaciones de una o más endoproteasas con una o más exoproteasas. Tales combinaciones de una endoproteasa con una exoproteasa se usan típicamente en industrias para mejorar aspectos como el sabor y el color del producto final. La razón para esto es que el desarrollo del sabor y del color depende en gran medida de la presencia de aminoácidos libres. Los aminoácidos libres se pueden obtener no sólo mediante exoproteasas tales como carboxipeptidasas y aminopeptidasas, sino también mediante peptidil-dipeptidasas. Si se combinan con endoproteasas, o incluso con dipeptidil- o tripeptidil-peptidasas, las carboxipeptidasas, aminopeptidasas y peptidil-dipeptidasas pueden crear mayores cantidades de aminoácidos libres en menos tiempo. Sin embargo, en todos estos procesos se debería evitar una liberación incontrolada de aminoácidos o incluso componentes no proteinosos, para minimizar reacciones secundarias indeseables. Other applications in these food and feed industries rely entirely on combinations of one or more endoproteases with one or more exoproteases. Such combinations of an endoprotease with an exoprotease are typically used in industries to improve aspects such as the taste and color of the final product. The reason for this is that the development of taste and color depends largely on the presence of free amino acids. Free amino acids can be obtained not only by exoproteases such as carboxypeptidases and aminopeptidases, but also by peptidyl dipeptidases. If combined with endoproteases, or even with dipeptidyl- or tripeptidyl-peptidases, carboxypeptidases, aminopeptidases and peptidyl dipeptidases can create greater amounts of free amino acids in less time. However, in all these processes an uncontrolled release of amino acids or even non-protein components should be avoided, to minimize undesirable side reactions.

Aunque los aminoácidos libres como tales pueden provocar un número de impresiones de sabor, estas impresiones de sabor son muy básicas (amarga, dulce, agria y “umami”), y la concentración de aminoácidos requerida para percibir estos sabores es muy elevada. A pesar de estos valores umbral elevados, los aminoácidos libres son capaces de crear efectos sensoriales importantes a intervalos de concentraciones mucho menores, a través de un número de mecanismos que potencian el sabor. Uno de estos mecanismos implica la combinación de aminoácidos libres con azúcares en las denominadas reacciones de Maillard. Comparados con los aminoácidos libres, con estos productos de Maillard se pueden desarrollar sistemas de sabor y olor abrumadoramente complejos, con valores umbral que son de varios órdenes de magnitud menores que los registrados para los aminoácidos libres. Los productos de Maillard se forman a temperaturas elevadas, habitualmente durante la cocción, horneado o tueste, cuando se preparan productos alimentarios o de piensos. Durante estos tratamientos, se desarrolla tanto color como un gran conjunto de aromas. En estas reacciones, los grupos amino reaccionan con compuestos reductores como primera etapa, y finalmente conducen a una familia completa de rutas de reacción. En alimentos o piensos, los compuestos amínicos implicados son predominantemente aminoácidos libres que son liberados de la materia prima proteinosa mediante diversas proteasas, y los compuestos reductores requeridos representan principalmente azúcares reductores. La implicación es que, durante el procesamiento de la materia prima, se debería evitar la liberación indeseada de aminoácidos libres y azúcares, para minimizar los malos sabores que se podían generar durante etapas subsiguientes de calentamiento, como por ejemplo durante el secado por pulverización o durante la esterilización. Esta última noción enfatiza una vez más el beneficio de la pureza superior y bajos costes en uso de la enzima según la invención. Although free amino acids as such can cause a number of flavor impressions, these flavor impressions are very basic (bitter, sweet, sour and "umami"), and the concentration of amino acids required to perceive these flavors is very high. Despite these high threshold values, free amino acids are capable of creating important sensory effects at much lower concentration intervals, through a number of mechanisms that enhance flavor. One of these mechanisms involves the combination of free amino acids with sugars in the so-called Maillard reactions. Compared to free amino acids, overwhelmingly complex taste and odor systems can be developed with these Maillard products, with threshold values that are several orders of magnitude smaller than those recorded for free amino acids. Maillard products are formed at elevated temperatures, usually during cooking, baking or roasting, when food or feed products are prepared. During these treatments, both color and a large set of aromas develop. In these reactions, the amino groups react with reducing compounds as the first stage, and finally lead to a complete family of reaction pathways. In foods or feedstuffs, the amino compounds involved are predominantly free amino acids that are released from the protein raw material by various proteases, and the required reducing compounds primarily represent reducing sugars. The implication is that, during the processing of the raw material, the unwanted release of free amino acids and sugars should be avoided, to minimize the bad flavors that could be generated during subsequent heating stages, such as during spray drying or during sterilization This last notion emphasizes once again the benefit of superior purity and low costs in use of the enzyme according to the invention.

Aparte de las reacciones de Maillard, los aminoácidos también pueden sufrir importantes transiciones químicas a temperaturas ambiente. Este último tipo de transiciones dependen de las enzimas, y son bastante habituales en alimentos fermentados tales como cerveza, yogur, maduración del queso y procesos de maduración de la carne y del vino. En estos procesos de fermentación, los aminoácidos libres se liberan de las materias primas usadas mediante las proteasas añadidas, o mediante actividad enzimática proteolítica a partir de la materia prima o los fermentos microbianos usados. Durante la fase de maduración, la actividad metabólica microbiana convierte entonces a los aminoácidos libres en derivados con propiedades sensoriales aumentadas. Por ejemplo, L-leucina, Lisoleucina y L-valina conducen a la formación de alcoholes de fusel valiosos como alcoholes amílicos e isobutanol en la fermentación de la cerveza. De forma similar, los volátiles del queso, tales como metanotiol y disulfuro de dimetilo, se han rastreado hasta la aparición de metionina en el queso, así como ácido metilpropanoico y metilpropanal hasta valina. Finalmente, el aminoácido libre glutamato puede crear efectos potenciadores del sabor potentes, debido a su sinergia con los productos de ruptura de ARN, denominados 5’-ribonucleótidos. Si se combinan con las concentraciones apropiadas de 5’-ribonucleótidos, tales como 5’-IMP y 5’-GMP, se sabe que el umbral de detección del sabor de umami generado por glutamato se reduce en casi dos órdenes de magnitud. Apart from Maillard reactions, amino acids can also undergo significant chemical transitions at room temperatures. The latter type of transitions depend on enzymes, and are quite common in fermented foods such as beer, yogurt, cheese maturation and meat and wine maturation processes. In these fermentation processes, free amino acids are released from the raw materials used by the added proteases, or by proteolytic enzymatic activity from the raw material or the microbial ferments used. During the maturation phase, the microbial metabolic activity then converts free amino acids into derivatives with increased sensory properties. For example, L-leucine, Lisoleucine and L-valine lead to the formation of valuable fusel alcohols such as amyl alcohols and isobutanol in the fermentation of beer. Similarly, cheese volatiles, such as methanethiol and dimethyl disulfide, have been traced to the appearance of methionine in cheese, as well as methylpropanoic acid and methylpropanal to valine. Finally, the free amino acid glutamate can create potent flavor enhancing effects, due to its synergy with RNA breakdown products, called 5’-ribonucleotides. If combined with the appropriate concentrations of 5'-ribonucleotides, such as 5’-IMP and 5’-GMP, it is known that the threshold of detection of the umami flavor generated by glutamate is reduced by almost two orders of magnitude.

A fin de obtener efectos de sabor pronunciados y precisos en todos estos procesos, los sustratos proteinosos se deberían de hidrolizar usando una combinación de una endo- y una exoproteasa, en la que al menos una de las endo- o exoproteasa, preferiblemente tanto la endo- como la exoproteasa, son puras y preferiblemente selectivas con respecto a un conjunto específico de aminoácidos o preferentemente liberan el aminoácido o aminoácidos preferidos. Las proteasas así preferidas se caracterizan por una gran selectividad con respecto a las secuencia de aminoácidos que se pueden escindir, noción la cual hace a la categoría enzimática en Aspergillus conocida como “madurasas” particularmente importante. In order to obtain pronounced and precise flavor effects in all these processes, protein substrates should be hydrolyzed using a combination of an endo- and an exoprotease, in which at least one of the endo- or exoprotease, preferably both the endo - like exoprotease, they are pure and preferably selective with respect to a specific set of amino acids or preferably release the preferred amino acid or amino acids. The proteases thus preferred are characterized by a high selectivity with respect to the amino acid sequence that can be cleaved, notion which makes the enzymatic category in Aspergillus known as "mature" particularly important.

Aparte de las industrias alimentaria y de piensos, las proteasas también se aplican habitualmente por las industrias química, farmacéutica, de diagnóstico y de cuidado personal. Apart from the food and feed industries, proteases are also commonly applied by the chemical, pharmaceutical, diagnostic and personal care industries.

En la industria del cuidado personal, las proteasas se usan para crear péptidos que se añaden a una variedad de productos, para mejorar aspectos como la sensación, el brillo o la protección de la piel. Además, hay una nueva tendencia a la aplicación tópica directa de la proteasa. Muy similar al uso enzimático en la industria del cuero, el objetivo primordial en esta última aplicación es limpiar, eliminar el pelo y suavizar la piel. In the personal care industry, proteases are used to create peptides that are added to a variety of products, to improve aspects such as sensation, shine or skin protection. In addition, there is a new trend to the direct topical application of the protease. Very similar to the enzymatic use in the leather industry, the main objective in this last application is to clean, remove hair and soften the skin.

En la industria química y farmacéutica, las proteasas se están desarrollando como herramientas valiosas para producir ingredientes o intermedios costosos. En estas industrias, las proteasas no sólo se usan debido a su capacidad hidrolítica, sino también debido a su capacidad para sintetizar péptidos de aminoácidos naturales o no naturales. Esta última opción se demuestra claramente mediante la posibilidad de sintetizar aspartamo a partir de sus bloques constructores a base de aminoácidos usando una endoproteasa como termolisina. In the chemical and pharmaceutical industry, proteases are being developed as valuable tools to produce expensive ingredients or intermediates. In these industries, proteases are not only used because of their hydrolytic capacity, but also because of their ability to synthesize natural or non-natural amino acid peptides. This last option is clearly demonstrated by the possibility of synthesizing aspartame from its amino acid-based building blocks using an endoprotease such as thermolysin.

A diferencia de la situación en la industria alimentaria y de piensos, la estereo- y regioselectividad de las proteasas también se consideran ventajas importantes, aunque se pueden necesitar condiciones de reacción no habituales para lograr la transformación química deseada. Los ejemplos típicos de la aplicación de proteasas en esta industria incluyen el uso de endoproteasas, aminopeptidasas, así como carboxipeptidasas, en la producción de diversos intermedios para fármacos como insulina, antibióticos, renina, e inhibidores de ACE. En Industrial Biotransformations, A. Liese, K. Seelbach, C. Wandrey, Wiley-VCH; ISBN 3-527-30094-5 se presenta un repaso de tales usos. Unlike the situation in the food and feed industry, the stereo- and regioselectivity of proteases are also considered important advantages, although unusual reaction conditions may be required to achieve the desired chemical transformation. Typical examples of the application of proteases in this industry include the use of endoproteases, aminopeptidases, as well as carboxypeptidases, in the production of various intermediates for drugs such as insulin, antibiotics, renin, and ACE inhibitors. In Industrial Biotransformations, A. Liese, K. Seelbach, C. Wandrey, Wiley-VCH; ISBN 3-527-30094-5 presents a review of such uses.

A la vista de las especificidades deseadas, estereo- y regioselectividades, la ausencia de actividades secundarias y la resistencia a condiciones de reacción no habituales tales como concentraciones elevadas de disolventes, el comportamiento mejorado de la proteasa según la invención ofrece ventajas sustanciales. In view of the desired specificities, stereo- and regioselectivities, the absence of secondary activities and resistance to unusual reaction conditions such as high concentrations of solvents, the improved behavior of the protease according to the invention offers substantial advantages.

Desde un punto de vista farmacéutico, el papel de las proteasas se ilustra mediante un número sustancial de referencias en Martindale’s, “The Extra Pharmacopoeia” (Pharmaceutical Press, Londres, UK). Además, el papel importante de proteasas muy específicas a la hora de regular todo tipo de procesos biológicos se ilustra por el hecho de que muchas hormonas se convierten en activas sólo después del procesamiento de una molécula precursora, mayoritariamente inactiva, por tal proteasa muy específica. Los inhibidores activos frente a ciertas categorías de tales proteasas específicas se han visto implicados en el desarrollo de todo tipo de nuevos fármacos. Por lo tanto, ahora se pueden identificar inhibidores nuevos y eficaces para proteasa usando las secuencias proporcionadas aquí. From a pharmaceutical point of view, the role of proteases is illustrated by a substantial number of references in Martindale’s, “The Extra Pharmacopoeia” (Pharmaceutical Press, London, UK). In addition, the important role of very specific proteases in regulating all types of biological processes is illustrated by the fact that many hormones become active only after the processing of a precursor molecule, mostly inactive, by such a very specific protease. Active inhibitors against certain categories of such specific proteases have been implicated in the development of all kinds of new drugs. Therefore, new and effective protease inhibitors can now be identified using the sequences provided herein.

Tabla 1 Table 1

Número de SEC ID SEQ ID Number
Función de la proteína codificada Número EC Function of the encoded protein EC number

Gen Gen
ADNc Proteína CDNA  Protein

1 one
58 115 Pepsina A3 EC3.4.23.1 58 115 Pepsin A3 EC3.4.23.1

2 2
59 116 Metaloproteasa EC3.4.24.56 59 116 Metalloprotease EC3.4.24.56

3 3
60 117 Acilaminoacil-peptidasa EC3.4.19.1 60 117 Acylaminoacyl peptidase  EC3.4.19.1

4 4
61 118 Tripeptidilaminopeptidasa EC3.4.14. 61 118 Tripeptidylaminopeptidase EC3.4.14.

62 62
119 serina carboxipeptidasa EC3.4.16.6 119 serine carboxypeptidase EC3.4.16.6

6 6
63 120 Serina endoproteasa EC3.4.21. 63 120 Endoprotease serine EC3.4.21.

7 7
64 121 Carboxipeptidasa Y EC3.4.16.5 64 121 Carboxypeptidase Y EC3.4.16.5

8 8
65 122 aspergilopepsina II - hom EC3.4.23.19 65 122 aspergilopepsin II - hom EC3.4.23.19

9 9
66 123 Tripeptidil peptidasa EC3.4.14.9 66 123 Tripeptidyl peptidase EC3.4.14.9

67  67
124 Tripeptidil peptidase EC3.4.14.9 124 Tripeptidyl peptidase EC3.4.14.9

11 eleven
68 125 aspergilopepsina II – hom EC3.4.23.19 68 125 aspergilopepsin II - hom EC3.4.23.19

1212
69 126 Tripeptidil peptidasa EC3.4.14.9  69 126 Tripeptidyl peptidase EC3.4.14.9

1313
70 127 Metaloproteasa EC3.4.24.  70 127 Metalloprotease EC3.4.24.

1414
71 128 aspergilopepsina I EC3.4.23.18  71 128 aspergilopepsin I EC3.4.23.18

72  72
129 Pepsinógeno E EC3.4.23.25 129 Pepsinogen E EC3.4.23.25

16 16
73 130 aspergilopepsina I - hom EC3.4.23.18 73 130 aspergilopepsin I - hom EC3.4.23.18

1717
74 131 aspergilopepsina II EC3.4.23.19  74 131 aspergilopepsin II EC3.4.23.19

1818
75 132 Pyro-Glu peptidasa EC3.4.19.3  75 132 Pyro-Glu peptidase EC3.4.19.3

1919
76 133 dipeptidil peptidasa EC3.4.14.2  76 133 dipeptidyl peptidase EC3.4.14.2

77  77
134 aminopeptidasa secr. EC3.4.11.10 134 aminopeptidase secr. EC3.4.11.10

21twenty-one
78 135 D-peptidasa alcalina EC3.4.16.4  78 135 Alkaline D-peptidase EC3.4.16.4

2222
79 136 Carboxipeptidasa EC3.4.16.1  79 136 Carboxypeptidase EC3.4.16.1

232. 3
80 137 Carboxipeptidasa EC3.4.16.1  80 137 Carboxypeptidase EC3.4.16.1

24 24
81 138 Carboxipeptidasa-II EC3.4.16.1 81 138 Carboxypeptidase-II EC3.4.16.1

82  82
139 proteinasa aspártica EC3.4.23. 139 aspartic proteinase EC3.4.23.

2626
83 140 Tripeptidil peptidasa EC3.4.14.9  83 140 Tripeptidyl peptidase EC3.4.14.9

2727
84 141 Carboxipeptidasa EC3.4.16.1  84 141 Carboxypeptidase EC3.4.16.1

2828
85 142 cisteína proteinasa EC3.4.22.  85 142 cysteine proteinase EC3.4.22.

2929
86 143 Metalocarboxipeptidasa EC3.4.17.  86 143 Metallocarboxypeptidase EC3.4.17.

87 87
144 Subtilisina hom. EC3.4.21.62 144 Subtilisin hom. EC3.4.21.62

3131
88 145 Carboxipeptidasa Y EC3.4.16.5  88 145 Carboxypeptidase Y EC3.4.16.5

32 32
89 146 Metaloproteasa EC3.4.24. 89 146 Metalloprotease EC3.4.24.

33 33
90 147 Carboxipeptidasa Y EC3.4.16.5 90 147 Carboxypeptidase Y EC3.4.16.5

343. 4
91 148 Metaloproteasa EC3.4.24.  91 148 Metalloprotease EC3.4.24.

92 92
149 Tripeptidil peptidasa EC3.4.14.9 149 Tripeptidyl peptidase EC3.4.14.9

3636
93 150 proteasa aspártica EC3.4.23.24  93 150 aspartic protease EC3.4.23.24

3737
94 151 proteasa aspártica EC3.4.23.24  94 151 aspartic protease EC3.4.23.24

3838
95 152 Pepsina A3 EC3.4.23.1  95 152 Pepsin A3 EC3.4.23.1

3939
96 153 proteasa aspártica EC3.4.23.24  96 153 aspartic protease EC3.4.23.24

4040
97 154 proteasa aspártica EC3.4.23.24  97 154 aspartic protease EC3.4.23.24

4141
98 155 Kex EC3.4.21.61  98 155 Kex EC3.4.21.61

4242
99 156 Serina proteasa EC3.4.21.  99 156 Serine protease EC3.4.21.

4343
100 157 Glutamil endoproteasa EC3.4.21.82  100 157 Glutamyl endoprotease EC3.4.21.82

4444
101 158 Aspergilopepsina II - hom EC3.4.23.19  101 158 Aspergilopepsin II - hom EC3.4.23.19

45Four. Five
102 159 acilaminoacil-peptidasa EC3.4.19.1  102 159 acylaminoacyl peptidase EC3.4.19.1

4646
103 160 Tripeptidilaminopeptidasa EC3.4.14.  103 160 Tripeptidylaminopeptidase EC3.4.14.

4747
104 161 Serina carboxipeptidasa EC3.4.16.6  104 161 Serine Carboxypeptidase EC3.4.16.6

4848
105 162 Gly-X carboxipeptidasa EC3.4.17.4  105 162 Gly-X carboxypeptidase EC3.4.17.4

49 49
106 163 proteinasa aspártica EC3.4.23. 106 163 aspartic proteinase EC3.4.23.

50fifty
107 164 Tripeptidil peptidasa EC3.4.14.9  107 164 Tripeptidyl peptidase EC3.4.14.9

5151
108 165 Carboxipeptidasa-I EC3.4.16.1  108 165 Carboxypeptidase-I EC3.4.16.1

5252
109 166 serina carboxipeptidasa EC3.4.16.6  109 166 serine carboxypeptidase EC3.4.16.6

5353
110 167 serina carboxipeptidasa EC3.4.16.6  110 167 serine carboxypeptidase EC3.4.16.6

5454
111 168 aminopeptidasa secr. EC3.4.11.10  111 168 aminopeptidase secr. EC3.4.11.10

5555
112 169 Prolil endopeptidasa EC3.4.21.26  112 169 Prolil endopeptidase EC3.4.21.26

5656
113 170 Aspergilopepsina I - hom EC3.4.23.18  113 170 Aspergilopepsin I - hom EC3.4.23.18

5757
114 171 Aminopeptidasa EC 3.4.11.  114 171 Aminopeptidase EC 3.4.11.

EJEMPLOS EXAMPLES

Ejemplo 1 Example 1

Evaluación de la actividad proteolítica y especificidad Evaluation of proteolytic activity and specificity

5 La especificidad de la proteasa se puede explorar usando diversos sustratos peptídicos. Los sustratos sintéticos se usan ampliamente para detectar enzimas proteolíticas en la identificación, en la fermentación, durante el aislamiento, para estudiar la actividad enzimática, para determinar concentraciones enzimáticas, para investigar la especificidad, y para explorar las interacciones con los inhibidores. Para estudiar la actividad de la proteasa, preferiblemente se usan p-nitroanilidas peptídicas, ya que la actividad puede ser seguida de forma continua, y por lo tanto permite la 5 Protease specificity can be explored using various peptide substrates. Synthetic substrates are widely used to detect proteolytic enzymes in identification, in fermentation, during isolation, to study enzymatic activity, to determine enzymatic concentrations, to investigate specificity, and to explore interactions with inhibitors. To study the activity of the protease, preferably peptide p-nitroanilides are used, since the activity can be followed continuously, and therefore allows the

10 medida cinética. La escisión de p-nitroanilidas peptídicas puede ser seguida midiendo el incremento en la adsorción a 410 nm al liberar 4-nitroanilida. Los sustratos de paranitroanilida se usan generalmente para serina y cisteína proteasas. Además, se usan tioésteres peptídicos y derivados peptídicos de 7-amino-p-metilcumarina. Los tioésteres peptídicos son sustratos muy sensibles para serina y metaloproteasas, que presentan una velocidad de recambio relativamente elevada, puesto que el enlace de tioéster es más fácil de escindir que el enlace amídico. La escisión 10 kinetic measure. The cleavage of peptide p-nitroanilides can be followed by measuring the increase in adsorption at 410 nm by releasing 4-nitroanilide. Paranitroanilide substrates are generally used for serine and cysteine proteases. In addition, peptide thioesters and peptide derivatives of 7-amino-p-methylcoumarin are used. Peptide thioesters are very sensitive substrates for serine and metalloproteases, which have a relatively high turnover rate, since the thioester bond is easier to cleave than the amide bond. Cleavage

15 de los ésteres de tiol puede ser seguida con un reactivo tiólico tal como 4,4-ditiopiridina (324 nm) o ácido 5,5-ditiobis2-nitrobenzoico (405 nm). Habitualmente se observa la misma velocidad incrementada de recambio para la escisión de enlaces de éster con relación al enlace amídico. Los sustratos mejor conocidos para estudiar la actividad de esterasa de las proteasas son los derivados de p-nitrofenol. La liberación de p-nitrofenol se puede monitorizar a diferentes longitudes de onda, dependiendo del pH que se use, por ejemplo alrededor de pH neutro se usa una Thiol esters can be followed with a thiol reagent such as 4,4-dithiopyridine (324 nm) or 5,5-dithiobis2-nitrobenzoic acid (405 nm). Usually the same increased rate of turnover is observed for the cleavage of ester bonds relative to the amide bond. The best known substrates for studying esterase activity of proteases are those derived from p-nitrophenol. The release of p-nitrophenol can be monitored at different wavelengths, depending on the pH used, for example around neutral pH a

20 longitud de onda de 340 nm, mientras que, por encima de pH 9, la monitorización se realiza alrededor de 405 nm. Además, la hidrólisis de los ésteres también puede ser seguida mediante valoración usando equipo medidor del pH. En caso de la medida cualitativa de la actividad de esterasa, se pueden aplicar colorantes sensibles al pH. 20 wavelength of 340 nm, while, above pH 9, monitoring is performed around 405 nm. In addition, the hydrolysis of the esters can also be followed by titration using pH measuring equipment. In case of qualitative measurement of esterase activity, pH sensitive dyes can be applied.

Como alternativa, los péptidos se pueden unir a un grupo saliente fluorescente. La proteolisis está acompañada por un incremento en la fluorescencia cuando se monitoriza a las longitudes de onda apropiadas. Habitualmente se usan 25 peptidil 2-naftilamidas y peptidil 4-metil-7-cumarilamidas. La liberación de, por ejemplo, 7-amino-4-metilcumarina se Alternatively, the peptides can be attached to a fluorescent leaving group. Proteolysis is accompanied by an increase in fluorescence when monitored at the appropriate wavelengths. Usually 25 peptidyl 2-naphthylamides and peptidyl 4-methyl-7-coumarylamides are used. The release of, for example, 7-amino-4-methylcoumarin is

mide usando una longitud de onda de excitación de 350 nm, y una longitud de onda de emisión de 460 nm. El uso de 7-amino-4-trifluorometilcumarina tiene la ventaja de que el grupo saliente es tanto cromógeno (absorción 380 nm) como fluorógeno (excitación 400 nm, emisión 505 nm). Cuando es esencial que en ambos lados del enlace escindible esté presente un aminoácido, puede ser útil la introducción de un grupo que apague la fluorescencia. Las características generales de tales sustratos son que la secuencia peptídica separa un grupo donante fluorescente de un grupo aceptor, que actúa como el apagador de la fluorescencia. La escisión del enlace peptídico entre el grupo apagador y el fluoróforo conducirá a un incremento sustancial de la fluorescencia. Se han dado a conocer varios pares de donante-aceptor, incluyendo ácido o-aminobenzoico (Abz) como donante y 2,4-dinitrofenilo (Dnp) como aceptor, ácido 5-[(2’-aminoetil)-amino]naftalenosulfónico (EDANS) como donante y ácido 4-[[4’(dimetilamino]fenil]azo]-benzoico (DABCYL) como aceptor. El par Abz/EDDnp representa un par de donante-aceptor muy conveniente, puesto que, tras la hidrólisis total, la fluorescencia aumenta en un factor de 7 a 100, y el espectro de absorción de EDDnp no cambia con el pH. Además, la secuencia peptídica puede contener hasta 10 restos sin pérdida del efecto apagador. A medida que aumenta el tamaño de los péptidos que se conectan, la posición del enlace escindible puede hacerse menos específica. Por lo tanto, además de establecer si se produce la proteolisis, puede ser necesario un análisis adicional de los productos. Esto se puede hacer analizando y separando mediante HPLC los péptidos producidos, y determinando la secuencia de aminoácidos de los fragmentos. Además, la composición peptídica del digerido se puede analizar directamente usando una técnica combinada de HPLC/espectroscopía de masas. measured using an excitation wavelength of 350 nm, and an emission wavelength of 460 nm. The use of 7-amino-4-trifluoromethylcoumarin has the advantage that the leaving group is both chromogen (380 nm absorption) and fluorogen (400 nm excitation, 505 nm emission). When it is essential that an amino acid is present on both sides of the cleavable link, the introduction of a group that turns off the fluorescence may be useful. The general characteristics of such substrates are that the peptide sequence separates a fluorescent donor group from an acceptor group, which acts as the fluorescence quencher. The cleavage of the peptide bond between the quencher group and the fluorophore will lead to a substantial increase in fluorescence. Several donor-acceptor pairs have been disclosed, including o-aminobenzoic acid (Abz) as donor and 2,4-dinitrophenyl (Dnp) as acceptor, 5 - [(2'-aminoethyl) -amino] naphthalenesulfonic acid (EDANS) ) as a donor and 4 - [[4 '(dimethylamino] phenyl] azo] -benzoic acid (DABCYL) as an acceptor The Abz / EDDnp pair represents a very convenient donor-acceptor pair, since, after total hydrolysis, the Fluorescence increases by a factor of 7 to 100, and the absorption spectrum of EDDnp does not change with pH.In addition, the peptide sequence can contain up to 10 residues without loss of the quenching effect.As the size of the peptides increases connected, the position of the cleavable link can be made less specific, therefore, in addition to establishing whether proteolysis occurs, additional analysis of the products may be necessary, this can be done by analyzing and separating the produced peptides by HPLC, and determining amino acid sequence of the fragments In addition, the digested peptide composition can be directly analyzed using a combined HPLC / mass spectroscopy technique.

Para estudiar la especificidad de las proteasas, aparte de usar péptidos de secuencia definida, también se pueden usar librerías peptídicas sintéticas. Los péptidos se sintetizan mediante síntesis en fase sólida de manera al azar o semialeatoria. Por ejemplo, Meldal et al. (PNAS USA 91, 3314, 1994) dan a conocer la preparación de una familia de sustratos de proteasa partiendo de H-Lys(Abz)-resina, extendiendo la resina con péptidos hasta una longitud de seis aminoácidos, y finalmente acoplando Tyr(NO2) a los péptidos. Cada perla de resina tiene una secuencia única, y, al tratarla con las proteasas, las más susceptibles se hacen fluorescentes a medida que se libera el péptido que contiene Tyr(NO2). El análisis de secuencia de los péptidos en las susceptibles dará información sobre la información de la proteasa. To study the specificity of proteases, apart from using peptides of defined sequence, synthetic peptide libraries can also be used. Peptides are synthesized by solid phase synthesis in a random or semi-random manner. For example, Meldal et al. (PNAS USA 91, 3314, 1994) disclose the preparation of a family of protease substrates starting from H-Lys (Abz) -resin, extending the resin with peptides to a length of six amino acids, and finally coupling Tyr (NO2 ) to the peptides. Each resin bead has a unique sequence, and, when treated with proteases, the most susceptible become fluorescent as the Tyr-containing peptide (NO2) is released. Sequence analysis of the peptides in the susceptible ones will give information on the protease information.

La actividad de proteasa se expresa habitualmente en unidades. Generalmente, la unidad estándar internacional (UI) se define como la cantidad de enzima que, en condiciones definidas, transfiere un micromol de sustrato por minuto. Específicamente, con proteasas, la UI se referiría a la hidrólisis de un micromol de enlace peptídico por minuto. Sin embargo, en el caso de unidades de proteasa, las desviaciones de la definición internacional son más una regla que una excepción. Así como con los péptidos modelos, que se escinden específicamente en un enlace, el cálculo de las UI es directo, para sustratos proteinosos, en los que la proteasa puede escindir en diversas posiciones en diverso grado, se usan muchas definiciones de unidad que se desvía. Aparte de una definición de la unidad usada, cualquier experimento de hidrólisis requiere una descripción adecuada de las condiciones en las que se miden las unidades. Tales condiciones comprenden, por ejemplo, la concentración de sustrato, la relación enzima-sustrato, el pH y la temperatura. Los ensayos típicos para determinar la actividad específica de proteasas comprenden un sustrato proteinoso, tal como, por ejemplo, hemoglobina desnaturalizada, insulina o caseína. El sustrato polipeptídico es digerido por una proteasa en condiciones fijas durante un intervalo de tiempo fijo. Los polipéptidos sin digerir y grandes son precipitados con TCA, y el producto soluble en TCA se determina midiendo la absorbancia a 220 ó 280 nm, o valorando los péptidos solubles con el reactivo de folina, ninhidrina, fluro 2,4, dinitrobenceno/cloruro de dansilo, método de TNBS, o fluoresceína. En lugar de marcar el producto después de la hidrólisis, también se pueden usar sustratos polipeptídicos que ya están marcados por colorantes específicos o fluoróforos, tales como, por ejemplo, fluoresceína. Además, se pueden aplicar métodos estándar de análisis de aminoácidos usando analizadores estándar de laboratorio. A fin de obtener una idea de la distribución de tamaños de los péptidos generados por una proteasa, se pueden llevar a cabo experimentos de cromatografía en gel. Además de esto, se aplica HPLC usando técnicas de fase inversa, a fin de obtener una mejor resolución de los patrones peptídicos generados por la proteasa. El transcurso de la hidrólisis de los sustratos proteinosos se expresa habitualmente en grado de hidrólisis o DH. En el caso en el que se use la cifra de pH para seguir el transcurso de la hidrólisis, el DH se puede derivar a partir del consumo de base durante la hidrólisis (Enzymatic Hydrolysis of Food Protein, J. Adler-Nissen, 1986, Elsevier Apllied Science Publishers LTD). El DH está relacionado con diversas propiedades funcionales útiles del hidrolizado, tales como solubilidad, capacidad emulsionante, espumación y estabilidad de la espuma, expansión del batido, cualidad organoléptica. Además, el sabor es un aspecto importante de los hidrolizados de grado alimentario. El amargor puede ser un problema importante en hidrolizados proteicos. La terminación de la reacción de hidrólisis se puede realizar cambiando el pH, mediante inactivación térmica, agentes desnaturalizantes tales como SDS, acetonitrilo, etc. Protease activity is usually expressed in units. Generally, the international standard unit (IU) is defined as the amount of enzyme that, under defined conditions, transfers one micromol of substrate per minute. Specifically, with proteases, the UI would refer to the hydrolysis of one micromol peptide bond per minute. However, in the case of protease units, deviations from the international definition are more a rule than an exception. As with the model peptides, which are specifically cleaved in a bond, the calculation of the UIs is direct, for protein substrates, in which the protease can cleave at various positions in varying degrees, many definitions of deviating unit are used . Apart from a definition of the unit used, any hydrolysis experiment requires an adequate description of the conditions in which the units are measured. Such conditions comprise, for example, the substrate concentration, the enzyme-substrate ratio, the pH and the temperature. Typical assays to determine the specific activity of proteases comprise a protein substrate, such as, for example, denatured hemoglobin, insulin or casein. The polypeptide substrate is digested by a protease under fixed conditions for a fixed time interval. The undigested and large polypeptides are precipitated with TCA, and the TCA soluble product is determined by measuring the absorbance at 220 or 280 nm, or by assessing the soluble peptides with the folin reagent, ninhydrin, 2,4 fluro, dinitrobenzene / chloride dansyl, TNBS method, or fluorescein. Instead of marking the product after hydrolysis, polypeptide substrates that are already labeled by specific dyes or fluorophores, such as, for example, fluorescein, can also be used. In addition, standard amino acid analysis methods can be applied using standard laboratory analyzers. In order to get an idea of the size distribution of the peptides generated by a protease, gel chromatography experiments can be carried out. In addition to this, HPLC is applied using reverse phase techniques, in order to obtain a better resolution of the peptide patterns generated by the protease. The course of hydrolysis of protein substrates is usually expressed in degree of hydrolysis or DH. In the case where the pH figure is used to follow the course of hydrolysis, DH can be derived from the base consumption during hydrolysis (Enzymatic Hydrolysis of Food Protein, J. Adler-Nissen, 1986, Elsevier Apllied Science Publishers LTD). DH is related to various useful functional properties of the hydrolyzate, such as solubility, emulsifying capacity, foaming and foam stability, milkshake expansion, organoleptic quality. In addition, flavor is an important aspect of food grade hydrolysates. Bitterness can be a major problem in protein hydrolysates. The termination of the hydrolysis reaction can be accomplished by changing the pH, by thermal inactivation, denaturing agents such as SDS, acetonitrile, etc.

Los polipéptidos mostrados en la Tabla 1 se expresaron y se purificaron al menos parcialmente según procedimientos estándar conocidos en la técnica. Se analizaron según al menos uno de los métodos descritos anteriormente, y se encontró que tienen las actividades enunciadas en la Tabla 1. The polypeptides shown in Table 1 were expressed and purified at least partially according to standard procedures known in the art. They were analyzed according to at least one of the methods described above, and were found to have the activities listed in Table 1.

Ejemplo 2 Example 2

Determinación directa de la relación kcat/Km para sustratos de proteasa Direct determination of the kcat / Km ratio for protease substrates

Se pueden usar sustratos sintéticos para monitorizar la actividad enzimática durante la purificación, para determinar la concentración enzimática, para determinar las constantes de inhibición, o para investigar la especificidad del sustrato. La determinación de la relación kcat/Km da una medida de la especificidad del sustrato. Permite comparar la especificidad de diferentes sustratos por una enzima, o la comparación de las velocidades de hidrólisis con diferentes enzimas que escinden al mismo sustrato. Esta relación tiene una unidad de una constante de velocidad de segundo orden, y entonces se expresa como 1/(concentración.tiempo). Se considera que los sustratos que tienen una relación kcat/Km en el intervalo de 10,5-10,6 M-1.s-1 son muy buenos sustratos, es decir, tienen buena afinidad y un recambio rápido. Sin embargo, algunos sustratos pueden ser muy específicos con valores de kcat/Km en el intervalo de 10.4 M-1.s-1. Synthetic substrates can be used to monitor enzyme activity during purification, to determine enzyme concentration, to determine inhibition constants, or to investigate substrate specificity. The determination of the kcat / Km ratio gives a measure of the substrate specificity. It allows comparing the specificity of different substrates by an enzyme, or comparing the hydrolysis rates with different enzymes that cleave the same substrate. This relationship has a unit of a second order velocity constant, and is then expressed as 1 / (concentration.time). Substrates that have a kcat / Km ratio in the range of 10.5-10.6 M-1.s-1 are considered to be very good substrates, that is, they have good affinity and rapid turnover. However, some substrates can be very specific with values of kcat / Km in the range of 10.4 M-1.s-1.

La relación kcat/Km se puede calcular después de la determinación de los parámetros individuales. En ese caso, Km y Vm se pueden obtener a partir de diversas representaciones gráficas lineales (por ejemplo el método de Hanes o de Cornish-Bowden, o mediante un método de regresión no lineal. Sabiendo que Vm = kcat.Et (en la que Et es la concentración de enzima activa final), entonces kcat = Vm/Et. La determinación de la relación Kcat/Km por el método anterior se puede evitar cuando se produce la inhibición del producto o del sustrato, o cuando el sustrato precipita a concentración elevada. Sin embargo, es posible obtener un valor exacto de la relación kcat/Km trabajando en condiciones de primer orden, es decir, a una concentración de sustrato muy por debajo de la Km estimada. En estas condiciones, la ecuación de Michaelis-Menten: v = (Vm.S)/(Km + S) se convierte en: The ratio kcat / Km can be calculated after the determination of the individual parameters. In that case, Km and Vm can be obtained from various linear graphical representations (for example the Hanes or Cornish-Bowden method, or by a non-linear regression method. Knowing that Vm = kcat.Et (in which Et is the final active enzyme concentration), then kcat = Vm / Et. The determination of the Kcat / Km ratio by the above method can be avoided when product or substrate inhibition occurs, or when the substrate precipitates at concentration However, it is possible to obtain an exact value of the ratio kcat / Km working under first-order conditions, that is, at a substrate concentration well below the estimated km Under these conditions, the Michaelis-Menten equation : v = (Vm.S) / (Km + S) becomes:

v = (Vm.S)/Km puesto que S « Km v = (Vm.S) / Km since S «Km

o v = (Vm/Km).S = kobs. S = -dS/dt or v = (Vm / Km) .S = kobs. S = -dS / dt

que se integra como lnS = -kobs.t + lnSo, en la que So es la concentración de sustrato de partida y S es la concentración de sustrato en un tiempo dado. La velocidad es proporcional a la concentración de sustrato. En otras palabras, la hidrólisis del sustrato obedece a un proceso de primer orden, con kobs como la constante de velocidad de primer orden. kobs = Vm/Km = (kcat.Et)/Km puesto que Vm = kcat.Et. which is integrated as lnS = -kobs.t + lnSo, in which So is the starting substrate concentration and S is the substrate concentration at a given time. The speed is proportional to the substrate concentration. In other words, substrate hydrolysis is due to a first order process, with kobs as the first order rate constant. kobs = Vm / Km = (kcat.Et) / Km since Vm = kcat.Et.

Un registro continuo de la hidrólisis del sustrato permitirá la determinación de kobs a partir de la gráfica de lnS frente al tiempo. La relación kcat/Km se infiere simplemente a partir de kobs con tal de que se sepa la concentración de enzima activa: A continuous record of substrate hydrolysis will allow the determination of kobs from the graph of lnS versus time. The kcat / Km ratio is simply inferred from kobs as long as the concentration of active enzyme is known:

kcat/Km = kobs/Et kcat / Km = kobs / Et

Método de ensayo: usar una concentración de sustrato de partida muy por debajo de la Km estimada, y una concentración enzimática baja para permitir registrar la hidrólisis del sustrato. Se obtendrá una curva de primer orden para la generación del producto: Test method: use a starting substrate concentration well below the estimated Km, and a low enzymatic concentration to allow the hydrolysis of the substrate to be recorded. A first order curve will be obtained for product generation:

tras la hidrólisis total del sustrato, la absorbancia (o unidades de fluorescencia) del producto permitirá la determinación exacta de So, puesto que Pt = So. kobs se determina a partir de la pendiente de la gráfica de lnS frente al tiempo, o, como alternativa, usando un software de ajuste (Enzfitter, SigmaPlot…). After total substrate hydrolysis, the absorbance (or fluorescence units) of the product will allow the exact determination of So, since Pt = So. kobs is determined from the slope of the graph of lnS versus time, or, as alternative, using an adjustment software (Enzfitter, SigmaPlot…).

Nota: No se olvide de calcular la concentración de sustrato para cualquier tiempo dado a partir de la concentración del producto (S = So – P), puesto que la representación gráfica de P frente al tiempo no proporcionaría la kobs correcta (dP/dt = kobs.S no se integra de la misma manera). Note: Do not forget to calculate the substrate concentration for any given time from the product concentration (S = So - P), since the graphical representation of P versus time would not provide the correct kobs (dP / dt = kobs.S is not integrated in the same way).

Como alternativa, se puede medir t1/2 (semitiempo) sucesivo a partir de la curva de aparición del producto, puesto que en el proceso de primer orden: As an alternative, successive t1 / 2 (half time) can be measured from the product appearance curve, since in the first order process:

t1/2 = ln2/kobs = 0,693/kobs, entonces kobs = 0,693/t1/2 t1 / 2 = ln2 / kobs = 0.693 / kobs, then kobs = 0.693 / t1 / 2

El uso de este método permite comprobar que se tiene un decaimiento de primer orden verdadero (valores idénticos para los t1/2 sucesivos). Using this method allows verifying that there is a true first order decay (identical values for successive t1 / 2).

Ejemplo 3 Example 3

Inactivación de genes de proteasa en Aspergillus Inactivation of protease genes in Aspergillus

La forma más conveniente para inactivar genes de proteasa en el genoma de Aspergillus es la técnica de sustitución de genes (también denominada “ruptura génica de una etapa”). Los principios básicos de esta técnica se han descrito por Rothstein RJ en Meth. Enzymol. 101, p. 202, 1983. Esencialmente, la técnica se basa en la recombinación homóloga de fragmentos de ADN transformados con el ADN genómico de una célula fúngica. Vía cruzamiento doble, el gen a inactivar se sustituye (parcialmente) por el fragmento de ADN con el que se transforma la célula. Preferiblemente, el fragmento de ADN transformado contiene un gen marcador seleccionable para Aspergillus niger. Básicamente, la manipulación de ADN y la generación de un constructo de inactivación se realizan The most convenient way to inactivate protease genes in the Aspergillus genome is the gene replacement technique (also called “one-stage gene breakdown”). The basic principles of this technique have been described by Rothstein RJ in Meth. Enzymol 101, p. 202, 1983. Essentially, the technique is based on homologous recombination of DNA fragments transformed with the genomic DNA of a fungal cell. Via double crossing, the gene to be inactivated is replaced (partially) by the DNA fragment with which the cell is transformed. Preferably, the transformed DNA fragment contains a selectable marker gene for Aspergillus niger. Basically, DNA manipulation and the generation of an inactivation construct are performed

usando técnicas generales de biología molecular. En primer lugar, se aísla ADN genómico de la cepa de Aspergillus niger, que se usa más tarde para la inactivación del gen de la proteasa. El ADN genómico de A. niger se puede aislar por cualquiera de las técnicas descritas, por ejemplo mediante el método descrito por de Graaff et al. (1988) Curr. Genet. 13, 315-321, y conocidas por la persona experta en la técnica. Este ADN genómico se usa como molde para la amplificación de las regiones de flanqueo del gen de proteasa, usando la reacción en cadena de la polimerasa (PCR; Sambrook et al. (1989) Molecular cloning, a laboratory manual, 2ª edición, Cold Spring Harbor Laboratory Press, New York). Con regiones de flanqueo se quiere decir aquí las regiones no codificantes en dirección 5’ y en dirección 3’ del gen de proteasa que se inactivarán. Preferiblemente, las regiones de flanqueo deberían tener cada una más de 1,0 kb de longitud. using general molecular biology techniques. First, genomic DNA from the Aspergillus niger strain is isolated, which is later used for inactivation of the protease gene. The genomic DNA of A. niger can be isolated by any of the techniques described, for example by the method described by de Graaff et al. (1988) Curr. Genet 13, 315-321, and known to the person skilled in the art. This genomic DNA is used as a template for amplification of flanking regions of the protease gene, using the polymerase chain reaction (PCR; Sambrook et al. (1989) Molecular cloning, a laboratory manual, 2nd edition, Cold Spring Harbor Laboratory Press, New York). By flanking regions it is meant here the non-coding regions in the 5 ’and 3 ′ direction of the protease gene that will be inactivated. Preferably, the flanking regions should each be more than 1.0 kb in length.

Para el cebado de la amplificación mediante PCR de cada región de flanqueo, se usan dos oligonucleótidos de ADN monocatenario. Para la región de flanqueo de 5’, un cebador es homólogo a una secuencia de ADN en dirección 5’ del comienzo de la secuencia codificante del gen de proteasa. Preferiblemente, la región homóloga está situada más de 1,0 kb en dirección 5’ del sitio de comienzo de la traducción. El segundo cebador es homólogo a la secuencia de ADN complementaria e inversa situada inmediatamente en dirección 5’ de la secuencia codificante del gen de proteasa. For priming the PCR amplification of each flanking region, two single stranded DNA oligonucleotides are used. For the 5 ’flank region, a primer is homologous to a 5 ′ DNA sequence from the beginning of the protease gene coding sequence. Preferably, the homologous region is located more than 1.0 kb in the 5 ’direction of the translation start site. The second primer is homologous to the complementary and reverse DNA sequence located immediately in the 5 ′ direction of the protease gene coding sequence.

Para la región de flanqueo de 3’, un cebador es homólogo a la secuencia de ADN inmediatamente en dirección 3’ de la secuencia codificante del gen de proteasa. El segundo cebador es homólogo a una secuencia de ADN complementaria e inversa situada preferiblemente más de 1,0 kb en dirección 3’ de la secuencia codificante del gen de proteasa. For the 3 ’flanking region, a primer is homologous to the DNA sequence immediately in the 3 ′ direction of the protease gene coding sequence. The second primer is homologous to a complementary and inverse DNA sequence preferably located more than 1.0 kb in the 3 ′ direction of the protease gene coding sequence.

La secuencia de ADN incluida en todos los cebadores y homóloga al genoma de A. niger debería tener como mínimo una longitud de 15 nucleótidos, preferiblemente una longitud de más de 18 nucleótidos. De forma más conveniente, todos los cebadores deberían contener una secuencia de ADN que codifica el sitio de reconocimiento de enzimas de restricción adecuadas en dirección 5’ de la secuencia que es homóloga al genoma de A. niger. Estos sitios de reconocimiento adicionales facilitan el proceso de clonación. The DNA sequence included in all primers and homologous to the A. niger genome should be at least 15 nucleotides in length, preferably more than 18 nucleotides in length. More conveniently, all primers should contain a DNA sequence encoding the appropriate restriction enzyme recognition site in the 5 ′ direction of the sequence that is homologous to the A. niger genome. These additional recognition sites facilitate the cloning process.

Ambos cebadores y el ADN genómico de A. niger se usan en una reacción de PCR en condiciones conocidas por los expertos en la técnica. La temperatura de hibridación de los cebadores se puede calcular a partir de la parte de la secuencia de ADN que es homóloga al genoma de A. niger. Ambos fragmentos que contienen la región de flanqueo de 5’ y la región de flanqueo de 3’ se clonaron en un vector que se puede propagar en E. coli usando técnicas generales de biología molecular. Entonces se clona entre las dos regiones de flanqueo un gen que se puede usar como marcador de selección en Aspergillus niger. Más convenientemente, el gen marcador está bajo el control de un promotor que se expresa en A. niger, preferiblemente un promotor de A. niger endógeno. La orientación de la inserción del gen marcador es preferiblemente en la misma dirección que el gen de proteasa original. El fragmento de inactivación final contiene la región de flanqueo de 5’, un gen marcador de selección preferiblemente bajo el control de un promotor endógeno de A. niger, y la región de flanqueo de 3’, todo en esta dirección y orientación. El ADN del constructo final se clona en un vector, que se puede propagar en E. coli. Both primers and A. niger genomic DNA are used in a PCR reaction under conditions known to those skilled in the art. The hybridization temperature of the primers can be calculated from the part of the DNA sequence that is homologous to the A. niger genome. Both fragments containing the 5 ’flank region and the 3 ′ flank region were cloned into a vector that can be propagated in E. coli using general molecular biology techniques. A gene that can be used as a selection marker in Aspergillus niger is then cloned between the two flanking regions. More conveniently, the marker gene is under the control of a promoter that is expressed in A. niger, preferably an endogenous A. niger promoter. The orientation of the insertion of the marker gene is preferably in the same direction as the original protease gene. The final inactivation fragment contains the 5 ’flank region, a selection marker gene preferably under the control of an endogenous A. niger promoter, and the 3 ′ flank region, all in this direction and orientation. The DNA of the final construct is cloned into a vector, which can be propagated in E. coli.

El constructo de inactivación se digiere con enzimas de restricción adecuadas, para eliminar las secuencias del vector de E. coli, y el fragmento de inactivación se aísla usando técnicas estándar (Sambrook et al. (1989) Molecular cloning, a laboratory manual, 2ª edición, Cold Spring Harbor Laboratory Press, New York). Finalmente, Aspergillus niger se transforma con el fragmento de inactivación usando un método descrito en la bibliografía, por ejemplo mediante el método descrito por Kusters-van Someren et al. (1991) Curr. Genet. 20, 293-299. Las células transformadas se seleccionan cultivando en placas la mezcla de transformación sobre placas de agar que son selectivas para el crecimiento de cepas de Aspergillus niger que expresan el gen marcador. Tras la purificación de las cepas de Aspergillus transformadas mediante cultivo en placas por réplicas, se analiza un número representativo de cepas mediante transferencia Southern usando métodos estándar (Sambrook et al. (1989) Molecular cloning, a laboratory manual, 2ª edición, Cold Spring Harbor Laboratory Press, New York). Por lo tanto, el ADN genómico de micelio de cepas transformadas se aísla y se digiere con enzimas de restricción adecuadas. Los fragmentos de restricción se separan usando electroforesis en gel de agarosa, se transfieren a membranas de microcelulosa y se sondan con un fragmento marcado del gen marcador. La hibridación y el lavado se realizan en condiciones restrictivas. Las cepas que contienen fragmentos de restricción marcados de la longitud correcta se consideran correctas. The inactivation construct is digested with suitable restriction enzymes, to eliminate the sequences of the E. coli vector, and the inactivation fragment is isolated using standard techniques (Sambrook et al. (1989) Molecular cloning, a laboratory manual, 2nd edition , Cold Spring Harbor Laboratory Press, New York). Finally, Aspergillus niger is transformed with the inactivation fragment using a method described in the literature, for example by the method described by Kusters-van Someren et al. (1991) Curr. Genet 20, 293-299. Transformed cells are selected by plating the transformation mixture on agar plates that are selective for the growth of Aspergillus niger strains that express the marker gene. After purification of the Aspergillus strains transformed by plaque culture by replicas, a representative number of strains are analyzed by Southern blotting using standard methods (Sambrook et al. (1989) Molecular cloning, a laboratory manual, 2nd edition, Cold Spring Harbor Laboratory Press, New York). Therefore, the mycelium genomic DNA of transformed strains is isolated and digested with suitable restriction enzymes. Restriction fragments are separated using agarose gel electrophoresis, transferred to microcellulose membranes and probed with a labeled fragment of the marker gene. Hybridization and washing are performed under restrictive conditions. Strains containing marked restriction fragments of the correct length are considered correct.

Usando este método, se pueden seleccionar cepas de A. niger con un gen de proteasa inactivado de elección. Using this method, strains of A. niger can be selected with an inactivated protease gene of choice.

Ejemplo 4 Example 4

Aislamiento de proteasas mediante cromatografía de intercambio iónico Protease isolation by ion exchange chromatography

Pequeñas cantidades de la proteasa codificada por la secuencia nucleotídica según se proporciona aquí se obtienen construyendo un plásmido de expresión que contiene la secuencia de ADN relevante, transformando una cepa de A. niger con este plásmido, y haciendo crecer la cepa de A. niger en un medio adecuado. Tras recoger el caldo libre de células contaminantes, se puede purificar la proteasa buscada. Small amounts of the protease encoded by the nucleotide sequence as provided herein are obtained by constructing an expression plasmid containing the relevant DNA sequence, transforming a strain of A. niger with this plasmid, and growing the strain of A. niger into A suitable medium. After collecting the free broth from contaminating cells, the desired protease can be purified.

Para aislar la proteasa según es codificada por la secuencia nucleotídica proporcionada en una forma esencialmente pura, se pueden seguir varias estrategias. Todas estas estrategias se han descrito adecuadamente en la bibliografía científica pertinente (véase, por ejemplo, el Protein Purification Handbook, 18-1132-29 Edición AA según se publica por Amersham Pharmacia Biotech, Uppsala, Suecia). Más abajo se proporciona aquí un procedimiento que es aplicable para purificar proteasas a partir de mezclas complejas. Es esencial que exista un ensayo adecuado que sea selectivo con respecto a las características enzimáticas buscadas. Para proteasas, típicamente se usa un sustrato peptídico cromogénico sintético como se describe en el Ejemplo 1. Tales sustratos peptídicos pueden ser selectivos con respecto a endoproteasas, carboxipeptidasas, aminopeptidasas u omega peptidasas. En el Ejemplo 11 se describe la selectividad con respecto a una tripeptidil peptidasa específica. Eligiendo los restos de aminoácidos correctos en el péptido sintético relevante, se pueden seleccionar proteasas con la especificidad deseada. To isolate the protease as encoded by the nucleotide sequence provided in an essentially pure form, several strategies can be followed. All of these strategies have been adequately described in the relevant scientific literature (see, for example, the Protein Purification Handbook, 18-1132-29 Edition AA as published by Amersham Pharmacia Biotech, Uppsala, Sweden). Below is provided a procedure that is applicable to purify proteases from complex mixtures. It is essential that there is a suitable assay that is selective with respect to the enzymatic characteristics sought. For proteases, a synthetic chromogenic peptide substrate is typically used as described in Example 1. Such peptide substrates may be selective with respect to endoproteases, carboxypeptidases, aminopeptidases or omega peptidases. Example 11 describes the selectivity with respect to a specific tripeptidyl peptidase. By choosing the correct amino acid residues in the relevant synthetic peptide, proteases with the desired specificity can be selected.

En primer lugar, se debería determinar si la proteasa es excretada al medio, dependiendo del sistema de expresión elegido para producir la proteasa, puede ser excretada o estar contenida en la célula. Si la proteasa es excretada al medio de fermentación, las células productoras o fragmentos de estas células se han de eliminar mediante centrifugación o filtración, y el medio claro o aclarado resultante es el punto de partida para la purificación posterior. En aquellos casos en los que la proteasa buscada no es excretada, las células productoras se han de destruir para permitir la purificación de la proteasa. En tales casos, la masa celular recogida se tritura mejor con un abrasivo, se muele con perlas, se somete a ultrasonidos, o se somete a una prensa francesa o a un homogeneizador de Manton-Gaulin, y después se filtra o se centrifuga. En el caso en el que la proteasa sea hidrófoba o esté unida a membrana, puede ser necesaria la adición de un detergente no iónico para solubilizar la proteasa antes de la etapa de filtración First, it should be determined if the protease is excreted in the medium, depending on the expression system chosen to produce the protease, it can be excreted or contained in the cell. If the protease is excreted to the fermentation medium, the producing cells or fragments of these cells must be removed by centrifugation or filtration, and the resulting clear or clarified medium is the starting point for further purification. In those cases in which the sought protease is not excreted, the producing cells must be destroyed to allow purification of the protease. In such cases, the collected cell mass is best crushed with an abrasive, ground with beads, subjected to ultrasound, or subjected to a French press or a Manton-Gaulin homogenizer, and then filtered or centrifuged. In the case where the protease is hydrophobic or membrane bound, the addition of a non-ionic detergent may be necessary to solubilize the protease before the filtration step

o centrifugación. or centrifugation.

Tras la etapa de la clarificación, se puede aplicar una estrategia de purificación de tres fases, para obtener las proteasas desconocidas en un estado esencialmente puro. En todas o algunas de estas tres fases, puede ser necesaria la adición de un detergente. After the clarification stage, a three-phase purification strategy can be applied to obtain the unknown proteases in an essentially pure state. In all or some of these three phases, the addition of a detergent may be necessary.

En la fase primera o de captura, la proteasa diana se aísla, se purifica parcialmente y se concentra. Durante la fase de purificación intermedia subsiguiente, se elimina la mayoría de las impurezas voluminosas, y, en la fase de pulido final, se eliminan cantidades en trazas de impurezas que quedan de cantidades más grandes de sustancias estrechamente relacionadas, y la enzima se disuelve en el tampón deseado. Dependiendo de la naturaleza y de las propiedades físicas de la proteasa disponible, la persona experta en la técnica es capaz de optimizar las tres fases usando versiones ligeramente modificadas de los diferentes materiales de unión a proteínas, y aplicar éstas en condiciones en cierta manera cambiadas. Sin embargo, en todos los casos es indispensable un ensayo analítico selectivo, ya que permitirá la monitorización continua de la actividad proteolítica cada vez más purificada. Los ensayos analíticos adecuados para el fin incluyen el uso de sustratos peptídicos cromógenos como se ha mencionado anteriormente. In the first or capture phase, the target protease is isolated, partially purified and concentrated. During the subsequent intermediate purification phase, most of the bulky impurities are removed, and, in the final polishing phase, trace amounts of impurities that are left of larger quantities of closely related substances are removed, and the enzyme is dissolved in The desired buffer. Depending on the nature and physical properties of the protease available, the person skilled in the art is able to optimize the three phases using slightly modified versions of the different protein binding materials, and apply these in somewhat changed conditions. However, in all cases a selective analytical test is indispensable, since it will allow continuous monitoring of the increasingly purified proteolytic activity. Analytical assays suitable for the purpose include the use of chromogenic peptide substrates as mentioned above.

En la primera fase de captura de la purificación, preferiblemente se usa una potente resina de intercambio iónico de tipo aniónico para aplicar el medio que contiene la enzima clarificada y desalada. Para garantizar la unión de la actividad proteolítica deseada a la resina, se ensayan tres o cuatro valores de pH diferentes de medio y de resina, en condiciones de baja conductividad. En estos ensayos, la resina se equilibra siempre con un tampón del mismo valor de pH y conductividad que el medio que contiene la enzima. El medio se aplica entonces a la columna en condiciones de pH las cuales han demostrado que permiten la unión adecuada de la proteasa a la resina, es decir, no se puede detectar actividad enzimática deseada en el medio que ha pasado a través. Subsiguientemente, la actividad enzimática deseada se eluye de la resina de intercambio iónico usando un gradiente salino continuo que comienza con el tampón de equilibrado de la resina y termina con este tampón al que se ha añadido 1 mol/litro de NaCl. Las fracciones eluidas que contienen la actividad deseada según el ensayo se reúnen y entonces se preparan para una etapa de purificación adicional. Esta etapa de purificación adicional depende de la pureza de la enzima deseada en la fracción reunida: si es casi pura, una etapa de filtración en gel adicional demostrará ser adecuada. Si no es casi pura, se aplica cromatografía sobre una resina de interacción hidrófoba, seguido de una etapa de filtración en gel. In the first phase of capturing the purification, a powerful anionic ion exchange resin is preferably used to apply the medium containing the clarified and desalted enzyme. To ensure the union of the desired proteolytic activity to the resin, three or four different pH values of medium and resin are tested, under conditions of low conductivity. In these tests, the resin is always equilibrated with a buffer of the same pH and conductivity value as the medium containing the enzyme. The medium is then applied to the column under pH conditions which have been shown to allow adequate binding of the protease to the resin, that is, no desired enzymatic activity can be detected in the medium that has passed through. Subsequently, the desired enzymatic activity is eluted from the ion exchange resin using a continuous salt gradient that begins with the resin equilibration buffer and ends with this buffer to which 1 mol / liter of NaCl has been added. The eluted fractions containing the desired activity according to the assay are combined and then prepared for an additional purification step. This additional purification stage depends on the purity of the desired enzyme in the pooled fraction: if it is almost pure, an additional gel filtration stage will prove to be adequate. If it is not almost pure, chromatography is applied on a hydrophobic interaction resin, followed by a gel filtration step.

La cromatografía sobre una resina de interacción hidrófoba se lleva a cabo incrementando en primer lugar el contenido salino de la fracción reunida obtenida de la resina de intercambio iónico hasta 4 moles/litro de NaCl, y eliminando cualquier precipitado formado. Si la fracción clara resultante no contiene la actividad deseada, esta actividad está presente obviamente en el precipitado, y se puede recuperar en un estado esencialmente puro. Si la fracción clara resultante todavía muestra en el ensayo la actividad deseada, entonces el líquido se aplica como tal a una resina fenílica de sepharose (Pharmacia), equilibrada en este tampón con gran concentración salina con un pH y conductividad idénticos. Si la actividad enzimática deseada se une a la resina fenílica de sepharose, la actividad se eluye con un gradiente continuo de contenido decreciente de sal, seguido de un lavado libre de sal y, si es necesario, con un agente caotrópico. Como antes, aquellas fracciones procedentes del gradiente que presentan actividad en el ensayo se reúnen y se someten finalmente a una etapa de filtración en gel. Si la actividad enzimática deseada no se une a la resina fenílica de sepharose, lo harán muchos de los contaminantes, de manera que la actividad proteolítica deseada según está presente en el volumen vacío de la columna requiere sólo una etapa de ultrafiltración adicional para obtener la actividad en una forma más concentrada antes de aplicarla a la columna de Chromatography on a hydrophobic interaction resin is carried out by first increasing the salt content of the pooled fraction obtained from the ion exchange resin to 4 moles / liter of NaCl, and eliminating any precipitate formed. If the resulting clear fraction does not contain the desired activity, this activity is obviously present in the precipitate, and can be recovered in an essentially pure state. If the resulting clear fraction still shows the desired activity in the test, then the liquid is applied as such to a phenyl resin of sepharose (Pharmacia), equilibrated in this buffer with high saline concentration with an identical pH and conductivity. If the desired enzyme activity binds to the sepharose phenyl resin, the activity is eluted with a continuous gradient of decreasing salt content, followed by a salt-free wash and, if necessary, with a chaotropic agent. As before, those fractions from the gradient that show activity in the assay are combined and finally subjected to a gel filtration step. If the desired enzymatic activity does not bind to the sepharose phenyl resin, many of the contaminants will do so, so that the desired proteolytic activity as present in the empty volume of the column requires only one additional ultrafiltration step to obtain the activity. in a more concentrated way before applying it to the column of

filtración en gel. La columna de filtración en gel no sólo elimina contaminaciones en trazas, sino también lleva a la enzima al tampón, lo que es necesario por uso subsiguiente. gel filtration The gel filtration column not only removes trace contamination, but also takes the enzyme to the buffer, which is necessary for subsequent use.

Aunque este método es aplicable generalmente para el aislamiento y purificación de proteasas según la invención, en el Ejemplo 4 se describe una técnica de aislamiento más específica. En ese ejemplo se describe el aislamiento 5 de una proteasa de Aspergillus usando bacitracina inmovilizada, un antibiótico peptídico conocido por su interacción selectiva con diversos tipos de proteasas. Although this method is generally applicable for the isolation and purification of proteases according to the invention, a more specific isolation technique is described in Example 4. In that example, the isolation of an Aspergillus protease using immobilized bacitracin, a peptide antibiotic known for its selective interaction with various types of proteases, is described.

Ejemplo 5 Example 5

Aislamiento de proteasas mediante cromatografía de afinidad Protease isolation by affinity chromatography

Un método alternativo para purificar pequeñas cantidades de proteasa es mediante cromatografía de afinidad. Para An alternative method to purify small amounts of protease is by affinity chromatography. For

10 obtener la proteasa en forma purificada, se hizo crecer un cultivo de 100 mililitros en un matraz de agitación bien aireado. Tras la centrifugación para eliminar cualquier materia no soluble, el sobrenadante se aplicó a una columna de bacitracina-sepharose de 40 mililitros, equilibrada con 0,05 moles/litro de acetato de sodio pH 5,0. Las proteasas unidas a la columna se eluyeron usando el tampón de acetato suplementado con 1 mol/litro de NaCl y 10% (v/v) de isopropanol (J. Appl. Biochem., 1983 p. 420-428). Las fracciones activas se recogieron, se dializaron frente a agua 10 to obtain the protease in purified form, a 100 milliliter culture was grown in a well aerated shake flask. After centrifugation to remove any non-soluble matter, the supernatant was applied to a 40 milliliter bacitracin-sepharose column, equilibrated with 0.05 mol / liter of sodium acetate pH 5.0. Column bound proteases were eluted using acetate buffer supplemented with 1 mol / liter of NaCl and 10% (v / v) of isopropanol (J. Appl. Biochem., 1983 p. 420-428). The active fractions were collected, dialyzed against water

15 destilada y se aplicaron a una columna de bacitracina-sepharose de 20 mililitros, nuevamente equilibrada con tampón de acetato. Como antes, la elución se llevó a cabo usando el tampón de acetato suplementado con NaCl e isopropanol. Las fracciones activas, es decir, las fracciones que presentan las actividades buscadas, se recogieron, se dializaron frente a tampón de acetato 5 milimoles/litro pH 5,0, y después se concentraron por medio de ultrafiltración con una membrana Amicon PM-10. Para obtener la proteasa en un estado esencialmente puro, el 15 distilled and applied to a 20 milliliter bacitracin-sepharose column, again equilibrated with acetate buffer. As before, elution was carried out using the acetate buffer supplemented with NaCl and isopropanol. The active fractions, that is, the fractions exhibiting the activities sought, were collected, dialyzed against 5 mmol / L acetate buffer pH 5.0, and then concentrated by means of ultrafiltration with an Amicon PM-10 membrane. To obtain the protease in an essentially pure state, the

20 líquido concentrado se cromatografió sobre una columna Superdex 75, equilibrada con el tampón de acetato de sodio 0,05 moles/litro pH 5,0 y suplementada con 0,5 moles/litro de NaCl. The concentrated liquid was chromatographed on a Superdex 75 column, equilibrated with the sodium acetate buffer 0.05 mol / liter pH 5.0 and supplemented with 0.5 mol / liter NaCl.

Experimentos adicionales llevados a cabo con la enzima purificada en PAGE pueden confirmar si el peso molecular está en línea con lo que se puede esperar basándose en los datos de secuencia disponibles. La confirmación final se puede obtener llevando a cabo un análisis parcial de aminoácidos N-terminales. Additional experiments carried out with the enzyme purified on PAGE can confirm if the molecular weight is in line with what can be expected based on the available sequence data. Final confirmation can be obtained by carrying out a partial analysis of N-terminal amino acids.

25 Ejemplo 6 25 Example 6

Propiedades de una nueva cisteína proteasa procedente de A. niger Properties of a new cysteine protease from A. niger

En este ejemplo se clonó el gen nr 28 de Aspergillus, y se sobreexpresó en A. niger como se describe anteriormente. La enzima obtenida se purificó según procedimientos descritos en el Ejemplo 4, y se usó para destruir la actividad inhibidora de tripsina de las habas de soja en diversas condiciones. Como materiales de In this example, the Aspergillus nr 28 gene was cloned, and overexpressed in A. niger as described above. The enzyme obtained was purified according to procedures described in Example 4, and was used to destroy the trypsin inhibitory activity of soy beans under various conditions. As materials of

30 referencia, se usaron papaína y bromelaína. La bromelaína se obtuvo de Sigma, y la papaína se obtuvo de DSM Food Specialties Business Unit Beverage Ingredients, PO Box 1, 2600 MA Delft, Países Bajos. 30 reference, papain and bromelain were used. Bromelain was obtained from Sigma, and papain was obtained from DSM Food Specialties Business Unit Beverage Ingredients, PO Box 1, 2600 MA Delft, The Netherlands.

La inhibición de la tripsina se midió según el método de Kakade, M.L., Rackis, J.J., McGhee, J.E. y Puski, G. (1974): Trypsin inhibition was measured according to the method of Kakade, M.L., Rackis, J.J., McGhee, J.E. and Puski, G. (1974):

J. Cereal Chemistry 51: 376-382. La degradación del sustrato N-benzoil-L-arginina-p-nitroanilina a N-benzoil-Larginina y p-nitroanilina se tomó como una medida de la actividad de tripsina. La tripsina se obtuvo de British Drug J. Cereal Chemistry 51: 376-382. The degradation of the substrate N-benzoyl-L-arginine-p-nitroaniline to N-benzoyl-Larginine and p-nitroaniline was taken as a measure of trypsin activity. Trypsin was obtained from British Drug

35 Houses Ltd., y derivó de páncreas de vaca que contiene más de 0,54 unidades Anson por gramo de producto. El inhibidor Kunitz para habas de soja también se obtuvo de Sigma. 35 Houses Ltd., and derived from cow pancreas containing more than 0.54 Anson units per gram of product. Kunitz inhibitor for soya beans was also obtained from Sigma.

El inhibidor de tripsina se preincubó a una concentración de 2 mg/ml con las enzimas de cisteína proteasa mencionadas anteriormente, a pH 3, en tampón de acetato de sodio 50 mM, antes de medir la inhibición de la tripsina. Las enzimas se añadieron a una relación de proteína enzimática a inhibidor de tripsina de 1:100 (p/p). La The trypsin inhibitor was pre-incubated at a concentration of 2 mg / ml with the cysteine protease enzymes mentioned above, at pH 3, in 50 mM sodium acetate buffer, before measuring trypsin inhibition. Enzymes were added at an enzyme protein to trypsin inhibitor ratio of 1: 100 (w / w). The

40 albúmina sirvió como control negativo para las enzimas. La actividad de tripsina que queda se midió tras la incubación durante 3 horas a 37ºC. Los resultados se muestran en la Tabla 2. 40 albumin served as a negative control for enzymes. The remaining trypsin activity was measured after incubation for 3 hours at 37 ° C. Results are shown in table 2.

Tabla 2. Efectos de diversas cisteína proteasas sobre la inactivación enzimática del inhibidor de tripsina de tipo Kunitz procedente de habas de soja. Table 2. Effects of various cysteine proteases on the enzymatic inactivation of the Kunitz-type trypsin inhibitor from soybeans.

1 one
2 3 4 5 2 3 4 5

Enzima ensayada Enzyme tested
Actividad de TI que queda (%) Actividad de TI que queda tras el tratamiento con pepsina Actividad de TI que queda tras el tratamiento térmico a 75ºC Actividad de TI que queda tras el tratamiento térmico a 90ºC IT activity remaining (%) IT activity that remains after pepsin treatment IT activity left after heat treatment at 75 ° C IT activity left after heat treatment at 90 ° C

PapaínaPapain
25 55 78 95  25 55 78 95

BromelaínaBromelain
30 62 86 99  30 62 86 99

A. niger A. niger
26 26 28 35 26  26 28 35

Albúmina (control) Albumin (control)
100 100 100 100 100 100 100 100

TI: Actividad del inhibidor de tripsina TI: Trypsin inhibitor activity

Los experimentos se repitieron en presencia de pepsina durante la preincubación de las cisteína proteasas con el inhibidor de tripsina. La pepsina se añadió a una concentración final de 1,3 mg/ml. Los resultados se muestran en la columna 3. Experiments were repeated in the presence of pepsin during preincubation of cysteine proteases with the trypsin inhibitor. Pepsin was added at a final concentration of 1.3 mg / ml. The results are shown in column 3.

5 Se llevó a cabo otra serie de experimentos para comprobar la estabilidad térmica. Las cisteína proteasas se incubaron a 75 y 90ºC durante 5 minutos antes de añadir estas enzimas a la preincubación con los inhibidores de tripsina. Los resultados se muestran en las columnas 4 y 5. 5 Another series of experiments was carried out to check thermal stability. The cysteine proteases were incubated at 75 and 90 ° C for 5 minutes before adding these enzymes to preincubation with trypsin inhibitors. The results are shown in columns 4 and 5.

Estos resultados demuestran claramente la actividad superior de estas nuevas cisteína proteasas procedentes de Aspergillus niger con respecto a las cisteína proteasas actualmente disponibles para la inactivación de inhibidores de These results clearly demonstrate the superior activity of these new cysteine proteases from Aspergillus niger with respect to the currently available cysteine proteases for the inactivation of inhibitors of

10 tripsina en pienso para animales. 10 trypsin in animal feed.

Ejemplo 7 Example 7

Exopeptidasas que promueven la maduración del queso y el sabor del queso Exopeptidases that promote cheese maturation and cheese flavor

Las aminopeptidasas codificadas por los genes nr 20 y 54 (véase la Tabla 1) se sobreexpresaron en A. niger según métodos descritos anteriormente. La purificación de estas enzimas se llevó a cabo según procedimientos como se 15 describe en el Ejemplo 4. La actividad de las muestras enzimáticas purificadas se determinó a pH 7,2 en un tampón acuoso de fosfato (50 mM) que contiene el derivado de para-nitroanilida de un número de aminoácidos hidrófobos (3 mM) como sustrato. La conversión del sustrato por la aminopeptidasa se determinó monitorizando el cambio en la densidad óptica a 400 nm como resultado de la conversión del sustrato, usando una disolución que no contiene la enzima como referencia. La actividad (A) se calculó como el cambio en la OD por minuto, y se expresó como, por 20 ejemplo, unidades de Phe-AP, Leu-AP o Val-AP, dependiendo del sustrato usado. Se inoculó leche de queso normal con cultivo de fermento del intervalo Delvo-tecTM DX 31 (DSM Food Specialities Delft, Países Bajos), para obtener un queso de tipo Gouda, y la coagulación se ejecutó con una dosis media de coagulante (50 IMCU por litro de leche de queso). Además, se añadieron 25 unidades Phe de cada exoproteasa a dos quesos experimentales, mientras que el control no contuvo ninguna de las exoproteasas. Se usaron parámetros de obtención de queso conforme al 25 procedimiento aplicado para queso semiduro para ambos quesos. Se observó una diferencia en términos de desarrollo de sabor y de aroma entre los quesos experimentales y el queso del control hasta un grado tal que los quesos experimentales obtuvieron la mayoría de sus propiedades organolépticas después de tres (3) semanas, mientras que el queso de control obtuvo una clasificación similar después de seis (6) semanas. Se demostró que el nivel de aminoácidos libres después de tres semanas era dos veces tan alto en los quesos experimentales; después The aminopeptidases encoded by genes nr 20 and 54 (see Table 1) were overexpressed in A. niger according to methods described above. The purification of these enzymes was carried out according to procedures as described in Example 4. The activity of the purified enzyme samples was determined at pH 7.2 in an aqueous phosphate buffer (50 mM) containing the para derivative. -nitroanilide of a number of hydrophobic amino acids (3 mM) as a substrate. Conversion of the substrate by aminopeptidase was determined by monitoring the change in optical density at 400 nm as a result of substrate conversion, using a solution that does not contain the enzyme as a reference. Activity (A) was calculated as the change in OD per minute, and expressed as, for example, units of Phe-AP, Leu-AP or Val-AP, depending on the substrate used. Normal cheese milk was inoculated with ferment culture of the Delvo-tecTM DX 31 interval (DSM Food Specialties Delft, The Netherlands), to obtain a Gouda cheese, and the coagulation was run with a medium dose of coagulant (50 IMCU per liter of cheese milk). In addition, 25 Phe units of each exoprotease were added to two experimental cheeses, while the control did not contain any of the exoproteases. Cheese production parameters were used according to the procedure applied for semi-hard cheese for both cheeses. A difference in terms of flavor and aroma development was observed between the experimental cheeses and the control cheese to such an extent that the experimental cheeses obtained the majority of their organoleptic properties after three (3) weeks, while the cheese of control obtained a similar classification after six (6) weeks. It was shown that the level of free amino acids after three weeks was twice as high in experimental cheeses; after

30 de seis semanas de maduración, los niveles fueron nuevamente comparables. Se llevó a cabo un análisis de aminoácidos según el método Picotag de Waters (Milford MA, USA). 30 of six weeks of maturation, the levels were again comparable. An amino acid analysis was carried out according to the Waters Picotag method (Milford MA, USA).

Estos datos sugieren que el producto está listo para la venta tres semanas antes, sin disminuir el mantenimiento de la calidad del queso. El carácter organoléptico de los quesos experimentales difirió del del control hasta tal punto que el sabor de queso blando con una tendencia ligera al amargor del queso del control se superó en el queso These data suggest that the product is ready for sale three weeks before, without decreasing the maintenance of cheese quality. The organoleptic nature of the experimental cheeses differed from that of the control to such an extent that the taste of soft cheese with a slight tendency to bitterness of the control cheese was exceeded in the cheese

35 experimental en presencia de la aminopeptidasa. Se encontró que la textura de los quesos era igualmente algo más suave. Experimental in the presence of aminopeptidase. It was found that the texture of the cheeses was also somewhat softer.

Ejemplo 8 Example 8

Nueva especificidad de una proteasa codificada por el gen 55 New specificity of a protease encoded by gene 55

Como se explica anteriormente, ciertas proteínas pueden resistir la hidrólisis enzimática como resultado de As explained above, certain proteins can resist enzymatic hydrolysis as a result of

40 composiciones de aminoácidos específicas o estructuras terciarias específicas. En tales casos, la cantidad de péptidos que se puede solubilizar a partir de proteínas resistentes a proteasas se puede mejorar drásticamente usando proteasas que presentan nuevas especificidades. 40 specific amino acid compositions or specific tertiary structures. In such cases, the amount of peptides that can be solubilized from protease resistant proteins can be drastically improved using proteases that have new specificities.

La beta-caseína es una proteína con una estructura terciaria muy limitada, pero con un extraordinario nivel elevado de restos de prolina. Muchas proteasas tienen dificultades a la hora de escindir secuencias que contienen prolina, de 45 manera que la hidrólisis de beta-caseína con proteasas disponibles normalmente produce un hidrolizado que es relativamente rico en péptidos grandes resistentes a proteasas. Estos últimos péptidos resistentes pueden contribuir a un número de propiedades indeseables del hidrolizado. Por ejemplo, es bien sabido que estos péptidos más grandes tienen un efecto relativamente fuerte sobre la alergenicidad y amargor. Además, estos péptidos soportan una degradación posterior a aminoácidos libres, de forma que, en ciertos procesos, la aparición de estos péptidos Beta-casein is a protein with a very limited tertiary structure, but with an extraordinary high level of proline residues. Many proteases have difficulties in cleaving proline-containing sequences, so that hydrolysis of beta-casein with available proteases normally produces a hydrolyzate that is relatively rich in large protease-resistant peptides. These latter resistant peptides can contribute to a number of undesirable properties of the hydrolyzate. For example, it is well known that these larger peptides have a relatively strong effect on allergenicity and bitterness. In addition, these peptides support subsequent degradation to free amino acids, so that, in certain processes, the appearance of these peptides

50 grandes, resistentes a proteasas, es sinónimo de pérdidas de rendimiento. Por lo tanto, la disponibilidad y uso de proteasas que son capaces de escindir las partes resistentes a proteasas de las proteínas se traducen en beneficios técnicos y económicos importantes. 50 large, protease resistant, is synonymous with performance losses. Therefore, the availability and use of proteases that are capable of cleaving the protease-resistant parts of the proteins translate into important technical and economic benefits.

La beta-caseína representa una de las fracciones principales de caseína de la leche bovina. La proteína se ha caracterizado bien en términos de su secuencia de aminoácidos, y está comercialmente disponible en forma casi pura. Como tal, la beta-caseína ofrece un excelente sustrato de ensayo para estudiar la relación entre los sitios de escisión enzimática y la longitud de diversos péptidos formados durante la hidrólisis enzimática. Beta-casein represents one of the main casein fractions of bovine milk. The protein has been well characterized in terms of its amino acid sequence, and is commercially available in almost pure form. As such, beta-casein offers an excellent assay substrate to study the relationship between enzymatic cleavage sites and the length of various peptides formed during enzymatic hydrolysis.

Este Ejemplo demuestra que, a pesar del carácter de escisión de amplio espectro de la endoproteasa subtilisina, la adición de una enzima muy específica como una prolil endopeptidasa, según es codificada por el gen 55 (véase la Tabla 1), tiene un impacto importante sobre el tamaño de los fragmentos de beta-caseína formados. This Example demonstrates that, despite the broad spectrum cleavage nature of the subtilisin endoprotease, the addition of a very specific enzyme such as a prolyl endopeptidase, as encoded by gene 55 (see Table 1), has an important impact on the size of the beta-casein fragments formed.

Se obtuvo beta-caseína de leche bovina (polvo liofilizado, esencialmente libre de sales) con un mínimo de 90% de beta-caseína a partir de Sigma. La subtilisina de B. licheniformis (Delvolase®, 560000 DU por gramo) se obtuvo de DSM Food Specialities (Seclin, Francia). La endoproteasa específica de prolina según es codificada por el gen 55 se sobreexpresó en A. niger y se purificó usando procedimientos descritos en el Ejemplo 4. Bovine milk beta-casein (lyophilized powder, essentially free of salts) was obtained with a minimum of 90% beta-casein from Sigma. B. licheniformis subtilisin (Delvolase®, 560000 DU per gram) was obtained from DSM Food Specialties (Seclin, France). The proline specific endoprotease as encoded by gene 55 was overexpressed in A. niger and purified using procedures described in Example 4.

El polvo de beta-caseína se disolvió a una concentración de 10% (p/p) junto con 0,1% (p/p) de polvo de DelvolaseTM en un tampón de fosfato de 0,1 moles/litro pH 7,0. Después de una incubación de 24 horas a 45ºC en un baño de agua agitado, la reacción se detuvo calentando la disolución durante 15 minutos a 90ºC. A la mitad de la disolución (1 ml que contiene 100 miligramos de beta-caseína) se añadieron 100 microlitros de la proteasa específica de prolina, y la reacción se continuó durante otras 24 horas a 45ºC. Después de otro choque térmico a 90ºC, las muestras de material de beta-caseína tratado tanto con DelvolaseTM como con DelvolaseTM + endoproteasa específica de prolina se analizaron mediante equipo de LC/MS para estudiar las distribuciones precisas de tamaños de péptidos en las dos muestras. The beta-casein powder was dissolved at a concentration of 10% (w / w) together with 0.1% (w / w) of DelvolaseTM powder in a 0.1 mol / liter phosphate buffer pH 7.0 . After a 24 hour incubation at 45 ° C in a stirred water bath, the reaction was stopped by heating the solution for 15 minutes at 90 ° C. Half of the solution (1 ml containing 100 milligrams of beta-casein) was added 100 microliters of proline specific protease, and the reaction was continued for another 24 hours at 45 ° C. After another thermal shock at 90 ° C, samples of beta-casein material treated with both DelvolaseTM and DelvolaseTM + proline-specific endoprotease were analyzed by LC / MS equipment to study the precise distributions of peptide sizes in the two samples.

Análisis de LC/MS LC / MS analysis

Se usó HPLC, que usa un espectrómetro de masas de trampa iónica (ThermoquestTM, Breda, Países Bajos) acoplado a una bomba P4000 (ThermoquestTM, Breda, Países Bajos), para caracterizar los hidrolizados proteicos enzimáticos producidos por la mezcla enzimática de la invención. Los péptidos formados se separaron usando unacolumna PEPMAP C18 300A (MIC-15-03-C18-PM, LC Packings, Ámsterdam, Países Bajos), en combinación con un gradiente de ácido fórmico al 0,1% en agua Milli Q (Millipore, Bedford, MA, USA; Disolución A) y ácido fórmico al 0,1% en acetonitrilo (Disolución B) para elución. El gradiente comenzó a 100% de Disolución A y aumentó hasta 70% de disolución B en 45 minutos, y se mantuvo a esta última relación durante otros 5 minutos. El volumen de inyección usado fue 50 microlitros, el caudal fue 50 microlitros por minuto, y la temperatura de la columna se mantuvo a 30ºC. La concentración de proteína de la muestra inyectada fue aprox. 50 microgramos/mililitro. HPLC, which uses an ion trap mass spectrometer (ThermoquestTM, Breda, The Netherlands) coupled to a P4000 pump (ThermoquestTM, Breda, The Netherlands), was used to characterize the enzymatic protein hydrolysates produced by the enzymatic mixture of the invention. The formed peptides were separated using a PEPMAP C18 300A column (MIC-15-03-C18-PM, LC Packings, Amsterdam, The Netherlands), in combination with a gradient of 0.1% formic acid in Milli Q water (Millipore, Bedford, MA, USA; Solution A) and 0.1% formic acid in acetonitrile (Solution B) for elution. The gradient started at 100% of Solution A and increased to 70% of solution B in 45 minutes, and maintained at the latter ratio for another 5 minutes. The injection volume used was 50 microliters, the flow rate was 50 microliters per minute, and the column temperature was maintained at 30 ° C. The protein concentration of the injected sample was approx. 50 micrograms / milliliter.

La información detallada sobre los péptidos individuales se obtuvo usando el algoritmo de MS/MS “dependiente del barrido”, que es un algoritmo característico para un espectrómetro de masas de trampa de iones. El análisis de barrido completo fue seguido por un análisis de barrido de zoom, para la determinación del estado de la carga del ion más intenso en el intervalo de masas de barrido completo. El análisis subsiguiente de MS/MS de este último ion dio como resultado una información de secuencia peptídica parcial, que se pudo usar para la búsqueda en bases de datos usando la aplicación SEQUEST de Xcalibur Bioworks (ThermoquestTM, Breda, Países Bajos). Los bancos de datos usados se extrajeron del banco de datos OWL.fasta, disponible en el NCBI (National Centre for Biotechnology informatics), que contiene las proteínas de interés para la aplicación usada. Detailed information on the individual peptides was obtained using the "scan-dependent" MS / MS algorithm, which is a characteristic algorithm for an ion trap mass spectrometer. The full scan analysis was followed by a zoom scan analysis, to determine the state of the most intense ion charge in the full scan mass range. Subsequent MS / MS analysis of this latter ion resulted in partial peptide sequence information, which could be used for searching databases using the SEQUEST application of Xcalibur Bioworks (ThermoquestTM, Breda, The Netherlands). The data banks used were extracted from the OWL.fasta data bank, available at the NCBI (National Center for Biotechnology informatics), which contains the proteins of interest for the application used.

Usando esta técnica como método de identificación, sólo los péptidos con una masa que oscila desde aprox. 400 hasta 2000 Daltons se consideraron adecuados para el análisis posterior mediante secuenciación de MS. Using this technique as an identification method, only peptides with a mass ranging from approx. 400 to 2000 Daltons were considered suitable for subsequent analysis by MS sequencing.

Para ajustar la sensibilidad óptima en el modo de MS, se usó angiotensina (M = 1295,6), y para la fragmentación óptima en el modo MS/MS, llevando a cabo una infusión constante de 60 Pg/ml, dando como resultado principalmente especies doble y tríplemente cargadas en el modo MS, y una energía de colisión óptima de alrededor de 35% en el modo MS/MS. To adjust the optimum sensitivity in the MS mode, angiotensin (M = 1295.6) was used, and for optimal fragmentation in the MS / MS mode, carrying out a constant infusion of 60 Pg / ml, mainly resulting Double and triple charged species in the MS mode, and an optimal collision energy of about 35% in the MS / MS mode.

En la muestra digerida con Delvolase sola, el análisis de LC/MS/MS identificó 40 péptidos que cubren diversas partes de la molécula de beta-caseína. Juntos, estos péptidos dieron cuenta del 79% de la secuencia total de beta-caseína. Se pudieron rastrear nuevamente tiempos de retención diferentes de los péptidos en la columna C18 hasta longitudes peptídicas que oscilan de 2 a 23 restos de aminoácidos. Juntos, < 15% de los péptidos encontrados fueron más pequeños de 6 aminoácidos. La muestra digerida con DelvolaseTM y la proteasa específica de prolina también generó un gran número de péptidos identificables a partir de beta-caseína. Juntos, estos péptidos cubrieron > 50% de la secuencia total de la proteína de beta-caseína. En esta muestra, la distribución de tamaños de los péptidos fue notablemente homogénea, ya que los péptidos oscilaron en longitud sólo entre 2 y 6 restos. Los resultados muestran que, en el hidrolizado obtenido con la proteasa específica de prolina, contiene una gran fracción de dipéptidos, tripéptidos, y de péptidos con hasta 6 AA, que muestran el efecto beneficioso distinto de la coincubación con una endoproteasa que presenta una especificidad inusual. También está claro a partir de estos experimentos que la endoproteasa según el gen 55 codifica una endoproteasa que escinde la cadena peptídica en el término carboxi del resto de prolina. In the sample digested with Delvolase alone, the LC / MS / MS analysis identified 40 peptides covering various parts of the beta-casein molecule. Together, these peptides accounted for 79% of the total beta-casein sequence. Retention times different from the peptides in column C18 could be traced back to peptide lengths ranging from 2 to 23 amino acid residues. Together, <15% of the peptides found were smaller than 6 amino acids. The sample digested with DelvolaseTM and the proline specific protease also generated a large number of identifiable peptides from beta-casein. Together, these peptides covered> 50% of the total beta-casein protein sequence. In this sample, the size distribution of the peptides was remarkably homogeneous, since the peptides ranged in length only between 2 and 6 residues. The results show that, in the hydrolyzate obtained with the proline specific protease, it contains a large fraction of dipeptides, tripeptides, and peptides with up to 6 AA, which show the beneficial effect other than co-incubation with an endoprotease that has an unusual specificity. . It is also clear from these experiments that the endoprotease according to gene 55 encodes an endoprotease that cleaves the peptide chain in the carboxy terminus of the proline moiety.

Ejemplo 9 Example 9

La liberación selectiva de aminoácidos específicos para promover la formación de sabor. The selective release of specific amino acids to promote flavor formation.

Los aminoácidos libres como leucina y fenilalanina no sólo han estado implicados en reacciones de Maillard, sino también como precursores para aromas deseables en diversas fermentaciones alimentarias. Para promover la 5 formación de tales aromas en fermentaciones alimentarias o durante la fase de calentamiento, tueste o cocción del alimento, sería ventajoso incorporar en estos productos un hidrolizado proteico que contenga niveles relativamente elevados de estos aminoácidos específicos en una forma libre. En este Ejemplo se describe la producción de extractos de levadura enriquecidos selectivamente en leucina y fenilalanina. Este enriquecimiento se obtiene combinando una endoproteasa con una preferencia de escisión para un conjunto seleccionado de restos de aminoácidos con una exoproteasa que favorece la liberación de un conjunto similar de restos de aminoácidos. La preferencia de la endoproteasa debería de coincidir con la preferencia de la exoproteasa usada. Por ejemplo, se ha establecido que las aminopeptidasas codificadas por los genes 20 y 54 (véase la Tabla 1) presenta una preferencia definida por liberar restos de leucina y fenilalanina que coincide con las preferencias de escisión de termolisina. Las carboxipeptidasas codificadas por los genes 23 y 24 tienen preferencia por liberar restos de arginina y lisina, que Free amino acids such as leucine and phenylalanine have not only been implicated in Maillard reactions, but also as precursors for desirable aromas in various food fermentations. To promote the formation of such aromas in food fermentations or during the heating, roasting or cooking phase of the food, it would be advantageous to incorporate in these products a protein hydrolyzate containing relatively high levels of these specific amino acids in a free form. This Example describes the production of yeast extracts selectively enriched in leucine and phenylalanine. This enrichment is obtained by combining an endoprotease with a cleavage preference for a selected set of amino acid residues with an exoprotease that favors the release of a similar set of amino acid residues. The preference of the endoprotease should match the preference of the exoprotease used. For example, it has been established that aminopeptidases encoded by genes 20 and 54 (see Table 1) have a definite preference for releasing leucine and phenylalanine residues that match the thermolysin cleavage preferences. Carboxypeptidases encoded by genes 23 and 24 have a preference for releasing arginine and lysine residues, which

15 coincide con las preferencias de escisión de tripsina. La carboxipeptidasa codificada por el gen 5 presenta una preferencia muy inusual por liberar glicina, que se podría combinar con ciertas endoproteasas presentes en papaína. La carboxipeptidasa codificada por el gen 51 es capaz de eliminar restos de glutamato, lo que coincide con la proteasa específica de glutamato codificada por el gen 43. 15 matches the trypsin cleavage preferences. The carboxypeptidase encoded by gene 5 has a very unusual preference for releasing glycine, which could be combined with certain endoproteases present in papain. The carboxypeptidase encoded by gene 51 is capable of eliminating glutamate residues, which coincides with the specific glutamate protease encoded by gene 43.

Se sabe que la endoproteasa termolisina (comercialmente disponible como Thermoase) C180 de Daiwa Kasei KK (Osaka, Japón) escinde enlaces peptídicos en el lado aminoterminal de aminoácidos hidrófobos voluminosos como Leu y Phe. Para liberar los aminoácidos así expuestos de los péptidos recientemente formados, se usaron las aminopeptidasas codificadas por los genes nr 20 y 54 (véase la Tabla 1). Estos genes se sobreexpresaron en A. niger según métodos descritos anteriormente, y la purificación de estas enzimas se llevó a cabo según procedimientos como se describe en el Ejemplo 4. It is known that the thermolysin endoprotease (commercially available as Thermoase) C180 from Daiwa Kasei KK (Osaka, Japan) cleaves peptide bonds on the aminoterminal side of bulky hydrophobic amino acids such as Leu and Phe. To release the amino acids thus exposed from the newly formed peptides, the aminopeptidases encoded by genes nr 20 and 54 were used (see Table 1). These genes were overexpressed in A. niger according to methods described above, and the purification of these enzymes was carried out according to procedures as described in Example 4.

25 Para liberar tanta leucina y fenilalanina como sea posible sin la liberación concomitante de aminoácidos indeseados con esta combinación de enzimas, es evidente que se deberían seleccionar con cuidado las condiciones usadas durante la hidrólisis enzimática. Además, se han de inactivar las proteasas endógenas (y probablemente aespecíficas) de las propias levaduras. Después de un número de incubaciones de ensayo, se obtuvo un protocolo que conduce a una liberación sorprendentemente selectiva y eficaz de leucina y fenilalanina a partir de las proteínas de la levadura usando estas dos nuevas enzimas. 25 To release as much leucine and phenylalanine as possible without the concomitant release of unwanted amino acids with this combination of enzymes, it is clear that the conditions used during enzymatic hydrolysis should be carefully selected. In addition, the endogenous (and probably specific) proteases of the yeasts themselves must be inactivated. After a number of test incubations, a protocol was obtained that leads to a surprisingly selective and effective release of leucine and phenylalanine from yeast proteins using these two new enzymes.

Para inactivar las proteasas endógenas de las levaduras, la suspensión de levadura se mantuvo durante 5 minutos a 95 grados C. Después, la suspensión se enfrió rápidamente hasta la temperatura requerida, y el pH se ajustó a 7,0 usando NaOH 4N. La levadura, la termolisina y una de las aminopeptidasas se incubaron todas simultáneamente en las siguientes condiciones. Después del choque térmico, el pH de los 2000 mililitros de suspensión de levadura se To inactivate the endogenous yeast proteases, the yeast suspension was maintained for 5 minutes at 95 degrees C. Then, the suspension was rapidly cooled to the required temperature, and the pH was adjusted to 7.0 using 4N NaOH. Yeast, thermolysin and one of the aminopeptidases were all incubated simultaneously under the following conditions. After thermal shock, the pH of the 2000 milliliters of yeast suspension is

35 ajustó a 7,0, después de lo cual se añadieron 680 miligramos de Thermoase y, tras agitar, la aminopeptidasa purificada. La mezcla se incubó con agitación a 50 grados C durante 3 horas, y se centrifugó. Para detener todas las actividades enzimáticas, el pH del sobrenadante se ajustó a 4 y se sometió a otro tratamiento térmico de 45 minutos a 95 grados C. Después de otra centrifugación, se obtuvo del sobrenadante una muestra para el análisis de aminoácidos. La materia precipitada o no disuelta se eliminó mediante centrifugación durante 15 minutos a 3500 rpm en una centrifugadora Hereaus Megafuge 2.0 R. El sobrenadante se retiró y se mantuvo congelado a -20ºC. Las muestras del sobrenadante se analizaron en busca del contenido de aminoácidos según el método Picotag de Waters (Milford, MA, USA), inmediatamente después de descongelarlas. 35 adjusted to 7.0, after which 680 milligrams of Thermoase were added and, after stirring, the purified aminopeptidase. The mixture was incubated with stirring at 50 degrees C for 3 hours, and centrifuged. To stop all enzymatic activities, the pH of the supernatant was adjusted to 4 and underwent another 45-minute heat treatment at 95 degrees C. After another centrifugation, a sample for amino acid analysis was obtained from the supernatant. The precipitated or undissolved matter was removed by centrifugation for 15 minutes at 3500 rpm in a Hereaus Megafuge 2.0 R centrifuge. The supernatant was removed and kept frozen at -20 ° C. Samples of the supernatant were analyzed for amino acid content according to the Waters Picotag method (Milford, MA, USA), immediately after thawing.

En el análisis de aminoácidos, los valores de Trp y Cys se omitieron, y los valores de Asp y Asn se sumaron como un valor. Según los datos obtenidos, en el hidrolizado resultante la relación entre alanina y leucina (21,3:11,7) fue In the amino acid analysis, Trp and Cys values were omitted, and Asp and Asn values were added as one value. According to the data obtained, in the resulting hydrolyzate the ratio between alanine and leucine (21.3: 11.7) was

45 1:0,5. Los hidrolizados de levadura comercialmente disponibles presentan típicamente relaciones de alanina frente a leucina de 1:0,3. 45 1: 0.5. Commercially available yeast hydrolysates typically have alanine to leucine ratios of 1: 0.3.

En un segundo experimento, se preparó un extracto de levadura que estaba enriquecido en glutamato libre. Para lograr esto, se hizo uso de una endoproteasa que presenta una preferencia por la escisión en el extremo C-terminal de restos de glutamato (codificada por el gen nr 43 en la Tabla 1), y una carboxipeptidasa (codificada por el gen nr 51 en la Tabla 1) capaz de eliminar estos restos de glutamato así expuestos. La endoproteasa codificada por el gen nr 43 y la carboxipeptidasa codificada por el gen 51 (véase la Tabla 1) se sobreexpresaron en A. niger según métodos descritos anteriormente. La purificación de estas enzimas se llevó a cabo según procedimientos como se describe en el Ejemplo 4. In a second experiment, a yeast extract was prepared that was enriched in free glutamate. To achieve this, an endoprotease was used that exhibits a preference for cleavage at the C-terminal end of glutamate residues (encoded by the nr 43 gene in Table 1), and a carboxypeptidase (encoded by the nr 51 gene in Table 1) capable of eliminating these glutamate residues thus exposed. The endoprotease encoded by the nr 43 gene and the carboxypeptidase encoded by the gene 51 (see Table 1) were overexpressed in A. niger according to methods described above. The purification of these enzymes was carried out according to procedures as described in Example 4.

El papel esencial de glutamato libre en un número de procesos formadores de aroma está bien documentado, y The essential role of free glutamate in a number of aroma-forming processes is well documented, and

55 MSG, la sal sódica del ácido glutámico, está reconocida como el componente potenciador del sabor más importante individual. 55 MSG, the sodium salt of glutamic acid, is recognized as the single most important flavor enhancer component.

En este Ejemplo, el pH de 200 ml de suspensión de levadura sometida a choque térmico se ajustó a 8,0, después se añadió el producto enzimático purificado codificado por el gen 43, y la mezcla se incubó durante 4 horas a 50 grados In this Example, the pH of 200 ml of yeast suspension subjected to thermal shock was adjusted to 8.0, then the purified enzyme product encoded by gene 43 was added, and the mixture was incubated for 4 hours at 50 degrees

C. Después, el pH se redujo a 5,0, y la suspensión se centrifugó. A 100 mililitros de sobrenadante se añadió el producto génico purificado del gen 51. La incubación con esta carboxipeptidasa tuvo lugar durante 30 minutos a 50 grados C, con ajustes continuos del pH. Después de detener la incubación enzimática mediante un tratamiento térmico de 5 minutos a 95 grados C, el material se centrifugó nuevamente (véase más arriba), y se obtuvo una C. Then, the pH was reduced to 5.0, and the suspension was centrifuged. The purified gene product of gene 51 was added to 100 milliliters of supernatant. Incubation with this carboxypeptidase took place for 30 minutes at 50 degrees C, with continuous pH adjustments. After stopping the enzymatic incubation by a 5-minute heat treatment at 95 degrees C, the material was centrifuged again (see above), and a

5 muestra para el análisis de aminoácidos. 5 sample for amino acid analysis.

Según los datos de aminoácidos obtenidos (véase anteriormente), en el hidrolizado resultante la relación entre alanina y glutamato (30,0:48,7) fue 1:1,6. Los hidrolizados de levadura comercialmente disponibles presentan típicamente relaciones de alanina frente a glutamato de 1:1. According to the amino acid data obtained (see above), in the resulting hydrolyzate the ratio between alanine and glutamate (30.0: 48.7) was 1: 1.6. Commercially available yeast hydrolysates typically have alanine to glutamate ratios of 1: 1.

Ejemplo 10 Example 10

10 Evaluación del sabor de hidrolizados de levadura enriquecidos en aminoácidos específicos. 10 Evaluation of the flavor of yeast hydrolysates enriched in specific amino acids.

Para demostrar que un hidrolizado proteico enriquecido en aminoácidos específicos según la invención puede generar aromas específicos, se llevó a cabo un número de experimentos con los hidrolizados de levadura descritos en el Ejemplo previo. Para ese fin, se prepararon y liofilizaron porciones más grandes de estos hidrolizados. El comportamiento de los polvos resultantes se comparó con el comportamiento de un extracto de levadura To demonstrate that a protein hydrolyzate enriched in specific amino acids according to the invention can generate specific aromas, a number of experiments with the yeast hydrolysates described in the previous Example were carried out. To that end, larger portions of these hydrolysates were prepared and lyophilized. The behavior of the resulting powders was compared with the behavior of a yeast extract

15 comercialmente disponible (Gistex LS, obtenible de DSM Food Specialties, Delft, Países Bajos) en una mezcla estandarizada bajo varias condiciones de reacción. La mezcla estandarizada consistió en uno de los hidrolizados, mezcla base y agua. 15 commercially available (Gistex LS, available from DSM Food Specialties, Delft, The Netherlands) in a standardized mixture under various reaction conditions. The standardized mixture consisted of one of the hydrolysates, base mix and water.

La mezcla base contenía 22 gramos de Maxarome Plus Powder (un extracto de levadura especializado, con un contenido elevado de nucleótidos naturales, también obtenible de DSM Food Specialties), 29,2 gramos de glucosa, 9 The base mixture contained 22 grams of Maxarome Plus Powder (a specialized yeast extract, with a high content of natural nucleotides, also available from DSM Food Specialties), 29.2 grams of glucose, 9

20 gramos de grasa REFEL-F (aceite de soja hidrogenado, obtenible de Barentz, Hoofddorp, Países Bajos) y 0,2 gramos de estearoil lactilato de calcio (emulsionante, obtenible de Abitec, Northampton, UK), mezclado a conciencia en un mortero. 20 grams of REFEL-F fat (hydrogenated soybean oil, obtainable from Barentz, Hoofddorp, The Netherlands) and 0.2 grams of calcium stearoyl lactylate (emulsifier, obtainable from Abitec, Northampton, UK), mixed thoroughly in a mortar .

Todas las mezclas estandarizadas contenían 5 gramos de polvo de hidrolizado de levadura (es decir, el material enriquecido en leucina o en glutamato, o el extracto de levadura comercial), 3 gramos de la mezcla base, y 3 gramos All standardized mixtures contained 5 grams of yeast hydrolyzate powder (i.e., leucine or glutamate enriched material, or commercial yeast extract), 3 grams of the base mixture, and 3 grams

25 de agua. Después del mezclamiento a conciencia, estas tres suspensiones se sometieron a diferentes regímenes de calentamiento, es decir, 65 minutos a 90-95 grados C en un vial de reacción (reacción líquida), o se secaron a 20 milibares a 120 grados C en un horno de vacío (reacción de tueste a vacío), o se calentaron en un vial de reacción abierto a 120 grados C durante 10 minutos tras disipar todo el agua (reacción de tueste). 25 of water After thorough mixing, these three suspensions were subjected to different heating regimens, that is, 65 minutes at 90-95 degrees C in a reaction vial (liquid reaction), or dried at 20 millibars at 120 degrees C in a vacuum oven (roasting reaction under vacuum), or they were heated in an open reaction vial at 120 degrees C for 10 minutes after dissipating all the water (roasting reaction).

Después del tratamiento térmico, los tres productos asumieron colores que oscilan desde el marrón oscuro hasta After the heat treatment, the three products assumed colors ranging from dark brown to

30 casi negro. En el caso de la reacción de tueste a vacío, sólo se usaron las capas superiores de color claro. La evaluación del sabor de los productos calentados se llevó a cabo moliendo las tortas oscurecidas hasta polvos finos, y disolviendo estos polvos hasta una concentración de 2% (p/p) en agua que contiene 0,6% (p/p) de NaCl. Las observaciones del panel de sabor se especifican en la Tabla 3. 30 almost black. In the case of the roasting reaction under vacuum, only the upper layers of light color were used. The evaluation of the taste of the heated products was carried out by grinding the darkened cakes to fine powders, and dissolving these powders to a concentration of 2% (w / w) in water containing 0.6% (w / w) NaCl . The flavor panel observations are specified in Table 3.

Tabla 3 Table 3

Referencia  Reference
Leucina Glutamato Leucine Glutamate

Líquido Liquid
Caldo, ligeramente tostado Té frío, ligeramente florido, similar a levadura More caldo, carnoso, similar a levadura Broth, lightly toasted Cold tea, slightly flowery, similar to yeast More broth, meaty, similar to yeast

Tueste a vacío Vacuum roast
Quemado, patatas fritas Astringente, habas, similar a levadura Quemado, caldo, similar a levadura Burned french fries Astringent, beans, similar to yeast Burned, broth, similar to yeast

Tueste Roast
Tostado oscuro, caldo, umami Menos tueste, florido, umami Tueste, más caldo, más umami Dark toast, broth, umami Less roast, flowery, umami Toast, more broth, more umami

35 Ejemplo 11 35 Example 11

Hidrolizados proteicos de suero no alergénicos formados con tripeptidil peptidasas. Non-allergenic whey protein hydrolysates formed with tripeptidyl peptidases.

Las dipeptidil peptidasas codificadas por los genes 19 y 55, así como las tripeptidil peptidasas codificadas por los genes 4, 9, 10, 12, 26, 35, 46, y 50 (véase la Tabla 1), se pueden sobreproducir como se describe, y se pueden Dipeptidyl peptidases encoded by genes 19 and 55, as well as tripeptidyl peptidases encoded by genes 4, 9, 10, 12, 26, 35, 46, and 50 (see Table 1), can be overproduced as described, and you can

40 purificar según los métodos proporcionados en el Ejemplo 4. Tras la purificación, el pH óptimo y la estabilidad de temperatura de cada enzima individual se pueden establecer por cualquiera de los métodos disponibles y conocidos por la persona experta. Además, la especificidad de cada enzima individual se puede determinar usando los métodos explicados en el Ejemplo 1. En el siguiente experimento se ilustra la selectividad mostrada por las tripeptidil peptidasas. Purify according to the methods provided in Example 4. After purification, the optimum pH and temperature stability of each individual enzyme can be established by any of the methods available and known to the skilled person. In addition, the specificity of each individual enzyme can be determined using the methods explained in Example 1. The following experiment illustrates the selectivity shown by tripeptidyl peptidases.

45 La enzima codificada por el gen 12 se sobreprodujo en una célula hospedante de Aspergillus niger, y se purificó mediante procedimientos descritos en el Ejemplo 4. La enzima así obtenida se incubó a pH 5 y a 50 grados C con The enzyme encoded by gene 12 was overproduced in an Aspergillus niger host cell, and purified by procedures described in Example 4. The enzyme thus obtained was incubated at pH 5 and at 50 degrees C with

diferentes sustratos cromógenos sintéticos, es decir, Ala-Ala-Phe-pNA y Ala-Phe-pNA (ambos de Bachem, Suiza). La incubación con el sustrato Ala-Ala-Phe-pNA condujo a un incremento significativo de la absorbancia a 410 nm, mientras que la incubación con Ala-Phe-pNA no lo hizo. Esta observación demuestra claramente que las tripeptidil peptidasas escinden tripéptidos y no presentan actividad de aminopeptidasa que puede conducir a un incremento indeseable de aminoácidos libres. different synthetic chromogenic substrates, that is, Ala-Ala-Phe-pNA and Ala-Phe-pNA (both from Bachem, Switzerland). Incubation with the Ala-Ala-Phe-pNA substrate led to a significant increase in absorbance at 410 nm, while incubation with Ala-Phe-pNA did not. This observation clearly demonstrates that tripeptidyl peptidases cleave tripeptides and have no aminopeptidase activity that can lead to an undesirable increase in free amino acids.

Además, la enzima codificada por el gen 12 muestra características de estabilidad enzimática favorables, como se muestra en el siguiente experimento. Se incubaron cuatro muestras de la enzima a pH 5 durante una hora a 0, 40, 50 y 60 grados C, respectivamente. Después, cada muestra enzimática se incubó con el sustrato Ala-Ala-Phe-pNA mencionado anteriormente en un tampón de citrato a pH 5, y se determinó la actividad residual en cada muestra individual midiendo el incremento de absorbancia a 410 nm. La muestra a 0 grados C presentó una actividad de 100%, la muestra a 40 grados presentó una actividad residual de 96%, la muestra a 50 grados presentó una actividad residual de 92%, y la muestra a 60 grados presentó una actividad residual de 88%. In addition, the enzyme encoded by gene 12 shows favorable enzyme stability characteristics, as shown in the following experiment. Four enzyme samples were incubated at pH 5 for one hour at 0, 40, 50 and 60 degrees C, respectively. Then, each enzyme sample was incubated with the above-mentioned Ala-Ala-Phe-pNA substrate in a citrate buffer at pH 5, and the residual activity in each individual sample was determined by measuring the absorbance increase at 410 nm. The sample at 0 degrees C showed a 100% activity, the sample at 40 degrees showed a residual activity of 96%, the sample at 50 degrees showed a residual activity of 92%, and the sample at 60 degrees showed a residual activity of 88%

En un proceso típico dirigido a producir un hidrolizado con una proporción elevada de tripéptidos, se puede disolver/suspender proteína de suero (WPC 75) en una concentración de 100 gramos de proteína/litro, en un medio acuoso que tiene un pH de 8,5. La primera incubación enzimática se realiza con la endoproteasa de amplio espectro subtilisina (Delvolase®, 560000 DU por gramo, de DSM). Después de una predigestión del suero con esta enzima en una concentración de 0,5% de concentrado enzimático por gramo de proteína durante 2 horas a 60ºC, la mezcla se trató con calor para inactivar la endoproteasa usada. Después, la temperatura se ajustó a 50 grados C y se añadió la tripeptidil peptidasa, y toda la mezcla se incubó hasta que se alcanzó el nivel deseado de tripéptidos. Las etapas del procesamiento adicionales del hidrolizado así obtenido dependen de la aplicación específica, pero pueden incorporar microfiltración o centrifugación seguido de evaporación y secado por pulverización. In a typical process aimed at producing a hydrolyzate with a high proportion of tripeptides, whey protein (WPC 75) can be dissolved / suspended in a concentration of 100 grams of protein / liter, in an aqueous medium having a pH of 8, 5. The first enzymatic incubation is performed with the broad spectrum subtilisin endoprotease (Delvolase®, 560000 DU per gram, of DSM). After a pre-digestion of the serum with this enzyme in a concentration of 0.5% of enzyme concentrate per gram of protein for 2 hours at 60 ° C, the mixture was heat treated to inactivate the endoprotease used. Then, the temperature was adjusted to 50 degrees C and tripeptidyl peptidase was added, and the entire mixture was incubated until the desired level of tripeptides was reached. The additional processing steps of the hydrolyzate thus obtained depend on the specific application, but may incorporate microfiltration or centrifugation followed by evaporation and spray drying.

LISTADO DE SECUENCIAS SEQUENCE LIST

<110> DSM NV <110> DSM NV

<120> Nuevos genes que codifican nuevas encimas proteolíticas <120> New genes encoding new proteolytic enzymes

<130> 20095WO <130> 20095WO

<160> 171 <160> 171

<170> PatentIn version 3.1 <170> PatentIn version 3.1

<210> 1 <210> 1

<211> 2520 <211> 2520

<212>. DNA <212>. DNA

<213> Aspergillus niger <213> Aspergillus niger

<400> 1 <400> 1

Claims (18)

REIVINDICACIONES
1.one.
Un polinucleótido aislado hibridable en condiciones muy restrictivas a polinucleótido SEC ID NO: 10 o a la secuencia SEC ID NO: 67, en el que dicho polinucleótido codifica una proteína que tiene actividad de proteasa.  An isolated polynucleotide hybridizable under conditions very restrictive to polynucleotide SEQ ID NO: 10 or to the sequence SEQ ID NO: 67, wherein said polynucleotide encodes a protein that has protease activity.
2.2.
Un polinucleótido aislado según la reivindicación 1, obtenible de un hongo filamentoso.  An isolated polynucleotide according to claim 1, obtainable from a filamentous fungus.
3.3.
Un polinucleótido aislado según la reivindicación 2, obtenible de A. niger.  An isolated polynucleotide according to claim 2, obtainable from A. niger.
4.Four.
Un polinucleótido aislado que codifica un polipéptido que comprende una secuencia de aminoácidos según SEC ID NO: 124 o una secuencia de aminoácidos que es al menos 80% homóloga a la secuencia de aminoácidos según SEC ID NO: 124, y que tiene actividad de proteasa.  An isolated polynucleotide encoding a polypeptide comprising an amino acid sequence according to SEQ ID NO: 124 or an amino acid sequence that is at least 80% homologous to the amino acid sequence according to SEQ ID NO: 124, and having protease activity.
5.5.
Un polinucleótido aislado que comprende una secuencia nucleotídica según SEC ID NO: 10 o la secuencia SEC ID NO: 67.  An isolated polynucleotide comprising a nucleotide sequence according to SEQ ID NO: 10 or the sequence SEQ ID NO: 67.
6.6.
Un polinucleótido aislado según la secuencia SEC ID NO: 10 o la secuencia SEC ID NO: 67.  An isolated polynucleotide according to the sequence SEQ ID NO: 10 or the sequence SEQ ID NO: 67.
7.7.
Un vector que comprende una secuencia polinucleotídica según las reivindicaciones 1 a 6.  A vector comprising a polynucleotide sequence according to claims 1 to 6.
8.8.
Un vector según la reivindicación 7, en el que dicha secuencia polinucleotídica según las reivindicaciones 1 a 6 está ligada operativamente con secuencias reguladoras adecuadas para la expresión de dicha secuencia polinucleotídica en una célula hospedante adecuada.  A vector according to claim 7, wherein said polynucleotide sequence according to claims 1 to 6 is operably linked with regulatory sequences suitable for the expression of said polynucleotide sequence in a suitable host cell.
9.9.
Un vector según la reivindicación 8, en el que dicha célula hospedante adecuada es un hongo filamentoso.  A vector according to claim 8, wherein said suitable host cell is a filamentous fungus.
10.10.
Un método para fabricar un polinucleótido según las reivindicaciones 1 a 6 o un vector según las reivindicaciones 7 a 9, que comprende las etapas de cultivas una célula hospedante transformada con dicho polinucleótido o dicho vector, y aislar dicho polinucleótido o dicho vector de dicha célula hospedante.  A method of manufacturing a polynucleotide according to claims 1 to 6 or a vector according to claims 7 to 9, comprising the steps of culturing a host cell transformed with said polynucleotide or said vector, and isolating said polynucleotide or said vector of said host cell .
11.eleven.
Un polipéptido aislado según la secuencia SEC ID NO: 124 o una secuencia de aminoácidos que es al menos 80% homóloga a la secuencia de aminoácidos según SEC ID NO: 124, y que tiene actividad de proteasa.  An isolated polypeptide according to the sequence SEQ ID NO: 124 or an amino acid sequence that is at least 80% homologous to the amino acid sequence according to SEQ ID NO: 124, and that has protease activity.
12.12.
Un polipéptido aislado según la reivindicación 11, obtenible de Aspergillus niger.  An isolated polypeptide according to claim 11, obtainable from Aspergillus niger.
13. 13.
Un polipéptido aislado obtenible expresando un polinucleótido según las reivindicaciones 1 a 6 o un vector según las reivindicaciones 7 a 9 en una célula hospedante apropiada, preferiblemente Aspergillus niger. An isolated polypeptide obtainable by expressing a polynucleotide according to claims 1 to 6 or a vector according to claims 7 to 9 in an appropriate host cell, preferably Aspergillus niger.
14.14.
Un método para fabricar un polipéptido según las reivindicaciones 11 a 13, que comprende las etapas de transformar una célula hospedante adecuada con un polinucleótido aislado según las reivindicaciones 1 a 6 o un vector según las reivindicaciones 7 a 9, cultivar dicha célula en condiciones que permitan la expresión de dicho polinucleótido, y opcionalmente purificar el polipéptido codificado de dicha célula o medio de cultivo.  A method for manufacturing a polypeptide according to claims 11 to 13, comprising the steps of transforming a suitable host cell with an isolated polynucleotide according to claims 1 to 6 or a vector according to claims 7 to 9, culturing said cell under conditions that allow the expression of said polynucleotide, and optionally purify the encoded polypeptide of said cell or culture medium.
15.fifteen.
Una célula hospedante recombinante que comprende un polinucleótido según las reivindicaciones 1 a 6 o un vector según las reivindicaciones 7 a 9.  A recombinant host cell comprising a polynucleotide according to claims 1 to 6 or a vector according to claims 7 to 9.
16.16.
Una célula hospedante recombinante que expresa un polipéptido según las reivindicaciones 11 a 13.  A recombinant host cell expressing a polypeptide according to claims 11 to 13.
17.17.
Una célula hospedante recombinante según las reivindicaciones 15 ó 16, en la que dicha célula hospedante procede de una especie Aspergillus, preferiblemente A. niger.  A recombinant host cell according to claims 15 or 16, wherein said host cell is derived from an Aspergillus species, preferably A. niger.
18.18.
Proteína de fusión que comprende una secuencia polipeptídica según las reivindicaciones 11 a 13.  Fusion protein comprising a polypeptide sequence according to claims 11 to 13.
ES08168496T 2001-02-23 2002-02-22 NEW GENES THAT CODIFY NEW PROTEOLITHIC ENZYMES. Expired - Lifetime ES2368285T3 (en)

Applications Claiming Priority (57)

Application Number Priority Date Filing Date Title
EP01200658 2001-02-23
EP01200657 2001-02-23
EP01200660 2001-02-23
EP01200707 2001-02-26
EP01200706 2001-02-26
EP01200708 2001-02-26
EP01200719 2001-02-26
EP01000080 2001-03-28
EP01000085 2001-03-28
EP01000087 2001-03-28
EP01000075 2001-03-28
EP01000078 2001-03-28
EP01000084 2001-03-28
EP01000088 2001-03-28
EP01000165 2001-05-21
EP01000162 2001-05-21
EP01000166 2001-05-21
EP01000160 2001-05-21
EP01000156 2001-05-21
EP01000168 2001-05-21
EP01000159 2001-05-21
EP01000225 2001-06-20
EP01000229 2001-06-20
EP01000238 2001-06-21
EP01000246 2001-06-21
EP01000244 2001-06-21
EP01000242 2001-06-21
EP01000237 2001-06-21
EP01000234 2001-06-21
EP01000240 2001-06-21
EP01000280 2001-07-12
EP01000286 2001-07-12
EP01000287 2001-07-12
EP01000285 2001-07-12
EP01000320 2001-07-30
EP01000321 2001-07-30
EP01000323 2001-07-30
EP01000322 2001-07-30
EP01000327 2001-07-30
EP01000341 2001-08-02
EP01000343 2001-08-02
EP01000344 2001-08-02
EP01000342 2001-08-02
EP01000357 2001-08-09
EP01000374 2001-08-16
EP01000374 2001-08-16
EP01000377 2001-08-16
EP01000478 2001-09-20
EP01000483 2001-09-20
EP01000556 2001-10-22
EP01000553 2001-10-22
EP01000557 2001-10-22
EP01000552 2001-10-22
EP01000558 2001-10-22
EP01000554 2001-10-22
EP01204464 2001-11-15
EP01205117 2001-12-21

Publications (1)

Publication Number Publication Date
ES2368285T3 true ES2368285T3 (en) 2011-11-16

Family

ID=44862182

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08168496T Expired - Lifetime ES2368285T3 (en) 2001-02-23 2002-02-22 NEW GENES THAT CODIFY NEW PROTEOLITHIC ENZYMES.

Country Status (1)

Country Link
ES (1) ES2368285T3 (en)

Similar Documents

Publication Publication Date Title
US7323327B2 (en) Genes encoding novel proteolytic enzymes
AU2002308306A1 (en) Genes encoding proteolytic enzymes from aspargilli
US20090275079A1 (en) Novel genes encoding novel proteolytic enzymes
ES2301579T3 (en) PROLIL ENDOPROTEASE FROM ASPERGILLUS NIGER.
JP5328100B2 (en) Use of proline-specific endoproteases to hydrolyze peptides and proteins
EP2283129B1 (en) Proline-specific protease from penicillium chrysogenum
RU2296160C2 (en) New genes encoding new proteolytic enzymes
ES2368285T3 (en) NEW GENES THAT CODIFY NEW PROTEOLITHIC ENZYMES.
AU2008202554C1 (en) Novel genes encoding novel proteolytic enzymes
NZ560367A (en) Novel genes encoding novel proteolytic enzymes
NZ547005A (en) Proteases from Aspergillus niger
KR20030080229A (en) Novel genes encoding novel proteolytic enzymes
Poza et al. Industrial applications of microbial proteases and genetic engineering
ES2316469T3 (en) AMENOPEPTIDASE.
AU2002216089A1 (en) Prolyl endoprotease from aspergillus niger