ES2373658T3 - Nuevas entidades biológicas y el uso de las mismas. - Google Patents

Nuevas entidades biológicas y el uso de las mismas. Download PDF

Info

Publication number
ES2373658T3
ES2373658T3 ES04741841T ES04741841T ES2373658T3 ES 2373658 T3 ES2373658 T3 ES 2373658T3 ES 04741841 T ES04741841 T ES 04741841T ES 04741841 T ES04741841 T ES 04741841T ES 2373658 T3 ES2373658 T3 ES 2373658T3
Authority
ES
Spain
Prior art keywords
protein
amino acid
enzymes
positions
framework
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES04741841T
Other languages
English (en)
Inventor
Ulrich Haupts
Andre Koltermann
Andreas Scheidig
Christian Voetsmeier
Ulrich Kettling
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer Pharma AG
Original Assignee
Bayer Pharma AG
Bayer Schering Pharma AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP03025871.9A external-priority patent/EP1531179A1/en
Application filed by Bayer Pharma AG, Bayer Schering Pharma AG filed Critical Bayer Pharma AG
Application granted granted Critical
Publication of ES2373658T3 publication Critical patent/ES2373658T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/482Serine endopeptidases (3.4.21)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/482Serine endopeptidases (3.4.21)
    • A61K38/4826Trypsin (3.4.21.4) Chymotrypsin (3.4.21.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/482Serine endopeptidases (3.4.21)
    • A61K38/486Elastase (3.4.21.36 or 3.4.21.37)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/4873Cysteine endopeptidases (3.4.22), e.g. stem bromelain, papain, ficin, cathepsin H
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/48Hydrolases (3) acting on peptide bonds (3.4)
    • A61K38/488Aspartic endopeptidases (3.4.23), e.g. pepsin, chymosin, renin, cathepsin E
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K8/00Cosmetics or similar toiletry preparations
    • A61K8/18Cosmetics or similar toiletry preparations characterised by the composition
    • A61K8/30Cosmetics or similar toiletry preparations characterised by the composition containing organic compounds
    • A61K8/64Proteins; Peptides; Derivatives or degradation products thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61QSPECIFIC USE OF COSMETICS OR SIMILAR TOILETRY PREPARATIONS
    • A61Q19/00Preparations for care of the skin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6472Cysteine endopeptidases (3.4.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6478Aspartic endopeptidases (3.4.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6489Metalloendopeptidases (3.4.24)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/34Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase
    • C12Q1/37Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving hydrolase involving peptidase or proteinase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Plant Pathology (AREA)
  • Birds (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Analytical Chemistry (AREA)
  • Dermatology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

Un procedimiento para generar una enzima proteolítica que tenga especificidad definida no conferida por el armazón proteico para al menos un sustrato diana que comprende al menos las siguientes etapas: (a) proporcionar un armazón proteico que tenga al menos 70 % de homología con tripsina humana I que tenga la secuencia de aminoácidos mostrada en SEC ID Nº: 1, que catalice al menos una reacción química en al menos un sustrato, (b) generar una biblioteca de enzimas proteolíticas o enzimas proteolíticas aisladas combinando un polinucleótido que codifica el armazón proteico de la etapa (a) mediante inserción o sustitución con 1 a 11 regiones determinantes de especificidad (SDR), en la que las SDR son secuencias oligonucleotídicas sintéticas completa o parcialmente aleatorias que codifican secuencias peptídicas con una longitud de menos de 50 restos aminoacídicos en una o más posiciones del grupo de posiciones dentro del polinucleótido que codifica el armazón proteico que corresponde estructuralmente o por homología de secuencia de aminoácidos a las regiones 18-25, 38-48, 54-63, 73-86, 122-130, 148-156, 165-171 y 194-204 en tripsina humana I que tiene la secuencia de aminoácidos mostrada en SEC ID Nº: 1, expresar dichas enzimas y (c) seleccionar de la biblioteca de enzimas proteolíticas generada en la etapa (b) una o más enzimas que tengan especificidades definidas no conferidas por el armazón proteico proporcionado en la etapa (a) para al menos un sustrato diana.

Description

Nuevas entidades biológicas y el uso de las mismas
La presente divulgación proporciona enzimas obtenidas por ingeniería genética comprendidas por un armazón proteico y Regiones Determinantes de Especificidad, la producción de tales enzimas y el uso de las mismas para fines terapéuticos, de investigación, de diagnóstico, de cuidado nutricional, de cuidado personal e industriales.
Antecedentes
La investigación académica e industrial busca continuamente proteínas funcionales para usarlas como agentes terapéuticos, de investigación, de diagnóstico, nutricionales, de cuidado personal o industriales. En la actualidad, tales proteínas funcionales pueden clasificarse principalmente en dos categorías: proteínas naturales y proteínas obtenidas por ingeniería. Las proteínas naturales, por un lado, se descubren en la naturaleza, por ejemplo cribando aislados naturales o secuenciando genomas de diversas especies. Las proteínas obtenidas por ingeniería genética, por otro lado, se basan normalmente en proteínas conocidas y se alteran para adquirir funcionalidades modificadas. En el presente documento se desvelan proteínas obtenidas por ingeniería genética con nuevas funciones en comparación con los componentes de partida. Tales proteínas se denominan NBE (Nuevas Entidades Biológicas). Las NBE desveladas son enzimas obtenidas por ingeniería genética con nuevas especificidades de sustrato o proteínas de fusión de tales enzimas obtenidas por ingeniería genética con otros componentes funcionales.
La especificidad es un elemento esencial de la función enzimática. Una célula consiste en miles de catalizadores altamente reactivos diferentes. Aún así la célula es capaz de mantener un metabolismo coordinado y una estructura tridimensional altamente organizada. Esto se debe en parte a la especificidad de las enzimas, es decir la conversión selectiva de sus sustratos respectivos. La especificidad es una propiedad cualitativa y cuantitativa: la especificidad de una enzima particular puede variar ampliamente, variando de solamente un tipo particular de moléculas diana a todos los tipos moleculares con ciertas subestructuras químicas. En la naturaleza, la especificidad de las enzimas de un organismo ha evolucionado a tenor de las necesidades particulares del organismo. Es poco probable encontrar especificidades arbitrarias con alto valor para aplicaciones terapéuticas, de investigación, de diagnóstico, nutricionales o industriales en el repertorio enzimático de cualquier organismo debido al gran espacio de posibles especificidades. El único modo realista de obtener tales especificidades es su generación de novo.
Cuando se comparan enzimas con agentes de unión, se proporciona un paradigma de especificidad por anticuerpos que reconocen epítopos individuales como estructuras pequeñas definidas dentro de moléculas grandes. El vasto intervalo de origen natural de especificidades de anticuerpo se atribuye a la diversidad generada por el sistema inmune en combinación con la selección natural. Varios mecanismos contribuyen al vasto repertorio de especificidad de anticuerpos y aparecen en diferentes etapas de la generación de respuesta inmune y maduración de anticuerpos (Janeway, C y col. (1999) Immunobiology, Elsevier Science Ltd., Garland Publishing, Nueva York). Específicamente, los anticuerpos contienen regiones determinantes de complementariedad (CDR) que interaccionan con el antígeno de una manera altamente específica y permiten la diferenciación incluso entre epítopos muy similares. La cadena ligera así como la pesada del anticuerpo contribuyen cada una con tres CDR al dominio de unión. En la naturaleza se usa la recombinación de diversos segmentos génicos combinados con mutagénesis adicional en la generación de CDR. Como resultado, las secuencias de los seis bucles de CDR son altamente variables en composición y longitud y esto forma la base de la diversidad de especificidades de unión en los anticuerpos. No se conoce un principio similar para la generación de una diversidad de especificidades catalíticas en la naturaleza.
La catálisis, es decir el aumento de la velocidad de una reacción química específica, es además de la unión la función proteica más importante. Las propiedades catalíticas, es decir enzimas, se clasifican de acuerdo con la reacción química que catalizan.
Las transferasas son enzimas que transfieren un grupo, por ejemplo, el grupo metilo o un grupo glucosilo, de un compuesto (generalmente considerado como donador) a otro compuesto (generalmente considerado como aceptor). Por ejemplo, las glucosiltransferasas (EC 2.4) transfieren restos glucosilo de una molécula donadora a una aceptora. Algunas de las glucosiltransferasas también catalizan la hidrólisis, que puede considerarse como transferencia de un grupo glucosilo del donador al agua. La subclase se subdivide adicionalmente en hexosiltransferasas (EC 2.4.1), pentosiltransferasas (EC 2.4.2) y las que transfieren otros grupos glucosilo (EC 2.4.99, Comité de Nomenclatura de la Unión Internacional de Bioquímica y Biología Molecular (NC-IUBMB)).
Las oxidorreductasas catalizan óxido-reducciones. El sustrato que se oxida se considera donador de hidrógeno o electrones. Las oxidoreductasas se clasifican como deshidrogenasas, oxidasas, mono- y dioxigenasas. Las deshidrogenasas transfieren hidrógeno de un donador de hidrógeno a una molécula aceptora de hidrógeno. Las oxidasas reaccionan con oxígeno molecular como aceptor de hidrógeno y producen productos oxidados así como peróxido de hidrógeno o agua. Las monooxigenasas transfieren un átomo de oxígeno del oxígeno molecular al sustrato y uno se reduce a agua. Por el contrario, las dioxigenasas catalizan la inserción de ambos átomos de oxígeno del oxígeno molecular al sustrato.
Las liasas catalizan reacciones de eliminación y de este modo generan dobles enlaces o, en la dirección inversa, cataliza las adiciones en dobles enlaces. Las isomerasas catalizan reordenamientos intramoleculares. Las ligasas
catalizan la formación de enlaces químicos a costa de consumo de ATP.
Finalmente, las hidrolasas son enzimas que catalizan la hidrólisis de enlaces químicos como C-O o C-N. La clasificación E. C. de estas enzimas generalmente las clasifica según la naturaleza del enlace hidrolizado y según la naturaleza del sustrato. Las hidrolasas tales como lipasas y proteasas desempeñan un papel importante en la naturaleza así como en aplicaciones técnicas de biocatalizadores. Las proteasas hidrolizan un enlace peptídico dentro de un contexto de un oligo- o polipéptido. Dependiendo del mecanismo catalítico las proteasas se agrupan en proteasas aspárticas, serina, cisteína, metalo- y treonina proteasas (Handbook of proteolytic enzymes. (1998) Eds: Barret, A; Rawling, N.; Woessner, J.; Academic Press, Londres). Esta clasificación se basa en las cadenas laterales de aminoácidos que son responsables de la catálisis y que se presentan normalmente en el sitio activo en orientación muy similar entre sí. El enlace escindible del sustrato se hace coincidir con los restos catalíticos debido a interacciones específicas entre las cadenas laterales de aminoácidos del sustrato y regiones complementarias de la proteasa (Perona, J. & Craik, C (1995) Protein Science, 4, 337-360). Los restos del extremo N- y C- terminal del enlace escindible se denominan habitualmente P1, P2, P3 etc. y P1’, P2’, P3’ y los bolsillos de unión complementarios al sustrato S1, S2, S3 y S1’, S2’, S3’, respectivamente (nomenclatura de acuerdo con Schlechter & Berger, Biochem. Biophys. Res. Commun. 27 (1967) 157-162). La selectividad de las proteasas puede variar ampliamente de ser prácticamente no selectivas, por ejemplo, las subtilisinas, pasando por una preferencia estricta en la posición P1, por ejemplo, la Tripsina que corta selectivamente en el extremo C-terminal de restos de arginina o lisina, hasta proteasas altamente específicas, por ejemplo activador de plasminógeno de tipo tisular humano (t-PA) que escinde en el extremo C-terminal de la arginina en la secuencia CPGRWG (Ding, L y col. (1995) Proc. Natl. Acad. Sci. USA 92, 7627-7631; Coombs, G y col. (1996) J. Biol. Chem. 271, 4461-4467).
La especificidad de las proteasas, es decir su capacidad para reconocer e hidrolizar preferentemente ciertos sustratos peptídicos, puede expresarse de forma cualitativa y cuantitativa. La especificidad cualitativa se refiere al tipo de restos aminoacídicos que se aceptan por una proteasa en ciertas posiciones del sustrato peptídico. Por ejemplo, la tripsina y t-PA se relacionan con respecto a su especificidad cualitativa, puesto que ambas de ellas requieren en la posición P1 una arginina o un resto similar. Por otro lado, la especificidad cuantitativa se refiere al número relativo de sustratos peptídicos que se aceptan como sustratos por la proteasa, o de forma más precisa, a las relaciones de kcat/kM relativas de la proteasa para los diferentes péptidos que se aceptan por la proteasa. Las proteasas que aceptan solamente una parte pequeña de todos los péptidos posibles tiene una alta especificidad, mientras que la especificidad de proteasas que, en caso extremo, escinden cualquier sustrato peptídico serían teóricamente cero.
La comparación de la estructura primaria, secundaria así como la terciaria de proteasas (Fersht, A., Enzyme Structure and Mechanism, W. H. Freeman and Company, Nueva York, 1995) permite la identificación de clases que muestran un alto grado de conservación (Rawlings, N.D. & Barrett, A.J. (1997) En: Proteolysis in Cell Functions Eds. Hopsu-Havu, V.K.; Jarvinen, M.; Kirschke, H, pág. 13-21, IOS Press, Ámsterdam). Un esquema ampliamente aceptado para la clasificación de proteasas se ha propuesto por Rawlings & Barrett (Handbook of proteolytic enzymes. (1998) Eds: Barret, A; Rawling, N.; Woessner, J.; Academic Press, Londres). Por ejemplo, la familia de serina proteasas puede subdividirse en clases estructurales con pliegues de quimiotripsina (clase S1), subtilisina (clase S8) y carboxipeptidasa (clase SC) cada una de las cuales incluye proteasas no específicas así como específicas (Rawlings, N.D. & Barrett, A.J. (1994) Methods Enzymol. 244, 19-61). Esto se aplica a otras familias de proteasa de forma análoga. Puede realizarse una distinción adicional de acuerdo con la localización relativa del enlace escindido en el sustrato. Las carboxi- y aminopeptidasas escinden aminoácidos de los extremos C- y Nterminal, respectivamente, mientras que las endopeptidasas cortan en cualquier lugar a lo largo del oligopéptido.
Muchas aplicaciones serían concebibles si estuvieran disponibles enzimas con un espectro de especificidades básicamente ilimitado. Sin embargo, el uso de tales enzimas con especificidad baja, alta o cualquiera definida está limitado en la actualidad a las que pueden aislarse de fuentes naturales. El campo de aplicación de estas enzimas varía de fines terapéuticos, de investigación, de diagnóstico, nutricionales a cuidado personal e industriales.
Los aditivos enzimáticos en detergentes han llegado a constituir casi un tercio del mercado de enzimas industriales completo. Las enzimas de detergentes incluyen proteinasas para retirar manchas orgánicas, lipasas para retirar manchas grasas, amilasas para retirar restos de alimentos con almidón y celulasas para restaurar superficie lisa de la fibra. La enzima de detergente mejor conocida es probablemente la proteinasa subtilisina no específica, aislada de diversas especies de Bacillus.
Las enzimas de almidón, tales como amilasas, ocupan la mayoría de las usadas en el procesamiento de alimentos. Mientras que las enzimas de almidón incluyen productos que son importantes para desencolado textil, fermentación alcohólica, procesamiento de papel y pulpa y aditivos de detergentes de lavandería, la mayor aplicación es para la producción de jarabe de maíz alto en fructosa. La producción de jarabe de maíz de almidón por medio de enzimas industriales fue una alternativa exitosa a la hidrólisis ácida.
Aparte del procesamiento de almidón, las enzimas se usan para una serie creciente de aplicaciones en alimentos. Las enzimas en los alimentos pueden mejorara la textura, apariencia y valor nutricional o pueden generar sabores y aromas deseables. Enzimas alimentarias usadas actualmente en panadería son amilasa, amiloglucosidasas, pentosanasas para rotura de pentosan y producción de gluten reducida o glucosa oxidasas para aumentar la
estabilidad de la masa. Son enzimas habituales para la industria láctea el cuajo (proteasa) como coagulante en la producción de queso, lactasa para hidrólisis de lactosa, proteasa para hidrólisis de proteínas del suero o catalasa para la retirada de peróxidos de hidrógeno. Las enzimas usadas en el procedimiento de fermentación son las anteriormente nombradas amilasas, pero también celulasas o proteasas para aclarar la cerveza de proteínas suspendidas. En vinos y zumos de frutas, la turbidez está provocada más habitualmente por almidón y pectinas de modo que las amilasas y pectinasas aumentan el rendimiento y clarificación. La papaína y otras proteinasas se usan para ablandar la carne.
También se han desarrollado enzimas para ayudar a los animales en la digestión del pienso. En el hemisferio occidental, el almidón es una fuente principal de alimento para vacas, cerdos y pollos. Para mejorar la biodisponibilidad de fosfato del maíz, se añade habitualmente fitasa (Wyss, M. y col. Biochemical characterization of fungal phytases (myo-inositol hexakisphosphate phosphohydrolases): Catalytic properties. Applied & Environmental Microbiology 65, 367-373 (1999)). Además, se ha mostrado que la hidrólisis del fitato proporciona mejoras en la capacidad de digestión de proteína y absorción de minerales tales como calcio (Bedford, M. R. & Schulze, H. EXOGENOUS ENZYMES FOR PIGS AND POULTRY [Revisión]. Nutrition Research Reviews 11, 91-114 (1998)). Otra enzima de pienso principal es xilanasa. Esta enzima es particularmente útil como un complemento para pienso alimentario que comprende más de aproximadamente 10 % de maíz, cebada, o centeno, debido a su contenido en fibra soluble relativamente alto. Las xilanasas provocan dos acciones importantes: reducción de viscosidad de los contenidos intestinales por hidrólisis de los arabinoxilanos de alto peso molecular de tipo gel en el pienso (Murphy, T., C., Bedford, M. R. & McCracken, K. J. Effect of a range of new xylanases on in vitro viscosity and on performance of broiler diets. British Poultry Science 44, S16-S18 (2003)) y rotura de polímeros en paredes celulares que mejora la biodisponibilidad de la proteína y almidón.
Los laboratorios de investigación y desarrollo de biotecnología usan de forma rutinaria enzimas especiales en cantidades pequeñas junto con muchos otros reactivos. Esas enzimas crean un mercado significativo para diversas enzimas. Enzimas como fosfatasa alcalina, peroxidasa de rábano rusticano y luciferasa son sólo algunos ejemplos. Las polimerasas de ADN termoestables como Taq polimerasa o endonucleasas de restricción revolucionaron el trabajo en laboratorio. Las enzimas terapéuticas son una clase particular de fármacos, clasificados por la FDA como agentes biológicos, con muchas ventajas en comparación con otros agentes farmacéuticos especialmente no biológicos. Son ejemplos de enzimas terapéuticas exitosas los factores de coagulación humanos como factor VIII y factor IX para tratamiento de seres humanos. Además, las enzimas digestivas se usan para diversas deficiencias en procesos digestivos humanos. Otros ejemplos son t-PA y estreptoquinasa para el tratamiento de enfermedad cardiovascular, beta-glucocerebrosidasa para el tratamiento de enfermedad de Gaucher de Tipo I, L-asparaginasa para el tratamiento de leucemia linfoblástica aguda y ADNasa para el tratamiento de fibrosis quística. Un problema importante en la aplicación de proteínas como agentes terapéuticos es su potencial inmunogenicidad. Para reducir este riesgo, se preferirían enzimas de origen humano, lo que estrecha el conjunto de enzimas disponibles. La provisión de enzimas diseñadas, preferentemente de origen humano, con nuevas especificidades adaptadas permitiría la modificación específica de sustratos diana a voluntad, minimizando el riesgo de inmunogenicidad. Una ventaja adicional de enzimas altamente específicas como agentes terapéuticos sería su menor riesgo de efectos secundarios. Debido a la posibilidad limitada de interacciones específicas entre una molécula pequeña y una proteína, la unión a proteínas no diana y por lo tanto los efectos secundarios son bastante comunes y con frecuencia provocan la terminación de un compuesto candidato de otro modo prometedor. Las enzimas específicas, por otro lado, proporcionan muchos sitios de contacto y mecanismos para diferenciar el sustrato y por lo tanto permiten una mayor especificidad y de este modo menos actividades secundarias.
Las proteasas representan una clase importante de agentes terapéuticos (Drugs of today, 33, 641-648 (1997)). Sin embargo, en la actualidad la proteasa terapéutica es habitualmente un sustituto de actividad insuficiente de las proteasas del propio cuerpo. Por ejemplo, el factor VII puede administrase en ciertos casos de deficiencias de coagulación de hemorragias o durante la cirugía (Heuer L.; Blumenberg D. (2002) Anaesthesist 51:388). Se aplica activador de plasminógeno de tipo tisular (t-PA) en infarto cardiaco agudo, lo que inicia la disolución de coágulos de fibrina a través de escisión específica y activación de plasminógeno (Verstraete, M. y col. (1995) Drugs, 50, 29-41). Hasta el momento se genera una proteasa con especificidad adaptada para proporcionar un agente terapéutico que activa o inactiva específicamente una proteína diana relacionada con la enfermedad.
Los anticuerpos monoclonales representan otra clase biológica importante de sustancias con capacidades terapéuticas. Una de las principales dianas de anticuerpo son los factores de necrosis tumoral (TNF) que pertenecen a la familia de las citocinas. Los TNF desempeñan un papel principal en el proceso de inflamación. Como homotrímeros podrían unirse a receptores de casi cada célula. Activan una multiplicidad de genes celulares, múltiples mecanismos de transducción de señal, quinasas y factor de transcripción. Los TNF más importantes son TNF-alfa y TNF-beta. TNF-alfa se produce por macrófagos, monocitos y otras células. TNF-alfa es un mediador de inflamación. Por lo tanto, la investigación de la última década se ha centrado en inhibidores de TNF-alfa como anticuerpos monoclonales como posibles agentes terapéuticos para diferentes indicaciones terapéuticas como Artritis Reumatoide, enfermedad de Crohn o psoriasis (Hamilton y col. (2000) Expert Opin Pharmacother, 1 (5): 1041-1052). Una de las principales desventajas de los anticuerpos monoclonales son sus altos costes, de modo que son de gran importancia nuevas alternativas biológicas.
Existen muchos ejemplos de enzimas modificadas por ingeniería genética en la bibliografía. Fulani y col. (Fulani F. y
col. (2003) Protein Engineering 16, 515-519) describen una rodanasa (tiosulfato:cianuro sulfurtransferasa) de Azetobacter vinelandii que tiene un dominio catalítico estructuralmente relacionado con la subunidad catalítica de las enzimas sulfatasas Cdc25. La diferencia del mecanismo catalítico depende del diferente tamaño del sitio activo. Tanto rodanasa como fosfatasa son altamente específicas en diferentes sustratos (sulfato frente a fosfato). El mecanismo catalítico de la rodanasa podría desplazarse hacia serina/treonina fosfatasa por inserción de resto sencillo. Por lo tanto, Fulani y col. proporciona un ejemplo sencillo para el cambio de un mecanismo catalítico por comparación estructural y alineamiento de secuencia de enzimas conocidas en la naturaleza de diferentes clases enzimáticas pero carecen de una indicación de cómo generar una especificidad de sustrato definible por el usuario manteniendo el mismo mecanismo catalítico.
La tiorredoxina reductasa descrita por Briggs y col. (documento WO 02/090300 A2) tiene una especificidad de cofactor alterada que se une preferentemente a NADPH en comparación con NADH. Por lo tanto, ambas enzimas, el punto de partida así como la enzima obtenida por ingeniería genética resultante son altamente específicas para sustratos diferentes. Los métodos para conseguir una especificidad de sustrato alterada tal son procedimientos de procesamiento computacional o alineamiento de secuencia de proteínas relacionadas para definir restos variables y conservados. Todos tienen en común que se basan en la comparación de estructuras y secuencias de proteínas con especificidades conocidas seguido de la transferencia de las mismas a otra cadena principal.
Existen otros ejemplos de enzima con especificidad modificada por ingeniería genética y, en particular, de proteasas que se han publicado en la bibliografía. Ninguno de estos ejemplos, sin embargo, proporciona un medio para generar nuevas especificidades en comparación con la especificidad del material de partida usado dentro de los procedimientos descritos. Los procedimientos varían de mutaciones de punto sencillo dirigidas a la estructura (Kurth,
T. y col. (1998) Biochemistry 37, 11434-11440; Ballinger, M y col. (1996) Biochemistry, 35:13579-13585), intercambio de bucles superficiales entre dos proteasas específicas (Horrevoets y col. (1993) J. Biol. Chem. 268, 779-782), a mutagénesis aleatoria regio-selectiva o a lo largo del gen completo en combinación con selección in vivo
o in vitro (Sices, H. & Kristie, T. (1998) Proc. Natl. Acad. Sci. USA, 95, 2828-2833).
El diseño racional de la especificidad de proteasa se limita a muy pocos ejemplos. Este enfoque está gravemente limitado por el insuficiente entendimiento de las complejidades que gobiernan el plegamiento y la dinámica así como las relaciones de función-estructura en las proteínas (Corey, M.J. & Corey, E. (1996) Proc. Natl. Acad. Sci. USA, 93:11428-11434). Es por lo tanto difícil alterar la secuencia de aminoácidos primaria de una proteasa para cambiar su actividad o especificidad de una manera predecible. En un ejemplo exitoso, Kurth y col. modificaron por ingeniería genética tripsina para que mostrara una preferencia por un motivo dibásico (Kurth, T. y col. (1998) Biochemistry, 37:11434-11440). En otro ejemplo, Hedstrom y col. convirtieron la especificidad del sustrato de S1 de tripsina a la de quimiotripsina (Hedstrom, L. y col. (1992) Science, 255:1249-1253). Este es un ejemplo en el que una propiedad conocida se transfirió de una cadena principal a otra.
Ballinger y col. (documento WO 96/27671) describen variantes de subtilisina con mutaciones de combinación (N62D/G166D y opcionalmente Y104D) que tiene un desplazamiento de especificidad de sustrato hacia sustratos peptídicos o polipeptídicos con aminoácidos básicos en las posiciones P1, P2 y P4 del sustrato. Los sustratos adecuados de la subtilisina variante se revelaron buscando en una biblioteca de partículas de fago (fago sustrato) que contenía cinco restos de seleccionados de forma aleatoria contiguos. Estas variantes de subtilisina son útiles para escindir proteínas de fusión con engarces de sustrato básico y procesar hormonas u otras proteínas (in vitro o in vivo) que contienen sitios de escisión básicos. Los problemas asociados con el rediseño racional de enzimas puede superarse parcialmente por evolución dirigida (como se desvela en el documento PCT/EP03/04864). Estos estudios pueden clasificarse por sus sistemas de expresión y selección. La selección genética significa producir dentro de un organismo una enzima, por ejemplo una proteasa, que es capaz de escindir una proteína precursora que a su vez da como resultado una alteración del comportamiento de crecimiento del organismo productor. A partir de una población de organismos con diferentes proteasas pueden seleccionarse los que tengan un comportamiento de crecimiento alterado. Este principio se indicó por ejemplo por Davis y col. (documentos US 5258289, WO 96/21009). La producción de un sistema de fago depende de la escisión de una proteína de fago que sólo puede activarse en presencia de una enzima proteolítica que es capaz de escindir la proteína de fago. Otros enfoques usan un sistema indicador que permite una selección por cribado en lugar de una selección genética, pero tampoco pueden superar la insuficiencia intrínseca de la caracterización intracelular de las enzimas.
También se han indicado sistemas para generar enzimas con especificidades alteradas con enzimas autosecretoras. Duff y col. (documento WO 98/11237) describen un sistema de expresión para una proteasa autosecretora. Un elemento esencial del diseño experimental es que la reacción catalítica actúa en la proteasa en sí misma por un procesamiento autoproteolítico de la molécula precursora unida a membrana para liberar la proteasa madura de la membrana celular al ambiente extracelular. Por lo tanto, debe construirse una proteína de fusión en la que la secuencia peptídica diana reemplace al sitio de escisión natural para autoproteólisis. Las limitaciones de un sistema tal son que las proteasas identificadas de forma segura tendrá la capacidad de escindir una cierta secuencia de aminoácidos pero también pueden escindir muchas otras secuencias peptídicas. Por lo tanto, no se puede conseguir alta especificidad de sustrato. Además, un sistema tal no es capaz de controlar que las proteasas seleccionadas se escindan en una posición específica en una secuencia de aminoácidos definida y no permite una caracterización precisa de las constantes cinéticas de las proteasas seleccionadas (kcat, KM).
Se ha descrito un procedimiento que se dirige a la generación de nuevas actividades catalíticas y especificidades dentro de las proteínas de barril α/β (documento WO 01/42432; Fersht y col, Methods of producing novel encimes; Altamirano y col (2000) Nature 403, 617-622). Las proteínas de barril α/β comprenden una gran superfamilia de proteínas que representan una fracción grande de todas las enzimas conocidas. La estructura de las proteínas se compone de un barril α/β rodeado de hélices α. Los bucles que conectan las cadenas β y las hélices comprenden la llamada estructura de tapa que incluye los restos de sitio activo. El procedimiento se basa en la clasificación de proteínas de barril α/β en dos clases basándose en la estructura de la tapa catalítica. Una comparación exhaustiva de estructuras proteicas de barril α/β condujo a los autores a la conclusión de que la unión de sustrato y especificidad se define principalmente por la estructura de barril mientras que la especificidad de la reacción química reside dentro de los bucles. Se sugiere que los barriles y estructuras de tapa de diferentes enzimas pueden combinarse para generar nuevas actividades enzimáticas y para proporcionar un punto de partida para ajustar las propiedades por mutagénesis dirigida o aleatoria y selección. El procedimiento no proporciona la generación de especificidad definida por el usuario.
En resumen, resulta evidente que existen muchas aplicaciones posibles en los campos de agentes terapéuticos, investigación y diagnóstico, enzimas industriales, procesamiento de alimentos y piensos, cosmética y otras áreas que resultarían posibles mediante la disponibilidad de enzimas con una nueva especificidad de sustrato. Sin embargo, solamente se ha identificado un número limitado de enzimas específicas de fuentes naturales hasta la fecha. Los procedimientos de diseño racional para modificar, alterar, convertir o transferir especificidad de secuencia así como enfoques aleatorios descritos anteriormente no permitieron la generación de una nueva especificidad definible por el usuario que no estaba presente en el material de partida empleado.
Por lo tanto, ninguno de los procedimientos actualmente disponibles puede proporcionar enzimas con una nueva especificidad de secuencia definible por el usuario. Por el contrario, la presente invención proporciona tales enzimas así como procedimientos para generarlas.
Sumario de la invención
El objetivo es proporcionar proteínas modificadas por ingeniería genética con nuevas funciones que no existen en los componentes usados para la ingeniería genética de tales proteínas. En particular, la divulgación proporciona enzimas con especificidades definibles por el usuario. La especificidad definible por el usuario significa que se proporcionan enzimas con especificidades que no existen en los componentes usados para la ingeniería genética de tales enzimas. Las especificidades pueden seleccionarse por el usuario de modo que se reconoce preferentemente uno o más sustratos diana pretendidos y se convierten por las enzimas. Además, la divulgación proporciona enzimas que poseen esencialmente secuencias idénticas a proteínas humanas pero tienen especificidades diferentes. En una realización particular, la divulgación proporciona proteasas con especificidades definibles por el usuario.
Además, la presente divulgación se refiere a enzimas obtenidas por ingeniería genética que se fusionan con uno o más componentes funcionales adicionales. Estos componentes adicionales pueden ser componentes proteicos que preferentemente tienen propiedades de unión y son del grupo que consiste en dominios de unión a sustrato, anticuerpos, receptores o fragmentos de los mismos. Además, estos componentes adicionales pueden ser componentes funcionales adicionales, preferentemente seleccionándose del grupo que consiste en polietilenglicoles, carbohidratos, lípidos, ácidos grasos, ácidos nucleicos, metales, quelados metálicos y fragmentos o derivados de los mismos. Las proteínas de fusión resultantes se entienden como enzimas con especificidades definibles por el usuario.
Además, la divulgación se refiere a la aplicación de tales enzimas con nuevas especificidades definibles por el usuario para fines terapéuticos, de investigación, diagnósticos, nutricionales, de cuidado personal o industriales. Además, la divulgación se refiere a un procedimiento para generar enzimas obtenidas por ingeniería genética con especificidades definibles por el usuario. En particular, la divulgación se refiere a generar enzimas que posean secuencias esencialmente idénticas a enzimas humanas pero que tengan especificidades diferentes.
Este problema se ha resuelto por las realizaciones especificadas en la descripción posterior y en las reivindicaciones. La presente divulgación se refiere por lo tanto a
(1) una enzima proteolítica con actividad catalítica de especificidad definida no conferida por el armazón proteico y caracterizada por una combinación de los siguientes componentes:
(a)
un armazón proteico que tiene al menos 90 % de homología con la tripsina humana I que tiene la secuencia de aminoácidos mostrada en SEC ID Nº: 1 y que es capaz de catalizar al menos una escisión peptídica en al menos un sustrato peptídico diana y
(b)
una o más regiones determinantes de especificidad insertadas o sustituidas con el armazón proteico en sitios en el armazón proteico que permiten que la enzima proteolítica resultante distinga el sustrato diana en tantos sitios como sea necesario para hidrolizar preferentemente el sustrato diana frente a uno o más otros sustratos y sustituyéndose o insertándose las regiones determinantes de especificidad en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 18
25, 38-48, 54-63, 73-86, 122-130, 148-156, 165-171 y 194-204 en tripsina humana I que tiene la secuencia de aminoácidos mostrada en SEC ID Nº: 1, y siendo las regiones determinantes de especificidad secuencias peptídicas que tienen una longitud de menos de 50 restos aminoacídicos;
(2) el uso de una enzima proteolítica como se ha definido en (1) anteriormente para fines terapéuticos, de 5 investigación, diagnósticos, nutricionales, de cuidado personal o industriales;
(3) un procedimiento para generar una enzima proteolítica como se ha definido en (1) anteriormente que tiene especificidad definida para al menos un sustrato diana, no estando presente dicha especificidad en los componentes de partida individuales, que comprende al menos las siguientes etapas:
(a) proporcionar un armazón proteico que tiene al menos 90 % de homología con tripsina humana I
10 que tiene la secuencia de aminoácidos mostrada en SEC ID Nº: 1, que cataliza al menos una reacción química en al menos un sustrato diana,
(b) generar una biblioteca de enzimas proteolíticas o enzimas proteolíticas aisladas combinando un polinucleótido que codifica el armazón proteico de la etapa (a) mediante inserción o sustitución con de 1 a 11 secuencias oligonucleotídicas sintéticas parcial o completamente aleatorias que codifican 15 secuencias peptídicas con una longitud de menos de 50 restos aminoacídicos en una o más posiciones del grupo de posiciones dentro del polinucleótido que codifica el armazón proteico que corresponde estructuralmente o por homología de secuencia de aminoácidos a las regiones 18-25, 38-48, 54-63, 73-86, 122-130, 148-156, 165-171 y 194-204 en tripsina humana I que tiene la secuencia de aminoácidos mostrada en SEC ID Nº: 1, que expresa dichas enzimas y (c)
20 seleccionando de la biblioteca de enzimas proteolíticas generadas en la etapa (b) una o más enzimas que tienen especificidades definidas no conferidas por el armazón proteico proporcionado en la etapa (a) para al menos un sustrato diana;
(4) una proteína de fusión que está comprendida por al menos una enzima proteolítica como se ha definido en (1) anteriormente y
25 (i) al menos un componente proteico adicional, seleccionándose preferentemente del grupo que consiste en dominios de unión, receptores, anticuerpos, dominios de regulación, pro-secuencias y fragmentos de los mismos y/o
(ii) al menos un componente funcional adicional, seleccionándose preferentemente del grupo que
consiste en polietilenglicoles, carbohidratos, lípidos, ácidos grasos, ácidos nucleicos, metales y 30 quelados metálicos;
(5) una composición o composición farmacéutica que comprende una o más enzimas proteolíticas como se ha definido en (1) anteriormente o una proteína de fusión como se ha definido en (4) anteriormente, pudiendo comprender opcionalmente dicha composición farmacéutica un vehículo, excipiente y/o agente adyuvante aceptable;
35 (6) un ácido nucleico que codifica una enzima proteolítica como se ha definido en (1) anteriormente o una proteína de fusión como se ha definido en (4) anteriormente;
(7)
un vector que comprende el ácido nucleico como se ha definido en (6) anteriormente;
(8)
una célula huésped u organismo transgénico que se transforma/transfecta con un vector como se ha
definido en (7) anteriormente o que comprende el ácido nucleico como se ha definido en (6) anteriormente 40 y;
(9) un procedimiento para producir la enzima proteolítica como se ha definido en (1) anteriormente o una proteína de fusión como se ha definido en (4) anteriormente que comprende cultivar una célula u organismo como se ha definido en (8) anteriormente y opcionalmente aislar la enzima del caldo de cultivo.
Breve descripción de las figuras
45 Las siguientes figuras se proporcionan para explicar adicionalmente la presente invención en complemento a la descripción detallada:
La Figura 1 ilustra la estructura tridimensional de tripsina humana I con los restos del sitio activo mostrados en representación de “bolas y varillas” e indicando las regiones marcadas sitios de inserción de SDR potenciales.
50 La Figura 2 muestra el alineamiento de la secuencia de aminoácidos primaria de tres miembros de la familia S1 de la clase de serina proteasa: tripsina humana I, alfa trombina humana y enteropeptidasa humana (véase también SEC ID Nº: 1, 5 y 6).
La Figura 3 ilustra la estructura tridimensional de subtilisina mostrándose los restos del sitio activo en representación de “bolas y varillas” indicando las regiones numeradas sitios de inserción de SDR
potenciales.
La Figura 4 muestra el alineamiento de las secuencias de aminoácidos primarias de cuatro miembros de la familia de la clase S8 de serina proteasa: subtilisina E, furina, PC1 y PC5 (véase también SEC ID Nº: 7-10).
La Figura 5 ilustra la estructura tridimensional de pepsina mostrándose los restos de sitio activo en representación de “bolas y varillas” indicado en las regiones numeradas en sitios de inserción de SDR potenciales.
La Figura 6 muestra el alineamiento de las secuencias de aminoácidos primarias de tres miembros de la familia de proteasa de ácido aspártico A1: pepsina, β-secretasa y catepsina D (véase también SEC ID Nº: 11-13).
La Figura 7 ilustra la estructura tridimensional de caspasa 7 mostrándose los restos del sitio activo en representación “bolas y varillas” indicando las regiones numeradas sitios de inserción de SDR potenciales.
La Figura 8 muestra la secuencia de aminoácidos primaria de caspasa 7 como un miembro de la familia de clase C14 de cisteína proteasa (véase también SEC ID Nº: 14).
La Figura 9 representa esquemáticamente el tercer aspecto de la divulgación.
La Figura 10 muestra un análisis de transferencia de Western de un sobrenadante de cultivo de células que expresan variantes de tripsina humana I con SDR1 y SDR2, en comparación con controles negativos.
La Figura 11 muestra el transcurso en el tiempo de la escisión proteolítica de un sustrato diana por tripsina humana I.
La Figura 12 muestra las actividades relativas de tres variantes de enzimas proteolíticas obtenidas por ingeniería genética en comparación con tripsina humana I en dos sustratos peptídicos diferentes.
La Figura 13 muestra las especificidades relativas de tripsina humana I y variantes de enzimas proteolíticas obtenidas por ingeniería genética con una o dos SDR, respectivamente.
La Figura 14 muestra las especificidades relativas de tripsina humana I y de variantes de enzimas proteolíticas obtenidas por ingeniería genética que son específicas para TNF-alfa humano con este armazón en péptidos con una secuencia diana de TNF-alfa humano.
La Figura 15 muestra la reducción de citotoxicidad inducida por TNF-alfa cuando se incuba el TNF-alfa con sobrenadante concentrado de cultivos que expresan las enzimas proteolíticas obtenidas por ingeniería genética que son específicas para TNF-alfa humano.
La Figura 16: muestra la reducción de citotoxicidad inducida por TNF-alfa cuando se incuba el TNF-alfa con enzima proteolítica obtenida por ingeniería genética purificada que es específica para TNF-alfa humano.
La Figura 17 compara la actividad de enzimas proteolíticas obtenidas por ingeniería genética que son específicas para TNF-alfa humano con la actividad de tripsina humana I en dos sustratos proteicos: (a) TNF-alfa humano; (b) mezcla de proteínas del suero humanas.
La Figura 18 muestra la actividad específica de una enzima proteolítica obtenida por ingeniería genética con especificidad para VEGF humano.
Definiciones
En el marco de la presente invención se usan los siguientes términos y definiciones.
El término “proteasa” significa cualquier molécula proteica que es capaz de hidrolizar enlaces peptídicos. Esto incluye enzimas proteolíticas artificiales o de origen natural, así como variantes de las mismas obtenidas por mutagénesis dirigida o aleatoria o cualquier otro procedimiento de ingeniería proteica, cualquier fragmento activo de una enzima proteolítica o cualquier complejo molecular o proteína de fusión que comprende una de las proteínas anteriormente mencionadas. Una “quimera de proteasas” significa una proteína de fusión de dos o más fragmentos derivados de diferentes proteasas parentales.
El término “sustrato” significa cualquier molécula que pueda convertirse catalíticamente por una enzima. La expresión “sustrato peptídico” significa cualquier péptido, oligopéptido o molécula proteica de cualquier composición, secuencia o longitud de aminoácidos, que contiene un enlace peptídico que puede hidrolizarse catalíticamente por una proteasa. El enlace peptídico que se hidroliza se denomina “sitio de escisión”. La numeración de las posiciones en el sustrato se realiza de acuerdo con el sistema introducido por Schlechter & Berger (Biochem. Biophys. Res Commun. 27 (1967) 157-162). Los restos aminoacídicos adyacentes N-terminal al sitio de escisión se numeran P1, P2, P3, etc., mientras que los restos adyacentes C-terminal al sitio de escisión se numeran P1', P2', P3', etc.
La expresión “sustrato diana” describe un sustrato definido por el usuario que se reconoce específicamente y se convierte por una enzima de acuerdo con la invención. La expresión “sustrato peptídico diana” describe un sustrato peptídico definido por el usuario. La expresión “especificidad de diana” describe la especificidad cualitativa y cuantitativa de una enzima que es capaz de reconocer y convertir un sustrato diana. Las propiedades catalíticas de las enzimas se expresan usando los parámetros cinéticos “KM“ o “constante de Michaelis Menten”, “kcat“ o “constante de velocidad catalítica”, y “kcat/kM” o “eficacia catalítica”, de acuerdo con las definiciones de Michaelis y Menten (Fersht, A., Enzyme Structure and Mechanism, W. H. Freeman and Company, Nueva York, 1995). La expresión “actividad catalítica” describe cuantitativamente la conversión de un sustrato dado en condiciones de reacción definidas.
El término “especificidad” significa la capacidad de una enzima para reconocer y convertir preferentemente ciertos sustratos. La especificidad puede expresarse cualitativa y cuantitativamente. “Especificidad cualitativa” se refiere a la naturaleza química de los restos de sustrato que se reconocen por una enzima. “Especificidad cuantitativa” se refiere al número de sustratos que se aceptan como sustratos. La especificidad cuantitativa puede expresarse por el término s, que se define como el logaritmo negativo del número de todos los sustratos aceptados dividido por el número de todos los posibles sustratos. Las proteasas, por ejemplo, que aceptan preferentemente una parte pequeña de todos los posibles sustratos peptídicos tienen una “alta especificidad”. Las proteasas que aceptan casi cualquier sustrato peptídico tienen una “baja especificidad”. Se realizan definiciones de acuerdo con el documento WO 03/095670. Las proteasas con muy baja especificidad también se denominan “proteasas no específicas”. La expresión “especificidad definida” se refiere a un cierto tipo de especificidad, es decir, a un cierto sustrato diana o un conjunto de ciertos sustratos diana que se convierten preferentemente frente a otros sustratos.
La expresión “obtenido por ingeniería genética” en combinación con el término “enzima” describe una enzima que está comprendida por diferentes componentes y que tiene características no conferidas por los componentes individuales por sí solos.
La expresión “armazón proteico” o “proteína de armazón” se refiere a una diversidad de estructuras polipeptídicas primarias, secundarias y terciarias.
La expresión “secuencia peptídica” indica cualquier secuencia peptídica usada para inserción o sustitución en o combinación con un armazón proteico. Las secuencias peptídicas se obtienen habitualmente por expresión de secuencias de ADN que pueden sintetizarse de acuerdo con técnicas bien establecidas o pueden obtenerse de fuentes naturales. La inserción, sustitución o combinación de secuencias peptídicas con el armazón proteico se generan por inserción, sustitución o combinación de oligonucleótidos en o con un polinucleótido que codifica el armazón proteico. El término “sintético” en combinación con la expresión “secuencia peptídica” se refiere a secuencias peptídicas que no están presentes en el armazón proteico en el que las secuencias peptídicas se insertan o sustituyen o con las que se combinan.
El término “componentes” en combinación con la expresión “enzima obtenida por ingeniería genética” se refiere a secuencias peptídicas o polipeptídicas que se combinan en la modificación por ingeniería genética de tales enzimas. Tales componentes pueden entre otros comprender uno o más armazones proteicos y una o más secuencias peptídicas sintéticas. La expresión “biblioteca de enzimas obtenidas por ingeniería genética” describe una mezcla de enzimas obtenidas por ingeniería genética, por lo que cada enzima obtenida por ingeniería genética sencilla se codifica por una secuencia polinucleotídica diferente. La expresión “genoteca” indica una biblioteca de polinucleótidos que codifica la biblioteca de enzimas obtenidas por ingeniería genética. El término “SDR” o “región determinante de especificidad” se refiere a una secuencia peptídica sintética que proporciona la especificidad definida cuando se combina con el armazón proteico en sitios que permiten que las enzimas resultantes diferencien entre el sustrato diana y uno o más otros sustratos. Tales sitios se denominan “sitios SDR”.
Las expresiones “estructura terciaria similar a la estructura de” y “estructura terciaria similar” en combinación con los términos “enzima” o “proteína” se refieren a proteínas en las que el tipo, secuencia, conectividad y orientación relativa de los elementos estructurales secundarios típicos de una proteína, por ejemplo, hélices alfa, láminas beta, giros beta y bucles, son similares y las proteínas se agrupan por lo tanto en la misma clase o pliegue estructural o topológico. Esto incluye proteínas que tienen elementos estructurales alterados, adicionales o suprimidos de cualquier tipo pero una topología en lo demás no cambiada. Los ejemplos de tales clases estructurales son la superfamilia de TNF, el pliegue S1 o el pliegue S8 dentro de las serina proteasas, los GPCR o el pliegue de barril α/β.
La expresión “posiciones que corresponden estructuralmente” indica aminoácidos en proteínas de estructura terciaria similar que se corresponden estructuralmente entre sí, es decir se localizan habitualmente dentro del mismo elemento estructural o topológico de la estructura. Dentro del elemento estructural poseen las mismas posiciones relativas con respecto al comienzo y al final del elemento estructural. Si, por ejemplo, la comparación topológica de dos proteínas revela dos secuencias estructuralmente correspondientes de diferente longitud, entonces los aminoácidos dentro de, por ejemplo 20 % y 40 % de las longitudes de región respectivas, corresponden estructuralmente entre sí.
La expresión “biblioteca de enzimas obtenidas por ingeniería genética” se refiere a una multiplicidad de enzimas o
variantes de enzima, que pueden existir como una mezcla o en forma aislada.
Los restos aminoacídicos se abrevian de acuerdo con la siguiente Tabla 1 en código de una o tres letras. Tabla 1: Abreviaturas de aminoácidos
Abreviaturas
Aminoácidos
A
Ala Alanina
C
Cys Cisteína
D
Asp Ácido Aspártico
E
Glu Ácido glutámico
F
Phe Fenilalanina
G
Gly Glicina
H
His Histidina
I
lie Isoleucina
K
Lys Lisina
L
Leu Leucina
M
Met Metionina
N
Asn Asparagina
P
Pro Prolina
Q
Gln Glutamina
R
Arg Arginina
S
Ser Serina
T
Thr Treonina
V
Val Valina
W
Trp Triptófano
Y
Tyr Tirosina
Descripción detallada de la invención
5 La presente divulgación proporciona proteínas obtenidas por ingeniería genética con nuevas funciones. En particular, la divulgación proporciona enzimas con especificidades definibles por el usuario. En una realización particular, la divulgación proporciona proteasas con especificidades definibles por el usuario. Además, la divulgación proporciona aplicaciones de tales enzimas con nuevas especificidades definibles por el usuario para fines terapéuticos, de investigación, de diagnóstico, nutricionales, de cuidado personal o industriales. Además, la
10 divulgación proporciona un procedimiento para generar enzimas con especificidades que no están presentes en los componentes usados para la ingeniería genética de tales enzimas. En particular, la divulgación se refiere a la generación de enzimas que tienen secuencias que son esencialmente idénticas a enzimas de mamífero especialmente humanas pero que tienen diferentes especificidades. Además, la divulgación proporciona bibliotecas de enzimas obtenidas por ingeniería genética específicas con especificidades correspondientes codificadas
15 genéticamente, un procedimiento para la generación de bibliotecas de enzimas obtenidas por ingeniería genética específicas con especificidades correspondientes codificadas genéticamente y la aplicación de tales bibliotecas para fines técnicos, diagnósticos, nutricionales, de cuidado personal o de investigación.
Un primer aspecto desvela enzimas obtenidas por ingeniería genética con especificidades definidas. Estas enzimas obtenidas por ingeniería genética se caracterizan por los siguientes componentes:
20 (a) un armazón proteico capaz de catalizar al menos una reacción química en un sustrato y
(b) uno o más regiones determinantes de especificidad (SDR) localizadas en sitios en el armazón proteico que permiten que la proteína obtenida por ingeniería genética resultante diferencie entre al menos un sustrato diana y uno o más diferentes sustratos, siendo las SDR esencialmente secuencias peptídicas sintéticas.
25 Preferentemente, dicha especificidad definida de las enzimas obtenidas por ingeniería genética no se confiere por el
armazón proteico.
En principio, el armazón proteico puede tener una diversidad de estructuras primarias, secundarias y terciarias. La estructura primaria, es decir, la secuencia de aminoácidos, puede ser una secuencia obtenida por ingeniería genética o puede derivarse de cualquier origen viral, procariota o eucariota. Para uso terapéutico humano, sin embargo, el armazón proteico es preferentemente de origen mamífero y más preferentemente de origen humano. Además, el armazón proteico es capaz de catalizar una o más reacciones químicas y tiene preferentemente solamente una especificidad baja.
Preferentemente, se usan derivados del armazón proteico que tienen secuencias de aminoácidos modificadas que confieren características mejoradas para la aplicabilidad como armazones proteicos. Tales características mejoradas comprenden, pero sin limitación, estabilidad; rendimiento de expresión o secreción; plegamiento, en particular después de combinación del armazón proteico con SDR; aumento o disminución de la sensibilidad a reguladores tales como activadores o inhibidores; inmunogenicidad; velocidad catalítica; kM o afinidad de sustrato.
Las enzimas obtenidas por ingeniería genética revelan su especificidad cuantitativa de las secuencias peptídicas sintéticas que se combinan con el armazón proteico. Por lo tanto, las secuencias peptídicas obtenidas por ingeniería genética actúan como regiones determinantes de especificidad o SDR. El número, la longitud y las posiciones de tales SDR pueden variar en un amplio intervalo. El número de SDR dentro del armazón es al menos una, preferentemente más de una, más preferentemente entre dos y once, más preferentemente entre dos y seis. Las SDR tienen una longitud entre uno y 50 restos aminoacídicos, preferentemente una longitud de entre uno y 15 restos aminoacídicos, más preferentemente una longitud de entre uno y seis restos aminoacídicos. Como alternativa, las SDR tienen una longitud de entre dos y 20 restos aminoacídicos, preferentemente una longitud de entre dos y diez restos aminoacídicos, más preferentemente una longitud de entre tres y ocho restos aminoacídicos.
Las enzimas obtenidas por ingeniería genética pueden describirse adicionalmente como moléculas proteicas de tipo anticuerpo que comprenden regiones constantes y variables, pero que tienen una cadena principal no de inmunoglobulina y que tienen un sitio activo (actividad catalítica) en la región constante, por lo que la especificidad de sustrato del sitio activo se modula por la región variable. Preferentemente, como en la estructura de inmunoglobulina, las regiones variables son bucles de longitud y composición variable que interaccionan con una molécula diana.
En particular, las enzimas obtenidas por ingeniería genética tienen actividad hidrolasa. En una variante preferida, las enzimas obtenidas por ingeniería genética tienen actividad proteolítica. Son armazones proteicos particularmente preferidos para esta variante proteasas no específicas o partes de proteasas no específicas o derivan de otro modo de proteasas no específicas. Las expresiones “derivado de” o “un derivado del mismo” con respecto a esto y en las siguientes variantes y realizaciones se refieren a derivados de proteínas que mutan en una o más posiciones aminoacídicas y/o tienen una homología de al menos el 70 %, preferentemente del 90 %, más preferentemente del 95 % y más preferentemente del 99 %, que se procesan proteolíticamente, que tienen un patrón de glucosilación alterado, que se unen covalentemente a sustancias no proteicas, que se fusionan con dominios proteicos adicionales, que tienen truncamientos C terminales y/o N terminales, y/o que tienen inserciones, sustituciones y/o deleciones específicas. Como alternativa, “derivado de” puede referirse a derivados que son combinaciones o quimeras de dos o más fragmentos de dos o más proteínas, cada una de los cuales comprende opcionalmente cualquiera o todas las modificaciones anteriormente mencionadas. La estructura terciaria del armazón proteico puede ser de cualquier tipo. Preferentemente, sin embargo, la estructura terciaria pertenece a una de las siguientes clases estructurales: clase S1 (pliegue de quimiotripsina de la familia de serina proteasas), clase S8 (pliegue de subtilisina de la familia de serina proteasas), clase SC (pliegue de carboxipeptidasa de la familia de serina proteasas) clase A1 (pliegue de pepsina A de las proteasas aspárticas) o clase C14 (pliegue de caspasa-1 de las cisteína proteasas). Son ejemplos de proteasas que pueden actuar como el armazón proteico de enzimas proteolíticas obtenidas por ingeniería genética para el uso como agentes terapéuticos humanos o derivan de tripsina humana, trombina humana, quimiotripsina humana, pepsina humana, endotiapepsina humana, caspasas humanas 1 a 14 y/o furina humana.
La especificidad definida de las enzimas proteolíticas obtenidas por ingeniería genética es una medida de su capacidad para diferenciar entre al menos un péptido diana o sustratos proteicos y uno o más sustratos peptídicos o proteicos adicionales. Preferentemente, la especificidad definida se refiere a la capacidad para diferenciar sustratos peptídicos o proteicos que difieren en otras posiciones distintas del sitio P1, más preferentemente, la especificidad definida se refiere a la capacidad para diferenciar sustratos peptídicos o proteicos que difieren en otras posiciones distintas del sitio P1 y el sitio P1'. Más preferentemente, las enzimas proteolíticas obtenidas por ingeniería genética distinguen sustratos peptídicos o proteicos diana en tantos sitios como sea necesario para hidrolizar preferentemente el sustrato diana frente a otras proteínas. Como ejemplo, una enzima proteolítica obtenida por ingeniería genética terapéuticamente útil aplicada por vía intravenosa en el cuerpo humano debería ser suficientemente específica para diferenciar entre el sustrato diana y cualquier otra proteína en el suero humano. Preferentemente, una enzima proteolítica obtenida por ingeniería genética tal reconoce y diferencia sustratos peptídicos en tres o más posiciones de aminoácidos, más preferentemente en cuatro o más posiciones e incluso más preferentemente en cinco o más posiciones de aminoácidos. Estas posiciones pueden estar adyacentes o no adyacentes.
En una primera realización, el armazón proteico tiene una estructura terciaria o pliegue igual o similar a la estructura terciaria o pliegue de la subclase estructural S1 de la serina proteasas, es decir el pliegue de quimiotripsina y/o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la subclase estructural S1 de serina proteasas. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 18-25, 38-48, 54-63, 73-86, 122-130, 148-156, 165-171 y 194-204 en tripsina humana I y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 20-23, 41-45, 57-60, 76-83, 125-128, 150-153, 167-169 y 197-201 (numeración de aminoácidos de acuerdo con SEC ID Nº: 1). El número de SDR a combinar con este tipo de armazón proteico está preferentemente entre 1 y 10 y más preferentemente entre 2 y 4. Preferentemente, el armazón proteico es igual a o es un derivado u homólogo de una o más de las siguientes proteínas: quimiotripsina, granzime, calicreína, tripsina, mesotripsina, elastasa de neutrófilos, elastasa pancreática, enteropeptidasa, catepsina, trombina, ancrod, factor de coagulación IXa, factor de coagulación VIIa, factor de coagulación Xa, proteína activada C, uroquinasa, activador del plasminógeno de tipo tisular, plasmina, activador de plasminógeno de tipo Desmodus. Más preferentemente, el armazón proteico es tripsina o trombina o es un derivado u homólogo de tripsina o trombina. Para el uso como un agente terapéutico humano, el armazón de tripsina o trombina es más preferentemente de origen humano para minimizar el riesgo de una respuesta inmune o una reacción alérgica.
Preferentemente, se usan derivados con características mejoradas derivados de tripsina humana I o de proteínas con estructura terciaria similar. Los ejemplos preferidos de tales derivados derivan de tripsina humana I (SEC ID Nº: 1) y comprenden una o más de las siguientes sustituciones de aminoácidos E56G; R78W; Y131F; A146T; C183R.
Se prefiere que se inserten al menos una de dos SDR en tripsina humana I, o un derivado de la misma, entre los restos 42 y 43 (SDR 1) y entre 123 y 124 (SDR 2), respectivamente (numeración de aminoácidos de acuerdo con SEC ID Nº: 1). Además la SDR 1 tiene una longitud preferida de 6 y la SDR 2 tiene una longitud preferida de 5 aminoácidos, respectivamente. En una variante preferida de esta realización, las secuencias SDR 1 y SDR 2 comprenden una de las secuencias de aminoácidos enumeradas en la Tabla 2. Tales enzimas proteolíticas obtenidas por ingeniería genética tienen especificidad por el sustrato diana B como se ejemplifica en el ejemplo IV.
En una realización adicional el armazón proteico pertenece a la subclase estructural S8 de serina proteasas y/o tiene una estructura terciaria similar a subtilisina E de Bacillus subtilis y/o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la subclase estructural S8 de serina proteasas. Preferentemente, el armazón pertenece a la familia de subtilisina o las convertasas de pro-proteína humanas. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 6-17, 25-29, 47-55, 59-69, 101-111, 117-125, 129-137, 139154, 158-169, 185-195 y 204-225 en subtilisina E de Bacillus subtilis y más preferentemente en uno o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones de 59-69, 101-111, 129-137, 158-169 y 204-225 (numeración de aminoácidos de acuerdo con SEC ID Nº: 7). Se prefiere que el armazón proteico sea igual o sea un derivado u homólogo de una o más de las siguientes proteínas: subtilisina Carlsberg; subtilisina E de B. subtilis; subtilisina BPN'; subtilisina de B. licheniformis; subtilisina de B. lentus; proteasa alcalina de Bacillus alcalophilus; proteinasa K; kexina; convertasa de pro-proteína humana; furina humana. En una variante preferida, se usa subtilisina BPN' o una de las proteínas SPC 1 a 7 como el armazón proteico.
En una realización adicional el armazón proteico pertenece a la familia de proteasas aspárticas y/o tiene una estructura terciaria similar a pepsina humana. Preferentemente, el armazón pertenece a la clase A1 de proteasas y/o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase A1 de proteasas. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 6-18, 49-55, 74-83, 9197, 112-120, 126-137, 159-164, 184-194, 242-247, 262-267 y 277-300 en pepsina humana y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 10-15, 75-80, 114-118, 130-134, 186-191 y 280-296 (numeración de aminoácidos de acuerdo con SEC ID Nº: 11). Se prefiere que el armazón proteico sea igual a o sea un derivado u homólogo de una o más de las siguientes proteínas: pepsina, quimosina, renina, catepsina, yapsina. Preferentemente, se usa pepsina o endotiopepsina o un derivado u homólogo de las mismas como el armazón proteico.
En una realización adicional el armazón proteico pertenece a la familia de cisteína proteasa y/o tiene una estructura terciaria similar a caspasa humana 7. Preferentemente el armazón pertenece a la clase C14 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C14 de cisteína proteasas. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 78-91, 144-160, 186-198, 226-243 y 271-291 en la caspasa humana 7 y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 80-86, 149-157, 190-194 y 233-238 (numeración de aminoácidos de acuerdo con SEC ID Nº: 14). Se prefiere que el armazón proteico sea igual a o sea un derivado u homólogo de una de las caspasas 1 a 9.
En una realización adicional el armazón proteico pertenece a la clase S11 de serina proteasas o tiene al menos un
70 % de identidad en el nivel de aminoácidos con una proteína de la clase S11 de serina proteasas y/o tiene una estructura terciaria similar a D-alanil-D-alanina transpeptidasa de la especie de Streptomyces K15. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 67-79, 137-150, 191-206, 212-222 y 251 241 en D-alanil-D-alanina transpeptidasa de la especie de Streptomyces K15 y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 70-75, 141-147, 195-202 y 216-220 (numeración de aminoácidos de acuerdo con SEC ID Nº: 15). Se prefiere que la D-alanil-D-alanina transpeptidasa de la especie de Streptomyces K15 o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase S21 de serina proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase S21 de serina proteasas y/o tiene una estructura terciaria similar a asemblina de citomegalovirus humano. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 25-33, 64-69, 134-155, 162-169 y 217-244 en asemblina de citomegalovirus humano y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 27-31, 164-168 y 222-239 (numeración de aminoácidos de acuerdo con SEC ID Nº: 16). Se prefiere que la asemblina de citomegalovirus humano o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase S26 de serina proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase S26 de serina proteasas y/o tiene una estructura terciaria similar a la peptidasa señal de Escherichia coli. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 8-14, 57-68, 125-134, 239-254, 200-211 y 228-239 en peptidasa de señal de Escherichia coli y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 9-13, 60-67, 127-132 y 203-209 (numeración de aminoácidos de acuerdo con SEC ID Nº: 17). Se prefiere que la peptidasa señal de Escherichia coli o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico que pertenece a la clase S33 de serina proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase S33 de serina proteasas y/o tiene una estructura terciaria similar a la prolil aminopeptidasa de Serratia marcescens. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 47-54, 152-160, 203-212 y 297-302 en prolil aminopeptidasa de Serratia marcescens y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones, 50-53, 154-158 y 206-210 (numeración de aminoácidos de acuerdo con SEC ID Nº: 18). Se prefiere que la prolil aminopeptidasa de Serratia marcescens o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase S51 de serina proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase S51 de serina proteasas y/o tiene una estructura terciaria similar a aspartil dipeptidasa de Escherichia coli. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 8-16, 38-46, 85-92, 132-140, 159-170 y 205-211 en aspartil dipeptidasa de Escherichia coli y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 10-14, 87-90, 134-138 y 160-165 (numeración de aminoácidos de acuerdo con SEC ID Nº: 19). Se prefiere que la aspartil dipeptidasa de Escherichia coli o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase A2 de proteasas aspárticas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase A2 de proteasas aspárticas y/o tiene una estructura terciaria similar a la proteasa del virus de la inmunodeficiencia humana. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 5-12, 17-23, 27-30, 33-38 y 77-83 en proteasa del virus de la inmunodeficiencia humana y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 7-10, 18-21, 34-37 y 79-82 (numeración de aminoácidos de acuerdo con SEC ID Nº: 20). Se prefiere que la proteasa del virus de inmunodeficiencia humana, preferentemente proteasa de VIH-1, o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase A26 de proteasas aspárticas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase A26 de proteasas aspárticas y/o tiene una estructura terciaria similar a la omptina de Escherichia coli. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 28-40, 86-98, 150-168, 213-219 y 267-278 en omptina de Escherichia coli y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por
homología de secuencia de aminoácidos a las regiones 33-38, 161-168 y 273-277 (numeración de aminoácidos de acuerdo con SEC ID Nº: 21). Se prefiere que la omptina de Escherichia coli o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C1 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C1 de cisteína proteasas y/o tiene una estructura terciaria similar a la papaína de Carica papaya. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 17-24, 61-68, 88-95, 135-142, 153-158 y 176-184 en papaína de Carica papaya y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 63-66, 139-136 y 177-181 (numeración de aminoácidos de acuerdo con SEC ID Nº: 22). Se prefiere que la papaína de Carica papaya o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C2 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C2 de cisteína proteasas y/o tiene una estructura terciaria similar a calpaína-2 humana. Se prefiere que las SDR se inserten en el armazón proteico en una
o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 90-103, 160-172, 193-199, 243-260, 286-294 y 316-322 en calpaína-2 humana y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 92-101, 245-250 y 287-291 (numeración de aminoácidos de acuerdo con SEC ID Nº: 23). Se prefiere que la calpaína-2 humana o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C4 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C4 de cisteína proteasas y/o tiene una estructura terciaria similar a proteasa NIa del virus del grabado del tabaco. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 23-31, 112-120, 144-150, 168-176 y 205-218 en NIa proteasa del virus del grabado del tabaco y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 145-149, 169-174 y 212-218 (numeración de aminoácidos de acuerdo con SEC ID Nº: 24). Se prefiere que la NIa proteasa del virus del grabado del tabaco (proteasa de VGT) o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C10 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C10 de cisteína proteasas y/o tiene una estructura terciaria similar a la estreptopaína de Streptococcus pyogenes. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 81-90, 133-140, 150-164, 191-199, 219-229, 246-256, 306312 y 330-337 en estreptopaína de Streptococcus pyogenes y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 82-87, 134-138, 250-254 y 331-335 (numeración de aminoácidos de acuerdo con SEC ID Nº: 25). Se prefiere que la estreptopaína de Streptococcus pyogenes o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C19 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C19 de cisteína proteasas y/o tiene una estructura terciaria similar a la proteasa específica de ubiquitina humana 7. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 3-15, 63-70, 80-86, 248-256, 272-283 y 292-304 en proteasa específica de ubiquitina humana 7 y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 10-15, 251-255, 277281 y 298-304 (numeración de aminoácidos de acuerdo con SEC ID Nº: 26). Se prefiere que la proteasa específica de ubiquitina humana 7 o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C47 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C47 de cisteína proteasas y/o tiene una estructura terciaria similar a la estafopaína de Staphylococcus aureus. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 15-23, 57-66, 108-119, 142-149 y 157-164 en estafopaína de Staphylococcus aureus y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 17-22, 111-117, 143147 y 159-163 (numeración de aminoácidos de acuerdo con SEC ID Nº 27). Se prefiere que la estafopaína de Staphylococcus aureus o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C48 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C48 de cisteína proteasas y/o tiene una
estructura terciaria similar a la endopeptidasa Ulp1 de Saccharomyces cerevisiae. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 40-51, 108-115, 132-141, 173-179 y 605 597 en endopeptidasa Ulp1 de Saccharomyces cerevisiae y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 43-49, 110-113, 133-137 y 175-178 (numeración de aminoácidos de acuerdo con SEC ID Nº: 28). Se prefiere que la endopeptidasa Ulp1 de Saccharomyces cerevisiae o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase C56 de cisteína proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase C56 de cisteína proteasas y/o tiene una estructura terciaria similar a la endopeptidasa Pfpl de Pyrococcus horikoshii. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 8-16, 40-47, 66-73, 118-125 y 147-153 en endopeptidasa Pfpl de Pyrococcus horikoshii, y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 9-14, 68-71, 120-123 y 148-151 (numeración de aminoácidos de acuerdo con SEC ID Nº 29). Se prefiere que la endopeptidasa Pfpl de Pyrococcus horikoshii o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase M4 de metalo proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase M4 de metalo proteasas y/o tiene una estructura terciaria similar a termolisina de Bacillus thermoproteolyticus. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 106-118, 125-130, 152-160, 197-204, 210-213 y 221-229 en termolisina de Bacillus thermoproteolyticus, y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 108115, 126-129, 199-203 y 223-227 (numeración de aminoácidos de acuerdo con SEC ID Nº 30). Se prefiere que la termolisina de Bacillus thermoproteolyticus, o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase M10 de metalo proteasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase M10 de metalo proteasas y/o tiene una estructura terciaria similar a colagenasa humana. Se prefiere que las SDR se inserten en el armazón proteico en una
o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 2-7, 68-79, 85-90, 107-111 y 135-141 en colagenasa humana y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 3-67, 1-78 y 136-140 (numeración de aminoácidos de acuerdo con SEC ID Nº 31). Se prefiere que la colagenasa humana o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que las enzimas obtenidas por ingeniería genética tengan actividad glucosidasa. Un armazón proteico especialmente adecuado para esta variante es una glucosilasa o deriva de una glucosilasa. Preferentemente, la estructura terciaria pertenece a una de las siguientes clases estructurales: barril (beta/alfa) 8 de clase GH13, GH7, GH12, GH11, GH10, GH28, GH26 y GH18.
En una primera realización el armazón proteico pertenece a la clase GH13 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH13 de glucosilasas y/o tiene una estructura terciaria similar a alfa amilasa pancreática humana. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 50-60, 100-110, 148-167, 235-244, 302-310 y 346-359 en alfa amilasa pancreática humana y más preferentemente en una o mas posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 51-58, 148-155 y 303-309 (numeración de aminoácidos de acuerdo con SEC ID Nº 32). Se prefiere que la alfa amilasa pancreática humana o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GH7 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH7 de glucosilasas y/o tiene una estructura terciaria similar a la celulasa de Trichoderma reesei. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 47-56, 93-104, 173-182, 215-223, 229-236 y 322-334 en celulasa de Trichoderma reesei y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 175-180, 218-222 y 324-332 (numeración de aminoácidos de acuerdo con SEC ID Nº 33). Se prefiere que la celulasa de Trichoderma reesei o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GH12 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH12 de glucosilasas y/o tiene una estructura terciaria similar a celulasa de Aspergillus niger. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de
secuencia de aminoácidos a las regiones 18-28, 55-60, 106-113, 126-132 y 149-159 en celulasa de Aspergillus niger, y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente
o por homología de secuencia de aminoácidos a las regiones 20-26, 56-59, 108-112 y 151-156 (numeración de aminoácidos de acuerdo con SEC ID Nº 34). Se prefiere que la celulasa de Aspergillus niger o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GH11 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH11 de glucosilasas y/o tiene una estructura terciaria similar a xilanasa de Aspergillus niger. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 7-14, 33-39, 88-97, 114-126 y 158-167 en xilanasa de Aspergillus niger y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 20-26, 56-59, 108-112 y 151-156 (numeración de aminoácidos de acuerdo con SEC ID Nº 35). Se prefiere que la xilanasa de Aspergillus niger o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GH10 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH10 de glucosilasas y/o tiene una estructura terciaria similar a xilanasa de Streptomyces lividans. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 21-29, 42-50, 84-92, 130-136, 206-217 y 269-278 en xilanasa de Streptomyces lividans y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 43-49, 86-90, 208-213 y 271-276 (numeración de aminoácidos de acuerdo con SEC ID Nº 36). Se prefiere que la xilanasa de Streptomyces lividans o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GH28 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH28 de glucosilasas y/o tiene una estructura terciaria similar a pectinasa de Aspergillus niger. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 82-88, 118-126, 171-178, 228-236, 264 256 y 289-299 en pectinasa de Aspergillus niger y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 116-124, 174-178 y 291-296 (numeración de aminoácidos de acuerdo con SEC ID Nº 37). Se prefiere que la pectinasa de Aspergillus niger o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GH26 de glucosilasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH26 de glucosilasas y/o tiene una estructura terciaria similar a mananasa de Pseudomonas cellulosa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 75-83, 113-125, 174-182, 217-224, 247-254, 324-332 y 325340 en mananasa de Pseudomonas cellulosa y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 115123, 176-180, 291 286 y 328-337 (numeración de aminoácidos de acuerdo con SEC ID Nº 38). Se prefiere que la mananasa de Pseudomonas cellulosa o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase de barril (beta/alfa) 8 de GH18 de glucosilasas
o tiene al menos un 70 % identidad en el nivel de aminoácidos con una proteína de la clase GH18 de glucosilasas y/o tiene una estructura terciaria similar a quitinasa de Bacillus circulans. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 21-29, 57-65, 130-136, 176-183, 221-229, 249-257 y 327337 en quitinasa de Bacillus circulans y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 59-63, 178-181, 250254 y 330-336 (numeración de aminoácidos de acuerdo con SEC ID Nº 39). Se prefiere que la quitinasa de Bacillus circulans o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que las enzimas obtenidas por ingeniería genética tengan actividad esterhidrolasa. Preferentemente, el armazón proteico para esta variante tiene actividad de lipasa, fosfatasa, fitasa o fosfodiesterasa.
En una primera realización el armazón proteico pertenece a la clase GX de esterasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GX de esterasas y/o tiene una estructura terciaria similar a la estructura de la lipasa B de Candida antarctica. Preferentemente, el armazón tiene actividad lipasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 139-148, 188-195, 216-224, 256-266, 272-287 en lipasa B de Candida antarctica y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 141-146, 218-222, 259-263 y 275-283 (numeración de aminoácidos de acuerdo con SEC ID Nº 40). Se
prefiere que la lipasa B de Candida antarctica o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GX de esterasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GX de esterasas y/o tiene una estructura terciaria similar a la lipasa pancreática de cobaya. Preferentemente, el armazón tiene actividad lipasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 78-90, 91-100, 112-120, 179-186, 207-218, 238-247 y 248-260 en lipasa pancreática de cobaya y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 80-87, 114-118, 209-215 y 239-246 (numeración de aminoácidos de acuerdo con SEC ID Nº 41). Se prefiere que la lipasa pancreática de cobaya o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico tiene una estructura terciaria similar a la estructura de la fosfatasa alcalina de Escherichia coli o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la fosfatasa alcalina de Escherichia coli. Preferentemente, el armazón tiene actividad fosfatasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 110-122, 187-142, 170-175, 186-193, 280-287 y 425-435 en fosfatasa alcalina de Escherichia coli y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 171-174, 187-191, 282-286 y 426433 (numeración de aminoácidos de acuerdo con SEC ID Nº 42). Se prefiere que la fosfatasa alcalina de Escherichia coli o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico tiene una estructura terciaria similar a la estructura de la desoxirribonucleasa pancreática bovina I o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la desoxirribonucleasa pancreática bovina I. Preferentemente, el armazón tiene actividad fosfodiesterasa. Más preferentemente, una nucleasa, y más preferentemente, una endonucleasa no específica o un derivado de la misma se usa como el armazón. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 14-21, 41-47, 72-77, 97-111, 135143, 171-178, 202-209 y 242-251 en desoxirribonucleasa pancreática bovina I y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 16-19, 42-46, 136-141 y 172-176 (numeración de aminoácidos de acuerdo con SEC ID Nº 43). Se prefiere que la desoxirribonucleasa pancreática bovina I o desoxirribonucleasa humana I o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que la enzima obtenida por ingeniería genética tenga actividad transferasa. Un armazón proteico particularmente adecuado para esta variante es una glucosil, fosfo o metiltransferasa o un derivado de las mismas. Son armazones proteicos particularmente preferidos para esta variante las glucosiltransferasas o derivan de glucosiltransferasas. La estructura terciaria del armazón proteico puede ser de cualquier tipo. Preferentemente, sin embargo, la estructura terciaria pertenece a una de las siguientes clases estructurales: GH13 y GT1.
En una primera realización el armazón proteico pertenece a la clase GH13 de transferasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GH13 de transferasas y/o tiene una estructura terciaria similar a la estructura de la ciclomaltodextrin glucanotransferasa de Bacillus circulans. Preferentemente, el armazón tiene actividad transferasa y más preferentemente se usa una glucosil trasnsferasa como el armazón. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 38-48, 85-94, 142-154, 178-186, 259-266, 331-340 y 367-377 en ciclomaltodextrin glucanotransferasa de Bacillus circulans y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 87-92, 180-185, 261-264 y 269-275 (numeración de aminoácidos de acuerdo con SEC ID Nº 44). Se prefiere que la ciclomaltodextrin glucanotransferasa de Bacillus circulans o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico pertenece a la clase GT1 de transferasas o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína de la clase GT1 de transferasas y/o tiene una estructura terciaria similar a la estructura de la glucosil transferasa de Amycolatopsis orientalis A82846. Preferentemente el armazón tiene actividad transferasa y más preferentemente actividad glucosil transferasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 58-74, 130-138, 185-193, 228-236 y 314-323 en glucosil transferasa de Amycolatopsis orientalis A82846 y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 61-71, 230-234 y 316-321 (numeración de aminoácidos de acuerdo con SEC ID Nº 45). Se prefiere que la glucosil transferasa de Amycolatopsis orientalis A82846 o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que las enzimas obtenidas por ingeniería genética tengan actividad oxidorreductasa. Un
armazón proteico particularmente adecuado para esta variante es una monooxigenasa, una dioxigenasa o un alcohol deshidrogenasa o un derivado de las mismas. La estructura terciaria del armazón proteico puede ser de cualquier tipo.
En una primera realización el armazón proteico tiene una estructura terciaria similar a la estructura de la 2,3difidroxibifenil dioxigenasa de Pseudomonas sp. o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la 2,3-difidroxibifenil dioxigenasa de Pseudomonas sp. Preferentemente, el armazón tiene actividad dioxigenasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 172-185, 198-206, 231-237, 250-259 y 282-287 en 2,3difidroxibifenil dioxigenasa de Pseudomonas sp. y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 175182, 200-204, 252-257 y 284-287 (numeración de aminoácidos de acuerdo con SEC ID Nº 46). Se prefiere que la 2,3-difidroxibifenil dioxigenasa de Pseudomonas sp o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico tiene una estructura terciaria similar a la estructura de la catecol dioxigenasa de Acinetobacter sp. o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la catecol dioxigenasa de Acinetobacter sp. Preferentemente, el armazón tiene actividad dioxigenasa y más preferentemente actividad catecol dioxigenasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 66-72, 105-112, 156171 y 198-207 en catecol dioxigenasa de Acinetobacter sp. y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 107-110, 161-171 y 201-205 (numeración de aminoácidos de acuerdo con SEC ID Nº 47). Se prefiere que la catecol dioxigenasa de Acinetobacter sp. o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico tiene una estructura terciaria similar a la estructura de la canfor-5monooxigenasa de Pseudomonas putida o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la canfor-5-monooxigenasa de Pseudomonas putida. Preferentemente, el armazón tiene actividad monooxigenasa y más preferentemente actividad canfor monooxigenasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 26-31, 57-63, 84-98, 182-191, 242-256, 292-299 y 392-399 en canfor-5-monooxigenasa de Pseudomonas putida y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 85-96, 183-188, 244-253, 293-298 y 393-398 (numeración de aminoácidos de acuerdo con SEC ID Nº 48). Se prefiere que la canfor-5-monooxigenasa de Pseudomonas putida
o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico tiene una estructura terciaria similar a la estructura de la alcohol deshidrogenasa de Equus callabus o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la alcohol deshidrogenasa de Equus callabus. Preferentemente, el armazón tiene actividad alcohol deshidrogenasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 49-63, 111-112, 294-301 y 361-369 en alcohol deshidrogenasa de Equus callabus y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 51-61 y 295-299 (numeración de aminoácidos de acuerdo con SEC ID Nº 49). Se prefiere que la alcohol deshidrogenasa de Equus callabus o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que las enzimas obtenidas por ingeniería genética tengan actividad liasa. Un armazón proteico particularmente adecuado para esta variante es una liasa oxoácida o es un derivado de la misma. Son armazones proteicos particularmente preferidos para esta variante aldolasas o sintetasas o derivan de las mismas. La estructura terciaria del armazón proteico puede ser de cualquier tipo, pero se prefiere una estructura de barril (beta/alfa) 8.
En una primera realización el armazón proteico tiene una estructura terciaria similar a la estructura de la ácido Nacetil-d-neurámico aldolasa de Escherichia coli o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la ácido N-acetil-d-neurámico aldolasa de Escherichia coli. Preferentemente, el armazón tiene actividad aldolasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 45-55, 78-87, 105-113, 137-146, 164-171, 187-193, 205210, 244-255 y 269-276 en ácido N-acetil-d-neurámico aldolasa de Escherichia coli, y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 45-52, 138-144, 189-192, 247-253 y 271-275 (numeración de aminoácidos de acuerdo con SEC ID Nº 50). Se prefiere que la ácido N-acetil-d-neurámico aldolasa de Escherichia coli o un derivado u homólogo de la misma se use como el armazón.
En una realización adicional el armazón proteico tiene una estructura terciaria similar a la estructura de la triptófano sintasa de Salmonella typhimurium o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la triptófano sintasa de Salmonella typhimurium. Preferentemente, el armazón tiene actividad sintasa. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 56-63, 127-134, 154-161, 175-193, 209-216 y 230-240 en triptófano sintasa de Salmonella typhimurium y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 57-62, 155-160, 178-190 y 210-215 (numeración de aminoácidos de acuerdo con SEC ID Nº 51). Se prefiere que la triptófano sintasa de Salmonella typhimurium o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que las enzimas obtenidas por ingeniería genética tengan actividad isomerasa. Un armazón proteico particularmente adecuado para esta variante es una aldosa de conversión o una cetosa de conversión o es un derivado de las mismas.
En una primera realización, el armazón proteico tiene una estructura terciaria similar a la estructura de la xilosa isomerasa de Actinoplanes missouriensis o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la xilosa isomerasa de Actinoplanes missouriensis. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 18-31, 92-103, 136-147, 178-188 y 250-257 en xilosa isomerasa de Actinoplanes missouriensis y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones de 20-27, 92-99 y 180-186 (numeración de aminoácidos de acuerdo con SEC ID Nº 52). Se prefiere que la xilosa isomerasa de Actinoplanes missouriensis o un derivado u homólogo de la misma se use como el armazón.
Se prefiere adicionalmente que las enzimas obtenidas por ingeniería genética tengan actividad ligasa. Un armazón proteico particularmente adecuado para esta variante es una ADN ligasa o es un derivado de la misma.
En una primera realización, el armazón proteico tiene una estructura terciaria similar a la estructura de la ADN ligasa del bacteriófago T7 o tiene al menos un 70 % de identidad en el nivel de aminoácidos con una proteína que tiene una estructura terciaria similar a la estructura de la ADN ligasa de bacteriófago T7. Se prefiere que las SDR se inserten en el armazón proteico en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones, 52-60, 94-108, 119-131, 241-248, 255-263 y 302-318 en ADN ligasa de bacteriófago T7 y más preferentemente en una o más posiciones del grupo de posiciones que corresponden estructuralmente o por homología de secuencia de aminoácidos a las regiones 96-106, 121-129, 256-262 y 304-316 (numeración de aminoácidos de acuerdo con SEC ID Nº 53). SE prefiere que la ADN ligasa de bacteriófago T7 o un derivado u homólogo de la misma se use como el armazón.
Un segundo aspecto se refiere a la aplicación de enzimas obtenidas por ingeniería genética con especificidades para fines terapéuticos, de investigación, diagnósticos, nutricionales, de cuidado personal o industriales. La aplicación comprende al menos las siguientes etapas:
(a)
identificación de un sustrato peptídico diana cuya hidrólisis tiene un efecto positivo en relación con el fin pretendido, tal como curar una enfermedad, diagnosticar una enfermedad, procesamiento de ingredientes para nutrición humana o animal u otros procedimientos técnicos;
(b)
provisión de una enzima obtenida por ingeniería genética, siendo específica la enzima para el péptido diana identificado en la etapa (a); y
(c)
uso de la enzima como se proporciona en la etapa (b) para el fin pretendido.
En una primera variante de este aspecto, la enzima obtenida por ingeniería genética se usa como un medio terapéutico para inactivar un sustrato diana relacionado con la enfermedad. Esta aplicación comprende al menos las siguientes etapas:
(a)
identificación de un sustrato diana cuya función está relacionada con una enfermedad y cuya inactivación tiene un efecto positivo en relación con la enfermedad y determinación de un sitio diana dentro del sustrato diana caracterizado por el hecho de que una modificación en el sitio diana conduce a la inactivación del sustrato diana;
(b)
provisión de una enzima obtenida por ingeniería genética, siendo específica la enzima del sitio diana identificado en la etapa (a); y
(c)
uso de la enzima para la inactivación del sustrato diana dentro o fuera del cuerpo humano.
En una realización preferida el armazón de la enzima obtenida por ingeniería genética proporcionada en la etapa (c) es de origen humano para evitar o reducir la inmunogenicidad o efectos alérgenos asociados con la aplicación de la enzima en el cuerpo humano. En una realización más preferida de esta variante, el armazón es de una proteasa humana y la modificación es hidrólisis de un sitio diana en una diana proteica. Preferentemente, la hidrólisis conduce a la activación o inactivación de la diana peptídica o proteica. Las dianas peptídicas o proteicas potenciales incluyen:
citocinas, factores de crecimiento, hormonas peptídicas, interleucinas, interferones, enzimas de la cascada de coagulación, serpinas, inmunoglobulinas, receptores unidos a membrana o solubles, proteínas de superficie celular o viral, fármacos peptídicos, fármacos proteicos.
Una realización particularmente preferida se basa en el hallazgo de que la enzima obtenida por ingeniería genética es capaz de escindir el factor de necrosis tumoral alfa (TNF-α) humano. Las enzimas obtenidas por ingeniería genética o la proteína de fusión puede por lo tanto usarse para preparar medicamentos para el tratamiento de enfermedades inflamatorias (así como otras enfermedades relacionadas con TNF-α). Preferentemente, dicha enzima obtenida por ingeniería genética o dicha proteína de fusión es capaz de inactivar específicamente el factor de necrosis tumoral alfa humano (hTNF-α), más preferentemente dicha enzima obtenida por ingeniería genética o dicha proteína de fusión es capaz de hidrolizar el enlace peptídico entre las posiciones 31/32, 32/33, 44/45, 87/88, 128/129 y/o 141/142 (más preferentemente entre las posiciones 31/32 y 32/33) en hTNF-α (SEC ID Nº 96).
En realizaciones adicionales, el sustrato diana es un profármaco que se activa por la enzima obtenida por ingeniería genética. En una realización particular de esta variante, la enzima obtenida por ingeniería genética tiene actividad proteolítica y el sustrato diana es una diana proteica que se activa de forma proteolítica. Son ejemplos de tales profármacos pro-proteínas tales como las formas inactivadas de factores de coagulación. En otra variante particular, la enzima obtenida por ingeniería genética es una oxidorreductasa y el sustrato diana es un agente químico que puede activarse por oxidación.
En una segunda variante de este aspecto, la enzima obtenida por ingeniería genética se usa como un medio técnico para catalizar una reacción industrial o nutricionalmente relevante con especificidad definida. En una realización particular de esta variante la enzima obtenida por ingeniería genética tiene actividad proteolítica, la reacción catalizada es un procesamiento proteolítico y la enzima obtenida por ingeniería genética hidroliza específicamente uno o más sustratos proteicos industrial o nutricionalmente relevantes. En una realización preferida de esta variante la enzima obtenida por ingeniería genética hidroliza uno o más sustratos proteicos industrial o nutricionalmente relevantes en sitios específicos, conduciendo de este modo a propiedades de producto industrial o nutricionalmente deseadas tales como textura, sabor o características de precipitación. En una realización particular adicional de esta variante, la enzima obtenida por ingeniería genética cataliza la hidrólisis de enlaces glucosídicos (actividad glicosidasa o glucosilasa). Después, preferentemente, la reacción catalizada es un procesamiento de polisacáridos y la enzima obtenida por ingeniería genética hidroliza específicamente uno o más sustratos polisacáridos industrial, técnica o nutricionalmente relevantes. En una realización particular adicional de esta variante, la enzima obtenida por ingeniería genética cataliza la hidrólisis de ésteres de triglicéridos o lípidos (actividad lipasa).
Después, preferentemente, la reacción catalizada es una etapa de procesamiento de lípidos y la enzima obtenida por ingeniería genética hidroliza específicamente uno o más sustratos lipídicos industrial, técnica o nutricionalmente relevantes. En una variante particular adicional de esta realización, la enzima obtenida por ingeniería genética cataliza la oxidación o reducción de sustratos (actividad oxidorreductasa). Después, preferentemente, la enzima obtenida por ingeniería genética oxida o reduce específicamente uno o más sustratos químicos industrial, técnica o nuctricionalmente relevantes.
Un tercer aspecto se refiere a un procedimiento para generar enzimas obtenida por ingeniería genética con especificidades que son cualitativa y/o cuantitativamente nuevas en combinación con el armazón proteico. El procedimiento comprende al menos las siguientes etapas:
(a)
proporcionar un armazón proteico capaz de catalizar al menos una reacción química en al menos un sustrato diana.
(b)
generar una biblioteca de enzimas obtenidas por ingeniería genética o enzimas obtenidas por ingeniería genética aisladas combinando el armazón proteico de la etapa (a) con una o más secuencias peptídicas completa o parcialmente aleatorias en sitios en el armazón proteico que permiten que la enzima obtenida por ingeniería genética resultante diferencie entre al menos un sustrato diana y uno o más sustratos diferentes y
(c)
seleccionar de la biblioteca de enzimas obtenidas por ingeniería genética generadas en la etapa (b) una
o más enzimas que tienen especificidades definidas para al menos un sustrato diana.
En una primera variante de este aspecto, el procedimiento comprende al menos las siguientes etapas:
(a)
proporcionar un armazón proteico capaz de catalizar al menos una reacción química en al menos un sustrato diana,
(b)
generar una biblioteca de enzimas obtenidas por ingeniería genética o enzimas obtenidas por ingeniería genética aisladas insertando en el armazón proteico de la etapa (a) una o más secuencias peptídicas completa o parcialmente aleatorias en sitios del armazón proteico que permiten que la enzima obtenida por ingeniería genética resultante diferencie entre al menos un sustrato diana y uno o más sustratos diferentes y
(c)
seleccionar de la biblioteca de enzimas obtenidas por ingeniería genética generadas en la etapa (b) una
o más enzimas que tienen especificidades definidas para al menos un sustrato diana.
Preferentemente, las posiciones en las que la o las secuencias peptídicas completa o parcialmente aleatorias se combinan con o se insertan en el armazón proteico se identifican antes de la combinación o inserción.
El número de inserciones u otras combinaciones de secuencias peptídicas completa o parcialmente aleatorias así como su longitud puede variar a lo largo de un intervalo amplio El número es al menos uno, preferentemente más de uno, más preferentemente entre dos y once, más preferentemente entre dos y seis. La longitud de tales secuencias peptídicas completa o parcialmente aleatorias es habitualmente menos de 50 restos aminoacídicos. Preferentemente, la longitud está entre uno y 15 restos aminoacídicos, más preferentemente entre uno y seis restos aminoacídicos. Como alternativa, la longitud está entre dos y 20 restos aminoacídicos, preferentemente entre dos y diez restos aminoacídicos, más preferentemente entre tres y ocho restos aminoacídicos.
Preferentemente tales inserciones u otras combinaciones se realizan en el nivel de ADN, usando polinucleótidos que codifican tales armazones proteicos y polinucleótidos u oligonucleótidos que codifican tales secuencias peptídicas completa o parcialmente aleatorias.
Opcionalmente, las etapas (a) a (c) se repiten cíclicamente, por lo que las enzimas seleccionadas en la etapa (c) actúan como el armazón proteico en la etapa (a) de un ciclo adicional y se insertan secuencias peptídicas seleccionadas de forma aleatoria o, como alternativa, sustituyen a secuencias peptídicas que se han insertado en ciclos anteriores. De este modo, el número de secuencias peptídicas insertadas es constante o aumenta a lo largo de los ciclos. Los ciclos se repiten hasta que se generan una o más enzimas con las especificidades pretendidas.
Además, durante o después de uno o más ciclos de las etapas (a) a (c), el armazón puede mutarse en una o más posiciones para hacer el armazón más aceptable para la combinación con secuencias SDR, para aumentar la actividad catalítica a un pH y temperatura específicos, para cambiar el patrón de glucosilación, para reducir la sensibilidad hacia inhibidores de enzima y/o para cambiar la estabilidad enzimática.
En una segunda variante de este aspecto, el procedimiento comprende al menos las siguientes etapas:
(a)
proporcionar un primer fragmento de armazón proteico,
(b)
conectar dicho fragmento de armazón proteico mediante un engarce peptídico con una primera SDR, opcionalmente
(c)
conectar el producto de la etapa (b) mediante un engarce peptídico con un péptido SDR adicional o con un fragmento de armazón proteico adicional y opcionalmente
(d)
repetir la etapa (c) durante tantos ciclos como sea necesario para generar una enzima suficientemente específica, y
(e)
seleccionar de la población generada en las etapas (a) - (d) una o más enzimas que tengan las especificidades deseadas para el o los sustratos diana.
El fragmento de armazón proteico significa una parte de la secuencia de un armazón proteico. Un armazón proteico está comprendido por al menos dos fragmentos de armazón proteico.
En una tercera variante de este aspecto, el armazón proteico, las SDR y la enzima obtenida por ingeniería genética se codifican por una secuencia de ADN y se usa un sistema de expresión para producir la proteína. En una variante alternativa, el armazón proteico, las SDR y/o la enzima obtenida por ingeniería genética se sintetizan químicamente a partir de componentes básicos peptídicos.
En una cuarta variante de este aspecto, el procedimiento comprende al menos las siguientes etapas:
(a)
proporcionar un polinucleótido que codifica un armazón proteico capaz de catalizar una o más reacciones químicas en uno o más sustratos diana;
(b)
combinar una o más secuencias oligonucleotídicas parcial o completamente aleatorias con el polinucleótido que codifica el armazón proteico, localizándose las secuencias oligonucleotídicas parcial o completamente aleatorias en sitios en el polinucleótido que permiten que la enzima obtenida por ingeniería genética codificada diferencie entre el o los sustratos diana y uno o más sustratos diferentes; y
(c)
seleccionar de la población generada en la etapa (b) uno o más polinucleótidos que codifican enzimas que tienen las especificidades definidas para el o los sustratos diana.
Cualquier enzima puede actuar como el armazón proteico en la etapa (a). Puede ser una enzima de origen natural, una variante o un derivado truncado de las mismas o una enzima obtenida por ingeniería genética. Para uso terapéutico humano, el armazón proteico es preferentemente una enzima de mamífero y más preferentemente una enzima humana. En ese aspecto, se refiere a un procedimiento para la generación de enzimas esencialmente de mamífero, especialmente esencialmente humanas con especificidades que son diferentes de las especificidades de cualquier enzima codificada en genomas de mamífero o en el genoma humano, respectivamente.
El armazón proteico proporcionado en la etapa (a) de este aspecto requiere ser capaz de catalizar una o más reacciones químicas en un sustrato diana. Por lo tanto, se selecciona un armazón proteico del grupo de armazones proteicos potenciales por su actividad en el sustrato diana.
En una variante preferida de este aspecto, se usa un armazón proteico con actividad hidrolasa. Preferentemente, se usa un armazón proteico con actividad proteolítica y más preferentemente se usa una proteasa con especificidad muy baja que tiene actividad básica en el sustrato diana como el armazón proteico. Los ejemplos de proteasas de diferentes clases estructurales con especificidad de sustrato baja son papaína, tripsina, quimiotripsina, subtilisina, SET (serina proteasa de tipo tripsina de Streptomyces erythraeus), elastasa, catepsina G o quimasa. Antes de emplearse como el armazón proteico, la secuencia de aminoácidos de la proteasa puede modificarse para cambiar las propiedades proteicas distintas de especificidad, por ejemplo actividad catalítica, estabilidad, sensibilidad al inhibidor o rendimiento de la expresión, esencialmente como se describe en el documento WO 92/18645 o para cambiar la especificidad, esencialmente como se describe en el documento EP 02020576.3 y el documento PCT/ EP03/04864.
Otra opción para un armazón proteico factible son las lipasas. La lipasa hepática, lipasa lipoproteica y lipasa pancreática pertenecen a la “superfamilia de lipasa lipoproteica”, que a su vez es un ejemplo de la clase GX de lipasas (M. Fischer, J. Pleiss (2003), Nucl. Acid. Res., 31, 319-321). La especificidad de sustrato de las lipasas puede caracterizarse por su actividad relativa hacia ésteres de triglicerol de ácidos grasos y fosfolípidos, que portan un grupo principal cargado. Como alternativa, otras hidrolasas tales como esterasas, glucosilasas, amidasas o nitrilasas pueden usarse como armazones.
Las transferasas también son armazones proteicos factibles. Las glucosiltransferasas están implicadas en muchas síntesis biológicas que implican una diversidad de donadores y aceptores.
Como alternativa, el armazón proteico puede tener actividad ligasa, liasa, oxidorreductasa o isomerasa.
En una primera realización, la o las secuencias peptídicas completa o parcialmente aleatorias se insertan en sitios específicos en el armazón proteico. Estos sitios de inserción se caracterizan por el hecho de que las secuencias peptídicas insertadas pueden actuar como diferenciadores entre diferentes sustratos, es decir como regiones determinantes de especificidad o SDR. Tales sitios de inserción pueden identificarse por varios enfoques. Preferentemente, los sitios de inserción se identifican por análisis de la estructura tridimensional de los armazones proteicos, por análisis comparativo de las secuencias primarias del armazón proteico con otras enzimas que tienen diferentes especificidades cuantitativas o experimentalmente por técnicas tales como cribado de alanina, mutagénesis aleatoria o deleción aleatoria o por cualquier combinación de las mismas.
Un primer enfoque para identificar sitios de inserción para SDR se basa en la estructura tridimensional del armazón proteico como puede obtenerse por cristalografía de rayos x o por estudios de resonancia magnética nuclear. El alineamiento estructural del armazón proteico en comparación con otras enzimas de la misma clase estructural pero que tiene diferentes especificidades cuantitativas revela regiones de alta similitud estructural y regiones con baja similitud estructural. Un análisis tal puede por ejemplo realizarse usando software público tal como Swiss PDB (Guex, N. y Peitsch, M.C. (1997) Electrophoresis 18, 2714-2723). Las regiones de baja similitud estructural son sitios de inserción de SDR preferidos.
En un segundo enfoque para identificar sitios de inserción para SDR, se analizan las estructuras tridimensionales de la proteína del armazón en complejo con inhibidores competitivos o análogos de sustrato. Se asume que el sitio de unión de un inhibidor competitivo solapa significativamente con el sitio de unión del sustrato. En ese caso, es probable que los átomos de la proteína que están dentro de una cierta distancia de átomos del inhibidor estén a unadistancia similar del sustrato también. La selección de una distancia corta, por ejemplo, < 5 Å, dará como resultado un conjunto de átomos de proteínas que están en contacto cercano con el sustrato. Estos restos constituirán los primeros contactos de superficie y son por lo tanto sitios de inserción preferidos para SDR. Una vez que se han identificado los primeros contactos de superficie, pueden hallarse segundos contactos de superficie repitiendo el análisis de distancia comenzando desde los primeros átomos de superficie. En otra alternativa más, el análisis de distancia descrito anteriormente se realiza empezando desde los restos del sitio activo.
En un tercer enfoque para identificar sitios de inserción para SDR, la secuencia primaria de la proteína del armazón se alinea con otras enzimas de la misma clase estructural pero que tienen diferentes especificidades cuantitativas usando un algoritmo de alineamiento. Están publicados ejemplos de tales algoritmos de alineamiento (Altschul, S.F., Gish, W., Miller, W., Myers, E.W. &amp; Lipman, D.J. (1990) J. Mol Biol. 215:403-410; “Statistical methods in Bioinformatics: an introduction” por Ewens, W. &amp; Grant, G.R. 2001, Springer, Nueva York). Un alineamiento tal puede revelar regiones conservadas y no conservadas con diversa homología de secuencia y, en particular, elementos de secuencia adicionales en una o más enzimas en comparación con la proteína del armazón. Es más probable que las regiones conservadas contribuyan a fenotipos compartidos entre las diferentes proteínas, por ejemplo, estabilización del pliegue tridimensional. Las regiones no conservadas y, en particular, secuencias adicionales en enzimas con especificidad cuantitativamente mayor (Turner, R. y col (2002) J. Biol. Chem., 277, 33068-33074) son sitios de inserción preferidos para las SDR.
Para proteasas se conocen actualmente cinco familias, concretamente proteasas aspárticas, cisteína proteasas, serina proteasas, metalo proteasas y treonina proteasas. Cada familia incluye grupos de proteasas que comparten un pliegue similar. Las estructuras cristalográficas de miembros de estos grupos se han resuelto y son accesibles a través de bases de datos públicas, por ejemplo, la base de datos de proteínas Brookhaven (H. M. Berman y col,
Nucleic Acids Research, 28 pág. 235-242 (2000)). Tales bases de datos también incluyen homólogos estructurales en otras clases de enzima y proteínas no activas enzimáticamente de cada clase. Están disponibles varias herramientas para buscar en bases de datos públicas homólogos estructurales: SCOP, una clasificación estructural de base de datos de proteínas para la investigación de secuencias y estructuras. (Murzin A. G. y col (1995) J. Mol. Biol. 247, 536-540); CATH, superfamilia de clase, arquitectura, topología y homóloga: una clasificación jerárquica de estructuras de dominio proteico (Orengo y col (1997) Structure 5(8) 1093-1108); FSSP, clasificación de pliegues basada en el alineamiento de estructura-estructura de proteínas (Holm y Sander (1998). Nucl. Acids Res. 26 316319); o VAST, herramienta de búsqueda de alineamiento de vector (Gibrat, Madej y Bryant (1996) Current Opinión in Structural Biology 6, 377-385).
En los enfoques anteriormente descritos, se comparan miembros de clases estructurales para identificar sitios de inserción para SDR.
En una variante preferida de estos enfoques se comparan serina proteasas de la clase estructural S1 entre sí. La tripsina representa un miembro con baja especificidad de sustrato, puesto que requiere solamente un resto de arginina o lisina en la posición P1. Por otro lado, la trombina, el activador de plasminógeno de tipo tisular o la enteroquinasa tienen todos una alta especificidad para sus secuencias sustrato, es decir, (L/I/V/F)XPR^NA, CPGR^WGG y DDDK^, respectivamente (Perona, J. &amp; Craik, C. (1997) J. Biol. Chem., 272, 29987-29990; Perona, J. &amp; Craik, C (1995) Protein Science, 4, 337-360). Se describe un alineamiento de las secuencias de aminoácidos de estas proteasas en el ejemplo 1 (Figura 2) junto con la identificación de SDR.
Un ejemplo adicional dentro de la familia de serina proteasas lo constituyen los miembros de la clase estructural S8 (pliegue de subtilisina). La subtilisina es la proteasa tipo para esta clase y representa una proteasa no específica (Ottesen, M. &amp; Svendsen, A. (1998) Methods Enzymol. 19, 199-215). Furina, PC1 y PC5 son proteasas de la misma clase estructural implicadas en el procesamiento de propéptidos y tienen una alta especificidad de sustrato (Seidah,
N. &amp; Chretien, M. (1997) Curr. Opin. Biotech., 8:602-607; Bergeron, F. y col (2000) J. Mol Endocrin., 24:1-22). En una variante preferida del enfoque se usan alineamientos de las secuencias de aminoácidos primarias (Figura 4) para identificar once tramos de secuencia mayores de tres aminoácidos que las proteasas específicas tienen además en comparación con subtilisina y son por lo tanto regiones determinantes de especificidad potenciales. En una variante adicional del enfoque puede usarse información de la estructura tridimensional de subtilisina para restringir adicionalmente la selección (Figura 3). De los once tramos de secuencia insertados, tres están especialmente cerca de los restos del sitio activo, concretamente el número de tramo 7, 8 y 11 que son inserciones en PC5, PC1 y las tres proteasas específicas, respectivamente (Figura 3). En una variante preferida, pueden insertarse uno o varios tramos de aminoácidos de longitud y composición variable en la secuencia de subtilisina en una o varias de las once posiciones. En una variante más preferida del enfoque la inserción se realiza en las regiones 7, 8 u 11 o cualquier combinación de las mismas. En otra variante preferida del enfoque se usan armazones de proteasa distintos de subtilisina de la clase estructural S8.
En una variante preferida adicional de este enfoque, se analizan proteasas de ácido aspártico de la clase estructural A1 (Rawlings, N.D. &amp; Barrett, A.J. (1995). Methods Enzymol. 248, 105-120; Chitpinityol, S. &amp; Crabbe, MJ. (1998), Food Chemistry, 61, 395-418). Son ejemplos de la clase estructural A1 de proteasas aspárticas pepsina con baja especificidad así como beta-secretasa (Gruninger-Leitch, F y col (2002) J. Biol. Chem. 277, 4687-4693) y renina (Wang, W. &amp; Liang, TC. (1994) Biochemistry, 33, 14636-14641) con especificidades de sustrato relativamente altas. Las proteasas retrovirales también pertenecen a esta clase, aunque la enzima activa es un dímero de dos subunidades idénticas. Las proteasas virales son esenciales para el correcto procesamiento del precursor poliproteico para generar proteínas funcionales que requiere una alta especificidad de sustrato en cada caso (Wu,J. y col (1998) Biochemistry, 37, 4518-4526; Pettit, S. y col (1991) J. Biol. Chem., 266, 14539-14547). La pepsina es la proteasa tipo para esta clase y representa una proteasa no específica (Kageyama, T. (2002) Cell. Mol. Life Sci. 59, 288-306). B-secretasa y catepsina D (Aguilar, C. F. y col (1995) Adv. Exp. Med. Biol., 362, 155-166) son proteasas de la misma clase estructural y tienen una alta especificidad de sustrato. En una variante preferida del enfoque se usan alineamientos de las secuencias de aminoácidos primarias (Figura 6) para identificar seis tramos de secuencia mayores de tres aminoácidos que se insertan en las proteasas específicas en comparación con pepsina y son por lo tanto regiones determinantes de especificidad potenciales. En una variante adicional del enfoque puede usarse información de la estructura tridimensional de b-secretasa para restringir la selección. De los seis tramos de secuencia insertados, tres están especialmente cerca de los restos del sitio activo, concretamente los números de tramo 1, 3 y 4 que son inserciones en catepsina D y beta-secretasa, respectivamente (Figura 5). En una variante preferida del enfoque, pueden insertarse uno o varios tramos de aminoácidos de longitud y composición variable en la secuencia de pepsina en una o más de las seis posiciones. En una realización más preferida la inserción se realiza en las posiciones 1, 3 ó 4 o cualquier combinación de las mismas. En otra realización preferida se usan armazones de proteasa distintos de pepsina.
Existen casos en los que una cierta clase estructural no incluye miembros conocidos de alta y baja especificidad. Esto se ejemplifica por la clase C14 de caspasas que pertenecen a la familia de cisteína proteasa (Rawlings, N.D. &amp; Barrett, A.J. (1994) Methods Enzymol. 244, 461-486) y que muestran todas alta especificidad para las posiciones P4 a P1. Por ejemplo, caspasa-1, caspasa-3 y caspasa-9 reconocen las secuencias YVAD^, DEVD^ o LEHD^, respectivamente. La identificación de las regiones que difieren entre las caspasas incluirán las regiones responsables de las diferencias en especificidad de sustrato (Figuras 7 y 8).
Finalmente, las proteínas no enzimáticas del mismo pliegue que el armazón enzimático también pueden contribuir a la identificación de sitios de inserción para SDR. Por ejemplo, haptoglobina (Arcoleo, J. &amp; Greer, J.; (1982) J. Biol. Chem. 257, 10063-10068) y azurocidina (Almeida, R. y col (1991) Biochem. Biophys. Res Commun. 177, 688-695) comparten el mismo pliegue de tipo quimiotripsina con todas las proteasas S1. Debido a sustituciones en los restos del sitio activo estas proteínas no poseen ninguna función proteolítica, pero muestran alta homología con proteasas activas. Las diferencias entre estas proteínas y las proteasas específicas incluyen regiones que pueden actuar como sitios de inserción para SDR.
En un cuarto enfoque, se identifican sitios de inserción para SDR experimentalmente por técnicas tales como cribado de alanina, mutagénesis aleatoria, inserción aleatoria o deleción aleatoria. A diferencia del enfoque desvelado anteriormente, este enfoque no requiere conocimiento detallado acerca de la estructura tridimensional del armazón proteico. En una variante preferida de este enfoque, puede usarse mutagénesis aleatoria de enzimas con especificidad relativamente alta de la misma clase estructural que el armazón proteico y cribado con respecto a pérdida de cambio de especificidad para identificar sitios de inserción para SDR en el armazón proteico.
La mutagénesis aleatoria, cribado de alanina, inserción aleatoria o deleción aleatoria se realizan todas en el nivel de los polinucleótidos que codifica las enzimas. Existe una diversidad de protocolos conocidos en la bibliografía (por ejemplo, Sambrook, J. F. Fritsch, E.F.; Maniatis, T.; Cold Spring Harbor Laboratory Press, segunda edición, 1989, Nueva York). Por ejemplo, puede conseguirse mutagénesis aleatoria mediante el uso de una polimerasa como se describe en la patente WO 9218645. De acuerdo con esta patente, el o los genes que codifican la o las proteasas se amplifican por el uso de una ADN polimerasa con una alta tasa de error o en condiciones que aumentan la tasa de incorporaciones erróneas. Por ejemplo puede emplearse el procedimiento de Cadwell y Joyce (Cadwell, R.C. y Joyce, G.F., PCR methods. Apl. 2 (1992) 28-33). También pueden emplearse otros procedimientos de mutagénesis aleatoria tales como, pero sin limitación, el uso de cepas mutantes, mutágenos químicos o radiación UV. Como alternativa, pueden usarse oligonucleótidos para mutagénesis que sustituyen restos aminoacídicos distribuidos aleatoriamente con una alanina. Este procedimiento se denomina generalmente mutagénesis de cribado de alanina (Fersht, A.R. Biochemistry (1989) 8031-8036). Como una alternativa adicional, pueden emplearse modificaciones de la mutagénesis de cribado de alanina tales como mutagénesis binominal (Gregoret, L.M. y Sauer, R.T. PNAS (1993) 4246-4250) o cribado de alanina combinatoria (Weiss y col, PNAS (2000) 8950-8954).
Para expresar enzimas obtenidas por ingeniería genética, el ADN que codifica tales proteínas obtenidas por ingeniería genética se liga en un vector de expresión adecuado por técnicas de clonación molecular convencionales (por ejemplo, Sambrook, J. F.; Fritsch, E.F.; Maniatis, T.; Cold Spring Harbor Laboratory Press, segunda edición, 1989, Nueva York). El vector se introduce en una célula huésped de expresión adecuada que expresa la variante enzimática obtenida por ingeniería genética correspondiente. Son huéspedes de expresión particularmente adecuados huéspedes de expresión bacterianos tales como Escherichia coli o Bacillus subtilis, huéspedes de expresión de levaduras tales como Saccharomyces cerevisiae o Pichia pastoris, huéspedes de expresión de mamíferos tales como las líneas celulares de ovario de hámster chino (CHO) o riñón de cría de hámster (BHK), sistemas de expresión virales tales como bacteriófagos como M13 o Lambda o virus tales como sistema de expresión de baculovirus. Como una alternativa adicional, pueden usarse sistemas para expresión de proteínas in vitro. Normalmente, el ADN se liga en un vector de expresión detrás de una secuencia señal adecuada que conduce a secreción de las variantes de enzima al espacio extracelular, permitiendo de este modo la detección directa de la actividad proteasa en el sobrenadante celular. Son secuencias señal particularmente adecuadas para Escherichia coli HlyA, para Bacillus subtilis AprE, NprB, Mpr, AmyA, AmyE, Blac, SacB y para S. cerevisiae Bar1, Suc2, Matα, Inu1A, Ggplp. Como alternativa, las variantes de enzima se expresan intracelularmente y los sustratos se expresan también intracelularmente. Preferentemente, esto se realiza esencialmente como se ha descrito en la solicitud de patente WO 0212543, usando un sustrato peptídico de fusión que comprende dos proteínas autofluorescentes ligadas por la secuencia de aminoácidos sustrato. Como una alternativa adicional, después de expresión intracelular de las variantes de enzima o secreción al espacio periplásmico usando secuencias señal tales como DsbA, PhoA, PeIB, OmpA, OmpT o gIII para Escherichia coli, una etapa de permeabilización o lisis libera las variantes de enzima al sobrenadante. La destrucción de la barrera de membrana puede forzarse mediante el uso de medios mecánicos tales como ultrasonidos, prensa francesa o el uso de enzimas que digieren la membrana tales como lisozima. Como otra alternativa adicional, los genes que codifican las variantes de enzima se expresan sin células mediante el uso de un sistema de expresión sin células adecuado. Por ejemplo, el extracto S30 de células de Escherichia coli se usa para este fin como se describe en Lesly y col (Methods in Molecular Biology 37 (1995) 265-278).
El conjunto de variantes génicas generado y expresado por cualquiera de los procedimientos anteriores se analiza con respecto a su afinidad, especificidad de sustrato o actividad por ensayo apropiado y procedimientos de cribado como se describe en detalle por ejemplo en la solicitud de patente PCT/EP03/04864. Se analizan genes de variantes catalíticamente activas que tienen especificidad reducida en comparación con la enzima original por secuenciación. Los sitios en los que se producen mutaciones, inserciones y/o deleciones son sitios de inserción preferidos en los que pueden insertarse SDR de forma específica de sitio.
En una segunda realización, la o las secuencias peptídicas parcial o completamente aleatorias se insertan en sitios aleatorios en el armazón proteico. Esta modificación se realiza habitualmente en el nivel de polinucleótidos, es decir insertando secuencias de nucleótidos en el gen que codifica el armazón proteico. Están disponibles varios procedimientos que permiten la inserción aleatoria de secuencias de nucleótidos. Los sistemas que pueden usarse
para inserción aleatoria son por ejemplo sistemas basados en ligación (Murakami y col. Nature Biotechnology 20 (2002) 76-81), sistemas basados en polimerización de ADN y sistemas basados en transposones (por ejemplo, sistema de mutagénesis GPS-MTM, NEB Biolabs; sistema de generación de mutaciones MGSTM, Finnzymes). Los procedimientos basados en transposón emplean una inserción mediada por transposasa de un gen marcado seleccionable que contiene en sus extremos secuencias de reconocimiento para la transposasa así como dos sitios para una endonucleasa de restricción de corte poco habitual. Usando la segunda endonucleasa habitualmente se libera el marcador de selección y después de la religación se obtiene una inserción. En lugar de realizar la religación se puede insertar como alternativa un fragmento que tiene secuencias de reconocimiento terminales para una o dos endonucleasas de restricción de corte exterior así como un marcador seleccionable. Después de la ligación, se libera este fragmento usando la o las dos endonucleasas de corte exterior. Después de crear extremos romos por procedimientos convencionales se insertan fragmentos aleatorios de extremos romos en posiciones aleatorias en el gen.
En una realización referida adicional, se usan procedimientos para recombinación in vitro homóloga para combinar las mutaciones introducidas por los procedimientos anteriormente mencionados para generar poblaciones de enzima. Son ejemplos de procedimientos que pueden aplicarse la Reacción en Cadena de Recombinación (RCR) de acuerdo con la Solicitud de Patente WO 0134835, el procedimiento de Barajado de ADN de acuerdo con la Solicitud de Patente WO 9522625, el procedimiento de Extensión Escalonada de acuerdo con la Patente WO 9842728, o la recombinación de Cebadores Aleatorios de acuerdo con la Solicitud de Patente WO9842728. Además, también pueden aplicarse procedimientos para recombinación no homóloga tales como el procedimiento de Itchy (Ostermeier, M. y col. Nature Biotechnology 17 (1999) 1205-1209).
Tras inserción aleatoria de una secuencia de nucleótidos en el armazón proteico se obtiene una biblioteca de diferentes genes que codifican variantes de enzima. La biblioteca polinucleotídica se transfiere posteriormente a un vector de expresión apropiado. Tras la expresión en un huésped adecuado o mediante el uso de un sistema de expresión in vitro, se obtiene una biblioteca de enzimas que contienen tramos de aminoácidos insertados de forma aleatoria.
De acuerdo con la etapa (b) de este tercer aspecto, se insertan una o más secuencias peptídicas completa o parcialmente aleatorias en el armazón proteico. El número real de tales SDR insertadas se determina por la especificidad cuantitativa pretendida que sigue la relación: cuanto mayor sea la especificidad pretendida más SDR se insertan. Mientras que una SDR sencilla permite la generación de enzimas moderadamente específicas, dos SDR permiten ya la generación de enzimas significativamente específicas. Sin embargo, pueden insertarse hasta seis y más SDR en un armazón proteico. Una relación similar es válida para la longitud de las SDR: cuanto mayor sea la especificidad pretendida, más largas serán las SDR que deban insertarse. Las SDR pueden ser tan cortas como de uno a cuatro restos aminoacídicos. Pueden, sin embargo, también ser tan largas como 50 restos aminoacídicos. Puede generarse ya especificidad significativa mediante el uso de SDR de una longitud de cuatro a seis restos aminoacídicos.
Las secuencias peptídicas que se insertan pueden ser completa o parcialmente aleatorias. En este contexto, completamente aleatorias significa que se inserta un conjunto de secuencias en paralelo que incluye secuencias que difieren entre sí en todas y cada una de las posiciones. Parcialmente aleatorias significa que se inserta un conjunto de secuencias en paralelo que incluye secuencias que difieren entre sí en al menos una posición. Esta diferencia puede ser por pares o con respecto a una secuencia sencilla. Por ejemplo, con respecto a una inserción de la longitud de cuatro aminoácidos, parcialmente aleatorio puede ser un conjunto (i) que incluye AGGG, GVGG, GGLG, GGGI, o (ii) que incluye AGGG, VGGG, LGGG y IGGG. Como alternativa, las secuencias aleatorias también comprenden secuencias que difieren entre sí en la longitud. La selección aleatoria de las secuencias peptídicas se consigue seleccionando aleatoriamente las secuencias de nucleótidos que se insertan en el gen en los sitios respectivos. De este modo, la selección aleatoria puede conseguirse empleando mezclas de bases nitrogenadas como monómeros durante la síntesis química de los oligonucleótidos. Una mezcla particularmente preferida de monómeros para un codón completamente aleatorio que además minimiza la probabilidad de codones de parada es NN(GTC). Como alternativa, pueden obtenerse oligonucleótidos aleatorios por fragmentación de ADN en fragmentos cortos que se insertan en el gen en los sitios respectivos. La fuente del ADN a fragmentar puede ser un oligonucleótido sintético pero como alternativa puede originarse de genes clonados, ADNc o ADN genómico. Preferentemente, el ADN es un gen que codifica una enzima. La fragmentación puede, por ejemplo, conseguirse por digestión endonucleolítica aleatoria de ADN. Preferentemente, se emplea una endonucleasa no específica tal como ADNasa I (por ejemplo de páncreas bovino) para la digestión endonucleolítica.
Si las etapas (a) - (c) del procedimiento se repiten de forma cíclica, existen diferentes alternativas para obtener secuencias peptídicas aleatorias que se insertan en ciclos consecutivos. Preferentemente, las SDR que se identificó en un ciclo que conducían a especificidad aumentada de enzima se usan como moldes para las secuencias peptídicas aleatorias que se insertan en el ciclo siguiente.
En una alternativa preferida, las secuencias seleccionadas en un ciclo se analizan y se generan oligonucleótidos seleccionados de forma aleatoria basándose en estas secuencias. Esto puede, por ejemplo, conseguirse usando además del nucleótido original con un cierto porcentaje de mezclas de los otros tres monómeros nucleotídicos en cada posición en la síntesis de oligonucleótido. Si, por ejemplo, en un primer ciclo se identifica una SDR que tiene la
secuencia de aminoácidos ARLT, por ejemplo, codificada por la secuencia de nucleótidos GCG CGC CTT ACC, una secuencia peptídica aleatoria insertada en este sitio de SDR podría codificarse por un oligonucleótido con G 70 %, A 10 %, T 10 % y C 10 % en la primera posición, C 70 %, G 10 %, T 10 % y A 10 % en la segunda posición, etc. Esto conduce en cada posición aproximadamente en uno de cada tres casos al aminoácido molde y en dos de cada tres casos a otro aminoácido.
En otra alternativa preferida, las secuencias seleccionadas en un ciclo se analizan y se genera una biblioteca consenso basándose en estas secuencias. Esto puede, por ejemplo, conseguirse usando mezclas definidas de nucleótidos en cada posición en la síntesis de oligonucleótidos de modo que conduzca a mezclas de los restos aminoacídicos que se identificaron en cada posición de la SDR seleccionada en el ciclo anterior. Si, por ejemplo, en un primer ciclo se identifican dos SDR que tienen las secuencias de aminoácidos ARLT y VPGS, una biblioteca consenso insertada en ese sitio SDR en el siguiente ciclo podría codificarse por un oligonucleótido con la secuencia G(C/T)G C(G/C)C (G/T)(G/T)G (A/T)CC. Esto correspondería a la secuencia peptídica aleatoria (A/V)(R/P)(L/G/V/W)(T/S), permitiendo de este modo todas las combinaciones de los restos aminoacídicos identificados en el primer ciclo y, debido a la degeneración del código genético, permitiendo además en menor grado restos aminoacídicos alternativos en algunas posiciones.
En otra alternativa preferida, estas secuencias seleccionadas en un ciclo se recombinan, sin análisis previo, usando procedimientos para la recombinación in vitro de polinucleótidos, tales como los procedimientos descritos en el documento WO 01/34835 (lo siguiente también proporciona detalles del octavo y noveno aspecto).
Después de la inserción de las secuencias parcial o completamente aleatorias en el gen que codifica la proteína de armazón y con el tiempo la ligación del gen resultante en un vector de expresión adecuado usando técnicas de clonación molecular convencionales (Sambrook, J.F; Fritsch, E.F.; Maniatis,T.; Cold Spring Harbor Laboratory Press, Segunda Edición, 1989, Nueva York), el vector se introduce en una célula huésped de expresión adecuada que expresa la variante enzimática correspondiente. Son huéspedes de expresión particularmente adecuados los huéspedes de expresión bacterianos tales como Escherichia coli o Bacillus subtilis, huéspedes de expresión de levaduras tales como Saccharomyces cerevisiae o Pichia pastoris, huéspedes de expresión de mamíferos tales como líneas celulares de Ovario de Hámster Chino (CHO) o Riñón de Cría de Hámster (BHK), sistemas de expresión viral tales como bacteriófagos como fago M13T7 o Lambda o virus tales como el sistema de expresión de Baculovirus. Como una alternativa adicional, pueden usarse sistemas para expresión proteica in vitro. Normalmente el ASDN se liga en un vector de expresión detrás de una secuencia señal adecuada que conduce a secreción de las variantes enzimáticas al espacio intracelular, permitiendo de este modo la detección directa de actividad enzimática en el sobrenadante celular. Son secuencias señal particularmente adecuadas para Escherichia coli ompA, pelB, HlyA, para Bacillus subtilis AprE, NprB, Mpr, AmyA, AmyE, Blac, SacB, y para S. cerevisiae Bar1, Suc2, Mata, Inu1A, Ggplp. Como alternativa, las variantes de enzima se expresan intracelularmente y los sustratos se expresan también intracelularmente. De acuerdo con variantes de proteasa esto se realiza esencialmente como se describe en la Solicitud de Patente WO 0212543, usando un sustrato peptídico de fusión que comprende dos proteínas autofluorescentes ligadas por la secuencia de aminoácidos sustrato. Como una alternativa adicional, después de la expresión intracelular de las variantes de enzima o secreción al espacio periplásmico usando secuencias señal tales como DsbA, PhoA, PeIB, OmpA, OmpT o gIII para Escherichia coli, una etapa de permeabilización o lisis libera las variantes de enzima al sobrenadante. La destrucción de la barrera de membrana puede forzarse por el uso de medios mecánicos tales como ultrasonidos, prensa Francesa o el uso de enzimas de digestión de membrana tales como lisozima. Como otra alternativa adicional, los genes que codifican las variantes enzimáticas se expresan sin células mediante el uso de un sistema de expresión sin células adecuado. Por ejemplo, el extracto S30 de células de Escherichia coli se usa para este fin como se describe en Lesly y col. (Methods in Molecular Biology 37 (1995) 265278).
Después de la introducción del vector en células huésped, estas células se criban con respecto a la expresión de enzimas con especificidad para el sustrato diana pretendido. Dicho cribado se realiza normalmente separando las células entre sí, para permitir la correlación de genotipo y fenotipo y ensayando la actividad de cada clon celular después de un periodo de crecimiento y expresión. Dicha separación puede por ejemplo realizarse por distribución de las células en los compartimentos de vehículos de muestras, por ejemplo como se describe en el documento WO 01/24933. Como alternativa, las células se separan sembrando en estrías en placas de agar, incluyendo en un polímero tal como agarosa, llenando capilares o por procedimientos similares.
La identificación de variantes con la especificidad pretendida puede realizarse por diferentes enfoques. En el caso de proteasas, preferentemente se emplean ensayos que usan sustratos peptídicos esencialmente como se describe en el documento PCT/EP03/04864.
Independientemente del formato de expresión, la selección de variantes de enzima se realiza en condiciones que permiten la identificación de enzimas que reconocen y convierten la secuencia diana preferentemente. Como una primera alternativa, se identifican enzimas que reconocen y convierten al secuencia diana preferentemente por cribado con respecto a enzimas con una alta afinidad para la secuencia sustrato diana. La alta afinidad corresponde a una baja KM que se selecciona cribando a concentraciones de sustrato diana sustancialmente por debajo de la KM de la primera enzima. Preferentemente, los sustratos que se usan están ligados a uno o más fluoróforos que permite la detección de la modificación del sustrato en concentraciones por debajo de 10 μM, preferentemente por debajo de
1 μM, más preferentemente por debajo de 100 nM y más preferentemente por debajo de 10 nM.
Como una segunda alternativa, se identifican enzimas que reconocen y convierten el sustrato diana preferentemente empleando dos o más sustratos en el ensayo y cribando con respecto a actividad en estos dos o más sustratos en comparación. Preferentemente, los dos o más sustratos empleados están ligados a diferentes moléculas marcadoras, permitiendo de este modo la detección de la modificación de los dos o más sustratos consecutivamente
o en paralelo. En caso de proteasas, particularmente preferentemente se emplean dos sustratos peptídicos, un sustrato peptídico que tiene una secuencia de aminoácidos seleccionada de forma arbitraria o incluso parcial o completamente aleatoria permitiendo de este modo controlar la actividad en un sustrato arbitrario y teniendo el otro sustrato peptídico una secuencia de aminoácidos idéntica o semejante a la secuencia sustrato diana pretendida permitiendo de este modo controlar la actividad en el sustrato diana. Especialmente preferentemente, estos dos sustratos peptídicos están ligados a moléculas marcadoras fluorescentes y las propiedades fluorescentes de los dos sustratos peptídicos son suficientemente diferentes para distinguir ambas actividades cuando se miden consecutivamente o en paralelo. Por ejemplo, puede usarse una proteína de fusión que comprende una primera proteína auto-fluorescente, un péptido y una segunda proteína auto-fluorescente de acuerdo con la Solicitud de Patente WO 0212543 para este fin. Como alternativa, se ligan químicamente fluoróforos tales como rodaminas a los sustratos peptídicos.
Como una tercera alternativa, se identifican enzimas que reconocen y convierten un sustrato diana preferentemente empleando uno o más sustratos que se asemejan al sustrato diana junto con sustratos que compiten en alto exceso. Se realiza después cribado con respecto a actividad en los sustratos que se asemejan a sustrato diana en presencia de los sustratos que compiten. Las enzimas que tiene una especificidad que corresponde cualitativamente a la especificidad diana, pero que tienen solamente una especificidad cuantitativa baja se identifican como muestras negativas en un cribado tal, mientras que las enzimas que tienen una especificidad que corresponde cualitativa y cuantitativamente a la especificidad diana se identifican positivamente. Preferentemente, el o los sustratos que se asemejan al sustrato diana se ligan a moléculas marcadoras, permitiendo de este modo la detección de sus modificaciones, mientras que los sustratos que compiten no portan moléculas marcadoras. Los sustratos que compiten tiene secuencias de aminoácidos seleccionadas arbitrariamente o aleatorias, actuando de este modo como inhibidores competitivos para la hidrólisis de los sustratos que portan marcadores. Por ejemplo, los hidrolizados proteicos tales como Trypton pueden actuar como sustratos de competición para enzimas proteolíticas obtenidas por ingeniería genética.
Como una cuarta alternativa, se identifican y seleccionan enzimas que reconocen y convierten el sustrato diana preferentemente por una etapa de selección acoplada a amplificación o acoplada a crecimiento. Además, la actividad puede medirse intracelularmente y la selección puede realizarse por un clasificador celular, tal como un clasificador celular activado por fluorescencia.
Como una alternativa adicional, se identifican enzimas que reconocen y convierten el sustrato diana seleccionando primero enzimas que se unen preferentemente al sustrato diana y en segundo lugar seleccionando de este subgrupo de variantes de enzima las enzimas que convierten el sustrato diana. La selección de enzimas que se unen preferentemente al sustrato diana puede realizarse por selección de agentes de unión al sustrato diana o por el contrario selección de enzimas que se unen a otros sustratos. Se conocen en la técnica procedimientos para la selección de agentes de unión o para la contra selección de agentes no de unión. Tales procedimientos normalmente requieren acoplamiento fenotipo-genotipo que puede resolverse usando procedimientos de expresión de presentación superficial. Tales procedimientos incluyen, por ejemplo, presentación de fagos o virus, presentación de superficie celular y presentación in vitro. La presentación de fagos o viral normalmente implica fusión de la proteína de interés con una proteína viral/de fago. La presentación de superficie celular, es decir presentación de célula bacteriana de eucariota, normalmente implica fusión de la proteína de interés con un péptido o proteína que se localiza en la superficie celular. En presentación in vitro, la proteína se prepara normalmente in vitro y se liga directa o indirectamente al ARNm que codifica la proteína (documento DE 19646372).
La divulgación también proporciona una composición o composición farmacéutica que comprende una o más enzimas obtenidas por ingeniería genética de acuerdo con el primer aspecto como se ha definido anteriormente en el presente documento. La composición puede comprender opcionalmente un vehículo, excipiente y/o agente adyuvante aceptable. Las composiciones no farmacéuticas como se define en el presente documento son composición de investigación, composición nutricional, composición de limpieza, composición de desinfección, composición cosmética o composición para cuidado personal. Además, también se proporcionan secuencias de ADN que codifican la enzima obtenida por ingeniería genética como se ha definido anteriormente en el presente documento y vectores que contienen dichas secuencias de ADN. Finalmente, también se contemplan células huésped transformadas (procariotas o eucariotas) u organismos transgénicos que contiene tales secuencias de ADN y/o vectores, así como un procedimiento que utiliza tales células huésped o animales transgénicos para producir la enzima obtenida por ingeniería genética del primer aspecto.
Descripción detallada de las figuras
Figura 1: Estructura tridimensional de tripsina humana I con los restos de sitio activo mostrados en representación de “bolas y varillas” e indicando las reacciones marcadas sitios de inserción de SDR potenciales.
Figura 2: Alineamiento de las secuencias de aminoácidos primarias de las proteasa humanas tripsina I, alfa-trombina y enteropeptidasa todas las cuales pertenecen a la clase estructural S1 de la familia de serina proteasa. La tripsina presenta una proteasa no específica de esta clase estructural, mientras que alfa-trombina y enteropeptidasa son proteasas con alta especificidad de sustrato. En comparación con tripsina se ven varias regiones de inserciones de tres o más aminoácidos en la secuencia primaria de α-trombina y enteroquinasa. La región marcada con (-1-) y la región marcada con (-3-) son sitios de inserción de SDR preferidos. En la estructura terciaria de alfa-trombina ambas regiones están en las cercanías del sitio de unión a sustrato. Estas regiones cumplen por lo tanto dos criterios para seleccionarse como candidatos para SDR: en primer lugar, representan inserciones en las proteasas específicas en comparación con la no específica y en segundo lugar, están cerca del sitio de unión de sustrato. Se proporciona la representación de la estructura tridimensional en la Figura 3.
Figura 3: Estructura tridimensional de subtilisina mostrándose los restos de sitio activo en representación de “bolas y varillas” indicando las regiones numeradas sitios de inserción de SDR potenciales.
Figura 4: Alineamiento de las secuencias de aminoácidos primarias de subtilisina E, furina , PC1 y PC5 todas las cuales pertenecen a la clase estructural S8 de la familia de serina proteasa. La subtilisina E representa una proteasa no específica de esta clase estructural, mientras que furina, PC1 y PC5 son proteasas con alta especificidad de sustrato. En comparación con subtilisina se ven varias regiones de inserciones de tres o más aminoácidos en la secuencia primaria de furina, PC1 y PC5. Las reacciones marcadas con (-4-), (-5-), (-7-), (-9-) y (-11-) son sitios de inserción de SDR preferidos. Estos tramos de región cumplen dos criterios para seleccionarse como candidatos para SDR: en primer lugar, representan inserciones en las proteasas específicas en comparación con la no específica y, en segundo lugar, están cerca de los restos del sitio activo.
Figura 5: Estructura tridimensional de beta-secretasa mostrándose los restos de sitio activo en representación de “bolas y varillas” e indicando las regiones numeradas sitios de inserción de SDR potenciales.
Figura 6: Alineamiento de las secuencias de aminoácidos primarias de pepsina, b-secretasa y catepsina D, todas las cuales pertenecen a la clase estructural A1 de la familia de proteasa aspártica. La pepsina representa una proteasa no específica de esta clase estructural, mientras que b-secretasa y catepsina D son proteasas con alta especificidad de sustrato. En comparación con pepsina se ven varias regiones de inserciones de tres o más aminoácidos en la secuencia primaria de b-secretasa y catepsina D. las regiones marcadas con -1- a -11- corresponden a posibles sitios de combinación de SDR y también están marcados en la Figura S.
Figura 7: Ilustra la estructura tridimensional de caspasa 7 mostrándose los restos del sitio activo en representación de “bolas y varillas” e indicando las regiones numeradas sitios de inserción de SDR potenciales.
Figura 8: Muestra la secuencia de aminoácidos primarios de caspasa 7 como un miembro de la familia de cisteína proteasa de clase C14 (véase también SEC ID Nº: 14).
Figura 9: Representación esquemática del procedimiento de acuerdo con el tercer aspecto.
Figura 10: Análisis de transferencia de Western de expresión de tripsina. El sobrenadante de cultivos celulares que expresan variantes de tripsina se compara con controles negativos. Carril 1: patrón de peso molecular; carril 2: control negativo; carril 3: sobrenadante de variante a; carril 4: control negativo; carril 5: sobrenadante de variante b. Se usó un anticuerpo primario específico para la proteína expresada y un anticuerpo secundario para generación de la señal.
Figura 11: Curso temporal de la escisión proteolítica de un sustrato diana. El sobrenadante de células que contienen el vector con el gen para tripsina humana y el de células que contienen el vector sin el gen se incubó con el sustrato peptídico descrito en el texto. La escisión del péptido dio como resultado una disminución del valor de lectura. La actividad proteolítica se confirma para el clon positivo.
Figura 12: Actividad relativa de tres enzimas proteolíticas obtenidas por ingeniería genética en comparación con tripsina humana I en dos sustratos peptídicos diferentes. Se realizó un ciclo temporal de la digestión proteolítica de los dos sustratos y se evaluó. Se usó sustrato B para el cribado y el sustrato A es una secuencia cercanamente relacionada. La actividad relativa de las tres variantes se normalizó a la actividad de tripsina humana I. La variante 1 y 2 claramente muestran aumento de la especificidad hacia el sustrato diana. La variante 3, por otro lado sirve como control negativo con actividades similares a la tripsina I humana.
Figura 13: Especificidades relativas de tripsina y variantes de enzimas proteolíticas obtenidas por ingeniería genética con una o dos SDR, respectivamente. La actividad de las proteasas se determinó en presencia y ausencia del sustrato competidor, es decir peptona a una concentración de 10 mg/ml. Los ciclos temporales para la escisión proteolítica se registraron y se determinaron las constantes de tiempo k. las relaciones entre las constantes de tiempo con y sin competidor se formaron y representan una medida cuantitativa para especificidad de la proteasa. Las relaciones se normalizaron a tripsina. La especificidad de la variante que contenía dos SDR es 2,5 veces mayor que la de la variante con SDR2 solamente.
Figura 14: Muestra las especificidades relativas de variantes de proteasa en ausencia y presencia de sustrato
competidor. Las variantes de proteasa que contiene dos insertos con diferentes secuencias y la tripsina humana I de armazón no modificado se expresaron en un huésped adecuado. La actividad de las variantes de proteasa se determinó como la velocidad de escisión de un péptido con la secuencia diana deseada de TNF-alfa en ausencia y presencia de sustrato competidor. La especificidad se expresa como la relación de velocidades de escisión en presencia o ausencia de competidor.
Figura 15: La figura muestra la reducción de citotoxicidad inducida por TNF-alfa humano cuando se incuba el TNFalfa humano con sobrenadante concentrado de cultivos que expresan las enzimas proteolíticas obtenidas por ingeniería genética que son específicas para TNF-alfa humano. Esto indica la eficacia de las enzimas proteolíticas obtenidas por ingeniería genética.
Figura 16: La figura muestra la reducción de citotoxicidad inducida por TNF-alfa humano cuando se incuba el TNFalfa humano con diferentes concentraciones de enzima proteolítica obtenida por ingeniería genética purificada que es específica para TNF-alfa humano. La variante G comprende SEC ID Nº: 72 como SDR1 y SEC ID Nº: 73 como SDR2. Esto indica la eficacia de las enzimas proteolíticas obtenidas por ingeniería genética.
Figura 17: La figura compara la actividad de enzimas proteolíticas obtenidas por ingeniería genética que son específicas para TNF-alfa humano con la actividad de tripsina humana I en dos sustratos proteicos: (a) TNF-alfa humano; (b) mezcla de proteínas de suero humano. Esto indica la seguridad de las enzimas proteolíticas obtenidas por ingeniería genética. La variante x corresponde a SEC ID Nº: 75 que comprende las SDR de acuerdo con SEC ID Nº 89 (SDR1) y 95 (SDR2). Las variantes xi y xii corresponden a derivados de la misma que comprende las mismas secuencias de SDR.
Figura 18: Hidrólisis específica de VEGF humano por una enzima proteolítica obtenida por ingeniería genética derivada de tripsina humana.
Ejemplos
En los siguientes ejemplos, se proporcionan materiales y procedimientos de la presente invención incluyendo la determinación de propiedades catalíticas de enzimas obtenidas por el procedimiento. Debería entenderse que estos ejemplos son para fines ilustrativos solamente y no deben interpretarse como limitantes de la presente invención de ninguna manera.
En los ejemplos experimentales descritos posteriormente, se usaron técnicas convencionales de tecnología de ADN recombinante que se han descrito en diversas publicaciones, por ejemplo Sambrook y col. (1989), Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, o Ausubel y col. (1987), Current Protocols in Molecular Biology 1987-1988, Wiley Interscience. A no ser que se indique de otro modo, las enzimas de restricción, polimerasas y otras enzimas así como kits de purificación de ADN se usaron de acuerdo con las especificaciones de los fabricantes.
Ejemplo I: Identificación de sitios de SDR en tripsina humana
Se han identificado sitios de inserción para SDR en la serina proteasa tripsina humana I (clase estructural S1) por comparación con miembros de la misma clase estructural que tienen una mayor especificidad de secuencia. La tripsina representa un miembro con especificidad de sustrato baja, puesto que requiere solamente un resto de arginina o lisina en la posición P1. Por otro lado, la trombina, activador de plasminógeno de tipo tisular o enteroquinasa tiene todas una alta especificidad para sus secuencias sustrato, es decir (L/I/V/F)XPR^NA, CPGR^VVGG y DDDK^, respectivamente. Las secuencias primarias y estructuras terciarias de estas y adicionales serina proteasa S1 se han alineado para determinar regiones de baja y alta homología de secuencia y estructura y especialmente regiones que corresponden a inserciones en las secuencias de las proteasas más específicas (Figura 2). Se han identificado varias regiones de inserciones iguales o mayores de tres aminoácidos que representan sitios de SDR potenciales como se indica en la Figura 1. Estas regiones se seleccionaron como sitios diana para la inserción de SDR en los ejemplos posteriores, por ejemplo SDR1 (región 1 en la Figura 2, después del aminoácido 42 de acuerdo con SEC ID Nº: 1) con una longitud de 6 y SDR2 (región 3 en la Figura 2, después del aminoácido 123 de acuerdo con SEC ID Nº: 1) con una longitud de 5 aminoácidos, respectivamente.
Ejemplo II: Clonación molecular del gen de tripsina humana I para usarlo como proteína de armazón y expresión de la proteasa madura en B. subtilis
El gen que codifica la proteasa no específica tripsinógeno humano I se clonó en el vector pUC18. La clonación se realizó como sigue: la secuencia codificante de la proteína se codificó por PCR usando cebadores que introdujeron un sitio Kpnl en el extremo 5’ y un sitio BamHI en el extremo 3’. Este fragmento de PCR se clonó en los sitios apropiados del vector pUC18. La identidad se confirmó por secuenciación. Después de secuenciar la secuencia codificante de la proteína madura se amplificó por PCR usando cebadores que introdujeron diferentes sitios BgII en el extremo 5’ y el extremo 3’. Este fragmento de PCR se clonó en los sitios apropiados de un vector lanzadera de E. coli - B. subtilis. El vector contiene un origen pMB1 para la amplificación en E. coli, un marcador de resistencia a neomicina para selección en E. coli así como un promotor P43 para la expresión constitutiva en B. subtilis. Se introdujo un fragmento de 87 pb que contiene la secuencia líder que codifica el péptido señal del gen sacB de B.
subtilis detrás del promotor P43. Diferentes sitios de restricción BglI actúan como sitios de inserción para que se expresen genes heterólogos.
La expresión de tripsina humana I se confirmó por medición de la actividad proteolítica en sobrenadante de células que contiene el vector con el gen en comparación con un control negativo. Se seleccionó un péptido que incluía un sitio de escisión de arginina como un sustrato. El péptido se biotiniló en el extremo N-terminal y se marcó con un fluoróforo en el extremo C-terminal. Después de incubación del péptido con sobrenadante de cultivo se añadió estreptavidina. El péptido no escindido se asocia con estreptavidina y conduce a un alto valor de lectura mientras que la escisión da como resultado bajos valores de lectura. La Figura 11 muestra el ciclo temporal de una digestión proteolítica de células B. subtilis que contiene el vector con el gen de tripsina I en comparación con células de B. subtilis que contiene el vector sin el gen de tripsina I (control negativo). Como confirmación adicional de la expresión de la proteasa, se analizaron los sobrenadantes de células que contenían el vector con el gen y células de control por electroforesis en gel de poliacrilamida y posterior transferencia de Western usando un anticuerpo específico para la proteasa diana. El procedimiento se realizó de acuerdo con procedimientos convencionales (Sambrook, J.F; Fritsch, E.F.; Maniatis,T.; Cold Spring Harbor Laboratory Press, Segunda edición, 1989, Nueva York). La Figura 8 confirma la expresión de la proteína solamente en las células que albergan el vector con el gen para tripsina.
Ejemplo III: Proporcionar una proteína de armazón
En este ejemplo, la tripsina humana I se usó como la proteína de armazón. El gen se usó en su forma natural o, como alternativa, se modificó para dar como resultado una proteína de armazón con actividad catalítica aumentada
o características mejoradas adicionales.
La modificación se realizó por modificación aleatoria del gen, seguido de expresión de la enzima y posterior selección con respecto a actividad aumentada. En primer lugar, el gen se amplificó por PCR en condiciones propensas a errores, esencialmente como se describe en Cadwell, R.C y Joyce, G.F. (PCR Methods Appl. 2 (1992) 28-33). Se realizó PCR propensa errores usando 30 pmol de cada cebador, 20 nmol de dGTP y dATP, 100 nmol de dCTP y dTTP, 20 fmol de molde y 5 U de ADN polimerasa Taq en Tris HCl 10 mM pH 7,6, KCl 50 mM, MgCl2 7 mM, MnCl2 0,5 mM, gelatina 0,01 % durante 20 ciclos de 1 min a 94 ºC, 1 min a 65 ºC y 1 min a 72 ºC. La biblioteca de ADN resultante se purificó usando el Kit de Purificación de PCR Qiaquick siguiendo las instrucciones de los proveedores. El producto de PCR se digirió con la enzima de restricción BglI y se purificó. A continuación, el producto de PCR se ligó en el vector lanzadera E. coli - B. subtilis descrito anteriormente que se digirió con BgII y se desfosforiló. Los productos de ligación se transformaron en E. coli, se amplificaron en LB y los plásmidos se purificaron usando el Kit de Purificación de plásmidos Qiagen siguiendo las instrucciones de los proveedores. Los plásmidos resultantes se transformaron en células B. subtilis.
Como alternativa, o además de la mutagénesis aleatoria, las variantes del gen se recombinaron estadísticamente en posiciones homólogas mediante el uso de reacción en cadena de recombinación, esencialmente como se describe en el documento WO 0134935. Los productos de PCR de los genes que codifican las variantes de proteasa se purificaron usando el Kit de Purificación de PCR QIAquick siguiendo las instrucciones de los proveedores, se comprobaron con respecto a tamaño correcto mediante electroforesis en gel de agarosa y se mezclaron entre sí en cantidades equimolares. Se calentaron 80 μg de esta mezcla de PCR en TrisHCl 150 mM, pH 7,6, MgCl2 6,6 mM durante 5 min a 94 ºC y se enfrió posteriormente hasta 37 °C a 0,05 ºC/s para rehibridar las cadenas y producir de este modo heterodúplex de una manera estocástica. Después se añadieron 2,5 U de Exonucleasa III por μg de ADN y se incubó durante 20, 40 o 60 min a 37 ºC para digerir diferentes longitudes de ambos extremos 3’ de los heterodúplex. Los productos de PCR parcialmente digeridos se recargaron con 0,6 U de Pfu polimerasa por μg de ADN incubando durante 15 minutos a 72 ºC en dNTP 0,17 mM y tampón de Pfu polimerasa de acuerdo con las instrucciones de los proveedores. Después de realizar un ciclo de PCR sencillo, el ADN resultante se purificó usando el Kit de Purificación de PCR QIAquick siguiendo las instrucciones de los proveedores, se digirió con BgII y se ligó en el vector linealizado. Los productos de ligación se transformaron en E. coli, se amplificaron en LB que contenía ampicilina como marcador y los plásmidos se purificaron usando el Kit de Purificación de Plásmidos Qiagen siguiendo las instrucciones de los proveedores. Los plásmidos resultantes se transformaron en células de B. subtilis.
Ejemplo IV: Inserción de SDR en el armazón proteico de tripsina humana I y generación de una enzima proteolítica obtenida por ingeniería genética con especificidad para un sustrato peptídico que tiene la secuencia KKWLGRVPGGPV
Para crear sitios de inserción para SDR en tripsina humana I se introdujeron dos pares de sitios de restricción diferentes en el gen en sitios que se identificaron como sitios de SDR potenciales (véase Ejemplo I anterior) sin cambiar la secuencia de aminoácidos. La inserción de los sitios de restricción se realizó por PCR de extensión de solapamiento. Se usaron los cebadores restr1 y restr2 para la introducción de los sitios de restricción SacII y BamHI, se usaron restr3 y restr4 para la introducción de los sitios de restricción Kpnl y Nhel. Las secuencias de los cebadores fueron las siguientes:
Sitio de unión para restr1 y restr2 y la secuencia de aminoácidos correspondiente (SEC ID Nº: 54):
5’-GGTGGTATCAGCAGGCCACTGCTACAAGTCCCCGCATCCAGGT-3’
V V S A GH C Y K S R I Q
Cebador directo restr1 (SEC ID Nº: 56): 5’-GGTGGTATCCGCGGGCCACTGCTACAAGTCCCGGATCCAGGT-3’ Cebador inverso restr2 (SEC ID Nº: 57): 5’-ACCTGGATCCGGGACTTGTAGCAGTGGCCCGCGGATACCACC-3’ Sitio de unión para restr3 y restr4 y la secuencia de aminoácidos correspondiente (SEC ID Nº: 58): 5’-CCACTGGCACGAAGTGCCTCATCTCTGGCTGGGGCAACACTGCGAGCTCT-3’
T G T K C L I S GW G N T A S S Cebador directo restr3 (SEC ID Nº: 60): 5’-CCACTGGCACGAAGTGCCTCATCTCTGGCTGGGGCAACACTGCGAGCTCT-3’ Cebador inverso restr4 (SEC ID Nº: 61): 5’-AGAGCTAGCAGTGTTGCCCCAGCCAGAGATGAGGCACTTGGTACCAGTGG-3’
En una primera PCR de extensión de solapamiento, se introdujeron los sitios SacII/BamHI permitiendo insertar SDR1 y en una segunda PCR de extensión de solapamiento los sitios KpnI/NheI permitiendo la inserción de SDR2. El producto de la PCR de extensión de solapamiento se amplificó usando los cebadores pUC directo y pUC inverso. Las secuencias de pUC directo y pUC inverso son las siguientes:
pUC directo (SEC ID Nº: 62): 5’-GGGGTACCCCACCACCATGAATCCACTCCT-3’ pUC inverso (SEC ID Nº: 63): 5’-CGGGATCCGGTATAGAGACTGAAGAGATAC-3’ Los sitios de restricción generados de este modo se usaron posteriormente para insertar oligonucleótidos definidos o aleatorios en los sitios de inserción SDR1 SDR2 por procedimientos de restricción y ligación convencionales. Normalmente, se hibridaron dos oligonucleótidos 5’-fosforilados sintéticos complementarios y se ligaron en un vector que portaba el gen de tripsina humana I modificado que se escindió con las enzimas de restricción respectivas. Se insertaron oligonucleótidos que codificaban SDR1 mediante los sitios SacII/BamHI mientras que se insertaron oligonucleótidos que codificaban SDR2 mediante los sitios Kpnl/NheI. Para cada inserción se usó un par de oligonucleótidos de acuerdo con las secuencias generales siguientes (indicando [P] fosforilación 5’, indicando N y X
cualquier resto nucleotídico o aminoacídico, respectivamente): oligox-SDR1f (SEC ID Nº: 64): 5’-[P]-GGGCCACTGCTACNNNNNNNNNNNNNNNNNNAAGTCCCG-3’ oligox-SDR1r (SEC ID Nº: 66):
3’-CGCCCGGTGACGATGNNNNNNNNNNNNNNNNNNTTCAGGGCCTAG-[P]-5’ G H C Y X X X X X X K S
oligox-SDR2f (SED ID Nº: 67): 5’-[P]-CAAGTGCCTCATCTCTGGCTGGGGCAACNNNNNNNNNNNNNNNACTG-3’ oligox-SDR2r (SEC ID Nº: 69)-.
3’-CATGGTTCACGGAGTAGAGACCGACCCCGTTGNNNNNNNNNNNNNNNTGACGATC-[P]-5’ K C L I S G W G N X X X X X T
Como alternativa al procedimiento anterior, se usó un procedimiento basado en PCR para la integración de secuencias aleatorias en los sitios de inserción de SDR1 y SDR2 en la tripsina humana modificada 1. Para cada SDR, se usó un cebador en el que la región SDR se ha seleccionado de forma completamente aleatoria. Las secuencias de los cebadores fueron las siguientes (N = A/C/G/T, B = C/G/T, V = A/C/G):
Cebador SDR1-mutnnb-directo (SEC ID Nº: 70):
5’-TGGTATCCGCGGGCCACTGCTACNNBNNBNNBNNBNNBNNBAAGTCCCGGATCCAGGTG-3’
Cebador SDR2-mutnnb-inverso (SEC ID Nº: 71):
5’-GGCGCCAGAGCTAGCAGTVNNVNNVNNVNNVNNGTTGCCCCAGCCAGAGATG-3’
El codón NNB o VNN en la hebra inversa, permite que se realicen los 20 aminoácidos pero reduce la probabilidad de codificar un codón de parada de 0,047 a 0,021.
Como una alternativa adicional, después de la identificación de SDR que conducen a especificidad aumentada, estas SDR se usaron como moldes para selección aleatoria adicional. De este modo, se insertaron secuencias peptídicas aleatorias que se seleccionaron de forma parcialmente aleatoria en cada posición y parcialmente idénticas en cada posición a la secuencia original.
Como ejemplo, se insertaron secuencias peptídicas aleatorias que tenían en aproximadamente en uno de cada tres casos el resto aminoacídico del molde y en aproximadamente dos de cada tres casos cualquier otro resto aminoacídico en cada posición en los dos sitios de inserción de SDR de la tripsina humana modificada humana I. Para este fin, se usaron cebadores que contenían en cada posición de nucleótido de la SDR aproximadamente el 70 % de las bases del molde y el 30 % de una mezcla de las tres otras bases.
Con cada par de cebadores se realizó una PCR en condiciones convencionales usando el gen de tripsina humana I como molde. El ADN restante se purificó usando el Kit de Purificación de PCR QIAquick siguiendo las instrucciones de los proveedores y se digirió con SacII y Nhel. Después de la digestión el ADN se purificó y se ligó en el vector digerido con SacII y Nhel y desfosforilado. Los productos de ligación se transformaron en E. coli, se amplificaron en LB que contenía el marcador respectivo y los plásmidos se purificaron usando el Kit de Purificación de Plásmidos Qiagen siguiendo las instrucciones de los proveedores. Los plásmidos resultantes se transformaron en células de B. subtilis. Estas células se separaron después a células sencillas, se dejaron crecer a clones y después de la expresión del gen de proteasa se cribaron con respecto a actividad proteolítica.
Se emplearon los siguientes sustratos para cribado con respecto a actividad proteolítica (SEC ID Nº: 76 y 77):
Sustrato A
L L W L G R V V G G P V
Sustrato B
K K W L G R V V G G P V
Se cribaron variantes de proteasa en el sustrato B a complejidades de 106 variantes por espectroscopia de fluorescencia confocal. El sustrato fue un péptido biotinilado en el extremo N-terminal y marcado con fluorescencia en el extremo C-terminal. Después de la incubación del péptido con sobrenadante de células que expresaban diferentes variantes de la proteasa, se añadió estreptavidina y las muestras se analizaron mediante fluorimetría confocal. La concentración baja del péptido (20 nM) conduce a escisión preferente por proteasas con un alto valor de kcat/KM, es decir proteasas con alta especificidad para la secuencia diana.
Se evaluaron adicionalmente variantes seleccionadas en el procedimiento de cribado con respecto a su especificidad para el sustrato B y el sustrato cercanamente relacionado A midiendo los ciclos temporales de la digestión proteolítica y determinando las constantes de velocidad que son proporcionales a los valores de kcat/KM. claramente, en comparación con la tripsina humana que se usó como proteína de armazón, la actividad específica de las variantes 1 y 2 está desplazada (SEC ID Nº: 2 y 3, respectivamente) hacia el sustrato B. La variante 3 (SEC ID Nº: 4), por otro lado, actúa como un control negativo con actividades similares a las de tripsina humana 1. La secuenciación de los genes de las tres variantes reveló las siguientes secuencias de aminoácidos en las SDR.
Tabla 2: Secuencias de las dos SDR en tres variantes diferentes seleccionadas para hidrólisis específica de sustrato B (SEC ID Nº: 78-82).
SDR1
SDR2
Tripsina
- - - - - - - - - - -
Variante 1
D A V G R D T I T N S
Variante 2
N G R D L E V R G T W
Variante 3
G F V M F N R S P L T
En un experimento adicional se cribó un grupo de variantes que contenían diferentes números de SDR por gen con respecto a especificidad aumentada usando una mezcla del sustrato definido y peptona como un sustrato competidor. Se han analizado adicionalmente las variantes que contienen una o dos SDR por gen. Como una medida de la especificidad la actividad en el ensayo de escisión de péptidos se comparó con y sin la presencia del sustrato competidor. La concentración del sustrato competidor fue de 10 mg/ml. En estas condiciones, las proteasas no específicas muestran, en comparación con proteasas específicas, una reducción más fuerte de la actividad con
concentraciones de competidor crecientes (intervalo entre 0 y 100 mg/ml). La relación de actividad proteolítica con y sin sustrato es una medida cuantitativa de la especificidad de la proteasas. La Figura 9 muestra las actividades relativas con o sin sustrato competidor. La tripsina humana 1 que se usó como la proteína de armazón y dos variantes, una que contenía solamente SDR2 y una que contenía ambas SDR, se compararon. La especificidad de la variante con ambas SDR es mayor en un factor de 2,5 que la de la variante con SDR2 solamente, lo que confirma que existe una relación directa entre el número de SDR y la especificidad cuantitativa de enzimas proteolíticas de enzimas proteolíticas obtenidas por ingeniería genética resultantes.
Ejemplo V: Generación de una enzima proteolítica obtenida por ingeniería genética que inactiva específicamente TNF-alfa humano
La tripsina humana alfa I o un derivado que comprende una o más de las siguientes sustituciones de aminoácidos E56G; R78W; Y131F; A146T; C183R se usó como armazón proteico para la generación de una enzima proteolítica obtenida por ingeniería genética con alta especificidad para TNF-alfa humano. La identificación de sitios SDR en tripsina humana I o derivados de la misma se realizó como se ha descrito anteriormente. Se seleccionaron dos sitios de inserción dentro del armazón para SDR. Las variantes de proteasa que contenían dos insertos con diferentes secuencias y también la tripsina humana I en sí misma sin insertos se expresaron en células de Bacillus Subtilis. Las células con proteasa variante se separaron en clones celulares sencillos y las variantes que expresaban proteasa se cribaron con respecto a actividad proteolítica en péptidos con la secuencia diana deseada de TNF-alfa. La actividad de las variantes de proteasa se determinó como la velocidad de escisión de un péptido con la secuencia diana deseada de TNF-alfa en ausencia y presencia de sustrato competidor. La especificidad se expresa como la relación de velocidades de escisión en presencia o ausencia de competidor (Figura 14).
Tabla 3: Especificidad relativa de variantes de enzimas proteolíticas obtenidas por ingeniería genética con diferentes secuencias SDR en ausencia y presencia de sustrato competidor (SEC ID Nº: 84-95)
K con comp./k sin comp.
Secuencia de SDR1 Secuencia de SDR2
Armazón (sin SDR)
0,092 --- ---
variante a
0,130 RPWDPS VHPTS
variante b
0,187 GFVMFN RSPLT
variante c
0,235 EIANRE RGART
variante d
0,310 KAVVGT RTPIS
variante e
0,374 VNIMAA TTARK
variante f
0,487 AAFNGD RKDFW
El efecto antagonista de tres variantes de proteasa en TNF-alfa humano se muestra en la Figura 15. Mediante el uso de las variantes, la inducción de la apoptosis se elimina casi completamente lo que indica la eficacia antiinflamatoria de las proteasas para iniciar rotura de TNF-alfa. Se ha incubado TNF-alfa con un sobrenadante concentrado de cultivos que expresan las variantes i a iii durante 2 horas. El TNF-alfa resultante se ha incubado con células no modificadas durante 4 horas. El efecto de la actividad de TNF-alfa restante se determinó como el alcance de la inducción de apoptosis por detección de caspasa-3 activada como marcador de células apoptóticas. Para los controles no se añade proteasa con el TNF-alfa humano (células muertas) o se usó tampón en lugar de TNF-alfa humano (células vivas), respectivamente. Se muestra un experimento análogo en la Figura 16 que usa variante purificada xiii. Se incubó TNF-alfa con diferentes concentraciones de la variante de proteasa purificada.
Para demostrar la especificidad de las variantes de proteasa, se han incubado proteínas de suero sanguíneo humano o TNF-alfa humano purificado con tripsina humana I o las variantes de enzima proteolítica obtenida por ingeniería genética, respectivamente. Aquí, la variante x corresponde a SEC ID Nº: 75 que comprende las mismas SDR que la variante f, es decir las SDR de acuerdo con SEC ID Nº: 89 (SDR1) y 95 (SDR2). Las variantes xi y xii corresponden a derivados de las mismas que comprenden las mismas secuencias de SDR. Se determinó la proteína intacta restante en función del tiempo. Aunque las variantes así como tripsina humana I digieren TNF-alfa humano, solamente la tripsina muestra actividad en proteína del suero (Figura 17 a y b). Esto demuestra la alta especificidad de TNF-alfa de las enzimas proteolíticas e indica su seguridad y en consecuencia sus bajos efectos secundarios para uso terapéutico.
Ejemplo VI: Generación de una enzima proteolítica obtenida por ingeniería genética que hidroliza específicamente VEGF humano
Se usó tripsina humana I como armazón proteico para la generación de una enzima proteolítica obtenida por ingeniería genética con alta especificidad para VEGF humano. La identificación de los sitios SDR en tripsina humana
I se realizó como se ha descrito anteriormente. Se seleccionaron dos sitios de inserción dentro del armazón para las SDR. Las variantes de proteasa que contienen dos insertos con diferentes secuencias se expresaron en células Bacillus subtilis. Las células de proteasa variante se separaron en clones celulares sencillos y las variantes que expresaban proteasa se cribaron como se ha descrito anteriormente. La actividad de las variantes de proteasa se
5 determinó como la velocidad de escisión de VEGF. Se incubaron 4 μg de VEGF165 humano recombinante con 0,18 μg de proteasa purificada en PBS / pH 7,4 a temperatura ambiente. Se tomaron alícuotas en los puntos temporales indicados y se analizaron en un gel de poliacrilamida. La extensión de la escisión se cuantificó por análisis densitométrico de las bandas. La actividad se representa frente al tiempo de incubación en la Figura 18. La escisión específica se controló mediante análisis en gel de poliacrilamida de SDS adicionales.
10 LISTADO DE SECUENCIAS
<110> DIREVO Biotech AG
<120> NUEVAS ENTIDADES BIOLÓGICAS Y USO DE LAS MISMAS 15
<130> 041480wo JH/cw
<160> 96
20 <170> PatentIn versión 3.1
<210> 1
<211> 224
<212> PRT 25 <213> Homo sapiens
<400> 1
<210> 2
<211> 235
<212> PRT 5 <213> secuencia artificial
<220>
<223> variante 1 de tripsina
<400> 2 10
<210> 3
<211> 235 5 <212> PRT
<213> secuencia artificial
<220>
<223> variante 2 de tripsina 10 <400> 3
<210> 4
<211> 235 5 <212> PRT
<213> secuencia artificial
<220>
<223> variante 3 de tripsina
10 <400> 4
<210> 5
<211> 259
<212> PRT
<213> Homo sapiens
<400> 5
<210> 6
<211> 235
<212> PRT
<213> Homo sapiens
<400> 6
<210> 7
<211> 275
<212> PRT
<213> Bacillus subtilis
<400> 7
<210> 8
<211> 320
<212> PRT
<213> Murinae gen. sp.
<400> 8
<210> 9
<211> 330
<212> PRT
<213> Homo sapiens
<400> 9
<210> 10
<211> 297
<212> PRT
<213> Homo sapiens
<400> 10
<210> 11
<211> 328
<212> PRT
<213> Homo sapiens
<400> 11
<210> 12
<211> 358
<212> PRT
<213> Homo sapiens
<400> 12
<210> 13
<211> 351
<212> PRT
<213> Homo sapiens
<400> 13
<210> 14
<211> 305
<212> PRT
<213> Homo sapiens
<400> 14
<210> 15
<211> 262
<212> PRT
<213> Streptomyces sp. K15
<400> 15
<210> 16
<211> 256
<212> PRT
<213> Citomegalovirus humano
<400> 16
<210> 17
<211> 248
<212> PRT
<213> Escherichia coli
<400> 17
<210> 18
<211> 317
<212> PRT
<213> Serratia marcescens
<400> 18
<210> 19
<211> 229
<212> PRT
<213> Escherichia coli
<400> 19
<210> 20
<211> 99
<212> PRT
<213> virus de la inmunodeficiencia humana
<400> 20
<210> 21
<211> 297
<212> PRT 15 <213> Escherichia coli
<400> 21
<210> 22
<211> 212
<212> PRT
<213> Carica papaya
<400> 22
<210> 23
<211> 699
<212> PRT
<213> Homo sapiens
<400> 23
<210> 24
<211> 221
<212> PRT
<213> Virus del grabado de tabaco
<400> 24
<210> 25
<211> 371
<212> PRT
<213> Streptococcus pyogenes 10
<400> 25
<210> 26
<211> 353
<212> PRT
<213> Homo sapiens
<400> 26
<210> 27
<211> 174
<212> PRT
<213> Staphylococcus aureus
<400> 27
<210> 28
<211> 221
<212> PRT
<213> Saccharomyces cerevisiae
<400> 28
<210> 29
<211> 166
<212> PRT 15 <213> Pyrococcus horikoshii
<400> 29
5 <210> 30
<211> 316
<212> PRT
<213> Bacillus thermoproteolyticus
10 <400> 30
<210> 31
<211> 169
<212> PRT
<213> Homo sapiens
<400> 31
<210> 32
<211> 496
<212> PRT
<213> Homo sapiens
<400> 32
<210> 33
<211> 370
<212> PRT
<213> Trichoderma reesei
<400> 33
<210> 34
<211> 223
<212> PRT
<213> Aspergillus niger
<400> 34
<210> 35
<211> 184
<212> PRT
<213> Aspergillus niger
<400> 35
<210> 36
<211> 313
<212> PRT
<213> Streptomyces lividans
<400> 36
<210> 37
<211> 362
<212> PRT
<213> Aspergillus niger
<400> 37
<210> 38
<211> 383
<212> PRT
<213> Pseudomonas cellulosa
<400> 38
<210> 39
<211> 419
<212> PRT
<213> Bacillus circulans
<400> 39
<210> 40
<211> 317
<212> PRT
<213> Candida antarctica
<400> 40
<210> 41
<211>
434 5 <212> PRT
<213> secuencia artificial
<220>
<223> quimera de cobaya y homo sapiens (humano = aprox. últimos 30 aminoácidos)
<210> 42
<211> 471
<212> PRT
<213> Escherichia coli
<400> 42
<210> 43
<211> 260
<212> PRT
<213> Bovino
<400> 43
<210> 44
<211> 686
<212> PRT
<213> Bacillus circulans
<400> 44
<210> 45
<211> 404
<212> PRT
<213> Amycolatopsis orientalis
<400> 45
<210> 46
<211> 292
<212> PRT
<213> Pseudomonas sp.
<400> 46
<210> 47
<211> 311
<212> PRT
<213> Acitenobacter sp.
<400> 47
<210> 48
<211> 414
<212> PRT
<213> Pseudomonas putida
<400> 48
<210> 49
<211> 374
<212> PRT
<213> Equus caballus
<400> 49
<210> 50
<211> 297
<212> PRT
<213> Escherichia coli
<400> 50
<210> 51
<211> 268
<212> PRT
<213> Salmonella typhimurium
<400> 51
<210> 52
<211> 393
<212> PRT
<213> Actinoplanes missouriensis
<400> 52
<210> 53
<211> 348
<212> PRT
<213> Bacteriófago T7
<400> 53
<210> 54
<211>
42 5 <212> ADN
10 <400> 41
<213> secuencia artificial
<220>
<223> sitio de unión para restr1 y restr2
<220>
<221> CDS
<222> (2)..(40)
<223>
<400> 54 15
<210> 55
<211> 13
<212> PRT
<213> secuencia artificial
<220>
<223> sitio de unión para restr1 y restr2
25 <400> 55
<210> 56
<211> 42
<212> ADN
<213> secuencia artificial
<220>
<223> cebador directo restr1
<400> 56
<210> 57
<211> 42
<212> ADN
<213> secuencia artificial
<220>
45 <223> cebador inverso restr2
<400> 57
<210> 58
<211> 50
<212> ADN
<213> secuencia artificial
<220> 5 <223> sitio de unión para restr3 y restr4
<220>
<221> CDS
<222> (3)..(50)
<223> 10
<400> 58
15 <210> 59
<211> 16
<212> PRT
<213> secuencia artificial
<220> 20 <223> sitio de unión para restr3 y restr4
<400> 59
25 <210> 60
<211> 50
<212> ADN
<213> secuencia artificial
<220> 30 <223> cebador directo restr3
<400> 60
35 <210> 61
<211> 50
<212> ADN
<213> secuencia artificial
<220> 40 <223> cebador inverso restr4
<400> 61
45 <210> 62
<211> 30
<212> ADN
<213> secuencia artificial
<220> 50 <223> cebador puc-directo
<400> 62
<210> 63
<211> 30
<212> ADN
<213> secuencia artificial
<220>
<223> cebador puc-inverso
<210> 64
<211> 39
<212> ADN
<213> secuencia artificial
<220>
<223> oligox-SDR1f
<220>
<221> misc_feature
<222> (14)..(31)
<223> cualquier nucleótido
<220>
<221> misc_feature
<222> (14)..(31)
<223> cualquier resto nucleotídico o aminoacídico
<220>
<221> CDS
<222> (2)..(37)
<223>
<400> 64
<210> 65
<211> 12
<212> PRT
<213> secuencia artificial
<220>
<221> misc_feature
<222> (5)..(5)
<223> El &quot;Xaa&quot; en la localización 5 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (6)..(6)
<223> T El &quot;Xaa&quot; en la localización 6 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (7)..(7)
<223> El &quot;Xaa&quot; en la localización 7 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (8)..(8)
<223> El &quot;Xaa&quot; en la localización 8 represemta Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220> <221> misc_feature
<222> (9)..(9)
<223> El &quot;Xaa&quot; en la localización 96 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (10)..(10)
<223> El &quot;Xaa&quot; en la localización 10 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<223> oligox-SDR1f
<220>
<221> misc_feature
<222> (14) .. (14)
<223> cualquier nucleótido
<220>
<221> misc_feature
<222> (14)..(31)
<223> cualquier resto nucleotídico o aminoacídico
<400> 65
<210> 66
<211> 45
<212> ADN
<213> secuencia artificial
<220>
<223> oligox-SDR1r
<220>
<221> misc_feature
<222> (16)..(33)
<223> cualquier aminoácido
<400> 66
<210> 67
<211> 47
<212> ADN
<213> secuencia artificial
<220>
<223> oligox-SDR2f
<220>
<221> CDS
<222> (2)..(96)
<223>
<220>
<221> misc_feature
<222> (29)..(43)
<223> cualquier resto nucleotídico o aminoacídico
<400> 67 <210> 68
<211> 15
<212> PRT
<213> secuencia artificial
<220>
<221> misc_feature
<222> (10)..(10)
<223> El &quot;Xaa&quot; en la localización 10 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (11)..(11)
<223> El &quot;Xaa&quot; en la localización 11 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (12)..(12)
<223> El &quot;Xaa&quot; en la localización 12 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (13)..(13)
<223> El &quot;Xaa&quot; en la localización 13 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<221> misc_feature
<222> (14)..(14)
<223> El &quot;Xaa&quot; en la localización 14 representa Lys, Asn, Arg, Ser, Thr, Ile, Met, Glu, Asp, Gly, Ala, Val, Gln, His, Pro, Leu, un codón de terminación, Tyr, Trp, Cys, o Phe.
<220>
<223> oligox-SDR2f
<220>
<221> misc_feature
<222> (29)..(43)
<223> cualquier resto nucleotídico o aminoacídico
<400> 68
<210> 69
<211> 55
<212> ADN
<213> secuencia artificial
<220>
<223> oligox-SDR2r
<220>
<221> misc_feature
<222> (33)..(47)
<223> cualquier base
<220>
<221> misc_feature
<222> (33)..(47) <223>cualquier nucleótido
<400> 69
<210> 70
<211> 59
<212> ADN
<213> secuencia artificial
<220>
<223> cebador SDR1-mutnnb-directo
<220>
<221> misc_feature
<222> (24)..(40)
<223> N=A, C, G, T; B=C, G, T; V=A, C, G
<400> 70
<210> 71
<211> 52
<212> ADN
<213> secuencia artificial
<220>
<223> cebador SDR2-mutnnb-inverso
<220>
<221> misc_feature
<222> (20)..(33)
<223> N=A, C, G, T; B=C, G, T; V=A, C, G
<400> 71
<210> 72
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante g SDR1
<400> 72
<210> 73
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante g SDR2
<400> 73
<210> 74
<211> 234
<212> PRT
<213> secuencia artificial
<220>
<223> secuencia artificial
<400> 74
<210> 75
<211> 234 10 <212> PRT
<213> secuencia artificial
<220>
<223> secuencia artificial 15
<400>
75
<400>
75
5
<210> 76
<211> 12
<212> PRT
<213> secuencia artificial
10
<220>
<223> sustrato A
<400> 76
15
<210> 77
<211> 12
<212> PRT
<213> secuencia artificial
<220>
<223> sustrato B
<400> 77
<210> 78
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante 1 SDR1
<400> 78
<210> 79
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante 2 SDR1
<400> 79
<210> 80
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante 3 SDR1
<400> 80
<210> 81
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante 1 SDR2
<400> 81 <210> 82
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante 2 SDR2
<400> 82
<210> 83
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante 3 SDR2
<400> 83
<210> 84
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante a SDR1
<400> 84
<210> 85
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante b SDR1
<400> 85
<210> 86
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante c SDR1
<400> 86
<210> 87
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante d SDR1
<400> 87
<210> 88 15 <211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante e SDR1
<400> 88
25 <210> 89
<211> 6
<212> PRT
<213> secuencia artificial
<220>
<223> variante f SDR1
<400> 89
<210> 90
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante a SDR2
<400> 90
<210> 91
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante b SDR2
<400> 91
<210> 92
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante c SDR2
<400> 92
<210> 93
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante d SDR2
<400> 93
<210> 94
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante e SDR2
<400> 94
<210> 95
<211> 5
<212> PRT
<213> secuencia artificial
<220>
<223> variante f SDR2
<400> 95
<210> 96
<211> 157
<212> PRT
<213> Homo sapiens
<400> 96

Claims (3)

  1. REIVINDICACIONES
    1. Un procedimiento para generar una enzima proteolítica que tenga especificidad definida no conferida por el armazón proteico para al menos un sustrato diana que comprende al menos las siguientes etapas:
    (a)
    proporcionar un armazón proteico que tenga al menos 70 % de homología con tripsina humana I que tenga la secuencia de aminoácidos mostrada en SEC ID Nº: 1, que catalice al menos una reacción química en al menos un sustrato,
    (b)
    generar una biblioteca de enzimas proteolíticas o enzimas proteolíticas aisladas combinando un polinucleótido que codifica el armazón proteico de la etapa (a) mediante inserción o sustitución con 1 a 11 regiones determinantes de especificidad (SDR), en la que las SDR son secuencias oligonucleotídicas sintéticas completa o parcialmente aleatorias que codifican secuencias peptídicas con una longitud de menos de 50 restos aminoacídicos en una o más posiciones del grupo de posiciones dentro del polinucleótido que codifica el armazón proteico que corresponde estructuralmente o por homología de secuencia de aminoácidos a las regiones 18-25, 38-48, 54-63, 73-86, 122-130, 148-156, 165-171 y 194-204 en tripsina humana I que tiene la secuencia de aminoácidos mostrada en SEC ID Nº: 1, expresar dichas enzimas y
    (c)
    seleccionar de la biblioteca de enzimas proteolíticas generada en la etapa (b) una o más enzimas que tengan especificidades definidas no conferidas por el armazón proteico proporcionado en la etapa (a) para al menos un sustrato diana.
  2. 2. El procedimiento de acuerdo con la reivindicación 1, en el que las secuencias peptídicas insertadas o sustituidas en la etapa (b) son completa o parcialmente aleatorias y/o tienen una variación de longitud; y/o en el que la selección en la etapa (c) se consigue cribando con respecto a la actividad enzimática y/o la afinidad enzimática
    (i)
    en concentraciones de sustrato diana bajas,
    (ii)
    usando el sustrato diana y al menos un sustrato más para comparación,
    (iii) añadiendo en exceso otros sustratos distintos del sustrato diana, usando este modo los sustratos diana añadidos como competidores,
    (iv)
    añadiendo inhibidores de enzima,
    (v)
    seleccionando enzimas que se unen preferentemente al sustrato diana y seleccionado de este subgrupo las enzimas que convierten el sustrato o
    (vi)
    cualquier combinación de las mismas.
  3. 3. El procedimiento de acuerdo con la reivindicación 1, que comprende al menos las siguientes etapas:
    (a)
    proporcionar un primer fragmento de armazón proteico,
    (b)
    conectar dicho fragmento de armazón proteico mediante un engarce peptídico con una primera región determinante de especificidad, y opcionalmente
    (c)
    conectar el producto de la etapa (b) mediante un engarce peptídico con un péptido de región determinante de especificidad adicional o con un fragmento de armazón proteico adicional, y opcionalmente
    (d)
    repetir la etapa (c) durante tantos ciclos como sea necesario para generar una enzima suficientemente específica y
    (e)
    seleccionar de la población generada en las etapas (a) - (d) una o más enzimas que tengan las especificidades deseadas para el uno o más sustratos que no se confieren por el fragmento de armazón proteico proporcionado de la etapa (a).
ES04741841T 2003-06-18 2004-06-18 Nuevas entidades biológicas y el uso de las mismas. Expired - Lifetime ES2373658T3 (es)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP03013819 2003-06-18
EP03013819 2003-06-18
EP03025851 2003-11-10
EP03025851 2003-11-10
EP03025871 2003-11-11
EP03025871.9A EP1531179A1 (en) 2003-11-11 New biological entities and the use thereof
PCT/EP2004/051172 WO2004113521A1 (en) 2003-06-18 2004-06-18 New biological entities and the use thereof

Publications (1)

Publication Number Publication Date
ES2373658T3 true ES2373658T3 (es) 2012-02-07

Family

ID=33544908

Family Applications (1)

Application Number Title Priority Date Filing Date
ES04741841T Expired - Lifetime ES2373658T3 (es) 2003-06-18 2004-06-18 Nuevas entidades biológicas y el uso de las mismas.

Country Status (9)

Country Link
US (3) US7335504B2 (es)
EP (1) EP1633865B1 (es)
JP (1) JP2006527590A (es)
AT (1) ATE526399T1 (es)
AU (1) AU2004249903B2 (es)
CA (1) CA2529659A1 (es)
ES (1) ES2373658T3 (es)
IL (1) IL172506A0 (es)
WO (1) WO2004113521A1 (es)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7939304B2 (en) 2002-10-02 2011-05-10 Catalyst Biosciences, Inc. Mutant MT-SP1 proteases with altered substrate specificity or activity
KR101132555B1 (ko) * 2002-10-02 2012-04-02 리전츠 오브 더 유니버시티 오브 캘리포니아 변경된 특이성을 갖는 프로테아제의 제조 및 선별 방법
US20060024289A1 (en) * 2002-10-02 2006-02-02 Ruggles Sandra W Cleavage of VEGF and VEGF receptor by wild-type and mutant proteases
EP2308967B1 (en) 2004-04-12 2017-08-23 Catalyst Biosciences, Inc. Mutant mt-sp1 polypeptides
EP1827486A2 (en) * 2004-12-22 2007-09-05 Direvo Biotech AG Targeted use of engineered enzymes
EP1726643A1 (en) 2005-05-27 2006-11-29 Direvo Biotech AG Method for the provision, identification and selection of proteases with altered sensitivity to activity-modulating substances
NZ595193A (en) 2005-10-21 2013-09-27 Catalyst Biosciences Inc Modified Proteases That Inhibit Complement Activation
JPWO2007069604A1 (ja) * 2005-12-14 2009-05-21 国立大学法人 北海道大学 修飾蛋白質の製造方法
EP1847600A1 (en) * 2006-04-18 2007-10-24 Direvo Biotech AG Specific protease for inactivation of human tumour necrosis factor-alpha
WO2007118889A1 (en) * 2006-04-18 2007-10-25 Direvo Biotech Ag Specific protease for inactivation of human tumour necrosis factor-alpha
KR20150033726A (ko) 2006-07-05 2015-04-01 카탈리스트 바이오사이언시즈, 인코포레이티드 프로테아제 스크리닝 방법 및 이에 의해 확인된 프로테아제
US8030447B2 (en) * 2006-09-20 2011-10-04 The Board Of Regents Of The University Of Texas System Substrate peptide sequences for plague plasminogen activator and uses thereof
KR20100075993A (ko) * 2007-11-01 2010-07-05 다니스코 유에스 인크. 써몰리신 및 이의 변이체의 생성, 및 액체 세제에서의 용도
TWI465247B (zh) 2008-04-11 2014-12-21 Catalyst Biosciences Inc 經修飾的因子vii多肽和其用途
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
JP2011097898A (ja) * 2009-11-09 2011-05-19 Sagami Chemical Research Institute 組換えFc受容体およびそれの製造方法
EP2680875B1 (en) 2011-03-02 2019-10-23 Novo Nordisk Health Care AG Coagulation factor-targeting to tlt-1 on activated platelets
US8759044B2 (en) 2011-03-23 2014-06-24 Butamax Advanced Biofuels Llc In situ expression of lipase for enzymatic production of alcohol esters during fermentation
US8765425B2 (en) 2011-03-23 2014-07-01 Butamax Advanced Biofuels Llc In situ expression of lipase for enzymatic production of alcohol esters during fermentation
ES2687974T3 (es) 2012-03-14 2018-10-30 Regeneron Pharmaceuticals, Inc. Moléculas multiespecíficas de unión a antígeno y uso de las mismas
JP2014089570A (ja) * 2012-10-30 2014-05-15 Toshiba Corp 感性検索装置、方法およびプログラム
GB201302597D0 (en) * 2013-02-14 2013-04-03 Univ Leeds Novel Synthetic Proteins
CN109265517B (zh) 2015-03-27 2024-05-10 伊玛提克斯生物技术有限公司 用于各种肿瘤免疫治疗的肽和肽组合物
GB201505305D0 (en) 2015-03-27 2015-05-13 Immatics Biotechnologies Gmbh Novel Peptides and combination of peptides for use in immunotherapy against various tumors
MY197218A (en) 2015-07-06 2023-06-02 Regeneron Pharma Multispecific antigen-binding molecules and uses thereof
EP3448891A1 (en) 2016-04-28 2019-03-06 Regeneron Pharmaceuticals, Inc. Methods of making multispecific antigen-binding molecules
AU2018281280A1 (en) 2017-06-07 2020-01-16 Regeneron Pharmaceuticals, Inc. Compositions and methods for internalizing enzymes
CN114728044A (zh) 2019-08-15 2022-07-08 介控生化科技公司 用于皮下施用和按需求治疗的经修饰的因子vii多肽
GB201918108D0 (en) * 2019-12-10 2020-01-22 Vib Vzw Improved aminopeptiadases for single molecule peptide sequencing
CN112831510B (zh) * 2019-12-13 2022-04-22 中国科学院天津工业生物技术研究所 一株高效表达几丁质酶重组菌的构建及高酶活突变体的筛选

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5258289A (en) 1990-09-05 1993-11-02 Davis Claude G Method for the selecting of genes encoding catalytic antibodies
DE4112440C1 (es) 1991-04-16 1992-10-22 Diagen Institut Fuer Molekularbiologische Diagnostik Gmbh, 4000 Duesseldorf, De
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5602021A (en) 1994-12-29 1997-02-11 Catalytic Antibodies, Inc. Method for generating proteolytic enzymes specific against a selected peptide sequence
US5837516A (en) 1995-03-03 1998-11-17 Genentech, Inc. Subtilisin variants capable of cleaving substrates containing basic residues
GB9618960D0 (en) 1996-09-11 1996-10-23 Medical Science Sys Inc Proteases
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
DE19948087B4 (de) 1999-10-06 2008-04-17 Evotec Ag Verfahren zur Herstellung eines Reaktionssubstrats
DE19953854C2 (de) 1999-11-09 2002-01-17 Max Planck Gesellschaft Verfahren zur Herstellung von Biopolymeren mit veränderten Eigenschaften
GB9929061D0 (en) * 1999-12-08 2000-02-02 Medical Res Council Methods of producing novel enzymes
DE10038382A1 (de) 2000-08-07 2002-02-21 Direvo Biotech Ag Zweifarbiges fluorimetrisches Proteaseassay
DE10049673A1 (de) 2000-10-07 2002-04-25 Univ Leipzig Verfahren zur Herstellung von Peptiden, Peptidmimetika und Proteinen
EP1507852A4 (en) * 2001-05-04 2005-12-28 Xencor Inc NUCLEIC ACIDS AND PROTEINS WITH THIORODOXIN REDUCED EFFECT
EP1321513A1 (en) 2001-12-21 2003-06-25 Direvo Biotech AG Subtilisin variants with improved characteristics
EP1361284A1 (en) 2002-05-10 2003-11-12 Direvo Biotech AG Process for generating sequence-specific proteases by directed evolution and use thereof

Also Published As

Publication number Publication date
ATE526399T1 (de) 2011-10-15
AU2004249903A1 (en) 2004-12-29
CA2529659A1 (en) 2004-12-29
AU2004249903B2 (en) 2009-06-04
EP1633865B1 (en) 2011-09-28
IL172506A0 (en) 2006-04-10
US20090208440A1 (en) 2009-08-20
WO2004113521A1 (en) 2004-12-29
JP2006527590A (ja) 2006-12-07
US20090208474A1 (en) 2009-08-20
EP1633865A1 (en) 2006-03-15
US20050059126A1 (en) 2005-03-17
US7335504B2 (en) 2008-02-26

Similar Documents

Publication Publication Date Title
ES2373658T3 (es) Nuevas entidades biológicas y el uso de las mismas.
US20050002897A1 (en) Biological entities and the pharmaceutical or diagnostic use thereof
EP2297314B1 (en) Compositions and methods comprising variant microbial proteases
CA2703975C (en) Use and production of citrate-stable neutral metalloproteases
CN102209778B (zh) 包含丝氨酸蛋白酶变体的组合物和方法
EP1827486A2 (en) Targeted use of engineered enzymes
CZ20001504A3 (cs) Vícenásobně substituované varianty proteáz
Tam et al. Peptide asparaginyl ligases—renegade peptide bond makers
AU2014202897A1 (en) Compositions and methods comprising variant microbial proteases
AU2014201928A1 (en) Compositions and methods comprising variant microbial proteases