ES2417153T5

ES2417153T5 - Unstructured recombinant polymers and uses thereof

Info

Publication number: ES2417153T5
Application number: ES07752636T
Authority: ES
Inventors: Volker Schellenberger; Willem Stemmer; Chia-Wei Wang; Michael Scholle; Mikhail Popkov; Nathaniel Gordon; Andreas Crameri
Original assignee: Amunix Operating Inc
Current assignee: Amunix Pharmaceuticals Inc
Priority date: 2006-03-06
Filing date: 2007-03-06
Publication date: 2024-04-04
Anticipated expiration: 2027-03-06
Also published as: JP2015006202A; EP2402754B9; JP2014198050A; ES2417153T3; DK1996220T3; CN103360471A; CN103360471B; DK1996220T4; ES2529315T3; JP6175030B2; EP2402754A2; ES2529315T5; ES2529315T9; JP2016185990A; EP2402754B1; EP2402754A3; FI2402754T4; EP2402754B2; JP2013081481A; FI1996220T4

Description

DESCRIPCIÓNDESCRIPTION

Polímeros recombinantes no estructurados y usos de los mismos Unstructured recombinant polymers and uses thereof

REFERENCIA CRUZADA ANTECEDENTES DE LA INVENCIÓNCROSS REFERENCE BACKGROUND OF THE INVENTION

[0001]Se ha documentado bien que las propiedades de proteínas, en particular eliminación del plasma e inmunogenicidad, pueden mejorarse uniendo polímeros hidrófilos a estas proteínas (Kochendoerfer, G. (2003) Expert Opin Biol Ther, 3: 1253-61), (Greenwald, R. B. y col. (2003) Adv Drug Deliv Rev, 55: 217-50), (Harris, J. M. y col. (2003) Nat Rev Drug Discov, 2: 214-21). Ejemplos de proteínas modificadas con polímeros que han sido autorizada por la FDA para el tratamiento de pacientes son Adagen, Oncaspar, PEG-Intron, Pegasys, Somavert y Neulasta. Muchas más proteínas modificadas con polímeros están en ensayos clínicos. Estos polímeros ejercen su efecto aumentando el radio hidrodinámico (también llamado radio de Stoke) de la proteína modificada con respecto a la proteína sin modificar, que reduce la tasa de eliminación por filtración del riñón (Yang, K. y col. (2003) Protein Eng, 16: 761-70). Además, la unión del polímero puede reducir la interacción de la proteína modificada con otras proteínas, células o superficies. En particular, la unión del polímero puede reducir interacciones entre la proteína modificada y anticuerpos y otros componentes del sistema inmunitario, reduciendo así la formación de una respuesta inmunitaria del huésped a la proteína modificada. Es de particular interés la modificación de proteínas por PEGilación, es decir, uniendo polímeros lineales o ramificados de polietilenglicol. Se mostró inmunogenicidad reducida tras la PEGilación, por ejemplo, para fenilalanina amoniaco liasa (Gamez, A. y col. (2005) Mol Ther, 11: 986-9), anticuerpos (Deckert, P. M. y col. (2000) Int J Cancer, 87: 382-90.), estafilocinasa (Collen, D. y col. (2000) Circulation, 102: 1766-72) y hemoglobina (Jin, C. y col. (2004) Protein Pept Lett, 11: 353-60). Normalmente, tales polímeros se conjugan con la proteína de interés mediante una etapa de modificación química después de que se haya purificado la proteína sin modificar. [0001]It has been well documented that protein properties, in particular plasma clearance and immunogenicity, can be improved by attaching hydrophilic polymers to these proteins (Kochendoerfer, G. (2003) Expert Opin Biol Ther, 3: 1253-61), ( Greenwald, R. B. et al. (2003) Adv Drug Deliv Rev, 55: 217-50), (Harris, J. M. et al. (2003) Nat Rev Drug Discov, 2: 214-21). Examples of polymer-modified proteins that have been cleared by the FDA for the treatment of patients are Adagen, Oncaspar, PEG-Intron, Pegasys, Somavert, and Neulasta. Many more polymer-modified proteins are in clinical trials. These polymers exert their effect by increasing the hydrodynamic radius (also called Stoke radius) of the modified protein with respect to the unmodified protein, which reduces the rate of elimination by filtration from the kidney (Yang, K. et al. (2003) Protein Eng, 16: 761-70). Additionally, polymer binding may reduce the interaction of the modified protein with other proteins, cells, or surfaces. In particular, polymer binding may reduce interactions between the modified protein and antibodies and other components of the immune system, thereby reducing the formation of a host immune response to the modified protein. Of particular interest is the modification of proteins by PEGylation, that is, joining linear or branched polyethylene glycol polymers. Reduced immunogenicity was shown after PEGylation, for example, for phenylalanine ammonia lyase (Gamez, A. et al. (2005) Mol Ther, 11: 986-9), antibodies (Deckert, P. M. et al. (2000) Int J Cancer , 87: 382-90.), staphylokinase (Collen, D. et al. (2000) Circulation, 102: 1766-72) and hemoglobin (Jin, C. et al. (2004) Protein Pept Lett, 11: 353- 60). Typically, such polymers are conjugated to the protein of interest via a chemical modification step after the unmodified protein has been purified.

[0002]Pueden unirse diversos polímeros a proteínas. Son de particular interés polímeros hidrófilos que tienen conformaciones flexibles y se hidratan bien en disoluciones acuosas. Un polímero frecuentemente usado es polietilenglicol (PEG). Estos polímeros tienden a tener grandes radios hidrodinámicos con respecto a su peso molecular (Kubetzko, S. y col. (2005) Mol Pharmacol, 68: 1439-54). Los polímeros unidos tienen a tener interacciones limitadas con la proteína a la que se han unido y así la proteína modificada con polímero retiene sus funciones relevantes. [0002]Various polymers can bind to proteins. Of particular interest are hydrophilic polymers that have flexible conformations and hydrate well in aqueous solutions. A frequently used polymer is polyethylene glycol (PEG). These polymers tend to have large hydrodynamic radii with respect to their molecular weight (Kubetzko, S. et al. (2005) Mol Pharmacol, 68: 1439-54). Bound polymers tend to have limited interactions with the protein to which they are bound and thus the polymer-modified protein retains its relevant functions.

[0003]La conjugación química de polímeros con proteínas requiere complejos procedimientos de múltiples etapas. Normalmente, el componente de proteína necesita producirse y purificarse antes de la etapa de conjugación química. La etapa de conjugación puede producir la formación de mezclas de productos que necesitan separarse, conduciendo a una pérdida significativa de producto. Alternativamente, tales mezclas pueden usarse como producto farmacéutico final. Algunos ejemplos son productos de interferón-alfa PEGilados actualmente comercializados que se usan como mezclas (Wang, B. L. y col. (1998) J Submicrosc Cytol Pathol, 30: 503-9; Dhalluin, C. y col. (2005) Bioconjug Chem, 16: 504-17). Tales mezclas son difíciles de fabricar y caracterizar y contienen isómeros con actividad reducida o no terapéutica. [0003]The chemical conjugation of polymers with proteins requires complex multi-step procedures. Typically, the protein component needs to be produced and purified before the chemical conjugation step. The conjugation step can result in the formation of product mixtures that need to be separated, leading to significant product loss. Alternatively, such mixtures can be used as a final pharmaceutical product. Some examples are currently marketed PEGylated interferon-alpha products used as mixtures (Wang, B. L. et al. (1998) J Submicrosc Cytol Pathol, 30: 503-9; Dhalluin, C. et al. (2005) Bioconjug Chem, 16: 504-17). Such mixtures are difficult to manufacture and characterize and contain isomers with reduced or non-therapeutic activity.

[0004]Se han descrito procedimientos que permiten la adición específica para sitio de polímeros como PEG. Ejemplos son la PEGilación selectiva en un único sitio de glicosilación de la proteína diana o la PEGilación selectiva de un aminoácido no natural que ha sido manipulado en las proteínas diana. En algunos casos ha sido posible PEGilar selectivamente el extremo N de una proteína, a la vez que se evita la PEGilación de cadenas laterales de lisina en la proteína diana controlando cuidadosamente las condiciones de reacción. Todavía otro enfoque para la PEGilación específica para sitio de proteínas diana es la introducción de residuos de cisteína que permiten la conjugación selectiva. Todos estos procedimientos tienen limitaciones significativas. La PEGilación selectiva del extremo N requiere un cuidado control del procedimiento y las reacciones secundarias son difíciles de eliminar. La introducción de cisteínas para la PEGilación puede interferir con la producción y/o purificación de proteínas. La introducción específica de aminoácidos no naturales requiere organismos huésped específicos para la producción de proteínas. Otra limitación de la PEGilación es que el PEG se fabrica normalmente como una mezcla de polímeros con longitud similar, pero no uniforme. Las mismas limitaciones son inherentes en muchos otros polímeros químicos. [0004]Procedures have been described that allow site-specific addition of polymers such as PEG. Examples are selective PEGylation at a single glycosylation site of the target protein or selective PEGylation of a non-natural amino acid that has been manipulated in the target proteins. In some cases it has been possible to selectively PEGylate the N terminus of a protein, while preventing PEGylation of lysine side chains in the target protein by carefully controlling the reaction conditions. Still another approach to site-specific PEGylation of target proteins is the introduction of cysteine residues that allow selective conjugation. All of these procedures have significant limitations. Selective N-terminal PEGylation requires careful control of the procedure and side reactions are difficult to eliminate. The introduction of cysteines for PEGylation can interfere with protein production and/or purification. The specific introduction of unnatural amino acids requires specific host organisms for protein production. Another limitation of PEGylation is that PEG is typically manufactured as a mixture of polymers with similar, but not uniform, length. The same limitations are inherent in many other chemical polymers.

[0005]La conjugación química usando polímeros multifuncionales que permitirían la síntesis de productos con módulos de múltiples proteínas es incluso más compleja que la conjugación de polímeros de un dominio de una sola proteína. [0005]Chemical conjugation using multifunctional polymers that would allow the synthesis of products with multi-protein modules is even more complex than the conjugation of polymers of a single protein domain.

[0006]Recientemente se ha observado que algunas proteínas de organismos patógenos contienen secuencias de péptidos repetitivas que parece que conducen a una semivida en suero relativamente larga de las proteínas que contienen estas secuencias (Alvarez, P. y col. (2004) J Biol Chem, 279: 3375-81). Se ha demostrado que secuencias oligoméricas que se basan en tales secuencias repetitivas derivadas de patógeno pueden fusionarse con otras proteínas produciendo elevada semivida en suero. Sin embargo, estos oligómeros derivados de patógeno tienen varias deficiencias. Las secuencias derivadas de patógeno tienden a ser inmunogénicas. Se ha descrito que las secuencias pueden modificarse para reducir su inmunogenicidad. Sin embargo, no se ha informado de intentos para eliminar epítopes de linfocitos T de las secuencias que contribuyen a la formación de reacciones inmunitarias. Además, las secuencias derivadas de patógeno no se han optimizado para aplicaciones farmacológicas que requieren secuencias con buena solubilidad y una afinidad muy baja por otras proteínas diana. [0006]It has recently been observed that some proteins from pathogenic organisms contain repetitive peptide sequences that appear to lead to a relatively long serum half-life of proteins containing these sequences (Alvarez, P. et al. (2004) J Biol Chem , 279: 3375-81). It has been shown that oligomeric sequences that are based on such pathogen-derived repetitive sequences can fuse with other proteins producing high serum half-life. However, these pathogen-derived oligomers have several deficiencies. Pathogen-derived sequences tend to be immunogenic. It has been described that the sequences can be modified to reduce their immunogenicity. However, attempts to remove T cell epitopes from sequences that contribute to the formation of immune reactions have not been reported. Furthermore, pathogen-derived sequences have not been optimized for pharmacological applications that require sequences with good solubility and very low affinity for other target proteins.

[0007]Así, hay una necesidad significativa de composiciones y procedimientos que permitirían que se combinaran módulos de múltiples polímeros y módulos de múltiples proteínas en productos de múltiples dominios definidos. [0007]Thus, there is a significant need for compositions and procedures that would allow multi-polymer modules and multi-protein modules to be combined into defined multi-domain products.

RESUMEN DE LA INVENCIÓNSUMMARY OF THE INVENTION

[0008]La presente divulgación describe un polímero recombinante no estructurado (URP) que comprende al menos 40 aminoácidos contiguos, en el que dicho URP es sustancialmente incapaz de unirse no específicamente a una proteína del suero, y en el que (a) la suma de los residuos de glicina (G), aspartato (D), alanina (A), serina (S), treonina (T), glutamato (E) y prolina (P) contenidos en el URP constituye más de aproximadamente el 80% de los aminoácidos totales del URP; y/o (b) al menos el 50% de los aminoácidos carecen de estructura secundaria como se ha determinado por el algoritmo de Chou-Fasman. En un realización relacionada se describe un polímero recombinante no estructurado (URP) que comprende al menos 40 aminoácidos contiguos, en el que dicho URP tiene una semivida de degradación en sueroin vivosuperior a aproximadamente 24 horas, y en el que (a) la suma de los residuos de glicina (G), aspartato (D), alanina (A), serina (S), treonina (T), glutamato (E) y prolina (P) contenidos en el URP constituye más de aproximadamente el 80% de los aminoácidos totales del URP; y/o (b) al menos el 50% de los aminoácidos carecen de estructura secundaria como se ha determinado por el algoritmo de Chou-Fasman. El URP objeto puede comprender una secuencia de aminoácidos no naturales. Si se desea, el URP se selecciona para la incorporación en una proteína heteróloga, y en el que tras la incorporación del URP en una proteína heteróloga, dicha proteína heteróloga presenta una semivida de secreción en suero prolongada y/o mayor solubilidad con respecto a la proteína correspondiente que es deficiente en dicho URP. La semivida puede prolongarse dos veces, tres veces, cinco veces, diez veces o más. En algunos aspectos, la incorporación del URP en una proteína heteróloga produce al menos un aumento de 2 veces, 3 veces, 4 veces, 5 veces o más en el peso molecular aparente de la proteína como se aproxima por cromatografía de exclusión por tamaño. En algunos aspectos, los URP tienen una puntuación de epítope T inferior a -3,5 (por ejemplo, -4 o menos, -5 o menos). En algunos aspectos, los URP pueden contener predominantemente residuos hidrófilos. Si se desea, al menos el 50% de los aminoácidos del URP carecen de estructura secundaria como se ha determinado por el algoritmo de Chou-Fasman. Los residuos de glicina contenidos en el URP pueden constituir al menos aproximadamente el 50% de los aminoácidos totales del URP. En algún aspecto, un tipo cualquiera de los aminoácidos solos seleccionados del grupo que consiste en glicina (G), aspartato (D), alanina (A), serina (S), treonina (T), glutamato (E) y prolina (P) contenidos en el URP constituye más de aproximadamente el 20%, 30%, 40%, 50%, 60% o más de los aminoácidos totales del URP. En algunos aspectos, el URP comprende más de aproximadamente 100, 150, 200 o más aminoácidos contiguos. [0008]The present disclosure describes an unstructured recombinant polymer (URP) comprising at least 40 contiguous amino acids, wherein said URP is substantially incapable of binding non-specifically to a whey protein, and wherein (a) the sum of the glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P) residues contained in the URP constitutes more than approximately 80% of the total amino acids of the URP; and/or (b) at least 50% of the amino acids lack secondary structure as determined by the Chou-Fasman algorithm. In a related embodiment, an unstructured recombinant polymer (URP) comprising at least 40 contiguous amino acids is described, wherein said URP has a degradation half-life in serum in vivo greater than approximately 24 hours, and wherein (a) the sum of The residues of glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P) contained in the URP constitute more than approximately 80% of the total URP amino acids; and/or (b) at least 50% of the amino acids lack secondary structure as determined by the Chou-Fasman algorithm. The subject URP may comprise a non-natural amino acid sequence. If desired, the URP is selected for incorporation into a heterologous protein, and wherein upon incorporation of the URP into a heterologous protein, said heterologous protein exhibits a prolonged serum secretion half-life and/or greater solubility relative to the corresponding protein that is deficient in said URP. The half-life can be extended two times, three times, five times, ten times or more. In some aspects, incorporation of the URP into a heterologous protein produces at least a 2-fold, 3-fold, 4-fold, 5-fold, or more increase in the apparent molecular weight of the protein as approximated by size exclusion chromatography. In some aspects, URPs have a T epitope score less than -3.5 (e.g., -4 or less, -5 or less). In some aspects, URPs may contain predominantly hydrophilic residues. If desired, at least 50% of the URP amino acids lack secondary structure as determined by the Chou-Fasman algorithm. The glycine residues contained in the URP may constitute at least about 50% of the total amino acids of the URP. In some aspect, any one type of single amino acids selected from the group consisting of glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P ) contained in the URP constitutes more than approximately 20%, 30%, 40%, 50%, 60% or more of the total amino acids of the URP. In some aspects, the URP comprises more than about 100, 150, 200 or more contiguous amino acids.

[0009]En el presente documento también se describe una proteína que comprende uno o más de los URP objeto, en la que los URP objeto son heterólogos con respecto a la proteína. La longitud total de los URP en agregación puede superar aproximadamente 40, 50, 60, 100, 150, 200 o más aminoácidos. La proteína puede comprender uno o más módulos funcionales seleccionados del grupo que consiste en módulo efector, módulo de unión, módulo del extremo N, módulo del extremo C y cualquier combinación de los mismos. Si se desea, la proteína objeto comprende una pluralidad de módulos de unión, en los que los módulos de unión individuales presentan especificidades de unión por las mismas dianas o dianas diferentes. El módulo de unión puede comprender un andamiaje que contiene disulfuro formado por apareamiento entre andamiajes de cisteínas. El módulo de unión pueden unirse a una molécula diana, diana que está seleccionada del grupo que consiste en proteína de la superficie celular, proteína secretasa, proteína citosólica y proteína nuclear. La diana puede ser un canal de iones y/o GPCR. Si se desea, el módulo efector puede ser una toxina. La proteína que contiene el URP objeto normalmente una semivida de secreción en suero prolongada de al menos 2, 3, 4, 5, 10 o más veces con respecto a una proteína correspondiente que es deficiente en dicho URP. [0009] Also described herein is a protein comprising one or more of the subject URPs, wherein the subject URPs are heterologous with respect to the protein. The total length of the aggregating URPs may exceed approximately 40, 50, 60, 100, 150, 200 or more amino acids. The protein may comprise one or more functional modules selected from the group consisting of effector module, binding module, N-terminal module, C-terminal module and any combination thereof. If desired, the subject protein comprises a plurality of binding modules, wherein the individual binding modules exhibit binding specificities for the same or different targets. The binding module may comprise a disulfide-containing scaffold formed by pairing between cysteine scaffolds. The binding module can bind to a target molecule, which target is selected from the group consisting of cell surface protein, secretase protein, cytosolic protein and nuclear protein. The target may be an ion channel and/or GPCR. If desired, the effector module can be a toxin. The protein containing the URP typically has a prolonged serum secretion half-life of at least 2, 3, 4, 5, 10 or more times relative to a corresponding protein that is deficient in said URP.

[0010]En el presente documento también se describe una proteína que se produce no naturalmente que comprende al menos 3 unidades de repetición de secuencias de aminoácidos, comprendiendo cada una de las unidades de repetición al menos 6 aminoácidos, en la que la mayoría de los segmentos que comprenden aproximadamente 6 a aproximadamente 15 aminoácidos contiguos de las al menos 3 unidades de repetición están presentes en una o más proteínas humanas nativas. En un aspecto, la mayoría de los segmentos, o cada segmento que comprende aproximadamente 9 a aproximadamente 15 aminoácidos contiguos dentro de las unidades de repetición, están presentes en una o más proteínas humanas nativas. Los segmentos pueden comprender aproximadamente 9 a aproximadamente 15 aminoácidos. Las tres unidades de repetición pueden compartir homología de secuencias sustancial, por ejemplo, compartir identidad de secuencias superior a aproximadamente el 50%, 60%, 70%, 80%, 90% o el 100% cuando se alinean. Tal proteína no natural también puede comprender uno o más módulos seleccionados del grupo que consiste en módulos de unión, módulos efectores, módulos de multimerización, módulos del extremo C y módulos del extremo N. Si se desea, la proteína no natural puede comprender unidades de repetición individuales que tienen el polímero recombinante no estructurado (URP) objeto. [0010] Also described herein is a non-naturally occurring protein comprising at least 3 repeat units of amino acid sequences, each of the repeat units comprising at least 6 amino acids, in which the majority of the Segments comprising about 6 to about 15 contiguous amino acids of the at least 3 repeat units are present in one or more native human proteins. In one aspect, the majority of the segments, or each segment comprising about 9 to about 15 contiguous amino acids within the repeat units, are present in one or more native human proteins. The segments may comprise about 9 to about 15 amino acids. The three repeat units may share substantial sequence homology, for example, sharing sequence identity greater than about 50%, 60%, 70%, 80%, 90%, or 100% when aligned. Such a non-natural protein may also comprise one or more modules selected from the group consisting of binding modules, effector modules, multimerization modules, C-terminal modules and N-terminal modules. If desired, the non-natural protein may comprise units of individual repeaters having the subject unstructured recombinant polymer (URP).

[0011]En el presente documento también se describen polinucleótidos recombinantes que comprenden secuencias codificantes que codifican los URP objeto, proteínas que contienen URP, microproteínas y toxinas. También se proporcionan vectores que contienen los polinucleótidos objeto, células huésped que alojan los vectores, paquetes genéticos que visualizan los URP objeto, proteínas que contienen URP, toxinas y cualquier otra entidad proteinácea desvelada en el presente documento. En el presente documento también se describen bibliotecas de selección de vectores de expresión de la presente invención. [0011] Also described herein are recombinant polynucleotides comprising coding sequences encoding the target URPs, URP-containing proteins, microproteins and toxins. Also provided are vectors containing the subject polynucleotides, host cells harboring the vectors, genetic packages displaying the subject URPs, URP-containing proteins, toxins, and any other proteinaceous entities disclosed herein. Also described herein are expression vector selection libraries of the present invention.

[0012]En el presente documento también se describe un procedimiento de producción de una proteína que comprende un polímero recombinante no estructurado (URP). El procedimiento implica (i) proporcionar una célula huésped que comprende un polinucleótido recombinante que codifica la proteína, comprendiendo dicha proteína uno o más URP, comprendiendo dicho URP al menos 40 aminoácidos contiguos, en el que dicho URP es sustancialmente incapaz de unirse no específicamente a una proteína del suero, y en el que (a) la suma de los residuos de glicina (G), aspartato (D), alanina (A), serina (S), treonina (T), glutamato (E) y prolina (P) contenidos en el URP constituye más de aproximadamente el 80% de los aminoácidos totales del URP; y/o (b) al menos el 50% de los aminoácidos carecen de estructura secundaria como se ha determinado por el algoritmo de Chou-Fasman; y (ii) cultivar dicha célula huésped en un medio de cultivo adecuado en condiciones para efectuar la expresión de dicha proteína de dicho polinucleótido. Células huésped adecuadas son células eucariotas (por ejemplo, células CHO) y procariotas. [0012]A method for producing a protein comprising an unstructured recombinant polymer (URP) is also described herein. The method involves (i) providing a host cell comprising a recombinant polynucleotide encoding the protein, said protein comprising one or more URPs, said URP comprising at least 40 contiguous amino acids, wherein said URP is substantially incapable of binding non-specifically to a whey protein, and in which (a) the sum of the residues of glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline ( P) contained in the URP constitutes more than approximately 80% of the total amino acids of the URP; and/or (b) at least 50% of the amino acids lack secondary structure as determined by the Chou-Fasman algorithm; and (ii) cultivating said host cell in a suitable culture medium under conditions to effect expression of said protein of said polynucleotide. Suitable host cells are eukaryotic (for example, CHO cells) and prokaryotic cells.

[0013]La presente invención proporciona un procedimiento de aumento de la semivida en suero de una proteína que comprende: fusionar dicha proteína con uno o más polímeros recombinantes no estructurados (URP), en el que el URP comprende al menos aproximadamente 200 aminoácidos contiguos, y en el que (a) la suma de los residuos de glicina (G), aspartato (D), alanina (A), serina (S), treonina (T), glutamato (E) y prolina (P) contenidos en el URP constituye más de aproximadamente el 80% de los aminoácidos totales del URP; y (b) al menos el 50% de los aminoácidos no están presentes en la estructura secundaria como se ha determinado por el algoritmo de Chou-Fasman; y en el que dicho URP es sustancialmente incapaz de unirse no específicamente a una proteína del suero. El URP tiene una puntuación de epítope T igual o inferior a -4. [0013]The present invention provides a method of increasing the serum half-life of a protein comprising: fusing said protein with one or more unstructured recombinant polymers (URP), wherein the URP comprises at least about 200 contiguous amino acids, and in which (a) the sum of the residues of glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P) contained in the URP constitutes more than approximately 80% of the total amino acids of URP; and (b) at least 50% of the amino acids are not present in the secondary structure as determined by the Chou-Fasman algorithm; and wherein said URP is substantially incapable of binding non-specifically to a whey protein. The URP has a T epitope score equal to or less than -4.

[0014]En el presente documento también se describe un procedimiento de detección de la presencia o ausencia de una interacción específica entre una proteína diana y una exógena que se visualiza sobre un paquete genético, en el que dicha proteína comprende uno o más polímeros recombinantes no estructurados (URP), comprendiendo el procedimiento: (a) proporcionar un paquete genético que visualiza una proteína que comprende uno o más polímeros recombinantes no estructurados (URP); (b) poner en contacto el paquete genético con la diana en condiciones adecuadas para producir un complejo de proteína-diana estable; y (c) detectar la formación del complejo de proteína-diana estable sobre el paquete genético, detectando así la presencia de una interacción específica. El procedimiento puede comprender además obtener una secuencia de nucleótidos del paquete genético que codifica la proteína exógena. En algunos aspectos, la presencia o ausencia de una interacción específica es entre el URP y una diana que comprende una proteína del suero. En algunos aspectos, la presencia o ausencia de una interacción específica es entre el URP y una diana que comprende una proteasa del suero. [0014]This document also describes a procedure for detecting the presence or absence of a specific interaction between a target protein and an exogenous one that is displayed on a genetic package, in which said protein comprises one or more non-recombinant polymers. structured (URP), the method comprising: (a) providing a genetic package that displays a protein comprising one or more unstructured recombinant polymers (URP); (b) contacting the genetic package with the target under suitable conditions to produce a stable protein-target complex; and (c) detect the formation of the stable protein-target complex on the genetic package, thus detecting the presence of a specific interaction. The method may further comprise obtaining a nucleotide sequence of the genetic package that encodes the exogenous protein. In some aspects, the presence or absence of a specific interaction is between the URP and a target comprising a serum protein. In some aspects, the presence or absence of a specific interaction is between the URP and a target comprising a serum protease.

[0015]En el presente documento también se describe un paquete genético que visualiza una microproteína, en el que dicha microproteína retiene la capacidad de unión a su diana nativa. En algunos aspectos, la microproteína presenta capacidad de unión hacia al menos una familia del canal de iones seleccionado del grupo que consiste en un canal de sodio, de potasio de calcio, de acetilcolina y de cloro. Si se desea, la microproteína es una microproteína de unión a canales de iones, y se modifica de forma que (a) la microproteína se une a una familia diferente del canal con respecto a la microproteína sin modificar correspondiente; (b) la microproteína se une a una subfamilia diferente de la misma familia del canal con respecto a la microproteína sin modificar correspondiente; (c) la microproteína se une a una especie diferente de la misma subfamilia de canal con respecto a la microproteína sin modificar correspondiente; (d) la microproteína se une a un sitio diferente sobre el mismo canal con respecto a la microproteína sin modificar correspondiente; y/o (e) la microproteína se une al mismo sitio del mismo canal pero da un efecto biológico diferente con respecto a la microproteína sin modificar correspondiente. En algún aspecto, la microproteína es una toxina. También se describe una biblioteca de paquetes genéticos que visualiza las microproteínas y/o toxinas objeto. Si se desea, el paquete genético visualiza una toxina proteinácea que retiene en parte o por completo su espectro de toxicidad. La toxina puede derivarse de una proteína de una sola toxina, o derivarse de una familia de toxinas. En el presente documento también se describe una biblioteca de paquetes genéticos en la que la biblioteca visualiza una familia de toxinas, en la que la familia retiene en parte o por completo su espectro de toxicidad nativo. [0015]This document also describes a genetic package that displays a microprotein, in which said microprotein retains the binding capacity to its native target. In some aspects, the microprotein exhibits binding capacity toward at least one family of ion channels selected from the group consisting of a sodium channel, a calcium potassium channel, an acetylcholine channel, and a chloride channel. If desired, the microprotein is an ion channel binding microprotein, and is modified such that (a) the microprotein binds to a different channel family relative to the corresponding unmodified microprotein; (b) the microprotein binds to a different subfamily of the same channel family relative to the corresponding unmodified microprotein; (c) the microprotein binds to a different species of the same channel subfamily relative to the corresponding unmodified microprotein; (d) the microprotein binds to a different site on the same channel relative to the corresponding unmodified microprotein; and/or (e) the microprotein binds to the same site of the same channel but gives a different biological effect with respect to the corresponding unmodified microprotein. In some respects, the microprotein is a toxin. A library of genetic packages that displays the target microproteins and/or toxins is also described. If desired, the genetic package envisions a proteinaceous toxin that retains some or all of its toxicity spectrum. The toxin may be derived from a single toxin protein, or derived from a family of toxins. Also described herein is a gene package library in which the library displays a family of toxins, where the family retains some or all of its native toxicity spectrum.

[0016]En el presente documento también se describe una proteína que comprende una pluralidad de dominios de unión a canales de iones, en la que dominios individuales son dominios de microproteína que han sido modificados de forma que (a) los dominios de microproteína se unan a una familia diferente del canal con respecto a los dominios de microproteína sin modificar correspondientes; (b) los dominios de microproteína se unen a una subfamilia diferente de la misma familia del canal con respecto a los dominios de microproteína sin modificar correspondientes; (c) los dominios de microproteína se unen a una especie diferente de la misma subfamilia con respecto a los dominios de microproteína sin modificar correspondientes; (d) los dominios de microproteína se unen a un sitio diferente sobre el mismo canal con respecto a los dominios de microproteína sin modificar correspondientes; (e) los dominios de microproteína se unen al mismo sitio del mismo canal, pero dan un efecto biológico diferente con respecto a los dominios de microproteína sin modificar correspondientes; y/o (f) los dominios de microproteína se unen al mismo sitio del mismo canal y dan el mismo efecto biológico con respecto a los dominios de microproteína sin modificar correspondientes. [0016] Also described herein is a protein comprising a plurality of ion channel binding domains, wherein individual domains are microprotein domains that have been modified such that (a) the microprotein domains bind to a different channel family with respect to the corresponding unmodified microprotein domains; (b) the microprotein domains bind to a different subfamily of the same channel family relative to the corresponding unmodified microprotein domains; (c) the microprotein domains bind to a different species of the same subfamily relative to the corresponding unmodified microprotein domains; (d) the microprotein domains bind to a different site on the same channel relative to the corresponding unmodified microprotein domains; (e) the microprotein domains bind to the same site of the same channel, but give a different biological effect relative to the corresponding unmodified microprotein domains; and/or (f) the microprotein domains bind to the same site of the same channel and give the same biological effect with respect to the corresponding unmodified microprotein domains.

[0017]En el presente documento también se describe un procedimiento de obtención de una microproteína con propiedad deseada, que comprende: (a) proporcionar una biblioteca objeto; y (b) cribar la biblioteca de selección para obtener al menos una visualización de fago de una microproteína con la propiedad deseada. También se proporcionan polinucleótidos, vectores, paquetes genéticos, células huésped para su uso en uno cualquiera de los procedimientos desvelados. [0017]This document also describes a procedure for obtaining a microprotein with the desired property, which comprises: (a) providing an object library; and (b) screening the selection library to obtain at least one phage display of a microprotein with the desired property. Also provided are polynucleotides, vectors, genetic packages, host cells for use in any one of the disclosed methods.

BREVE DESCRIPCIÓN DE LOS DIBUJOSBRIEF DESCRIPTION OF THE DRAWINGS

[0018]Las novedosas características de la invención se exponen con particularidad en las reivindicaciones adjuntas. Un mejor entendimiento de las características y ventajas de la presente invención se obtendrán por referencia a la siguiente descripción detallada que expone realizaciones ilustrativas, en las que los principios de la invención se utilizan, y los dibujos adjuntos de los que: [0018]The novel features of the invention are set out with particularity in the attached claims. A better understanding of the features and advantages of the present invention will be obtained by reference to the following detailed description which sets forth illustrative embodiments, in which the principles of the invention are used, and the accompanying drawings of which:

[0019]La FIG. 1 muestra los componentes modulares de una MURP. Módulos unión, módulos efectores y módulos de multimerización se representan como círculos. Módulos de URP, módulos del extremo N y del extremo C se muestran como rectángulos. [0019]FIG. 1 shows the modular components of a MURP. Binding modules, effector modules and multimerization modules are represented as circles. URP modules, N-end and C-end modules are shown as rectangles.

[0020]La FIG. 2 muestra ejemplos de arquitecturas modulares de MURP. Módulos de unión (BM) en una MURP pueden tener especificidades diana idénticas o diferentes. [0020]FIG. 2 shows examples of modular MURP architectures. Binding modules (BM) in a MURP can have identical or different target specificities.

[0021]La FIG. 3 muestra que una proteína de repetición que se basa en una secuencia humana puede contener secuencias de aminoácidos novedosas, que pueden contener epítopes de linfocitos T. Estas secuencias novedosas se forman en el empalme entre unidades de repetición vecinas. [0021]FIG. 3 shows that a repeat protein that is based on a human sequence may contain novel amino acid sequences, which may contain T cell epitopes. These novel sequences are formed at the splicing between neighboring repeat units.

[0022]La FIG. 4 ilustra el diseño de una secuencia de URP que es una proteína de repetición basada en tres secuencias de donante humano D1, D2, y D3. La unidad de repetición de este URP se eligió de forma que incluso secuencias 9-meras que atraviesan el empalme entre unidades vecinas pudieran encontrarse en al menos una de las secuencias de donante humano. [0022]FIG. 4 illustrates the design of a URP sequence that is a repeat protein based on three human donor sequences D1, D2, and D3. The repeat unit of this URP was chosen so that even 9-mer sequences that span the splice between neighboring units could be found in at least one of the human donor sequences.

[0023]FIG. 5 Ejemplo de una secuencia de URP que es una proteína de repetición basada en las secuencias de tres proteínas humanas. La porción inferior de la figura ilustra que todas las subsecuencias 9-meras en el URP se producen en al menos una de las proteínas de donante humano. [0023]FIG. 5 Example of a URP sequence that is a repeat protein based on the sequences of three human proteins. The lower portion of the figure illustrates that all 9-mer subsequences in the URP occur in at least one of the human donor proteins.

[0024] FIG. 6 Ejemplo basado en secuencia de URP basada en los residuos del dominio POU humano 146 182. [0024] FIG. 6 Example based on URP sequence based on human POU domain residues 146 182.

[0025] La FIG. 7 muestra la ventaja de separar módulos con secuencias ricas en información insertando módulos de URP entre tales secuencias. El lado izquierdo de la figura muestra que la fusión directa de los módulos A y B conduce a secuencias novedosas en la región de empalme. Estas secuencias de empalme pueden ser epítopes. La mitad derecha de la figura muestra que la inserción de un módulo de URP entre el módulo A y B previene la formación de tales secuencias de empalme que contienen secuencias parciales de los módulos A y B. En su lugar, los extremos de los módulos A y B dan secuencias de empalme que contienen secuencias deRy así se predice que tienen baja inmunogenicidad. [0025] FIG. 7 shows the advantage of separating modules with information-rich sequences by inserting URP modules between such sequences. The left side of the figure shows that direct fusion of modules A and B leads to novel sequences in the splicing region. These splicing sequences may be epitopes. The right half of the figure shows that the insertion of a URP module between module A and B prevents the formation of such splice sequences containing partial sequences of modules A and B. Instead, the ends of modules A and B give splicing sequences containingRsequences and are thus predicted to have low immunogenicity.

[0026] La FIG. 8 muestra construcciones de administración de fármaco que se basan en URP. Las moléculas de fármaco representadas como hexágonos están químicamente conjugadas con la MURP. [0026] FIG. 8 shows drug delivery constructs that are based on URP. Drug molecules represented as hexagons are chemically conjugated to MURP.

[0027] La FIG. 9 muestra y MURP que contiene un sitio sensible a proteasas. El módulo de URP se diseña de forma que bloquee la función del módulo efector. La escisión con proteasa elimina una parte del módulo de URP y produce elevada actividad de la función efectora. [0027] FIG. 9 sample and MURP containing a protease-sensitive site. The URP module is designed in such a way that it blocks the function of the effector module. Protease cleavage eliminates a part of the URP module and produces high effector function activity.

[0028] La FIG. 10 muestra cómo un módulo de URP puede actuar de ligador entre un módulo de unión y un módulo efector. El módulo de unión pueden unirse a una diana y como consecuencia aumenta la concentración local de módulo efector en la proximidad de la diana. [0028] FIG. 10 shows how a URP module can act as a linker between a binding module and an effector module. The binding module can bind to a target and as a consequence the local concentration of effector module in the vicinity of the target increases.

[0029] La FIG. 11 muestra un procedimiento para construir genes que codifican secuencias de URP de bibliotecas de módulos de URP cortos. La biblioteca de módulos de URP puede insertarse en un vector de relleno que contiene proteína verde fluorescente (GFP) como indicador para facilitar la identificación de secuencias de URP con alta expresión. La figura ilustra que los genes que codifican secuencias de URP largas pueden construirse por dimerización iterativa. [0029] FIG. 11 shows a procedure for constructing genes encoding URP sequences from libraries of short URP modules. The URP module library can be inserted into a filler vector containing green fluorescent protein (GFP) as a reporter to facilitate the identification of highly expressed URP sequences. The figure illustrates that genes encoding long URP sequences can be constructed by iterative dimerization.

[0030] La FIG. 12 muestra MURP que contienen múltiples módulos de unión para receptores de muerte. Los receptores de muerte son desencadenados por la trimerización y así MURP que contienen al menos tres elementos de unión para un receptor de muerte particularmente potente en inducir muerte celular. La porción inferior de la figura ilustra que puede aumentarse la especificidad de la MURP por tejido enfermo añadiendo uno o más módulos de unión con especificidad por tejido tumoral. [0030] FIG. 12 shows MURPs containing multiple binding modules for death receptors. Death receptors are triggered by trimerization and thus MURPs contain at least three binding elements for a death receptor particularly potent in inducing cell death. The lower portion of the figure illustrates that the specificity of MURP for diseased tissue can be increased by adding one or more binding modules with specificity for tumor tissue.

[0031] La FIG. 13 muestra una MURP que comprende cuatro módulos de unión (rectángulos) con especificidad por un antígeno de tumor con un módulo efector como interleucina 2. [0031] FIG. 13 shows a MURP comprising four binding modules (rectangles) with specificity for a tumor antigen with an effector module such as interleukin 2.

[0032] La FIG. 14 muestra el diagrama de flujo para la construcción de módulos de URP con 288 residuos. Los módulos de URP se construyeron como proteínas de fusión con GFP. Las bibliotecas de módulos de URP con 36 aminoácidos se construyeron primero, seguido de dimerización iterativa para dar módulos de URP con 288 aminoácidos (rPEG_H288 y rPEG_J288). [0032] FIG. 14 shows the flowchart for the construction of URP modules with 288 residues. URP modules were constructed as fusion proteins with GFP. Libraries of URP modules with 36 amino acids were constructed first, followed by iterative dimerization to give URP modules with 288 amino acids (rPEG_H288 and rPEG_J288).

[0033] FIG. 15 Secuencia de aminoácidos y de nucleótidos de un módulo de URP con 288 aminoácidos (rPEG_J288). [0033] FIG. 15 Amino acid and nucleotide sequence of a URP module with 288 amino acids (rPEG_J288).

[0034] FIG. 16 Secuencia de aminoácidos y de nucleótidos de un módulo de URP con 288 aminoácidos (rPEG_H288). [0034] FIG. 16 Amino acid and nucleotide sequence of a URP module with 288 amino acids (rPEG_H288).

[0035] FIG. 17 Secuencia de aminoácidos de una región de secuencia rica en serina de la proteína humana dentina sialofosfoproteína. [0035] FIG. 17 Amino acid sequence of a serine-rich sequence region of the human dentin sialophosphoprotein protein.

[0036] La FIG. 18 muestra un derivado de liberación prolongada de una MURP. La proteína contiene dos residuos de cisteína que pueden formar un débil puente SS. La proteína puede fabricarse con el puente SS intacto. Puede formularse e inyectarse en pacientes en forma reducida. Después de la inyección se oxidará en proximidad al sitio de inyección y como resultado puede formar un polímero de alto peso molecular con difusividad muy limitada. La MURP activa puede filtrarse lentamente del sitio de inyección por proteólisis limitada o reducción limitada del enlace SS de reticulación. [0036] FIG. 18 shows a sustained release derivative of a MURP. The protein contains two cysteine residues that can form a weak SS bridge. The protein can be made with the SS bridge intact. It can be formulated and injected into patients in reduced form. After injection it will oxidize in proximity to the injection site and as a result may form a high molecular weight polymer with very limited diffusivity. Active MURP can slowly leak from the injection site by limited proteolysis or limited reduction of the cross-linking SS bond.

[0037] La FIG. 19 muestra una forma de liberación prolongada de una MURP. La MURP tiene difusividad muy limitada en el sitio de inyección y puede liberarse del sitio de inyección por proteólisis limitada. [0037] FIG. 19 shows a sustained release form of a MURP. MURP has very limited diffusivity at the injection site and can be released from the injection site by limited proteolysis.

[0038] La FIG. 20 muestra una forma de liberación prolongada de una MURP que contiene una secuencia rica en histidina. La MURP puede formularse e inyectarse en combinación con perlas insolubles que contienen níquel inmovilizado. La MURP se une a las perlas de níquel en el sitio de inyección y es lentamente liberada en la circulación. [0038] FIG. 20 shows a sustained release form of a MURP containing a histidine-rich sequence. MURP can be formulated and injected in combination with insoluble beads containing immobilized nickel. MURP binds to nickel beads at the injection site and is slowly released into the circulation.

[0039] La FIG. 21 muestra MURP que contienen módulos de multimerización. La parte superior de la figura muestra una MURP que contiene una secuencia de dimerización. Como resultado, forma un dímero que duplica eficazmente su peso molecular. El centro de la figura muestra tres diseños de MURP que comprenden dos secuencias de multimerización. Tales MURP pueden formar multímeros con peso molecular eficaz muy alto. La parte inferior de la figura ilustró una MURP que contiene múltiples secuencias de RGD que son conocidas por unirse a receptores de la superficie celular y así conferir semivida. [0039] FIG. 21 shows MURPs containing multimerization modules. The top part of the figure shows a MURP containing a dimerization sequence. As a result, it forms a dimer that effectively doubles its molecular weight. The center of the figure shows three MURP designs comprising two multimerization sequences. Such MURPs can form multimers with very high effective molecular weight. The bottom part of the figure illustrated a MURP containing multiple RGD sequences that are known to bind to cell surface receptors and thus confer half-life.

[0040] La FIG. 22 muestra una variedad de MURP que se diseñan para bloquear o modular la función de canales de iones. Los círculos indican módulos de unión con especificidad por canales de iones. Estos módulos de unión pueden derivarse o ser idénticos a toxinas naturales con afinidad por receptores de canales de iones. La figura ilustra que otros dominios de unión pueden añadirse a cualquier lado de los módulos específicos para unión a canales de iones, confiriendo así a las MURP eficacia o especificidad elevada por un tipo de célula particular. [0040] FIG. 22 shows a variety of MURPs that are designed to block or modulate the function of ion channels. Circles indicate binding modules with ion channel specificity. These binding modules may be derived from or identical to natural toxins with affinity for ion channel receptors. The figure illustrates that other binding domains can be added to either side of the specific ion channel binding modules, thus conferring MURPs with high efficacy or specificity for a particular cell type.

[0041] La FIG. 23 muestra varios diseños de MURP para semivida elevada. El peso molecular eficaz elevado puede lograrse aumentando la longitud de cadena (A), multimerización química (B), añadiendo múltiples copias de módulos de unión a una molécula separada por sitios de no unión (C), construcción de multímeros químicos similares a C (D, E), que incluyen secuencias de multimerización (F). [0041] FIG. 23 shows various MURP designs for high half-life. High effective molecular weight can be achieved by increasing chain length (A), chemical multimerization (B), adding multiple copies of binding modules to a molecule separated by non-binding sites (C), construction of C-like chemical multimers ( D, E), which include multimerization sequences (F).

[0042] La FIG. 24 muestra MURP que pueden formarse por conjugación química de módulos de unión con una secuencia de URP recombinante. La secuencia de URP se diseña para contener múltiples residuos de lisina (K) como sitios de conjugación. [0042] FIG. 24 shows MURPs that can be formed by chemical conjugation of binding modules with a recombinant URP sequence. The URP sequence is designed to contain multiple lysine (K) residues as conjugation sites.

[0043] La FIG. 25 muestra el diseño de una biblioteca de módulos de unión a 2SS. Las secuencias contienen una secuencia de 1SS constante en el centro que está flanqueada por secuencias aleatorias que contienen residuos de cisteína a distancia variable del núcleo de 1Ss . [0043] FIG. 25 shows the design of a 2SS binding module library. The sequences contain a constant 1SS sequence in the center that is flanked by random sequences containing cysteine residues at varying distances from the 1Ss core.

[0044] La FIG. 26 muestra el diseño de una biblioteca de módulos de unión a 2SS. Las secuencias contienen una secuencia de 1SS constante en el centro que está flanqueada por secuencias aleatorias que contienen residuos de cisteína a distancia variable del núcleo de 1S<s>. [0044] FIG. 26 shows the design of a 2SS binding module library. The sequences contain a constant 1SS sequence in the center that is flanked by random sequences containing cysteine residues at varying distances from the 1S<s>core.

[0045] La FIG. 27 muestra el diseño de una biblioteca de dímeros de módulos de unión 1SS. Inicialmente, una colección de módulos de unión 1SS se amplifica por dos reacciones de PCR. Los productos de PCR resultantes se combinan y generan dímeros en una posterior etapa de PCR. [0045] FIG. 27 shows the design of a 1SS binding module dimer library. Initially, a collection of 1SS binding modules is amplified by two PCR reactions. The resulting PCR products are combined and generate dimers in a subsequent PCR step.

[0046] La FIG. 28 muestra los análisis de Western de una proteína de fusión que contiene la secuencia de URP de 288 aminoácidos rPEG_J288 después de la incubación de hasta 3 días en 50% de suero de ratón. [0046] FIG. 28 shows Western analyzes of a fusion protein containing the 288 amino acid URP sequence rPEG_J288 after incubation for up to 3 days in 50% mouse serum.

[0047] La FIG. 29 muestra los resultados de una prueba de ensayo de unión para anticuerpos preexistentes contra una secuencia de URP de 288 aminoácidos. [0047] FIG. 29 shows the results of a binding assay test for pre-existing antibodies against a 288 amino acid URP sequence.

[0048] La FIG. 30 muestra la unión de MURP que contienen un (monómero), dos (dímero), cuatro (tetrámero) o cero (rPEG36) módulos de unión con especificidad por VEGF que se recubrió para placas de microtitulación. [0048] FIG. 30 shows the binding of MURPs containing one (monomer), two (dimer), four (tetramer) or zero (rPEG36) binding modules with specificity for VEGF that were coated to microtiter plates.

[0049] La FIG. 31 muestra la secuencia de aminoácidos de una MURP con especificidad por EpCAM. La secuencia contiene cuatro módulos de unión con afinidad por EpCAM (subrayado). La secuencia contiene una secuencia de Flag del extremo N que contiene los dos únicos residuos de lisina de la secuencia entera. [0049] FIG. 31 shows the amino acid sequence of a MURP with specificity for EpCAM. The sequence contains four binding modules with affinity for EpCAM (underlined). The sequence contains an N-terminal Flag sequence that contains the only two lysine residues in the entire sequence.

[0050] La FIG. 32 muestra el diseño de bibliotecas de adición de 1SS. Módulos 1SS aleatorios pueden añadirse al extremo N o C de un módulo de unión preseleccionado o simultáneamente a ambos lados. [0050] FIG. 32 shows the design of 1SS addition libraries. Random 1SS modules can be added to the N or C end of a preselected junction module or simultaneously to both sides.

[0051] La FIG. 33 muestra el alineamiento de secuencias relacionadas con toxina de tres dedos. La figura también muestra una estructura 3D que se resolvió por RMN. [0051] FIG. 33 shows the alignment of sequences related to three-finger toxin. The figure also shows a 3D structure that was solved by NMR.

[0052]La FIG. 34 muestra el diseño de una biblioteca basada en la toxina de tres dedos. Los residuos designados X se aleatorizaron. Se indica la elección de codón para cada posición al azar. [0052]FIG. 34 shows the design of a library based on the three-finger toxin. The residues designated X were randomized. The codon choice for each random position is indicated.

[0053]La FIG. 35 muestra el alineamiento de secuencias relacionadas con plexina. [0053]FIG. 35 shows the alignment of plexin-related sequences.

[0054]La FIG. 36 muestra el diseño de una biblioteca basada en plexina. Los residuos designados X se aleatorizaron. Se indica la elección de codón para cada posición al azar. [0054]FIG. 36 shows the design of a plexin-based library. The residues designated X were randomized. The codon choice for each random position is indicated.

[0055]FIG. 37 Secuencias de módulos de unión relacionados con plexina con especificidad por DR4, ErbB2 y HGFR. [0055]FIG. 37 Sequences of plexin-related binding modules with specificity for DR4, ErbB2 and HGFR.

[0056]La FIG. 38 muestra un ensayo de unión para dominios de unión basados en microproteína con especificidad por VEGF. [0056]FIG. 38 shows a binding assay for microprotein-based binding domains with specificity for VEGF.

[0057]La FIG. 39 muestra secuencias de módulos de unión de 2SS y 3SS que se aislaron de bibliotecas de elaboración con especificidad por VEGF. La parte superior de la proteína muestra análisis de gel de PAGE de las proteínas purificadas por calor-lisis. [0057]FIG. 39 shows sequences of 2SS and 3SS binding modules that were isolated from manufacturing libraries with VEGF specificity. The top part of the protein shows PAGE gel analysis of the proteins purified by heat-lysis.

[0058]La FIG. 40 muestra etapas de clonación para construir la secuencia de URP rPEG_J72. [0058]FIG. 40 shows cloning steps to construct the rPEG_J72 URP sequence.

[0059]La FIG. 41 muestra la construcción de una biblioteca de módulos de URP con 36 aminoácidos llamada rPEG_J36. La región que codifica rPEG_J36 se ensambló ligando tres segmentos más cortos que codifican rPEG_J12 y un módulo tapón. [0059]FIG. 41 shows the construction of a library of URP modules with 36 amino acids called rPEG_J36. The region encoding rPEG_J36 was assembled by ligating three shorter segments encoding rPEG_J12 and a stopper module.

[0060]La FIG. 42 muestra la secuencia de nucleótidos y la traducción del vector de relleno pCW0051. La región de relleno está flanqueada por sitios BsaI y BbsI y contiene múltiples codones de terminación. [0060]FIG. 42 shows the nucleotide sequence and translation of the stuffing vector pCW0051. The filler region is flanked by BsaI and BbsI sites and contains multiple stop codons.

[0061]La FIG. 43 muestra un gel de PAGE de la purificación del URP rPEG_J288 fusionado con GFP. El carril 2 muestra el lisado celular; carril 3: producto purificado por IMAC; carril 4: producto purificado por anti-Flag. [0061]FIG. 43 shows a PAGE gel of the purification of the rPEG_J288 URP fused to GFP. Lane 2 shows cell lysate; lane 3: product purified by IMAC; lane 4: product purified by anti-Flag.

[0062]FIG. 44 Secuencia de aminoácidos de proteínas de fusión entre rPEG_J288 y los dominios efectores humanos interferón alfa, G-CSF y hormona de crecimiento humana. [0062]FIG. 44 Amino acid sequence of fusion proteins between rPEG_J288 and the human interferon alpha, G-CSF and human growth hormone effector domains.

[0063]La FIG. 45 muestra el análisis Western de expresión de proteínas de fusión entre rPEG_J288 y hormona de crecimiento humana (carriles 1 y 2), interferón alfa (carriles 3 y 4) y GFP (carriles 5 y 6). Se analizó tanto material soluble como insoluble para cada proteína. [0063]FIG. 45 shows the Western analysis of expression of fusion proteins between rPEG_J288 and human growth hormone (lanes 1 and 2), alpha interferon (lanes 3 and 4) and GFP (lanes 5 and 6). Both soluble and insoluble material was analyzed for each protein.

[0064]La FIG. 46 muestra el diseño de MURP basado en la toxina OSK1. La figura muestra que secuencias de URP y/o módulos de unión pueden añadirse a cualquier lado de OSK1 [0064]FIG. 46 shows the design of MURP based on the OSK1 toxin. The figure shows which URP sequences and/or binding modules can be added to either side of OSK1

[0065]La FIG. 47 representa a modo de ejemplo formatos de producto que comprenden los URP objeto.DESCRIPCIÓN DETALLADA DE LA INVENCIÓN[0065]FIG. 47 represents, by way of example, product formats that comprise the object URPs. DETAILED DESCRIPTION OF THE INVENTION

[0066]Aunque en el presente documento se han mostrado y descrito realizaciones preferidas de la presente invención, será obvio para aquellos expertos en la materia que tales realizaciones solo se proporcionan a modo de ejemplo. Numerosas variaciones, cambios y sustituciones se les ocurrirán ahora a aquellos expertos en la materia sin apartarse de la invención. Debe entenderse que pueden emplearse diversas alternativas a las realizaciones de la invención descritas en el presente documento en la práctica de la invención. Se pretende que las siguientes reivindicaciones definan el alcance de la invención y que así se cubran procedimientos y estructuras dentro del alcance de estas reivindicaciones y sus equivalentes. [0066]Although preferred embodiments of the present invention have been shown and described herein, it will be obvious to those skilled in the art that such embodiments are only provided by way of example. Numerous variations, changes and substitutions will now occur to those skilled in the art without departing from the invention. It should be understood that various alternatives to the embodiments of the invention described herein may be employed in the practice of the invention. The following claims are intended to define the scope of the invention and thus cover procedures and structures within the scope of these claims and their equivalents.

Técnicas generales: General techniques:

[0067]La práctica de la presente invención emplea, a menos que se indique lo contrario, técnicas convencionales de inmunología, bioquímica, química, biología molecular, microbiología, biología celular, genómica y ADN recombinante, que están dentro de la habilidad en la técnica. Véase Sambrook, Fritsch y Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2a edición (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel y col. eds., (1987)); las series METHODS IN ENZYMOLOGY (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames y G.R. Taylor eds. (1995)), Harlow y Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, y ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)). [0067]The practice of the present invention employs, unless otherwise indicated, conventional techniques of immunology, biochemistry, chemistry, molecular biology, microbiology, cell biology, genomics and recombinant DNA, which are within the skill in the art. . See Sambrook, Fritsch and Maniatis, MOLECULAR CLONING: A LABORATORY MANUAL, 2nd edition (1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY (F. M. Ausubel et al. eds., (1987)); the METHODS IN ENZYMOLOGY series (Academic Press, Inc.): PCR 2: A PRACTICAL APPROACH (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) ANTIBODIES, A LABORATORY MANUAL, and ANIMAL CELL CULTURE (R.I. Freshney, ed. (1987)).

Definiciones: Definitions:

[0068]Como se usa en la memoria descriptiva y reivindicaciones, la forma singular “un”, “una”, “el” y “la” incluyen referencias plurales, a menos que el contexto dicte claramente de otro modo. Por ejemplo, el término “una célula” incluye una pluralidad de células, que incluye mezclas de las mismas. [0068]As used in the specification and claims, the singular form “a”, “an”, “the” and “the” include plural references, unless the context clearly dictates otherwise. For example, the term "a cell" includes a plurality of cells, including mixtures thereof.

[0069]Los términos “polipéptido”, “péptido”, “secuencia de aminoácidos” y “proteína” se usan indistintamente en el presente documento para referirse a polímeros de aminoácidos de cualquier longitud. El polímero puede ser lineal o ramificado, puede comprender aminoácidos modificados y puede estar interrumpido por no aminoácidos. Los términos también engloban un polímero de aminoácidos que ha sido modificado, por ejemplo, formación de enlaces disulfuro, glicosilación, lipidación, acetilación, fosforilación, o cualquier otra manipulación tal como conjugación con un componente de marca. Como se usa en el presente documento, el término “aminoácido” se refiere tanto a aminoácidos naturales y/o no naturales como a sintéticos que incluyen, pero no se limitan a, glicina y tanto los isómeros ópticos D como L, y análogos de aminoácidos y peptidomiméticos. Se usan códigos de una sola letra o de tres letras convencionales para designar los aminoácidos. [0069]The terms “polypeptide”, “peptide”, “amino acid sequence” and “protein” are used interchangeably herein to refer to polymers of amino acids of any length. The polymer may be linear or branched, may comprise modified amino acids, and may be interrupted by non-amino acids. The terms also encompass a polymer of amino acids that has been modified, for example, disulfide bond formation, glycosylation, lipidation, acetylation, phosphorylation, or any other manipulation such as conjugation with a brand component. As used herein, the term “amino acid” refers to both natural and/or non-natural and synthetic amino acids including, but not limited to, glycine and both the D and L optical isomers, and amino acid analogs. and peptidomimetics. Single-letter or conventional three-letter codes are used to designate amino acids.

[0070]Una “secuencia repetitiva” se refiere a una secuencia de aminoácidos que puede describirse como un oligómero de secuencias de péptidos de repetición, que forman repeticiones directas, o repeticiones inversas o repeticiones alternantes de motivos de múltiples secuencias. Estas secuencias de oligómeros de repetición pueden ser idénticas u homólogas entre sí, pero también pueden ser motivos repetidos múltiples. Las secuencias repetitivas se caracterizan por un contenido de información muy bajo. Una secuencia repetitiva no es una característica requerida de un URP y en algunos casos una secuencia no repetitiva será de hecho preferida. [0070]A “repetitive sequence” refers to an amino acid sequence that can be described as an oligomer of repeating peptide sequences, which form direct repeats, or inverse repeats or alternating repeats of multiple sequence motifs. These repeat oligomer sequences may be identical or homologous to each other, but may also be multiple repeat motifs. Repetitive sequences are characterized by a very low information content. A repetitive sequence is not a required feature of a URP and in some cases a non-repetitive sequence will in fact be preferred.

[0071]Los aminoácidos pueden caracterizarse basándose en su hidrofobia. Se han desarrollado varias escalas. Un ejemplo es una escala desarrollada por Levitt, M y col. (véase Levitt, M (1976) J Mol Biol 104, 59, n° 3233, que se enumera en Hopp, TP y col. (1981) Proc Natl Acad Sci U S A 78, 3824, n° 3232). Ejemplos de “aminoácidos hidrófilos” son arginina, lisina, treonina, alanina, asparagina y glutamina. Son de particular interés los aminoácidos hidrófilos aspartato, glutamato y serina, y glicina. Ejemplos de “aminoácidos hidrófobos” son triptófano, tirosina, fenilalanina, metionina, leucina, isoleucina y valina. [0071]Amino acids can be characterized based on their hydrophobicity. Several scales have been developed. An example is a scale developed by Levitt, M et al. (see Levitt, M (1976) J Mol Biol 104, 59, no. 3233, listed in Hopp, TP et al. (1981) Proc Natl Acad Sci U S A 78, 3824, no. 3232). Examples of "hydrophilic amino acids" are arginine, lysine, threonine, alanine, asparagine and glutamine. Of particular interest are the hydrophilic amino acids aspartate, glutamate and serine, and glycine. Examples of “hydrophobic amino acids” are tryptophan, tyrosine, phenylalanine, methionine, leucine, isoleucine and valine.

[0072]El término “conformación desnaturalizada” describe el estado de un péptido en disolución que se caracteriza por una gran libertad conformacional del esqueleto del péptido. La mayoría de los péptidos y proteínas adoptan una conformación desnaturalizada en presencia de altas concentraciones de desnaturalizantes o a temperaturas elevadas. Los péptidos en conformación desnaturalizada tienen espectros de CD característicos y se caracterizan generalmente por una falta de interacciones de largo intervalo como se ha determinado por, por ejemplo, RMN. Conformación desnaturalizada y conformación no plegada se usarán sinónimamente. [0072]The term “denatured conformation” describes the state of a peptide in solution that is characterized by great conformational freedom of the peptide backbone. Most peptides and proteins adopt a denatured conformation in the presence of high concentrations of denaturants or at elevated temperatures. Peptides in denatured conformation have characteristic CD spectra and are generally characterized by a lack of long-range interactions as determined by, for example, NMR. Denatured conformation and unfolded conformation will be used synonymously.

[0073]Los términos “secuencias de proteínas no estructuradas (UNP)” y polímero recombinante no estructurado” (URP) se usan en el presente documento indistintamente. Los términos se refieren a secuencias de aminoácidos que comparten características comunes con secuencias de péptidos desnaturalizadas, por ejemplo, que presentan un comportamiento típico similar a secuencias de péptidos desnaturalizadas, bajo condiciones fisiológicas, como se detalla en el presente documento. Las secuencias de URP carecen de una estructura terciaria definida y tienen estructura limitada o no secundaria como se detecta, por ejemplo, por el algoritmo de Chou-Fasman. [0073]The terms “unstructured protein sequences (UNP)” and unstructured recombinant polymer” (URP) are used interchangeably herein. The terms refer to amino acid sequences that share common characteristics with denatured peptide sequences, for example, exhibiting typical behavior similar to denatured peptide sequences, under physiological conditions, as detailed herein. URP sequences lack a defined tertiary structure and have limited or no secondary structure as detected, for example, by the Chou-Fasman algorithm.

[0074]Como se usa en el presente documento, el término “proteínas de la superficie celular” se refiere a los componentes de la membrana plasmática de una célula. Engloba proteínas de la membrana integrales y periféricas, glicoproteínas, polisacáridos y lípidos que constituyen la membrana plasmática. Una proteína de la membrana integral es una proteína transmembrana que se extiende a través de la bicapa de lípidos de la membrana plasmática de una célula. Una proteína de la membrana integral típica consiste en al menos un segmento que atraviesa la membrana que generalmente comprende residuos de aminoácidos hidrófobos. Las proteínas de la membrana periférica no se extienden en el interior hidrófobo de la bicapa de lípidos y están unidas a la superficie de la membrana mediante interacción covalente o no covalente directamente o indirectamente con otros componentes de la membrana. [0074]As used herein, the term “cell surface proteins” refers to components of the plasma membrane of a cell. It encompasses integral and peripheral membrane proteins, glycoproteins, polysaccharides and lipids that constitute the plasma membrane. An integral membrane protein is a transmembrane protein that spans the lipid bilayer of a cell's plasma membrane. A typical integral membrane protein consists of at least one membrane-spanning segment that generally comprises hydrophobic amino acid residues. Peripheral membrane proteins do not extend into the hydrophobic interior of the lipid bilayer and are attached to the membrane surface by covalent or noncovalent interaction directly or indirectly with other membrane components.

[0075]Los términos “membrana”, “citosólica”, “nuclear” y “secretada” como se aplican a proteínas celulares especifican la localización extracelular y/o subcelular en la que la proteína celular está principalmente, predominantemente o preferencialmente localizada. [0075]The terms “membrane”, “cytosolic”, “nuclear” and “secreted” as applied to cellular proteins specify the extracellular and/or subcellular location in which the cellular protein is primarily, predominantly or preferentially located.

[0076]Los “receptores de la superficie celular” representan un subconjunto de proteínas de la membrana, que pueden unirse a sus ligandos respectivos. Los receptores de la superficie celular son moléculas ancladas sobre o insertadas en la membrana plasmática de la célula. Constituyen una gran familia de proteínas, glicoproteínas, polisacáridos y lípidos, que sirven no solo de constituyentes estructurales de la membrana plasmática, sino también de elementos reguladores que gobiernan una variedad de funciones biológicas. [0076] “Cell surface receptors” represent a subset of membrane proteins, which can bind their respective ligands. Cell surface receptors are molecules anchored on or inserted into the plasma membrane of the cell. They constitute a large family of proteins, glycoproteins, polysaccharides and lipids, which serve not only as structural constituents of the plasma membrane, but also as regulatory elements that govern a variety of biological functions.

[0077]El término “módulo” se refiere a una parte de una proteína que se diferencia físicamente o funcionalmente de otras porciones de la proteína o péptido. Un módulo puede comprender uno o más dominios. En general, un módulo o dominio puede ser una única estructura tridimensional estable, independientemente del tamaño. La estructura terciaria de un dominio típico es estable en disolución y sigue igual si un miembro tal se aísla o se fusiona covalentemente con otros dominios. Un dominio tiene generalmente una estructura terciaria particular formada por relaciones espaciales de elementos de la estructura secundaria, tales como hojas beta, hélices alfa y bucles no estructurados. En dominios de la familia de las microproteínas, los puentes disulfuro son generalmente los elementos primarios que determinan la estructura terciaria. En algunos casos, los dominios son módulos que pueden conferir una actividad funcional específica, tal como avidez (sitios de múltiple unión a la misma diana), multiespecificidad (sitios de unión para diferentes dianas), semivida (usando un dominio, péptido cíclico o péptido lineal) que se une a una proteína del suero como albúmina de suero humano (HSA) o a IgG (hIgG1, 2, 3 ó 4) o a glóbulos rojos. Los dominios funcionalmente definidos tienen una función (funciones) biológica(s) distinta(s). El dominio de unión a ligando de un receptor es, por ejemplo, el dominio que se une a ligando. Un dominio de unión a antígeno se refiere a la parte de una unidad de unión a antígeno o un anticuerpo que se une al antígeno. Los dominios funcionalmente definidos no necesitan codificarse por secuencias de aminoácidos contiguas. Los dominios funcionalmente definidos pueden contener uno o más dominios físicamente definidos. Los receptores, por ejemplo, se dividen generalmente en el dominio de unión a ligando extracelular, un dominio transmembrana y un dominio efector intracelular. Un “dominio de anclaje a membrana” se refiere a la porción de una proteína que media en la asociación a membrana. Generalmente, el dominio de anclaje a membrana está compuesto por residuos de aminoácidos hidrófobos. Alternativamente, el dominio de anclaje a membrana puede contener aminoácidos modificados, por ejemplo, aminoácidos que están unidos a una cadena de ácido graso, que a su vez ancla la proteína a una membrana. [0077]The term “module” refers to a part of a protein that is physically or functionally differentiated from other portions of the protein or peptide. A module may comprise one or more domains. In general, a module or domain can be a single stable three-dimensional structure, regardless of size. The tertiary structure of a typical domain is stable in solution and remains the same whether such a member is isolated or covalently fused to other domains. A domain generally has a particular tertiary structure formed by spatial relationships of secondary structure elements, such as beta sheets, alpha helices, and unstructured loops. In domains of the microprotein family, disulfide bridges are generally the primary elements that determine the tertiary structure. In some cases, domains are modules that can confer specific functional activity, such as avidity (multiple binding sites for the same target), multispecificity (binding sites for different targets), half-life (using a domain, cyclic peptide or peptide linear) that binds to a serum protein such as human serum albumin (HSA) or to IgG (hIgG1, 2, 3 or 4) or to red blood cells. Functionally defined domains have distinct biological function(s). The ligand binding domain of a receptor is, for example, the domain that binds ligand. An antigen-binding domain refers to the part of an antigen-binding unit or an antibody that binds to the antigen. Functionally defined domains do not need to be encoded by contiguous amino acid sequences. Functionally defined domains may contain one or more physically defined domains. Receptors, for example, are generally divided into the extracellular ligand-binding domain, a transmembrane domain, and an intracellular effector domain. A “membrane anchoring domain” refers to the portion of a protein that mediates membrane association. Generally, the membrane anchoring domain is composed of hydrophobic amino acid residues. Alternatively, the membrane anchoring domain may contain modified amino acids, for example, amino acids that are linked to a fatty acid chain, which in turn anchors the protein to a membrane.

[0078]“Que no se produce naturalmente” como se aplica a una proteína significa que la proteína contiene al menos un aminoácido que es diferente de la proteína natural o nativa correspondiente. Pueden determinarse secuencias no naturales realizando búsqueda con BLAST usando, por ejemplo, la menor probabilidad de suma mínima en la que la ventana de comparación es la longitud de la secuencia de interés (la buscada) y cuando se compara con la base de datos no redundante (“nr”) de Genbank usando BLAST 2.0. El algoritmo BLAST 2.0, que se describe en Altschul y col. (1990) J. Mol. Biol. 215:403-410, respectivamente. El software para realizar análisis con BLAST está públicamente disponible del Centro nacional para información biotecnológica. [0078]“Not naturally occurring” as applied to a protein means that the protein contains at least one amino acid that is different from the corresponding natural or native protein. Unnatural sequences can be determined by searching with BLAST using, for example, the smallest probability of minimum sum in which the comparison window is the length of the sequence of interest (the searched one) and when compared to the non-redundant database (“nr”) from Genbank using BLAST 2.0. The BLAST 2.0 algorithm, described in Altschul et al. (1990) J. Mol. Biol. 215:403-410, respectively. Software for performing BLAST analysis is publicly available from the National Center for Biotechnology Information.

[0079]Una “célula huésped” incluye una célula individual o cultivo celular que puede ser o ha sido un receptor para los vectores objeto. Células huésped incluyen progenie de una única célula huésped. La progenie puede no ser necesariamente completamente idéntica (en morfología o en genómica del complemento de ADN total) a la célula parental original debido a mutación natural, accidental o intencionada. Una célula huésped incluye células transfectadasin vivocon un vector descrito en el presente documento. [0079]A “host cell” includes an individual cell or cell culture that may be or has been a recipient for the subject vectors. Host cells include progeny of a single host cell. The progeny may not necessarily be completely identical (in morphology or in genomics of the total DNA complement) to the original parental cell due to natural, accidental or intentional mutation. A host cell includes cells transfected in vivo with a vector described herein.

[0080]Como se usa en el presente documento, el término “aislado” significa separado de constituyentes, celulares y de otro modo, en los que el polinucleótido, péptido, polipéptido, proteína, anticuerpo, o fragmentos de los mismos, están normalmente asociados en la naturaleza. Como es evidente para aquellos expertos en la materia, un polinucleótido, péptido, polipéptido, proteína, anticuerpo, o fragmentos de los mismos, que no se produce naturalmente no requiere “aislamiento” para distinguirlo de su homólogo que se produce naturalmente. Además, un polinucleótido, péptido, polipéptido, proteína, anticuerpo, o fragmentos de los mismos, “concentrado”, “separado” o “diluido” es diferenciable de su homólogo que se produce naturalmente porque la concentración o número de moléculas por volumen es mayor que “concentrado” o inferior a “separado” que el de su homólogo que se produce naturalmente. [0080]As used herein, the term "isolated" means separated from constituents, cellular and otherwise, in which the polynucleotide, peptide, polypeptide, protein, antibody, or fragments thereof, are normally associated In nature. As is evident to those skilled in the art, a non-naturally occurring polynucleotide, peptide, polypeptide, protein, antibody, or fragments thereof does not require “isolation” to distinguish it from its naturally occurring counterpart. Furthermore, a “concentrated,” “separated,” or “diluted” polynucleotide, peptide, polypeptide, protein, antibody, or fragments thereof is differentiable from its naturally occurring counterpart because the concentration or number of molecules per volume is greater. than “concentrated” or lower than “separated” than its naturally occurring counterpart.

[0081]“Ligado” y “fusionado” o “fusión” se usan indistintamente en el presente documento. Estos términos se refieren a unir juntos dos o más elementos o componentes químicos, por cualquier medio que incluya conjugación química o medios recombinantes. Una “fusión en marco” se refiere a la unión de dos o más marcos de lectura abiertos (OFR) para formar un OFR más largo continuo, de un modo que mantenga el marco de lectura correcto de los OFR originales. Así, la proteína de fusión recombinante resultante es una proteína individual que contiene dos o más segmentos que se corresponden con polipéptidos codificados por los OFR originales (segmentos que normalmente no están así unidos en la naturaleza.) [0081]“Linked” and “fused” or “fusion” are used interchangeably herein. These terms refer to joining together two or more chemical elements or components, by any means including chemical conjugation or recombinant means. An “in-frame merge” refers to the joining of two or more open reading frames (OFRs) to form a longer continuous OFR, in a way that maintains the correct reading frame of the original OFRs. Thus, the resulting recombinant fusion protein is a single protein containing two or more segments that correspond to polypeptides encoded by the original OFRs (segments that are not normally so linked in nature.)

[0082]En el contexto de polipéptidos, una “secuencia lineal” o una “secuencia” es un orden de aminoácidos en un polipéptido en una dirección del extremo amino a carboxilo en la que los residuos que son vecinos entre sí en la secuencia son contiguos en la estructura primaria del polipéptido. Una “secuencia parcial” es una secuencia lineal de parte de un polipéptido que se sabe que comprende residuos adicionales en una o ambas direcciones. [0082]In the context of polypeptides, a “linear sequence” or “sequence” is an order of amino acids in a polypeptide in an amino- to carboxyl-terminal direction in which residues that are neighbors of each other in the sequence are contiguous. in the primary structure of the polypeptide. A “partial sequence” is a linear sequence of part of a polypeptide that is known to comprise additional residues in one or both directions.

[0083]“Heterólogo” significa derivado de una entidad genotípicamente distinta del resto de la entidad con la que está siendo comparada. Por ejemplo, una secuencia rica en glicina eliminada de su secuencia codificante nativa y operativamente ligada a una secuencia codificante distinta de la secuencia nativa es una secuencia rica en glicina heteróloga. El término “heterólogo” como se aplica a un polinucleótido, un polipéptido, significa que el polinucleótido o polipéptido se deriva de una entidad genotípicamente distinta de la del resto de la entidad con la que está siendo comparada. [0083]“Heterologous” means derived from an entity genotypically different from the rest of the entity with which it is being compared. For example, a glycine-rich sequence removed from its native coding sequence and operatively linked to a coding sequence other than the native sequence is a heterologous glycine-rich sequence. The term "heterologous" as applied to a polynucleotide, a polypeptide, means that the polynucleotide or polypeptide is derived from an entity genotypically different from that of the rest of the entity with which it is being compared.

[0084]Los términos “polinucleótidos”, “ácidos nucleicos”, “nucleótidos” y “oligonucleótidos” se usan indistintamente. Se refieren a una forma polimérica de nucleótidos de cualquier longitud, tanto desoxirribonucleótidos como ribonucleótidos, o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional, y pueden realizar cualquier función, conocida o desconocida. Lo siguiente son ejemplos no limitantes de polinucleótidos: regiones codificantes o no codificantes de un gen o fragmento de gen, loci (locus) definidos del análisis de enlace, exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ribozimas, ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácido nucleico y cebadores. Un polinucleótido puede comprender nucleótidos modificados, tales como nucleótidos metilados y análogos de nucleótidos. Si están presentes, las modificaciones a la estructura del nucleótido pueden conferirse antes o después del ensamblaje del polímero. La secuencia de nucleótidos puede interrumpirse por componentes de no nucleótido. Un polinucleótido puede modificarse adicionalmente después de la polimerización, tal como por conjugación con un componente de marca. [0084]The terms “polynucleotides”, “nucleic acids”, “nucleotides” and “oligonucleotides” are used interchangeably. They refer to a polymeric form of nucleotides of any length, both deoxyribonucleotides and ribonucleotides, or analogues thereof. Polynucleotides can have any three-dimensional structure, and can perform any function, known or unknown. The following are non-limiting examples of polynucleotides: coding or non-coding regions of a gene or gene fragment, loci defined from linkage analysis, exons, introns, messenger RNA (mRNA), transfer RNA, ribosomal RNA, ribozymes , cDNA, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, DNA isolated from any sequence, RNA isolated from any sequence, nucleic acid probes and primers. A polynucleotide may comprise modified nucleotides, such as methylated nucleotides and nucleotide analogs. If present, modifications to the nucleotide structure may be conferred before or after polymer assembly. The nucleotide sequence can be interrupted by non-nucleotide components. A polynucleotide may be further modified after polymerization, such as by conjugation with a label component.

[0085]“Recombinante” como se aplica a un polinucleótido significa que el polinucleótido es el producto de diversas combinaciones de etapas de clonación, restricción y/o ligación, y otros procedimientos que producen una construcción que es distinta de un polinucleótido encontrado en la naturaleza. [0085]“Recombinant” as applied to a polynucleotide means that the polynucleotide is the product of various combinations of cloning, restriction and/or ligation steps, and other procedures that produce a construct that is distinct from a polynucleotide found in nature. .

[0086]Los términos “gen” o “fragmento génico” se usan indistintamente en el presente documento. Se refieren a un polinucleótido que contiene al menos un marco de lectura abierto que puede codificar una proteína particular después de ser transcrita y traducida. Un gen o fragmento génico puede ser ADN genómico o ADNc, en tanto que el polinucleótido contenga al menos un marco de lectura abierto que pueda cubrir la región codificante entera o un segmento de la misma. Un “gen de fusión” es un gen compuesto por al menos dos polinucleótidos heterólogos que están ligados juntos. [0086]The terms “gene” or “gene fragment” are used interchangeably herein. They refer to a polynucleotide that contains at least one open reading frame that can encode a particular protein after being transcribed and translated. A gene or gene fragment may be genomic DNA or cDNA, as long as the polynucleotide contains at least one open reading frame that can cover the entire coding region or a segment thereof. A “fusion gene” is a gene composed of at least two heterologous polynucleotides that are linked together.

[0087]Un “vector” es una molécula de ácido nucleico, preferentemente auto-replicante, que transfiere una molécula de ácido nucleico insertada en y/o entre células huésped. El término incluye vectores que funcionan principalmente para la inserción de ADN o ARN en una célula, replicación de vectores que funcionan principalmente para la replicación de ADN o ARN y vectores de expresión que funcionan para la transcripción y/o traducción del ADN o ARN. También se incluyen vectores que proporcionan más de una de las funciones anteriores. Un “vector de expresión” es un polinucleótido que, cuando se introduce en una célula huésped apropiada, puede transcribirse y traducirse en un polipéptido(s). Un “sistema de expresión” normalmente connota una célula huésped adecuada que comprende un vector de expresión que puede funcionar para dar un producto de expresión deseado. [0087]A “vector” is a nucleic acid molecule, preferably self-replicating, that transfers an inserted nucleic acid molecule into and/or between host cells. The term includes vectors that function primarily for the insertion of DNA or RNA into a cell, replication vectors that function primarily for the replication of DNA or RNA, and expression vectors that function for transcription and/or translation of the DNA or RNA. Vectors that provide more than one of the above functions are also included. An “expression vector” is a polynucleotide that, when introduced into an appropriate host cell, can be transcribed and translated into a polypeptide(s). An “expression system” typically connotes a suitable host cell comprising an expression vector that can function to give a desired expression product.

[0088]La “diana” como se usa en el contexto de MURP es una molécula o estructura bioquímica con la que el módulo de unión o el módulo de unión ligado a URP puede unirse y en la que el acontecimiento de unión produce una actividad biológica deseada. La diana puede ser un ligando de proteína o receptor que es inhibido, activado o que actúa de otro modo por la proteína. Ejemplos de dianas son hormonas, citocinas, anticuerpos o fragmentos de anticuerpos, receptores de la superficie celular, cinasas, factores de crecimiento y otras estructuras bioquímicas con actividad biológica. [0088]The “target” as used in the context of MURP is a molecule or biochemical structure with which the binding module or the URP-linked binding module can bind and in which the binding event produces a biological activity desired. The target may be a protein ligand or receptor that is inhibited, activated or otherwise acted upon by the protein. Examples of targets are hormones, cytokines, antibodies or antibody fragments, cell surface receptors, kinases, growth factors and other biochemical structures with biological activity.

[0089] Un “módulo funcional” puede ser cualquier no URP en un producto de proteína. Así, un módulo funcional puede ser un módulo de unión (BM), un módulo efector (EM), un módulo de multimerización (MM), un módulo del extremo C (CM) o un módulo del extremo N (NM). En general, los módulos funcionales se caracterizan por un alto contenido de información de su secuencia de aminoácidos, es decir, contienen muchos aminoácidos diferentes y muchos de estos aminoácidos son importantes para la función de un módulo funcional. Un módulo funcional normalmente tiene estructura secundaria y terciaria, puede ser un dominio de proteína plegada y puede contener 1, 2, 3, 4, 5 o más enlaces disulfuro. [0089] A “functional module” can be any non-URP in a protein product. Thus, a functional module can be a binding module (BM), an effector module (EM), a multimerization module (MM), a C-terminal module (CM) or an N-terminal module (NM). In general, functional modules are characterized by a high information content of their amino acid sequence, that is, they contain many different amino acids and many of these amino acids are important for the function of a functional module. A functional module typically has secondary and tertiary structure, may be a folded protein domain, and may contain 1, 2, 3, 4, 5, or more disulfide bonds.

[0090] El término 'microproteínas' se refiere a una clasificación en la base de datos SCOP. Las microproteínas son normalmente las proteínas más pequeñas con una estructura fija y normalmente, pero no exclusivamente, tienen tan solo 15 aminoácidos con dos disulfuros o hasta 200 aminoácidos con más de diez disulfuros. Una microproteína puede contener uno o más dominios de microproteína. Algunos dominios de microproteína o familias de dominios pueden tener múltiples estructuras más o menos estables y múltiples estructuras más o menos similares que son conferidas por diferentes patrones de enlace disulfuro, así el término estable se usa de una forma relativa para diferenciar microproteínas de péptidos y dominios de no microproteína. La mayoría de las toxinas de microproteína están compuestas de un único dominio, pero las microproteínas del receptor de la superficie de la célula frecuentemente tienen múltiples dominios. Las microproteínas pueden ser tan pequeñas debido a que su plegamiento se estabiliza tanto por enlaces disulfuro como por iones tales como calcio, magnesio, manganeso, cobre, cinc, hierro, o una variedad de otros iones multivalentes, en lugar de estabilizarse por el núcleo hidrófobo típico. [0090] The term 'microproteins' refers to a classification in the SCOP database. Microproteins are typically the smallest proteins with a fixed structure and typically, but not exclusively, have as few as 15 amino acids with two disulfides or up to 200 amino acids with more than ten disulfides. A microprotein may contain one or more microprotein domains. Some microprotein domains or families of domains may have multiple more or less stable structures and multiple more or less similar structures that are conferred by different disulfide bond patterns, so the term stable is used in a relative way to differentiate microproteins from peptides and domains. of non-microprotein. Most microprotein toxins are composed of a single domain, but cell surface receptor microproteins frequently have multiple domains. Microproteins can be so small because their folding is stabilized by both disulfide bonds and ions such as calcium, magnesium, manganese, copper, zinc, iron, or a variety of other multivalent ions, rather than by the hydrophobic core. typical.

[0091] El término “andamiaje” se refiere a la 'región estructural' o 'motivo de secuencia' de polipéptidos mínimo que se usa como secuencia común conservada en la construcción de bibliotecas de proteínas. Entre los residuos/posiciones fijos o conservados del andamiaje se encuentran posiciones variables e hipervariables. Se proporciona una diversidad de aminoácidos en las regiones variables entre los residuos de andamiaje fijos para proporcionar la unión específica a una molécula diana. Un andamiaje se define normalmente por los residuos conservados que se observan en un alineamiento de una familia de proteínas relacionadas con la secuencia. Los residuos fijos pueden requerirse para plegamiento o estructura, especialmente si las funciones de las proteínas alineadas son diferentes. Una descripción completa de un andamiaje de microproteína puede incluir el número, posición o separación y patrón de unión de las cisteínas, además de posición e identidad de cualquier residuo fijo en los bucles, que incluyen sitios de unión para iones tales como calcio. [0091] The term “scaffold” refers to the minimal polypeptide 'structural region' or 'sequence motif' that is used as a common conserved sequence in the construction of protein libraries. Among the fixed or conserved residues/positions of the scaffold are variable and hypervariable positions. A variety of amino acids are provided in the variable regions between the fixed scaffold residues to provide specific binding to a target molecule. A scaffold is typically defined by the conserved residues observed in an alignment of a family of sequence-related proteins. Fixed residues may be required for folding or structure, especially if the functions of the aligned proteins are different. A complete description of a microprotein scaffold may include the number, position or spacing, and binding pattern of the cysteines, as well as the position and identity of any fixed residues in the loops, including binding sites for ions such as calcium.

[0092] El “pliegue” de una microproteína se define ampliamente por el patrón de enlace de los enlaces disulfuro (es decir, 1-4, 2-6, 3-5). Este patrón es una constante topológica y generalmente no es flexible a conversión en otro patrón sin no ligar y religar los disulfuros tales como mediante reducción y oxidación (agentes rédox). En general, proteínas naturales con secuencias relacionadas adoptan los mismos patrones de enlace disulfuro. Los principales determinantes son el patrón de distancia de cisteína (CDP) y algunos residuos no cis fijos, además de un sitio de unión a metal, si está presente. En algunos casos, el plegamiento de proteínas también está influido por las secuencias de alrededor (es decir, pro-péptidos) y en algunos casos por derivatización química (por ejemplo, gamma-carboxilación) de residuos que permiten que la proteína se una a iones metálicos divalentes (es decir, Ca++) que ayuda en su plegamiento. Para la gran mayoría de las microproteínas no se requiere tal ayuda en el plegamiento. [0092] The “fold” of a microprotein is broadly defined by the bonding pattern of the disulfide bonds (i.e., 1-4, 2-6, 3-5). This pattern is a topological constant and is generally not flexible to conversion into another pattern without unbinding and religating the disulfides such as through reduction and oxidation (redox agents). In general, natural proteins with related sequences adopt the same disulfide bond patterns. The main determinants are the cysteine distance pattern (CDP) and some fixed non-cis residues, as well as a metal binding site, if present. In some cases, protein folding is also influenced by surrounding sequences (i.e., pro-peptides) and in some cases by chemical derivatization (e.g., gamma-carboxylation) of residues that allow the protein to bind ions. divalent metals (i.e. Ca++) that helps in their folding. For the vast majority of microproteins, no such assistance in folding is required.

[0093] Sin embargo, proteínas con el mismo patrón de unión pueden todavía comprender múltiples pliegues, basándose en diferencias en la longitud y composición de los bucles que son suficientemente grandes para que la proteína dé una estructura bastante diferente. Un ejemplo son las familias de dominios de conotoxina, ciclotoxina y anato que tienen el mismo DBP, pero un CDP muy diferente, y se considera que son plegamientos diferentes. Determinantes de un pliegue de proteína son cualquier atributo que altere enormemente la estructura con respecto a un pliegue diferente, tal como el número y patrón de unión de las cisteínas, la separación de las cisteínas, diferencias en los motivos de secuencia de los bucles entre cisteínas (especialmente residuos de bucle fijos que es probable que se necesiten para el plegamiento, o en la localización o composición del sitio de unión a calcio (u otro metal o co-factor). [0093] However, proteins with the same binding pattern may still comprise multiple folds, based on differences in the length and composition of the loops that are large enough for the protein to give a quite different structure. An example is the conotoxin, cyclotoxin, and annatto domain families that have the same DBP, but a very different CDP, and are considered to be different folds. Determinants of a protein fold are any attribute that greatly alters the structure with respect to a different fold, such as the number and binding pattern of cysteines, the spacing of cysteines, differences in the sequence motifs of loops between cysteines (especially fixed loop residues that are likely to be needed for folding, or in the location or composition of the calcium (or other metal or co-factor) binding site.

[0094] El término “patrón de enlaces disulfuro” o “DBP” se refiere al patrón de enlace de las cisteínas, que están numeradas 1-n del extremo N con respecto al extremo C de la proteína. Los patrones de enlaces disulfuro son topológicamente constantes, que significa que solo pueden cambiarse no ligando uno o más disulfuros tales como usando condiciones rédox. Los posibles patrones de 2, 3 y 4 enlaces disulfuro se enumeran más adelante en los párrafos 0048-0075. [0094] The term “disulfide bond pattern” or “DBP” refers to the bonding pattern of cysteines, which are numbered 1-n from the N terminus to the C terminus of the protein. The disulfide bond patterns are topologically constant, which means that they can only be changed by not binding one or more disulfides such as using redox conditions. Possible patterns of 2, 3, and 4 disulfide bonds are listed below in paragraphs 0048-0075.

[0095]El término “patrón de distancia de cisternas” o “CDP” se refiere al número de aminoácidos de no cisteína que separa las cisteínas sobre una cadena de proteína lineal. Se usan varias notaciones: C5C0C3C igual a C5CC3C igual a CxxxxxCCxxxC. [0095]The term “cysteine distance pattern” or “CDP” refers to the number of non-cysteine amino acids that separate cysteines on a linear protein chain. Various notations are used: C5C0C3C equals C5CC3C equals CxxxxxCCxxxC.

[0096]El término 'Posición n6' o 'n7=4' se refiere a los bucles entre cisteínas y 'n6' se define como el bucle entre C6 y C7; 'n7=4' significa el bucle entre C7 y C8 tiene 4 aminoácidos de longitud, sin contar las cisteínas [0096]The term 'Position n6' or 'n7=4' refers to the loops between cysteines and 'n6' is defined as the loop between C6 and C7; 'n7=4' means the loop between C7 and C8 is 4 amino acids long, not counting cysteines

[0097]Resistencia a la degradación en suero - Las proteínas pueden eliminarse por degradación en la sangre, que normalmente implica proteasas en el suero o plasma. La resistencia a la degradación en suero se mide combinando la proteína con suero o plasma humano (o ratón, rata, mono, según sea apropiado), normalmente durante un intervalo de días (es decir, 0,25, 0,5, 1, 2, 4, 8, 16 días) a 37 °C. Las muestras para estos momentos de tiempo se ejecutan entonces sobre un ensayo Western y la proteína se detecta con un anticuerpo. El anticuerpo puede ser una marca en la proteína. Si la proteína muestra una única banda sobre Western, en la que el tamaño de la proteína es idéntico al de la proteína inyectada, entonces no se ha producido degradación. El momento de tiempo al que el 50% de la proteína se degrada, como se juzga por Western, es la semivida de degradación en suero de la proteína [0097]Resistance to degradation in serum - Proteins can be removed by degradation in the blood, which usually involves proteases in serum or plasma. Resistance to degradation in serum is measured by combining the protein with human (or mouse, rat, monkey, as appropriate) serum or plasma, typically over a range of days (i.e., 0.25, 0.5, 1, 2, 4, 8, 16 days) at 37 °C. Samples for these time points are then run on a Western assay and the protein is detected with an antibody. The antibody can be a mark on the protein. If the protein shows a single band on Western, in which the size of the protein is identical to that of the injected protein, then no degradation has occurred. The time point at which 50% of the protein is degraded, as judged by Western, is the serum degradation half-life of the protein.

[0098]Unión a proteína del suero - Mientras que la MURP tiene normalmente varios módulos que se unen a dianas de la superficie de la célula y/o proteínas del suero, se desea que el URP carezca sustancialmente de actividades involuntarias. El URP debe diseñarse para minimizar evitar la interacción con (unión a) proteínas del suero, que incluyen anticuerpos. Pueden cribarse diferentes diseños de URP para la unión a proteínas del suero por ELISA, inmovilizando las proteínas del suero y luego añadiendo el URP, incubando, lavando y luego detectando la cantidad de URP unido. Un enfoque es detectar el URP usando un anticuerpo que reconoce una marca que se ha unido a URP. Un enfoque diferente es inmovilizar el URP (tal como mediante una fusión con GFP) y ponerlo en contacto con suero humano, incubando, lavando y luego detectando la cantidad de anticuerpos humanos que siguen unidos al URP usando anticuerpos secundarios como de cabra dirigido contra IgG humana. Usando estos enfoques, los presentes inventores han diseñado sus URP que muestran niveles muy bajos de unión a proteínas del suero. Sin embargo, en algunas aplicaciones se desea la unión a proteínas del suero o proteínas expuestas al suero, por ejemplo, debido a que puede prologar adicionalmente la semivida de secreción. En tales casos, pueden usarse estos mismos ensayos para diseñar URP que se unen a proteínas del suero o proteínas expuestas al suero tales como HSA o IgG. En otros casos, las MURP puedes ser módulos de unión dados que contienen péptidos que han sido diseñados para unirse a proteínas del suero o proteínas expuestas al suero tales como HSA o IgG. [0098]Whey Protein Binding - While MURP typically has several modules that bind to cell surface targets and/or serum proteins, it is desired that URP be substantially devoid of unintended activities. The URP should be designed to minimize interaction with (binding to) serum proteins, including antibodies. Different URP designs can be screened for binding to serum proteins by ELISA, by immobilizing the serum proteins and then adding the URP, incubating, washing, and then detecting the amount of bound URP. One approach is to detect the URP using an antibody that recognizes a tag that has been bound to URP. A different approach is to immobilize the URP (such as by fusion with GFP) and contact it with human serum, incubating, washing, and then detecting the amount of human antibodies still bound to the URP using secondary antibodies such as goat directed against human IgG. . Using these approaches, the present inventors have designed their URPs that show very low levels of binding to serum proteins. However, in some applications binding to serum proteins or proteins exposed to serum is desired, for example, because it may further prolong the secretion half-life. In such cases, these same assays can be used to design URPs that bind to serum proteins or serum-exposed proteins such as HSA or IgG. In other cases, MURPs may be given binding modules containing peptides that have been designed to bind serum proteins or serum-exposed proteins such as HSA or IgG.

Polímeros recombinantes no estructurados (URP):Unstructured recombinant polymers (URP):

[0099]La presente memoria descriptiva describe el diseño de polímeros recombinantes no estructurados (URP). Los URP objeto son particularmente útiles para generar proteínas recombinantes de valor terapéutico y/o diagnóstico. Los URP objeto presentan una o más de las siguientes características. [0099]This specification describes the design of unstructured recombinant polymers (URP). The subject URPs are particularly useful for generating recombinant proteins of therapeutic and/or diagnostic value. Object URPs have one or more of the following characteristics.

[0100]Los URP objeto comprenden secuencias de aminoácidos que normalmente comparten características comunes con secuencias de péptidos desnaturalizadas bajo condiciones fisiológicas. Las secuencias de URP normalmente se comportan como secuencias de péptidos desnaturalizadas bajo condiciones fisiológicas. Las secuencias de URP carecen de estructuras secundarias y terciarias bien definidas bajo condiciones fisiológicas. Se ha establecido una variedad de procedimientos en la técnica para determinar las estructuras secundarias y terciarias de un polipéptido dado. Por ejemplo, la estructura secundaria de un polipéptido puede determinarse por espectroscopía de CD en la región espectral “UV lejana” (190-250 nm). Las estructuras de hélice alfa, hoja beta y de bobina al azar dan cada una lugar a una forma y magnitud característica de espectros de CD. La estructura secundaria también puede determinarse mediante ciertos programas informáticos o algoritmos tales como el algoritmo de Chou-Fasman (Chou, P. Y. y col. (1974) Biochemistry, 13: 222-45). Para una secuencia de URP dada, el algoritmo puede predecir si existe o no alguna estructura secundaria o absolutamente ninguna estructura secundaria. En general, las secuencias de URP tendrán espectros que se asemejan a proteínas desnaturalizadas debido a su bajo grado de estructura secundaria y terciaria. Si se desea, las secuencias de URP pueden diseñarse para tener conformaciones predominantemente desnaturalizadas bajo condiciones fisiológicas. Las secuencias de URP normalmente tienen un alto grado de flexibilidad conformacional bajo condiciones fisiológicas y tienden a tener grandes radios hidrodinámicos (radio de Stokes) en comparación con proteínas globulares de peso molecular similar. Como se usa en el presente documento, condiciones fisiológicas se refiere a un conjunto de condiciones que incluyen temperatura, concentración de sales, pH que imitan a aquellas condiciones de un sujeto vivo. Se han establecido una multitud de condiciones fisiológicamente relevantes para su uso en ensayosin vitro. Generalmente, un tampón fisiológico contiene una concentración fisiológica de sal y ajustado a un pH neutro que oscila de aproximadamente 6,5 a aproximadamente 7,8, y preferentemente de aproximadamente 7,0 a aproximadamente 7,5. Una variedad de tampones fisiológicos se enumera en Sambrook y col. (1989), arriba, y de ahí que no se detalle en el presente documento. La temperatura fisiológicamente relevante oscila de aproximadamente 25 °C a aproximadamente 38 °C, y preferentemente de aproximadamente 30 °C a aproximadamente 37 °C. [0100]The subject URPs comprise amino acid sequences that typically share common characteristics with peptide sequences denatured under physiological conditions. URP sequences normally behave like denatured peptide sequences under physiological conditions. URP sequences lack well-defined secondary and tertiary structures under physiological conditions. A variety of procedures have been established in the art to determine the secondary and tertiary structures of a given polypeptide. For example, the secondary structure of a polypeptide can be determined by CD spectroscopy in the “far UV” spectral region (190-250 nm). The alpha helix, beta sheet, and random coil structures each give rise to a characteristic shape and magnitude of CD spectra. Secondary structure can also be determined by certain computer programs or algorithms such as the Chou-Fasman algorithm (Chou, P. Y. et al. (1974) Biochemistry, 13: 222-45). For a given URP sequence, the algorithm can predict whether or not there is any secondary structure or absolutely no secondary structure. In general, URP sequences will have spectra that resemble denatured proteins due to their low degree of secondary and tertiary structure. If desired, URP sequences can be designed to have predominantly denatured conformations under physiological conditions. URP sequences typically have a high degree of conformational flexibility under physiological conditions and tend to have large hydrodynamic radii (Stokes radius) compared to globular proteins of similar molecular weight. As used herein, physiological conditions refers to a set of conditions including temperature, salt concentration, pH that mimic those conditions of a living subject. A multitude of physiologically relevant conditions have been established for use in in vitro assays. Generally, a physiological buffer contains a physiological concentration of salt and adjusted to a neutral pH ranging from about 6.5 to about 7.8, and preferably from about 7.0 to about 7.5. A variety of physiological tampons are listed in Sambrook et al. (1989), above, and hence is not detailed in this document. The physiologically relevant temperature ranges from about 25°C to about 38°C, and preferably from about 30°C to about 37°C.

[0101]Los URP objeto pueden ser secuencias con baja inmunogenicidad. La baja inmunogenicidad puede ser un resultado directo de la flexibilidad conformacional de las secuencias de URP. Muchos anticuerpos reconocen los llamados epítopes conformacionales en antígenos de proteína. Los epítopes conformacionales están formado por regiones de la superficie de la proteína que están compuestas de múltiples secuencias de aminoácidos discontinuas del antígeno de proteína. El plegamiento preciso de la proteína lleva a estas secuencias a una configuración especial bien definida que puede ser reconocida por anticuerpos. Los URP preferidos se diseñan para evitar la formación de epítopes conformacionales. Por ejemplo, son de particular interés secuencias de URP que tienen una baja tendencia a adaptarse a conformaciones compactamente plegadas en disolución acuosa. En particular, la baja inmunogenicidad puede lograrse eligiendo secuencias que resisten al procesamiento de antígenos en células presentadoras de antígeno, eligiendo secuencias que no se unen a bien MHC y/o eligiendo secuencias que se derivan de secuencias humanas. [0101]The target URPs may be sequences with low immunogenicity. The low immunogenicity may be a direct result of the conformational flexibility of the URP sequences. Many antibodies recognize so-called conformational epitopes on protein antigens. Conformational epitopes are formed by regions of the protein surface that are composed of multiple discontinuous amino acid sequences of the protein antigen. The precise folding of the protein brings these sequences into a special well-defined configuration that can be recognized by antibodies. Preferred URPs are designed to avoid the formation of conformational epitopes. For example, of particular interest are URP sequences that have a low tendency to adapt to compactly folded conformations in aqueous solution. In particular, low immunogenicity can be achieved by choosing sequences that resist antigen processing in antigen-presenting cells, by choosing sequences that do not bind MHC well, and/or by choosing sequences that are derived from human sequences.

[0102]Los URP objeto pueden ser secuencias con un alto grado de resistencia a proteasas. La resistencia a proteasas también puede ser un resultado de la flexibilidad conformacional de las secuencias de URP. La resistencia a proteasas puede diseñarse evitando sitios de reconocimiento de proteasas conocidos. Alternativamente, las secuencias resistentes a proteasas pueden seleccionarse por visualización de fago o técnicas relacionadas de bibliotecas de secuencias aleatorias o semialeatorias. Si se desea para aplicaciones especiales, tales como liberación lenta de una preparación de proteína de liberación controlada, pueden construirse sitios de escisión por proteasas del suero en un URP. Son de particular interés secuencias de URP con alta estabilidad (por ejemplo, larga semivida en suero, menos propensas a la escisión por proteasas presentes en fluido corporal) en sangre. [0102]The target URPs may be sequences with a high degree of protease resistance. Protease resistance may also be a result of conformational flexibility of URP sequences. Protease resistance can be engineered by avoiding known protease recognition sites. Alternatively, protease-resistant sequences can be selected by phage display or related techniques from libraries of random or semi-random sequences. If desired for special applications, such as slow release of a controlled release protein preparation, serum protease cleavage sites can be constructed in a URP. Of particular interest are URP sequences with high stability (e.g., long half-life in serum, less prone to cleavage by proteases present in body fluid) in blood.

[0103]El URP objeto también puede caracterizarse por el efecto por el cual tras su la incorporación en una proteína, la proteína presenta una semivida en suero prolongada y/o mayor solubilidad con respecto a la proteína correspondiente que es deficiente en URP. [En la técnica se conocen procedimientos de determinación de la semivida en suero (véase, por ejemplo, Alvarez, P. y col. (2004) J Biol Chem, 279: 3375-81). Puede determinarse fácilmente si la proteína resultante tiene una semivida en suero prolongada con respecto a la proteína sin modificar poniendo en práctica cualquier procedimiento disponible en la materia o ejemplificado en el presente documento. [0103]The subject URP can also be characterized by the effect whereby after incorporation into a protein, the protein has a prolonged serum half-life and/or greater solubility with respect to the corresponding protein that is deficient in URP. [Methods for determining serum half-life are known in the art (see, for example, Alvarez, P. et al. (2004) J Biol Chem, 279: 3375-81). Whether the resulting protein has a prolonged serum half-life relative to the unmodified protein can be readily determined by practicing any procedure available in the art or exemplified herein.

[0104]El URP objeto puede ser de cualquier longitud necesaria para efectuar (a) la extensión de la semivida en suero de una proteína que comprende el URP; pws. opcionalmente (b) un aumento en la solubilidad de la proteína resultante; (c) una elevada resistencia a proteasas; y/o (d) una inmunogenicidad reducida de la proteína resultante que comprende el URP. El URP objeto tiene aproximadamente 200, 300, 400 o más aminoácidos contiguos. Cuando se incorpora en una proteína, el URP puede fragmentarse de forma que la proteína resultante contenga múltiples URP, o múltiples fragmentos de URP. [0104]The subject URP may be of any length necessary to effect (a) extension of the serum half-life of a protein comprising the URP; pws. optionally (b) an increase in the solubility of the resulting protein; (c) high resistance to proteases; and/or (d) a reduced immunogenicity of the resulting protein comprising the URP. The subject URP has approximately 200, 300, 400 or more contiguous amino acids. When incorporated into a protein, the URP can be fragmented so that the resulting protein contains multiple URPs, or multiple fragments of URPs.

[0105]El URP puede tener un punto isoeléctrico (pl) de 1,0, 1,5, 2,0, 2,5, 3,0, 3,5, 4,0, 4,5, 5,0, 5,5, 6,0, 6,5, 7,0, 7,5, 8,0, 8,5, 9,0, 9,5, 10,0, 10,5, 11,0, 11,5, 12,0, 12,5 o incluso 13,0. [0105]The URP may have an isoelectric point (pl) of 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5, 5.0, 5.5, 6.0, 6.5, 7.0, 7.5, 8.0, 8.5, 9.0, 9.5, 10.0, 10.5, 11.0, 11, 5, 12.0, 12.5 or even 13.0.

[0106]En general, las secuencias de URP son ricas en aminoácidos hidrófilos y contienen un bajo porcentaje de aminoácidos hidrófobos o aromáticos. Residuos hidrófilos adecuados incluyen, pero no se limitan a, glicina, serina, aspartato, glutamato, lisina, arginina y treonina. Los residuos hidrófobos que son menos favorecidos en la construcción de URP incluyen triptófano, fenilalanina, tirosina, leucina, isoleucina, valina y metionina. Las secuencias de URP pueden ser ricas en glicina, pero las secuencias de URP también pueden ser ricas en los aminoácidos glutamato, aspartato, serina, treonina, alanina o prolina. Así, el aminoácido predominante puede ser G, E, D, S, T, A o P. La inclusión de residuos de prolina tiende a reducir la sensibilidad a degradación proteolítica. [0106]In general, URP sequences are rich in hydrophilic amino acids and contain a low percentage of hydrophobic or aromatic amino acids. Suitable hydrophilic residues include, but are not limited to, glycine, serine, aspartate, glutamate, lysine, arginine and threonine. Hydrophobic residues that are less favored in URP construction include tryptophan, phenylalanine, tyrosine, leucine, isoleucine, valine, and methionine. URP sequences can be rich in glycine, but URP sequences can also be rich in the amino acids glutamate, aspartate, serine, threonine, alanine or proline. Thus, the predominant amino acid can be G, E, D, S, T, A or P. The inclusion of proline residues tends to reduce sensitivity to proteolytic degradation.

[0107]La inclusión de residuos hidrófilos normalmente aumenta la solubilidad de URP en agua y medios acuosos bajo condiciones fisiológicas. Como resultado de su composición de aminoácidos, las secuencias de URP tienen una baja tendencia a formar agregados en formulaciones acuosas y la fusión de secuencias de URP a otras proteínas o péptidos tiende a potenciar su solubilidad y reducir su tendencia a formar agregados, que es un mecanismo separado para reducir la inmunogenicidad. [0107]The inclusion of hydrophilic residues normally increases the solubility of URP in water and aqueous media under physiological conditions. As a result of their amino acid composition, URP sequences have a low tendency to form aggregates in aqueous formulations and the fusion of URP sequences to other proteins or peptides tends to enhance their solubility and reduce their tendency to form aggregates, which is a separate mechanism to reduce immunogenicity.

[0108]Las secuencias de URP pueden diseñarse para evitar que ciertos aminoácidos confieran propiedades no deseables a la proteína. Por ejemplo, pueden diseñarse secuencias de URP que contengan pocos o ninguno de los siguientes aminoácidos: cisteína (para evitar la formación y oxidación de disulfuro), metionina (para evitar la oxidación), asparagina y glutamina (para evitar la desamidación). [0108]URP sequences can be designed to prevent certain amino acids from conferring undesirable properties to the protein. For example, URP sequences can be designed that contain few or none of the following amino acids: cysteine (to prevent disulfide formation and oxidation), methionine (to prevent oxidation), asparagine, and glutamine (to prevent deamidation).

URP ricos en glicina:URP rich in glycine:

[0109]En una realización, el URP objeto comprende una secuencia rica en glicina (GRS). Por ejemplo, la glicina puede estar presente predominantemente de forma que sean los residuos más prevalentes presentes en la secuencia de interés. En otro ejemplo, las secuencias de URP pueden diseñarse de forma que los residuos de glicina constituyan al menos aproximadamente el 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100% de los aminoácidos totales. Los URP también puede contener el 100% de glicinas. En otro ejemplo más, los URP contienen al menos 30% de glicina y la concentración total de triptófano, fenilalanina, tirosina, valina, leucina e isoleucina es entonces menos del 20%. En otro ejemplo adicional, los URP contienen al menos 40% de glicina y la concentración total de triptófano, fenilalanina, tirosina, valina, leucina e isoleucina es entonces menos del 10%. En todavía otro ejemplo, los URP contienen al menos aproximadamente 50% de glicina y la concentración total de triptófano, fenilalanina, tirosina, valina, leucina e isoleucina es entonces menos del 5%. [0109]In one embodiment, the subject URP comprises a glycine-rich sequence (GRS). For example, glycine may be predominantly present such that they are the most prevalent residues present in the sequence of interest. In another example, the URP sequences can be designed so that glycine residues constitute at least about 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75 %, 80%, 85%, 90%, 95%, 100% of total amino acids. URP can also contain 100% glycines. In yet another example, URPs contain at least 30% glycine and the total concentration of tryptophan, phenylalanine, tyrosine, valine, leucine and isoleucine is then less than 20%. In another further example, URPs contain at least 40% glycine and the total concentration of tryptophan, phenylalanine, tyrosine, valine, leucine and isoleucine is then less than 10%. In yet another example, URPs contain at least about 50% glycine and the total concentration of tryptophan, phenylalanine, tyrosine, valine, leucine and isoleucine is then less than 5%.

[0110]La longitud de GRS pueden variar entre aproximadamente 5 aminoácidos y 200 aminoácidos o más. Por ejemplo, la longitud de un GRS contiguo individual puede contener 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 240, 280, 320 ó 400 o más aminoácidos. La GRS puede comprender residuos de glicina en ambos extremos. [0110]The length of GRS can vary between about 5 amino acids and 200 amino acids or more. For example, the length of an individual contiguous GRS may contain 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 70, 80, 90,100, 120, 140, 160, 180, 200, 240, 280, 320 or 400 or more amino acids. The GRS may comprise glycine residues at both ends.

[0111]La GRS también puede tener un contenido significativo de otros aminoácidos, por ejemplo, Ser, Thr, Ala o Pro. La GRS puede contener una fracción significativa de aminoácidos negativamente cargados que incluyen, pero no se limitan a, Asp y Glu. La GRS puede contener una fracción significativa de aminoácidos positivamente cargados que incluyen, pero no se limitan a, Arg o Lys. Si se desea, los URP pueden diseñarse para contener solo un único tipo de aminoácido (es decir, Gly o Glu), algunas veces solo algunos tipos de aminoácidos, por ejemplo, dos a cinco tipos de aminoácidos (por ejemplo, seleccionados de G, E, D, S, T, A y P), a diferencia de proteínas típicas y ligadores típicos que generalmente están compuestos de la mayoría de los veinte tipos de aminoácidos. Los URP pueden contener residuos negativamente cargados (Asp, Glu) en el 30, 25, 20, 15, 12, 10, 9, 8, 7, 6, 5, 4, 3, 2 o el 1 por ciento de las posiciones de aminoácidos. [0111]GRS may also have a significant content of other amino acids, for example, Ser, Thr, Ala or Pro. GRS may contain a significant fraction of negatively charged amino acids including, but not limited to, Asp and Glu. The GRS may contain a significant fraction of positively charged amino acids including, but not limited to, Arg or Lys. If desired, URPs can be designed to contain only a single type of amino acid (i.e., Gly or Glu), sometimes only a few types of amino acids, for example, two to five types of amino acids (e.g., selected from G, E, D, S, T, A and P), unlike typical proteins and typical linkers which are generally composed of most of the twenty types of amino acids. URPs can contain negatively charged residues (Asp, Glu) at 30, 25, 20, 15, 12, 10, 9, 8, 7, 6, 5, 4, 3, 2, or 1 percent of the positions. amino acids.

[0112]Los URP que contienen GRS son de particular interés debido a, en parte, la elevada libertad conformacional de los péptidos que contienen glicina. Los péptidos desnaturalizados en disolución tienen un alto grado de libertad conformacional. La mayor parte de esa libertad conformacional se pierde tras la unión de dichos péptidos a una diana como un receptor, un anticuerpo o una proteasa. Esta pérdida de entropía necesita compensarse por la energía de interacción entre el péptido y su diana. El grado de libertad conformacional de un péptido desnaturalizado depende de sus secuencias de aminoácidos. Los péptidos que contienen muchos aminoácidos con cadenas laterales pequeñas tienden a tener más libertad conformacional que los péptidos que están compuestos de aminoácidos con cadenas laterales mayores. Los péptidos que contienen el aminoácido glicina tienen grados particularmente grandes de libertad. Se ha estimado que los enlaces peptídicos que contienen glicina tienen aproximadamente 3,4 veces más entropía en disolución con respecto a secuencias que contienen alanina correspondientes (D'Aquino, J. A. y col. (1996) Proteins, 25: 143-56). Este factor aumenta con el número de residuos de glicina en una secuencia. Como resultado, tales péptidos tienden a perder más entropía tras la unión a dianas, que reduce su capacidad global para interaccionar con otras proteínas, además de su capacidad para adoptar estructuras tridimensionales definidas. La gran flexibilidad conformacional de los enlaces peptídicos de glicina también es evidente cuando se analizan representaciones de Ramachandran de estructuras de proteína en las que los enlaces peptídicos de glicina ocupan áreas que están raramente ocupadas por otros enlaces peptídicos (Venkatachalam, C. M. y col. (1969) Annu Rev Biochem, 38: 45-82). Stites y col. estudiaron una base de datos de 12.320 residuos de 61 estructuras cristalinas de alta resolución no homólogas para determinar las preferencias conformaciones phi, psi de cada uno de los 20 aminoácidos. Las distribuciones observadas en el estado nativo de proteínas se supone que también refleja las distribuciones encontradas en el estado desnaturalizado. Las distribuciones se usaron para aproximar la superficie de energía a cada residuo, permitiendo el cálculo de entropías conformaciones relativas para cada residuo con respecto a glicina. En el caso más extremo, la sustitución de prolina con glicina, los cambios de entropía conformacional estabilizarán el estado nativo con respecto al estado desnaturalizado -0,82 /- 0,08 kcal/mol a 20 °C (Stites, W. E. y col. (1995) Protein, 22: 132). Estas observaciones confirman la función especial de la glicina entre los 20 aminoácidos naturales. [0112]GRS-containing URPs are of particular interest due, in part, to the high conformational freedom of glycine-containing peptides. Denatured peptides in solution have a high degree of conformational freedom. Most of this conformational freedom is lost after the binding of said peptides to a target such as a receptor, an antibody or a protease. This loss of entropy needs to be compensated by the interaction energy between the peptide and its target. The degree of conformational freedom of a denatured peptide depends on its amino acid sequences. Peptides that contain many amino acids with small side chains tend to have more conformational freedom than peptides that are composed of amino acids with larger side chains. Peptides containing the amino acid glycine have particularly large degrees of freedom. It has been estimated that glycine-containing peptide bonds have approximately 3.4 times more entropy in solution relative to corresponding alanine-containing sequences (D'Aquino, J. A. et al. (1996) Proteins, 25: 143-56). This factor increases with the number of glycine residues in a sequence. As a result, such peptides tend to lose more entropy upon binding to targets, which reduces their overall ability to interact with other proteins, as well as their ability to adopt defined three-dimensional structures. The great conformational flexibility of glycine peptide bonds is also evident when analyzing Ramachandran representations of protein structures in which glycine peptide bonds occupy areas that are rarely occupied by other peptide bonds (Venkatachalam, C. M. et al. (1969). ) Annu Rev Biochem, 38: 45-82). Stites et al. studied a database of 12,320 residues from 61 non-homologous high-resolution crystal structures to determine the preferred phi, psi conformations of each of the 20 amino acids. The distributions observed in the native state of proteins are assumed to also reflect the distributions found in the denatured state. The distributions were used to approximate the surface energy of each residue, allowing the calculation of relative conformational entropies for each residue with respect to glycine. In the most extreme case, the substitution of proline with glycine, conformational entropy changes will stabilize the native state with respect to the denatured state -0.82 /- 0.08 kcal/mol at 20 °C (Stites, W. E. et al. (1995) Protein, 22: 132). These observations confirm the special role of glycine among the 20 natural amino acids.

[0113]En el diseño de los URP objeto pueden usarse secuencias naturales o no naturales. Por ejemplo, una multitud de secuencias naturales que contienen alto contenido de glicina se proporciona en la Tabla 1, Tabla 2, Tabla 3 y Tabla 4. Un experto en la materia puede adoptar una cualquiera de las secuencias como un URP, o modificar las secuencias para lograr las propiedades previstas. Si es de interés la inmunogenicidad para el sujeto huésped, es preferible diseñar URP que contengan GRS basándose en secuencias ricas en glicina derivadas del huésped. URP que contienen GRS preferidos son secuencias de proteínas humanas o secuencias que comparten homología sustancial con las secuencias ricas en glicina correspondientes en las proteínas humanas de referencia. [0113]Natural or non-natural sequences can be used in the design of the object URPs. For example, a multitude of natural sequences containing high glycine content are provided in Table 1, Table 2, Table 3 and Table 4. A person skilled in the art can adopt any one of the sequences as a URP, or modify the sequences to achieve the intended properties. If immunogenicity is of interest to the host subject, it is preferable to design GRS-containing URPs based on host-derived glycine-rich sequences. Preferred GRS-containing URPs are human protein sequences or sequences that share substantial homology with the corresponding glycine-rich sequences in human reference proteins.

[0114][0114]

Tabla 1. Análisis estructural de proteínas que contienen secuencias ricas en glicinaTable 1. Structural analysis of proteins containing glycine-rich sequences.

______________ ______________

Tabla 2: Marcos de lectura abiertos que codifican GRS con 300 o más residuos de glicina Acceso Organismo Gly (%) Longitud de GRS Longitud del gen Función predichaNP_974499Arabidopsis thaliana64 509 579 desconocida ZP_00458077Burkholderia66 373 518 lipoproteína putativacenocepaciaTable 2: Open reading frames encoding GRS with 300 or more glycine residues Access Organism Gly (%) GRS length Gene length Predicted functionNP_974499Arabidopsis thaliana64,509,579 unknown ZP_00458077Burkholderia66,373,518 putativacenocepacia lipoprotein

XP_477841Oryza sativa74 371 422 desconocida MP_910409Oryza sativa75 368 400 precursor putativo de la pared celular NP_610660Drosophila66 322 610 elemento transponiblemelanogasterXP_477841Oryza sativa74 371 422 unknown MP_910409Oryza sativa75 368 400 putative cell wall precursor NP_610660Drosophila66 322 610 transposable elementmelanogaster

Tabla 3. Ejemplos de GRS humanaTable 3. Examples of human GRS

Acceso Gly (%) Longitud de GRS Longitud del gen Hidrofobia Función predichaNP_000217 62 135 622 sí queratina 9 Gly access (%) GRS length Gene length Hydrophobia Predicted functionNP_000217 62 135 622 yes keratin 9

NP_631961 61 73 592 sí isoforma 1 del factor 15 asociado a TBP NP_476429 65 70 629 sí queratina 3 NP_631961 61 73 592 yes TBP-associated factor 15 isoform 1 NP_476429 65 70 629 yes keratin 3

NP 000418 70 66 316 sí loricrina, envuelta de la célula NP_056932 60 66 638 sí citoqueratina 2 NP 000418 70 66 316 yes loricrin, cell envelope NP_056932 60 66 638 yes cytokeratin 2

Tabla 4. Ejemplos adicionales de GRS humanaTable 4. Additional examples of human GRS.

Acceso Secuencias Número de aminoácidosNP_006228 GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG 37 Access Sequences Number of amino acidsNP_006228 GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG 37

NP _787059 GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG 33 NP_009060 GGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGG 32 NP_031393 GDGGGAGGGGGGGGSGGGGSGGGGGGG 27 NP_005850 GSGSGSGGGGGGGGGGGGSGGGGGG 25 NP_061856 GGGRGGRGGGRGGGGRGGGRGGG 22 NP_787059 GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG 33 NP_009060 GGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGG 32 NP_031393 GDGGGAGGGGGGGGSGGGGSGGGGGGG 27 NP_115818 GSGGSGGSGGGPGPGPGGGGG 21 XP_376532 GEGGGGGGEGGGAGGGSG 18 NP_005850 RGGGRGGG 22 NP_787059 GAGGGGGGGGGGGGGSGGGGGGGAGAGGAGAG 33 NP_009060 GGGSGSGGAGGGSGGGSGSGGGGGGGAGGGGGG 32 NP_031393 GDGGGAGGGGGGGGSGGGGSGGGGGGG 27 NP_115818 GSGGSGGSGGGPGPGPGGGGG 21 XP_376532 GEGGG GGGEGGGAGGGSG 18

NP 065104 GGGGGGGGDGGG 12 GGGSGSGGAGGGSGGGSGSGGGGGGAGGGGGGSSGGGSGTAGGHSG NP 065104 GGGGGGGGDGGG 12 GGGSGSGGAGGGGSGGGSGSGGGGGGAGGGGGGGSSGGGSGTAGGHSG

dominio POU, clase 4, factor de transcripción 1 [Homo sapiens] GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG POU domain, class 4, transcription factor 1 [Homo sapiens] GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG

2 que contiene dominio YEATS [Homo sapiens] 2 containing YEATS domain [Homo sapiens]

GGSGAGGGGGGGGGGGSGSGGGGSTGGGGGTAGGG GGSGAGGGGGGGGGGGSGSGGGGSTGGGGGTAGGG

¡soforma 3 de dominio 1B interactivo rico en AT (similar a SWI1); proteína de unión a BRG1 ELD/OSA1; Eld (párpado)/proteína Osa [Homo sapiens] AT-rich interactive domain 1B form 3 (similar to SWI1); BRG1-binding protein ELD/OSA1; Eld (eyelid)/Osa protein [Homo sapiens]

GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG GAGGGGGGGGGGGGGSGGGGGGGGGAGAGGAGAG

isoforma 2 de dominio 1B interactivo rico en AT (similar a SWI1); proteína de unión a BRG1 ELD/OSA1; Eld (párpado)/proteína Osa [Homo sapiens] AT-rich interacting domain 1B isoform 2 (similar to SWI1); BRG1-binding protein ELD/OSA1; Eld (eyelid)/Osa protein [Homo sapiens]

GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG GAGGGGGGGGGGGGGSGGGGGGGGGAGAGGAGAG

isoforma 1 de dominio 1B interactivo rico en AT (similar a SWI1); proteína de unión a BRG1 ELD/OSA1; Eld (párpado)/proteína Osa [Homo sapiens] AT-rich interacting domain 1B isoform 1 (similar to SWI1); BRG1-binding protein ELD/OSA1; Eld (eyelid)/Osa protein [Homo sapiens]

GAGGGGGGGGGGGGGSGGGGGGGGAGAGGAGAG GAGGGGGGGGGGGGGSGGGGGGGGGAGAGGAGAG

proteína A de unión al elemento rico en purina; proteína alfa de unión a ADN monocatenario rico en purina; proteína PUR-alfa del activador transcripcional [Homo sapiens] purine-rich element binding protein A; purine-rich single-stranded DNA binding protein alpha; transcriptional activator protein PUR-alpha [Homo sapiens]

GHPGSGSGSGGGGGGGGGGGGSGGGGGGAPGG GHPGSGSGSGGGGGGGGGGGGGSGGGGGGAPGG

factor X1 regulador; factor 1 regulador de acción trans; factor C potenciador; factor RFX regulador del MHC de clase II [Homo sapiens] regulatory factor X1; trans-acting regulatory factor 1; enhancing factor C; MHC class II regulatory factor RFX [Homo sapiens]

GGGGSGGGGGGGGGGGGGGSGSTGGGGSGAG GGGGSGGGGGGGGGGGGGGGSTGGGGSGAG

proteína que contiene dominio de bromo alterada en leucemia [Homo sapiens] GGRGRGGRGRGSRGRGGGGTRGRGRGRGGRG Bromine domain-containing protein altered in leukemia [Homo sapiens] GGRGRGGRGRGSRGRGGGGTRGRGRGRGGRG

proteína desconocida [Homo sapiens] unknown protein [Homo sapiens]

GSGGSGGSGGGPGPGPGGGGGPSGSGSGPG PREDICHA: proteína hipotética XP_059256 [Homo sapiens] GGGGGGGGGGGRGGGGRGGGRGGGGEGGG GSGGSGGSGGGGPGPGGGGGPSGSGSGPG PREDICTED: hypothetical protein XP_059256 [Homo sapiens] GGGGGGGGGGGRGGGGRGGGRGGGGEGGG

proteína de dedo de cinc 281; factor de transcripción de ZNP-99 [Homo sapiens] zinc finger protein 281; ZNP-99 transcription factor [Homo sapiens]

GGGGT GSSGGSGSGGGGSGGGGGGGSSG GGGGT GSSGGGSGSGGGGSGGGGGGGSSG

isoforma corta de la proteína de unión a ARN (autoantigénica, asociada a hnRNP con amarillo letal); proteína de unión a ARN (autoantigénica); proteína de unión a ARN (letal) [Homo sapiens] GDGGGAGGGGGGGGSGGGGSGGGGGGG short isoform of RNA-binding protein (autoantigenic, hnRNP-associated with lethal yellow); RNA binding protein (autoantigenic); RNA binding protein (lethal) [Homo sapiens] GDGGGAGGGGGGGGSGGGGGSGGGGGGG

partícula de reconocimiento de señales de 68 kDa [Homo sapiens] GGGGGGGSGGGGGSGGGGSGGGRGAGG 68 kDa signal recognition particle [Homo sapiens] GGGGGGSGGGGGSGGGGSGGGRGAGG

proteína KIAA0265 [Homo sapiens] protein KIAA0265 [Homo sapiens]

GGGAAGAGGGGSGAGGGSGSGGRGTG GGGAAGAGGGGSGAGGGSGSGGRGTG

homólogo deengrailed2;Engrailed-2[Homo sapiens] homologue of engrailed2;Engrailed-2[Homo sapiens]

GAGGGRGGGAGGEGGASGAEGGGGAGG GAGGGRGGGAGGEGGASGAEGGGGAGG

isoforma larga de proteína de unión a ARN (autoantigénica, asociada a hnRNP con amarillo letal), proteína de unión a ARN (autoantigénica); proteína de unión a ARN (autoantigénica, asociada a hnRNP con amarillo letal) [Homo sapiens] RNA-binding protein long isoform (autoantigenic, hnRNP-associated with lethal yellow), RNA-binding protein (autoantigenic); RNA-binding protein (autoantigenic, hnRNP-associated with lethal yellow) [Homo sapiens]

GDGGGAGGGGGGGGSGGGGSGGGGGGG GDGGGAGGGGGGGGSGGGGSGGGGGG

receptor de andrógenos; receptor de dihidrotestosterona [Homo sapiens] GGGGGGGGGGGGGGGGGGGGGGGEAG androgen receptor; dihydrotestosterone receptor [Homo sapiens] GGGGGGGGGGGGGGGGGGGGGGGEAG

caja homeótica D11; caja homeótica 4F; Hox-4.6, ratón, homólogo de; proteína de caja homeótica Hox-D11 [Homo sapiens] homeotic box D11; homeotic box 4F; Hox-4.6, mouse, homolog of; homeotic box protein Hox-D11 [Homo sapiens]

GGGGGGSAGGGSSGGGPGGGGGGAGG GGGGGGSAGGGSSGGPGGGGGGGGAGG

frizzled 8; homólogo 8 de frizzled (Drosophila) [Homo sapiens] frizzled 8; frizzled homolog 8 (Drosophila) [Homo sapiens]

GGGGGPGGGGGGGPGGGGGPGGGGG GGGGGPGGGGGGGPGGGGGPGGGGG

gen asociado al desarrollo ocular [Homo sapiens] gene associated with eye development [Homo sapiens]

GRGGAGSGGAGSGAAGGTGSSGGGG GRGGAGGSGGAGGSGAAGGTGSSGGGG

caja homeótica B3; caja homeótica 2G; proteína de la caja homeótica Hox-B3 [Homo sapiens] GGGGGGGGGGGSGGSGGGGGGGGGG homeotic box B3; 2G homeotic box; homeotic box protein Hox-B3 [Homo sapiens] GGGGGGGGGGGGSGGSGGGGGGGGGG

marco de lectura abierto 29 del cromosoma 2 [Homo sapiens] open reading frame 29 of chromosome 2 [Homo sapiens]

GGSGGGRGGASGPGSGSGGPGGPAG GGSGGGRGGASGPGSGSGGPGGPAG

proteína DKFZP564F0522 [Homo sapiens] protein DKFZP564F0522 [Homo sapiens]

GGHHGDRGGGRGGRGGRGGRGGRAG PREDICHA: similar a proteína 2 homóloga a even-skipped (EVX-2) de caja homeótica [Homo sapiens] GSRGGGGGGGGGGGGGGGGAGAGGG PREDICTED GGHHGDRGGGRGGRGGRGGRGGRAG: similar to even-skipped homologous protein 2 (EVX-2) of homeotic box [Homo sapiens] GSRGGGGGGGGGGGGGGGGAGAGGG

familia de genes homólogos a ras, miembro U; Ryu GTPasa; homólogo Cdc42 sensible a Wnt-1; 2310026M05Rik; 1 similar a proteína de unión a GTP; GTPasa similar a CDC42 [Homo sapiens] GGRGGRGPGEPGGRGRAGGAEGRG ras homologous gene family, member U; Ryu GTPase; Wnt-1-responsive Cdc42 homolog; 2310026M05Rik; GTP-binding protein-like 1; CDC42-like GTPase [Homo sapiens] GGGRGGRGPGEPGGRGRAGGAEGRG

proteína scratch 2; scratch 2 de represor transcripcional; scratch (homólogo de Drosophila) 2, proteína de dedo de cinc [Homo sapiens] scratch protein 2; transcriptional repressor scratch 2; scratch (Drosophila homolog) 2, zinc finger protein [Homo sapiens]

GGGGGDAGGSGDAGGAGGRAGRAG GGGGGDAGGSGDAGGAGGRAGRAG

familia A de la proteína nucleolar, miembro 1; proteína GAR1 [Homo sapiens] GGGRGGRGGGRGGGGRGGGRGGG nucleolar protein family A, member 1; GAR1 protein [Homo sapiens] GGGRGGRGGGRGGGGRGGGRGGG

queratina 1; queratina-1; citoqueratina 1; alfa-proteína del pelo [Homo sapiens] GGSGGGGGGSSGGRGSGGGSSGG keratin 1; keratin-1; cytokeratin 1; alpha-hair protein [Homo sapiens] GGSGGGGGGSSGGRGGSGGGSSGG

proteína hipotética FLJ31413 [Homo sapiens] hypothetical protein FLJ31413 [Homo sapiens]

GSGPGT GGGGSGSGGGGGGSGGG GSGPGT GGGGSGSGGGGGGGSGGG

dominio onecut, miembro 2 de la familia; onecut 2 [Homo sapiens] onecut domain, family member 2; onecut 2 [Homo sapiens]

GARGGGSGGGGGGGGGGGGGGPG GARGGGSGGGGGGGGGGGGGGPG

dominio POU, clase 3, factor de transcripción 2 [Homo sapiens] POU domain, class 3, transcription factor 2 [Homo sapiens]

GGGGGGGGGGGGGGGGGGGGGDG PREDICHA: similar a la subunidad 4 del completo THO (Tho4) (ARN y proteína 1 de unión a factor de exportación) (REF1-I) (Ally de AML-1 y LEF-1) (Aly/REF) [Homo sapiens] GGGGGGGGGGGGGGGGGGGGGDG: similar to complete THO subunit 4 (Tho4) (RNA and export factor binding protein 1) (REF1-I) (Ally of AML-1 and LEF-1) (Aly/REF) [Homo sapiens ]

GGTRGGTRGGTRGGDRGRGRGAG PREDICHA: similar a la subunidad 4 del complejo THO (Tho4) (ARN y proteína 1 de unión a factor de exportación) (REF1-I) (Ally de AML-1 y LEF-1) (Aly/REF) [Homo sapiens] PREDICTED GGTRGGTRGGTRGGDRGRGRGAG: similar to THO complex subunit 4 (Tho4) (RNA and export factor binding protein 1) (REF1-I) (Ally of AML-1 and LEF-1) (Aly/REF) [Homo sapiens ]

GGTRGGTRGGTRGGDRGRGRGAG GGTRGGTRGGTRGGDRGRGRGAG

dominio POU, clase 3, factor de transcripción 3 [Homo sapiens] POU domain, class 3, transcription factor 3 [Homo sapiens]

GAGGGGGGGGGGGGGGAGGGGGG GAGGGGGGGGGGGGGGGAGGGGGG

fibrilarina; antígeno de esclerodermia nucleolar de 34 kD; ARN, proteína 1 de interacción con nucleolar pequeña U3 [Homo sapiens] fibrillarin; nucleolar scleroderma antigen 34 kD; RNA, U3 small nucleolar-interacting protein 1 [Homo sapiens]

GRGRGGGGGGGGGGGGGRGGGG GRGRGGGGGGGGGGGGGRGGGG

proteína 579 de dedo de cinc [Homo sapiens] zinc finger protein 579 [Homo sapiens]

GRGRGRGRGRGRGRGRGRGGAG GRGRGRGRGRGRGRGRGRGGAG

calpaína, subunidad 1 pequeña; proteinasa neutra activada con calcio; calpaína, polipéptido pequeño; calpaína 4, subunidad pequeña (30 K); proteasa dependiente del calcio, subunidad pequeña [Homo sapiens] GAGGGGGGGGGGGGGGGGGGGG calpain, small subunit 1; calcium-activated neutral proteinase; calpain, small polypeptide; calpain 4, small subunit (30 K); calcium-dependent protease, small subunit [Homo sapiens] GAGGGGGGGGGGGGGGGGGGGG

queratina 9 [Homo sapiens] keratin 9 [Homo sapiens]

GGGSGGGHSGGSGGGHSGGSGG GGGGSGGGHSGGGSGGGHSGGSGG

caja forkhead D1; activador 4 relacionado con forkhead; Forkhead, drosophila, 8 similar a homólogo; 8 similar a forkhead (Drosophila) [Homo sapiens] D1 forkhead box; forkhead related trigger 4; Forkhead, drosophila, 8 homologous-like; 8 similar to forkhead (Drosophila) [Homo sapiens]

GAGAGGGGGGGGAGGGGSAGSG PREDICHA: similar a ADNc de RIKEN C230094B15 [Homo sapiens] PREDICTED GAGAGGGGGGGGAGGGSAGSG: similar to RIKEN cDNA C230094B15 [Homo sapiens]

GGPGT GSGGGGAGT GGGAGGPG GGGGGGGGGAGGAGGAGSAGGG GGPGT GSGGGGAGT GGGAGGPG GGGGGGGGGAGGAGGAGSAGGG

precursor de cadherina 22, ortólogo de cadherina de rata PB [Homo sapiens] GGDGGGSAGGGAGGGSGGGAG cadherin 22 precursor, rat cadherin ortholog PB [Homo sapiens] GGDGGGSAGGGAGGGSGGGAG

factor 1 de transcripción de unión a AT; factor 1 de unión a motivo AT [Homo sapiens] GGGGGGSGGGGGGGGGGGGGG AT-binding transcription factor 1; AT motif binding factor 1 [Homo sapiens] GGGGGGSGGGGGGGGGGGGGG

eomesodermina; caja t, cerebro, 2; homólogo de eomesodermina (Xenopus laevis) [Homo sapiens] GPGAGAGSGAGGSSGGGGGPG eomesodermin; t-box, brain, 2; homologue of eomesodermina (Xenopus laevis) [Homo sapiens] GPGAGAGSGAGGSSGGGGGPG

proteína de transferencia de fosfatidilinositol, 2 asociada a membrana; receptor 3 de interacción con el dominio del extremo N de PYK2; B alfa 2 de degeneración retiniana (Drosophila) [Homo sapiens] GGGGGGGGGGGSSGGGGSSGG membrane-associated phosphatidylinositol transfer protein, 2; PYK2 N-terminal domain-interacting receptor 3; B alpha 2 of retinal degeneration (Drosophila) [Homo sapiens] GGGGGGGGGGGSSGGGGSSGG

isoforma 2 del antígeno 8 asociado a espermatozoides; proteína 1 de la membrana de espermatozoides [Homo sapiens] sperm-associated antigen 8 isoform 2; sperm membrane protein 1 [Homo sapiens]

GSGSGPGPGSGPGSGPGHGSG PREDICHA: proteína 27 de motivo de unión a ARN [Homo sapiens] PREDICTED GSGSGPGPGSGPGSGPGHGSG: RNA-binding motif protein 27 [Homo sapiens]

GPGPGPGPGPGPGPGPGPGPG GPPGPGPGPGPGPGPGPGPG

isoforma 1 de la proteína 1 de unión a la subunidad gamma de AP1; proteína 1 de unión a la subunidad gamma del complejo 1 de gamma-sinergina; proteína relacionada con adaptador [Homo sapiens] GAGSGGGGAAGAGAGSAGGGG AP1 gamma subunit binding protein 1 isoform 1; gamma-synergine complex 1 gamma subunit binding protein 1; adapter-related protein [Homo sapiens] GAGSGGGGAAGAGAGSAGGGG

isoforma 2 de la proteína 1 de unión a la subunidad gamma de AP1; gamma-sinergina; proteína 1 de unión a la subunidad gamma del complejo 1 de proteína relacionada con adaptador [Homo sapiens] GAGSGGGGAAGAGAGSAGGGG AP1 gamma subunit binding protein 1 isoform 2; gamma-synergine; Adapter-related protein complex 1 gamma subunit binding protein 1 [Homo sapiens] GAGSGGGGAAGAGAGSAGGGG

repetición de anquirina y 1 que contiene dominio del motivo alfa estéril; repetición de anquirina y 1 que contiene dominio SAM [Homo sapiens] ankyrin repeat and sterile alpha motif domain-containing 1; ankyrin repeat and SAM domain-containing 1 [Homo sapiens]

GGGGGGGSGGGGGGSGGGGGG GGGGGGGGSGGGGGGGSGGGGGG

isoforma 1 de la proteína 2 de dominio de unión a metil-CpG [Homo sapiens] GRGRGRGRGRGRGRGRGRGRG Methyl-CpG binding domain protein 2 isoform 1 [Homo sapiens] GRGRRGRGRGRGRGRGRGRGRG

dominio funcional triple (que interacciona con PTPRF) [Homo sapiens] triple functional domain (interacting with PTPRF) [Homo sapiens]

GGGGGGGSGGSGGGGGSGGGG GGGGGGGGSGGGSGGGGGSGGGG

caja forkhead D3 [Homo sapiens] forkhead box D3 [Homo sapiens]

GGEEGGASGGGPGAGSGSAGG GGEEGGASGGGPGAGSGSAGG

isoforma 1 del antígeno 8 asociado a espermatozoides; proteína 1 de la membrana de espermatozoides [Homo sapiens] sperm-associated antigen 8 isoform 1; sperm membrane protein 1 [Homo sapiens]

GSGSGPGPGSGPGSGPGHGSG GSGSGPGPGSGPGSGPGHGSG

isoforma específica de testículos de la proteína 2 del dominio de unión a metil-CpG [Homo sapiens] GRGRGRGRGRGRGRGRGRGRG testis-specific isoform of methyl-CpG binding domain protein 2 [Homo sapiens] GRGRRGRGRGRGRGRGRGRGRG

regulador de muerte celular aven; muerte celular programada 12 [Homo sapiens] GGGGGGGGDGGGRRGRGRGRG aven cell death regulator; programmed cell death 12 [Homo sapiens] GGGGGGGGDGGGRRGRRGRGRG

regulador de transcritos 1 de terminación; delta helicasa; homólogo de la mutación 1 de Up-Frameshift (S. cerevisiae); factor 1 reductor de ARNm de terminación; homólogo de levadura Upflp [Homo sapiens] GGPGGPGGGGAGGPGGAGAG termination transcript regulator 1; delta helicase; homolog of Up-Frameshift mutation 1 (S. cerevisiae); termination mRNA reducing factor 1; yeast homolog Upflp [Homo sapiens] GGPGGPGGGGAGGPGGAGAG

isoforma a de la proteína 2 de canales de potasio activados por calcio de pequeña conductancia; canal de potasio activado por Ca2+ de pequeña conductancia sensible a apamina [Homo sapiens] small-conductance calcium-activated potassium channel protein 2 isoform a; apamin-sensitive small-conductance Ca2+-activated potassium channel [Homo sapiens]

GT GGGGST GGGGGGGGSGHG GT GGGGST GGGGGGGSGHG

caja 1 de SRY (región Y determinante del sexo); gen 1 de la caja HMG relacionado con SRY [Homo sapiens] GPAGAGGGGGGGGGGGGGGG SRY box 1 (sex determining region Y); SRY-related HMG box gene 1 [Homo sapiens] GPAGAGGGGGGGGGGGGGGG

isoforma 2 del factor de transcripción 20; proteína de unión a elementos sensibles al factor de crecimiento derivado de plaquetas de estromelisina-1; proteína de unión a elementos sensibles a PDGF de estromelisina 1; proteína de unión a SPRE; factor SPBP nuclear [Homo sapiens] transcription factor 20 isoform 2; stromelysin platelet-derived growth factor-responsive element binding protein-1; stromelysin PDGF-responsive element binding protein 1; SPRE binding protein; nuclear SPBP factor [Homo sapiens]

GGTGGSSGSSGSGSGGGRRG GGTGGSSGSSSGSGSGGGRRG

isoforma 1 del factor de transcripción 20; proteína de unión a elementos sensibles al factor de crecimiento derivado de plaquetas de estromelisina-1; proteína de unión a elementos sensibles a PDGF de estromelisina 1; proteína de unión a SPRE; factor SPBP nuclear [Homo sapiens] transcription factor 20 isoform 1; stromelysin platelet-derived growth factor-responsive element binding protein-1; stromelysin PDGF-responsive element binding protein 1; SPRE binding protein; nuclear SPBP factor [Homo sapiens]

GGTGGSSGSSGSGSGGGRRG GGTGGSSGSSSGSGSGGGRRG

proteína 1 de interacción con ras [Homo sapiens] ras-interacting protein 1 [Homo sapiens]

GSGT GTT GSSGAGGPGTPGG GSGT GTT GSSGAGGPGTPGG

isoforma b de cinasa inducible por BMP-2 [Homo sapiens] BMP-2-inducible kinase isoform b [Homo sapiens]

GGSGGGAAGGGAGGAGAGAG GGSGGGAAGGGAGGAGAGAG

isoforma a de cinasa inducible por BMP-2 [Homo sapiens] BMP-2-inducible kinase isoform a [Homo sapiens]

GGSGGGAAGGGAGGAGAGAG GGSGGGAAGGGAGGAGAGAG

caja forkhead C1; activador 3 relacionado con forkhead; Forkhead, drosophila, 7 similar a homólogo; 7 similar a forkhead (Drosophila); iridogoniodisgénesis tipo 1 [Homo sapiens] C1 forkhead box; forkhead related trigger 3; Forkhead, drosophila, 7 homologous-like; 7 forkhead-like (Drosophila); iridogoniodysgenesis type 1 [Homo sapiens]

GSSGGGGGGAGAAGGAGGAG GSSGGGGGGGAGAAGGAGGAG

factor p54 de corte y empalme; proteína nuclear de 54 kDa rica en arginina [Homo sapiens] GPGPSGGPGGGGGGGGGGGG p54 splicing factor; 54 kDa arginine-rich nuclear protein [Homo sapiens] GPGPSGGPGGGGGGGGGGGGG

homólogo oncogénico del fibrosarcoma musculoaponeurótico de v-maf; protooncogén de fibrosarcoma musculoaponeurótico aviar (MAF); homólogo oncogénico del fibrosarcoma musculoaponeurótico de v-maf (aviar) [Homo sapiens] v-maf musculoaponeurotic fibrosarcoma oncogenic homologue; avian musculoaponeurotic fibrosarcoma (MAF) proto-oncogene; oncogenic homologue of v-maf musculoaponeurotic fibrosarcoma (avian) [Homo sapiens]

GGGGGGGGGGGGGGAAGAGG GGGGGGGGGGGGGGGAAGAGG

polipéptido de ribonucleoproteína D1 nuclear pequeña 16 kDa; proteína D1 de núcleo de snRNP; autoantígeno Sm-D; polipéptido de ribonucleoproteína D1 nuclear pequeña (16kD) [Homo sapiens] GRGRGRGRGRGRGRGRGRGG small nuclear ribonucleoprotein D1 polypeptide 16 kDa; snRNP core protein D1; Sm-D autoantigen; small nuclear ribonucleoprotein D1 polypeptide (16kD) [Homo sapiens] GRGRGRGRGRGRGRGRGRGG

proteína hipotética H41 [Homo sapiens] hypothetical protein H41 [Homo sapiens]

GSAGGSSGAAGAAGGGAGAG GSAGGSSGAAGAAGGGAGAG

Residuos de no glicina que contienen URP (NGR):URP-containing non-glycine residues (NGR):

[0115]Las secuencias de residuos de no glicina en estas GRS pueden seleccionarse para optimizar las propiedades de URP y de ahí las proteínas que contienen los URP deseados. Por ejemplo, pueden optimizarse las secuencias de URP para potenciar la selectividad de la proteína resultante para un tejido particular, tipo de célula específica o linaje celular. Por ejemplo, pueden incorporarse secuencias de proteínas que no se expresan ubicuamente, sino que se expresan diferencialmente en uno o más de los tejidos del cuerpo que incluyen corazón, hígado, próstata, pulmón, riñón, médula ósea, sangre, piel, vejiga, cerebro, músculos, nervios y tejidos seleccionados que son afectados por enfermedades tales como enfermedades infecciosas, enfermedad autoinmunitaria, trastornos renales, neuronales, cardíacos y cánceres. Pueden emplearse secuencias representativas de un origen de desarrollo específico, tales como aquellas expresadas en un embrión o un adulto, durante la formación de ectodermo, endodermo o mesodermo en un organismo pluricelular. También pueden utilizarse secuencias que participan en un proceso biológico específico que incluye, pero no se limita a, regulación del ciclo celular, diferenciación celular, apoptosis, quimiotaxis, motilidad celular y transposición citoesquelética. También pueden utilizarse otras secuencias de proteínas no ubicuamente expresadas para dirigir la proteína resultante a localizaciones subcelulares específicas: matriz extracelular, núcleo, citoplasma, citoesqueleto, plasma y/o estructuras membranosas intracelulares que incluyen, pero no se limitan a, depresiones recubiertas, aparato de Golgi, retículo endoplásmico, endosoma, lisosoma y mitocondria. [0115]The sequences of non-glycine residues in these GRS can be selected to optimize URP properties and hence proteins containing the desired URPs. For example, URP sequences can be optimized to enhance the selectivity of the resulting protein for a particular tissue, specific cell type or cell lineage. For example, protein sequences may be incorporated that are not ubiquitously expressed, but are differentially expressed in one or more of the body's tissues including heart, liver, prostate, lung, kidney, bone marrow, blood, skin, bladder, brain. , muscles, nerves and selected tissues that are affected by diseases such as infectious diseases, autoimmune disease, kidney, neuronal, cardiac disorders and cancers. Sequences representative of a specific developmental origin, such as those expressed in an embryo or an adult, may be used during the formation of ectoderm, endoderm or mesoderm in a multicellular organism. Sequences that participate in a specific biological process including, but not limited to, cell cycle regulation, cell differentiation, apoptosis, chemotaxis, cell motility, and cytoskeletal rearrangement may also be used. Other non-ubiquitously expressed protein sequences may also be used to direct the resulting protein to specific subcellular locations: extracellular matrix, nucleus, cytoplasm, cytoskeleton, plasma and/or intracellular membranous structures including, but not limited to, coated pits, Golgi, endoplasmic reticulum, endosome, lysosome and mitochondria.

[0116]Se conoce una variedad de estas secuencias específicas de tejido, específicas de tipo de célula, específicas de localización subcelular y están disponibles de numerosas bases de datos de proteínas. Tales secuencias de URP selectivas pueden obtenerse generando bibliotecas de secuencias de URP aleatorias o semialeatorias, inyectándolas en animales o pacientes, y determinando secuencias con la selectividad por tejido deseada en muestras de tejido. La determinación de secuencias puede realizarse por espectrometría de masas. Usando procedimientos similares pueden seleccionarse secuencias de URP que facilitan la captación oral, bucal, intestinal, nasal, tecal, peritoneal, pulmonar, rectal o dérmica. [0116]A variety of these tissue-specific, cell type-specific, subcellular localization-specific sequences are known and are available from numerous protein databases. Such selective URP sequences can be obtained by generating libraries of random or semi-random URP sequences, injecting them into animals or patients, and determining sequences with the desired tissue selectivity in tissue samples. Sequence determination can be performed by mass spectrometry. Using similar procedures, URP sequences can be selected that facilitate oral, buccal, intestinal, nasal, thecal, peritoneal, pulmonary, rectal, or dermal uptake.

[0117]Son de particular interés secuencias de URP que contienen regiones que son relativamente ricas en los aminoácidos positivamente cargados arginina o lisina que favorecen la captación celular o transporte por las membranas. Pueden diseñarse secuencias de URP que contienen una o varias secuencias sensibles a proteasas. Tales secuencias de URP pueden escindirse una vez el producto del procedimiento de la invención ha alcanzado su localización diana. Esta escisión puede desencadenar un aumento en la potencia del dominio farmacéuticamente activo (activación de pro-fármacos) o puede potenciar la unión del producto de escisión a un receptor. Las secuencias de URP pueden diseñarse para llevan un exceso de cargas negativas introduciendo residuos de ácido aspártico o ácido glutámico. Son de particular interés URP que contienen más del 5%, más del 6%, 7%, 8%, 9%, 10%, 15%, 30% o más ácido glutámico y menos del 2% de lisina o arginina. Tales URP llevan un exceso de carga negativa y como resultado tienen una tendencia a adoptar conformaciones abiertas debido a la repulsión electrostática entre cargas negativas individuales del péptido. Un exceso de carga negativa tal conduce a un aumento eficaz en su radio hidrodinámico y como resultado puede conducir a eliminación renal reducida de tales moléculas. Así, puede modularse la carga neta eficaz y el radio hidrodinámico de una secuencia de URP controlando la frecuencia y distribución de aminoácidos negativamente cargados en las secuencias de URP. La mayoría de los tejidos y superficies en un ser humano o animal llevan exceso de cargas negativas. Diseñando las secuencias de URP para llevar un exceso de cargas negativas pueden minimizarse las interacciones no específicas entre la proteína resultante que comprende el URP y diversas superficies tales como vasos sanguíneos, tejidos sanos o diversos receptores. [0117] Of particular interest are URP sequences that contain regions that are relatively rich in the positively charged amino acids arginine or lysine that promote cellular uptake or transport across membranes. URP sequences can be designed that contain one or more protease-sensitive sequences. Such URP sequences can be cleaved once the product of the method of the invention has reached its target location. This cleavage may trigger an increase in the potency of the pharmaceutically active domain (pro-drug activation) or may enhance binding of the cleavage product to a receptor. URP sequences can be designed to carry excess negative charges by introducing aspartic acid or glutamic acid residues. Of particular interest are URPs that contain more than 5%, more than 6%, 7%, 8%, 9%, 10%, 15%, 30% or more glutamic acid and less than 2% lysine or arginine. Such URPs carry an excess of negative charge and as a result have a tendency to adopt open conformations due to electrostatic repulsion between individual negative charges of the peptide. Such an excess of negative charge leads to an effective increase in their hydrodynamic radius and as a result may lead to reduced renal clearance of such molecules. Thus, the effective net charge and hydrodynamic radius of a URP sequence can be modulated by controlling the frequency and distribution of negatively charged amino acids in the URP sequences. Most tissues and surfaces in a human or animal carry excess negative charges. By designing URP sequences to carry excess negative charges, non-specific interactions between the resulting protein comprising the URP and various surfaces such as blood vessels, healthy tissues or various receptors can be minimized.

[0118]Los URP pueden tener una secuencia repetitiva de aminoácidos del formato (motivo) en el que un motivo de secuencia forma una repetición directa (es decir, ABCABCABCABC) o una repetición invertida (ABCCBAABCCBA) y el número de estas repeticiones puede ser 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 35, 40, 50 o más URP o las repeticiones dentro de URP frecuentemente contienen solo 1, 2, 3, 4, 5 ó 6 tipos diferentes de aminoácidos. Los URP normalmente consisten en repeticiones de secuencias de aminoácidos humanas que tienen 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24, 26, 28, 30, 32, 34, 36 o más aminoácidos de longitud, pero los URP también pueden consistir en secuencias de aminoácidos no humanas que tienen 20, 22, 24, 26, 28, 30, 32, 34, 36, 3840, 42, 44, 46, 48, 50 aminoácidos de longitud. [0118]URPs may have a repetitive amino acid sequence of the format (motif) in which one sequence motif forms a direct repeat (i.e. ABCABCABCABC) or an inverted repeat (ABCCBAABCCBA) and the number of these repeats may be 2 , 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 35, 40, 50 or more URP or repetitions within URPs frequently contain only 1, 2, 3, 4, 5, or 6 different types of amino acids. URPs typically consist of repeats of human amino acid sequences that have 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 24 , 26, 28, 30, 32, 34, 36 or more amino acids in length, but URPs can also consist of non-human amino acid sequences that are 20, 22, 24, 26, 28, 30, 32, 34, 36, 3840, 42, 44, 46, 48, 50 amino acids long.

URP derivados de secuencias humanas:URPs derived from human sequences:

[0119]Los URP pueden derivarse de secuencias humanas. El genoma humano contiene muchas subsecuencias que son ricas en un aminoácido particular. Son de particular interés aquellas secuencias de aminoácidos que son ricas en un aminoácido hidrófilo como serina, treonina, glutamato, aspartato o glicina. Son de particular interés aquellas subsecuencias que contienen pocos aminoácidos hidrófobos. Se predice que tales subsecuencias son no estructuradas y altamente solubles en disolución acuosa. Tales subsecuencias humanas pueden modificarse para mejorar adicionalmente su utilidad. La Figura 17 muestra una secuencia humana a modo de ejemplo que es rica en serina y que puede aislarse como URP objeto. La dentina sialofosfoproteína ejemplificada contiene una subsecuencia de 670 aminoácidos en la que el 64% de los residuos son serina y la mayoría de las otras posiciones son aminoácidos hidrófilos tales como aspartato, asparaginas y glutamato. La secuencia es extremadamente repetitiva y como resultado tiene un bajo contenido de información. Pueden usarse directamente subsecuencias de una proteína humana tal. Si se desea, la secuencia puede modificarse de una forma que preserve su carácter global, pero que la haga más adecuada para aplicaciones farmacéuticas. Ejemplos de secuencias que están relacionadas con dentina sialofosfoproteína son (SSD)n, (SSDSSN)n, (SSE)n en las que n es entre aproximadamente 4 y 200. [0119]URPs can be derived from human sequences. The human genome contains many subsequences that are rich in a particular amino acid. Of particular interest are those amino acid sequences that are rich in a hydrophilic amino acid such as serine, threonine, glutamate, aspartate or glycine. Of particular interest are those subsequences that contain few hydrophobic amino acids. Such subsequences are predicted to be unstructured and highly soluble in aqueous solution. Such human subsequences can be modified to further improve their usefulness. Figure 17 shows an exemplary human sequence that is rich in serine and that can be isolated as a target URP. The exemplified dentin sialophosphoprotein contains a subsequence of 670 amino acids in which 64% of the residues are serine and most of the other positions are hydrophilic amino acids such as aspartate, asparagines and glutamate. The sequence is extremely repetitive and as a result has a low information content. Subsequences of such a human protein can be used directly. If desired, the sequence can be modified in a way that preserves its overall character, but makes it more suitable for pharmaceutical applications. Examples of sequences that are related to dentin sialophosphoprotein are (SSD)n, (SSDSSN)n, (SSE)n in which n is between approximately 4 and 200.

[0120]El uso de secuencias de proteínas humanas es particularmente deseable en el diseño de URP con inmunogenicidad reducida en un sujeto humano. Una etapa clave para provocar una respuesta inmunitaria a una proteína extraña es la presentación de fragmentos de péptido de dicha proteína por receptores de MHC de clase II. Estos fragmentos unidos a MHCII pueden luego detectarse por receptores de linfocitos T, que desencadenan la proliferación de linfocitos T colaboradores e inicia una respuesta inmunitaria. La eliminación de epítopes de linfocitos T de proteínas farmacéuticas se ha reconocido como un medio para reducir el riesgo de provocación de una reacción inmunitaria (Stickler, M. y col. (2003) J Immunol Methods, 281: 95-108). Los receptores de MHCII normalmente interaccionan con un epítope que tiene, por ejemplo, una región de 9 aminoácidos de longitud de los péptidos visualizados. Así, puede reducirse el riesgo de provocar una respuesta inmunitaria a una proteína en pacientes si todas las subsecuencias o la mayoría de las posibles subsecuencias 9-meras de la proteína pueden encontrarse en proteínas humanas y, si es así, estas secuencias y repeticiones de estas secuencias no serán reconocidas por el paciente como secuencias extrañas. Pueden incorporarse secuencias humanas en el diseño de secuencias deRoligomerizando o concatenando secuencias humanas que tienen composiciones de aminoácidos adecuadas. Éstas pueden ser repeticiones directas o repeticiones invertidas o mezclas de diferentes repeticiones. Por ejemplo, las secuencias pueden oligomerizarse como se muestra en la Tabla 2. Tales oligómeros tienen un reducido riesgo de ser inmunogénicas. Sin embargo, las secuencias de empalme entre las unidades de monómeros todavía pueden contener epítopes de linfocitos T que pueden desencadenar una reacción inmunitaria, que se ilustra en la Figura 3. Adicionalmente puede reducirse el riesgo de provocar una respuesta inmunitaria diseñando secuencias de URP basadas en múltiples secuencias humanas de solapamiento. Este enfoque se ilustra en la Figura 4. La secuencia de URP en la Figura 2 se diseñó como un oligómero basado en múltiples secuencias humanas de forma que cada subsecuencia 9-mera del oligómero pueda encontrarse en una proteína humana. En estos diseños, cada subsecuencia 9-mera es una secuencia humana. Un ejemplo de una secuencia de URP basada en tres secuencias humanas se muestra en la Figura 5. También es posible diseñar secuencias de URP basadas en una única secuencia humana de forma que todas las posibles subsecuencias 9-meras en las secuencias de URP oligoméricas se produzcan en la misma proteína humana. Un ejemplo se muestra en la Figura 6 basándose en el dominio POU que es rico en glicina y prolina. El monómero de repetición en la secuencia de URP es solo un fragmento de la proteína humana y sus secuencias flanqueantes son idénticas a la unidad de repetición como se ilustra en la Figura 6. También pueden diseñarse secuencias de URP no oligoméricas basándose en proteínas humanas. Las condiciones primarias son que todas las subsecuencias 9-meras puedan encontrarse en secuencias humanas. La composición de aminoácidos de las secuencias contienen preferentemente pocos residuos hidrófobos. Son de particular interés secuencias de URP que se diseñan basándose en secuencias humanas y que contienen una gran fracción de residuos de glicina. [0120]The use of human protein sequences is particularly desirable in the design of URPs with reduced immunogenicity in a human subject. A key step in eliciting an immune response to a foreign protein is the presentation of peptide fragments of that protein by MHC class II receptors. These MHCII-bound fragments can then be detected by T cell receptors, which trigger the proliferation of T helper cells and initiate an immune response. Removal of T cell epitopes from pharmaceutical proteins has been recognized as a means of reducing the risk of provoking an immune reaction (Stickler, M. et al. (2003) J Immunol Methods, 281: 95-108). MHCII receptors normally interact with an epitope having, for example, a 9 amino acid long region of the displayed peptides. Thus, the risk of eliciting an immune response to a protein in patients may be reduced if all or most of the possible 9-mer subsequences of the protein can be found in human proteins and, if so, these sequences and repeats of these sequences will not be recognized by the patient as strange sequences. Human sequences can be incorporated into the design ofRsequences by oligomerizing or concatenating human sequences that have suitable amino acid compositions. These can be direct repetitions or inverted repetitions or mixtures of different repetitions. For example, sequences can be oligomerized as shown in Table 2. Such oligomers have a reduced risk of being immunogenic. However, the splicing sequences between the monomer units can still contain T cell epitopes that can trigger an immune reaction, which is illustrated in Figure 3. Additionally, the risk of provoking an immune response can be reduced by designing URP sequences based on multiple overlapping human sequences. This approach is illustrated in Figure 4. The URP sequence in Figure 2 was designed as an oligomer based on multiple human sequences so that each 9-mer subsequence of the oligomer can be found in a human protein. In these designs, each 9-mer subsequence is a human sequence. An example of a URP sequence based on three human sequences is shown in Figure 5. It is also possible to design URP sequences based on a single human sequence such that all possible 9-mer subsequences in the oligomeric URP sequences occur. in the same human protein. An example is shown in Figure 6 based on the POU domain that is rich in glycine and proline. The repeat monomer in the URP sequence is only a fragment of the human protein and its flanking sequences are identical to the repeat unit as illustrated in Figure 6. Non-oligomeric URP sequences can also be designed based on human proteins. The primary conditions are that all 9-mer subsequences can be found in human sequences. The amino acid composition of the sequences preferably contain few hydrophobic residues. Of particular interest are URP sequences that are designed based on human sequences and that contain a large fraction of glycine residues.

[0121]Utilizando este esquema o similar puede diseñarse una clase de URP que comprenda secuencias de repetición con baja inmunogenicidad para el huésped de interés. El huésped de interés puede ser cualquier animal, que incluye vertebrados e invertebrados. Huéspedes preferidos son mamíferos tales como primates (por ejemplo chimpancés y seres humanos), cetáceos (por ejemplo, ballenas y delfines), quirópteros (por ejemplo, murciélagos), perisodáctilos (por ejemplo, caballos y rinocerontes), roedores (por ejemplo, ratas), y ciertos tipos de insectívoros tales como musarañas, topos y erizos. Si se selecciona el ser humano como huésped, los URP normalmente contienen múltiples copias de las secuencias o unidades de repetición, en los que la mayoría de los segmentos que comprenden aproximadamente 6 a aproximadamente 15 aminoácidos contiguos están presentes en una o más proteínas humanas nativas. También pueden diseñarse URP en los que la mayoría de los segmentos que comprenden entre aproximadamente 9 y aproximadamente 15 aminoácidos contiguos se encuentran en una o más proteínas humanas nativas. Como se usa en el presente documento, la mayoría de los segmentos se refieren a más de aproximadamente el 50%, preferentemente el 60%, preferentemente el 70%, preferentemente el 80%, preferentemente el 90%, preferentemente el 100%. Si se desea, cada uno de los posibles segmentos entre aproximadamente 6 y 15 aminoácidos, preferentemente entre aproximadamente 9 y 15 aminoácidos dentro de las unidades de repetición, están presentes en una o más proteínas humanas nativas. Los URP pueden comprender múltiples unidades o secuencias de repetición, por ejemplo, teniendo 2, 3, 4, 5, 6, 7, 8, 9, 10 o más unidades de repetición. [0121]Using this scheme or a similar one, a class of URPs can be designed that comprise repeat sequences with low immunogenicity for the host of interest. The host of interest can be any animal, including vertebrates and invertebrates. Preferred hosts are mammals such as primates (e.g. chimpanzees and humans), cetaceans (e.g. whales and dolphins), bats (e.g. bats), perissodactyls (e.g. horses and rhinos), rodents (e.g. rats). ), and certain types of insectivores such as shrews, moles and hedgehogs. If the human is selected as the host, URPs typically contain multiple copies of the sequences or repeat units, in which the majority of the segments comprising about 6 to about 15 contiguous amino acids are present in one or more native human proteins. URPs can also be designed in which the majority of the segments comprising between about 9 and about 15 contiguous amino acids are found in one or more native human proteins. As used herein, most segments refer to more than about 50%, preferably 60%, preferably 70%, preferably 80%, preferably 90%, preferably 100%. If desired, each of the possible segments between about 6 and 15 amino acids, preferably between about 9 and 15 amino acids within the repeat units, are present in one or more native human proteins. URPs may comprise multiple repeat units or sequences, for example, having 2, 3, 4, 5, 6, 7, 8, 9, 10 or more repeat units.

Diseño de URP que están sustancialmente libres de epítopes de linfocitos T humanos:Design URPs that are substantially free of human T cell epitopes:

[0122]Las secuencias de URP pueden diseñarse para estar sustancialmente libres de epítopes reconocidos por linfocitos T humanos. Por ejemplo, puede sintetizarse una serie de secuencias semi-aleatorias con composiciones de aminoácidos que favorecen conformaciones no estructuradas desnaturalizadas y evaluar estas secuencias para la presencia de epítopes de linfocitos T humanos y si son secuencias humanas o no. Se han descrito ensayos para epítopes de linfocitos T humanos (Stickler, M. y col. (2003) J Immunol Methods, 281: 95-108). Son de particular interés secuencias de péptidos que pueden oligomerizarse sin generar epítopes de linfocitos T o secuencias no humanas. Esto puede lograrse probando repeticiones directas de estas secuencias para la presencia de epítopes de linfocitos T y para la aparición de subsecuencias 6 a 15-meras y en particular 9-meras que no son humanas. Una alternativa es evaluar múltiples secuencias de péptidos que puedan ensamblarse en unidades de repetición como se describe en la sección previa para el ensamblaje de secuencias humanas. Otra alternativa es diseñar secuencias de URP que produzcan bajas puntuaciones usando algoritmos de predicción de epítopes como TEPITOPE (Sturniolo, T. y col. (1999) Nat Biotechnol, 17: 555-61). Otro enfoque para evitar epítopes de linfocitos T es evitar aminoácidos que puedan servir de residuos de anclaje durante la visualización de péptidos sobre MHC, tal como M, I, L, V, F. Aminoácidos hidrófobos y aminoácidos positivamente cargados pueden servir frecuentemente de tales residuos de anclaje y el minimizar su frecuencia en una secuencia de URP reduce la probabilidad de generación de epítopes de linfocitos T y así provocar una reacción inmunitaria. Los URP seleccionados contienen generalmente subsecuencias que se encuentran en al menos una proteína humana, y tienen un menor contenido de aminoácidos hidrófobos. [0122]URP sequences can be designed to be substantially free of epitopes recognized by human T lymphocytes. For example, one can synthesize a series of semi-random sequences with amino acid compositions that favor denatured unstructured conformations and evaluate these sequences for the presence of human T cell epitopes and whether they are human sequences or not. Assays for human T cell epitopes have been described (Stickler, M. et al. (2003) J Immunol Methods, 281: 95-108). Of particular interest are peptide sequences that can oligomerize without generating T cell epitopes or non-human sequences. This can be achieved by testing direct repeats of these sequences for the presence of T cell epitopes and for the appearance of non-human 6- to 15-mer and particularly 9-mer subsequences. An alternative is to evaluate multiple peptide sequences that can be assembled into repeat units as described in the previous section for assembly of human sequences. Another alternative is to design URP sequences that produce low scores using epitope prediction algorithms such as TEPITOPE (Sturniolo, T. et al. (1999) Nat Biotechnol, 17: 555-61). Another approach to avoiding T cell epitopes is to avoid amino acids that can serve as anchor residues during MHC display of peptides, such as M, I, L, V, F. Hydrophobic amino acids and positively charged amino acids can frequently serve as such residues. anchoring and minimizing its frequency in a URP sequence reduces the probability of generating T lymphocyte epitopes and thus provoking an immune reaction. The selected URPs generally contain subsequences that are found in at least one human protein, and have a lower content of hydrophobic amino acids.

[0123]Las secuencias de URP pueden diseñarse para optimizar la producción de proteínas. Esto puede lograrse evitando o minimizando la repetitividad del ADN codificante. Secuencias de URP tales como poli-glicina pueden tener propiedades farmacéuticas muy deseables, pero su fabricación puede ser difícil debido al alto contenido de GC de secuencias de ADN que codifican GRS y debido a la presencia de secuencias de ADN de repetición que pueden conducir a recombinación. [0123]URP sequences can be designed to optimize protein production. This can be achieved by avoiding or minimizing the repetitiveness of the coding DNA. URP sequences such as poly-glycine may have very desirable pharmaceutical properties, but their manufacture may be difficult due to the high GC content of GRS-encoding DNA sequences and due to the presence of repeating DNA sequences that can lead to recombination. .

[0124]Como se observa anteriormente, las secuencias de URP pueden diseñarse para ser altamente repetitivas al nivel de aminoácidos. Como resultado, las secuencias de URP tienen contenido de información muy bajo y pueden reducir el riesgo de provocar una reacción inmunitaria. [0124]As noted above, URP sequences can be designed to be highly repetitive at the amino acid level. As a result, URP sequences have very low information content and may reduce the risk of provoking an immune reaction.

[0125]Ejemplos no limitantes de URP que contienen aminoácidos de repetición son: poli-glicina, poli-ácido glutámico, poli-ácido aspártico, poli-serina, poli-treonina, (GX)n en la que G es glicina y X es serina, ácido aspártico, ácido glutámico, treonina o prolina y n es al menos 20, (GGX)n en la que X es serina, ácido aspártico, ácido glutámico, treonina o prolina y n es al menos 13, (GGGX)n en la que X es serina, ácido aspártico, ácido glutámico, treonina o prolina y n es al menos 10, (GGGGX)n en la que X es serina, ácido aspártico, ácido glutámico, treonina o prolina y n es al menos 8, (GxC)n en la que X es serina, ácido aspártico, ácido glutámico, treonina o prolina, n es al menos 15, y z es entre 1 y 20. [0125] Non-limiting examples of URPs containing repeating amino acids are: poly-glycine, poly-glutamic acid, poly-aspartic acid, poly-serine, poly-threonine, (GX)n in which G is glycine and serine, aspartic acid, glutamic acid, threonine or proline and n is at least 20, (GGX)n in which X is serine, aspartic acid, glutamic acid, threonine or proline and n is at least 10, (GGGGX)n in which where X is serine, aspartic acid, glutamic acid, threonine or proline, n is at least 15, and z is between 1 and 20.

[0126]El número de estas repeticiones puede ser cualquier número entre 10 y 100. Los productos de los procedimientos de la invención pueden contener secuencias de URP que son secuencias semi-aleatorias. Ejemplos son secuencias semi-aleatorias que contienen al menos el 30, 40, 50, 60 o el 70% de glicina en las que las glicinas están bien dispersas y en las que la concentración total de triptófano, fenilalanina, tirosina, valina, leucina e isoleucina es entonces menos del 70, 60, 50, 40, 30, 20 o el 10% cuando se combinan. Una secuencia de URP semi-aleatoria preferida contiene al menos el 40% de glicina y la concentración total de triptófano, fenilalanina, tirosina, valina, leucina e isoleucina es entonces menos del 10%. Una secuencia de URP aleatoria más preferida contiene al menos el 50% de glicina y la concentración total de triptófano, fenilalanina, tirosina, valina, leucina e isoleucina es entonces menos del 5%. Pueden diseñarse secuencias de URP combinando las secuencias de dos o más secuencias de URP más cortas o fragmentos de secuencias de URP. Una combinación tal permite modular mejor las propiedades farmacéuticas del producto que contiene las secuencias de URP y permite que se reduzca la repetividad de las secuencias de ADN que codifican las secuencias de URP, que pueden mejorar la expresión y reducir la recombinación de secuencias codificantes de URP. [0126]The number of these repeats can be any number between 10 and 100. The products of the methods of the invention can contain URP sequences that are semi-random sequences. Examples are semi-random sequences containing at least 30, 40, 50, 60 or 70% glycine in which the glycines are well dispersed and in which the total concentration of tryptophan, phenylalanine, tyrosine, valine, leucine and Isoleucine is then less than 70, 60, 50, 40, 30, 20 or 10% when combined. A preferred semi-random URP sequence contains at least 40% glycine and the total concentration of tryptophan, phenylalanine, tyrosine, valine, leucine and isoleucine is then less than 10%. A more preferred random URP sequence contains at least 50% glycine and the total concentration of tryptophan, phenylalanine, tyrosine, valine, leucine and isoleucine is then less than 5%. URP sequences can be designed by combining the sequences of two or more shorter URP sequences or fragments of URP sequences. Such a combination allows better modulation of the pharmaceutical properties of the product containing the URP sequences and allows the repetitiveness of the DNA sequences encoding the URP sequences to be reduced, which can improve the expression and reduce recombination of URP coding sequences. .

[0127]Pueden diseñarse secuencias de URP y seleccionarse para que posean varias de las siguientes propiedades deseadas: a) alta estabilidad genética de las secuencias codificantes en el huésped de producción, b) alto nivel de expresión, c) baja inmunogenicidad (predicha/calculada), d) alta estabilidad en presencia de proteasas del suero y/u otras proteasas de tejido, e) gran radio hidrodinámico bajo condiciones fisiológicas. Un enfoque a modo de ejemplo para obtener secuencias de URP que cumplen múltiples criterios es construir una biblioteca de secuencias candidatas e identificar a partir de la biblioteca las subsecuencias adecuadas. Las bibliotecas pueden comprender secuencias aleatorias y/o semi-aleatorias. Son de particular utilidad bibliotecas de codones, que es una biblioteca de moléculas de ADN que contiene múltiples codones para el residuo de aminoácido idéntico. Puede aplicarse aleatorización de codones a posiciones de aminoácidos seleccionadas de un cierto tipo o a la mayoría o a todas las posiciones. Bibliotecas de codones verdaderas solo codifican una secuencia de un solo aminoácido, pero pueden combinarse fácilmente con bibliotecas de aminoácidos, que es una población de moléculas de ADN que codifica una mezcla de aminoácidos (relacionados o sin relacionar) en la posición de residuo. Las bibliotecas de codones permiten la identificación de genes que tienen repetividad relativamente baja al nivel de ADN, pero que codifican secuencias de aminoácidos altamente repetitivas. Esto es útil debido a que secuencias de ADN repetitivas tienden a recombinarse, conduciendo a inestabilidad. También pueden construirse bibliotecas de codones que codifican diversidad de aminoácidos limitada. Tales bibliotecas permiten la introducción de un número limitado de aminoácidos en algunas posiciones de la secuencia, mientras que otras posiciones permiten variación de codones, pero todos los codones codifican el mismo aminoácido. Pueden sintetizarse oligonucleótidos parcialmente aleatorios incorporando mezclas de nucleótidos en la misma posición durante la síntesis de oligonucleótidos. Tales oligonucleótidos parcialmente aleatorios pueden fusionarse por PCR de solapamiento o enfoques basados en ligación. En particular, pueden multimerizarse oligonucleótidos semi-aleatorios que codifican secuencias ricas en glicina. Estos oligonucleótidos pueden diferenciarse en longitud y secuencias y uso de codones. Como resultado, se obtiene una biblioteca de secuencias de URP candidatas. Otro procedimiento para generar bibliotecas es sintetizar una secuencia de partida y posteriormente someter dichas secuencias a aleatorización parcial. Esto puede hacerse por cultivo del gen que codifica las secuencias de URP en una cepa de mutador o por amplificación del gen codificante bajo condiciones mutagénicas (Leung, D. y col. (1989) Technique, 1: 11-15). Secuencias de URP con propiedades deseables pueden identificarse a partir de bibliotecas usando una variedad de procedimientos. Las secuencias que tienen un alto grado de estabilidad genética pueden enriquecerse cultivando la biblioteca en un huésped de producción. Secuencias que son inestables acumularán mutaciones, que pueden identificarse por secuenciación de ADN. Variantes de secuencias de URP que pueden expresarse a alto nivel pueden identificarse por cribado o selección usando múltiples protocolos conocidos para cualquier experto en la materia. Por ejemplo, pueden cultivarse múltiples cepas aisladas de una biblioteca y comparar niveles de expresión. Los niveles de expresión pueden medirse por análisis de gel, cromatografía analítica o diversos procedimientos basados en ELISA. La determinación de los niveles de expresión de variantes de secuencia individuales puede facilitarse fusionando la biblioteca de secuencias de URP candidatas con marcas de secuencia como marca myc, marca His, marca HA. Otro enfoque es fusionar la biblioteca con una enzima u otra proteína indicadora como proteína verde fluorescente. Es de particular interés la fusión de la biblioteca con un marcador de selección como beta-lactamasa o kanamicina-acil transferasa. Puede usarse selección con antibiótico para enriquecer en variantes con alto nivel de expresión y buena estabilidad genética. Pueden identificarse variantes con buena resistencia a proteasas cribando secuencias intactas después de la incubación con proteasas. Una forma eficaz para identificar secuencias de URP resistentes a proteasas es la visualización de fago bacteriano o procedimientos de visualización relacionados. Se han descrito múltiples sistemas en los que las secuencias que experimentan rápida proteólisis pueden enriquecerse por visualización de fago. Estos procedimientos pueden adoptarse fácilmente para enriquecer en secuencias resistentes a proteasas. Por ejemplo, puede clonarse una biblioteca de secuencias de URP candidatas entre una marca de afinidad y la proteínapIIIdel fago M13. La biblioteca puede entonces exponerse a proteasas o muestras biológicas que contienen proteasas como sangre o preparaciones lisosómicas. Las secuencias resistentes a proteasas que contienen fago pueden capturarse después del tratamiento con proteasas por unión a la marca de afinidad. Secuencias que resisten a la degradación por preparaciones lisosómicas son de particular interés debido a que la degradación lisosómica es una etapa clave durante la presentación de antígeno en células dendríticas y otras células presentadoras de antígeno. La visualización de fago puede utilizarse para identificar secuencias de URP candidatas que no se unen a un suero inmune particular con el fin de identificar secuencias de URP con baja inmunogenicidad. Pueden inmunizarse animales con una secuencia de URP candidata o con una biblioteca de secuencias de URP para producir anticuerpos contra las secuencias de URP en la biblioteca. El suero resultante puede entonces usarse para la inmunopurificación de fagos para eliminar o identificar secuencias que son reconocidas por anticuerpos en el suero inmune resultante. Otros procedimientos como visualización bacteriana, visualización de levadura, visualización ribosómica pueden utilizarse para identificar variantes de secuencias de URP con propiedades deseables. Otro enfoque es la identificación de secuencias de URP de interés por espectrometría de masas. Por ejemplo, puede incubarse una biblioteca de secuencias de URP candidatas con una proteasa o muestra biológica de interés e identificar secuencias que resistan a la degradación por espectrometría de masas. En un enfoque similar, pueden identificarse secuencias de URP que facilitan la captación oral. Puede alimentarse una mezcla de secuencias de URP candidatas a animales o seres humanos e identificar variantes con la mayor eficiencia de transferencia o captación a través de algún tejido barrera (es decir, dérmico, etc.) por espectrometría de masas. De un modo similar, pueden identificarse secuencias de URP que favorecen otros mecanismos de captación como administración pulmonar, intranasal, rectal, transdérmica. También pueden identificarse secuencias de URP que favorezcan la captación celular o secuencias de URP que resistan a la captación celular. [0127]URP sequences can be designed and selected to possess several of the following desired properties: a) high genetic stability of the coding sequences in the production host, b) high level of expression, c) low immunogenicity (predicted/calculated ), d) high stability in the presence of serum proteases and/or other tissue proteases, e) large hydrodynamic radius under physiological conditions. An exemplary approach to obtaining URP sequences that meet multiple criteria is to construct a library of candidate sequences and identify suitable subsequences from the library. The libraries may comprise random and/or semi-random sequences. Of particular use are codon libraries, which are a library of DNA molecules that contain multiple codons for the identical amino acid residue. Codon randomization can be applied to selected amino acid positions of a certain type or to most or all positions. True codon libraries only encode a single amino acid sequence, but can be easily combined with amino acid libraries, which is a population of DNA molecules that encode a mixture of amino acids (related or unrelated) at the residue position. Codon libraries allow the identification of genes that have relatively low repeatability at the DNA level, but that encode highly repetitive amino acid sequences. This is useful because repetitive DNA sequences tend to recombine, leading to instability. Codon libraries encoding limited amino acid diversity can also be constructed. Such libraries allow the introduction of a limited number of amino acids at some positions in the sequence, while other positions allow codon variation, but all codons encode the same amino acid. Partially random oligonucleotides can be synthesized by incorporating mixtures of nucleotides at the same position during oligonucleotide synthesis. Such partially random oligonucleotides can be fused by overlap PCR or ligation-based approaches. In particular, semi-random oligonucleotides encoding glycine-rich sequences can be multimerized. These oligonucleotides can differ in length and sequences and codon usage. As a result, a library of candidate URP sequences is obtained. Another procedure to generate libraries is to synthesize a starting sequence and subsequently subject these sequences to partial randomization. This can be done by culturing the gene encoding the URP sequences in a mutator strain or by amplification of the encoding gene under mutagenic conditions (Leung, D. et al. (1989) Technique, 1: 11-15). URP sequences with desirable properties can be identified from libraries using a variety of procedures. Sequences that have a high degree of genetic stability can be enriched by growing the library in a production host. Sequences that are unstable will accumulate mutations, which can be identified by DNA sequencing. URP sequence variants that can be expressed at high level can be identified by screening or selection using multiple protocols known to anyone skilled in the art. For example, multiple strains isolated from a library can be grown and expression levels compared. Expression levels can be measured by gel analysis, analytical chromatography or various ELISA-based procedures. Determination of expression levels of individual sequence variants can be facilitated by merging the library of candidate URP sequences with sequence tags such as myc tag, His tag, HA tag. Another approach is to fuse the library with an enzyme or other reporter protein such as green fluorescent protein. Of particular interest is the fusion of the library with a selection marker such as beta-lactamase or kanamycin-acyl transferase. Antibiotic selection can be used to enrich for variants with high expression level and good genetic stability. Variants with good protease resistance can be identified by screening for intact sequences after incubation with proteases. An effective way to identify protease-resistant URP sequences is bacterial phage display or related display procedures. Multiple systems have been described in which sequences undergoing rapid proteolysis can be enriched by phage display. These procedures can be easily adopted to enrich for protease-resistant sequences. For example, a library of candidate URP sequences can be cloned between an affinity tag and the pIII protein of phage M13. The library can then be exposed to proteases or protease-containing biological samples such as blood or lysosomal preparations. Phage-containing protease-resistant sequences can be captured after protease treatment by binding to the affinity tag. Sequences that resist degradation by lysosomal preparations are of particular interest because lysosomal degradation is a key step during antigen presentation in dendritic cells and other antigen-presenting cells. Phage display can be used to identify candidate URP sequences that do not bind a particular immune serum in order to identify URP sequences with low immunogenicity. Animals can be immunized with a candidate URP sequence or with a library of URP sequences to produce antibodies against the URP sequences in the library. The resulting serum can then be used for phage immunopurification to remove or identify sequences that are recognized by antibodies in the resulting immune serum. Other procedures such as bacterial display, yeast display, ribosomal display can be used to identify URP sequence variants with desirable properties. Another approach is the identification of URP sequences of interest by mass spectrometry. For example, a library of candidate URP sequences can be incubated with a protease or biological sample of interest and sequences that resist degradation by mass spectrometry can be identified. In a similar approach, URP sequences that facilitate oral uptake can be identified. A mixture of candidate URP sequences can be fed to animals or humans and variants with the highest efficiency of transfer or uptake across some barrier tissue (i.e., dermal, etc.) can be identified by mass spectrometry. In a similar way, URP sequences that favor other uptake mechanisms such as pulmonary, intranasal, rectal, and transdermal administration can be identified. URP sequences that favor cellular uptake or URP sequences that resist cellular uptake can also be identified.

[0128]Las secuencias de URP pueden diseñarse combinando secuencias de URP o fragmentos de secuencias de URP que se diseñaron por cualquiera de los procedimientos descritos anteriormente. Además, pueden aplicarse enfoques semi-aleatorios para optimizar secuencias que se diseñaron basándose en las reglas descritas anteriormente. Es de particular interés la optimización de codones con el objetivo de mejorar la expresión de las proteínas potenciadas y mejorar la estabilidad genética del gen codificante en los huéspedes de producción. La optimización de codones es de particular importancia para secuencias de URP que son ricas en glicina o que tienen secuencias de aminoácidos muy repetitivas. La optimización de codones puede realizarse usando programas informáticos (Gustafsson, C. y col. (2004) Trends Biotechnol, 22: 346-53), algunos de los cuales minimizan la detención ribosómica (Coda Genomics Inc.). Cuando se diseñan secuencias de URP pueden considerarse varias propiedades. Puede minimizarse la repetitividad en las secuencias de ADN codificantes. Además, puede evitarse o minimizarse el uso de codones que son raramente usados por el huésped de producción (es decir, los codones de arginina AGG y AGA y un codón de leucina enE. coli).Las secuencias de a Dn que tienen un alto nivel de glicina tienden a tener un alto contenido de GC que puede conducir a inestabilidad o bajos niveles de expresión. Así, cuando sea posible, se prefiere elegir codones de forma que el contenido de GC de la secuencia codificante de URP sea adecuado para el organismo de producción que se usará para fabricar el URP. [0128]URP sequences can be designed by combining URP sequences or fragments of URP sequences that were designed by any of the procedures described above. Furthermore, semi-random approaches can be applied to optimize sequences that were designed based on the rules described above. Of particular interest is codon optimization with the aim of improving the expression of enhanced proteins and improving the genetic stability of the coding gene in production hosts. Codon optimization is of particular importance for URP sequences that are rich in glycine or have highly repetitive amino acid sequences. Codon optimization can be performed using computer programs (Gustafsson, C. et al. (2004) Trends Biotechnol, 22: 346-53), some of which minimize ribosomal arrest (Coda Genomics Inc.). Several properties can be considered when designing URP sequences. Repetitivity in the coding DNA sequences can be minimized. Additionally, the use of codons that are rarely used by the production host (i.e., the AGG and AGA arginine codons and a leucine codon in E. coli) can be avoided or minimized. Glycine tend to have a high GC content which can lead to instability or low expression levels. Thus, where possible, it is preferred to choose codons so that the GC content of the URP coding sequence is suitable for the production organism that will be used to manufacture the URP.

[0129]Pueden prepararse genes que codifican URP en una o más etapas, tanto completamente sintéticamente como por síntesis combinada con procedimientos enzimáticos tales como clonación mediada por enzimas de restricción, PCR y extensión por solapamiento. Los módulos de URP pueden construirse de forma que el gen que codifica el módulo de URP tenga baja repetitividad, mientras que la secuencia de aminoácidos codificada tenga un alto grado de repetitividad. El enfoque se ilustra en la Figura 11. Como primera etapa se construye una biblioteca de secuencias de URP relativamente cortas. Ésta puede ser una biblioteca de codones pura de forma que cada miembro de la biblioteca tenga la misma secuencia de aminoácidos, pero son posibles muchas secuencias codificantes diferentes. Para facilitar la identificación de miembros de bibliotecas de buena expresión, la biblioteca puede construirse como fusión con una proteína indicadora. Ejemplos de genes indicadores adecuados son proteína verde fluorescente, luciferasa, fosfatasa alcalina, beta-galactosidasa. Mediante cribado pueden identificarse secuencias de URP cortas que pueden expresarse en alta concentración en el organismo huésped de elección. Posteriormente, puede generarse una biblioteca de dímeros de URP aleatorios y repetir el cribado para alto nivel de expresión. La dimerización puede realizarse por ligación, extensión por solapamiento o técnicas de clonación similares. Este procedimiento de dimerización y posterior cribado puede repetirse múltiples veces hasta que la secuencia de u Rp resultante haya alcanzado la longitud deseada. Opcionalmente, pueden secuenciarse clones en la biblioteca para eliminar cepas aisladas que contienen secuencias no deseables. La biblioteca inicial de secuencias de URP cortas puede permitir alguna variación en la secuencia de aminoácidos. Por ejemplo, pueden aleatorizarse algunos codones de forma que puedan producirse varios aminoácidos hidrófilos en dicha posición. Durante el procedimiento de multimerización iterativa pueden cribarse miembros de la biblioteca para otras características como solubilidad o resistencia a proteasas, además de un cribado para expresión de alto nivel. En lugar de dimerizar secuencias de URP, también pueden generarse multímeros más largos. Esto permite aumentar más rápidamente la longitud de módulos de URP. [0129]Genes encoding URPs can be prepared in one or more steps, either completely synthetically or by synthesis combined with enzymatic procedures such as restriction enzyme-mediated cloning, PCR and overlap extension. URP modules can be constructed such that the gene encoding the URP module has low repeatability, while the encoded amino acid sequence has a high degree of repeatability. The approach is illustrated in Figure 11. As a first stage, a library of relatively short URP sequences is constructed. This may be a pure codon library so that each member of the library has the same amino acid sequence, but many different coding sequences are possible. To facilitate the identification of well-expressing library members, the library can be constructed as a fusion with a reporter protein. Examples of suitable reporter genes are green fluorescent protein, luciferase, alkaline phosphatase, beta-galactosidase. Short URP sequences that can be expressed in high concentration in the host organism of choice can be identified by screening. Subsequently, a library of random URP dimers can be generated and the screening for high level expression can be repeated. Dimerization can be performed by ligation, overlap extension or similar cloning techniques. This dimerization and subsequent screening procedure can be repeated multiple times until the resulting uRp sequence has reached the desired length. Optionally, clones in the library can be sequenced to eliminate isolates containing undesirable sequences. The initial library of short URP sequences may allow for some variation in the amino acid sequence. For example, some codons can be randomized so that several hydrophilic amino acids can be produced at that position. During the iterative multimerization procedure, library members can be screened for other characteristics such as solubility or protease resistance, in addition to screening for high-level expression. Instead of dimerizing URP sequences, longer multimers can also be generated. This allows the length of URP modules to be increased more quickly.

[0130]Muchas secuencias de URP contienen aminoácidos particulares a alta fracción. Tales secuencias pueden ser difíciles de producir por técnicas recombinantes, ya que sus genes codificantes pueden contener secuencias repetitivas que están sometidas a recombinación. Además, genes que contienen codones particulares a frecuencias muy altas pueden limitar la expresión, ya que los ARNt cargados respectivos en el huésped de producción se vuelven limitantes. Un ejemplo es la producción recombinante de GRS. Los residuos de glicina están codificados por 4 tripletes, GGG, GGC, GGA y GGT. Como resultado, los genes que codifican GRS tienden a tener alto contenido de Gc y tienden a ser particularmente repetitivos. Un reto adicional puede resultar del sesgo de codones del huésped de producción. En el caso deE. coli,dos codones de glicina, GGA y GGG, se usan raramente en proteínas altamente expresadas. Así, la optimización de codones del gen que codifica secuencias de URP puede ser muy deseable. Puede optimizarse el uso de codones empleando programas informáticos que consideran sesgo de codones del huésped de producción (Gustafsson, C. y col. (2004) Trends Biotechnol, 22: 346-53). Como alternativa, pueden construirse bibliotecas de codones en las que todos los miembros de la biblioteca codifican la misma secuencia de aminoácidos, pero en la que se varía el uso de codones. Tales bibliotecas pueden cribarse para miembros altamente expresantes y genéticamente estables que son particularmente adecuados para la producción a gran escala de productos que contienen URP. [0130]Many URP sequences contain particular amino acids at a high fraction. Such sequences may be difficult to produce by recombinant techniques, since their coding genes may contain repetitive sequences that are subject to recombination. Furthermore, genes containing particular codons at very high frequencies can limit expression, as the respective charged tRNAs in the production host become limiting. An example is the recombinant production of GRS. Glycine residues are encoded by 4 triplets, GGG, GGC, GGA and GGT. As a result, genes encoding GRS tend to be high in Gc and tend to be particularly repetitive. An additional challenge may result from production host codon bias. In the case of E. coli, two glycine codons, GGA and GGG, are rarely used in highly expressed proteins. Thus, codon optimization of the gene encoding URP sequences may be highly desirable. Codon usage can be optimized using software that considers production host codon bias (Gustafsson, C. et al. (2004) Trends Biotechnol, 22: 346-53). Alternatively, codon libraries can be constructed in which all members of the library encode the same amino acid sequence, but in which the codon usage is varied. Such libraries can be screened for highly expressing and genetically stable members that are particularly suitable for large scale production of URP-containing products.

Proteínas recombinantes no estructuradas multivalentes (MURP):Multivalent Unstructured Recombinant Proteins (MURP):

[0131]Como se observa anteriormente, los URP objeto son particularmente útiles como módulos para diseñar proteínas de valor terapéutico. Por consiguiente, en el presente documento se desvelan proteínas que comprenden uno o más URP objeto. Tales proteínas se denominan en el presente documento proteínas recombinantes no estructuradas multivalentes (MURP). [0131]As noted above, the subject URPs are particularly useful as modules for designing proteins of therapeutic value. Accordingly, proteins comprising one or more subject URPs are disclosed herein. Such proteins are referred to herein as multivalent unstructured recombinant proteins (MURP).

[0132]Para construir MURP, una o más secuencias de URP pueden fusionarse con el extremo N o extremo C de una proteína o insertarse en el centro de la proteína, por ejemplo, en bucles de una proteína o entre módulos de la proteína de interés, dando las propiedades mejoradas de proteínas modificadas resultantes con respecto a las proteínas sin modificar. La longitud combinada de secuencias de URP que están unidas a una proteína puede tener 200 o más aminoácidos. [0132]To construct MURP, one or more URP sequences can be fused to the N-terminus or C-terminus of a protein or inserted into the center of the protein, for example, in loops of a protein or between modules of the protein of interest. , giving the resulting improved properties of modified proteins with respect to unmodified proteins. The combined length of URP sequences that are bound to a protein can be 200 or more amino acids.

[0133]Las MURP presentan una o más propiedades mejoradas como se detalla a continuación. [0133]MURPs have one or more improved properties as detailed below.

Semivida mejorada:Improved half-life:

[0134]Añadiendo secuencias de URP a una proteína farmacéuticamente activa pueden mejorarse muchas propiedades de esa proteína. En particular, añadiendo una secuencia de URP larga puede aumentarse significativamente la semivida en suero de la proteína. Tales URP contienen secuencias de aminoácidos de al menos aproximadamente 200 o más aminoácidos. [0134]Adding URP sequences to a pharmaceutically active protein can improve many properties of that protein. In particular, adding a long URP sequence can significantly increase the serum half-life of the protein. Such URPs contain amino acid sequences of at least about 200 or more amino acids.

[0135]Los URP pueden fragmentarse de forma que la proteína resultante contenga múltiples URP, o múltiples fragmentos de URP. En un aspecto, los URP fusionados pueden aumentar el radio hidrodinámico de una proteína y así reducir su eliminación de la sangre por el riñón. El aumento en el radio hidrodinámico de la proteína de fusión resultante con respecto a la proteína sin modificar puede detectarse por ultracentrifugación, cromatografía de exclusión por tamaño o dispersión de la luz. [0135]URPs can be fragmented so that the resulting protein contains multiple URPs, or multiple fragments of URPs. In one aspect, fused URPs can increase the hydrodynamic radius of a protein and thus reduce its clearance from the blood by the kidney. The increase in the hydrodynamic radius of the resulting fusion protein relative to the unmodified protein can be detected by ultracentrifugation, size exclusion chromatography, or light scattering.

Selectividad por tejido mejorada:Improved tissue selectivity:

[0136]El aumento del radio hidrodinámico también puede conducir a penetración reducida en tejidos, que puede explotarse para minimizar efectos secundarios de una proteína farmacéuticamente activa. Está muy documentado que los polímeros hidrófilos tienen una tendencia a acumularse en tejido tumoral que se produce por el potenciado efecto de la permeabilidad y retención (EPR). La causa subyacente del efecto EPR es la naturaleza porosa de la vasculatura tumoral (McDonald, D. M. y col. (2002) Cancer Res, 62: 5381-5) y la falta de drenaje linfático en tejidos tumorales. Por tanto, la selectividad de proteínas farmacéuticamente activas por tejidos tumorales puede potenciarse añadiendo polímeros hidrófilos. Como tal, el índice terapéutico de una proteína farmacéuticamente activa dada puede aumentarse incorporando los URP objeto. [0136]Increased hydrodynamic radius can also lead to reduced tissue penetration, which can be exploited to minimize side effects of a pharmaceutically active protein. It is well documented that hydrophilic polymers have a tendency to accumulate in tumor tissue that is produced by the enhanced permeability and retention (EPR) effect. The underlying cause of the EPR effect is the porous nature of the tumor vasculature (McDonald, D. M. et al. (2002) Cancer Res, 62: 5381-5) and the lack of lymphatic drainage in tumor tissues. Therefore, the selectivity of pharmaceutically active proteins for tumor tissues can be enhanced by adding hydrophilic polymers. As such, the therapeutic index of a given pharmaceutically active protein can be increased by incorporating the subject URPs.

Protección de la degradación e inmunogenicidad reducida:Protection from degradation and reduced immunogenicity:

[0137]La adición de secuencias de URP puede mejorar significativamente la resistencia a proteasas de una proteína. Las propias secuencias de URP pueden diseñarse para ser resistentes a proteasas y uniéndolas a una proteína puede protegerse esa proteína del acceso de enzimas degradantes. Las secuencias de URP pueden añadirse a proteínas farmacéuticamente activas con el objetivo de reducir interacciones no deseables de la proteína con otros receptores o superficies. Para lograr esto puede ser beneficioso añadir las secuencias de URP a la proteína farmacéuticamente activa en proximidad al sitio de la proteína que hace tales contactos no deseados. En particular, pueden añadirse secuencias de URP a proteínas farmacéuticamente activas con el objetivo de reducir sus interacciones con cualquier componente del sistema inmunitario para prevenir una respuesta inmunitaria contra el producto del procedimiento de la invención. La adición de una secuencia de URP a una proteína farmacéuticamente activa puede reducir la interacción con anticuerpos preexistentes o receptores de linfocitos B. Además, la adición de secuencias de URP puede reducir la captación y procesamiento del producto del procedimiento de la invención por células presentadoras de antígeno. La adición de una o más secuencias de URP a una proteína es una forma preferida de reducir su inmunogenicidad, ya que suprimirá una respuesta inmunitaria en muchas especies, permitiendo que se prediga la inmunogenicidad esperada de un producto en pacientes basándose en datos animales. Tal prueba independiente de inmunogenicidad de la especie no es posible para enfoques que se basan en la identificación y eliminación de epítopes de linfocitos T humanos o comparación de secuencias con secuencias humanas. [0137]The addition of URP sequences can significantly improve the protease resistance of a protein. The URP sequences themselves can be designed to be resistant to proteases and binding them to a protein can protect that protein from access by degrading enzymes. URP sequences can be added to pharmaceutically active proteins with the aim of reducing undesirable interactions of the protein with other receptors or surfaces. To achieve this it may be beneficial to add the URP sequences to the pharmaceutically active protein in proximity to the site on the protein that makes such unwanted contacts. In particular, URP sequences can be added to pharmaceutically active proteins with the aim of reducing their interactions with any component of the immune system to prevent an immune response against the product of the method of the invention. The addition of a URP sequence to a pharmaceutically active protein can reduce the interaction with preexisting antibodies or B cell receptors. In addition, the addition of URP sequences can reduce the uptake and processing of the product of the method of the invention by presenting cells. antigen. The addition of one or more URP sequences to a protein is a preferred way to reduce its immunogenicity, as it will suppress an immune response in many species, allowing the expected immunogenicity of a product in patients to be predicted based on animal data. Such species-independent testing of immunogenicity is not possible for approaches that rely on the identification and deletion of human T cell epitopes or comparison of sequences with human sequences.

Interrupción de epítopes de linfocitos T:Disruption of T cell epitopes:

[0138]Las secuencias de URP pueden introducirse en proteínas con el fin de interrumpir epítopes de linfocitos T. Esto es particularmente útil para proteínas que combinan múltiples módulos funcionales separados. La formación de epítopes de linfocitos T requiere que los fragmentos de péptido de un antígeno de proteína se unan a MHC. Las moléculas de MHC interaccionan con un segmento de aminoácidos corto, normalmente 9 residuos contiguos de los péptidos presentados. La fusión directa de diferentes módulos de unión en una molécula de proteína puede conducir a epítopes de linfocitos T que atraviesan dos dominios vecinos. Separando los módulos funcionales por módulos de URP se previene la generación de tales epítopes de linfocitos T que atraviesan módulos como se ilustra en la Figura 7. La inserción de secuencias de URP entre módulos funcionales también puede interferir con el procesamiento proteolítico en células presentadoras de antígeno, que conducirá a una reducción adicional de la inmunogenicidad. Otro enfoque para reducir el riesgo de inmunogenicidad es alterar epítopes de linfocitos T dentro de módulos funcionales de un producto. En el caso de microproteínas, un enfoque es que algunos de los bucles de intercisteína (aquellos que no participan en la unión a diana) sean ricos en glicina. En microproteínas, cuya estructura es debida a un número pequeño de cisteínas, podría de hecho sustituirse la mayoría o todos los residuos que no participan en la unión a diana con glicina, serina, glutamato, treonina, reduciéndose así las posibilidades de inmunogenicidad, a la vez que no se afecta la afinidad por la diana. Por ejemplo, esto puede llevarse a cabo realizando un 'barrido de glicinas' de todos los residuos, en el que cada residuo se sustituye con una glicina, luego seleccionando los clones que retienen la unión a diana usando visualización o cribado de fago, y luego combinando todas las sustituciones de glicina que son permitidas. En general, los módulos funcionales tienen una probabilidad mucho mayor de contener epítopes de linfocitos T que los módulos de URP. Puede reducirse la frecuencia de epítopes de linfocitos T en módulos funcionales reemplazando todos o muchos residuos de aminoácidos no críticos con residuos hidrófilos pequeños como gly, ser, ala, glu, asp, asn, gln, thr. Las posiciones en un módulo funcional que permiten la sustitución pueden identificarse usando una variedad de enfoques aleatorios o de ingeniería de proteínas basada en estructura. [0138]URP sequences can be introduced into proteins in order to disrupt T cell epitopes. This is particularly useful for proteins that combine multiple separate functional modules. The formation of T cell epitopes requires that peptide fragments of a protein antigen bind to MHC. MHC molecules interact with a short amino acid segment, typically 9 contiguous residues of the presented peptides. Direct fusion of different binding modules on one protein molecule can lead to T cell epitopes that span two neighboring domains. Separating functional modules by URP modules prevents the generation of such module-spanning T cell epitopes as illustrated in Figure 7. Insertion of URP sequences between functional modules may also interfere with proteolytic processing in antigen-presenting cells. , which will lead to a further reduction in immunogenicity. Another approach to reduce the risk of immunogenicity is to alter T cell epitopes within functional modules of a product. In the case of microproteins, one approach is for some of the intercysteine loops (those not involved in target binding) to be rich in glycine. In microproteins, whose structure is due to a small number of cysteines, most or all of the residues that do not participate in target binding could in fact be replaced with glycine, serine, glutamate, threonine, thus reducing the possibilities of immunogenicity, to the while the affinity for the target is not affected. For example, this can be carried out by performing a 'glycine scan' of all residues, in which each residue is replaced with a glycine, then selecting clones that retain target binding using display or phage screening, and then combining all glycine substitutions that are allowed. In general, functional modules are much more likely to contain T cell epitopes than URP modules. The frequency of T cell epitopes in functional modules can be reduced by replacing all or many non-critical amino acid residues with small hydrophilic residues such as gly, ser, ala, glu, asp, asn, gln, thr. Positions in a functional module that allow substitution can be identified using a variety of random or structure-based protein engineering approaches.

Solubilidad mejorada:Improved solubility:

[0139]Los módulos funcionales de una proteína pueden tener solubilidad limitada. En particular, módulos de unión tienden a llevar residuos hidrófobos sobre su superficie, que pueden limitar su solubilidad y pueden conducir a agregación. Separando o flanqueando tales módulos funcionales con módulos de URP puede mejorarse la solubilidad global del producto resultante. Esto es cierto en particular para módulos de URP que llevan un porcentaje significativo de residuos hidrófilos o cargados. Separando módulos funcionales con módulos de URP solubles pueden reducirse interacciones intramoleculares entre estos módulos funcionales. [0139]The functional modules of a protein may have limited solubility. In particular, binding modules tend to carry hydrophobic residues on their surface, which can limit their solubility and can lead to aggregation. Separating or flanking such functional modules with URP modules can improve the overall solubility of the resulting product. This is particularly true for URP modules that carry a significant percentage of hydrophilic or charged residues. Separating functional modules with soluble URP modules can reduce intramolecular interactions between these functional modules.

Perfil de pH mejorado y homogeneidad de la carga del producto:Improved pH profile and product loading homogeneity:

[0140]Pueden diseñarse secuencias de URP para llevar un exceso de cargas negativas o positivas. Como resultado, confieren un campo electrostático a cualquier componente de fusión que pueda utilizarse para desplazar el perfil de pH de una enzima o una interacción de unión. Además, el campo electrostático de una secuencia de URP cargada puede aumentar la homogeneidad de valores de pKa de cargas superficiales de un producto de proteína, que conduce a perfiles de pH bruscos de interacciones de ligandos y a separaciones refinadas por isoelectroenfoque o cromatoenfoque. [0140]URP sequences can be designed to carry excess negative or positive charges. As a result, they confer an electrostatic field to any fusion component that can be used to shift the pH profile of an enzyme or binding interaction. Furthermore, the electrostatic field of a charged URP sequence can increase the homogeneity of pKa values of surface charges of a protein product, leading to abrupt pH profiles of ligand interactions and to refined separations by isoelectrofocusing or chromatofocusing.

Propiedades de purificación mejoradas debido a pKa de producto más refinado:Improved purification properties due to more refined product pKa:

[0141]Cada aminoácido en disolución tiene por sí mismo un único pKa fijo, que es el pH al que sus grupos funcionales están protonados a la mitad. En una proteína típica se tienen muchos tipos de residuos y debido a la proximidad y los efectos de respiración de la proteína, también se cambian entre sí el pKa eficaz de formas variables. Debido a esto, a un amplio intervalo de condiciones de pH, proteínas típicas pueden adoptar cientos de especies diferentemente ionizadas, cada una con un peso molecular diferente y carga neta, debido a grandes números de combinaciones de residuos de aminoácidos cargados y neutros. Esto se denomina un espectro de ionización ancho y dificulta más el análisis (es decir, espectrometría de masas) y purificación de tales proteínas. [0141]Each amino acid in solution itself has a unique fixed pKa, which is the pH at which its functional groups are half protonated. In a typical protein you have many types of residues and due to the proximity and respiration effects of the protein, they also change each other's effective pKa in variable ways. Because of this, at a wide range of pH conditions, typical proteins can adopt hundreds of differently ionized species, each with a different molecular weight and net charge, due to large numbers of combinations of charged and neutral amino acid residues. This is called a broad ionization spectrum and makes the analysis (i.e., mass spectrometry) and purification of such proteins more difficult.

[0142]El PEG no tiene carga y no afecta el espectro de ionización de la proteína con la que está unido, dejándola con un amplio espectro de ionización. Sin embargo, un URP con un alto contenido de Gly y Glu solo existe en principio en dos estados: neutro (-COOH) si el pH está por debajo del pKa del glutamato y negativamente cargado (-COO') si el pH está por encima del pKa del glutamato. Los módulos de URP pueden formar un único tipo de molécula homogéneamente ionizada y pueden dar una única masa en espectrometría de masas. [0142]PEG has no charge and does not affect the ionization spectrum of the protein to which it is bound, leaving it with a broad ionization spectrum. However, a URP with a high content of Gly and Glu only exists in principle in two states: neutral (-COOH) if the pH is below the pKa of glutamate and negatively charged (-COO') if the pH is above of the pKa of glutamate. URP modules can form a single type of homogeneously ionized molecule and can give a single mass in mass spectrometry.

[0143]Si se desea, las MURP pueden expresarse como una fusión con un URP que tiene un único tipo de carga (Glu) distribuida a separación constante por el módulo de URP. Puede elegirse incorporar 25-50 residuos de Glu por 20 kD de URP y todos estos 25-50 residuos tendrían pKa muy similar. [0143]If desired, MURPs can be expressed as a fusion with a URP that has a single type of charge (Glu) distributed at constant spacing across the URP module. One can choose to incorporate 25-50 residues of Glu per 20 kD of URP and all of these 25-50 residues would have very similar pKa.

[0144]Además, la adición de 25-50 cargas negativas a una proteína pequeña como IFN, hGH o GCSF (con solo 20 residuos cargados) aumentaría la homogeneidad de la carga del producto y aumentaría su punto isoeléctrico, que sería muy próximo al pKa del glutamato libre. [0144]In addition, the addition of 25-50 negative charges to a small protein such as IFN, hGH or GCSF (with only 20 charged residues) would increase the charge homogeneity of the product and increase its isoelectric point, which would be very close to the pKa of free glutamate.

[0145]El aumento en la homogeneidad de la carga de la población de proteínas tiene propiedades de procesamiento favorables tales como en intercambio iónico, isoelectroenfoque, espectrometría de masas, etc., en comparación con la PEGilación tradicional. [0145]The increase in charge homogeneity of the protein population has favorable processing properties such as in ion exchange, isoelectric focusing, mass spectrometry, etc., compared to traditional PEGylation.

Formulación mejorada y/o administración:Improved formulation and/or administration:

[0146]La adición de secuencias de URP a proteínas farmacéuticamente activas puede simplificar significativamente la formulación y o la administración de los productos resultantes. Las secuencias de URP pueden diseñarse para ser muy hidrófilas y como resultado mejoran la solubilidad de (por ejemplo) proteínas humanas, que frecuentemente contienen parches hidrófobos que se usan para unirse a otras proteínas humanas. La formulación de tales proteínas humanas, como anticuerpos, puede ser bastante exigente y frecuentemente limita sus opciones de concentración y administración. Los URP pueden reducir la precipitación y agregación de productos y permite que se usen formulaciones más simples que contienen menos componentes, que son normalmente necesarios para estabilizar un producto en disolución. La solubilidad mejorada de productos que contienen secuencias de URP permite formular estos productos a mayor concentración y como resultado puede reducirse el volumen de inyección para productos inyectables, que pueden permitir la inyección en casa, que está limitado a un volumen inyectado muy bajo. La adición de una secuencia de URP también puede simplificar el almacenamiento de los productos formulados resultantes. Las secuencias de URP pueden añadirse a proteínas farmacéuticamente activas para facilitar su captación oral, pulmonar, rectal o intranasal. Las secuencias de URP pueden facilitar diversos modos de administración debido a que permiten mayores concentraciones de producto y estabilidad de producto mejorada. Pueden lograrse mejoras adicionales diseñando secuencias de URP que facilitan la penetración en la membrana.Producción mejorada:[0146]The addition of URP sequences to pharmaceutically active proteins can significantly simplify the formulation and/or administration of the resulting products. URP sequences can be designed to be very hydrophilic and as a result improve the solubility of (for example) human proteins, which often contain hydrophobic patches that are used to bind to other human proteins. The formulation of such human proteins, such as antibodies, can be quite demanding and often limits their concentration and delivery options. URPs can reduce product precipitation and aggregation and allow simpler formulations to be used that contain fewer components, which are normally necessary to stabilize a product in solution. The improved solubility of products containing URP sequences allows these products to be formulated at higher concentrations and as a result the injection volume for injectable products can be reduced, which may allow injection at home, which is limited to a very low injected volume. The addition of a URP sequence can also simplify storage of the resulting formulated products. URP sequences can be added to pharmaceutically active proteins to facilitate their oral, pulmonary, rectal or intranasal uptake. URP sequences can facilitate various modes of administration because they allow for higher product concentrations and improved product stability. Additional improvements can be achieved by designing URP sequences that facilitate membrane penetration. Improved production:

[0147]La adición de secuencias de URP puede tener beneficios significativos para la producción del producto resultante. Muchos productos recombinantes, especialmente proteínas humanas nativas, tienen una tendencia a formar agregados durante la producción que pueden ser difíciles o imposibles de disolver e incluso cuando se eliminan del producto final pueden volver a producirse. Éstos son normalmente debidos a parches hidrófobos por los cuales estas proteínas (humanas nativas) se pusieron en contacto con otras proteínas (humanas nativas) y la mutación de estos residuos se considera arriesgado debido a la inmunogenicidad. Sin embargo, los URP pueden aumentar la hidrofilia de tales proteínas y permitir su formulación sin mutar la secuencia de la proteína humana. Las secuencias de URP pueden facilitar el plegamiento de una proteína para alcanzar su estado nativo. Muchas proteínas farmacéuticamente activas se producen mediante procedimientos recombinantes en un estado agregado no nativo. Estos productos necesitan desnaturalizarse y posteriormente se incuban en condiciones que permitan que las proteínas se plieguen en su estado activo nativo. Una reacción secundaria frecuente durante la renaturalización es la formación de agregados. La fusión de secuencias de URP con una proteína reduce significativamente su tendencia a formar agregados y así facilita el plegamiento del componente farmacéuticamente activo del producto. Productos que contienen URP son mucho más fáciles de preparar con respecto a proteínas modificadas con polímeros. La modificación con polímeros químicos requiere etapas de modificación y de purificación adicionales después de purificarse la proteína activa. A diferencia, pueden fabricarse secuencias de URP usando procedimientos de ADN recombinante junto con la proteína farmacéuticamente activa. Los productos de los procedimientos de la invención también son significativamente más fáciles de caracterizar en comparación con productos modificados con polímeros. Debido al procedimiento de producción recombinante, pueden obtenerse productos más homogéneos con características moleculares definidas. Las secuencias de URP también pueden facilitar la purificación de un producto. Por ejemplo, secuencias de URP pueden incluir subsecuencias que pueden ser capturadas por cromatografía de afinidad. Un ejemplo son secuencias ricas en histidina, que pueden ser capturadas sobre resinas con metales inmovilizados como níquel. Las secuencias de URP también pueden diseñarse para tener un exceso de aminoácidos negativamente o positivamente cargados. Como resultado, pueden impactar significativamente en la carga neta de un producto, que puede facilitar la purificación de productos por cromatografía de intercambio iónica o electroforesis preparativa. [0147]The addition of URP sequences can have significant benefits to the production of the resulting product. Many recombinant products, especially native human proteins, have a tendency to form aggregates during production that can be difficult or impossible to dissolve and even when removed from the final product can occur again. These are normally due to hydrophobic patches by which these proteins (native human) came into contact with other proteins (native human) and mutation of these residues is considered risky due to immunogenicity. However, URPs can increase the hydrophilicity of such proteins and allow their formulation without mutating the human protein sequence. URP sequences can facilitate the folding of a protein to reach its native state. Many pharmaceutically active proteins are produced by recombinant procedures in a non-native aggregated state. These products need to be denatured and subsequently incubated under conditions that allow the proteins to fold into their native active state. A common side reaction during renaturation is the formation of aggregates. Fusion of URP sequences with a protein significantly reduces its tendency to form aggregates and thus facilitates the folding of the pharmaceutically active component of the product. Products containing URP are much easier to prepare relative to polymer-modified proteins. Modification with chemical polymers requires additional modification and purification steps after the active protein is purified. In contrast, URP sequences can be manufactured using recombinant DNA procedures together with the pharmaceutically active protein. The products of the processes of the invention are also significantly easier to characterize compared to polymer modified products. Due to the recombinant production procedure, more homogeneous products with defined molecular characteristics can be obtained. URP sequences can also facilitate purification of a product. For example, URP sequences may include subsequences that can be captured by affinity chromatography. An example is sequences rich in histidine, which can be captured on resins with immobilized metals such as nickel. URP sequences can also be designed to have an excess of negatively or positively charged amino acids. As a result, they can significantly impact the net charge of a product, which can facilitate purification of products by ion exchange chromatography or preparative electrophoresis.

[0148]Las MURP objeto pueden contener una variedad de módulos que incluyen, pero no se limitan a, módulos de unión, módulos efectores, módulos de multimerización, módulos del extremo C y módulos del extremo N. La Figura 1 representa una MURP a modo de ejemplo que tiene múltiples módulos. Sin embargo, las MURP también pueden tener arquitecturas relativamente simples que se ilustran en la Fig. 2. Las MURP también pueden contener sitios de fragmentación. Éstos pueden ser secuencias sensibles a proteasas o secuencias químicamente sensibles que pueden escindirse preferencialmente cuando las MURP llegan a su sitio diana. [0148]Object MURPs may contain a variety of modules including, but not limited to, binding modules, effector modules, multimerization modules, C-terminal modules, and N-terminal modules. Figure 1 represents a MURP as example that has multiple modules. However, MURPs can also have relatively simple architectures which are illustrated in Fig. 2. MURPs can also contain fragmentation sites. These may be protease-sensitive sequences or chemically sensitive sequences that can be preferentially cleaved when MURPs reach their target site.

Módulo de unión (BM):Bonding Module (BM):

[0149]Las MURP empleadas en los procedimientos de la presente invención pueden comprender uno o más módulos de unión. Módulo de unión (BM) se refiere a una secuencia de péptidos o de proteínas que puede unirse específicamente a una o varias dianas, que pueden ser una o más dianas terapéuticas o dianas accesorias, tales como para la elección de diana de células, tejidos u órganos. Los BM pueden ser péptidos lineales o cíclicos, péptidos restringidos a cisteína, microproteínas, proteínas de andamiaje (por ejemplo, fibronectina, anquirinas, cristalina, estreptavidina, fragmentos de anticuerpos, anticuerpos de dominio), hormonas peptídicas, factores de crecimiento, citocinas, o cualquier tipo de dominio de proteína, humano o no humano, natural o no natural, y pueden basarse en un andamiaje natural o no basarse en un andamiaje natural, o basarse en combinaciones o pueden ser fragmentos de cualquiera de lo anterior. Opcionalmente, estos BM pueden manipularse añadiendo, quitando o sustituyendo uno o múltiples aminoácidos con el fin de potenciar sus propiedades de unión, su estabilidad, u otras propiedades. Los módulos de unión pueden obtenerse de proteínas naturales, por diseño o por visualización de paquetes genéticos, que incluyen visualización de fago, visualización celular, visualización ribosómica u otros procedimientos de visualización. Los módulos de unión pueden unirse a la misma copia de la misma diana, que produce avidez, o pueden unirse a diferentes copias de la misma diana (que puede producir avidez si estas copias están conectadas o ligadas de alguna forma, tal como por una membrana celular), o pueden unirse a dos dianas sin relacionar (que da avidez si estas dianas están ligadas de alguna forma, tal como por una membrana). Los módulos de unión pueden identificarse cribando o analizando de otro modo bibliotecas aleatorias de péptidos o proteínas. [0149]The MURPs used in the methods of the present invention may comprise one or more binding modules. Binding module (BM) refers to a peptide or protein sequence that can specifically bind to one or more targets, which may be one or more therapeutic targets or accessory targets, such as for targeting cells, tissues or organs. BMs may be linear or cyclic peptides, cysteine-restricted peptides, microproteins, scaffolding proteins (e.g., fibronectin, ankyrins, crystallin, streptavidin, antibody fragments, domain antibodies), peptide hormones, growth factors, cytokines, or any type of protein domain, human or non-human, natural or non-natural, and may be based on a natural scaffold or not based on a natural scaffold, or based on combinations or may be fragments of any of the above. Optionally, these BMs can be manipulated by adding, removing or substituting one or multiple amino acids in order to enhance their binding properties, their stability, or other properties. Binding modules can be obtained from natural proteins, by design, or by gene package display, including phage display, cell display, ribosomal display, or other display procedures. The binding modules can bind to the same copy of the same target, which produces avidity, or they can bind to different copies of the same target (which can produce avidity if these copies are connected or linked in some way, such as by a membrane cellular), or they can bind to two unrelated targets (which gives avidity if these targets are linked in some way, such as by a membrane). Binding modules can be identified by screening or otherwise analyzing random libraries of peptides or proteins.

[0150]Módulos de unión particularmente deseables son aquellos que tras la incorporación en una MURP, la MURP da una puntuación de epítope T deseable. La puntuación de epítope T de una proteína es el log de Kd (constante de disociación, afinidad, tasa de disociación) de la unión de esa proteína a múltiples de los alelos de MHC humanos más comunes, como se desvela en Sturniolo T. y col. (1999) Nature Biotechnology 17:555). La puntuación oscila sobre al menos 15 logaritmos, de aproximadamente 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0, -1, -2, -3, -4, -5 (10e10 Kd) a aproximadamente -5. MURP preferidas dan una puntuación inferior a aproximadamente -3,5 [KKW: ¿En escala absoluta?] [0150]Particularly desirable binding modules are those that upon incorporation into a MURP, the MURP gives a desirable T epitope score. The T epitope score of a protein is the log Kd (dissociation constant, affinity, dissociation rate) of the binding of that protein to multiple of the most common human MHC alleles, as disclosed in Sturniolo T. et al. . (1999) Nature Biotechnology 17:555). The score ranges over at least 15 logarithms, approximately 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0, -1, -2, -3, -4, -5 (10e10 Kd ) to approximately -5. Preferred MURPs give a lower score of approximately -3.5 [KKW: On an absolute scale?]

[0151]También son de particular interés módulos de unión que comprenden enlaces disulfuro formados por apareamiento de dos residuos de cisteína. En ciertas realizaciones, los módulos de unión comprenden polipéptidos que tienen alto contenido de cisteína o alta densidad de disulfuro (HDD). Los módulos de unión de la familia HDD normalmente tienen 5-50% (5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40, 45 ó 50%) de residuos de cisteína y cada dominio contiene normalmente al menos dos disulfuros y opcionalmente un co-factor tal como calcio u otro ión. [0151]Also of particular interest are binding modules comprising disulfide bonds formed by pairing of two cysteine residues. In certain embodiments, the binding modules comprise polypeptides that have high cysteine content or high disulfide density (HDD). HDD family bonding modules typically have 5-50% (5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40, 45 or 50%) of cysteine residues and each domain typically contains at least two disulfides and optionally a co-factor such as calcium or another ion.

[0152]La presencia del andamiaje de HDD permite que estos módulos sean pequeños, pero que todavía adopten una estructura relativamente rígida. La rigidez es importante para obtener altas afinidades de unión, resistencia a proteasas y calor, que incluyen las proteasas que participan en el procesamiento de antígenos, y así contribuye a la baja inmunogenicidad o no inmunogenicidad de estos módulos. La región estructural de disulfuro pliega los módulos sin la necesidad de un gran número de interacciones de cadenas laterales hidrófobas en el interior de la mayoría de los módulos. El pequeño tamaño también es ventajoso para la rápida penetración en el tejido y para administración alternativa tal como oral, nasal, intestinal, pulmonar, barrera hematoencefálica, etc. Además, el pequeño tamaño también ayuda a reducir la inmunogenicidad. Puede obtenerse una mayor densidad de disulfuro, tanto aumentando el número de disulfuros como usando dominios con el mismo número de disulfuros, pero menos aminoácidos. También se desea disminuir el número de residuos fijos de no cisteína, de manera que esté disponible un mayor porcentaje de aminoácidos para la unión a diana. [0152]The presence of HDD scaffolding allows these modules to be small, but still adopt a relatively rigid structure. Stiffness is important to obtain high binding affinities, resistance to proteases and heat, including proteases involved in antigen processing, and thus contributes to the low immunogenicity or non-immunogenicity of these modules. The disulfide structural region folds the modules without the need for a large number of hydrophobic side chain interactions in the interior of most modules. The small size is also advantageous for rapid tissue penetration and for alternative administration such as oral, nasal, intestinal, pulmonary, blood-brain barrier, etc. Furthermore, the small size also helps reduce immunogenicity. A higher disulfide density can be obtained either by increasing the number of disulfides or by using domains with the same number of disulfides, but fewer amino acids. It is also desired to decrease the number of fixed non-cysteine residues, so that a greater percentage of amino acids are available for target binding.

[0153]Los módulos de unión que contienen cisteína pueden adoptar una amplia gama de patrones de enlaces disulfuro (DBP). Por ejemplo, módulos de dos disulfuros pueden tener tres patrones de enlaces disulfuro (DBP) diferentes, módulos de tres disulfuros pueden tener 15 DBP diferentes y módulos de cuatro disulfuros tienen hasta 105 DBP diferentes. Ejemplos naturales existen para todos los DBP de 2SS, la mayoría de los DBP de 3SS y menos de la mitad de los DBP de 4SS. [0153]Cysteine-containing binding modules can adopt a wide range of disulfide bond patterns (DBPs). For example, two-disulfide modules can have three different disulfide bond patterns (DBPs), three-disulfide modules can have 15 different DBPs, and four-disulfide modules have up to 105 different DBPs. Natural examples exist for all 2SS DBPs, most 3SS DBPs, and less than half of the 4SS DBPs.

[0154]En un aspecto, el módulo que contiene cisteína (C) natural o que no se produce naturalmente comprende un polipéptido que tiene dos enlaces disulfuro formados por apareamiento de cisteínas contenidos en el polipéptido según un patrón seleccionado del grupo que consiste en C1-2, 3-4, C1-3, 2-4 y C1-4, 2-3, en los que los dos números numéricos unidos por un guión indican que dos cisteínas contando desde el extremo N del polipéptido se aparean para formar un enlace disulfuro. En otro aspecto, el módulo que contiene cisteína (C) natural o que no se produce naturalmente comprende un polipéptido que tiene tres enlaces disulfuro formados por apareamiento de cisteínas entre andamiajes según un patrón seleccionado del grupo que consiste en C1-2, 3-45-6, C1-2, 3-5, 4-6, C1-2, 3-6, 4-5, C1-3, 2-4, 5-6, Cl-3, 2-5, 4-6, C1-3, 2-6, 4-4, C1-4, 2-3, 5-6, C1-4, 2-6, 3-5, C1-5, 2-2, 4-6, C1-5, 2-4, 3-6, C1-5, 2-6, 3-4, C1-6, 2-3, 4-5 y C1-6, 2-5, 3-4, en los que los dos números numéricos unidos por un guión indican que dos cisteínas contando desde el extremo N del polipéptido se aparean para formar un enlace disulfuro. En otro aspecto más, el módulo que contiene cisteína (C) natural o que no se produce naturalmente comprende un polipéptido que tiene al menos cuatro enlaces disulfuro formados por apareamiento de cisteínas contenidas en el polipéptido según un patrón seleccionado del grupo de permutaciones definidas por la fórmula anterior. En otro aspecto más, el módulo que contiene cisteína (C) natural o que no se produce naturalmente comprende un polipéptido que tiene al menos cinco, seis o más enlaces disulfuro formados por apareamiento de cisteínas entre proteínas según un patrón seleccionado del grupo de permutaciones representado por la fórmula anterior. Cualquiera de las proteínas que contienen cisteína o andamiajes desvelados en las solicitudes de patente en tramitación junto con la presente [números de serie 11/528.927 y 11/528.950] son módulos de unión candidatos. [0154]In one aspect, the natural or non-naturally occurring cysteine (C)-containing module comprises a polypeptide having two disulfide bonds formed by pairing of cysteines contained in the polypeptide according to a pattern selected from the group consisting of C1- 2, 3-4, C1-3, 2-4 and C1-4, 2-3, in which the two numerical numbers joined by a hyphen indicate that two cysteines counting from the N terminus of the polypeptide pair to form a bond disulfide. In another aspect, the natural or non-naturally occurring cysteine (C)-containing module comprises a polypeptide having three disulfide bonds formed by pairing of cysteines between scaffolds according to a pattern selected from the group consisting of C1-2, 3-45 -6, C1-2, 3-5, 4-6, C1-2, 3-6, 4-5, C1-3, 2-4, 5-6, Cl-3, 2-5, 4-6 , C1-3, 2-6, 4-4, C1-4, 2-3, 5-6, C1-4, 2-6, 3-5, C1-5, 2-2, 4-6, C1 -5, 2-4, 3-6, C1-5, 2-6, 3-4, C1-6, 2-3, 4-5 and C1-6, 2-5, 3-4, in which The two numerical numbers joined by a hyphen indicate that two cysteines counting from the N terminus of the polypeptide pair to form a disulfide bond. In yet another aspect, the natural or non-naturally occurring cysteine (C)-containing module comprises a polypeptide having at least four disulfide bonds formed by pairing of cysteines contained in the polypeptide according to a pattern selected from the group of permutations defined by the previous formula. In yet another aspect, the natural or non-naturally occurring cysteine (C)-containing module comprises a polypeptide having at least five, six or more disulfide bonds formed by pairing of cysteines between proteins according to a pattern selected from the group of permutations represented by the previous formula. Any of the cysteine-containing proteins or scaffolds disclosed in the co-pending patent applications [serial numbers 11/528,927 and 11/528,950] are candidate binding modules.

[0155]Los módulos de unión también pueden seleccionarse de bibliotecas de péptidos cíclicos restringidos a cisteína con 4, 5, 6, 7, 8, 9, 10, 11 y 12 aminoácidos aleatorizados o parcialmente aleatorizados entre las cisteínas unidas por disulfuro (por ejemplo, en un modo de formación), y en algunos casos aminoácidos aleatorizados adicionales sobre el exterior del par de cisteínas puede construirse usando una variedad de procedimientos. Los miembros de las bibliotecas con especificidad por una diana de interés pueden identificarse usando diversos procedimientos que incluyen visualización de fago, visualización ribosómica, visualización de levadura y otros procedimientos conocidos en la técnica. Tales péptidos cíclicos pueden utilizarse como módulos de unión en MURP. En una realización preferida, pueden manipularse adicionalmente péptidos restringidos a cisteína para aumentar la afinidad de unión, estabilidad proteolítica y/o especificidad usando enfoques de formación que conducen a módulos de unión que contienen más de un enlace disulfuro. Un enfoque de formación particular se ilustra en la Fig. 25. Se basa en la adición de una única cisteína más múltiples residuos aleatorizados sobre el lado del extremo N del péptido cíclico previamente seleccionado, además de sobre el lado del extremo C. Pueden generarse bibliotecas que han sido diseñadas como se ilustra en la Fig. 25. Los módulos de unión con propiedades mejoradas pueden identificarse por visualización de fago o procedimientos similares. Tales bibliotecas de formación pueden contener entre 1 y 12 posiciones aleatorias sobre el extremo N, además de sobre el lado del extremo C de un péptido cíclico. La distancia entre los residuos de cisteína en los flancos aleatorios recientemente añadidos y los residuos de cisteína en el péptido cíclico puede variarse entre 1 y 12 residuos. Tales bibliotecas contendrán cuatro residuos de cisteína por miembro de biblioteca, con dos cisteínas resultantes del péptido cíclico original y dos residuos de cisteína en los flancos recientemente añadidos. Este enfoque favorece un DBP 1-4 2-3 o un cambio en DBP, rompiendo el disulfuro 1-2 preexistente (= 2-3 en la construcción de 4 cisteínas) para formar un DBP 1-23-4 ó 1-32 4. Tales enfoques de formación pueden realizarse con cebadores específicos para clon de manera que no quede secuencia fija entre las áreas de la biblioteca como se muestra en la Fig. 25, o pueden realizarse con cebadores que usan (y entonces queda) una secuencia fija en ambos lados del péptido previamente seleccionado y, por tanto, estos mismos cebadores pueden usarse para cualquier clon previamente seleccionado como se ilustra en la Fig. 26. El procedimiento ilustrado en la Fig. 26 puede aplicarse a un conjunto de péptidos cíclicos con especificidad por una diana de interés. Se mostró que ambos enfoques de formación funcionaban para maduración por afinidad anti-VEGF por formación. Este enfoque puede repetirse para generar módulos de unión con seis o más residuos de cisteína. [0155]The binding modules can also be selected from libraries of cysteine-restricted cyclic peptides with 4, 5, 6, 7, 8, 9, 10, 11 and 12 amino acids randomized or partially randomized between the disulfide-linked cysteines (e.g. , in a formation mode), and in some cases additional randomized amino acids on the outside of the cysteine pair can be constructed using a variety of procedures. Members of libraries with specificity for a target of interest can be identified using various methods including phage display, ribosomal display, yeast display, and other methods known in the art. Such cyclic peptides can be used as binding modules in MURP. In a preferred embodiment, cysteine-restricted peptides can be further manipulated to increase binding affinity, proteolytic stability and/or specificity using formation approaches that lead to binding modules containing more than one disulfide bond. A particular training approach is illustrated in Fig. 25. It is based on the addition of a single cysteine plus multiple randomized residues on the N-terminal side of the previously selected cyclic peptide, in addition to on the C-terminal side. Libraries can be generated which have been designed as illustrated in Fig. 25. Binding modules with improved properties can be identified by phage display or similar procedures. Such training libraries may contain between 1 and 12 random positions on the N-terminus as well as on the C-terminus side of a cyclic peptide. The distance between the cysteine residues on the newly added random flanks and the cysteine residues on the cyclic peptide can be varied between 1 and 12 residues. Such libraries will contain four cysteine residues per library member, with two cysteines resulting from the original cyclic peptide and two cysteine residues on the newly added flanks. This approach favors a 1-4 2-3 DBP or a change in DBP, cleaving the pre-existing 1-2 disulfide (= 2-3 in the 4-cysteine construct) to form a 1-23-4 or 1-32 4 DBP. Such training approaches can be performed with clone-specific primers so that no fixed sequence remains between areas of the library as shown in Fig. 25, or they can be performed with primers that use (and then remain) a fixed sequence in both sides of the previously selected peptide and, therefore, these same primers can be used for any previously selected clone as illustrated in Fig. 26. The procedure illustrated in Fig. 26 can be applied to a set of cyclic peptides with specificity for a target of interest. Both training approaches were shown to work for anti-VEGF affinity maturation by training. This approach can be repeated to generate binding modules with six or more cysteine residues.

[0156]Otra formación de un disulfuro en una secuencia de 2 disulfuros se ilustra en la Fig. 27. Implica la dimerización de un conjunto previamente seleccionado de péptidos de 1 disulfuro consigo mismo de manera que el conjunto de péptidos preseleccionado termine en el extremo N, además de en la posición del extremo C. Este enfoque favorece la formación de secuencias de 2 disulfuros que reconocen dos epítopes separados sobre una diana. [0156]Another formation of a disulfide in a 2-disulfide sequence is illustrated in Fig. 27. It involves dimerization of a preselected set of 1-disulfide peptides with itself such that the preselected set of peptides terminates at the N-terminus. , in addition to the C-terminal position. This approach favors the formation of 2-disulfide sequences that recognize two separate epitopes on a target.

[0157]Otro enfoque de formación implica la adición de una secuencia (parcialmente) aleatorizada de 6-15 residuos que contiene dos cisteínas que están separadas 4, 5, 6, 7, 8, 9 ó 10 aminoácidos, con posiciones aleatorizadas opcionalmente adicionales fuera de las cisteínas ligadas. Esta secuencia aleatoria de 2 cisteínas se añade sobre el lado del extremo N del péptido previamente seleccionado, o sobre el lado del extremo C. Este enfoque favorece un DBP 1-23-4, aunque pueden formarse otros DBP. Este enfoque puede repetirse para generar módulos de unión con seis o más residuos de cisteína. [0157]Another training approach involves the addition of a (partially) randomized sequence of 6-15 residues containing two cysteines that are 4, 5, 6, 7, 8, 9, or 10 amino acids apart, with optionally additional randomized positions outside. of the linked cysteines. This random sequence of 2 cysteines is added on the N-terminal side of the previously selected peptide, or on the C-terminal side. This approach favors a 1-23-4 DBP, although other DBPs can be formed. This approach can be repeated to generate binding modules with six or more cysteine residues.

[0158]Los módulos de unión pueden construirse basándose en andamiajes de estructuras naturales. Tales andamiajes pueden identificarse por búsqueda en bases de datos. Bibliotecas que se basan en andamiajes naturales pueden someterse a inmunopurificación por visualización de fago, seguido de cribado para identificar secuencias que se unen específicamente a una diana de interés. [0158]Joining modules can be built based on scaffolding of natural structures. Such scaffolds can be identified by database searching. Libraries that are based on natural scaffolds can undergo immunopurification by phage display, followed by screening to identify sequences that specifically bind to a target of interest.

[0159]Está disponible una amplia selección de andamiajes naturales para construir los módulos de unión. La elección de un andamiaje particular dependerá de la diana prevista. Ejemplos no limitantes de andamiajes naturales incluyen proteínas similares a toxinas de serpiente tales como toxinas del veneno de serpiente y dominio extracelular de receptores de la superficie celular humana. Ejemplos no limitantes de toxinas del veneno de serpiente son erabutoxina B, gamma-cardiotoxina, faciculina, toxina muscarínica, erabutoxina A, neurotoxina I, cardiotoxina V4II (toxina III), cardiotoxina V, alfa-cobratoxina, neurotoxina larga 1, FS2 axina, bungarotoxina, bucandina, cardiotoxina CTXI, cardiotoxina CTX IIB, cardiotoxina II, cardiotoxina III, cardiotoxina IV, cobrotoxina 2, alfa-toxinas, neurotoxina II (cobrotoxina B), toxina B (neurotoxina), candotoxina, bucaína. Ejemplos no limitantes de dominio extracelular de receptores de la superficie celular (humana) incluyen CD59, receptor de activina tipo II, ectodominio del receptor Ia de BMP, dominio extracelular del receptor de tipo II de TGF-beta. Otros andamiajes naturales incluyen, pero no se limitan a, A-dominios, EGF, Ca-EGF, TNF-R, Notch, DSL, Trefoil, PD, TSP1,<t>S2, TSP3, anato, integrina beta, tiroglobulina, defensina 1, defensina 2, ciclotida, SHKT, desintegrinas, miotoxinas, gamma-tioneínas, conotoxina, mu-conotoxina, omega-atracotoxinas, delta-atracotoxinas, además de familias adicionales desveladas en las solicitudes de patente en tramitación junto con la presente número de serie 11/528.927 y 11/528.950, que se incorporan en el presente documento en su totalidad. [0159]A wide selection of natural scaffolds is available to construct the binding modules. The choice of a particular scaffold will depend on the intended target. Non-limiting examples of natural scaffolds include snake toxin-like proteins such as snake venom toxins and extracellular domain of human cell surface receptors. Non-limiting examples of snake venom toxins are erabutoxin B, gamma-cardiotoxin, faciculin, muscarinic toxin, erabutoxin A, neurotoxin I, cardiotoxin V4II (toxin III), cardiotoxin V, alpha-cobratoxin, long neurotoxin 1, FS2 axin, bungarotoxin , bucandin, cardiotoxin CTXI, cardiotoxin CTX IIB, cardiotoxin II, cardiotoxin III, cardiotoxin IV, cobrotoxin 2, alpha-toxins, neurotoxin II (cobrotoxin B), toxin B (neurotoxin), candotoxin, bucaine. Non-limiting examples of extracellular domain of cell surface receptors (human) include CD59, activin type II receptor, BMP receptor Ia ectodomain, TGF-beta type II receptor extracellular domain. Other natural scaffolds include, but are not limited to, A-domains, EGF, Ca-EGF, TNF-R, Notch, DSL, Trefoil, PD, TSP1,<t>S2, TSP3, annatto, beta integrin , thyroglobulin, defensin 1, defensin 2, cyclotide, SHKT, disintegrins, myotoxins, gamma-thioneins, conotoxin, mu-conotoxin, omega-atrachotoxins, delta-atrachotoxins, in addition to additional families disclosed in the patent applications pending together with the present serial number 11/528,927 and 11/528,950, which are incorporated herein in their entirety.

[0160]Se ha descrito una gran variedad de procedimientos que permiten identificar moléculas de unión en una gran biblioteca de variantes. Un procedimiento es la síntesis química. Los miembros de las bibliotecas pueden sintetizarse sobre perlas de forma que cada perla lleve una secuencia de péptidos diferente. Las perlas que llevan ligandos con una especificidad deseable pueden identificarse usando componentes de unión marcados. Otro enfoque es la generación de sub-bibliotecas de péptidos que permiten identificar secuencias de unión específicas en un procedimiento iterativo (Pinilla, C. y col. (1992) BioTechniques, 13: 901-905). Más comúnmente usados son los procedimientos de visualización en los que una biblioteca de variantes se expresa sobre la superficie de un fago, proteína o célula. Estos procedimientos tienen en común que el ADN o ARN que codifica cada variante en la biblioteca está físicamente ligado al ligando. Esto permite detectar o recuperar el ligando de interés y luego determinar su secuencia de péptidos secuenciando el ADN o ARN unido. Los procedimientos de visualización permiten que un experto en la técnica enriquezca miembros de las bibliotecas con propiedades de unión deseables de grandes bibliotecas de variantes aleatorias. Frecuentemente, variantes con propiedades de unión deseables pueden identificarse de bibliotecas enriquecidas cribando cepas individuales aisladas de una biblioteca enriquecida para propiedades deseables. Ejemplos de procedimientos de visualización son fusión con el represor lac (Cull, M. y col. (1992) Proc. Natl. Acad. Sci. USA, 89: 1865-1869), visualización de superficie celular (Wittrup, K. D. (2001) Curr Opin Biotechnol, 12: 395-9). Son de particular interés procedimientos en los que los péptidos o proteínas aleatorios se ligan a partículas de fago. Comúnmente se usan fago M13 (Smith, G. P. y col. (1997) Chem Rev, 97: 391-410) y fago T7 (Danner, S. y col. (2001) Proc Natl Acad Sci U S A, 98: 12954-9). Hay múltiples procedimientos disponibles para visualizar péptidos o proteínas sobre el fago M13. En muchos casos, la secuencia de la biblioteca está fusionada con el extremo N del péptidopIIIdel fago M13. El fago lleva normalmente 3-5 copias de esta proteína y así el fago en una biblioteca tal llevará en la mayoría de los casos entre 3-5 copias de un miembro de la biblioteca. Este enfoque se denomina visualización multivalente. Una alternativa es la visualización de fagémido en la que la biblioteca está codificada sobre un fagémido. Las partículas de fago pueden formarse por infección de células que llevan un fagémido con un fago colaborador (Lowman, H. B. y col. (1991) Biochemistry, 30: 10832-10838). Este procedimiento normalmente conduce a visualización monovalente. En algunos casos se prefiere la visualización monovalente para obtener ligantes de alta afinidad. En otros casos se prefiere la visualización multivalente (O'Connell, D. y col. (2002) J Mol Biol. 321: 49-56). [0160]A wide variety of procedures have been described that allow binding molecules to be identified in a large library of variants. One procedure is chemical synthesis. Library members can be synthesized on beads so that each bead carries a different peptide sequence. Beads carrying ligands with desirable specificity can be identified using labeled binding components. Another approach is the generation of peptide sub-libraries that allow specific binding sequences to be identified in an iterative procedure (Pinilla, C. et al. (1992) BioTechniques, 13: 901-905). Most commonly used are display procedures in which a library of variants is expressed on the surface of a phage, protein or cell. These procedures have in common that the DNA or RNA that encodes each variant in the library is physically linked to the ligand. This allows the ligand of interest to be detected or recovered and then its peptide sequence determined by sequencing the bound DNA or RNA. The display procedures allow one skilled in the art to enrich library members with desirable binding properties from large libraries of random variants. Frequently, variants with desirable binding properties can be identified from enriched libraries by screening individual strains isolated from an enriched library for desirable properties. Examples of visualization procedures are fusion with the lac repressor (Cull, M. et al. (1992) Proc. Natl. Acad. Sci. USA, 89: 1865-1869), cell surface visualization (Wittrup, K. D. (2001) Curr Opin Biotechnol, 12: 395-9). Of particular interest are methods in which random peptides or proteins are ligated to phage particles. Phage M13 (Smith, G. P. et al. (1997) Chem Rev, 97: 391-410) and phage T7 (Danner, S. et al. (2001) Proc Natl Acad Sci U S A, 98: 12954-9) are commonly used. . There are multiple procedures available to visualize peptides or proteins on phage M13. In many cases, the library sequence is fused to the N terminus of the phage M13 peptide pIII. The phage normally carries 3-5 copies of this protein and so the phage in such a library will in most cases carry between 3-5 copies of a member of the library. This approach is called multivalent visualization. An alternative is phagemid visualization in which the library is encoded on a phagemid. Phage particles can be formed by infection of cells carrying a phagemid with a helper phage (Lowman, H. B. et al. (1991) Biochemistry, 30: 10832-10838). This procedure usually leads to monovalent visualization. In some cases, monovalent display is preferred to obtain high affinity binders. In other cases, multivalent visualization is preferred (O'Connell, D. et al. (2002) J Mol Biol. 321: 49-56).

[0161]Se han descrito una variedad de procedimientos para enriquecer secuencias con características deseables por visualización de fago. Puede inmovilizarse una diana de interés por unión a inmunotubos, placas de microtitulación, perlas magnéticas u otras superficies. Posteriormente, una biblioteca de fagos se pone en contacto con la diana inmovilizada, el fago que carece de un ligando de unión se lava, y el fago que lleva un ligando específico para diana puede eluirse mediante una variedad de condiciones. La elución puede realizarse a pH bajo, pH alto, urea u otras condiciones que tienden a romper contactos proteína-proteína. El fago unido también puede eluirse añadiendo células deE. colide forma que la elución del fago pueda infectar directamente el huésped deE. coliañadido. Un protocolo interesante es la elución con proteasa que puede degradar el ligando unido a fago o la diana inmovilizada. También pueden utilizarse proteasas como herramientas para enriquecer ligandos unidos a fago resistentes a proteasas. Por ejemplo, puede incubarse una biblioteca de ligandos unidos a fago con una o más proteasas (humanas o de ratón) antes de la inmunopurificación sobre la diana de interés. Este procedimiento degrada y elimina ligandos lábiles a proteasas de la biblioteca (Kristensen, P. y col. (1998) Fold Des, 3: 321-8). También pueden enriquecerse bibliotecas de visualización de fago de ligandos para unirse a muestras biológicas complejas. Ejemplos son la inmunopurificación sobre fracciones de membrana celular inmovilizadas (Tur, M. K. y col. (2003) Int J Mol Med, 11: 523-7), o células enteras (Rasmussen, U. B. y col. (2002) Cancer Gene Ther, 9: 606-12; Kelly, K. A. y col. (2003) Neoplasia, 5: 437-44). En algunos casos tienen que optimizarse las condiciones de inmunopurificación para el enriquecimiento de ligantes específicos para células de bibliotecas de fagos (Watters, J. M. y col. (1997) Immunotechnology, 3: 21-9). La inmunopurificación de fagos también puede realizarse en pacientes o animales vivos. Este enfoque es de particular interés para la identificación de ligandos que se unen a dianas vasculares (Arap, W. y col. (2002) Nat Med, 8: 121-7). [0161]A variety of procedures have been described to enrich sequences with desirable characteristics by phage display. A target of interest can be immobilized by binding to immunotubes, microtiter plates, magnetic beads or other surfaces. Subsequently, a phage library is contacted with the immobilized target, phage lacking a binding ligand is washed, and phage carrying a target-specific ligand can be eluted using a variety of conditions. Elution can be performed at low pH, high pH, urea, or other conditions that tend to break protein-protein contacts. Bound phage can also be eluted by adding E. cells. colide so that the elution of the phage can directly infect the host of E. co-added. An interesting protocol is protease elution that can degrade phage-bound ligand or immobilized target. Proteases can also be used as tools to enrich for protease-resistant phage-bound ligands. For example, a library of phage-bound ligands can be incubated with one or more proteases (human or mouse) prior to immunopurification on the target of interest. This procedure degrades and removes protease-labile ligands from the library (Kristensen, P. et al. (1998) Fold Des, 3: 321-8). Phage display libraries can also be enriched for ligands to bind to complex biological samples. Examples are immunopurification on immobilized cell membrane fractions (Tur, M. K. et al. (2003) Int J Mol Med, 11: 523-7), or whole cells (Rasmussen, U. B. et al. (2002) Cancer Gene Ther, 9 : 606-12; Kelly, K. A. et al. (2003) Neoplasia, 5: 437-44). In some cases immunopurification conditions have to be optimized for the enrichment of cell-specific binders from phage libraries (Watters, J. M. et al. (1997) Immunotechnology, 3: 21-9). Phage immunopurification can also be performed in patients or live animals. This approach is of particular interest for the identification of ligands that bind to vascular targets (Arap, W. et al. (2002) Nat Med, 8: 121-7).

[0162]Están disponibles una variedad de procedimientos de clonación que permiten que un experto en la materia genere bibliotecas de secuencias de ADN que codifican bibliotecas de péptidos. Pueden utilizarse mezclas aleatorias de nucleótidos para sintetizar oligonucleótidos que contienen una o múltiples posiciones aleatorias. Este procedimiento permite controlar el número de posiciones aleatorias, además del grado de aleatorización. Además, pueden obtenerse secuencias aleatorias o semi-aleatorias de ADN por digestión parcial de ADN de muestras biológicas. Pueden usarse oligonucleótidos aleatorios para construir bibliotecas de plásmidos o fagos que se aleatorizan en localizaciones predefinidas. Esto puede hacerse por fusión de PCR como se describe en (de Kruif, J. y col. (1995) J Mol Biol, 248: 97-105). Otros protocolos se basan en ligación de ADN (Felici, F. y col. (1991) J Mol Biol, 222: 301-10; Kay, B. K. y col. (1993) Gene, 128: 59-65). Otro enfoque comúnmente usado es mutagénesis de Kunkel en la que una hebra mutagenizada de un plásmido o fagémido se sintetiza usando ADN cíclico monocatenario como molde. Véase, Sidhu, S. S. y col. (2000) Methods Enzymol, 328: 333-63; Kunkel, T. A. y col. (1987) Methods Enzymol, 154: 367-82. [0162]A variety of cloning procedures are available that allow one skilled in the art to generate libraries of DNA sequences encoding libraries of peptides. Random mixtures of nucleotides can be used to synthesize oligonucleotides containing one or multiple random positions. This procedure allows controlling the number of random positions, in addition to the degree of randomization. Furthermore, random or semi-random DNA sequences can be obtained by partial digestion of DNA from biological samples. Random oligonucleotides can be used to construct plasmid or phage libraries that are randomized to predefined locations. This can be done by fusion PCR as described in (de Kruif, J. et al. (1995) J Mol Biol, 248: 97-105). Other protocols are based on DNA ligation (Felici, F. et al. (1991) J Mol Biol, 222: 301-10; Kay, B. K. et al. (1993) Gene, 128: 59-65). Another commonly used approach is Kunkel mutagenesis in which a mutagenized strand of a plasmid or phagemid is synthesized using single-stranded cyclic DNA as a template. See, Sidhu, S. S. et al. (2000) Methods Enzymol, 328: 333-63; Kunkel, T. A. et al. (1987) Methods Enzymol, 154: 367-82.

[0163]La mutagénesis de Kunkel usa moldes que contienen bases de uracilo aleatoriamente incorporadas que pueden obtenerse de cepas deE. colicomo CJ236. La hebra molde que contiene uracilo se degrada preferencialmente tras la transformación enE. coli,mientras que se retiene la hebra mutagenizada sintetizadain vitro.Como resultado, la mayoría de las células transformadas llevan la versión mutagenizada del fagémido o fago. Un enfoque valioso para aumentar la diversidad en una biblioteca es combinar múltiples sub-bibliotecas. Estas sub bibliotecas pueden generarse por cualquiera de los procedimientos descritos anteriormente y pueden basarse en el mismo andamiaje o en andamiajes diferentes. [0163]Kunkel mutagenesis uses templates containing randomly incorporated uracil bases that can be obtained from strains of E. coli like CJ236. The uracil-containing template strand is preferentially degraded upon transformation into E. coli, while the mutagenized strand synthesized in vitro is retained. As a result, most transformed cells carry the mutagenized version of the phagemid or phage. A valuable approach to increasing diversity in a library is to combine multiple sub-libraries. These sublibraries can be generated by any of the procedures described above and can be based on the same or different scaffolds.

[0164]Recientemente se ha descrito un procedimiento útil para generar grandes bibliotecas de fagos de péptidos cortos (Scholle, M. D. y col. (2005) Comb Chem High Throughput Screen, 8: 545-51). Este procedimiento está relacionado con el enfoque de Kunkel, pero no requiere la generación de ADN mensajero monocatenario que contiene bases de uracilo aleatorias. En su lugar, el procedimiento empieza con un fago molde que lleva una o más mutaciones próximas al área que va a mutagenizarse y dicha mutación hace que el fago sea no infeccioso. El procedimiento usa un oligonucleótido mutagénico que lleva codones aleatorizados en algunas posiciones y que corrige la mutación inactivante del fado en el molde. Como resultado, solo partículas de fago mutagenizadas son infecciosas después de la transformación y muy pocos fagos parentales están contenidos en tales bibliotecas. Este procedimiento puede modificarse adicionalmente de varias formas. Por ejemplo, pueden utilizarse múltiples oligonucleótidos mutagénicos para mutagenizar simultáneamente múltiples regiones discontiguas de un fago. Los presentes inventores han dado un paso más con este enfoque aplicándolo a microproteínas completas de >25, 30, 35, 40, 45, 50, 55 y 60 aminoácidos, en lugar de a péptidos cortos de <10, 15 ó 20 aminoácidos, que plantea un desafío adicional. Este enfoque da ahora bibliotecas de más de 10e10 transformantes (hasta 10e11) con una única transformación, de manera que de 10 transformaciones se espera una única biblioteca con una diversidad de 10e12. [0164]A useful procedure for generating large phage libraries of short peptides has recently been described (Scholle, M. D. et al. (2005) Comb Chem High Throughput Screen, 8: 545-51). This procedure is related to the Kunkel approach, but does not require the generation of single-stranded messenger DNA containing random uracil bases. Instead, the procedure begins with a template phage that carries one or more mutations close to the area to be mutagenized and said mutation renders the phage non-infectious. The procedure uses a mutagenic oligonucleotide that carries randomized codons in some positions and that corrects the fado-inactivating mutation in the template. As a result, only mutagenized phage particles are infectious after transformation and very few parental phages are contained in such libraries. This procedure can be further modified in several ways. For example, multiple mutagenic oligonucleotides can be used to simultaneously mutagenize multiple discontiguous regions of a phage. The present inventors have taken this approach a step further by applying it to complete microproteins of >25, 30, 35, 40, 45, 50, 55 and 60 amino acids, instead of to short peptides of <10, 15 or 20 amino acids, which poses an additional challenge. This approach now gives libraries of more than 10e10 transformants (up to 10e11) with a single transformation, so that from 10 transformations a single library with a diversity of 10e12 is expected.

[0165]Otra variación del procedimiento de Scholle es diseñar el oligonucleótido mutagénico de forma que un codón de terminación ámbar en el molde se convierta en un codón de terminación ocre, y uno ocre en uno ámbar en el siguiente ciclo de mutagénesis. En este caso, el fago molde y los miembros de la biblioteca mutagenizada deben cultivarse en diferentes cepas supresoras deE. coli,alternando un supresor ocre con cepas de supresor ámbar. Esto permite realizar rondas sucesivas de mutagénesis de un fago alternando entre estos dos tipos de codones de terminación y dos cepas supresoras. [0165]Another variation of the Scholle procedure is to design the mutagenic oligonucleotide so that an amber stop codon on the template becomes an ocher stop codon, and an ocher stop codon becomes an amber one in the next cycle of mutagenesis. In this case, the template phage and the mutagenized library members must be grown on different suppressor strains of E. coli, alternating an ocher suppressor with amber suppressor strains. This allows successive rounds of phage mutagenesis to be carried out alternating between these two types of stop codons and two suppressor strains.

[0166]Todavía otra variación del enfoque de Scholle implica el uso de megacebadores con un molde de ADN de fago monocatenario. El megacebador es un ADNmc largo que se generó a partir de los insertos de biblioteca del conjunto seleccionado del fago de la ronda previa de inmunopurificación. El objetivo es capturar la diversidad completa de los insertos de biblioteca del conjunto previo, que se mutagenizó en una o más áreas, y transferirla a una nueva biblioteca de tal forma que pueda mutagenizarse un área adicional. El procedimiento de megacebadores puede repetirse para múltiples ciclos usando el mismo molde que contiene un codón de terminación en el gen de interés. El megacebador es un ADNmc (opcionalmente generado por PCR) que contiene 1) áreas de solapamiento de 5' y 3' de al menos 15 bases para complementariedad con el molde de ADNmc, y 2) una o más áreas de la biblioteca previamente seleccionadas (1, 2, 3, 4 o más) que se copiaron (opcionalmente por PCR) del conjunto de clones previamente seleccionados, y 3) un área de biblioteca recientemente mutagenizada que va a seleccionarse en la siguiente ronda de inmunopurificación. El megacebador se prepara opcionalmente 1) sintetizando uno o más oligonucleótidos que codifican el área de la biblioteca recientemente sintetizada y 2) fusionado ésta, opcionalmente usando PCR de solapamiento, con un fragmento de ADN (opcionalmente obtenido por PCR) que contiene cualquier otra área de biblioteca que se optimizó previamente. La ronda final o PCR monocatenaria del producto de PCR (solapado) combinado se usa para generar el megacebador monocatenario que contiene todas las áreas previamente optimizadas de la nueva biblioteca para un área que va a optimizarse en el siguiente experimento de inmunopurificación. Se espera que este enfoque permita afinidad por maduración de proteínas usando múltiples ciclos rápidos de creación de bibliotecas que generan 10e11 a 10e12 diversidades por ciclo, cada uno seguido de inmunopurificación. [0166]Still another variation of Scholle's approach involves the use of megaprimers with a single-stranded phage DNA template. The megaprimer is a long ssDNA that was generated from the phage curated set library inserts from the previous round of immunopurification. The goal is to capture the full diversity of library inserts from the previous set, which was mutagenized in one or more areas, and transfer it to a new library such that an additional area can be mutagenized. The megaprimer procedure can be repeated for multiple cycles using the same template containing a stop codon in the gene of interest. The megaprimer is a ssDNA (optionally generated by PCR) that contains 1) 5' and 3' overlap areas of at least 15 bases for complementarity with the ssDNA template, and 2) one or more previously selected library areas ( 1, 2, 3, 4 or more) that were copied (optionally by PCR) from the set of previously selected clones, and 3) a newly mutagenized library area that is to be selected in the next round of immunopurification. The megaprimer is optionally prepared by 1) synthesizing one or more oligonucleotides encoding the area of the newly synthesized library and 2) fusing this, optionally using overlap PCR, with a DNA fragment (optionally obtained by PCR) containing any other area of library that was previously optimized. The final round or single-stranded PCR of the combined (overlapping) PCR product is used to generate the single-stranded megaprimer containing all previously optimized areas of the new library for an area to be optimized in the next immunopurification experiment. This approach is expected to enable affinity maturation of proteins using multiple rapid cycles of library creation that generate 10e11 to 10e12 diversities per cycle, each followed by immunopurification.

[0167]Puede aplicarse una variedad de procedimientos para introducir diversidad de secuencias en bibliotecas (previamente seleccionadas o sin tratamiento previo) de microproteínas o para mutar clones de microproteínas individuales con el objetivo de potenciar su unión u otras propiedades como fabricación, estabilidad o inmunogenicidad. En principio, todos los procedimientos que pueden usarse para generar bibliotecas también pueden usarse para introducir diversidad en bibliotecas enriquecidas (previamente seleccionadas) de microproteínas. En particular, pueden sintetizarse variantes con unión deseable u otras propiedades y diseñar oligonucleótidos parcialmente aleatorizados basándose en estas secuencias. Este procedimiento permite controlar las posiciones y grado de aleatorización. Puede deducirse la utilidad de mutaciones individuales en una proteína de datos de secuencia de múltiples variantes usando una variedad de algoritmos informáticos (Jonsson, J. y col. (1993) Nucleic Acids Res. 21: 733-9; Amin. N. y col. (2004) Protein Eng Des Sel, 17: 787-93). De particular interés para la re-mutagénesis de bibliotecas enriquecidas es el barajado de ADN (Stemmer, W. P. C. (1994) Nature, 370: 389 391), que genera recombinantes de secuencias individuales en una biblioteca enriquecida. El barajado puede realizarse usando una variedad de condiciones de PCR modificadas y los moldes pueden degradarse parcialmente para potenciar la recombinación. Una alternativa es la recombinación en posiciones predefinidas usando clonación basada en enzimas de restricción. Son de particular interés procedimientos que utilizan enzimas de restricción tipo IIS que escinden ADN fuera de su sitio de reconocimiento de secuencias (Collins, J. y col. (2001) J Biotechnol. 74: 317-38). Pueden utilizarse enzimas de restricción que generan residuos protuberantes no palindrómicos para escindir plásmidos u otras mezclas de variantes que codifican ADN en múltiples localizaciones y plásmidos completos pueden reensamblarse por ligación (Berger, S. L. y col. (1993) Anal Biochem, 214: 571-9). Otro procedimiento para introducir diversidad es mutagénesis por PCR en la que las secuencias de ADN que codifican miembros de las bibliotecas se someten a PCR bajo condiciones mutagénicas. Se ha descrito que las condiciones de PCR conducen a mutaciones a frecuencias de mutación relativamente altas (Leung, D. y col. (1989) Technique, 1: 11-15). Además, puede emplearse una polimerasa con fidelidad reducida (Vanhercke, T. y col. (2005) Anal Biochem, 339: 9-14). Un procedimiento de particular interés se basa en cepas de mutador (Irving, R. A. y col. (1996) Immunotechnology, 2: 127-43; Coia, G. y col. (1997) Gene, 201: 203-9). Éstas son cepas que llevan defectos en uno o más genes de reparación de ADN. Los plásmidos o fago u otro ADN en estas cepas acumulan mutaciones durante la replicación normal. Pueden propagarse clones individuales o poblaciones enriquecidas en cepas de mutador para introducir diversidad genética. Muchos de los procedimientos descritos anteriormente pueden utilizarse en un procedimiento iterativo. Pueden aplicarse múltiples rondas de mutagénesis y cribado o inmunopurificación a genes enteros, o a porciones de un gen, o pueden mutagenizarse diferentes porciones de una proteína durante cada ronda posterior (Yang, W. P. y col. (1995) J Mol Biol, 254: 392-403). [0167]A variety of procedures can be applied to introduce sequence diversity into libraries (previously selected or naïve) of microproteins or to mutate individual microprotein clones with the aim of enhancing their binding or other properties such as manufacturing, stability or immunogenicity. In principle, all procedures that can be used to generate libraries can also be used to introduce diversity into enriched (previously curated) libraries of microproteins. In particular, variants with desirable binding or other properties can be synthesized and partially randomized oligonucleotides designed based on these sequences. This procedure allows controlling the positions and degree of randomization. The utility of individual mutations in a protein can be inferred from multi-variant sequence data using a variety of computer algorithms (Jonsson, J. et al. (1993) Nucleic Acids Res. 21: 733-9; Amin. N. et al. . (2004) Protein Eng Des Sel, 17: 787-93). Of particular interest for re-mutagenesis of enriched libraries is DNA shuffling (Stemmer, W. P. C. (1994) Nature, 370: 389 391), which generates recombinants of individual sequences in an enriched library. Shuffling can be performed using a variety of modified PCR conditions and templates can be partially degraded to enhance recombination. An alternative is recombination at predefined positions using restriction enzyme-based cloning. Of particular interest are procedures that use type IIS restriction enzymes that cleave DNA outside its sequence recognition site (Collins, J. et al. (2001) J Biotechnol. 74: 317-38). Restriction enzymes that generate non-palindromic overhangs can be used to excise plasmids or other mixtures of DNA-encoding variants at multiple locations and complete plasmids can be reassembled by ligation (Berger, S. L. et al. (1993) Anal Biochem, 214: 571-9 ). Another procedure for introducing diversity is PCR mutagenesis in which DNA sequences encoding members of the libraries are subjected to PCR under mutagenic conditions. PCR conditions have been reported to lead to mutations at relatively high mutation frequencies (Leung, D. et al. (1989) Technique, 1: 11-15). Furthermore, a polymerase with reduced fidelity can be used (Vanhercke, T. et al. (2005) Anal Biochem, 339: 9-14). A procedure of particular interest is based on mutator strains (Irving, R. A. et al. (1996) Immunotechnology, 2: 127-43; Coia, G. et al. (1997) Gene, 201: 203-9). These are strains that carry defects in one or more DNA repair genes. The plasmids or phage or other DNA in these strains accumulate mutations during normal replication. Individual clones or enriched populations can be propagated in mutator strains to introduce genetic diversity. Many of the procedures described above can be used in an iterative procedure. Multiple rounds of mutagenesis and screening or immunopurification can be applied to entire genes, or to portions of a gene, or different portions of a protein can be mutagenized during each subsequent round (Yang, W. P. et al. (1995) J Mol Biol, 254: 392- 403).

[0168]Las bibliotecas pueden tratarse adicionalmente para reducir artefactos. Artefactos conocidos de inmunopurificación de fagos incluyen 1) unión no específica basada en hidrofobia, y 2) unión multivalente a la diana, tanto debido a a) la pentavalencia de la proteína del fagopIIIcomo b) debido a la formación de disulfuros entre diferentes microproteínas, produciendo multímeros, o c) debido a recubrimiento de alta densidad de la diana sobre un soporte sólido y 3) unión a diana dependiente de contexto, en la que el contexto de la diana o el contexto de las microproteínas se vuelve crítico para la actividad de unión o de inhibición. Pueden realizarse diferentes etapas de tratamiento para minimizar la magnitud de estos problemas. Por ejemplo, tales tratamientos se aplican a la biblioteca completa, pero algunos tratamientos útiles que eliminan clones malos solo pueden aplicarse a conjuntos de proteínas solubles o solo a proteínas solubles individuales. [0168]Libraries may be additionally treated to reduce artifacts. Known artifacts of phage immunopurification include 1) nonspecific binding based on hydrophobicity, and 2) multivalent binding to the target, both due to a) the pentavalence of the phagopIII protein and b) due to the formation of disulfides between different microproteins, producing multimers. , or c) due to high-density coating of the target on a solid support and 3) context-dependent target binding, in which the context of the target or the context of the microproteins becomes critical for the binding or binding activity. inhibition. Different stages of treatment can be performed to minimize the magnitude of these problems. For example, such treatments are applied to the entire library, but some useful treatments that remove bad clones can only be applied to sets of soluble proteins or only to individual soluble proteins.

[0169]Es probable que las bibliotecas de andamiajes que contienen cisteína contengan tioles libres, que pueden complicar la evolución dirigida por reticulación a otras proteínas. Un enfoque es eliminar los peores clones de la biblioteca pasándolos por una columna sin tiol, eliminando así todos los clones que tienen uno más sulfhidrilos libres. Los clones con grupos SH libres también pueden hacerse reaccionar con reactivos de biotina-SH, permitiendo la eliminación eficiente de clones con grupos SH reactivos usando columnas de estreptavidina. Otro enfoque es no eliminar los tioles libres, pero inactivarlos tapando los extremos con compuestos químicos reactivos con sulfhidrilo tales como ácido yodoacético. Son de particular interés reactivos de sulfhidrilo voluminosos o hidrófilos que reducen la unión a diana no específica o variantes modificadas. [0169]Cysteine-containing scaffold libraries are likely to contain free thiols, which may complicate evolution directed by cross-linking to other proteins. One approach is to remove the worst clones from the library by running them through a thiol-free column, thus eliminating all clones that have one more free sulfhydryls. Clones with free SH groups can also be reacted with biotin-SH reagents, allowing efficient removal of clones with reactive SH groups using streptavidin columns. Another approach is not to remove free thiols, but to inactivate them by end capping with sulfhydryl-reactive chemicals such as iodoacetic acid. Of particular interest are bulky or hydrophilic sulfhydryl reagents that reduce non-specific target binding or modified variants.

[0170]Ejemplos de dependencia del contexto son todas las secuencias constantes, que incluyen la proteínapIII, ligadores, marcas de péptidos, biotina-estreptavidina, Fc y otras proteínas de fusión que contribuyen a la interacción. El enfoque típi [0170]Examples of context dependence are all constant sequences, including the pIII protein, linkers, peptide tags, biotin-streptavidin, Fc and other fusion proteins that contribute to the interaction. The typical approach

como sea práctico con el fin de evitar la formación. Esto puede implicar alternar entre diferentes sistemas de visualización (es decir, M13 frente a T7, o M13 frente a levadura), alternar las marcas y ligadores que se usan, alternar el soporte (sólido) usado para la inmovilización (es decir, química de inmovilización) y alternar las propias proteínas diana (diferentes vendedores, diferentes versiones de fusión). as practical in order to avoid formation. This may involve alternating between different display systems (i.e., M13 vs. T7, or M13 vs. yeast), alternating the labels and linkers used, alternating the (solid) support used for immobilization (i.e., immobilization) and alternate the target proteins themselves (different vendors, different fusion versions).

[0171]También puede usarse tratamiento de bibliotecas para seleccionar proteínas con cualidades preferidas. Una opción es el tratamiento de bibliotecas con proteasas con el fin de eliminar variantes inestables de la biblioteca. Las proteasas usadas son normalmente aquellas que se encontrarían en la aplicación. Para administración pulmonar se usarían proteasas pulmonares, por ejemplo, obtenidas por un lavado pulmonar. Similarmente, se obtendrían mezclas de proteasas de suero, saliva, estómago, intestino, piel, nariz, etc. Sin embargo, también es posible usar mezclas de proteasas purificadas individuales. Una amplia lista de proteasas se muestra en [Apéndice E]. Los fagos por sí mismos son excepcionalmente resistentes a la mayoría de las proteasas y otros tratamientos rigurosos. [0171]Library screening can also be used to select proteins with preferred qualities. One option is the treatment of libraries with proteases in order to eliminate unstable variants from the library. The proteases used are normally those that would be found in the application. For pulmonary administration, pulmonary proteases would be used, for example, obtained by lung lavage. Similarly, mixtures of proteases would be obtained from serum, saliva, stomach, intestine, skin, nose, etc. However, it is also possible to use mixtures of individual purified proteases. A comprehensive list of proteases is shown in [Appendix E]. Phages themselves are exceptionally resistant to most proteases and other harsh treatments.

[0172]Por ejemplo, es posible seleccionar la biblioteca para las estructuras más estables, es decir, aquellas con los enlaces disulfuro más fuertes, por exposición a concentraciones crecientes de agentes reductores (es decir, DTT o beta-mercaptoetanol), eliminando así primero las estructuras menos estables. Normalmente se usaría agente reductor (es decir, DTT, BME, otro) a concentraciones de 2,5 mM, a 5 mM, 10 mM, 20 mM, 30 mM, 40 mM, 50 mM, 60 mM, 70 mM, 80 mM, 90 mM o incluso 100 mM, dependiendo de la estabilidad deseada. [0172]For example, it is possible to select the library for the most stable structures, that is, those with the strongest disulfide bonds, by exposure to increasing concentrations of reducing agents (that is, DTT or beta-mercaptoethanol), thus first removing less stable structures. Typically reducing agent (i.e. DTT, BME, other) would be used at concentrations of 2.5mM, 5mM, 10mM, 20mM, 30mM, 40mM, 50mM, 60mM, 70mM, 80mM , 90 mM or even 100 mM, depending on the desired stability.

[0173]También es posible seleccionar clones que pueden replegarse eficientementein vitro,reduciendo la biblioteca de visualización entera con un alto nivel de agente reductor, seguido de reoxidando gradualmente la biblioteca de proteínas para volver a formar los disulfuros, seguido de la eliminación de clones con grupos SH libres, como se ha descrito anteriormente. Este procedimiento puede aplicarse una vez o múltiples veces para eliminar clones que tienen baja eficiencia de replegamientoin vitro.[0173]It is also possible to select clones that can refold efficiently in vitro, by reducing the entire display library with a high level of reducing agent, followed by gradually reoxidizing the protein library to reform the disulfides, followed by elimination of clones with free SH groups, as described above. This procedure can be applied once or multiple times to eliminate clones that have low in vitro refolding efficiency.

[0174]Un enfoque es aplicar una selección genética para el nivel de expresión de proteínas, plegamiento y solubilidad como se describe por A. C. Fisher y col. (2006) Genetic selection for protein solubility enabled by the folding quality control feature of the twin-arginine translocalization pathway. Protein Science (en línea). Después de la inmunopurificación de bibliotecas de visualización (opcional), se querría evitar cribar miles de clones al nivel de proteínas para la unión a diana, nivel de expresión y plegamiento. Una alternativa es clonar el conjunto completo de insertos seleccionados en un vector de fusión de beta-lactamasa que, cuando se siembra sobre beta-lactama, los autores demostraron que era selectivo para proteínas bien expresadas, completamente unidas por disulfuro y solubles. [0174]One approach is to apply genetic selection for the level of protein expression, folding and solubility as described by A. C. Fisher et al. (2006) Genetic selection for protein solubility enabled by the folding quality control feature of the twin-arginine translocalization pathway. Protein Science (online). After immunopurification of display libraries (optional), one would want to avoid screening thousands of clones at the protein level for target binding, expression level and folding. An alternative is to clone the complete set of selected inserts into a beta-lactamase fusion vector which, when plated on beta-lactam, the authors showed was selective for well-expressed, fully disulfide-linked, and soluble proteins.

[0175]Tras la visualización de fago M13 de bibliotecas de proteínas e inmunopurificación sobre dianas para uno o más ciclos, hay una variedad de formas de proceder, que incluyen (1) cribar clones de fago individuales por ELISA de fago, que mide el número de partículas de fago (usando anticuerpos anti-M13) que se unen a una diana inmovilizada; (2) transferir bibliotecas de visualización de fago de M13 a T7. El segundo enfoque es particularmente útil en reducir la aparición de positivos falsos basándose en la valencia. Cualquier formato de biblioteca individual tiende a favorecer clones que puedan formar contacto de alta avidez con la diana. Este es el motivo por el cual el cribado de proteínas solubles es importante, aunque esto es una solución tediosa. La multivalencia alcanzada en la visualización de fago T7 es probablemente muy diferente de la alcanzada en la visualización de M13, y la realización en ciclos entre T7 y M13 puede ser un enfoque excelente para reducir la aparición de positivos falsos basándose en la valencia. [0175]Following M13 phage display of protein libraries and immunopurification on targets for one or more cycles, there are a variety of ways to proceed, including (1) screening individual phage clones by phage ELISA, which measures the number of phage particles (using anti-M13 antibodies) that bind to an immobilized target; (2) transfer phage display libraries from M13 to T7. The second approach is particularly useful in reducing the occurrence of false positives based on valence. Any single library format tends to favor clones that can form high avidity contact with the target. This is why screening for soluble proteins is important, although this is a tedious solution. The multivalency achieved in T7 phage display is likely very different from that achieved in M13 display, and cycling between T7 and M13 may be an excellent approach to reduce the occurrence of false positives based on valence.

[0176]La elevación del filtro es otra metodología que puede ser con colonias bacterianas cultivadas a alta densidad sobre placas de agar grandes (10e2-10e5). Pequeñas cantidades de algunas proteínas son secretadas en los medios y terminan unidas a la membrana de filtración (nitrocelulosa o nailon). Entonces, los filtros se bloquean en leche desnatada, 1% de hidrolizado de caseína o una disolución de 1% de BSA y se incuban con la proteína diana que se ha marcado con un colorante fluorescente o una enzima indicadora (directamente o indirectamente mediante anticuerpos o mediante biotina-estreptavidina). La localización de la colonia se determina por revestimiento del filtro sobre el fondo de la placa y todas las colonias positivas se seleccionan y se usan para caracterización adicional. La ventaja de las elevaciones del filtro es que puede hacerse que sean selectivas por afinidad leyendo la señal después de lavar durante diferentes periodos de tiempo. La señal de clones de alta afinidad se 'atenúa' lentamente, mientras que la señal de clones de baja afinidad se atenúa rápidamente. Tal caracterización por afinidad normalmente requiere un ensayo de 4 puntos con un ensayo fundamentado y puede proporcionar mejor comparabilidad clon a clon que ensayos fundamentados. La molienda de colonias en una matriz es útil, ya que minimiza diferencias debido al tamaño o localización de colonias. [0176]Filter elevation is another methodology that can be with bacterial colonies grown at high density on large agar plates (10e2-10e5). Small amounts of some proteins are secreted into the media and end up attached to the filtration membrane (nitrocellulose or nylon). The filters are then blocked in skimmed milk, 1% casein hydrolyzate, or a 1% BSA solution and incubated with the target protein that has been labeled with a fluorescent dye or reporter enzyme (directly or indirectly by antibodies or through biotin-streptavidin). Colony location is determined by coating the filter on the bottom of the plate and all positive colonies are selected and used for further characterization. The advantage of filter elevations is that they can be made affinity selective by reading the signal after washing for different periods of time. The signal from high-affinity clones 'fades' slowly, while the signal from low-affinity clones 'fades' rapidly. Such affinity characterization typically requires a 4-point assay with a substantiated assay and may provide better clone-to-clone comparability than substantiated assays. Milling colonies on a matrix is useful as it minimizes differences due to colony size or location.

Módulos del extremo N:N-end modules:

[0177]Las MURP objeto pueden contener módulos del extremo N (NM), que son particularmente útiles, por ejemplo, en facilitar la producción de las MURP. El NM puede ser un único residuo de metionina si los productos se expresan en el citoplasma deE. coli.Un formato de producto típico es un URP fusionado con una proteína terapéutica, que se expresa en el citoplasma bacteriano de manera que el extremo N sea formil-metionina. La formilmetionina puede tanto ser permanente como temporal, si se elimina por procesamiento biológico o químico. [0177]The subject MURPs may contain N-end modules (NM), which are particularly useful, for example, in facilitating the production of the MURPs. The NM may be a single methionine residue if the products are expressed in the cytoplasm of E. coli. A typical product format is a URP fused to a therapeutic protein, which is expressed in the bacterial cytoplasm so that the N terminus is formyl-methionine. Formylmethionine can be either permanent or temporary, if removed by biological or chemical processing.

[0178]El NM también puede ser una secuencia de péptidos que se ha manipulado para procesamiento proteolítico, que puede usarse para eliminar marcas o para eliminar proteínas de fusión. El módulo del extremo N puede manipularse para facilitar la purificación de la MURP, incluyendo una marca de afinidad tal como la marca Flag, Myc, HA o His. El módulo del extremo N también puede incluir una marca de afinidad que puede usarse para la detección de la MURP. Un NM puede manipularse o seleccionarse para expresión de alto nivel de la MUMP. También puede manipularse o seleccionarse para potenciar la resistencia a proteasas de la MURP resultante. Las MURP pueden producirse con un módulo del extremo N que facilita la expresión y/o purificación. Este módulo del extremo N puede separarse por escisión durante el procedimiento de producción con una proteasa, de forma que el producto final no contiene un módulo del extremo N. [0178]The NM can also be a peptide sequence that has been manipulated for proteolytic processing, which can be used to remove tags or to remove fusion proteins. The N-terminal module can be manipulated to facilitate MURP purification, including an affinity tag such as the Flag, Myc, HA or His tag. The N-terminal module may also include an affinity tag that may be used for MURP detection. An NM can be manipulated or selected for high-level expression of the MUMP. It can also be manipulated or selected to enhance the protease resistance of the resulting MURP. MURPs can be produced with an N-terminal module that facilitates expression and/or purification. This N-terminal module can be cleaved during the production process with a protease, so that the final product does not contain an N-terminal module.

[0179]Optimizando la elección de aminoácidos y codones del módulo del extremo N puede aumentarse la producción recombinante. El módulo del extremo N también puede contener un sitio de procesamiento que puede escindirse por una proteasa específica como factor Xa, trombina o enterocinasa. Proteasa del virus del grabado del tomate (v Gt ). También pueden diseñarse sitios de procesamiento para ser escindibles por hidrólisis química. Un ejemplo es la secuencia de aminoácidos asp-pro que puede escindirse en condiciones ácidas. También puede diseñarse un módulo del extremo N para facilitar la purificación de una MURP. Por ejemplo, pueden diseñarse módulos del extremo N para contener múltiples residuos his que permiten la captura de producto por cromatografía de metal inmovilizado. Los módulos del extremo N pueden contener secuencias de péptidos que pueden capturarse o detectarse específicamente por anticuerpos. Ejemplos son FLAG, HA, c-myc. [0179]Optimizing the choice of amino acids and codons of the N-terminal module can increase recombinant production. The N-terminal module may also contain a processing site that can be cleaved by a specific protease such as factor Xa, thrombin, or enterokinase. Tomato etch virus protease (vGt). Processing sites can also be designed to be cleavable by chemical hydrolysis. An example is the asp-pro amino acid sequence which can be cleaved under acidic conditions. An N-terminal module can also be designed to facilitate purification of a MURP. For example, N-terminal modules can be designed to contain multiple his residues that allow product capture by immobilized metal chromatography. The N-terminal modules may contain peptide sequences that can be specifically captured or detected by antibodies. Examples are FLAG, HA, c-myc.

Módulos del extremo C:C-end modules:

[0180]Las MURP pueden contener un módulo del extremo C, que son particularmente útiles, por ejemplo, en facilitar la producción de las MURP. Por ejemplo, el módulo del extremo C puede comprender un sitio de escisión para efectuar el procesamiento proteolítico para eliminar secuencias que están fusionadas y de ahí aumentar la expresión de proteínas o facilitar la purificación. En particular, el módulo del extremo C también puede contener un sitio de procesamiento que puede escindirse por una proteasa específica como factor Xa, trombina, proteasa de VGT o enterocinasa. Los sitios de procesamiento también pueden diseñarse para ser escindibles por hidrólisis química. Un ejemplo es la secuencia de aminoácidos asp-pro que puede escindirse en condiciones ácidas. El módulo del extremo C puede ser una marca de afinidad que tiene como objetivo facilitar la purificación de la MURP. Por ejemplo, los módulos del extremo C pueden diseñarse para contener múltiples residuos his que permiten la captura de producto por cromatografía de metal inmovilizado. Los módulos del extremo C pueden contener secuencias de péptidos que pueden capturarse o detectarse específicamente por anticuerpos. Ejemplos no limitantes de las marcas incluyen marca FLAG, HA, c-myc o His. El módulo del extremo C también puede manipularse o seleccionarse para potenciar la resistencia a proteasas de la MURP resultante. [0180]MURPs may contain a C-end module, which are particularly useful, for example, in facilitating the production of MURPs. For example, the C-terminal module may comprise a cleavage site to effect proteolytic processing to remove sequences that are fused and thereby increase protein expression or facilitate purification. In particular, the C-terminal module may also contain a processing site that can be cleaved by a specific protease such as factor Xa, thrombin, VGT protease or enterokinase. Processing sites can also be designed to be cleavable by chemical hydrolysis. An example is the asp-pro amino acid sequence which can be cleaved under acidic conditions. The C-terminal module may be an affinity mark that aims to facilitate MURP purification. For example, C-terminal modules can be designed to contain multiple his residues that allow product capture by immobilized metal chromatography. The C-terminal modules may contain peptide sequences that can be specifically captured or detected by antibodies. Non-limiting examples of the tags include FLAG, HA, c-myc or His tag. The C-terminal module can also be manipulated or selected to enhance the protease resistance of the resulting MURP.

[0181]Si se desea, el extremo N de la proteína puede ligarse a su propio extremo C. Por ejemplo, la ligación de estos dos módulos puede llevarse a cabo creando un enlace natural similar a aminoácido (enlace peptídico) o usando una entidad de enlace exógena. Son de particular interés ciclotidas, una familia de proteínas pequeñas en que esto se produce naturalmente. Adoptando un formato estructural como ciclotidas se espera proporcionar estabilidad adicional contra exo-proteasas. Tal enlace intramolecular normalmente funciona mejor a menores concentraciones de proteína. [0181]If desired, the N-terminus of the protein can be ligated to its own C-terminus. For example, ligation of these two modules can be carried out by creating a natural amino acid-like bond (peptide bond) or using an entity of exogenous link. Of particular interest are cyclotides, a family of small proteins in which this occurs naturally. Adopting a structural format such as cyclotides is expected to provide additional stability against exo-proteases. Such intramolecular bonding typically works better at lower protein concentrations.

Módulos efectores:Effector modules:

[0182]Las MURP pueden comprender uno o múltiples módulos efectores (EM), o ninguno. Los módulos efectores normalmente no proporcionan la elección de diana, pero proporcionan una actividad requerida para efecto terapéutico, como destrucción de células. Los EM pueden ser moléculas pequeñas farmacéuticamente activas (es decir, fármacos tóxicos), péptidos o proteínas. Ejemplos no limitantes son citocinas, anticuerpos, enzimas, factores de crecimiento, hormonas, receptores, agonistas o antagonistas de receptores, tanto si están completos como un fragmento o dominio de los mismos. Los módulos efectores también pueden comprender secuencias de péptidos que llevan fármacos de molécula pequeña químicamente ligados, tanto si son sintéticos como naturales. Opcionalmente, estas moléculas efectoras pueden ligarse al módulo efector mediante ligadores químicos, que pueden o pueden no escindirse bajo condiciones seleccionadas conduciendo a una liberación de la actividad tóxica. Los EM también pueden incluir radioisótopos y sus quelatos, además de diversas marcas para TEP y RMN. Los módulos efectores también pueden ser tóxicos para una célula o un tejido. Son de particular interés MURP que contienen módulos efectores tóxicos y módulos de unión con especificidad por un tejido enfermo o tipo de célula enferma. Tales MURP pueden acumularse específicamente en un tejido enfermo o en células enfermas y pueden ejercer su acción tóxica preferencialmente en las células o tejidos enfermos. A continuación se enumeran módulos efectores a modo de ejemplo. [0182]MURPs may comprise one or multiple effector modules (EMs), or none. Effector modules typically do not provide targeting, but provide an activity required for therapeutic effect, such as cell destruction. EMs can be small pharmaceutically active molecules (i.e., toxic drugs), peptides, or proteins. Non-limiting examples are cytokines, antibodies, enzymes, growth factors, hormones, receptors, receptor agonists or antagonists, whether complete or a fragment or domain thereof. Effector modules may also comprise peptide sequences carrying chemically linked small molecule drugs, whether synthetic or natural. Optionally, these effector molecules may be linked to the effector module by chemical linkers, which may or may not cleave under selected conditions leading to a release of toxic activity. EMs may also include radioisotopes and their chelates, as well as various labels for PET and MRI. Effector modules can also be toxic to a cell or tissue. Of particular interest are MURPs that contain toxic effector modules and binding modules with specificity for a diseased tissue or diseased cell type. Such MURPs can accumulate specifically in a diseased tissue or in diseased cells and can exert their toxic action preferentially in the diseased cells or tissues. Example effector modules are listed below.

[0183]Enzimas -Los módulos efectores pueden ser enzimas. Son de particular interés enzimas que degradan metabolitos que son críticos para el crecimiento celular como hidratos de carbono o aminoácidos o lípidos o co-factores. Otros ejemplos de módulos efectores con actividad enzimática son RNAsa, ADNasa y fosfatasa, asparaginasa, histidinasa, arginasa, beta-lactamasa. Los módulos efectores con actividad enzimática pueden ser tóxicos cuando se administran a un tejido o célula. Son de particular interés MURP que combinan módulos efectores que son tóxicos y módulos de unión que se unen específicamente a un tejido enfermo. También son módulos efectores posibles enzimas que convierten un profármaco inactivo en un fármaco activo en el sitio tumoral. [0183]Enzymes -The effector modules can be enzymes. Of particular interest are enzymes that degrade metabolites that are critical for cell growth such as carbohydrates or amino acids or lipids or co-factors. Other examples of effector modules with enzymatic activity are RNase, DNase and phosphatase, asparaginase, histidinase, arginase, beta-lactamase. Effector modules with enzymatic activity can be toxic when administered to a tissue or cell. Of particular interest are MURPs that combine effector modules that are toxic and binding modules that bind specifically to diseased tissue. Also possible effector modules are enzymes that convert an inactive prodrug into an active drug at the tumor site.

[0184]Fármaco -La MURP objeto puede contener un efector que es un fármaco. Si se desea, pueden diseñarse secuencias para la administración selectiva al órgano de moléculas de fármaco. Un ejemplo se ilustra en la Figura 8. Una secuencia de URP puede fusionarse con una proteína que se une preferencialmente a tejido enfermo. La misma secuencia de URP puede contener uno o más residuos de aminoácidos que pueden modificarse para la unión de moléculas de fármaco. Un conjugado tal puede unirse a tejido enfermo con alta especificidad y las moléculas de fármaco unidas pueden producir acción local, a la vez que mantienen la exposición a fármaco sistémico. La MURP puede diseñarse para facilitar la liberación de moléculas de fármaco al tamaño diana introduciendo sitios sensibles a proteasas que pueden escindirse por proteasas nativas en el sitio de acción deseada. Una ventaja significativa de uso de secuencias de URP para el diseño de construcciones de administración de fármaco es que pueden evitarse interacciones no deseables entre la molécula de fármaco y el dominio que elige diana de la construcción. Muchas moléculas de fármaco que pueden conjugarse con dominios que eligen diana tienen hidrofobia significativa y los conjugados resultantes tienden a agregarse. Añadiendo secuencias de URP hidrófilas a tales construcciones puede mejorarse la solubilidad de las construcciones de administración resultantes y, como consecuencia, reducirse la tendencia a la agregación. Además, puede aumentarse el número de moléculas de fármaco que pueden fusionarse con un dominio que elige diana añadiendo secuencias de URP largas. Además, el uso de secuencias de URP permite optimizar la distancia entre los sitios de conjugación del fármaco para facilitar la completa conjugación. La lista de fármacos adecuados incluye, pero no se limita a, agentes quimioterapéuticos tales como tiotepa y ciclofosfamida (CYTOXAN™); alquilsulfonatos tales como busulfan, improsulfan y piposulfan; aziridinas tales como benzodopa, carbocuona, meturedopa, y uredopa; etileniminas y metilamelaminas que incluyen altretamina, trietilenmelamina, trietilenfosforamida, trietilentiofosforamida y trimetilolomelamina; mostazas de nitrógeno tales como clorambucilo, clornafazina, ciclofosfamida, estramustina, ifosfamida, mecloretamina, clorhidrato de óxido de mecloretamina, melfalan, novembiquina, fenesterina, prednimustina, trofosfamida, mostaza de uracilo; nitrosoureas tales como carmustina, clorozotocina, fotemustina, lomustina, nimustina, ranimustina; antibióticos tales como aclacinomisinas, actinomicina, autramicina, azaserina, bleomicinas, cactinomicina, carabicina, carminomicina, carzinofilina, cromomicinas, dactinomicina, daunorubicina, detorubicina, 6-diazo-5-oxo-L-norleucina, doxorubicina, epirubicina, esorubicina, idarubicina, marcelomicina, mitomicinas, ácido micofenólico, nogalamicina, olivomicinas, peplomicina, potfiromicina, puromicina, quelamicina, rodorubicina, estreptonigrina, estreptozocina, tubercidina, ubenimex, zinostatina, zorubicina; antimetabolitos tales como metotrexato y 5-fluorouracilo (5-FU); análogos de ácido fólico tales como denopterina, metotrexato, pteropterina, trimetrexato; análogos de purina tales como fludarabina, 6-mercaptopurina, tiamiprina, tioguanina; análogos de pirimidina tales como ancitabina, azacitidina, 6-azauridina, carmofur, citarabina, didesoxiuridina, doxifluridina, enocitabina, floxuridina, andrógenos tales como calusterona, propionato de dromostanolona, epitiostanol, mepitiostano, testolactona; antiadrenérgicos tales como aminoglutetimida, mitotano, trilostano; reparadores de ácido fólico tales como ácido frolínico; aceglatona; glucósido aldofosfamida; ácido aminolevulínico; amsacrina; bestrabucilo; bisantreno; edatraxato; defofamina; demecolcina; diazicuona; duocarmicina, maitansina, auristatina, elfornitina; acetato de eliptinio; etoglúcido, nitrato de galio; hidroxiurea; lentinan; lonidamina; mitoguazona; mitoxantrona; mopidamol; nitracrina; pentostatina; fenamet; pirarubicina; ácido podofilínico; 2-etilhidrazida; procarbazina; PSK.R™; razoxana; sizofiran; espirogermanio; ácido tenuazonico; triazicuona; 2,2',2"-triclorotrietilamina; uretano; vindesina; dacarbazina; manomustina; mitobronitol; mitolactol; pipobromano; gacitosina; arabinósido (“Ara-C”); ciclofosfamida; tiotepa; taxanos, por ejemplo, paclitaxel (TAXOL™, Bristol-Myers Squibb Oncology, Princeton, N.J.) y doxetaxel (TAXOTERE™, Rhóne-Poulenc Rorer, Antony, Francia); clorambucilo; gemcitabina; 6-tioguanina; mercaptopurina; metotrexato; análogos de platino tales como cisplatino y carboplatino; vinblastina; platino; etopósido (VP-16); ifosfamida; mitomicina C; mitoxantrona; vincristina; vinorelbina; navelbina; novantrona; tenipósido; daunomicina; aminopterina; xeloda; ibandronato; camptotecina-11 (CPT-11); inhibidor de la topoisomerasa RFS 2000; difluorometilornitina (DMFO); ácido retinoico; esperamicinas; capecitabina; y sales, ácidos o derivados farmacéuticamente aceptables de cualquiera de los anteriores. Como acondicionadores celulares quimioterapéuticos adecuados también están incluidos agentes antihormonales que actúan para regular o inhibir la acción de hormonas sobre tumores tales como antiestrógenos que incluyen, por ejemplo, tamoxifeno, raloxifeno, 4(5)-imidazoles inhibidores de aromatasa, 4-hidroxitamoxifeno, trioxifeno, keoxifeno, LY117018, onapristona y toremifeno (Fareston); y antiandrógenos tales como flutamida, nilutamida, bicalutamida, leuprolida, goserelina, doxorubicina, daunomicina, duocarmicina, vincristina y vinblastina. [0184]Drug -The MURP object may contain an effector that is a drug. If desired, sequences can be designed for organ-selective delivery of drug molecules. An example is illustrated in Figure 8. A URP sequence can be fused to a protein that preferentially binds to diseased tissue. The same URP sequence may contain one or more amino acid residues that can be modified for the binding of drug molecules. Such a conjugate can bind to diseased tissue with high specificity and the bound drug molecules can produce local action, while maintaining systemic drug exposure. MURP can be designed to facilitate the release of drug molecules at the target size by introducing protease-sensitive sites that can be cleaved by native proteases at the site of desired action. A significant advantage of using URP sequences for the design of drug delivery constructs is that undesirable interactions between the drug molecule and the targeting domain of the construct can be avoided. Many drug molecules that can be conjugated to targeting domains have significant hydrophobicity and the resulting conjugates tend to aggregate. Adding hydrophilic URP sequences to such constructs can improve the solubility of the resulting delivery constructs and, consequently, reduce the tendency for aggregation. Furthermore, the number of drug molecules that can be fused to a targeting domain can be increased by adding long URP sequences. Furthermore, the use of URP sequences allows the distance between drug conjugation sites to be optimized to facilitate complete conjugation. The list of suitable drugs includes, but is not limited to, chemotherapeutic agents such as thiotepa and cyclophosphamide (CYTOXAN™); alkylsulfonates such as busulfan, improsulfan and piposulfan; aziridines such as benzodopa, carboquone, meturedopa, and uredopa; ethyleneimines and methylmelamines including altretamine, triethylenemelamine, triethylenephosphoramide, triethylenethiophosphoramide and trimethylololamine; nitrogen mustards such as chlorambucil, chlornaphazine, cyclophosphamide, estramustine, ifosfamide, mechlorethamine, mechlorethamine oxide hydrochloride, melphalan, novembiquin, phenesterin, prednimustine, trofosfamide, uracil mustard; nitrosoureas such as carmustine, chlorozotocin, fotemustine, lomustine, nimustine, ranimustine; antibiotics such as aclacinomycins, actinomycin, autramycin, azaserine, bleomycins, cactinomycin, carabicin, carminomycin, carzinophilin, chromomycins, dactinomycin, daunorubicin, detorubicin, 6-diazo-5-oxo-L-norleucine, doxorubicin, epirubicin, esorubicin, idarubicin, marcelomycin , mitomycins, mycophenolic acid, nogalamycin, olivomycins, peplomycin, potfiromycin, puromycin, chelamycin, rhodorubicin, streptonigrin, streptozocin, tubercidin, ubenimex, zinostatin, zorubicin; antimetabolites such as methotrexate and 5-fluorouracil (5-FU); folic acid analogues such as denopterin, methotrexate, pteropterin, trimetrexate; purine analogues such as fludarabine, 6-mercaptopurine, thiamiprine, thioguanine; pyrimidine analogues such as ancitabine, azacitidine, 6-azauridine, carmofur, cytarabine, dideoxyuridine, doxyfluridine, enocitabine, floxuridine, androgens such as calusterone, dromostanolone propionate, epithiostanol, mepitiostane, testolactone; antiadrenergics such as aminoglutethimide, mitotane, trilostane; folic acid repairers such as frolinic acid; aceglatone; aldophosphamide glucoside; aminolevulinic acid; amsacrine; bestrabucil; bisantrene; edatraxate; defofamine; demecolcine; diaziquone; duocarmycin, maytansine, auristatin, elfornithine; elliptinium acetate; ethoglucide, gallium nitrate; hydroxyurea; lentinan; lonidamine; mitoguazone; mitoxantrone; mopidamol; nitracrine; pentostatin; fenamet; pyrarubicin; podophylinic acid; 2-ethylhydrazide; procarbazine; PSK.R™; razoxane; sizophyran; spirogermanium; tenuazonic acid; triaziquone; 2,2',2"-trichlorotriethylamine; urethane; vindesine; dacarbazine; mannomustine; mitobronitol; mitolactol; pipobromane; gacytosine; arabinoside (“Ara-C”); cyclophosphamide; thiotepa; taxanes, e.g. paclitaxel (TAXOL™, Bristol -Myers Squibb Oncology, Princeton, N.J.) and doxetaxel (TAXOTERE™, Rhóne-Poulenc Rorer, Antony, France); etoposide (VP-16); DMFO); retinoic acid; Esperamycins; and pharmaceutically acceptable salts, acids or derivatives of any of the above. Also included are antihormonal agents that act to regulate or inhibit the action of hormones such as antiestrogens. include, for example, tamoxifen, raloxifene, 4(5)-imidazoles aromatase inhibitors, 4-hydroxytamoxifen, trioxifene, keoxifene, LY117018, onapristone and toremifene (Fareston); and antiandrogens such as flutamide, nilutamide, bicalutamide, leuprolide, goserelin, doxorubicin, daunomycin, duocarmycin, vincristine and vinblastine.

[0185]Otros fármacos que pueden usarse como módulos efectores incluyen aquellos que son útiles para tratar afecciones inflamatorias, enfermedades cardíacas, enfermedades infecciosas, enfermedades respiratorias, enfermedades autoinmunitarias, trastornos neuronales y musculares, trastornos metabólicos y cánceres. [0185]Other drugs that can be used as effector modules include those that are useful for treating inflammatory conditions, heart diseases, infectious diseases, respiratory diseases, autoimmune diseases, neuronal and muscular disorders, metabolic disorders and cancers.

[0186]Fármacos adicionales que pueden usarse como efectores en MURP incluyen agentes para el dolor e inflamación tales como histamina y antagonistas de la histamina, bradiquinina y antagonistas de bradiquinina, 5-hidroxitriptamina (serotonina), sustancias lipídicas que se generan por biotransformación de los productos de la hidrólisis selectiva de fosfolípidos de membrana, eicosanoides, prostaglandinas, tromboxanos, leucotrienos, aspirina, agentes antiinflamatorios no esteroideos, agentes analgésico-antipiréticos, agentes que inhiben la síntesis de prostaglandinas y tromboxanos, inhibidores selectivos de la ciclooxigenasa inducible, inhibidores selectivos de la ciclooxigenasa-2 inducible, autacoides, hormonas paracrinas, somatostatina, gastrina, citocinas que median en interacciones implicadas en respuestas inmunitarias humorales y celulares, autacoides derivados de péptidos, eicosanoides, agonistas p-adrenérgicos, ipratropio, glucocorticoides, metilxantinas, bloqueantes de los canales de sodio, agonistas de receptores de opioides, bloqueantes de canales de calcio, estabilizadores de la membrana e inhibidores de leucotrieno. [0186]Additional drugs that can be used as effectors in MURP include pain and inflammation agents such as histamine and histamine antagonists, bradykinin and bradykinin antagonists, 5-hydroxytryptamine (serotonin), lipid substances that are generated by biotransformation of the products of selective hydrolysis of membrane phospholipids, eicosanoids, prostaglandins, thromboxanes, leukotrienes, aspirin, non-steroidal anti-inflammatory agents, analgesic-antipyretic agents, agents that inhibit the synthesis of prostaglandins and thromboxanes, selective inhibitors of inducible cyclooxygenase, selective inhibitors of inducible cyclooxygenase-2, autacoids, paracrine hormones, somatostatin, gastrin, cytokines mediating interactions involved in humoral and cellular immune responses, peptide-derived autacoids, eicosanoids, p-adrenergic agonists, ipratropium, glucocorticoids, methylxanthines, channel blockers sodium, opioid receptor agonists, calcium channel blockers, membrane stabilizers and leukotriene inhibitors.

[0187]Otros fármacos que pueden usarse como efector incluyen agentes para el tratamiento de úlceras peptídicas, agentes para el tratamiento de enfermedad por reflujo gastroesofágico, agentes procinéticos, antieméticos, agentes usados en síndrome del intestino irritable, agentes usados para diarrea, agentes usados para estreñimiento, agentes usados para enfermedad inflamatoria del intestino, agentes usados para enfermedad biliar, agentes usados para enfermedad pancreática. [0187]Other drugs that can be used as an effector include agents for the treatment of peptide ulcers, agents for the treatment of gastroesophageal reflux disease, prokinetic agents, antiemetics, agents used in irritable bowel syndrome, agents used for diarrhea, agents used for constipation, agents used for inflammatory bowel disease, agents used for biliary disease, agents used for pancreatic disease.

[0188]Radionúclidos -Las MURP pueden diseñarse para la administración que elige tejido como diana de radionúclidos, además de para la obtención de imágenes con radionúclidos. Las URP son ideales para la obtención de imágenes debido a que la semivida puede optimizarse cambiando la longitud del URP. Para la mayoría de las aplicaciones de obtención de imágenes es probable que se prefiera un URP moderadamente largo, proporcionando una semivida de 5 minutos a algunas horas, no días o semanas. Las MURP pueden diseñarse de forma que solo contengan un único grupo amino o un pequeño número definido de grupos amino que pueden modificarse con agentes quelantes (tales como DOTA) para radioisótopos tales como tecnecio, indio e itrio (EXPAND). Procedimientos alternativos de conjugación son mediante cadenas laterales de cisteína reservadas. Tales MURP que llevan radionúclidos pueden emplearse para el tratamiento de tumores u otros tejidos enfermos, además de para la obtención de imágenes. [0188]Radionuclides -MURPs can be designed for tissue-targeting delivery of radionuclides, as well as for radionuclide imaging. URPs are ideal for imaging because the half-life can be optimized by changing the length of the URP. For most imaging applications a moderately long URP is likely to be preferred, providing a half-life of 5 minutes to a few hours, not days or weeks. MURPs can be designed to contain only a single amino group or a small defined number of amino groups that can be modified with chelating agents (such as DOTA) for radioisotopes such as technetium, indium and yttrium (EXPAND). Alternative conjugation procedures are via reserved cysteine side chains. Such radionuclide-bearing MURPs can be used for the treatment of tumors or other diseased tissues, as well as for imaging.

[0189]Muchas proteínas farmacéuticamente activas o dominios de proteína pueden usarse como modelos efectores en MURP. Ejemplos son las siguientes proteínas, además de fragmentos de estas proteínas: citocinas, factores de crecimiento, enzimas, receptores, microproteínas, hormonas, eritropoyetina, adenosina desiminasa, asparaginasa, arginasa, interferón, hormona de crecimiento, hormona liberadora de hormona de crecimiento, G-CSF, GM-CSM, insulina, hirudina, receptor de TNF, uricasa, rasburicasa, axoquina, RNAsa, ADNsa, fosfatasa, exotoxina dePseudomonas,ricina, gelonina, desmoteplasa, laronidasa, trombina, enzima de coagulación de la sangre, VEGF, protropina, somatropina, alteplasa, interleucina, factor IIV, factor VIII, factor X, factor IX, dornasa, glucocerebrosidasa, folitropina, glucagón, tirotropina, nesiritida, alteplasa, teriparatida, agalsidasa, laronidasa, metioninasa. [0189]Many pharmaceutically active proteins or protein domains can be used as effector models in MURP. Examples are the following proteins, as well as fragments of these proteins: cytokines, growth factors, enzymes, receptors, microproteins, hormones, erythropoietin, adenosine deiminase, asparaginase, arginase, interferon, growth hormone, growth hormone-releasing hormone, G -CSF, GM-CSM, insulin, hirudin, TNF receptor, uricase, rasburicase, axokine, RNase, DNAse, phosphatase, Pseudomonas exotoxin, ricin, gelonin, desmoteplase, laronidase, thrombin, blood clotting enzyme, VEGF, protropin , somatropin, alteplase, interleukin, factor IIV, factor VIII, factor

[0190]MURP activada por proteasa:Para potenciar el índice terapéutico de un módulo efector pueden insertarse secuencias lábiles a proteasas en secuencias de URP que son sensibles a proteasas que se encuentran preferencialmente en suero o en el tejido diana que va a tratarse por la MURP. Este enfoque se ilustra en la Figura 9. Algunos diseños permiten construir proteínas que son selectivamente activadas cuando llegan a un tejido diana. Son de particular interés MURP que se activan en un sitio de enfermedad. Para facilitar tal activación específica para diana, secuencias de URP pueden unirse en estrecha proximidad al sitio activo o sitio de unión a receptor del módulo efector de forma que la proteína de fusión resultante tenga actividad biológica limitada. Es de particular interés la activación de un módulo efector en un sitio tumoral. Muchos tejidos tumorales expresan proteasas a concentraciones relativamente altas y secuencias que son específicamente escindidas por estas proteasas tumorales pueden insertarse en secuencias de URP. Por ejemplo, la mayoría de los tejidos tumorales de la próstata contienen altas concentraciones de antígeno específico de la próstata (PSA), que es una serina proteasa. Profármacos constituidos por un péptido lábil a PSA conjugado con el fármaco contra el cáncer doxorubicina han mostrado activación selectiva en tejido de próstata [DeFeo-Jones, D. y col. (2000) Nat Med, 6: 1248]. De particular interés para activación específica para enfermedad son proteínas con actividad citostática o citotóxica como TNF-alfa, y muchas citocinas e interleucinas. Otra aplicación es la activación selectiva de proteínas en el sitio de inflamación o en el sitio de virus o infección bacteriana. [0190] Protease-activated MURP: To enhance the therapeutic index of an effector module, protease-labile sequences can be inserted into URP sequences that are sensitive to proteases that are preferentially found in serum or in the target tissue to be treated by MURP. . This approach is illustrated in Figure 9. Some designs allow the construction of proteins that are selectively activated when they reach a target tissue. Of particular interest are MURPs that are activated at a disease site. To facilitate such target-specific activation, URP sequences can be linked in close proximity to the active site or receptor binding site of the effector module so that the resulting fusion protein has limited biological activity. Of particular interest is the activation of an effector module at a tumor site. Many tumor tissues express proteases at relatively high concentrations and sequences that are specifically cleaved by these tumor proteases can be inserted into URP sequences. For example, most prostate tumor tissues contain high concentrations of prostate-specific antigen (PSA), which is a serine protease. Prodrugs consisting of a PSA-labile peptide conjugated to the anticancer drug doxorubicin have shown selective activation in prostate tissue [DeFeo-Jones, D. et al. (2000) Nat Med, 6: 1248]. Of particular interest for disease-specific activation are proteins with cytostatic or cytotoxic activity such as TNF-alpha, and many cytokines and interleukins. Another application is the selective activation of proteins at the site of inflammation or at the site of virus or bacterial infection.

[0191]Procedimientos de producción -Las MURP que contienen secuencias de URP pueden producirse usando enfoques de biología molecular que son muy conocidos en la materia. Están disponibles una variedad de vectores de clonación para diversos sistemas de expresión como células de mamífero, levadura y microbios. De particular interés como huéspedes de expresión sonE. coli, S. cerevisiae, P. pastorisy células de ovario de hámster chino. Son de particular interés huéspedes que han sido optimizados para ampliar su uso de codones. Es de particular interés un huésped que ha sido modificado para potenciar la expresión de GRS. Esto puede hacerse proporcionando ADN que codifica ARNt específicos para glicina. Además, puede manipularse el huésped de forma que se potencie la carga de ARNt específico para glicina. El ADN que codifica la proteína potenciada puede ligarse operacionalmente a secuencias promotoras. El ADN que codifica la proteína potenciada, además del promotor operacionalmente ligado, puede ser parte de un vector de plásmido, vector vírico o puede insertarse en el cromosoma del huésped. [0191]Production procedures -MURPs containing URP sequences can be produced using molecular biology approaches that are well known in the art. A variety of cloning vectors are available for various expression systems such as mammalian cells, yeast, and microbes. Of particular interest as expression hosts are E. coli, S. cerevisiae, P. pastoris, and Chinese hamster ovary cells. Of particular interest are guests that have been optimized to expand their codon usage. Of particular interest is a host that has been modified to enhance GRS expression. This can be done by providing DNA that encodes glycine-specific tRNAs. Furthermore, the host can be manipulated in a way that enhances the loading of glycine-specific tRNA. The DNA encoding the enhanced protein can be operationally linked to promoter sequences. The DNA encoding the enhanced protein, in addition to the operationally linked promoter, may be part of a plasmid vector, viral vector, or may be inserted into the host chromosome.

[0192] Para la producción, el huésped puede cultivarse en condiciones que faciliten la producción de la proteína potenciada. Son de particular interés condiciones que mejoran la producción de GRS. [0192] For production, the host can be grown under conditions that facilitate production of the enhanced protein. Of particular interest are conditions that enhance LFG production.

[0193] Las MURP objeto pueden adoptar una variedad de formatos. Por ejemplo, las MURP pueden contener URP que están fusionados con proteínas farmacéuticamente activas para producir productos de lenta liberación. Tales productos pueden inyectarse o implantarse localmente, por ejemplo, en o bajo la piel de un paciente. Debido a su gran radio hidrodinámico, el producto que contiene secuencias de URP se libera lentamente del sitio de inyección o implantación que conduce a una reducción de la frecuencia de inyección o implantación. Las secuencias de URP pueden diseñarse para contener regiones que se unen a superficies celulares o tejido con el fin de prolongar la retención local del fármaco en el sitio de inyección. Son de particular interés productos que contienen URP que pueden formularse como compuestos solubles, pero forman agregados o precipitados tras la inyección. Esta agregación o precipitación puede desencadenarse por un cambio en pH entre el producto formulado y el pH en el sitio de inyección. Alternativas son productos que contienen URP que precipitan o forman agregados como resultado de un cambio en las condiciones rédox. Todavía otro enfoque es un producto que contiene URP que se estabiliza en disolución mediante la adición de solutos no activos, pero que precipita o se agrega tras la inyección como resultado de la difusión de los solutos solubilizantes. Otro enfoque es diseñar productos que contienen URP que contienen uno o múltiples residuos de lisina o cisteína en su secuencia de URP y que pueden reticularse antes de la inyección. [0193] Object MURPs can take a variety of formats. For example, MURPs may contain URPs that are fused to pharmaceutically active proteins to produce slow-release products. Such products may be injected or implanted locally, for example, in or under the skin of a patient. Due to its large hydrodynamic radius, the product containing URP sequences is slowly released from the injection or implantation site leading to a reduction in the injection or implantation frequency. URP sequences can be designed to contain regions that bind to cell surfaces or tissue in order to prolong local retention of the drug at the injection site. Of particular interest are products containing URPs that may be formulated as soluble compounds, but form aggregates or precipitates upon injection. This aggregation or precipitation can be triggered by a change in pH between the formulated product and the pH at the injection site. Alternatives are URP-containing products that precipitate or form aggregates as a result of a change in redox conditions. Still another approach is a URP-containing product that is stabilized in solution by the addition of non-active solutes, but that precipitates or aggregates upon injection as a result of diffusion of the solubilizing solutes. Another approach is to design URP-containing products that contain one or multiple lysine or cysteine residues in their URP sequence and that can be cross-linked prior to injection.

[0194] Si se desea, la MURP es monomérica (que aquí significa no reticulada) cuando se fabrica y se formula y cuando se inyecta, pero después de la inyección subcutánea la proteína empieza a reticularse consigo mismo o con proteínas humanas nativas, formando un polímero bajo la piel del cual las moléculas de fármaco activas se liberan solo muy gradualmente. Tal liberación puede ser por reducción del enlace disulfuro o barajado de disulfuros como se ilustra en la Fig. 18, o puede mediarse por la proteólisis como se muestra en la Fig. 19, liberando fragmentos activos en la circulación. Es importante que estos fragmentos activos sean suficientemente grandes para tener una larga semivida, debido a que cuanto más larga sea su semivida de secreción, menor podrá ser la dosis de la proteína liberada, permitiendo el uso de una menor dosis de producto que va a inyectarse o un tiempo prolongado entre inyecciones. [0194] If desired, MURP is monomeric (here meaning non-cross-linked) when manufactured and formulated and when injected, but after subcutaneous injection the protein begins to cross-link with itself or with native human proteins, forming a polymer under the skin from which active drug molecules are released only very gradually. Such release may be by disulfide bond reduction or disulfide shuffling as illustrated in Fig. 18, or may be mediated by proteolysis as shown in Fig. 19, releasing active fragments into the circulation. It is important that these active fragments are large enough to have a long half-life, because the longer their secretion half-life, the lower the dose of the protein released, allowing the use of a lower dose of product to be injected. or a long time between injections.

[0195]Un enfoque que ofrece estas ventajas es la reticulación mediada por disulfuro de proteínas. Por ejemplo, un fármaco de proteína se fabricaría con un péptido cíclico en él (uno o más). Este péptido cíclico puede o puede no participar en la unión a la diana. Esta proteína se fabrica con el péptido cíclico formado, es decir, en forma oxidada, para simplificar la purificación. Sin embargo, el producto se reduce luego y se formula para mantener la proteína en forma reducida. Es importante que el péptido cíclico se reduzca a una baja concentración de agente reductor, tal como ditiotreitol 0,25, 0,5, 1,0, 2,0, 4,0 ó 8,0 mM o beta-mercaptoetanol o cisteína o agente reductor equivalente, de manera que el péptido cíclico pueda reducirse sin reducir otros módulos de proteína que contienen disulfuro en el producto. Se prefiere el uso de agentes reductores aprobados por la FDA, tales como cisteína o glutatión. Después de la inyección subcutánea, el agente reductor de bajo peso molecular difunde rápidamente o se neutraliza por proteínas humanas, exponiendo el fármaco a un ambiente oxidante, a la vez que está a alta concentración molar, produciendo reticulación de cisteínas localizadas sobre diferentes cadenas de proteína, que conducen a polimerización del fármaco en el sitio de inyección. Cuanto mayor sea la distancia entre las cisteínas en el péptido cíclico, y mayor sea la concentración de fármaco, mayor será el grado de polimerización del fármaco, ya que la polimerización compite con la re-formación de péptido cíclico. Con el tiempo, la reducción y oxidación del disulfuro producirá re-barajado de disulfuro, que conducirá a la re-formación de péptido cíclico y monomerización y re-solubilización del fármaco. La liberación del fármaco del polímero también puede producirse mediante proteólisis, que podría ser elegida como diana y controlarse o aumentarse formando sitios de escisión para proteasas del suero. La reticulación de las proteínas también podría realizarse con un agente de reticulación químico de proteína-proteína tal como los enumerados en la [Tabla x]. Idealmente, éste es un agente ya aprobado por la FDA, tal como aquellos usados para la conjugación de vacunas o conjugación de productos químicos con proteínas. [0195]One approach that offers these advantages is protein disulfide-mediated cross-linking. For example, a protein drug would be made with a cyclic peptide in it (one or more). This cyclic peptide may or may not participate in binding to the target. This protein is manufactured with the formed cyclic peptide, that is, in oxidized form, to simplify purification. However, the product is then reduced and formulated to keep the protein in a reduced form. It is important that the cyclic peptide be reduced to a low concentration of reducing agent, such as 0.25, 0.5, 1.0, 2.0, 4.0 or 8.0 mM dithiothreitol or cysteine or equivalent reducing agent, so that the cyclic peptide can be reduced without reducing other disulfide-containing protein modules in the product. The use of FDA-approved reducing agents, such as cysteine or glutathione, is preferred. After subcutaneous injection, the low molecular weight reducing agent rapidly diffuses or is neutralized by human proteins, exposing the drug to an oxidizing environment, while at high molar concentration, producing cross-linking of cysteines located on different protein chains. , which lead to polymerization of the drug at the injection site. The greater the distance between the cysteines in the cyclic peptide, and the greater the drug concentration, the greater the degree of polymerization of the drug, since the polymerization competes with the re-formation of the cyclic peptide. Over time, the reduction and oxidation of the disulfide will produce re-shuffling of disulfide, which will lead to the re-formation of cyclic peptide and monomerization and re-solubilization of the drug. Drug release from the polymer can also occur by proteolysis, which could be targeted and controlled or increased by forming cleavage sites for serum proteases. Cross-linking of proteins could also be performed with a protein-protein chemical cross-linking agent such as those listed in [Table x]. Ideally, this is an agent already approved by the FDA, such as those used for vaccine conjugation or protein conjugation of chemicals.

[0196]En lugar de usar disulfuros, también pueden estabilizarse proteínas contra la degradación proteolítica usando una amplia variedad de agentes de reticulación. La mayoría de los siguientes agentes son comercializados por Pierce Chemicals bajo el mismo nombre e instrucciones para su uso están disponibles en línea (www.piercenet.com). Los agentes que producen la misma distancia cadena a cadena como se ha obtenido con disulfuros son los que más probablemente serán útiles para la presente aplicación. Los agentes de ligador corto tales como DFDNB son los más prometedores. La distancia entre cadenas puede determinarse fácilmente a partir de las estructuras de los productos químicos como se muestra en www.piercenet.com. [0196]Instead of using disulfides, proteins can also be stabilized against proteolytic degradation using a wide variety of cross-linking agents. Most of the following agents are marketed by Pierce Chemicals under the same name and instructions for their use are available online (www.piercenet.com). Agents that produce the same chain-to-chain distance as has been obtained with disulfides are those most likely to be useful for the present application. Short linker agents such as DFDNB are the most promising. The distance between chains can be easily determined from the structures of chemicals as shown at www.piercenet.com.

[0197]Hay un gran número de productos químicos específicos que funcionan basándose en el siguiente número pequeño de esquemas de reacción básicos, todos los cuales se describen en detalle en www.piercenet.com. Ejemplos de agentes de reticulación útiles son imidoésteres, halógenos activos, maleimida, disulfuro de piridilo, éster de NHS. Los agentes de reticulación homobifuncionales tienen dos grupos reactivos idénticos y se usan frecuentemente en un procedimiento de reticulación química de una etapa. Ejemplos son BS3 (un análogo de DSS soluble en agua no escindible), BSOCOES (de bases reversibles), DMA (adipimidato de dimetilo-2HCl), DMP (pimelimidato de dimetilo-2HCl), DEM (suberimidato de dimetilo-2HCl), DSG (análogo de 5 carbonos de D<s>S), DSP (reactivo de Lomant), DSS (no escindible), DST (escindible por agentes de oxidación), DTBP (3,3'-ditiobispropionimidato de dimetilo-2HCl), DTSSP, EGS, Sulfo-EGS, THPP, TSAT, DFDNB (1,5-difluoro-2,4-dinitrobenceno) es especialmente útil para reticular entre pequeñas distancias espaciales (Kornblatt, J.A. y Lake, D.F. (1980). Cross-linking of cytochrome oxidase subunits with difluorodinitrobenzene. Can J. Biochem. 58, 219-224). [0197]There are a large number of specific chemicals that work based on the following small number of basic reaction schemes, all of which are described in detail at www.piercenet.com. Examples of useful cross-linking agents are imidoesters, active halogens, maleimide, pyridyl disulfide, NHS ester. Homobifunctional cross-linking agents have two identical reactive groups and are frequently used in a one-step chemical cross-linking process. Examples are BS3 (a non-cleavable water-soluble DSS analogue), BSOCOES (base-reversible), DMA (dimethyl adipimidate-2HCl), DMP (dimethyl pimelimidate-2HCl), DEM (dimethyl suberimidate-2HCl), DSG (5-carbon analogue of D<s>S), DSP (Lomant reagent), DSS (non-cleavable), DST (cleavable by oxidation agents), DTBP (dimethyl 3,3'-dithiobispropionimidate-2HCl), DTSSP , EGS, Sulfo-EGS, THPP, TSAT, DFDNB (1,5-difluoro-2,4-dinitrobenzene) is especially useful for cross-linking over small spatial distances (Kornblatt, J.A. and Lake, D.F. (1980). Cross-linking of cytochrome oxidase subunits with difluorodinitrobenzene. Can J. Biochem. 58, 219-224).

[0198]Los agentes de reticulación homofuncionales reactivos con sulfhidrilo que son reticulantes de proteínas homobifuncionales que reaccionan con sulfhidrilos se basan frecuentemente en maleimidas, que reaccionan con grupos -SH a pH 6,5-7,5, formando enlaces tioéter estables. BM[PEO]3 es un espaciador de poliéter de 8 átomos que reduce las posibilidades de precipitación de conjugados en aplicaciones de reticulación de sulfhidrilo con sulfhidrilo. BM[PEO]4 es similar, pero con un espaciador de 11 átomos. BMB es un reticulante no escindible con un espaciador de cuatro carbonos. BMDB forma un enlace que puede escindirse con peryodato. BMH es un reticulante reactivo con sulfhidrilo homobifuncional ampliamente usado. BMOE tiene un ligador especialmente corto. DPDPB y DTME son reticulantes escindibles. HVBS no tiene el potencial de hidrólisis de las meleimidas. TMEA es otra opción. Los agentes reticulantes heterobifuncionales tienen dos grupos reactivos diferentes. Ejemplos son ésteres de NHS y aminas/hidracinas mediante activación de EDC, AEDP, ASB<a>(fotorreactivo, yodable), EDC (carbodiimida soluble en agua). Los reticulantes bifuncionales reactivos con amina-sulfhidrilo son AMAS, APDP, BMPS, EMCA, EMCS, GMBS, KMUA, LC-SMCC, LC-SPDP, MBS, SBAP, SIA (extra-corto), SIAB, SMCC, SMPB, SMPH, SMPT, SPDP, sulfo-EMCS, Sulfo-GMBS, Sulfo-KMUS, Sulfo-LC-SMPT, Sulfo-LC-SPDP, Sulfo-MBS, Sulfo-SIAB, Sulfo-SMCC, Sulfo-SMPB. Agentes de reticulación heterobifuncionales reactivos con grupos amino son ANB-NOS, MSA, NHS-ASA, SADP, SAED, SAND, SANPAH, SASD, SFAD, Sulfo-HSAB, Sulfo-NHS-LC-ASA, Sulfo-SADP, Sulfo-SANPAH, TFCS. [0198]Sulfhydryl-reactive homofunctional cross-linking agents that are sulfhydryl-reactive homobifunctional protein cross-linkers are frequently based on maleimides, which react with -SH groups at pH 6.5-7.5, forming stable thioether bonds. BM[PEO]3 is an 8-atom polyether spacer that reduces the chances of conjugate precipitation in sulfhydryl-sulfhydryl cross-linking applications. BM[PEO]4 is similar, but with an 11-atom spacer. BMB is a non-cleavable cross-linker with a four-carbon spacer. BMDB forms a bond that can be cleaved by periodate. BMH is a widely used homobifunctional sulfhydryl-reactive cross-linker. BMOE has an especially short linker. DPDPB and DTME are cleavable cross-linkers. HVBS does not have the hydrolysis potential of meleimides. TMEA is another option. Heterobifunctional cross-linking agents have two different reactive groups. Examples are NHS esters and amines/hydrazines by activation of EDC, AEDP, ASB<a>(photoreactive, iodable), EDC (water-soluble carbodiimide). Amine-sulfhydryl reactive bifunctional crosslinkers are AMAS, APDP, BMPS, EMCA, EMCS, GMBS, KMUA, LC-SMCC, LC-SPDP, MBS, SBAP, SIA (extra-short), SIAB, SMCC, SMPB, SMPH, SMPT, SPDP, Sulfo-EMCS, Sulfo-GMBS, Sulfo-KMUS, Sulfo-LC-SMPT, Sulfo-LC-SPDP, Sulfo-MBS, Sulfo-SIAB, Sulfo-SMCC, Sulfo-SMPB. Heterobifunctional cross-linking agents reactive with amino groups are ANB-NOS, MSA, NHS-ASA, SADP, SAED, SAND, SANPAH, SASD, SFAD, Sulfo-HSAB, Sulfo-NHS-LC-ASA, Sulfo-SADP, Sulfo-SANPAH , TFCS.

[0199]El fármaco marcado con una marca de His6 tiene un formato de liberación lenta diferente, que se mezcla y co-inyecta con perlas conjugadas con níquel-ácido nitrilotriacético (perlas Ni-NTA), una versión de GMO de las que están disponibles de Qiagen. El fármaco se liberaría lentamente de las perlas, proporcionando liberación controlada y lenta como se ilustra en la Fig. 20. Las perlas son opcionales y pueden sustituirse por un níquel-ácido nitrilotriacético polimérico reticulado que conduce a ensamblaje de un polímero incluso mayor. [0199]The drug tagged with a His6 tag has a different slow-release format, which is mixed and co-injected with nickel-nitrilotriacetic acid conjugated beads (Ni-NTA beads), a GMO version of those available by Qiagen. The drug would be slowly released from the beads, providing controlled and slow release as illustrated in Fig. 20. The beads are optional and can be replaced by a cross-linked polymeric nickel-nitrilotriacetic acid leading to assembly of an even larger polymer.

[0200]Las secuencias de URP pueden contener secuencias que son conocidas por formar multímeros como alfa2D [Hill, R, y col. (1998) J Am Chem Soc, 120: 1138-1145] que se utilizó para dimerizar un fragmento de anticuerpo [Kubetzko, S. y col. (2005) Mol Pharmacol, 68: 1439-54]. Ejemplos de un péptido de homodimerización útil es la secuencia SKVILFE. Un ejemplo de secuencias de heterodimerización útiles son el péptido ARARAR que puede formar dímeros con la secuencia DADADA y secuencias relacionadas. La multimerización puede mejorar la función biológica de una molécula aumentando su avidez y puede influir en las propiedades farmacocinéticas y distribución de tejido de las MURP resultantes. [0200]URP sequences may contain sequences that are known to form multimers such as alpha2D [Hill, R, et al. (1998) J Am Chem Soc, 120: 1138-1145] which was used to dimerize an antibody fragment [Kubetzko, S. et al. (2005) Mol Pharmacol, 68: 1439-54]. Examples of a useful homodimerization peptide is the SKVILFE sequence. An example of useful heterodimerization sequences is the ARARAR peptide which can form dimers with the DADADA sequence and related sequences. Multimerization can improve the biological function of a molecule by increasing its avidity and can influence the pharmacokinetic properties and tissue distribution of the resulting MURPs.

[0201]Los “módulos de multimerización” son secuencias de aminoácidos que facilitan la formación de dímeros o multímeros de MURP. Los módulos de multimerización pueden unirse a sí mismos para formar dímeros o multímeros. Alternativamente, los módulos de multimerización pueden unirse a otros módulos de la MURP. Éstas pueden ser cremalleras de leucina o péptidos pequeños como derivados del activador de la cabeza de la hidra (similares a SKVILF) que forman homopolímeros antiparalelos, o péptidos como RARARA y DADADA, que forman heteropolímeros antiparalelos de alta afinidad. Usando una, dos o más copias de estos péptidos puede forzarse la formación de dímeros de proteína, multímeros lineales o multímeros ramificados. [0201]The “multimerization modules” are amino acid sequences that facilitate the formation of MURP dimers or multimers. Multimerization modules can join themselves to form dimers or multimers. Alternatively, multimerization modules can be linked to other MURP modules. These can be leucine zippers or small peptides such as hydra head activator derivatives (similar to SKVILF) that form antiparallel homopolymers, or peptides such as RARARA and DADADA, which form high affinity antiparallel heteropolymers. Using one, two or more copies of these peptides can force the formation of protein dimers, linear multimers or branched multimers.

[0202]La afinidad de la asociación puede confeccionarse cambiando el tipo, longitud y composición de los péptidos. Algunas aplicaciones requieren péptidos que forman homodímeros como se ilustra en la Fig. 21. Otras aplicaciones requieren heterodímeros. En algunos casos, una vez asociados, los péptidos pueden bloquearsein situformando enlaces disulfuro entre las dos cadenas de proteína, normalmente a cualquier lado de los péptidos. Los módulos de multimerización son útiles para enlazar juntas dos moléculas de MURP (cabeza con cola, cabeza con cabeza, o cola con cola) como se ilustra en la Fig. 21. Los módulos de multimerización pueden localizarse en cualquiera del extremo N o C con el fin de formar dímeros. Si los módulos de multimerización están presentes en ambos extremos, se formarán multímeros lineales largos. Si más de dos módulos de multimerización están presentes por proteína, pueden formarse redes poliméricas ramificadas. Los conceptos de multimerización y conjugación química pueden combinarse conduciendo a útiles para la extensión de la semivida y formación de depósito, conduciendo a lenta liberación del fármaco activo del depósito o sitio de inyección como se ilustra en la Fig. 23. [0202]The affinity of the association can be made by changing the type, length and composition of the peptides. Some applications require peptides that form homodimers as illustrated in Fig. 21. Other applications require heterodimers. In some cases, once associated, the peptides can lock in situ by forming disulfide bonds between the two protein chains, usually on either side of the peptides. The multimerization modules are useful for linking two MURP molecules together (head to tail, head to head, or tail to tail) as illustrated in Fig. 21. The multimerization modules can be located at either the N or C terminus with in order to form dimers. If multimerization modules are present at both ends, long linear multimers will form. If more than two multimerization modules are present per protein, branched polymer networks can form. The concepts of multimerization and chemical conjugation can be combined leading to useful half-life extension and depot formation, leading to slow release of the active drug from the depot or injection site as illustrated in Fig. 23.

[0203]Las MURP objeto pueden incorporar un URP genérico o universal. Un enfoque es expresar un URP que contiene un módulo de URP largo, que proporciona semivida y contiene múltiples (normalmente 4-10) lisinas (u otros sitios) que permiten la conjugación específica para sitio de péptidos (es decir, lineales, cíclicos, 2SS, 3SS, etc.) que se unen a una diana específica. La ventaja de este enfoque es que el módulo de URP es genérico y puede conjugarse con cualquier péptido específico para diana. Idealmente, el enlace del péptido específico para diana con el URP es un enlace dirigido, de manera que los residuos sobre el URP solo pueden reaccionar con un residuo sobre el péptido específico para diana y el acoplamiento exhaustivo solo puede producir una única especie, que es, por ejemplo, un URP que está ligado a un péptido en cada lisina. Este complejo se comporta como un multímero de alta avidez en sus propiedades de unión, pero es simple de fabricar. Este enfoque se ilustra en la Fig. 24. [0203]Object MURPs may incorporate a generic or universal URP. One approach is to express a URP that contains a long URP module, which provides half-life and contains multiple (typically 4-10) lysines (or other sites) that allow site-specific conjugation of peptides (i.e., linear, cyclic, 2SS , 3SS, etc.) that bind to a specific target. The advantage of this approach is that the URP module is generic and can be conjugated to any target-specific peptide. Ideally, the binding of the target-specific peptide to the URP is a directed binding, such that residues on the URP can only react with one residue on the target-specific peptide and exhaustive coupling can only produce a single species, which is , for example, a URP that is linked to a peptide at each lysine. This complex behaves like a high-avidity multimer in its binding properties, but is simple to manufacture. This approach is illustrated in Fig. 24.

[0204]Las MURP objeto también pueden incorporar URP para efectuar la administración a través de barreras de tejido. Los URP pueden manipularse para potenciar la administración a través de las barreras dérmica, oral, bucal, intestinal, nasal, hematoencefálica, pulmonar, tecal, peritoneal, rectal, vaginal o muchas otras barreras de tejido. [0204]Subject MURPs may also incorporate URPs to effect delivery across tissue barriers. URPs can be manipulated to enhance delivery across dermal, oral, oral, intestinal, nasal, blood-brain, pulmonary, thecal, peritoneal, rectal, vaginal, or many other tissue barriers.

[0205]Uno de los obstáculos clave para la administración de proteínas orales es la sensibilidad de la mayoría de las proteínas a proteasas en el aparato digestivo. La conjugación con secuencias de URP puede mejorar la resistencia a proteasas de proteínas farmacéuticamente activas y así facilitar su captación. Se ha mostrado que la captación de proteínas en el aparato digestivo puede mejorarse añadiendo vehículos moleculares. La función principal de estos vehículos es una mejora de la permeabilidad de la membrana [Stoll, B. R. y col. (2000) J Control Release, 64: 217-28]. Así, pueden incluirse secuencias en secuencias de URP que mejoran la permeabilidad de la membrana. Muchas secuencias que mejoran la permeabilidad de la membrana son conocidas y ejemplos son secuencias ricas en arginina [Takenobu, T. y col. (2002) Mol Cancer The, 1: 1043-9]. Así, pueden diseñarse secuencias de URP que mejoran la captación celular u oral de proteínas combinando dos funciones, una reducción en la degradación proteolítica de la proteína de interés, además de un aumento en la permeabilidad de la membrana del producto de fusión. Opcional, puede añadirse secuencia a la secuencia de URP que es sensible a una proteasa que está preferencialmente localizada en el tejido diana para el fármaco de interés, pero es estable a proteasas en el tubo digestivo. Ejemplos de tales secuencias de URP son secuencias que contienen regiones largas de GRS, además de secuencias que son ricas en aminoácidos básicos, en particular arginina, y facilitan la transferencia de la membrana. URP puede utilizarse de un modo similar para mejorar la captación de proteínas mediante las vías intranasal, intrapulmonar, u otras vías de administración. [0205]One of the key obstacles to oral protein administration is the sensitivity of most proteins to proteases in the digestive system. Conjugation with URP sequences can improve the protease resistance of pharmaceutically active proteins and thus facilitate their uptake. It has been shown that protein uptake in the digestive system can be improved by adding molecular carriers. The main function of these vehicles is an improvement in membrane permeability [Stoll, B. R. et al. (2000) J Control Release, 64: 217-28]. Thus, sequences can be included in URP sequences that improve membrane permeability. Many sequences that improve membrane permeability are known and examples are arginine-rich sequences [Takenobu, T. et al. (2002) Mol Cancer The, 1: 1043-9]. Thus, URP sequences can be designed that improve cellular or oral uptake of proteins by combining two functions, a reduction in proteolytic degradation of the protein of interest, as well as an increase in the membrane permeability of the fusion product. Optionally, sequence may be added to the URP sequence that is sensitive to a protease that is preferentially located in the target tissue for the drug of interest, but is stable to proteases in the digestive tract. Examples of such URP sequences are sequences that contain long GRS regions, as well as sequences that are rich in basic amino acids, in particular arginine, and facilitate membrane transfer. URP can be used in a similar way to improve protein uptake via intranasal, intrapulmonary, or other routes of administration.

Ejemplos de productos específicos:Examples of specific products:

[0206]Agonista de DR4/DR5 -DR4 y DR5 son receptores de muerte que se expresan en muchas células tumorales. Estos receptores pueden desencadenarse por trimerización, que conduce a muerte celular y regresión tumoral. Los dominios de unión con especificidad por DR4 o DR5 pueden obtenerse por inmunopurificación de fago u otros procedimientos de visualización: Estos dominios específicos de unión a DR4 o DR5 pueden multimerizarse usando módulos de URP como ligadores como se ilustra en la Figura 12. Son de particular interés MURP que contienen tres o más módulos de unión con especificidad por DR4 o DR5 o ambos. Como se ilustra en la Figura 12, las MURP pueden contener módulos de unión adicionales con especificidad por antígenos de tumor que se expresan en exceso en tejidos tumorales. Esto permite construir MURP que se acumulan específicamente en tejido tumoral y desencadenan muerte celular. Las MURP pueden contener módulos que se unen a o bien DR4 o a DR5. Son de particular interés MURP que contienen módulos de unión que se unen tanto a DR4 como a DR5. [0206]DR4/DR5 agonist -DR4 and DR5 are death receptors that are expressed on many tumor cells. These receptors can be triggered by trimerization, which leads to cell death and tumor regression. Binding domains with specificity for DR4 or DR5 can be obtained by phage immunopurification or other display procedures: These specific DR4 or DR5 binding domains can be multimerized using URP modules as linkers as illustrated in Figure 12. They are of particular MURPs of interest containing three or more binding modules with specificity for DR4 or DR5 or both. As illustrated in Figure 12, MURPs may contain additional binding modules with specificity for tumor antigens that are overexpressed in tumor tissues. This allows the construction of MURPs that accumulate specifically in tumor tissue and trigger cell death. MURPs can contain modules that bind to either DR4 or DR5. Of particular interest are MURPs that contain binding modules that bind both DR4 and DR5.

[0207]Interleucina 2 elegida como diana por tumor -La interleucina 2 (IL2) es una citocina que puede potenciar la respuesta inmunitaria a tejido tumoral. Sin embargo, la terapia con IL2 sistémica se caracteriza por efectos secundarios significativos. Las MURP pueden construirse de forma que combinen dominios de unión con especificidad por antígenos de tumor e IL2 como módulo efector como se ilustra en la Figura 13. Tales MURP pueden acumularse selectivamente en tejido tumoral y así provocar una respuesta inmunitaria selectiva para tumor, a la vez que se minimizan los efectos secundarios sistémicos de la terapia con citocinas. Tales MURP pueden elegir como diana una variedad de antígenos de tumor como EpCAM, Her2, CEA, EGFR, antígeno de Thomsen-Friedenreich. Son de particular utilidad MURP que se unen a antígenos de tumor que muestran lenta internalización. Pueden diseñarse MURP similares usando otras citocinas o factor de necrosis tumoral-alfa como módulos efectores. [0207]Interleukin 2 chosen as a target by tumor -Interleukin 2 (IL2) is a cytokine that can enhance the immune response to tumor tissue. However, systemic IL2 therapy is characterized by significant side effects. MURPs can be constructed in a way that combines binding domains with specificity for tumor antigens and IL2 as an effector module as illustrated in Figure 13. Such MURPs can selectively accumulate in tumor tissue and thus provoke a tumor-selective immune response, to which while minimizing the systemic side effects of cytokine therapy. Such MURPs can target a variety of tumor antigens such as EpCAM, Her2, CEA, EGFR, Thomsen-Friedenreich antigen. Of particular use are MURPs that bind to tumor antigens that show slow internalization. Similar MURPs can be designed using other cytokines or tumor necrosis factor-alpha as effector modules.

[0208]Asparaginasa selectiva para tumor -La asparaginasa se usa para tratar pacientes con leucemia aguda. Tanto la asparaginasa deE. colicomo la asparaginasa deErwiniase usan para tratamiento. Ambas enzimas pueden conducir a inmunogenicidad y reacciones hipersensibles. Oncaspar es la versión PEGilada de la asparaginasa que tiene inmunogenicidad reducida. Sin embargo, la proteína es difícil de fabricar y se administra como una mezcla de isómeros. La adición de secuencias de URP a los extremos y/o a bucles internos permite la fabricación recombinante directa de una variante de asparaginasa que es homogénea y tiene baja inmunogenicidad. Pueden compararse diversas secuencias de URP y sitios de unión para determinar la posición óptima para la unión a secuencia de URP. Varias otras enzimas que pueden degradar aminoácidos han informado actividad antitumoral. Ejemplos son arginasa, metioninasa, fenilalanina amoniaco liasa y triptofanasa. Es de particular interés la fenilalanina amoniaco liasa deStreptomyces maritimus,que tiene una alta actividad específica y no requiere un cofactor [Calabrese, J. C. y col. (2004) Biochemistry, 43: 11403-16]. La mayoría de estas enzimas son de origen bacteriano u otro origen no humano y es probable que provoquen reacciones inmunitarias. La inmunogenicidad de estas enzimas puede reducirse añadiendo una o más secuencias de URP. Además, el índice terapéutico y las propiedades PK de estas enzimas pueden mejorarse aumentando su radio hidrodinámico como resultado de unión a secuencias de URP. [0208]Tumor-selective asparaginase -Asparaginase is used to treat patients with acute leukemia. Both the asparaginase of E. coli and Erwinia asparaginase are used for treatment. Both enzymes can lead to immunogenicity and hypersensitive reactions. Oncaspar is the PEGylated version of asparaginase that has reduced immunogenicity. However, the protein is difficult to manufacture and is administered as a mixture of isomers. The addition of URP sequences to the ends and/or to internal loops allows direct recombinant manufacturing of an asparaginase variant that is homogeneous and has low immunogenicity. Various URP sequences and binding sites can be compared to determine the optimal position for URP sequence binding. Several other enzymes that can degrade amino acids have reported antitumor activity. Examples are arginase, methioninase, phenylalanine ammonia lyase and tryptophanase. Of particular interest is the phenylalanine ammonia lyase from Streptomyces maritimus, which has a high specific activity and does not require a cofactor [Calabrese, J. C. et al. (2004) Biochemistry, 43: 11403-16]. Most of these enzymes are of bacterial or other non-human origin and are likely to cause immune reactions. The immunogenicity of these enzymes can be reduced by adding one or more URP sequences. Furthermore, the therapeutic index and PK properties of these enzymes can be improved by increasing their hydrodynamic radius as a result of binding to URP sequences.

[0209] Las MURP objeto pueden diseñarse para elegir como diana cualquier proteína celular. Una lista no limitante se proporciona a continuación. [0209] The target MURPs can be designed to target any cellular protein. A non-limiting list is provided below.

[0210] VEGF, VEGF-R1, VEGF-R2, VEGF-R3, Her-1, Her-2, Her-3, EGF-1, EGF-2, EGF-3, Alfa3, cMet, ICOS, CD40L, LFA-1, c-Met, ICOS, LFA-1, IL-6, B7,1, B7,2, OX40, IL-lb, TACI, IgE, BAFF o BLys, TPO-R, CD19, CD20, CD22, CD33, CD28, IL-1-R1, TNF<a>, TRAIL-R1, receptor 1 del complemento, FGFa, osteopontina, vitronectina, efrina A1-A5, efrina B1-B3, alfa-2-macroglobulina, CCL1, CCL2, CCL3, CCL4, CCL5, CCL6, CCL7, CXCL8, CXCL9, CXCL10, CXCL11, CXCL12, CCL13, CCL14, CCL15, CXCL16, CCL16, CCL17, CCL18, CCL19, CCL20, CCL21, CCL22, PDGF, TGFb, GMCSF, SCF, p40 (IL12/IL23), IL1b, IL1 a, IL1 ra, IL2, IL3, IL4, IL5, IL6, IL8, IL10, IL12, IL15, IL23, Fas, FasL, ligando Flt3, 41BB, ACE, ACE-2, KGF, FGF-7, SCF, netrina 1, 2, IFNa, b, g, caspasa 2, 3, 7, 8, 10, ADAM S1, S5, 8, 9, 15, TS1, TS5; adiponectina, ALCAM, ALK-1, APRIL, anexina V, angiogenina, anfiregulina, angiopoyetina 1, 2, 4, B7-1/CD80, B7-2/CD86, B7-H1, B7-H2, B7-H3, Bc1-2, BACE-1, BAK, BCAM, BDNF, bNGF, bECGF, BMP2, 3, 4, 5, 6, 7, 8; CRP, cadherina 6, 8, 11; catepsina A, B, C, D, E, L, S, V, X; CD11a/LFA-1, LFA-3, GP2b3a, receptor de GH, proteína RSV F, IL-23 (p40, p19), IL-12, CD80, CD86, CD28, CTLA-4, «4p1, «4p7, TNF/linfotoxina, IgE, CD3, CD20, IL-6, IL-6R, BLYS/BAFF, IL-2R, HER2, EGFR, CD33, CD52, digoxina, Rho (D), varicela, hepatitis, CMV, tétanos, variolovacuna, antídoto, bolutínica, Trail-R1, Trail-R2, cMet, familia de TNF-R, tal como LA NGF-R, CD27, CD30, CD40, CD95, receptor de linfotoxina a/b, Wsl-1, TL1A/TNFSF15, BAFF, BAFF-R/TNFRSF13C, TRAIL R2/TNFRSF10B, TRAIL R2/TNFRSF10B, Fas/TNFRSF6 CD27/TNFRSF7, DR3/TNFRSF25, HVEM/TNFRSF14, TROY/TNFRSF19, ligando CD40/TNFSF5, BCMA/TNFRSF17, CD30/TNFRSF8, LIGHT/TNFSF14, 4-1BB/TNFRSF9, CD40/TNFRSF5, GITR/TNFRSF18, osteoprotegerina/TNFRSF11B, RANK/TNFRSF11 A, TRAIL R3/TNFRSF10C, TRAIL/TNFSF10, TRANCE/RANK L/TNFSF11, 4-1BB Ligando/TNFSF9, TWEAK/TNFSF12, ligando CD40/TNFSF5, ligando Fas/TNFSF6, RELT/TNFRSF19L, APRIL/TNFSF13, DcR3/TNFRSF6B, TNF RI/TNFRSF1A, TRAIL R1/TNFRSF10A, TRAIL R4/TNFRSF10D, ligando CD30/TNFSF8, ligando GITR/TNFSF18, TNFSF18, TACI/TNFRSF13B, NGF R/TNFRSF16, ligando OX40/TNFSF4, TRAIL R2/TNFRSF10B, TRAIL R3/TNFRSF10C, TWEAK R/TNFRSF12, BAFF/BLyS/TNFSF13, DR6/TNFRSF21, TNF-alfa/TNFSF1A, Pro-TNFalfa/TNFSF1A, R de linfotoxina beta/TNFRSF3, quimera de R de linfotoxina beta (LTbR)/Fc, TNF RI/TNFRSF1A, TNF-beta/TNFSF1B, PGRP-S, TNF RI/TNFRSF1A, TNF RII/TNFRSF1B, EDA-A2, TNF-alfa/TNFSF1A, EDAR, XEDAR, TNF RI/TNFRSF1A. [0210] VEGF, VEGF-R1, VEGF-R2, VEGF-R3, Her-1, Her-2, Her-3, EGF-1, EGF-2, EGF-3, Alfa3, cMet, ICOS, CD40L, LFA -1, c-Met, ICOS, LFA-1, IL-6, B7.1, B7.2, OX40, IL-lb, TACI, IgE, BAFF or BLys, TPO-R, CD19, CD20, CD22, CD33 , CD28, IL-1-R1, TNF<a>, TRAIL-R1, complement receptor 1, FGFa, osteopontin, vitronectin, ephrin A1-A5, ephrin B1-B3, alpha-2-macroglobulin, CCL1, CCL2, CCL3 , CCL4, CCL5, CCL6, CCL7, CXCL8, CXCL9, CXCL10, CXCL11, CXCL12, CCL13, CCL14, CCL15, CXCL16, CCL16, CCL17, CCL18, CCL19, CCL20, CCL21, CCL22, PDGF, TGFb, GMCSF, SCF, p40 (IL12/IL23), IL1b, IL1 a, IL1 ra, IL2, IL3, IL4, IL5, IL6, IL8, IL10, IL12, IL15, IL23, Fas, FasL, Flt3 ligand, 41BB, ACE, ACE-2, KGF , FGF-7, SCF, netrin 1, 2, IFNa, b, g, caspase 2, 3, 7, 8, 10, ADAM S1, S5, 8, 9, 15, TS1, TS5; adiponectin, ALCAM, ALK-1, APRIL, annexin V, angiogenin, amphiregulin, angiopoietin 1, 2, 4, B7-1/CD80, B7-2/CD86, B7-H1, B7-H2, B7-H3, Bc1- 2, BACE-1, BAK, BCAM, BDNF, bNGF, bECGF, BMP2, 3, 4, 5, 6, 7, 8; CRP, cadherin 6, 8, 11; cathepsin A, B, C, D, E, L, S, V, X; CD11a/LFA-1, LFA-3, GP2b3a, GH receptor, RSV F protein, IL-23 (p40, p19), IL-12, CD80, CD86, CD28, CTLA-4, «4p1, «4p7, TNF /lymphotoxin, IgE, CD3, CD20, IL-6, IL-6R, BLYS/BAFF, IL-2R, HER2, EGFR, CD33, CD52, digoxin, Rho (D), chickenpox, hepatitis, CMV, tetanus, vaccinia, antidote, bolutinic, Trail-R1, Trail-R2, cMet, TNF-R family, such as LA NGF-R, CD27, CD30, CD40, CD95, lymphotoxin a/b receptor, Wsl-1, TL1A/TNFSF15, BAFF, BAFF-R/TNFRSF13C, TRAIL R2/TNFRSF10B, TRAIL R2/TNFRSF10B, Fas/TNFRSF6 CD27/TNFRSF7, DR3/TNFRSF25, HVEM/TNFRSF14, TROY/TNFRSF19, ligand CD40/TNFSF5, BCMA/TNFRSF17, CD30/TNFRSF8, LIGHT/TNFSF14, 4-1BB/TNFRSF9, CD40/TNFRSF5, GITR/TNFRSF18, osteoprotegerin/TNFRSF11B, RANK/TNFRSF11 A, TRAIL R3/TNFRSF10C, TRAIL/TNFSF10, TRANCE/RANK L/TNFSF11, 4-1BB Ligand/TNFSF9, TWEAK/TNFSF12, CD40/TNFSF5 ligand, Fas/TNFSF6 ligand, RELT/TNFRSF19L, APRIL/TNFSF13, DcR3/TNFRSF6B, TNF RI/TNFRSF1A, TRAIL R1/TNFRSF10A, TRAIL R4/TNFRSF10D, CD30/TNFSF8 ligand, GITR/TNFSF18 ligand , TNFSF18, TACI/TNFRSF13B, NGF R/TNFRSF16, OX40/TNFSF4 ligand, TRAIL R2/TNFRSF10B, TRAIL R3/TNFRSF10C, TWEAK R/TNFRSF12, BAFF/BLyS/TNFSF13, DR6/TNFRSF21, TNF-alpha/TNFSF1A, Pro- TNFalpha/TNFSF1A, lymphotoxin beta R/TNFRSF3, lymphotoxin beta R (LTbR)/Fc chimera, TNF RI/TNFRSF1A, TNF-beta/TNFSF1B, PGRP-S, TNF RI/TNFRSF1A, TNF RII/TNFRSF1B, EDA- A2, TNF-alpha/TNFSF1A, EDAR, XEDAR, TNF RI/TNFRSF1A.

[0211]Son de particular interés proteínas diana humana que están comercialmente disponibles en forma purificada. Ejemplos son: 4EBP1, 14-3-3 zeta, 53BP1, 2B4/SLAMF4, CCL21/6Ccina, 4-1BB/TNFRSF9, 8D6A, ligando 4-1BB/TNFSF9, 8-oxo-dG, 4-amino-1,8-naftalimida, A2B5, aminopeptidasa LRAP/ERAP2, A33, aminopeptidasa N/ANPEP, Aag, aminopeptidasa P2/YPNPEP2, ABCG2,aminopeptidasa P1/XPNPEP1, ACE, aminopeptidasa PILS/ARTS1, ACE-2, Amnionless, actina, anfiregulina, beta-actina, A<m>PK alfa 1/2, activina A, AMPK alfa 1, activina AB, AMPK alfa 2, activina B, AMPK beta 1, activina C, AMPK beta 2, activina RIA/ALK-2, R de andrógenos/NR3C4, activina RIB/ALK-4, angiogenina, activina RIIA, angiopoyetina-1, activina RIIB, angiopoyetina-2, ADAM8, angiopoyetina-3, ADAM9, angiopoyetina-4, ADAM10, 1 similar a angiopoyetina, ADAM12, 2 similar a angiopoyetina, ADAM15, 3 similar a angiopoyetina, TACE/ADAM17, 4 similar a angiopoyetina, ADAM19, 7 similar a angiopoyetina/CDT6, ADAM33, angiostatina, ADAMTS4, anexina A1/anexina I, AD<a>M<t>S5, anexina A7, ADAMTS1, anexina A10, ADAMTSL-1/punctina, anexina V, adiponectina/Acrp30, ANP, AEBSF, sitio AP, agrecano, APAJF-1, agrina, APC, AgRP, APE, A<g>TR-2, APJ, AIF, APLP-1, Akt, APLP-2, Akt1, apolipoproteína AI, Akt2, apolipoproteína B, Akt3, APP, albúmina de suero, APRIL/TNFSF13, ALCAM, ARC, ALK-1, artemina, ALK-7, arilsulfatasa A/ARSA, fosfatasa alcalina, ASAH2/N-acilesfingosina amidohidrolasa-2, alfa 2u-globulina, ASC, glicoproteína alfa-1-ácida, ASGR1, alfa-fetoproteína, ASK1, ALS, ATM, ameloblastina, ATRIP, AMICA/JAML, Aurora A, AMIGO, Aurora B, AMIGO2, axina-1, AMIGO3, Axl, aminoacilasa/ACY1, azurocidina/CAP37/HBP, aminopeptidasa A/ENPEP, B4 gALT 1, BIM, B7-1/CD80, 6-biotina-17-NAD, B7-2/CD86, BLAME/SLAMF8, B7-H1/PD-L1, CXCL13/BLC/BCA-1, B7-H2, BLIMP1, B7-H3, Blk, B7-H4, BMI-1, BACE-1, BMP-1/PCP, BACE-2, BMP-2, Bad, BMP-3, BAFF/TNFSF13B, BMP-3b/GDF-10, BAFF R/TNFRSF13C, BMP-4, Bag-1, BMP-5, BAK, BMP-6, BAMBI/NMA, BMP-7, BARD1, BMP-8, Bax, BMP-9, BCAM, BMP-10, Bcl-10, BMP-15/GDF-9B, Bcl-2, BMPR-IA/ALK-3, proteína A1 relacionada con Bcl-2, BMPR-IB/ALK-6, Bcl-w, BMPR-II, Bcl-x, BNIP3L, Bcl-xL, BOC, BCMA/TNFRSF17, BOK, BDNF, BPDE, benzamida, Brachyury, cadena beta común, B-Raf, beta IG-H3, CXCL14/BRAK, betacelulina, BRCA1, beta-defensina 2, BRCA2, BID, BTLA, biglicano, Bub-1, proteína asesina similar a Bik, c-jun, CD90/Thy1, c-Rel, CD94, CCL6/C10, CD97, Clq R1/CD93, CD151, ClqTNF1, CD160, ClqTNF4, CD163, ClqTNF5, CD164, componente del complemento C1r, CD200, componente del complemento C1s, CD200 R1, componente del complemento C2,<c>D229/SLAMF3, componente del complemento C3a, CD23/Fc épsilon RII, componente del complemento C3d, CD2F-10/SLAMF9, componente del complemento C5a, CD5L, cadherina-4/R-cadherina, CD69, cadherina-6, CDC2, cadherina-8, CDC25A, cadherina-11, CDC25B, cadherina-12, CDCP1, cadherina-13, CDO, cadherina-17, CDX4, E-cadherina, CEACAM-1/CD66a, N-cadherina, CEACAM-6, P-cadherina, Cerberus 1, VE-cadherina, CFTR, calbindina D, cGMP, calcineurina A, Chem R23, calcineurina B, Chemerin, calreticulina-2, envases de muestreo de quimiocinas, CaM cinasa II, 1 similar a quitinasa 3, cAMP, quitotriosidasa/CHITI, R1 de cannabinoide; Chk1, R2 de cannabinoide/CB2/CNR2, Chk2, CAR/NR1I3, CHL-1/L1CAM-2, anhidrasa carbónica I, colina acetiltransferasa/ChAT, anhidrasa carbónica II, condrolectina, anhidrasa carbónica III, cordina, anhidrasa carbónica IV, 1 similar a cordina, anhidrasa carbónica VA, 2 similar a cordina, anhidrasa carbónica VB, CINC-1, anhidrasa carbónica VI, CINC-2, anhidrasa carbónica VII, CINC-3, anhidrasa carbónica VIII, claspina, anhidrosa carbónica IX, claudina-6, anhidrasa carbónica X, CLC, anhidrasa carbónica XII, CLEC-1, anhidrasa carbónica XIII, CLEC-2, anhidrasa carbónica XIV, CLECSF13/CLEC4F, carboximetil lisina, CLECSFB, carboxipeptidasa A1/CPA1, CLF-1, carboxipeptidasa A2, CL-P1/COLEC12, carboxipeptidasa A4, clusterina, carboxipeptidasa B1, 1 similar a clusterina, carboxipeptidasa E/CPE, CMG-2, carboxipeptidasa X1, CMV UL146, cardiotropina-1, CMV UL147, carnosina dipeptidasa 1, CNP, caronte, CNTF, CART, CNT<f>R alfa, caspasa, factor de coagulación II/trombina, caspasa-1, factor de coagulación III/factor tisular, caspasa-2, factor de coagulación VII, caspasa-3, factor de coagulación X, caspasa-4, factor de coagulación XI, caspasa-6, factor de coagulación XIV/proteína C, caspasa-7, COCO, caspasa-8, cohesina, caspasa-9, colágeno 1, caspasa-10, colágeno II, caspasa-12, colágeno IV, caspasa-13, cadena gamma común/IL-2 R gamma, inhibidores de péptidos de caspasa, COMP/trombospondina-5, catalasa, componente del complemento C1rLP, beta-catenina, componente del complemento ClqA, catepsina 1, componente del complemento C1qC, catepsina 3, factor D del complemento, catepsina 6, factor I del complemento, catepsina A, complemento MASP3, catepsina B, conexina 43, catepsina C/DPPI, contactina-1, catepsina D, contactina-2/TAG1, catepsina E, contactina-4, catepsina F, contactina-5, catepsina H, corina, catepsina L, comulina, catepsina O, CORS26/ClqTNF,3, catepsina S, citoblastos corticales de rata, catepsina V, cortisol, catepsina X/Z/P, COUP-TF I/NR2F1, CBP, COUP-TF II/NR2F2, CCI, COX-1, CCK-A R, COX-2, CCL28, CRACC/SLAMF7, CCR1, proteína C reactiva, CCR2, creatina cinasa, músculo/CKMM, CCR3, creatinina, CCR4, CREB, CCR5, CREG, CCR6, CRELD1, CCR7, CRELD2, CCR8, CRHBP, CCR9, CRHR-1, CCR10, CRIM1, CD155/PVR, Cripto, CD2, CRISP-2, CD3, CRISP-3, CD4, Crossveinless-2, CD4+/45RA-, CRTAM, CD4+/45RO-, CRTH-2, CD4+/CD62L-/CD44, CRY1, CD4+/CD62L+/CD44, críptico, CD5, CSB/ERCC6, CD6, CCL27/CTACK, CD8, CTGF/CCN2, CD8+/45RA-, CTLA-4, CD8+/45RO-, cubilina, CD9, CX3CR1, CD14, CXADP, CD27/TNFRSF7, CXCL16, ligando CD27/TNFSF7, CXCR3, CD28, CXCR4, CD30/TNFRSF8, CXCR5, ligando CD30/TNFSF8, CXCR6, CD31/PECAM-1, ciclofilina A, CD34, Cyr61/CCN1, CD36/SR-B3, cistatina A, CD38, cistatina B, CD40/TNFRSF5, cistatina C, ligando CD40/TNFSF5, cistatina D, CD43, cistatina E/M, CD44, cistatina F, CD45, cistatina H, CD46, cistatina H2, CD47, cistatina S, CD48/SLAMF2, cistatina SA, CD55/DAF, cistatina SN, CD58/LFA-3, citocromo c, CD59, apocitocromo c, CD68, holocitocromo c, CD72, citoqueratina 8, CD74, citoqueratina 14, CD83, citoqueratina 19, CD84/SLAMF5, citonina, D6, DISP1, DAN, Dkk-1, DANCE, Dkk-2, DARPP-32, Dkk-3, DAX1/NR0B1, Dkk-4, DCC, DLEC, DCIR/CLEC4A, DLL1, DCAR, DLL4, DcR3/TNFRSF6B, d-luciferina, DC-SIGN, ADN ligasa IV, DC-SIGNR/CD299, ADN polimerasa beta, DcTRAIL R1/TNFRSF23, ADNM-1, DcTRAIL R2/TNFRSF22, ADN-PKcs, DDR1, DNER, DDR2, dopa descarboxilasa/DDC, DEC-205, DPCR-1, decapentaplégico, DPP6, decorina, DPPA4, dectina-1/CLEC7A, DPPA5/ESG1, dectina-2/CLEC6A, DPPII/QPP/DPP7, DEP-1/CD148, DPPIV/CD26, Desert Hedgehog, DR3/TNFRSF25, desmina, DR6/TNFRSF21, desmogleína-1, DSCAM, desmogleína-2, DSCAM-L1, desmogleína-3, DSPG3, Dishevelled-1, Dtk, Dishevelled-3, dinamina, EAR2/NR2F6, EphA5, ECE-1, EphA6, ECE-2, EphA7, ECF-L/CHL3L3, EphA8, ECM-1, EphB1, ecotina, EphB2, EDA, EphB3, EDA-A2, EphB4, EDAR, EphB6, EDG-1, efrina, EDG-5, efrina-A1, EDG-8, efrina-A2, eEF-2, efrina-A3, EGF, efrina-A4, EGF R, efrina-A5, EGR1, efrina-B, EG-VEGF/PK1, efrina-B1, eIF2 alfa, efrina-B2, eIF4E, efrina-B3, Elk-1, epigen, EMAP-II, epimorfina/sintaxina 2, EMMPRIN/CD147, epiregulina, CXCL5/ENA, EPR-1/receptor Xa, endocano, ErbB2, endoglina/CD105, ErbB3, endoglicano, ErbB4, endonucleasa III, ERCC1, endonucleasa IV, ERCC3, endonucleasa V, ERK1/ERK2, endonucleasa VIII, ERK1, endorepelina/perlecano, ERK2, endostatina, ERK3, endotelina-1, ERK5/BMK1, Engrailed-2, ERR alfa/NR3B1, EN-RAGE, ERR beta/NR3B2, enteropeptidasa/enterocinasa, ERR gamma/NR3B3, CCL11/eotaxina, eritropoyetina, CCL24/eotaxina-2, eritropoyetina R, CCL26/eotaxina-3, ESAM, EpCAM/TROP-1, ER alfa/NR3A1, EPCR, ER beta/NR3A2, Eph, exonucleasa III, EphA1, 2 similar a exostosina/EXTL2, EphA2, 3 similar a exostosina /EXTL3, EphA3, FABP1, FGF-BP, FABP2, FGF R1-4, FABP3, FGF R1, FABP4, FGF R2, FABP5, FGF R3, FABP7, FGF R4, FABP9, FGF R5, factor B del complemento, Fgr, FADD, FHR5, FAM3A, fibronectina, FAM3B, ficolina-2, FAM3C, ficolina-3, FAM3D, FITC, proteína alfa de activación de fibroblastos/FAP, FKBP38, Fas/TNFRSF6, Flap, ligando Fas /TNFSF6, FLIP, FATP1, FLRG, FATP4, FLRT1, FATP5, FLRT2, Fc gamma RI/CD64, FLRT3, Fc gamma RIIB/CD32b, Flt-3, Fc gamma RIIC/CD32c, ligando Flt-3, Fc gamma RIIA/CD32a, folistatina, Fc gamma RIII/CD16, 1 similar a folistatina, FcRH1/IRTA5, FosB/G0S3, FcRH2/IRTA4, FoxD3, FcRH4/IRTA1, FoxJ1, FcRH5/IRTA2, FoxP3, 3 similar a receptor Fc/CD16-2, Fpg, FEN-1, FPR1, fetuína A, FPRL1, fetuína B, FPRL2, FGF ácido, CX3CL1/fractalcina, FGF básico, Frizzled-1, FGF-3, Frizzled-2, FGF-4, Frizzled-3, FGF-5. Frizzled-4, FGF-6, Frizzled-5, FGF-8, Frizzled-6, FGF-9, Frizzled-7, FGF-10, Frizzled-8, FGF-11, Frizzled-9, FGF-12, Frk, FGF-13, sFRP-1, FGF-16, sFRP-2, FGF-17, sFRP-3, FGF-19, sFRP-4, FGF-20, furina, FGF-21, FXR/NR1H4, FGF-22, Fyn, FGF-23, G9a/EHMT2, GFR alfa-3/GDNF R alfa-3, GABA-A-R alfa 1, GFR alfa-4/GDNF R alfa-4, GABA-A-R alfa 2, GITR/TNFRSF18, GABA-A-R alfa 4, ligando GITR/TNFSF18, GABA-A-R alfa 5, GLI-1, GABA-A-R alfa 6, GLI-2, GABA-A-R beta 1, GLP/EHMT1, GABA-A-R beta 2, GLP-1 R, GABA-A-R beta 3, glucagón, GABA-A-R gamma 2, glucosamina (N-acetil)-6-sulfatasa/GNS, GABA-B-R2, GluR1, GAD1/GAD67, GluR2/3, GAD2/GAD65, GluR2, GADD45 alfa, GluR3, GADD45 beta, Glut1, GADD45 gamma, Glut2, galectina-1, Glut3, galectina-2, Glut4, galectina-3, Glut5, galectina-3 BP, glutaredoxina 1, galectina-4, glicina R, galectina-7, glicoforina A, galectina-8, glipicano 2, galectina-9, glipicano 3, GaINAc4S-6ST, glipicano 5, GAP-43, glipicano 6, GAPDH, GM-CSF, Gas1, GM-CSF R alfa, Gas6, GMF-beta, GASP-1/WFIKKNRP, gp130, GASP-2/WFIKKN, glicógeno fosforilasa BB/GPBB, GATA-1, GPR15, GATA-2, GPR39, GATA-3, GPVI, GATA-4, GR/NR3C1, GATA-5, Gr-1/Ly-6G, GATA-6, granulisina, GBL, granzima A, GCNT/NR6A 1, granzima B, CXCL6/GCP-2, granzima D, GCSF, granzima G, G-CSF R, granzima H, GDF-1, GRASP, GDF-3 GRB2, GDF-5, gremlina, GDF-6, GRO, GDF-7, CXCL1/GRO alfa, GDF-8, CXCL2/GRO beta, GDF-9, CXCL3/GRO gamma, GDF-11, hormona de crecimiento, GDF-15, hormona de crecimiento R, GDNF, GRP75/HSPA9B, GFAP, GSK-3 alfa/beta, GFI-1, GSK-3 alfa, GFR alfa-1/GDNF R alfa-1, GSK-3 beta, GFR alfa-2/GDNF R alfa-2, EZFIT, H2AX, histidina, H60, HM74A, HAI-1, HMGA2, HAI-2, HMGB1, HAI-2A, TCF-2/HNF-1 beta, HAI-2B, HNF-3 beta/FoxA2, HAND1, HNF-4 alfa/NR2A1, HAPLN1, HNF-4 gamma/NR2A2, proteasa similar a tripsina de las vías respiratorias/HAT, HO-1/HMOX1/HSP32, HB-EGF, HO-2/HMOX2, CCL14a/HCC-1, HPRG, CCL14b/HCC-3, Hrk, CCL16/HCC-4, HRP-1, alfa HCG, HS6ST2, Hck HSD-1, HCR/CRAM-A/B, HSD-2, HDGF, HSP10/EPF, hemoglobina, HSP27, Hepassocin, HSP60, HES-1, HSP70, HES-4, HSP90, HGF, HTRA/proteasa Do, activador de HGF, HTRA1/PRSS11, HGF R, HTRA2/Omi, HIF-1 alfa, HVEM/TNFRSF14, HIF-2 alfa, hialuronano, HIN-1/secretoglobulina 3A1, 4-hidroxinonenal, Hip,CCL1/I-309/TCA-3, IL-10, cIAP (pan), IL-10 R alfa, cIAP-1/HIAP-2, IL-10 R beta, cIAP-2/HLAP-1, IL-11, IBSP/sialoproteína II, IL-11 R alfa, ICAM-1/CD54, IL-12, ICAM-2/CD102, IL-12/IL-23 p40, ICAM-3/CD50, IL-12 R beta 1, ICAM-5, IL-12 R beta 2, ICAT, IL-13, ICOS, IL-13 R alfa 1, iduronato 2-sulfatasa/IDS, IL-13 R alfa 2, IFN, IL-15, IFN-alfa, IL-15 R alfa, IFN-alfa 1, IL-16, IFN-alfa 2, IL-17, IFN-alfa 4b, IL-17 R, IFN-alfa A, IL-17 RC, IFN-alfa B2, IL-17 RD, IFN-alfa C, 1L-17B, IFN-alfa D, IL-17B R, IFN-alfa F, IL-17C, IFN-alfa G, IL-17D, IFN-alfa H2, IL-17E, IFN-alfa I, IL-17F, IFN-alfa J1, IL-18/IL-IF4, IFN-alfa K, IL-18 BPa, IFN-alfa WA, IL-18 BPc, IFN-alfa/beta R1, IL-18 BPd, IFN-alfa/beta R2, IL-18 R alfa/IL-1 R5, IFN-beta, IL-18 R beta/IL-1 R7, IFN-gamma, IL-19, IFN-gamma R1, IL-20, IFN-gamma R2, IL-20 R alfa, IFN-omega, IL-20 R beta, IgE, IL-21, IGFBP-1, IL-21 R, IGFBP-2, IL-22, IGFBP-3, IL-22 R, IGFBP-4, IL-22BP, IGFBP-5, IL-23, IGFBP-6, IL-23 R, IGFBP-L1, IL-24, IGFBP-rp1/IGFBP-7, IL-26/AK155, IGFBP-rP10, IL-27, IGF-I, IL-28A, IGF-I R, IL-28B, IGF-II, IL-29/IFN-lambda 1, IGF-II R, IL-31, IgG, IL-31 RA, IgM, IL-32 alfa, IGSF2, IL-33, IGSF4A/SynCAM, ILT2/CD85j, IGSF4B, ILT3/CD85k, IGSF8, ILT4/CD85d, IgY, ILT5/CD85a, IkB-beta, ILT6/CD85e, IKK alfa, Hedgehog indio, IKK épsilon, INSRR, IKK gamma, insulina, IL-1 alfa/IL-1F1, insulina R/CD220, IL-1 beta/IL-1F2, proinsulina, IL-1 ra/IL-1 F3, insulisina/IDE, 1L-1F5/FIL1 delta, integrina alfa 2/CD49b, IL-1F6/FIL1 épsilon, integrina alfa 3/CD49c, IL-1F7/FIL1 zeta, integrina alfa 3 beta 1/VLA-3, IL-1F8/FIL1 eta, integrina alfa 4/CD49d, IL-1F9/IL-1 H1, integrina alfa 5/CD49e, IL-1F10/IL-1HY2, integrina alfa 5 beta 1, IL-1 RI, integrina alfa 6/CD49f, IL-1 RII, integrina alfa 7, IL-1 R3/IL-1 R AcP, integrina alfa 9, IL-1 R4/ST2, integrina alfa E/CD103, IL-1 R6/IL-1 R rp2; integrina alfa L/CD11a, IL-1 R8, integrina alfa L beta 2, IL-1 R9, integrina alfa M/CD11b, IL-2, integrina alfa M beta 2, IL-2 R alfa, integrina alfa V/CD51, IL-2 R beta, integrina alfa V beta 5, IL-3, integrina alfa V beta 3, IL-3 R alfa, integrina alfa V beta 6, IL-3 R beta, integrina alfa X/CD11c, IL-4, integrina beta 1/CD29, IL-4 R, integrina beta 2/CD18, IL-5, integrina beta 3/CD61, IL-5 R alfa, integrina beta 5, IL-6, integrina beta 6, IL-6 R, integrina beta 7, IL-7, CXCL10/IP-10/CRG-2, IL-7 R alfa/CD127, IRAK1, CXCR1/IL-8 RA, IRAK4, CXCR2/IL-8 RB, IRS-1, CXCL8/IL-8, Islet-1, IL-9, CXCL11/1-TAC, IL-9 R, Jagged 1, JAM-4/IGSF5, Jagged 2, JNK, JAM-A, JNK1/JNK2, JAM-B/VE-JAM, JNK1, JAM-C, JNK2, quininógeno, calicreína 3/PSA, quininostatina, calicreína 4, KIR/CD158, calicreína 5, KIR2DL1, calicreína 6/neurosina, KIR2DL3, calicreína 7, KIR2DLA/CD158d, calicreína 8/neuropsina, KIR2DS4, calicreína 9, KIR3DL1, calicreína plasmática/KLKB1, KIR3DL2, calicreína 10, Kirrel2, calicreína 11, KLF4, calicreína 12, KLF5, calicreína 13, KLF6, calicreína 14, Klotho, calicreína 15, Klotho beta, KC, KOR, Keap1, Kremen-1, Kell, Kremen-2, KGF/FGF-7, LAG-3, LINGO-2, LAIR1, lipina 2, LAIR2, lipocalina-1, laminina alfa 4, lipocalina-2/NGAL, laminina gamma 1, 5-lipoxigenasa, laminina I, LXR alfa/NR1H3, laminina S, LXR beta/NR1H2, laminina-1, livina, laminina-5, LIX, LAMP, LMIR1/CD300A, langerina, LMIR2/CD300c, LAR, LMIR3/CD300LF, latexina, LMIRS/CD300LB, layilina, LMIR6/CD300LE, LBP, LM02, LDL R, LOX-1/SR-E1, LECT2, LRH-1/NR5A2, LEDGF, LRIG1, Lefty, LRIG3, Lefty-1, LRP-1, Lefty-A, LRP-6, legumaína, LSECtin/CLEC4G, leptina, lumicano, leptina R, CXCL15/Lungkine, leucotrieno B4, XCL1/linfotactina, leucotrieno B4 R1, linfotoxina, LIF, linfotoxina beta/TNFSF3, LIF R alfa, linfotoxina beta R/TNFRSF3, LIGHT/TNFSF14, Lyn, limitina, Lyp, LIMPII/SR-B2, homólogo 2 de lisil oxidasa, LIN-28, LYVE-1, LINGO-1, alfa 2-macroglobulina, CXCL9/MIG, MAD2L1, mimecano, MAdCAM-1, mindina, MafB, R de mineralocorticoide/NR3C2, MafF, CCL3L1/MIP-1 alfa isoforma LD78 beta, MafG, CCL3/MIP-1 alfa, MafK, CCL4L1/LAG-1, MAG/Siglec-4a, CCL4/MIP-1 beta, MANF, CCL15/MIP-1 delta, MAP2, CCL9/10/MIP-1 gamma, MAPK, MIP-2, marapsina/pancreasina, CCL19/MIP-3 beta, MARCKS, CCL20/MIP-3 alfa, MARCO, MIP-I, Mash1, MIP-II, matrilina-2, MIP-III, matrilina-3, MIS/AMH, matrilina-4, MIS RII, matriptasa/ST14, MIXL1, MBL, MKK3/MKK6, MBL-2, MKK3, melanocortina 3R/MC3R, MKK4, MCAM/CD146, MKK6, MCK-2, MKK7, Mcl-1, MKP-3, MCP-6, MLH-1, CCL2/MCP-1, MLK4 alfa, MCP-11, MMP, CCL8/MCP-2, MMP-1, CCL7/MCP-3/MARC, MMP-2, CCL13/MCP-4, MMP-3, CCL12/MCP-5, MMP-7, M-CSF, MMP-8, M-CSF R, MMP-9, MCV-tipo II, MMP-10, MD-1, MMP-11, MD-2, MMP-12, CCL22/MDC, MMP-13, MDL-1/CLEC5A, MMP-14, MDM2, MMP-15, MEA-1, MMP-16/MT3-MMP, MEK1/MEK2, MMP-24/MT5-MMP, MEK1, MMP-25/MT6-MMP, MEK2, MMP-26, melusina, MMR, MEPE, MOG, meprina alfa, CCL23/MPBP-1, meprina beta, M-Ras/R-Ras3, Mer, Mre11, mesotelina, MRP1, meteorina, MSK1/MSK2, metionina aminopeptidasa 1, MSK1, metionina aminopeptidasa, MSK2, metionina aminopeptidasa 2, MSP, MFG-E8, MSP R/Ron, MFRP, Mug, MgcRacGAP, MULT-1, MGL2, Musashi-1, MGMT, Musashi-2, MIA, MuSK, MICA, MutY ADN glicosilasa, MICB, MyD88, MICL/CLEC12A, mieloperoxidasa, beta 2 microglobulina, miocardina, Midkine, miocilina, MIF, mioglobina, NAIP NGFI-B gamma/NR4A3, Nanog, NgR2/NgRH1, CXCL7/NAP-2, NgR3/NgRH2, Nbsl, nidogen-1/entactina, NCAM-1/CD56, nidogen-2, NCAM-L1, óxido nítrico, nectina-1, nitrotirosina, nectina-2/CD112, NKG2A, nectina-3, NKG2C, nectina-4, NKG2D, neogenina, NKp30, neprilisina/CD10, NKp44, neprilisina-2/MMEL1/MMEL2, NKp46/NCR1, nestina, NKp80/KLRF1, NET02, NKX2,5, netrina-1, NMDA R, subunidad de NR1, netrina-2, N<m>D<a>R, subunidad de NR2A, netrina-4, NMDA R, subunidad de NR2B, netrina-G1a, NMDA R, subunidad de NR2C, netrina-G2a, N-Me-6,7-diOH-TIQ, neuregulina-1/NRG1, nodal, neuregulina-3/NRG3, noggina, neuritina, receptor de nogo, NeuroD1, Nogo-A, neurofascina, NOMO, neurogenina-1, nope, neurogenina-2, norrina, neurogenina-3, eNOS, neurolisina, iNOS, neurofisina II, nNOS, neurofilina-1, Notch-1, neurofilina-2, Notch-2, neuropoyetina, Notch-3, neurotrimina, Notch-4, neurturina, NOV/CCN3, NFAM1, NRAGE, NF-H, NrCAM, NFkB1, NRL, NFkB2, NT-3, NF-L, NT-4, NF-M, NTB-A/SLAMF6, NG2/MCSP, NTH1, NGF R/TNFRSF16, nucleostemina, beta-NGF, Nurr-1/NR4A2, NGFI-B alfa/NR4A1, OAS2, orexina B, OBCAM, OSCAR, OCAM, OSF-2/periostina, OCIL/CLEC2d, oncostatina M/OSM, OCILRP2/CLEC2i, OSM R beta, Oct-3/4, osteoactivina/GPNMB, OGG1, osteoadherina, Olig 1, 2, 3, osteocalcina, Olig 1, osteocrina, Olig2, osteopontina, Olig3, osteoprotegerina/TNFRSF11B, marcador de oligodendrocitos O1, Otx2, marcador de oligodendrocitos 04, OV-6, OMgp, OX40/TNFRSF4, opticina, ligando OX40/TNFSF4, orexina A, OAS2, orexina B, OBCAM, OSCAR, OCAM, OSF-2/periostina, OCIL/CLEC2d, oncostatina M/OSM, OCILRP2/CLEC2i, OSM R beta, Oct-3/4, osteoactivina/GPNMB, OGG1, osteoadherina, Olig 1, 2, 3, osteocalcina, Olig1, osteocrina, Olig2, osteopontina, Olig3, osteoprotegerina/TNFRSF11B, marcador de oligodendrocitos O1, Otx2, marcador de oligodendrocitos 04, OV-6, OMgp, OX40/TNFRSF4, opticina, ligando OX40/TNFSF4, orexina A, RACK1, Ret, Rad1, REV-ERB alfa/NR1D1, Rad17, REV-ERB beta/NR1D2, Rad51, Rex-1, Rae-1, RGM-A, Rae-1 alfa, RGM-B, Rae-1 beta, RGM-C, Rae-1 delta, Rheb, Rae-1 épsilon, proteína ribosómica S6, Rae-1 gamma, RIP1, Raf-1, ROBO1, RAGE, ROB02, Ra1A/Ra1B, ROB03, Ra1A, ROBO4, Ra1B, ROR/NR1F1-3 (pan), RANK/TNFRSF11A, ROR alfa/NR1F1, CCL5/RANTES, ROR gamma/NR1F3, Rap1A/B, receptor 1 de orfano similar a RTK/ROR1, RAR alfa/NR1B1, receptor 2 de orfano similar a RTK/ROR2, R<a>R beta/NR1B2, RP105, RAR gamma/NR1B3, RPA2, Ras, RSK (pan), RBP4, RSK1/RSK2, RECK, RSK1, Reg 2/PAP, RSK2, Reg I, RSK3, Reg II, RSK4, Reg III, R-espondina 1, Reg IIIa, R-espondina 2, Reg IV, R-espondina 3, relaxina-1, RUNX1/CBFA2, relaxina-2, RUNX2/CBFA1, relaxina-3, RUNX3/CBFA3, RELM alfa, RXR alfa/NR2B1, RELM beta, RXR beta/NR2B2, RELT/TNFRSF19L, RXR gamma/NR2B3, resistina, S100A10, SLITRK5, S100A8, SLPI, S100A9, SMAC/diablo, S100B, Smad1, S100P, Smad2, SALL1, Smad3, delta-sarcoglicano, Smad4, Sca-1/Ly6, Smad5, SCD-1, Smad7, SCF, Smad8, SCF R/c-kit, SMC1, SCGF, alfa-actina de músculo liso, SCL/Tal1, SMUG1, SCP3/SYCP3, Snail, CXCL12/SDF-1, intercambiador 1 de sodio y calcio, SDNSF/MCFD2, Soggy-1, alfa-secretasa, Sonic Hedgehog, gamma-secretasa, SorCS1, betasecretasa, SorCS3, E-selectina, sortilina, L-selectina, SOST, P-selectina, SOX1, semaforina 3A, SOX2, semaforina 3C, SOX3, semaforina 3E, SOX7, semaforina 3F, SOX9, semaforina 6A, SOX10, semaforina 6B, SOX17, semaforina 6C, SOX21 semaforina 6D,SPARC, semaforina 7A, 1 similar a SPARC, separasa, SP-D, sustrato I de serina/treonina fosfatasa, espinesina, serpina A1, F-espondina, serpina A3, SR-AI/MSR, serpina A4/calistatina, Src, serpina A5/inhibidor de proteína C, SREC-I/SR-F1, serpina A8/angiotensinógeno, SREC-II, serpina B5, SSEA-1, serpina C1/antitrombina-III, SSEA-3, serpina D1/cofactor II de heparina, SSEA-4, serpina E1/PAI-1, ST7/LRP12, serpina E2, estabilina-1, serpina F1, estabilina-2, serpina F2, estaniocalcina 1, serpina G1/inhibidor de C1, estaniocalcina 2, serpina I2, STAT1, amiloide A1 del suero, STAT2, SF-1/NR5A1, STAT3, SGK, STAT4, SHBG, STAT5a/b, SHIP, STAT5a, SHP/NR0B2, STAT5b, SHP-1, STAT6, SHP-2, VE-estatina, SIGIRR, Stella/Dppa3, Siglec-2/CD22, STRO-1, Siglec-3/CD33, sustancia P, Siglec-5, sulfamidasa/SGSH, Siglec-6, factor 1 modificador de sulfatasa/SUMF1, Siglec-7, factor 2 modificador de sulfatasa/SUMF2, Siglec-9, SUMO1, Siglec-10, SUMO2/3/4, Siglec-11, SUMO3, Siglec-F, superóxido dismutasa, SIGNR1/CD209, superóxido dismutasa-1/Cu-Zn SOD, SIGNR4, superóxido dismutasa-2/Mn-SOD, SIRP beta 1, superóxido dismutasa-3/EC-SOD, SKI, survivina, SLAM/CD150, sinapsina I, transposasa Sleeping Beauty, sindecano-1/CD138, Slit3, sindecano-2, SLITRK1, sindecano-3, SLITRK2, sindecano-4, SLITRK4, TACI/TNFRSF13B, TMEFF1/tomoregulina-1, TAO2, TMEFF2, TAPP1, TNF-alfa/TNFSF1A, CCL17/TARC, TNF-beta/TNFSF1B, Tau, TNF RI/TNFRSF1A. TC21/R-Ras2, TNF RII/TNFRSF1B, TCAM-1, TOR, TCCR/WSX-1, TP-1, TC-PTP, TP63/TP73L, TDG, TR, CCL25/TECK, TR alfa/NR1A1, tenascina C, TR beta 1/NR1A2, tenascina R, TR2/NR2C1, TER-119, TR4/NR2C2, TERT, TRA-1-85, testicano 1/SPOCK1, TRADD, testicano 2/SPOCK2,TRAF-1, testicano 3/SPOCK3, TRAF-2, TFPI, TRAF-3, TFPI-2, TRAF-4, TGF-alfa, TRAF-6, TGF-beta, TRAIL/TNFSF10, TGF-beta 1, TRAIL R1/TNFRSF10A, LAP (TGF-beta 1), TRAIL R2/TNFRSF10B, TGF-beta 1 latente, TRAIL R3/TNFRSF10C, TGF-beta 1,2, TRAIL R4/TNFRSF10D, TGF-beta 2, TRANCE/TNFSF11, TGF-beta 3, TfR (transferrina R), TGF-beta 5, apo-transferrina, TGF-beta latente pb 1, holo-transferrina, TGF-beta latente pb 2, trapina-2/elafina, TGF-beta latente pb4, TREM-1, TGF-beta RI/ALK-5, TREM-2, TGF-beta RII, TREM-3, TGF-beta RIIb, TREML1/TLT-1, TGF-beta RIII, TRF-1, termolisina, TRF-2, tiorredoxina-1, ectoenzima degradadora de TRH/TRHDE, tiorredoxina-2, TRIM5, tiorredoxina-80, tripeptidil-peptidasa I, 5 similar a tiorredoxina /TRP14, TrkA, THOP1, TrkB, trombomodulina/CD141, TrkC, trombopoyetina, TROP-2, trombopoyetina R, péptido 3 de troponina I, trombospondina-1, troponina T, trombospondina-2, TROY/TNFRSF19, trombospondina-4, tripsina 1, timopoyetina, tripsina 2/PRSS2, quimiocina-1 del timo, tripsina 3/PRSS3, Tie-1, triptasa-5/Prss32, Tie-2, triptasa alfa/TPS1, TIM-1/KIM-1/HAVCR, triptasa beta-1/MCPT-7, TIM-2, triptasa beta-2/TPSB2, TIM-3, triptasa épsilon/BSSP-4, TIM-4, triptasa gamma-1/TPSG1, TIM-5, triptófano hidroxilasa, TIM-6, TSC22, TIMP-1, TSG, TTMP-2, TSG-6, TIMP-3, TSK, TIMP-4, TSLP, TL1A/TNFSF15, TSLP R, TLR1, TSP50, TLR2, beta-III tubulina, TLR3, TWEAK/TNFSF12, TLR4, TWEAK R/TNFRSF12, TLR5, Tyk2, TLR6, fosfo-tirosina, TLR9, tirosina hidroxitasa, TLX/NR2E1, sustrato I de tirosina fosfatasa, ubiquitina, UNCSH3, Ugi, UNCSH4, UGRP1, UNG, ULBP-1, uPA, ULBP-2, uPAR, ULBP-3, URB, UNC5H1, UVDE, UNC5H2, vainilloide R1, VEGF R, VASA, VEGF R1/Flt-1, vasohibina, VEGF R2/KDR/Flk-1, vasorina, VEGF R3/Flt-4, vasostatina, versicano, Vav-1, VG5Q, VCAM-1, VHR, VDR/NR1I1, vimentina, VEGF, vitronectina, VEGF-B, VLDLR, VEGF-C, vWF-A2, VEGF-D, sinucleína-alfa, Ku70, WASP, Wnt-7b, WIF-1, Wnt-8a WISP-1/CCN4, Wnt-8b, WNK1, Wnt-9a, Wnt-1, Wnt-9b, Wnt-3a, Wnt-10a, Wnt-4, Wnt-10b, Wnt-5a, Wnt-11, Wnt-5b,wnvNS3, Wnt7a, XCR1, XPE/DDB1, XEDAR, XPE/DDB2, Xg, XPF, XIAP, XPG, XPA, XPV, XPD, XRCC1, Sí, YY1, EphA4. [0211]Of particular interest are human target proteins that are commercially available in purified form. Examples are: 4EBP1, 14-3-3 zeta, 53BP1, 2B4/SLAMF4, CCL21/6Ccina, 4-1BB/TNFRSF9, 8D6A, 4-1BB/TNFSF9 ligand, 8-oxo-dG, 4-amino-1,8 -naphthalimide, A2B5, aminopeptidase LRAP/ERAP2, A33, aminopeptidase N/ANPEP, Aag, aminopeptidase P2/YPNPEP2, ABCG2, aminopeptidase P1/XPNPEP1, ACE, aminopeptidase PILS/ARTS1, ACE-2, Amnionless, actin, amphiregulin, beta- actin, A<m>PK alpha 1/2, activin A, AMPK alpha 1, activin AB, AMPK alpha 2, activin B, AMPK beta 1, activin C, AMPK beta 2, activin RIA/ALK-2, androgen R /NR3C4, activin RIB/ALK-4, angiogenin, activin RIIA, angiopoietin-1, activin RIIB, angiopoietin-2, ADAM8, angiopoietin-3, ADAM9, angiopoietin-4, ADAM10, 1 angiopoietin-like, ADAM12, 2 similar angiopoietin, ADAM15, 3 angiopoietin-like, TACE/ADAM17, 4 angiopoietin-like, ADAM19, 7 angiopoietin-like/CDT6, ADAM33, angiostatin, ADAMTS4, annexin A1/annexin I, AD<a>M<t>S5, annexin A7, ADAMTS1, annexin A10, ADAMTSL-1/punctin, annexin V, adiponectin/Acrp30, ANP, AEBSF, AP site, aggrecan, APAJF-1, agrin, APC, AgRP, APE, A<g>TR-2, APJ , AIF, APLP-1, Akt, APLP-2, Akt1, apolipoprotein AI, Akt2, apolipoprotein B, Akt3, APP, serum albumin, APRIL/TNFSF13, ALCAM, ARC, ALK-1, artemin, ALK-7, arylsulfatase A/ARSA, alkaline phosphatase, ASAH2/N-acylesphingosine amidohydrolase-2, alpha 2u-globulin, ASC, alpha-1-acid glycoprotein, ASGR1, alpha-fetoprotein, ASK1, ALS, ATM, ameloblastin, ATRIP, AMICA/JAML, Aurora A, AMIGO, Aurora B, AMIGO2, axin-1, AMIGO3, Axl, aminoacylase/ACY1, azurocidin/CAP37/HBP, aminopeptidase A/ENPEP, B4 gALT 1, BIM, B7-1/CD80, 6-biotin-17 -NAD, B7-2/CD86, BLAME/SLAMF8, B7-H1/PD-L1, CXCL13/BLC/BCA-1, B7-H2, BLIMP1, B7-H3, Blk, B7-H4, BMI-1, BACE -1, BMP-1/PCP, BACE-2, BMP-2, Bad, BMP-3, BAFF/TNFSF13B, BMP-3b/GDF-10, BAFF R/TNFRSF13C, BMP-4, Bag-1, BMP- 5, BAK, BMP-6, BAMBI/NMA, BMP-7, BARD1, BMP-8, Bax, BMP-9, BCAM, BMP-10, Bcl-10, BMP-15/GDF-9B, Bcl-2, BMPR-IA/ALK-3, Bcl-2-related protein A1, BMPR-IB/ALK-6, Bcl-w, BMPR-II, Bcl-x, BNIP3L, Bcl-xL, BOC, BCMA/TNFRSF17, BOK, BDNF, BPDE, benzamide, Brachyury, common beta chain, B-Raf, beta IG-H3, CXCL14/BRAK, betacellulin, BRCA1, beta-defensin 2, BRCA2, BID, BTLA, biglycan, Bub-1, killer protein-like Bik, c-jun, CD90/Thy1, c-Rel, CD94, CCL6/C10, CD97, Clq R1/CD93, CD151, ClqTNF1, CD160, ClqTNF4, CD163, ClqTNF5, CD164, complement component C1r, CD200, complement component complement C1s, CD200 R1, complement component C2,<c>D229/SLAMF3, complement component C3a, CD23/Fc epsilon RII, complement component C3d, CD2F-10/SLAMF9, complement component C5a, CD5L, cadherin-4 /R-cadherin, CD69, cadherin-6, CDC2, cadherin-8, CDC25A, cadherin-11, CDC25B, cadherin-12, CDCP1, cadherin-13, CDO, cadherin-17, CDX4, E-cadherin, CEACAM-1 /CD66a, N-cadherin, CEACAM-6, P-cadherin, Cerberus 1, VE-cadherin, CFTR, calbindin D, cGMP, calcineurin A, Chem R23, calcineurin B, Chemerin, calreticulin-2, chemokine sampling containers, CaM kinase II, chitinase 3-like 1, cAMP, chitotriosidase/CHITI, cannabinoid R1; Chk1, cannabinoid R2/CB2/CNR2, Chk2, CAR/NR1I3, CHL-1/L1CAM-2, carbonic anhydrase I, choline acetyltransferase/ChAT, carbonic anhydrase II, chondrolectin, carbonic anhydrase III, chordin, carbonic anhydrase IV, 1 chordin-like, carbonic anhydrase VA, chordin-like 2, carbonic anhydrase VB, CINC-1, carbonic anhydrase VI, CINC-2, carbonic anhydrase VII, CINC-3, carbonic anhydrase VIII, claspin, carbonic anhydrase IX, claudin-6 , carbonic anhydrase X, CLC, carbonic anhydrase XII, CLEC-1, carbonic anhydrase XIII, CLEC-2, carbonic anhydrase P1/COLEC12, carboxypeptidase A4, clusterin, carboxypeptidase B1, clusterin-like 1, carboxypeptidase E/CPE, CMG-2, carboxypeptidase , CNT<f>R alpha, caspase, coagulation factor II/thrombin, caspase-1, coagulation factor III/tissue factor, caspase-2, coagulation factor VII, caspase-3, coagulation factor X, caspase-4 , coagulation factor XI, caspase-6, coagulation factor , caspase-13, common gamma chain/IL-2 R gamma, caspase peptide inhibitors, COMP/thrombospondin-5, catalase, complement component C1rLP, beta-catenin, complement component ClqA, cathepsin 1, complement component C1qC , cathepsin 3, complement factor D, cathepsin 6, complement factor I, cathepsin A, complement MASP3, cathepsin B, connexin 43, cathepsin C/DPPI, contactin-1, cathepsin D, contactin-2/TAG1, cathepsin E, contactin-4, cathepsin F, contactin-5, cathepsin H, corin, cathepsin L, comulin, cathepsin O, CORS26/ClqTNF,3, cathepsin S, rat cortical stem cells, cathepsin V, cortisol, cathepsin X/Z/P, COUP-TF I/NR2F1, CBP, COUP-TF II/NR2F2, CCI, COX-1, CCK-A R, COX-2, CCL28, CRACC/SLAMF7, CCR1, C-reactive protein, CCR2, creatine kinase, muscle/ CKMM, CCR3, creatinine, CCR4, CREB, CCR5, CREG, CCR6, CRELD1, CCR7, CRELD2, CCR8, CRHBP, CCR9, CRHR-1, CCR10, CRIM1, CD155/PVR, Cripto, CD2, CRISP-2, CD3, CRISP-3, CD4, Crossveinless-2, CD4+/45RA-, CRTAM, CD4+/45RO-, CRTH-2, CD4+/CD62L-/CD44, CRY1, CD4+/CD62L+/CD44, Cryptic, CD5, CSB/ERCC6, CD6 , CCL27/CTACK, CD8, CTGF/CCN2, CD8+/45RA-, CTLA-4, CD8+/45RO-, cubilin, CD9, CX3CR1, CD14, CXADP, CD27/TNFRSF7, CXCL16, CD27/TNFSF7 ligand, CXCR3, CD28, CXCR4, CD30/TNFRSF8, CXCR5, CD30/TNFSF8 ligand, CXCR6, CD31/PECAM-1, cyclophilin A, CD34, Cyr61/CCN1, CD36/SR-B3, cystatin A, CD38, cystatin B, CD40/TNFRSF5, cystatin C , CD40/TNFSF5 ligand, cystatin D, CD43, cystatin E/M, CD44, cystatin F, CD45, cystatin H, CD46, cystatin H2, CD47, cystatin S, CD48/SLAMF2, cystatin SA, CD55/DAF, cystatin SN, CD58/LFA-3, cytochrome c, CD59, apocytochrome c, CD68, holocytochrome c, CD72, cytokeratin 8, CD74, cytokeratin 14, CD83, cytokeratin 19, CD84/SLAMF5, cytonin, D6, DISP1, DAN, Dkk-1, DANCE, Dkk-2, DARPP-32, Dkk-3, DAX1/NR0B1, Dkk-4, DCC, DLEC, DCIR/CLEC4A, DLL1, DCAR, DLL4, DcR3/TNFRSF6B, d-luciferin, DC-SIGN, DNA ligase IV, DC-SIGNR/CD299, DNA polymerase beta, DcTRAIL R1/TNFRSF23, ADNM-1, DcTRAIL R2/TNFRSF22, DNA-PKcs, DDR1, DNER, DDR2, dopa decarboxylase/DDC, DEC-205, DPCR-1, decapentaplegic , DPP6, decorin, DPPA4, dectin-1/CLEC7A, DPPA5/ESG1, dectin-2/CLEC6A, DPPII/QPP/DPP7, DEP-1/CD148, DPPIV/CD26, Desert Hedgehog, DR3/TNFRSF25, desmin, DR6/ TNFRSF21, desmoglein-1, DSCAM, desmoglein-2, DSCAM-L1, desmoglein-3, DSPG3, Disheveled-1, Dtk, Disheveled-3, dynamin, EAR2/NR2F6, EphA5, ECE-1, EphA6, ECE-2, EphA7, ECF-L/CHL3L3, EphA8, ECM-1, EphB1, ecotin, EphB2, EDA, EphB3, EDA-A2, EphB4, EDAR, EphB6, EDG-1, ephrin, EDG-5, ephrin-A1, EDG- 8, ephrin-A2, eEF-2, ephrin-A3, EGF, ephrin-A4, EGF R, ephrin-A5, EGR1, ephrin-B, EG-VEGF/PK1, ephrin-B1, eIF2 alpha, ephrin-B2, eIF4E, ephrin-B3, Elk-1, epigene, EMAP-II, epimorphin/syntaxin 2, EMMPRIN/CD147, epiregulin, CXCL5/ENA, EPR-1/Xa receptor, endocan, ErbB2, endoglin/CD105, ErbB3, endoglycan, ErbB4, endonuclease III, ERCC1, endonuclease IV, ERCC3, endonuclease V, ERK1/ERK2, endonuclease VIII, ERK1, endorepelin/perlecan, ERK2, endostatin, ERK3, endothelin-1, ERK5/BMK1, Engrailed-2, ERR alpha/NR3B1 , EN-RAGE, ERR beta/NR3B2, enteropeptidase/enterokinase, ERR gamma/NR3B3, CCL11/eotaxin, erythropoietin, CCL24/eotaxin-2, erythropoietin R, CCL26/eotaxin-3, ESAM, EpCAM/TROP-1, ER alpha /NR3A1, EPCR, ER beta/NR3A2, Eph, exonuclease III, EphA1, exostosin-like 2/EXTL2, EphA2, exostosin-like 3 /EXTL3, EphA3, FABP1, FGF-BP, FABP2, FGF R1-4, FABP3, FGF R1, FABP4, FGF R2, FABP5, FGF R3, FABP7, FGF R4, FABP9, FGF R5, complement factor B, Fgr, FADD, FHR5, FAM3A, fibronectin, FAM3B, ficolin-2, FAM3C, ficolin-3, FAM3D, FITC, fibroblast activation protein alpha/FAP, FKBP38, Fas/TNFRSF6, Flap, Fas ligand /TNFSF6, FLIP, FATP1, FLRG, FATP4, FLRT1, FATP5, FLRT2, Fc gamma RI/CD64, FLRT3, Fc gamma RIIB/CD32b, Flt-3, Fc gamma RIIC/CD32c, Flt-3 ligand, Fc gamma RIIA/CD32a, follistatin, Fc gamma RIII/CD16, follistatin-like 1, FcRH1/IRTA5, FosB/G0S3, FcRH2/IRTA4, FoxD3, FcRH4/IRTA1, FoxJ1, FcRH5/IRTA2, FoxP3, Fc receptor-like 3/CD16-2, Fpg, FEN-1, FPR1, fetuin A, FPRL1, fetuin B, FPRL2, acidic FGF, CX3CL1/fractalkine, FGF basic, Frizzled-1, FGF-3, Frizzled-2, FGF-4, Frizzled-3, FGF-5. Frizzled-4, FGF-6, Frizzled-5, FGF-8, Frizzled-6, FGF-9, Frizzled-7, FGF-10, Frizzled-8, FGF-11, Frizzled-9, FGF-12, Frk, FGF-13, sFRP-1, FGF-16, sFRP-2, FGF-17, sFRP-3, FGF-19, sFRP-4, FGF-20, furin, FGF-21, FXR/NR1H4, FGF-22, Fyn, FGF-23, G9a/EHMT2, GFR alpha-3/GDNF R alpha-3, GABA-A-R alpha 1, GFR alpha-4/GDNF R alpha-4, GABA-A-R alpha 2, GITR/TNFRSF18, GABA- A-R alpha 4, GITR/TNFSF18 ligand, GABA-A-R alpha 5, GLI-1, GABA-A-R alpha 6, GLI-2, GABA-A-R beta 1, GLP/EHMT1, GABA-A-R beta 2, GLP-1 R, GABA-A-R beta 3, glucagon, GABA-A-R gamma 2, glucosamine (N-acetyl)-6-sulfatase/GNS, GABA-B-R2, GluR1, GAD1/GAD67, GluR2/3, GAD2/GAD65, GluR2, GADD45 alpha, GluR3, GADD45 beta, Glut1, GADD45 gamma, Glut2, galectin-1, Glut3, galectin-2, Glut4, galectin-3, Glut5, galectin-3 BP, glutaredoxin 1, galectin-4, glycine R, galectin-7 , glycophorin A, galectin-8, glypican 2, galectin-9, glypican 3, GaINAc4S-6ST, glypican 5, GAP-43, glypican 6, GAPDH, GM-CSF, Gas1, GM-CSF R alpha, Gas6, GMF- beta, GASP-1/WFIKKNRP, gp130, GASP-2/WFIKKN, glycogen phosphorylase BB/GPBB, GATA-1, GPR15, GATA-2, GPR39, GATA-3, GPVI, GATA-4, GR/NR3C1, GATA- 5, Gr-1/Ly-6G, GATA-6, granulysin, GBL, granzyme A, GCNT/NR6A 1, granzyme B, CXCL6/GCP-2, granzyme D, GCSF, granzyme G, G-CSF R, granzyme H , GDF-1, GRASP, GDF-3 GRB2, GDF-5, Gremlin, GDF-6, GRO, GDF-7, CXCL1/GRO alpha, GDF-8, CXCL2/GRO beta, GDF-9, CXCL3/GRO gamma , GDF-11, growth hormone, GDF-15, growth hormone R, GDNF, GRP75/HSPA9B, GFAP, GSK-3 alpha/beta, GFI-1, GSK-3 alpha, GFR alpha-1/GDNF R alpha -1, GSK-3 beta, GFR alpha-2/GDNF R alpha-2, EZFIT, H2AX, histidine, H60, HM74A, HAI-1, HMGA2, HAI-2, HMGB1, HAI-2A, TCF-2/HNF -1 beta, HAI-2B, HNF-3 beta/FoxA2, HAND1, HNF-4 alpha/NR2A1, HAPLN1, HNF-4 gamma/NR2A2, airway trypsin-like protease/HAT, HO-1/HMOX1/ HSP32, HB-EGF, HO-2/HMOX2, CCL14a/HCC-1, HPRG, CCL14b/HCC-3, Hrk, CCL16/HCC-4, HRP-1, alpha HCG, HS6ST2, Hck HSD-1, HCR/ CRAM-A/B, HSD-2, HDGF, HSP10/EPF, Hemoglobin, HSP27, Hepassocin, HSP60, HES-1, HSP70, HES-4, HSP90, HGF, HTRA/protease Do, HGF activator, HTRA1/PRSS11 , HGF R, HTRA2/Omi, HIF-1 alpha, HVEM/TNFRSF14, HIF-2 alpha, hyaluronan, HIN-1/secretoglobulin 3A1, 4-hydroxynonenal, Hip,CCL1/I-309/TCA-3, IL-10 , cIAP (pan), IL-10 R alpha, cIAP-1/HIAP-2, IL-10 R beta, cIAP-2/HLAP-1, IL-11, IBSP/sialoprotein II, IL-11 R alpha, ICAM -1/CD54, IL-12, ICAM-2/CD102, IL-12/IL-23 p40, ICAM-3/CD50, IL-12 R beta 1, ICAM-5, IL-12 R beta 2, ICAT, IL-13, ICOS, IL-13 R alpha 1, iduronate 2-sulfatase/IDS, IL-13 R alpha 2, IFN, IL-15, IFN-alpha, IL-15 R alpha, IFN-alpha 1, IL- 16, IFN-alpha 2, IL-17, IFN-alpha 4b, IL-17 R, IFN-alpha A, IL-17 RC, IFN-alpha B2, IL-17 RD, IFN-alpha C, 1L-17B, IFN-alpha D, IL-17B R, IFN-alpha F, IL-17C, IFN-alpha G, IL-17D, IFN-alpha H2, IL-17E, IFN-alpha I, IL-17F, IFN-alpha J1 , IL-18/IL-IF4, IFN-alpha K, IL-18 BPa, IFN-alpha WA, IL-18 BPc, IFN-alpha/beta R1, IL-18 BPd, IFN-alpha/beta R2, IL- 18 R alpha/IL-1 R5, IFN-beta, IL-18 R beta/IL-1 R7, IFN-gamma, IL-19, IFN-gamma R1, IL-20, IFN-gamma R2, IL-20 R alpha, IFN-omega, IL-20 R beta, IgE, IL-21, IGFBP-1, IL-21 R, IGFBP-2, IL-22, IGFBP-3, IL-22 R, IGFBP-4, IL- 22BP, IGFBP-5, IL-23, IGFBP-6, IL-23 R, IGFBP-L1, IL-24, IGFBP-rp1/IGFBP-7, IL-26/AK155, IGFBP-rP10, IL-27, IGF -I, IL-28A, IGF-I R, IL-28B, IGF-II, IL-29/IFN-lambda 1, IGF-II R, IL-31, IgG, IL-31 RA, IgM, IL-32 alpha, IGSF2, IL-33, IGSF4A/SynCAM, ILT2/CD85j, IGSF4B, ILT3/CD85k, IGSF8, ILT4/CD85d, IgY, ILT5/CD85a, IkB-beta, ILT6/CD85e, IKK alfa, Indian Hedgehog, IKK epsilon , INSRR, IKK gamma, insulin, IL-1 alpha/IL-1F1, insulin R/CD220, IL-1 beta/IL-1F2, proinsulin, IL-1 ra/IL-1 F3, insulisin/IDE, 1L-1F5 /FIL1 delta, integrin alpha 2/CD49b, IL-1F6/FIL1 epsilon, integrin alpha 3/CD49c, IL-1F7/FIL1 zeta, integrin alpha 3 beta 1/VLA-3, IL-1F8/FIL1 eta, integrin alpha 4 /CD49d, IL-1F9/IL-1 H1, integrin alpha 5/CD49e, IL-1F10/IL-1HY2, integrin alpha 5 beta 1, IL-1 RI, integrin alpha 6/CD49f, IL-1 RII, integrin alpha 7, IL-1 R3/IL-1 R AcP, integrin alpha 9, IL-1 R4/ST2, integrin alpha E/CD103, IL-1 R6/IL-1 R rp2; integrin alpha L/CD11a, IL-1 R8, integrin alpha L beta 2, IL-1 R9, integrin alpha M/CD11b, IL-2, integrin alpha M beta 2, IL-2 R alpha, integrin alpha V/CD51, IL-2 R beta, integrin alpha V beta 5, IL-3, integrin alpha V beta 3, IL-3 R alpha, integrin alpha V beta 6, IL-3 R beta, integrin alpha X/CD11c, IL-4, integrin beta 1/CD29, IL-4 R, integrin beta 2/CD18, IL-5, integrin beta 3/CD61, IL-5 R alpha, integrin beta 5, IL-6, integrin beta 6, IL-6 R, integrin beta 7, IL-7, CXCL10/IP-10/CRG-2, IL-7 R alpha/CD127, IRAK1, CXCR1/IL-8 RA, IRAK4, CXCR2/IL-8 RB, IRS-1, CXCL8/ IL-8, Islet-1, IL-9, CXCL11/1-TAC, IL-9 R, Jagged 1, JAM-4/IGSF5, Jagged 2, JNK, JAM-A, JNK1/JNK2, JAM-B/VE -JAM, JNK1, JAM-C, JNK2, kininogen, kallikrein 3/PSA, quininostatin, kallikrein 4, KIR/CD158, kallikrein 5, KIR2DL1, kallikrein 6/neurosin, KIR2DL3, kallikrein 7, KIR2DLA/CD158d, kallikrein 8/neuropsin , KIR2DS4, kallikrein 9, KIR3DL1, plasma kallikrein/KLKB1, KIR3DL2, kallikrein 10, Kirrel2, kallikrein 11, KLF4, kallikrein 12, KLF5, kallikrein 13, KLF6, kallikrein 14, Klotho, kallikrein 15, Klotho beta, KC, KOR, Keap1, Kremen-1, Kell, Kremen-2, KGF/FGF-7, LAG-3, LINGO-2, LAIR1, lipin 2, LAIR2, lipocalin-1, laminin alpha 4, lipocalin-2/NGAL, laminin gamma 1 , 5-lipoxygenase, laminin I, LXR alpha/NR1H3, laminin S, LXR beta/NR1H2, laminin-1, livin, laminin-5, LIX, LAMP, LMIR1/CD300A, langerin, LMIR2/CD300c, LAR, LMIR3/CD300LF , latexin, LMIRS/CD300LB, layilin, LMIR6/CD300LE, LBP, LM02, LDL R, LOX-1/SR-E1, LECT2, LRH-1/NR5A2, LEDGF, LRIG1, Lefty, LRIG3, Lefty-1, LRP- 1, Lefty-A, LRP-6, legumain, LSECtin/CLEC4G, leptin, lumican, leptin R, CXCL15/Lungkine, leukotriene B4, , lymphotoxin beta R/TNFRSF3, LIGHT/TNFSF14, Lyn, limitin, Lyp, LIMPII/SR-B2, lysyl oxidase homolog 2, LIN-28, LYVE-1, LINGO-1, alpha 2-macroglobulin, CXCL9/MIG, MAD2L1, mimecane, MAdCAM-1, mindin, MafB, mineralocorticoid R/NR3C2, MafF, CCL3L1/MIP-1 alpha isoform LD78 beta, MafG, CCL3/MIP-1 alpha, MafK, CCL4L1/LAG-1, MAG/Siglec -4a, CCL4/MIP-1 beta, MANF, CCL15/MIP-1 delta, MAP2, CCL9/10/MIP-1 gamma, MAPK, MIP-2, marapsin/pancreasin, CCL19/MIP-3 beta, MARCKS, CCL20 /MIP-3 alpha, MARCO, MIP-I, Mash1, MIP-II, Matrilin-2, MIP-III, Matrilin-3, MIS/AMH, Matrilin-4, MIS RII, Matriptase/ST14, MIXL1, MBL, MKK3 /MKK6, MBL-2, MKK3, melanocortin 3R/MC3R, MKK4, MCAM/CD146, MKK6, MCK-2, MKK7, Mcl-1, MKP-3, MCP-6, MLH-1, CCL2/MCP-1, MLK4 alpha, MCP-11, MMP, CCL8/MCP-2, MMP-1, CCL7/MCP-3/MARC, MMP-2, CCL13/MCP-4, MMP-3, CCL12/MCP-5, MMP-7 , M-CSF, MMP-8, M-CSF R, MMP-9, MCV-type II, MMP-10, MD-1, MMP-11, MD-2, MMP-12, CCL22/MDC, MMP-13 , MDL-1/CLEC5A, MMP-14, MDM2, MMP-15, MEA-1, MMP-16/MT3-MMP, MEK1/MEK2, MMP-24/MT5-MMP, MEK1, MMP-25/MT6-MMP , MEK2, MMP-26, melusin, MMR, MEPE, MOG, meprin alpha, CCL23/MPBP-1, meprin beta, M-Ras/R-Ras3, Mer, Mre11, mesothelin, MRP1, meteorin, MSK1/MSK2, methionine aminopeptidase 1, MSK1, methionine aminopeptidase, MSK2, methionine aminopeptidase 2, MSP, MFG-E8, MSP R/Ron, MFRP, Mug, MgcRacGAP, MULT-1, MGL2, Musashi-1, MGMT, Musashi-2, MIA, MuSK , MICA, MutY DNA glycosylase, MICB, MyD88, MICL/CLEC12A, myeloperoxidase, beta 2 microglobulin, myocardin, Midkine, myocilin, MIF, myoglobin, NAIP NGFI-B gamma/NR4A3, Nanog, NgR2/NgRH1, CXCL7/NAP-2 , NgR3/NgRH2, Nbsl, nidogen-1/entactin, NCAM-1/CD56, nidogen-2, NCAM-L1, nitric oxide, nectin-1, nitrotyrosine, nectin-2/CD112, NKG2A, nectin-3, NKG2C, nectin-4, NKG2D, neogenin, NKp30, neprilysin/CD10, NKp44, neprilysin-2/MMEL1/MMEL2, NKp46/NCR1, nestin, NKp80/KLRF1, NET02, NKX2.5, netrin-1, NMDA R, NR1 subunit , netrin-2, N<m>D<a>R, NR2A subunit, netrin-4, NMDA R, NR2B subunit, netrin-G1a, NMDA R, NR2C subunit, netrin-G2a, N-Me-6 ,7-diOH-TIQ, neuregulin-1/NRG1, nodal, neuregulin-3/NRG3, noggin, neuritin, nogo receptor, NeuroD1, Nogo-A, neurofascin, NOMO, neurogenin-1, nope, neurogenin-2, norrin , neurogenin-3, eNOS, neurolysin, iNOS, neurophysin II, nNOS, neurophilin-1, Notch-1, neurophilin-2, Notch-2, neuropoietin, Notch-3, neurotrimin, Notch-4, neurturin, NOV/CCN3, NFAM1, NRAGE, NF-H, NrCAM, NFkB1, NRL, NFkB2, NT-3, NF-L, NT-4, NF-M, NTB-A/SLAMF6, NG2/MCSP, NTH1, NGF R/TNFRSF16, nucleostemin , beta-NGF, Nurr-1/NR4A2, NGFI-B alpha/NR4A1, OAS2, orexin B, OBCAM, OSCAR, OCAM, OSF-2/periostin, OCIL/CLEC2d, oncostatin M/OSM, OCILRP2/CLEC2i, OSM R beta, Oct-3/4, osteoactivin/GPNMB, OGG1, osteoadherin, Olig 1, 2, 3, osteocalcin, Olig 1, osteocrin, Olig2, osteopontin, Olig3, osteoprotegerin/TNFRSF11B, oligodendrocyte marker O1, Otx2, oligodendrocyte marker 04, OV-6, OMgp, OX40/TNFRSF4, opticin, OX40/TNFSF4 ligand, orexin A, OAS2, orexin B, OBCAM, OSCAR, Ocam, OSF-2/periostin, OCIL/CLEC2d, oncostatin M/OSM, OCILRP2/ CLEC2i, OSM R beta, Oct-3/4, osteoactivin/GPNMB, OGG1, osteoadherin, Olig 1, 2, 3, osteocalcin, Olig1, osteocrin, Olig2, osteopontin, Olig3, osteoprotegerin/TNFRSF11B, oligodendrocyte marker O1, Otx2, oligodendrocyte marker 04, OV-6, OMgp, OX40/TNFRSF4, opticin, OX40/TNFSF4 ligand, orexin A, RACK1, Ret, Rad1, REV-ERB alpha/NR1D1, Rad17, REV-ERB beta/NR1D2, Rad51, Rex -1, Rae-1, RGM-A, Rae-1 alpha, RGM-B, Rae-1 beta, RGM-C, Rae-1 delta, Rheb, Rae-1 epsilon, ribosomal protein S6, Rae-1 gamma, RIP1, Raf-1, ROBO1, RAGE, ROB02, Ra1A/Ra1B, ROB03, Ra1A, ROBO4, Ra1B, ROR/NR1F1-3 (pan), RANK/TNFRSF11A, ROR alpha/NR1F1, CCL5/RANTES, ROR gamma/NR1F3 , Rap1A/B, RTK/ROR1-like orphan receptor 1, RAR alpha/NR1B1, RTK/ROR2-like orphan receptor 2, R<a>R beta/NR1B2, RP105, RAR gamma/NR1B3, RPA2, Ras, RSK (pan), RBP4, RSK1/RSK2, RECK, RSK1, Reg 2/PAP, RSK2, Reg I, RSK3, Reg II, RSK4, Reg III, R-spondin 1, Reg IIIa, R-spondin 2, Reg IV , R-spondin 3, relaxin-1, RUNX1/CBFA2, relaxin-2, RUNX2/CBFA1, relaxin-3, RUNX3/CBFA3, RELM alpha, RXR alpha/NR2B1, RELM beta, RXR beta/NR2B2, RELT/TNFRSF19L, RXR gamma/NR2B3, resistin, S100A10, SLITRK5, S100A8, SLPI, S100A9, SMAC/diablo, S100B, Smad1, S100P, Smad2, SALL1, Smad3, delta-sarcoglycan, Smad4, Sca-1/Ly6, Smad5, SCD-1 , Smad7, SCF, Smad8, SCF R/c-kit, SMC1, SCGF, alpha-smooth muscle actin, SCL/Tal1, SMUG1, SCP3/SYCP3, Snail, CXCL12/SDF-1, sodium calcium exchanger 1, SDNSF/MCFD2, Soggy-1, alpha-secretase, Sonic Hedgehog, gamma-secretase, SorCS1, betasecretase, SorCS3, E-selectin, sortilin, L-selectin, SOST, P-selectin, SOX1, semaphorin 3A, SOX2, semaphorin 3C , SOX3, semaphorin 3E, SOX7, semaphorin 3F, SOX9, semaphorin 6A, SOX10, semaphorin 6B, SOX17, semaphorin 6C, SOX21 semaphorin 6D,SPARC, semaphorin 7A, SPARC-like 1, separase, SP-D, serine substrate I /threonine phosphatase, spinesin, serpin A1, F-spondin, serpin A3, SR-AI/MSR, serpin A4/kallistatin, Src, serpin A5/protein C inhibitor, SREC-I/SR-F1, serpin A8/angiotensinogen, SREC-II, serpin B5, SSEA-1, serpin C1/antithrombin-III, SSEA-3, serpin D1/heparin cofactor II, SSEA-4, serpin E1/PAI-1, ST7/LRP12, serpin E2, stabilin- 1, Serpin F1, Stabilin-2, Serpin F2, Staniocalcin 1, Serpin G1/C1 inhibitor, Staniocalcin 2, Serpin I2, STAT1, Serum amyloid A1, STAT2, SF-1/NR5A1, STAT3, SGK, STAT4, SHBG , STAT5a/b, SHIP, STAT5a, SHP/NR0B2, STAT5b, SHP-1, STAT6, SHP-2, VE-statin, SIGIRR, Stella/Dppa3, Siglec-2/CD22, STRO-1, Siglec-3/CD33 , Substance P, Siglec-5, Sulfamidase/SGSH, Siglec-6, Sulfatase Modifying Factor 1/SUMF1, Siglec-7, Sulfatase Modifying Factor 2/SUMF2, Siglec-9, SUMO1, Siglec-10, SUMO2/3/ 4, Siglec-11, SUMO3, Siglec-F, superoxide dismutase, SIGNR1/CD209, superoxide dismutase-1/Cu-Zn SOD, SIGNR4, superoxide dismutase-2/Mn-SOD, SIRP beta 1, superoxide dismutase-3/EC -SOD, SKI, survivin, SLAM/CD150, synapsin I, Sleeping Beauty transposase, syndecan-1/CD138, Slit3, syndecan-2, SLITRK1, syndecan-3, SLITRK2, syndecan-4, SLITRK4, TACI/TNFRSF13B, TMEFF1/ tomoregulin-1, TAO2, TMEFF2, TAPP1, TNF-alpha/TNFSF1A, CCL17/TARC, TNF-beta/TNFSF1B, Tau, TNF RI/TNFRSF1A.TC21/R-Ras2, TNF RII/TNFRSF1B, TCAM-1, TOR, TCCR/WSX-1, TP-1, TC-PTP, TP63/TP73L, TDG, TR, CCL25/TECK, TR alpha/NR1A1, tenascin C, TR beta 1/NR1A2, tenascin R, TR2/NR2C1, TER-119 , TR4/NR2C2, TERT, TRA-1-85, testican 1/SPOCK1, TRADD, testican 2/SPOCK2,TRAF-1, testican 3/SPOCK3, TRAF-2, TFPI, TRAF-3, TFPI-2, TRAF- 4, TGF-alpha, TRAF-6, TGF-beta, TRAIL/TNFSF10, TGF-beta 1, TRAIL R1/TNFRSF10A, LAP (TGF-beta 1), TRAIL R2/TNFRSF10B, latent TGF-beta 1, TRAIL R3/ TNFRSF10C, TGF-beta 1,2, TRAIL R4/TNFRSF10D, TGF-beta 2, TRANCE/TNFSF11, TGF-beta 3, TfR (transferrin R), TGF-beta 5, apo-transferrin, latent TGF-beta pb 1, holo-transferrin, latent TGF-beta pb 2, trapin-2/elafin, latent TGF-beta pb4, TREM-1, TGF-beta RI/ALK-5, TREM-2, TGF-beta RII, TREM-3, TGF -beta RIIb, TREML1/TLT-1, TGF-beta RIII, TRF-1, thermolysin, TRF-2, thioredoxin-1, TRH/TRHDE-degrading ectoenzyme, thioredoxin-2, TRIM5, thioredoxin-80, tripeptidyl peptidase I , thioredoxin-like /TRP14, TrkA, THOP1, TrkB, thrombomodulin/CD141, TrkC, thrombopoietin, TROP-2, thrombopoietin R, troponin I peptide 3, thrombospondin-1, troponin T, thrombospondin-2, TROY/TNFRSF19, thrombospondin-4, trypsin 1, thymopoietin, trypsin 2/PRSS2, thymic chemokine-1, trypsin 3/PRSS3, Tie-1, tryptase-5/Prss32, Tie-2, tryptase alpha/TPS1, TIM-1/KIM- 1/HAVCR, tryptase beta-1/MCPT-7, TIM-2, tryptase beta-2/TPSB2, TIM-3, tryptase epsilon/BSSP-4, TIM-4, tryptase gamma-1/TPSG1, TIM-5, tryptophan hydroxylase, TIM-6, TSC22, TIMP-1, TSG, TTMP-2, TSG-6, TIMP-3, TSK, TIMP-4, TSLP, TL1A/TNFSF15, TSLP R, TLR1, TSP50, TLR2, beta- III tubulin, TLR3, TWEAK/TNFSF12, TLR4, TWEAK R/TNFRSF12, TLR5, Tyk2, TLR6, phospho-tyrosine, TLR9, tyrosine hydroxytase, TLX/NR2E1, tyrosine phosphatase substrate I, ubiquitin, UNCSH3, Ugi, UNCSH4, UGRP1 , UNG, ULBP-1, uPA, ULBP-2, uPAR, ULBP-3, URB, UNC5H1, UVDE, UNC5H2, vanilloid R1, VEGF R, VASA, VEGF R1/Flt-1, vasohibin, VEGF R2/KDR/Flk -1, vasorin, VEGF R3/Flt-4, vasostatin, versican, Vav-1, VG5Q, VCAM-1, VHR, VDR/NR1I1, vimentin, VEGF, vitronectin, VEGF-B, VLDLR, VEGF-C, vWF- A2, VEGF-D, alpha-synuclein, Ku70, WASP, Wnt-7b, WIF-1, Wnt-8a WISP-1/CCN4, Wnt-8b, WNK1, Wnt-9a, Wnt-1, Wnt-9b, Wnt -3a, Wnt-10a, Wnt-4, Wnt-10b, Wnt-5a, Wnt-11, Wnt-5b,wnvNS3, Wnt7a, XCR1, XPE/DDB1, XEDAR, XPE/DDB2, Xg, XPF, XIAP, XPG , XPA, XPV, XPD, XRCC1, Yes, YY1, EphA4.

[0212]Numerosos canales de iones humanos son dianas de particular interés. Ejemplos no limitantes incluyen subunidad B del receptor 3 de 5-hidroxitriptamina, precursor del receptor 3 de 5-hidroxitriptamina, subunidad C del receptor 3 de 5-hidroxitriptamina, proteína 14 de AAD, proteína de receptor de acetilcolina, precursor de la subunidad alfa, proteína de receptor de acetilcolina, precursor de la subunidad beta, proteína de receptor de acetilcolina, precursor de la subunidad delta, proteína de receptor de acetilcolina, precursor de la subunidad épsilon, proteína de receptor de acetilcolina, precursor de la subunidad gamma, variante de corte y empalme b de canales de iones sensibles a ácidos 3, variante de corte y empalme c de canales de iones sensible a ácidos 3, canal de iones sensible a ácidos 4, ADP-ribosa pirofosfatasa, precursor mitocondrial, canal de calcio dependiente de voltaje alfa1A, canal de cationes sensible a amilorida 1, neuronal, canal de cationes sensible a amilorida 2, canal de cationes sensible a amilorida 4 neuronal, isoforma 2, canal de sodio sensible a amilorida, subunidad alfa de canales de sodio sensibles a amilorida, subunidad beta de canales de sodio sensibles a amilorida, subunidad delta de canales de sodio sensibles a amilorida, subunidad gamma de canales de sodio sensibles a amilorida, anexina A7, proteína similar a apical, canal de potasio de rectificación interna sensible a ATP 1, canal de potasio de rectificación interna sensible a ATP 10, canal de potasio de rectificación interna sensible a ATP 11, canal de potasio de rectificación interna sensible al ATP 14, canal de potasio de rectificación interna sensible al ATP 15, canal de potasio de rectificación interna sensible al ATP 8, subunidad alfa 12.2 de canales de calcio, subunidad alfa 12.2 de canales de calcio, subunidad alfa1E de canales de calcio, variante de corte y empalme delta19 delta40 delta46, subunidad 1 de canales de potasio activados por calcio alfa, subunidad 1 de canales de potasio activados por calcio beta, subunidad 2 de canales de potasio activados por calcio beta, subunidad 3 de canales de potasio activados por calcio beta, canal de cloruro dependiente de calcio 1, canal de cationes TRPM4B, CADN fLj90453 fis, clon NT2RP3001542, altamente similar a 6 que contiene dominio de tetramerización de canales de potasio, CADN FLJ90663 fis, clon PLACE1005031, altamente similar a proteína 5 de canales intracelulares de cloruro, subunidad beta de canales de cationes regulados por CGMP, proteína de canales de cloruro, proteína de canales de cloruro 2, proteína de canales de cloruro 3, proteína de canales de cloruro 4, proteína de canales de cloruro 5, proteína de canales de cloruro 6, proteína de canales de cloruro C1C-Ka, proteína de canales de cloruro C1C-Kb, proteína de canales de cloruro, músculo esquelético, canal intracelular de cloruro 6, proteína 3 de canales intracelulares de cloruro, proteína 4 de canales intracelulares de cloruro, proteína 5 de canales intracelulares de cloruro, proteína CHRNA3, proteína Clcn3e, proteína CLCNKB, proteína CNGA4, culina-5, canal de potasio regulado por g Mp cíclico, canal de cationes regulado por nucleótido cíclico 4, canal de cationes regulado por nucleótido cíclico alfa 3, canal de cationes regulado por nucleótido cíclico beta 3, canal olfativo regulado por nucleótidos cíclicos, regulador de la conductancia transmembrana de fibrosis quística, cadena pesada de citocromo B-245, tipo L sensible a dihidropiridina, precursor de subunidades alfa-2/delta de canales de calcio, precursor del regulador 3 del transporte de iones que contiene dominio de FXYD, precursor del regulador 5 del transporte de iones que contiene dominio de FXYD, precursor del regulador 6 del transporte de iones que contiene dominio de FXYD, regulador 7 del transporte de iones que contiene dominio de FXYD, precursor del regulador 8 del transporte de iones que contiene dominio de FXYD, canal de potasio de rectificación interna activado por proteína G 1, canal de potasio de rectificación interna activado por proteína G 2, canal de potasio de rectificación interna activado por proteína G 3, canal de potasio de rectificación interna activado por proteína G 4, precursor de la subunidad alfa-1 de receptor de ácido gamma-aminobutírico, precursor de la subunidad alfa-2 de receptor de ácido gamma-aminobutírico, precursor de la subunidad alfa-3 de receptor de ácido gamma-aminobutírico, precursor de la subunidad alfa-4 de receptor de ácido gammaaminobutírico, precursor de la subunidad alfa-5 de receptor de ácido gamma-aminobutírico, precursor de la subunidad alfa-6 de receptor de ácido gamma-aminobutírico, precursor de la subunidad beta-1 de receptor de ácido gamma-aminobutírico, precursor de la subunidad beta-2 de receptor de ácido gamma-aminobutírico, precursor de la subunidad beta-3 de receptor de ácido gamma-aminobutírico, precursor de la subunidad delta de receptor de ácido gamma-aminobutírico, precursor de la subunidad épsilon de receptor de ácido gamma-aminobutírico, precursor de la subunidad gamma-1 de receptor de ácido gamma-aminobutírico, precursor de la subunidad gamma-3 de receptor de ácido gamma-aminobutírico, precursor de la subunidad pi de receptor de ácido gamma-aminobutírico, precursor de la subunidad rho-1 de receptor de ácido gamma-aminobutírico, precursor de la subunidad rho-2 de receptor de ácido gamma-aminobutírico, precursor de la subunidad theta de receptor de ácido gamma-aminobutírico, receptor de kainato GluR6, precursor del receptor 1 de glutamato, precursor del receptor 2 de glutamato, precursor del receptor 3 de glutamato, precursor del receptor 4 de glutamato, receptor 7 de glutamato, receptor B de glutamato, precursor de la subunidad delta-1 del receptor de glutamato, receptor de glutamato, precursor de kainato 1 ionotrópico, receptor de glutamato, precursor de kainato 2 ionotrópico, receptor de glutamato, precursor de kainato 3 ionotrópico, receptor de glutamato, precursor de kainato 4 ionotrópico, receptor de glutamato, precursor de kainato 5 ionotrópico, precursor de la subunidad 3A del receptor de glutamato [NMDA], precursor de la subunidad 3B del receptor de glutamato [NMDA], precursor de la subunidad épsilon 1 del receptor de glutamato [NMDA], precursor de la subunidad épsilon 2 del receptor de glutamato [NMDA], precursor de la subunidad épsilon 4 del receptor de glutamato [NMDA], precursor de la subunidad zeta I del receptor de glutamato [NMDA], precursor de la cadena alfa-1 de receptor de glicina, precursor de la cadena alfa-2 de receptor de glicina, precursor de la cadena alfa-3 de receptor de glicina, precursor de la cadena beta de receptor de glicina, subunidad 1 del complejo de ribonucleoproteína H/ACA, subunidad beta del receptor épsilon de inmunoglobulina de alta afinidad, proteína hipotética DKFZp313I0334, proteína hipotética DKFZp761M1724, proteína hipotética FLJ12242, proteína hipotética FLJ14389, proteína hipotética FLJ14798, proteína hipotética FLJ14995, proteína hipotética FLJ16180, proteína hipotética FLJ16802, proteína hipotética FLJ32069, proteína hipotética FLJ37401, proteína hipotética FLJ38750, proteína hipotética FLJ40162, proteína hipotética FLJ41415, proteína hipotética FLJ90576, proteína hipotética FLJ90590, proteína hipotética FLJ90622, proteína hipotética KCTD15, proteína hipotética MGC15619, receptor tipo 1 de 1,4,5-trisfosfato de inositol, receptor tipo 2 de 1,4,5-trisfosfato de inositol, receptor tipo 3 de 1,4,5-trisfosfato de inositol, proteína 4 de canales de potasio activados por calcio de conductancia intermedia, canal de potasio de rectificación interna 13, canal de potasio de rectificación interna 16, canal de potasio de rectificación interna 4, regulador Kir2.2v negativo de canales de K(+) de rectificación interna, subunidad KA2a del receptor de kainato, proteína KCNH5, proteína KCTD 17, proteína KCTD2, proteína transmembrana asociada a queratinocitos 1, proteína 4 de interacción con canales Kv, melastatina 1, proteína MLC1 de membrana, proteína MGC15619, mucolipina-1, mucolipina-2, mucolipina-3, proteína 4 asociada a resistencia a múltiples fármacos, precursor de la subunidad 2C del receptor de N-metil-D-aspartato, homólogo de NADPH oxidasa 1, proteína de receptor de acetilcolina neuronal Nav1.5, precursor de la subunidad alfa-10, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-2, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-3, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-4, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-5, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-6, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-7, proteína del receptor de acetilcolina neuronal, precursor de la subunidad alfa-9, proteína del receptor de acetilcolina neuronal, precursor de la subunidad beta-2, proteína del receptor de acetilcolina neuronal, precursor de la subunidad beta-3, proteína del receptor de acetilcolina neuronal, precursor de la subunidad beta-4, subunidad alfa 2D de canales de calcio dependientes de voltaje neuronales, receptor purinérgico P2X 1, receptor purinérgico P2X 2, receptor purinérgico P2X 3, receptor purinérgico P2X 4, receptor purinérgico P2X 5, receptor purinérgico P2X 6, receptor purinérgico P2X 7, canal de potasio pancreático TALK-1b, canal de potasio pancreático TALK-1c, canal de potasio pancreático TALK-1d, precursor de Phospholemman, plasmolipina, proteína relacionada con 2 de enfermedad del riñón poliquístico, proteína 1 similar a 2 de enfermedad del riñón poliquístico, proteína 2 similar a 2 de enfermedad del riñón poliquístico, enfermedad del riñón poliquístico y receptor para precursor de la proteína relacionada con la gelatina del huevo, policistina-2, regulador de los canales de potasio, miembro 1 de la subfamilia K de canales de potasio, miembro 10 de la subfamilia K de canales de potasio, miembro 12 de la subfamilia K de canales de potasio, miembro 13 de la subfamilia K de canales de potasio, miembro 15 de la subfamilia K de canales de potasio, miembro 16 de la subfamilia K de canales de potasio, miembro 17 de la subfamilia K de canales de potasio, miembro 2 de la subfamilia K de canales de potasio, miembro 3 de la subfamilia K de canales de potasio, miembro 4 de la subfamilia K de canales de potasio, miembro 5 de la subfamilia K de canales de potasio, miembro 6 de la subfamilia K de canales de potasio, miembro 7 de la subfamilia K de canales de potasio, miembro 9 de la subfamilia K de canales de potasio, 3 que contiene dominios de tetramerización de canales de potasio, proteína 12 que contiene dominios de tetramerización de canales de potasio, proteína 14 que contiene dominios de tetramerización de canales de potasio, proteína 2 que contiene dominios de tetramerización de canales de potasio, proteína 4 que contiene dominios de tetramerización de canales de potasio, proteína 5 que contiene dominios de tetramerización de canales de potasio, 10 que contiene dominios de tetramerización de canales de potasio, proteína 13 que contiene dominios de tetramerización de canales de potasio, 1 que contiene dominios de tetramerización de canales de potasio, miembro 1 de la subfamilia A de canales regulados por voltaje de potasio, miembro 2 de la subfamilia A de canales regulados por voltaje de potasio, miembro 4 de la subfamilia A de canales regulados por voltaje de potasio, miembro 5 de la subfamilia A de canales regulados por voltaje de potasio, miembro 6 de la subfamilia A de canales regulados por voltaje de potasio, miembro 1 de la subfamilia B de canales regulados por voltaje de potasio, miembro 2 de la subfamilia B de canales regulados por voltaje de potasio, miembro 1 de la subfamilia C de canales regulados por voltaje de potasio, miembro 3 de la subfamilia C de canales regulados por voltaje de potasio, miembro 4 de la subfamilia C de canales regulados por voltaje de potasio, miembro 1 de la subfamilia D de canales regulados por voltaje de potasio, miembro 2 de la subfamilia D de canales regulados por voltaje de potasio, miembro 3 de la subfamilia D de canales regulados por voltaje de potasio, miembro 1 de la subfamilia E de canales regulados por voltaje de potasio, miembro 2 de la subfamilia E de canales regulados por voltaje de potasio, miembro 3 de la subfamilia E de canales regulados por voltaje de potasio, miembro 4 de la subfamilia E de canales regulados por voltaje de potasio, miembro 1 de la subfamilia F de canales regulados por voltaje de potasio, miembro 1 de la subfamilia G de canales regulados por voltaje de potasio, miembro 2 de la subfamilia G de canales regulados por voltaje de potasio, miembro 3 de de la subfamilia G de canales regulados por voltaje de potasio, miembro 4 de la subfamilia G de canales regulados por voltaje de potasio, miembro 1 de la subfamilia H de canales regulados por voltaje de potasio, miembro 2 de la subfamilia H de canales regulados por voltaje de potasio, miembro 3 de la subfamilia H de canales regulados por voltaje de potasio, miembro 4 de la subfamilia H de canales regulados por voltaje de potasio, miembro 5 de la subfamilia H de canales regulados por voltaje de potasio, miembro 6 de la subfamilia H de canales regulados por voltaje de potasio, miembro 7 de la subfamilia H de canales regulados por voltaje de potasio, miembro 8 de la subfamilia H de canales regulados por voltaje de potasio, miembro 1 de la subfamilia KQT de canales regulados por voltaje de potasio, miembro 2 de la subfamilia KQT de canales regulados por voltaje de potasio, miembro 3 de la subfamilia KQT de canales regulados por voltaje de potasio, miembro 4 de la subfamilia KQT de canales regulados por voltaje de potasio, miembro 5 de la subfamilia KQT de canales regulados por voltaje de potasio, miembro 1 de la subfamilia S de canales regulados por voltaje de potasio, miembro 2 de la subfamilia S de canales regulados por voltaje de potasio, miembro 3 de la subfamilia S de canales regulados por voltaje de potasio, miembro 2 de la subfamilia V de canales regulados por voltaje de potasio, canales regulados por voltaje de potasio, subfamilia H, miembro 7, isoforma 2, canal regulado por nucleótidos cíclicos activados por hiperpolarización de potasio/sodio 1, canal regulado por nucleótidos cíclicos activados por hiperpolarización de potasio/sodio 2, canal regulado por nucleótidos cíclicos activados por hiperpolarización de potasio/sodio 3, canal regulado por nucleótidos cíclicos activados por hiperpolarización de potasio/sodio 4, homólogos de TOM40 de la subunidad de receptores de importación mitocondrial probable, receptor purinérgico, isoforma A, canal de iones seleccionados por voltaje de 4 repeticiones putativas, proteína 7 de canales de cloruro putativos, receptor de kainato GluR6 putativo, variante 1 de la proteína CATSPER2 de canales de iones putativos, variante 2 de la proteína CATSPER2 de canales de iones putativos, variante 3 de la proteína CATSPER2 de canales de iones putativos, regulador putativo de la variante 1 de proteína de canales de potasio, proteína tirosina fosfatasa TPTE putativa, receptor 1 de rianodina, receptor 2 de rianodina, receptor 3 de rianodina, proteína 1 de unión a SH3KBP1, canal 1 de potencial receptor transitorio corto, canal 4 de potencial receptor transitorio corto, canal 5 de potencial receptor transitorio corto, canal 6 de potencial receptor transitorio corto, canal 7 de potencial receptor transitorio corto, proteína 1 de canales de potasio activados por calcio de conductancia pequeña, proteína 2 de canales de potasio activados por calcio de conductancia pequeña, isoforma b, proteína 3 de canales de potasio activados por calcio de conductancia pequeña, isoforma b, canal de potasio activado por calcio de conductancia pequeña SK2, canal de potasio activado por calcio de conductancia pequeña SK3, canal de sodio, precursor de la subunidad beta-1 de canales de sodio, subunidad alfa de proteína tipo II de canales de sodio, subunidad alfa de proteína tipo III de canales de sodio, subunidad alfa de proteína tipo IV de canales de sodio, subunidad alfa de proteína tipo IX de canales de sodio, subunidad alfa de proteína tipo V de canales de sodio, subunidad alfa de proteína tipo VI de canales de sodio, subunidad alfa de proteína tipo VIII de canales de sodio, subunidad alfa de proteína tipo X de canales de sodio, subunidad alfa de proteína tipo XI de canales de sodio, canal de potasio sensible al ATP activado por sodio y cloruro, cadena gamma de ATPasa transportadora de sodio/potasio, canal de cationes asociado a espermatozoides 1, canal de cationes asociado a espermatozoides 2, isoforma 4, sintaxina-1 B1, miembro 1 de la subfamilia A de canales de cationes de potencial receptor transitorio, miembro 2 de la subfamilia M de canales de cationes de potencial receptor transitorio, miembro 3 de la subfamilia M de canales de cationes de potencial receptor transitorio, miembro 6 de la subfamilia M de canales de cationes de potencial receptor transitorio, miembro 7 de la subfamilia M de canales de cationes de potencial receptor transitorio, miembro 1 de la subfamilia V de canales de cationes de potencial receptor transitorio, miembro 2 de la subfamilia V de canales de cationes de potencial receptor transitorio, miembro 3 de la subfamilia V de canales de cationes de potencial receptor transitorio, miembro 4 de la subfamilia V de canales de cationes de potencial receptor transitorio, miembro 5 de la subfamilia V de canales de cationes de potencial receptor transitorio, miembro 6 de la subfamilia A de canales de cationes de potencial receptor transitorio, variante de corte y empalme épsilon de canales de potencial receptor transitorio 4, variante de corte y empalme zeta de canales de potencial receptor transitorio 4, variante de corte y empalme gamma de canales de potencial receptor transitorio 7, factor de necrosis tumoral, proteína 1 alfa-inducida, endotelial, proteína 2 de canales de calcio de dos poros, proteína VDAC4, canal de potasio regulado por voltaje Kv3.2b, subunidad beta1B de canales de sodio regulados por voltaje, canales de aniones dependientes de voltaje, canales de aniones dependientes de voltaje 2, proteína 1 de canales selectivos de aniones dependientes de voltaje, proteína 2 de canales selectivos de aniones dependientes de voltaje, proteína 3 de canales selectivos de aniones dependientes de voltaje, subunidad gamma-1 de canales de calcio dependientes de voltaje, subunidad gamma-2 de canales de calcio dependientes de voltaje, subunidad gamma-3 de canales de calcio dependientes de voltaje, subunidad gamma-4 de canales de calcio dependientes de voltaje, subunidad gamma-5 de canales de calcio dependientes de voltaje, subunidad gamma-6 de canales de calcio dependientes de voltaje, subunidad gamma-7 de canales de calcio dependientes de voltaje, subunidad gamma-8 de canales de calcio dependientes de voltaje, subunidad alfa-1 C de canales de calcio tipo L dependientes de voltaje, subunidad alfa-1 D de canales de calcio tipo L dependientes de voltaje, subunidad alfa-1S de canales de calcio tipo L dependientes de voltaje, subunidad beta-1 de canales de calcio tipo L dependientes de voltaje, subunidad beta-2 de canales de calcio tipo L dependientes de voltaje, subunidad beta-3 de canales de calcio tipo L dependientes de voltaje, subunidad beta-4 de canales de calcio tipo L dependientes de voltaje, subunidad alfa-1B de canales de calcio tipo N dependientes de voltaje, subunidad alfa-1A de canales de calcio tipo P/G dependientes de voltaje, subunidad alfa-1E de canales de calcio tipo R dependientes de voltaje, subunidad alfa-1G de canales de calcio tipo T dependientes de voltaje, subunidad alfa-1H de canales de calcio tipo L dependientes de voltaje, subunidad alfa-11 de canales de calcio tipo T dependientes de voltaje, subunidad alfa-1 de canales de calcio tipo L dependientes de voltaje, subunidad beta-1 de canales de potasio dependientes de voltaje, subunidad beta-2 de canales de potasio dependientes de voltaje, subunidad beta-3 de canales de potasio dependientes de voltaje, canal de potasio dependiente de voltaje KCNA7. [0212]Numerous human ion channels are targets of particular interest. Non-limiting examples include 5-hydroxytryptamine receptor 3 subunit B, 5-hydroxytryptamine receptor 3 precursor, 5-hydroxytryptamine receptor 3 subunit C, AAD protein 14, acetylcholine receptor protein, alpha subunit precursor, acetylcholine receptor protein, beta subunit precursor, acetylcholine receptor protein, delta subunit precursor, acetylcholine receptor protein, epsilon subunit precursor, acetylcholine receptor protein, gamma subunit precursor, variant acid-sensitive ion channel b-splicing variant 3, acid-sensitive ion channel c-splicing variant 3, acid-sensitive ion channel 4, ADP-ribose pyrophosphatase, mitochondrial precursor, voltage-gated calcium channel alpha1A, amiloride-responsive cation channel 1, neuronal, amiloride-responsive cation channel 2, neuronal amiloride-responsive cation channel 4, isoform 2, amiloride-responsive sodium channel, amiloride-responsive sodium channel alpha subunit, subunit amiloride-sensitive sodium channel beta, amiloride-sensitive sodium channel delta subunit, amiloride-sensitive sodium channel gamma subunit, annexin A7, apical-like protein, ATP-sensitive inwardly rectifying potassium channel 1, ATP-sensitive inwardly rectifying potassium channel 10, ATP-sensitive inwardly rectifying potassium channel 11, ATP-sensitive inwardly rectifying potassium channel 14, ATP-sensitive inwardly rectifying potassium channel 15, ATP-sensitive inwardly rectifying potassium channel ATP 8, alpha 12.2 calcium channel subunit, alpha 12.2 calcium channel subunit, alpha1E calcium channel subunit, splice variant delta19 delta40 delta46, alpha calcium activated potassium channel subunit 1, alpha channel subunit 1 beta calcium activated potassium channels, beta calcium activated potassium channel subunit 2, beta calcium activated potassium channel subunit 3, calcium dependent chloride channel 1, TRPM4B cation channel, CADN fLj90453 fis, clone NT2RP3001542, highly potassium channel tetramerization domain-containing similar 6, CADN FLJ90663 fis, clone PLACE1005031, highly similar to intracellular chloride channel protein 5, beta subunit of CGMP-regulated cation channels, chloride channel protein, channel protein chloride channel protein 2, chloride channel protein 3, chloride channel protein 4, chloride channel protein 5, chloride channel protein 6, chloride channel protein C1C-Ka, chloride channel protein C1C-Kb, chloride channel protein, skeletal muscle, intracellular chloride channel 6, intracellular chloride channel protein 3, intracellular chloride channel protein 4, intracellular chloride channel protein 5, CHRNA3 protein, Clcn3e protein, CLCNKB protein, CNGA4 protein , cullin-5, cyclic g Mp-regulated potassium channel, cyclic nucleotide-regulated 4 cation channel, alpha 3-cyclic nucleotide-regulated cation channel, beta 3-cyclic nucleotide-regulated cation channel, cyclic nucleotide-regulated olfactory channel, regulator of cystic fibrosis transmembrane conductance, cytochrome B-245 heavy chain, dihydropyridine-sensitive L-type, precursor of alpha-2/delta subunits of calcium channels, precursor of FXYD domain-containing ion transport regulator 3, FXYD domain-containing ion transport regulator 5 precursor, FXYD domain-containing ion transport regulator 6 precursor, FXYD domain-containing ion transport regulator 7 precursor, FXYD domain-containing ion transport regulator 8 precursor FXYD domain, G protein-activated inwardly rectifying potassium channel 1, G protein-activated inwardly rectifying potassium channel 2, G protein-activated inwardly rectifying potassium channel 3, G protein-activated inwardly rectifying potassium channel 4, precursor of gamma-aminobutyric acid receptor alpha-1 subunit, precursor of gamma-aminobutyric acid receptor alpha-2 subunit, precursor of gamma-aminobutyric acid receptor alpha-3 subunit, precursor of gamma-aminobutyric acid receptor alpha-4 subunit, precursor of the gamma-aminobutyric acid receptor alpha-5 subunit, precursor of the gamma-aminobutyric acid receptor alpha-6 subunit, precursor of the gamma-aminobutyric acid receptor beta-1 subunit gamma-aminobutyric acid, precursor of the beta-2 subunit of the gamma-aminobutyric acid receptor, precursor of the beta-3 subunit of the gamma-aminobutyric acid receptor, precursor of the delta subunit of the gamma-aminobutyric acid receptor, precursor of the gamma-aminobutyric acid receptor epsilon subunit, precursor of the gamma-aminobutyric acid receptor gamma-1 subunit, precursor of the gamma-aminobutyric acid receptor gamma-3 subunit, precursor of the acid receptor pi subunit gamma-aminobutyric acid, precursor of the rho-1 subunit of the gamma-aminobutyric acid receptor, precursor of the rho-2 subunit of the gamma-aminobutyric acid receptor, precursor of the theta subunit of the gamma-aminobutyric acid receptor, kainate receptor GluR6, glutamate receptor 1 precursor, glutamate receptor 2 precursor, glutamate receptor 3 precursor, glutamate receptor 4 precursor, glutamate receptor 7, glutamate receptor B, glutamate receptor delta-1 subunit precursor glutamate, glutamate receptor, ionotropic kainate 1 precursor, glutamate receptor, ionotropic kainate 2 precursor, glutamate receptor, ionotropic kainate 3 precursor, glutamate receptor, ionotropic kainate 4 precursor, glutamate receptor, ionotropic kainate 5 precursor ionotropic, precursor of glutamate receptor subunit 3A [NMDA], precursor of glutamate receptor subunit 3B [NMDA], precursor of glutamate receptor epsilon 1 subunit [NMDA], precursor of receptor epsilon 2 subunit glutamate [NMDA], precursor of the epsilon 4 subunit of the glutamate receptor [NMDA], precursor of the zeta I subunit of the glutamate receptor [NMDA], precursor of the alpha-1 chain of the glycine receptor, precursor of the glycine receptor alpha-2, glycine receptor alpha-3 chain precursor, glycine receptor beta chain precursor, ribonucleoprotein H/ACA complex subunit 1, high affinity immunoglobulin epsilon receptor beta subunit , hypothetical protein DKFZp313I0334, hypothetical protein DKFZp761M1724, hypothetical protein FLJ12242, hypothetical protein FLJ14389, hypothetical protein FLJ14798, hypothetical protein FLJ14995, hypothetical protein FLJ16180, hypothetical protein FLJ16802, hypothetical protein FLJ32069, hypothetical FLJ37401, hypothetical protein FLJ38750, hypothetical protein FLJ40162, protein hypothetical FLJ41415, hypothetical protein FLJ90576, hypothetical protein FLJ90590, hypothetical protein FLJ90622, hypothetical protein KCTD15, hypothetical protein MGC15619, inositol 1,4,5-trisphosphate receptor type 1, inositol 1,4,5-trisphosphate receptor type 2 , inositol 1,4,5-trisphosphate receptor type 3, intermediate-conductance calcium-activated potassium channel protein 4, inwardly rectifying potassium channel 13, inwardly rectifying potassium channel 16, inwardly rectifying potassium channel 4, Kir2.2v negative regulator of inwardly rectifying K(+) channels, KA2a subunit of the kainate receptor, KCNH5 protein, KCTD protein 17, KCTD2 protein, keratinocyte-associated transmembrane protein 1, Kv channel-interacting protein 4, melastatin 1, membrane protein MLC1, MGC15619 protein, mucolipin-1, mucolipin-2, mucolipin-3, multidrug resistance-associated protein 4, N-methyl-D-aspartate receptor subunit 2C precursor, homolog of NADPH oxidase 1, neuronal acetylcholine receptor protein Nav1.5, alpha-10 subunit precursor, neuronal acetylcholine receptor protein, alpha-2 subunit precursor, neuronal acetylcholine receptor protein, alpha-subunit precursor 3, neuronal acetylcholine receptor protein, alpha-4 subunit precursor, neuronal acetylcholine receptor protein, alpha-5 subunit precursor, neuronal acetylcholine receptor protein, alpha-6 subunit precursor, receptor protein neuronal acetylcholine, alpha-7 subunit precursor, neuronal acetylcholine receptor protein, alpha-9 subunit precursor, neuronal acetylcholine receptor protein, beta-2 subunit precursor, neuronal acetylcholine receptor protein, precursor beta-3 subunit, neuronal acetylcholine receptor protein, beta-4 subunit precursor, 2D alpha subunit of neuronal voltage-gated calcium channels, purinergic P2X receptor 1, purinergic P2X receptor 2, purinergic P2X receptor 3, receptor purinergic P2X 4, purinergic P2X receptor 5, purinergic P2X receptor 6, purinergic P2X receptor 7, pancreatic potassium channel TALK-1b, pancreatic potassium channel TALK-1c, pancreatic potassium channel TALK-1d, Phospholemman precursor, plasmolipin, protein polycystic kidney disease-related 2, polycystic kidney disease-like protein 2, polycystic kidney disease-like protein 2, polycystic kidney disease and receptor for egg gelatin-related protein precursor, polycystin -2, potassium channel regulator, potassium channel K subfamily member 1, potassium channel K subfamily member 10, potassium channel K subfamily member 12, potassium channel K subfamily member 13 potassium channels, potassium channel K subfamily member 15, potassium channel K subfamily member 16, potassium channel K subfamily member 17, potassium channel K subfamily member 2, member 3 potassium channel subfamily K, potassium channel K subfamily member 4, potassium channel K subfamily member 5, potassium channel K subfamily member 6, channel K subfamily member 7 potassium, potassium channel subfamily K member 9, potassium channel tetramerization domain-containing protein 12, potassium channel tetramerization domain-containing protein 14, protein 2 containing potassium channel tetramerization domains, protein 4 containing potassium channel tetramerization domains, protein 5 containing potassium channel tetramerization domains, 10 containing potassium channel tetramerization domains, protein 13 containing potassium channel tetramerization domains, 1 containing potassium channel tetramerization domains, member 1 of potassium voltage-gated channel subfamily A, member 2 of potassium voltage-gated channel subfamily A, member 4 of potassium voltage-gated channel subfamily A, potassium voltage-gated channel subfamily A member 5, potassium voltage-gated channel subfamily A member 6, voltage-gated channel subfamily B member 1 potassium, potassium voltage-gated channel subfamily B member 2, potassium voltage-gated channel subfamily C member 1, potassium voltage-gated channel subfamily C member 3, potassium voltage-gated channel subfamily C member 4 Potassium voltage-gated channel C, Potassium voltage-gated channel subfamily D member 1, Potassium voltage-gated channel subfamily D member 2, Potassium voltage-gated channel subfamily D member 3 , member 1 of the E subfamily of potassium voltage-gated channels, member 2 of the E subfamily of potassium voltage-gated channels, member 3 of the E subfamily of potassium voltage-gated channels, member 4 of the E subfamily of potassium voltage-gated channels, member 1 of the F subfamily of potassium voltage-gated channels, member 1 of the G subfamily of potassium voltage-gated channels, member 2 of the G subfamily of potassium voltage-gated channels, member Potassium voltage-gated channel subfamily G 3, potassium voltage-gated channel subfamily G member 4, potassium voltage-gated channel subfamily H member 1, channel subfamily H member 2 potassium voltage-gated channel subfamily H member 3, potassium voltage-gated channel subfamily H member 4, potassium voltage-gated channel subfamily H member 5, member 6 of the H subfamily of potassium voltage-gated channels, member 7 of the H subfamily of potassium voltage-gated channels, member 8 of the H subfamily of potassium voltage-gated channels, member 1 of the KQT subfamily of potassium voltage-gated channels potassium voltage, member 2 of the KQT subfamily of potassium voltage-gated channels, member 3 of the KQT subfamily of potassium voltage-gated channels, member 4 of the KQT subfamily of potassium voltage-gated channels, member 5 of the KQT subfamily of potassium voltage-gated channels, member 1 of the S subfamily of potassium voltage-gated channels, member 2 of the S subfamily of potassium voltage-gated channels, member 3 of the S subfamily of potassium voltage-gated channels potassium, potassium voltage-gated channel subfamily V member 2, potassium voltage-gated channels, subfamily H, member 7, isoform 2, potassium/sodium hyperpolarization-activated cyclic nucleotide-gated channel 1, nucleotide-gated channel potassium/sodium hyperpolarization-activated cyclic 2, potassium/sodium hyperpolarization-activated cyclic nucleotide-gated channel 3, potassium/sodium hyperpolarization-activated cyclic nucleotide-gated channel 4, probable mitochondrial import receptor subunit TOM40 homologs , purinergic receptor, isoform A, putative 4-repeat voltage-selected ion channel, putative chloride channel protein 7, putative GluR6 kainate receptor, putative ion channel protein CATSPER2 variant 1, CATSPER2 protein variant 2 putative ion channel protein, putative ion channel protein CATSPER2 variant 3, putative regulator of potassium channel protein variant 1, putative TPTE protein tyrosine phosphatase, ryanodine receptor 1, ryanodine receptor 2, ryanodine receptor 3 ryanodine, SH3KBP1 binding protein 1, short transient receptor potential channel 1, short transient receptor potential channel 4, short transient receptor potential channel 5, short transient receptor potential channel 6, short transient receptor potential channel 7, protein small-conductance calcium-activated potassium channel 1, small-conductance calcium-activated potassium channel protein 2, isoform b, small-conductance calcium-activated potassium channel protein 3, isoform b, calcium-activated potassium channel SK2 small-conductance calcium-activated potassium channel, SK3 small-conductance calcium-activated potassium channel, sodium channel, sodium channel beta-1 subunit precursor, sodium channel protein type II alpha subunit, sodium channel protein type III alpha subunit sodium channels, sodium channel protein type IV alpha subunit, sodium channel protein type IX alpha subunit, sodium channel protein type V alpha subunit, sodium channel protein type VI alpha subunit, alpha subunit sodium channel protein type VIII, sodium channel protein type /potassium, sperm-associated cation channel 1, sperm-associated cation channel 2, isoform 4, syntaxin-1 B1, transient receptor potential cation channel subfamily A member 1, channel subfamily M member 2 receptor potential cation channels, member 3 of the M subfamily of transient receptor potential cation channels, member 6 of the M subfamily of transient receptor potential cation channels, member 7 of the M subfamily of receptor potential cation channels transient, member 1 of the subfamily V of transient receptor potential cation channels, member 2 of the subfamily V of transient receptor potential cation channels, member 3 of the subfamily V of transient receptor potential cation channels, member 4 of transient receptor potential cation channel subfamily V, member 5 of transient receptor potential cation channel subfamily V, member 6 of transient receptor potential cation channel subfamily A, epsilon splice variant of channels transient receptor potential 4, zeta splice variant of transient receptor potential 4 channels, gamma splice variant of transient receptor potential 7 channels, tumor necrosis factor, protein 1 alpha-induced, endothelial, protein 2 two-pore calcium channels, VDAC4 protein, voltage-gated potassium channel Kv3.2b, voltage-gated sodium channel beta1B subunit, voltage-gated anion channels, voltage-gated anion channels 2, selective channel protein 1 voltage-gated anion channel protein 2, voltage-gated anion-selective channel protein 3, voltage-gated calcium channel gamma-1 subunit, voltage-gated calcium channel gamma-2 subunit voltage, gamma-3 subunit of voltage-gated calcium channels, gamma-4 subunit of voltage-gated calcium channels, gamma-5 subunit of voltage-gated calcium channels, gamma-6 subunit of voltage-gated calcium channels, gamma-7 subunit of voltage-gated calcium channels, gamma-8 subunit of voltage-gated calcium channels, alpha-1 C subunit of voltage-gated L-type calcium channels, alpha-1 D subunit of L-type calcium channels voltage-gated, alpha-1S subunit of voltage-gated L-type calcium channels, beta-1 subunit of voltage-gated L-type calcium channels, beta-2 subunit of voltage-gated L-type calcium channels, beta-3 subunit of voltage-gated L-type calcium channels, beta-4 subunit of voltage-gated L-type calcium channels, alpha-1B subunit of voltage-gated N-type calcium channels, alpha-1A subunit of P/G-type calcium channels voltage-gated, alpha-1E subunit of voltage-gated R-type calcium channels, alpha-1G subunit of voltage-gated T-type calcium channels, alpha-1H subunit of voltage-gated L-type calcium channels, alpha-11 subunit of voltage-gated T-type calcium channels, alpha-1 subunit of voltage-gated L-type calcium channels, beta-1 subunit of voltage-gated potassium channels, beta-2 subunit of voltage-gated potassium channels, beta subunit -3 voltage-gated potassium channels, KCNA7 voltage-gated potassium channel.

[0213]GPCR a modo de ejemplo incluyen, pero no se limitan a, rodopsina de clase A como receptores tales como acetilcolina muscular de vertebrado tipo 1, acetilcolina muscular de vertebrado tipo 2, acetilcolina muscular de vertebrado tipo 3, acetilcolina muscular de vertebrado tipo 4; receptores adrenérgicos (receptores adrenérgicos alfa tipo 1, receptores adrenérgicos alfa tipo 2, receptores adrenérgicos beta tipo 1, receptores adrenérgicos beta tipo 2, receptores adrenérgicos beta tipo 3, dopamina de vertebrado tipo 1, dopamina de vertebrado tipo 2, dopamina de vertebrado tipo 3, dopamina de vertebrado tipo 4, histamina tipo 1, histamina tipo 2, histamina tipo 3, histamina tipo 4, serotonina tipo 1, serotonina tipo 2, serotonina tipo 3, serotonina tipo 4, serotonina tipo 5, serotonina tipo 6, serotonina tipo 7, serotonina tipo 8, otros tipos de serotonina, amina Trace, angiotensina tipo 1, angiotensina tipo 2, bombesina, bradiquinina, anafilatoxina C5a, Fmet-leu-phe, similar a APJ, interleucina-8 tipo A, interleucina-8 tipo B, otros tipos de interleucina-8, quimiocina C-C tipo 1 a tipo 11 y otros tipos, quimiocina C-X-C (tipos 2 a 6 y otros), quimiocina C-X3-C, colecistoquinina CCK, CCK tipo A, CCK tipo B, otras CCK, endotelina, melanocortina (hormona estimulante de melanocitos, hormona adrenocorticotrópica, hormona melanocortina), antígeno Duffy, péptido liberador de prolactina (GPR10), neuropéptido Y (tipo 1 a 7), neuropéptido Y, otros neuropéptidos Y, neurotensina, opioide (tipo D, K, M, X), somatostatina (tipo 1 a 5), taquiquinina (sustancia P (NK1), sustancia K (NK2), neuromedina K (NK3), 1 similar a taquiquinina, 2 similar a taquiquinina, vasopresina / vasotocina (tipo 1 a 2), vasotocina, oxitocina / mesotocina, conopresina, similar a galanina, similar a activada con proteinasa, orexina y neuropéptidos FF, QRFP, similar a receptor de quimiocina, similar a neuromedina U (neuromedina U, PRXamida), proteína hormonal (hormona estimulante del folículo, hormona lutropina-coriogonadotrópica, tirotropina, gonadotropina tipo I, gonadotropina tipo II), (rod)opsina, rodopsina de vertebrado (tipos 1-5), rodopsina de vertebrado tipo 5, rodopsina de artrópodo, rodopsina de artrópodo tipo 1, rodopsina de artrópodo tipo 2, rodopsina de artrópodo tipo 3, rodopsina de molusco, rodopsina, olfativa (olfativa II fam 1 a 13), prostaglandina (prostaglandina E2 subtipo EP1, prostaglandina E2/D2 subtipo EP2, prostaglandina E2 subtipo EP3, prostaglandina E2 subtipo EP4, prostaglandina F2-alfa, prostaciclina, tromboxano, adenosina tipo 1 a 3, receptores purinérgicos, receptor purinérgico P2RY1-4, 6, 11 GPR91, receptor purinérgico P2RY5, 8, 9, 10 GPR35, 92, 174, receptor purinérgico P2RY12-14 GPR87 (UDP-Glucosa), cannabinoide, factor de activación de plaquetas, hormona liberadora de gonadotropina, hormona liberadora de gonadotropina tipo I, hormona liberadora de gonadotropina tipo II, similar a hormona adipocinética, corazonina, hormona liberadora de tirotropina y secretagogo, hormona liberadora de tirotropina, secretagogo de hormona de crecimiento, similar a secretagogo de hormona de crecimiento, hormona desencadenante de ecdisis (ETHR), melatonina, lisoesfingolípido y LPA (EDG), esfingosina 1-fosfato Edg-1, ácido lisofosfatídico Edg-2, esfingosina 1-fosfato Edg-3, ácido lisofosfatídico Edg-4, esfingosina 1-fosfato Edg-5, esfingosina 1-fosfato Edg-6, ácido lisofosfatídico Edg-7, esfingosina 1-fosfato Edg-8, Edg. Otro receptor de leucotrieno B4, receptor BLT1 de leucotrieno B4, receptor BLT2 de leucotrieno B4, orfano de clase A/otro, neurotransmisores putativos, SREB, proto-oncogén mas y relacionado con mas (MRG), similar a GPR45, cisteinilleucotrieno, receptor de ácido biliar acoplado a proteína G, receptor de ácidos grasos libres (GP40, GP41, GP43), similar a secretina de clase B, calcitonina, factor liberador de corticotropina, péptido inhibidor gástrico, glucagón, hormona liberadora de hormona de crecimiento, hormona paratiroidea, PACAP, secretina, polipéptido intestinal vasoactivo, latrofilina, latrofilina tipo 1, latrofilina tipo 2, latrofilina tipo 3, receptores de ETL, inhibidor de angiogénesis específica para cerebro (BAI), proteínas similares a Methuselah (MTH), cadherina EGF LAG (CELSR), receptor acoplado a proteína G muy grande, glutamato metabotrópico de clase C/feromona, glutamato metabotrópico grupo I a III, similar a sensibilización al calcio, sensibilización al calcio extracelular, feromona, otra similar a sensibilización al calcio, receptores de feromonas putativas, GABA-B, GABA-B subtipo 1, GABA-B subtipo 2, similar a GABA-B, orfano GPRC5, orfano GPCR6, novia de proteínas sevenless (BOSS), receptores de Taste (T1R), feromonas fúngicas de clase D, similar a factor de feromonas fúngicas A (STE2, STE3), similar a feromona B fúngica (BAR, BBR, RCB, PRA), receptores de cAMP de clase E, proteínas del albinismo ocular, familia de Frizzled/Smoothened, frizzled grupo A ( F z 1 y 2 y 4 y 5 y 7-9), frizzled grupo B (Fz 3 y 6), frizzled grupo C (otros), receptores vomeronasales, quimioreceptores de nematodos, receptores olorosos de insectos y opsinas arqueales/bacterianas/fúngicas de clase Z. [0213]Exemplary GPCRs include, but are not limited to, class A rhodopsin like receptors such as vertebrate muscle acetylcholine type 1, vertebrate muscle acetylcholine type 2, vertebrate muscle acetylcholine type 3, vertebrate muscle acetylcholine type 4; adrenergic receptors (alpha type 1 adrenergic receptors, alpha type 2 adrenergic receptors, beta type 1 adrenergic receptors, beta type 2 adrenergic receptors, beta type 3 adrenergic receptors, vertebrate dopamine type 1, vertebrate dopamine type 2, vertebrate dopamine type 3 , vertebrate dopamine type 4, histamine type 1, histamine type 2, histamine type 3, histamine type 4, serotonin type 1, serotonin type 2, serotonin type 3, serotonin type 4, serotonin type 5, serotonin type 6, serotonin type 7 , serotonin type 8, other types of serotonin, Trace amine, angiotensin type 1, angiotensin type 2, bombesin, bradykinin, anaphylatoxin C5a, Fmet-leu-phe, APJ-like, interleukin-8 type A, interleukin-8 type B, other types of interleukin-8, chemokine C-C type 1 to type 11 and other types, chemokine C-X-C (types 2 to 6 and others), chemokine C-X3-C, cholecystokinin CCK, CCK type A, CCK type B, other CCK, endothelin, melanocortin (melanocyte-stimulating hormone, adrenocorticotropic hormone, melanocortin hormone), Duffy antigen, prolactin-releasing peptide (GPR10), neuropeptide Y (type 1 to 7), neuropeptide Y, other neuropeptides Y, neurotensin, opioid (type D, K, M, 1 to 2), vasotocin, oxytocin/mesotocin, conopressin, galanin-like, activated proteinase-like, orexin and FF neuropeptides, QRFP, chemokine receptor-like, neuromedin U-like (neuromedin U, PRXamide), hormone protein ( follicle-stimulating hormone, lutropin-choriogonadotropic hormone, thyrotropin, gonadotropin type I, gonadotropin type II), (rod)opsin, vertebrate rhodopsin (types 1-5), vertebrate rhodopsin type 5, arthropod rhodopsin, arthropod rhodopsin type 1, arthropod rhodopsin type 2, arthropod rhodopsin type 3, mollusk rhodopsin, rhodopsin, olfactory (olfactory II fam 1 to 13), prostaglandin (prostaglandin E2 subtype EP1, prostaglandin E2/D2 subtype EP2, prostaglandin E2 subtype EP3, prostaglandin E2 subtype EP4, prostaglandin F2-alpha, prostacyclin, thromboxane, adenosine type 1 to 3, purinergic receptors, purinergic receptor P2RY1-4, 6, 11 GPR91, purinergic receptor P2RY5, 8, 9, 10 GPR35, 92, 174, purinergic receptor P2RY12-14 GPR87 (UDP-Glucose), cannabinoid, platelet activating factor, gonadotropin-releasing hormone, gonadotropin-releasing hormone type I, gonadotropin-releasing hormone type II, adipokinetic hormone-like, corazonin, thyrotropin-releasing hormone and secretagogue , thyrotropin-releasing hormone, growth hormone secretagogue, growth hormone secretagogue-like, ecdysis-triggering hormone (ETHR), melatonin, lysosphingolipid and LPA (EDG), sphingosine 1-phosphate Edg-1, lysophosphatidic acid Edg-2 , sphingosine 1-phosphate Edg-3, lysophosphatidic acid Edg-4, sphingosine 1-phosphate Edg-5, sphingosine 1-phosphate Edg-6, lysophosphatidic acid Edg-7, sphingosine 1-phosphate Edg-8, Edg. Leukotriene B4 receptor G protein-coupled bile acid, free fatty acid receptor (GP40, GP41, GP43), class B secretin-like, calcitonin, corticotropin-releasing factor, gastric inhibitory peptide, glucagon, growth hormone-releasing hormone, parathyroid hormone, PACAP, secretin, vasoactive intestinal polypeptide, latrophilin, latrophilin type 1, latrophilin type 2, latrophilin type 3, ETL receptors, brain-specific angiogenesis inhibitor (BAI), Methuselah-like proteins (MTH), EGF LAG cadherin (CELSR) , very large G protein-coupled receptor, class C metabotropic glutamate/pheromone, group I to III metabotropic glutamate, calcium sensitization-like, extracellular calcium sensitization, pheromone, other calcium sensitization-like, putative pheromone receptors, GABA -B, GABA-B subtype 1, GABA-B subtype 2, GABA-B-like, Orphan GPRC5, Orphan GPCR6, Bride of sevenless proteins (BOSS), Taste receptors (T1R), Class D fungal pheromones, similar to fungal pheromone factor A (STE2, STE3), fungal pheromone B-like (BAR, BBR, RCB, PRA), cAMP receptors class E, ocular albinism proteins, Frizzled/Smoothened family, frizzled group A (F z 1 and 2 and 4 and 5 and 7-9), frizzled group B (Fz 3 and 6), frizzled group C (others), vomeronasal receptors, nematode chemoreceptors, insect odorant receptors and archaeal/bacterial/fungal class opsins Z.

[0214]Las MURP objeto pueden diseñarse para elegir como diana cualquier proteína celular que incluye, pero no se limita a, proteína de la superficie celular, proteína secretasa, proteína citosólica y proteína nuclear. Una diana de particular interés es un canal de iones. [0214]The target MURPs can be designed to target any cellular protein including, but not limited to, cell surface protein, secretase protein, cytosolic protein, and nuclear protein. One target of particular interest is an ion channel.

[0215]Los canales de iones constituyen una superfamilia de proteínas, que incluyen la familia de canales de potasio (canales de K), la familia de canales de sodio (canales de Na), la familia de canales de calcio (canales de Ca), la familia de canales de cloro (canales de Cl) y la familia de canales de acetilcolina. Cada una de estas familias contiene subfamilias y cada subfamilia normalmente contiene canales específicos derivados de genes individuales. Por ejemplo, la familia de los canales de K contiene subfamilias de canales de potasio regulados por voltaje llamados Kv1.x y Kv3.x. La subfamilia Kv1.x contiene los canales Kv1.1, Kv1.2 y Kv1.3, que se corresponden con los productos de genes individuales y así se llaman 'especies'. La clasificación se aplica a las familias de canales de Na, Ca, Cl y a otras familias también. [0215]Ion channels constitute a superfamily of proteins, including the potassium channel family (K channels), the sodium channel family (Na channels), the calcium channel family (Ca channels) , the chloride channel family (Cl channels) and the acetylcholine channel family. Each of these families contains subfamilies and each subfamily typically contains specific channels derived from individual genes. For example, the K channel family contains subfamilies of voltage-gated potassium channels called Kv1.x and Kv3.x. The Kv1.x subfamily contains the channels Kv1.1, Kv1.2 and Kv1.3, which correspond to the products of individual genes and are thus called 'species'. The classification applies to the Na, Ca, Cl channel families and other families as well.

[0216]Los canales de iones también pueden clasificarse según los mecanismos por los que operan los canales. Específicamente, los principales tipos de proteínas de canales de iones se caracterizan por el procedimiento empleado de abrir o cerrar la proteína del canal para tanto permitir como prevenir que iones específicos entren en la proteína del canal y atraviesen una membrana celular bicapa lipídica. Un tipo importante de proteína de canales es la proteína de canales regulados por voltaje que se abre o cierra (regula) en respuesta a cambios en el potencial eléctrico a través de la membrana celular. El canal de sodio regulado por voltaje 1.6 (Nav1.6) es de particular interés como diana terapéutica. Otro tipo de proteína de canales de iones es el canal mecánicamente regulado, para el cual una tensión mecánica sobre la proteína abre o cierra el canal. Todavía otro tipo se llama canal regulado por ligando, que se abre o cierra dependiendo de si un ligando particular se une o no a la proteína. El ligando puede ser tanto un resto extracelular, tal como un neurotransmisor, como un resto intracelular, tal como un ión o nucleótido. [0216]Ion channels can also be classified based on the mechanisms by which the channels operate. Specifically, the major types of ion channel proteins are characterized by the procedure used to open or close the channel protein to both allow and prevent specific ions from entering the channel protein and passing through a lipid bilayer cell membrane. An important type of channel protein is the voltage-gated channel protein that opens or closes (regulates) in response to changes in the electrical potential across the cell membrane. Voltage-gated sodium channel 1.6 (Nav1.6) is of particular interest as a therapeutic target. Another type of ion channel protein is the mechanically gated channel, for which a mechanical stress on the protein opens or closes the channel. Still another type is called a ligand-gated channel, which opens or closes depending on whether or not a particular ligand binds to the protein. The ligand may be either an extracellular moiety, such as a neurotransmitter, or an intracellular moiety, such as an ion or nucleotide.

[0217]Los canales de iones generalmente permiten flujo pasivo de iones hacia un gradiente electroquímico, mientras que las bombas de iones usan ATP para transportar contra un gradiente. Los transportadores acoplados, tanto antiportadores como simportadores, permiten el movimiento de una especie de ión contra su gradiente, accionado por el movimiento descendente de otra especie de ión. [0217]Ion channels generally allow passive flow of ions toward an electrochemical gradient, while ion pumps use ATP to transport against a gradient. Coupled transporters, both antiporters and symporters, allow the movement of one ion species against its gradient, driven by the downward movement of another ion species.

[0218]Uno de los tipos más comunes de proteínas de canales, encontradas en la membrana de casi todas las células animales, permite la permeación específica de iones potasio a través de una membrana celular. En particular, los iones potasio entran rápidamente a través de membranas celulares a proteínas de canales de K+ (hasta 10-8 iones por segundo). Además, las proteínas de canales de potasio tienen la capacidad para distinguir entre iones potasio y otros iones alcalinos metálicos pequeños tales como Li+ o Na+ con gran fidelidad. En particular, los iones potasio son al menos diez mil veces más permanentes que los iones sodio. Las proteínas de los canales de potasio normalmente comprenden cuatro subunidades (normalmente idénticas), así sus dianas de la superficie celular están presentes como tetrámeros, permitiendo la unión tetravalente de MURP. Un tipo de subunidad contiene seis segmentos hidrófobos de longitud (que puede atravesar la membrana), mientras que los otros tipos contienen dos segmentos hidrófobos. [0218]One of the most common types of channel proteins, found in the membrane of almost all animal cells, allows the specific permeation of potassium ions across a cell membrane. In particular, potassium ions enter rapidly through cell membranes to K+ channel proteins (up to 10-8 ions per second). Furthermore, potassium channel proteins have the ability to distinguish between potassium ions and other small alkali metal ions such as Li+ or Na+ with high fidelity. In particular, potassium ions are at least ten thousand times more permanent than sodium ions. Potassium channel proteins typically comprise four subunits (usually identical), thus their cell surface targets are present as tetramers, allowing tetravalent binding of MURP. One type of subunit contains six hydrophobic segments in length (which can span the membrane), while the other types contain two hydrophobic segments.

[0219]Otra familia significativa de canales es el canal de calcio. Los canales de calcio se clasifican generalmente según sus propiedades electrofisiológicas como canales activados por bajo voltaje (LVA) o activados por alto voltaje (HVA). Los canales HVA comprenden al menos tres grupos de canales, conocidos como canales tipo L, N y P/Q. Estos canales se han diferenciado entre sí electrofisiológicamente, además de bioquímicamente, basándose en su farmacología y propiedades de unión a ligando. Por ejemplo, las dihidropiridinas, difenilalquilaminas y piperidinas se unen a la subunidad ai del canal de calcio tipo L y bloquean una proporción de corrientes de calcio HVA en tejido neuronal, que se llaman corrientes de calcio tipo L. Los canales de calcio tipo N son sensibles a conopéptidos omega, pero son relativamente insensibles a compuestos de dihidropiridina tales como nimodipina y nifedipina. Los canales tipo P/Q, por otra parte, son insensibles a dihidropiridinas, pero son sensibles a la toxina de la araña de tela en embudo Aga III<a>. Los canales de calcio tipo R, al igual que los canales tipo L, N, P y Q, se activan por grandes despolarizaciones de membrana, y así se clasifican como canales activados por alto voltaje (HVA). Los canales de tipo R son generalmente insensibles a las dihidropiridinas y conopéptidos omega, pero, al igual que los canales P/Q, L y N, son sensibles a la toxina de la araña de tela en embudo AgaIVA. Estudios de tinción inmunocitoquímica indican que estos canales están localizados en todo el cerebro, particularmente en las estructuras de la línea media profunda (caudado-putamen, tálamo, hipotálamo, amígdala, cerebelo) y en los núcleos del cerebro medio ventral y tronco encefálico. Los canales de calcio sensibles al voltaje neurona! normalmente consisten en una subunidad central ai, una subunidad a<2>/S, una subunidad p y una subunidad de 95 kD. [0219]Another significant family of channels is the calcium channel. Calcium channels are generally classified according to their electrophysiological properties as low-voltage-activated (LVA) or high-voltage-activated (HVA) channels. HVA channels comprise at least three groups of channels, known as type L, N and P/Q channels. These channels have been differentiated from each other electrophysiologically, as well as biochemically, based on their pharmacology and ligand binding properties. For example, dihydropyridines, diphenylalkylamines and piperidines bind to the AI subunit of the L-type calcium channel and block a proportion of HVA calcium currents in neuronal tissue, which are called L-type calcium currents. N-type calcium channels are sensitive to omega conopeptides, but are relatively insensitive to dihydropyridine compounds such as nimodipine and nifedipine. P/Q-type channels, on the other hand, are insensitive to dihydropyridines, but are sensitive to the funnel-web spider toxin Aga III<a>. R-type calcium channels, like L-, N-, P-, and Q-type channels, are activated by large membrane depolarizations, and are thus classified as high-voltage-activated (HVA) channels. R-type channels are generally insensitive to dihydropyridines and omega conopeptides, but, like P/Q, L, and N channels, they are sensitive to the funnel-web spider toxin AgaIVA. Immunocytochemical staining studies indicate that these channels are located throughout the brain, particularly in the deep midline structures (caudate-putamen, thalamus, hypothalamus, amygdala, cerebellum) and in the nuclei of the ventral midbrain and brainstem. Neuron voltage-sensitive calcium channels! They typically consist of a core ai subunit, an a<2>/S subunit, a p subunit, and a 95 kD subunit.

[0220]Ejemplos no limitantes adicionales incluyen Kir (un canal de potasio de rectificación interna), Kv (un canal de potasio regulado por voltaje), Nav (un canal de sodio regulado por voltaje), Cav (un canal de calcio regulado por voltaje), CNG (canal regulado por nucleótidos cíclicos), HCN (canal activado por hiperpolarización), TRP (un canal de potencial receptor transitorio), CIC (un canal de cloruro), CFTR (un regulador de la conductancia transmembrana de fibrosis quística, un canal de cloruro), IP3R (un receptor de trisfosfato de inositol), RYR (un receptor de rianodina). Otros tipos de canales son canales de 2 poros, receptores de glutamato (AMPA, NMDA, KA), M2, conexinas y receptores de bucle Cys. [0220]Additional non-limiting examples include Kir (an internally rectifying potassium channel), Kv (a voltage-gated potassium channel), Nav (a voltage-gated sodium channel), Cav (a voltage-gated calcium channel ), CNG (cyclic nucleotide-gated channel), HCN (hyperpolarization-activated channel), TRP (a transient receptor potential channel), CIC (a chloride channel), CFTR (a cystic fibrosis transmembrane conductance regulator, a chloride channel), IP3R (an inositol trisphosphate receptor), RYR (a ryanodine receptor). Other types of channels are 2-pore channels, glutamate receptors (AMPA, NMDA, KA), M2, connexins, and Cys-loop receptors.

[0221]Un diseño común para proteínas de los canales de iones tales como Kv1.2, Kv3.1, Shaker, TRPC1 y TRPC5 es que tengan seis segmentos que atraviesan la membrana dispuestos del siguiente modo: [0221]A common design for ion channel proteins such as Kv1.2, Kv3.1, Shaker, TRPC1 and TRPC5 is to have six membrane-spanning segments arranged as follows:

extremo N-S1-E1-S2-X1-S3-E2-S4-X2-S5-E3-S6-extremo C N end-S1-E1-S2-X1-S3-E2-S4-X2-S5-E3-S6-C end

[0222]En la que S1-6 son secuencias que atraviesan la membrana, E1-3 son bucles de la superficie extracelular y X1-2 son bucles de la superficie intracelular. El bucle E3 es generalmente el más largo de los tres bucles extracelulares y es hidrófilo de forma que es una buena diana para la unión de fármacos y MURP. La parte que forma los poros de la mayoría de los canales es un complejo multimérico (por ejemplo, tetramérico o raramente pentamérico) de hélices alfa que atraviesa la membrana. Generalmente hay un bucle de poros, que es una región de la proteína que retorna a la membrana para formar el filtro de selectividad que determina qué especie de ión puede entrar. Tales canales se llaman canales de 'poro-bucle'. [0222]Wherein S1-6 are membrane-spanning sequences, E1-3 are extracellular surface loops, and X1-2 are intracellular surface loops. The E3 loop is generally the longest of the three extracellular loops and is hydrophilic so it is a good target for drug and MURP binding. The pore-forming part of most channels is a multimeric (e.g., tetrameric or rarely pentameric) complex of alpha helices that spans the membrane. There is usually a pore loop, which is a region of the protein that returns to the membrane to form the selectivity filter that determines which ion species can enter. Such channels are called 'pore-loop' channels.

[0223]Los canales de iones son dianas valiosas para el diseño de fármacos debido a que participan en una amplia gama de procesos fisiológicos. En seres humanos existen aproximadamente más de trescientas proteínas de los canales de iones, muchas de las cuales participan en enfermedades genéticas. Por ejemplo, la expresión o función anómala de los canales de iones se ha mostrado que produce una amplia gama de enfermedades que incluyen enfermedades cardíacas, neuronales, musculares, respiratorias y metabólicas. Esta sección se basa en canales de iones, pero los mismos conceptos y enfoques son igualmente aplicables a todas las proteínas de la membrana, que incluyen 7TM, 1TM, proteínas G y receptores acoplados a proteína G (GPCR), etc. Algunos de los canales de iones son GPGR. [0223]Ion channels are valuable targets for drug design because they participate in a wide range of physiological processes. In humans there are approximately more than three hundred ion channel proteins, many of which are involved in genetic diseases. For example, abnormal expression or function of ion channels has been shown to result in a wide range of diseases including cardiac, neuronal, muscle, respiratory, and metabolic diseases. This section is based on ion channels, but the same concepts and approaches are equally applicable to all membrane proteins, including 7TM, 1TM, G proteins and G protein-coupled receptors (GPCRs), etc. Some of the ion channels are GPGR.

[0224]Los canales de iones normalmente forman grandes complejos macromoleculares que incluyen subunidades de proteínas accesorias estrechamente unidas y el uso combinatorio de tales subunidades contribuye a la diversidad de los canales de iones. Estas proteínas accesorias también puede ser las dianas de unión de las MURP objeto, microproteínas y toxinas. [0224]Ion channels typically form large macromolecular complexes that include closely linked accessory protein subunits, and the combinatorial use of such subunits contributes to the diversity of ion channels. These accessory proteins may also be the binding targets of the target MURPs, microproteins and toxins.

[0225]Las MURP objeto pueden diseñarse para unirse a cualquiera de los canales conocidos en la técnica y a aquellos específicamente ejemplificados en el presente documento. Las MURP que presentan una capacidad de unión a canales de iones deseada (que engloba especificidad y avidez) pueden seleccionarse por cualquier técnica recombinante y bioquímica (por ejemplo, expresión y visualización) conocida en la técnica. Por ejemplo, las MURP pueden visualizarse por un paquete genético que incluye, pero no se limita a, fagos y esporas, y someterse a inmunopurificación contra membranas celulares intactas, o preferentemente células intactas tales como células de mamífero completas. Para eliminar el fago que se unen a las otras moléculas de la superficie celular no diana, el enfoque convencional era realizar inmunopurificación de sustracción contra líneas celulares similares que tenían un nivel bajo o no detectable del receptor diana. Sin embargo, Popkov y col. (J. Immunol. Methods 291:137-151 (2004)) mostraron que tipos de células relacionados no son ideales para la sustracción debido a que generalmente tienen un nivel reducido, pero todavía significativo, de la diana sobre su superficie, que reduce el número de clones de fago deseados. Este problema se produce incluso cuando se inmunopurifica sobre células que han sido transfectadas con el gen que codifica la diana, seguido de selección/sustracción negativa sobre la misma línea celular que no se transfectó, especialmente si el gen diana nativo no estaba inactivado. En su lugar, Popkov y col. mostraron que la selección o inmunopurificación por sustracción negativa funciona mucho mejor si se realiza con un exceso de las mismas células que se usan para inmunopurificación normal (selección positiva), excepto que la diana se ha bloqueado ahora con un inhibidor específico para diana de alta afinidad tal como una molécula pequeña, péptido o un anticuerpo para la diana, que hace que el sitio activo no esté disponible. Este procedimiento se llama “selección negativa con células enmascaradas por epítope”, que es particularmente útil en seleccionar MURP objeto con una capacidad de unión a canales de iones deseada. [0225]The subject MURPs may be designed to bind to any of the channels known in the art and those specifically exemplified herein. MURPs exhibiting a desired ion channel binding capacity (encompassing specificity and avidity) can be selected by any recombinant and biochemical techniques (e.g., expression and display) known in the art. For example, MURPs can be displayed by a genetic package including, but not limited to, phages and spores, and subjected to immunopurification against intact cell membranes, or preferably intact cells such as whole mammalian cells. To eliminate phage binding to other non-target cell surface molecules, the conventional approach was to perform subtraction immunopurification against similar cell lines that had a low or no detectable level of the target receptor. However, Popkov et al. (J. Immunol. Methods 291:137-151 (2004)) showed that related cell types are not ideal for subtraction because they generally have a reduced, but still significant, level of the target on their surface, which reduces the number of desired phage clones. This problem occurs even when immunopurifying on cells that have been transfected with the gene encoding the target, followed by negative selection/subtraction on the same cell line that was not transfected, especially if the native target gene was not inactivated. Instead, Popkov et al. showed that negative subtraction selection or immunopurification works much better if performed with an excess of the same cells used for normal immunopurification (positive selection), except that the target has now been blocked with a high-affinity target-specific inhibitor. such as a small molecule, peptide or an antibody to the target, which makes the active site unavailable. This procedure is called “negative selection with epitope-masked cells,” which is particularly useful in selecting MURP targets with a desired ion channel binding capacity.

[0226]En el presente documento también se desvelan microproteínas, y particularmente microproteínas que presentan capacidad de unión hacia al menos una familia de canales de iones. En el presente documento también se desvela un paquete genético que visualiza tales microproteínas. Ejemplos no limitantes de canales de iones a los que las microproteínas objeto se unen son canales de sodio, potasio, calcio, acetilcolina y cloro. Son de particular interés aquellas microproteínas y los paquetes genéticos que visualizan tales microproteínas, que presentan capacidad de unión hacia dianas nativas. Las dianas nativas son generalmente moléculas o fragmentos naturales, derivados de los mismos de los que se sabe que la microproteína se une, incluyendo normalmente aquellas dianas de unión conocidas de las que se ha informado en la bibliografía. [0226] Microproteins are also disclosed herein, and particularly microproteins that have binding capacity towards at least one family of ion channels. A genetic package that visualizes such microproteins is also disclosed in the present document. Non-limiting examples of ion channels to which the target microproteins bind are sodium, potassium, calcium, acetylcholine and chloride channels. Of particular interest are those microproteins and the genetic packages that display such microproteins, which have binding capacity towards native targets. Native targets are generally natural molecules or fragments derived therefrom that the microprotein is known to bind, typically including those known binding targets that have been reported in the literature.

[0227]En el presente documento también se desvela un paquete genético que visualiza una microproteína de unión a canales de iones que ha sido modificada. La microproteína modificada puede (a) unirse a una familia diferente de canal con respecto a la microproteína sin modificar correspondiente; (b) unirse a una subfamilia diferente de la misma familia del canal con respecto a la microproteína sin modificar correspondiente; (c) unirse a una especie diferente de la misma subfamilia de canal con respecto a la microproteína sin modificar correspondiente; (d) la microproteína se une a un sitio diferente sobre el mismo canal con respecto a la microproteína sin modificar correspondiente; y/o (e) unirse al mismo sitio del mismo canal, pero da un efecto biológico diferente con respecto a la microproteína sin modificar correspondiente. [0227] Also disclosed herein is a genetic package that displays an ion channel binding microprotein that has been modified. The modified microprotein may (a) bind to a different family of channel relative to the corresponding unmodified microprotein; (b) binding to a different subfamily of the same channel family relative to the corresponding unmodified microprotein; (c) binding to a different species of the same channel subfamily with respect to the corresponding unmodified microprotein; (d) the microprotein binds to a different site on the same channel relative to the corresponding unmodified microprotein; and/or (e) bind to the same site of the same channel, but give a different biological effect with respect to the corresponding unmodified microprotein.

[0228]La Figura 22 y 46 muestran cómo los dominios de microproteína o toxinas que cada uno se unen a diferentes sitios del mismo canal de iones pueden combinarse en una única proteína. Los dos sitios de unión en los que se unen estas dos microproteínas pueden estar sobre dos canales de familias diferentes, dos canales de la misma familia, pero una subfamilia diferente, dos canales de la misma subfamilia, pero una especie diferente (producto génico), o dos sitios de unión diferentes sobre el mismo canal (especie) o pueden unirse (simultáneamente o no) al mismo sitio de unión sobre el mismo canal (especie), ya que los canales son multiméricos. Los módulos y dominios de unión que se unen a sitios sobre los canales pueden ser dominios de microproteína (natural o no natural, que contienen 2 a 8 disulfuros), péptidos de un disulfuro, o péptidos lineales. Estos módulos pueden seleccionarse independientemente y combinarse, o pueden seleccionarse de una biblioteca para unirse en presencia de un módulo de unión activo fijo. En el último caso, la biblioteca de visualización visualizaría múltiples módulos de que los que uno contendría una biblioteca de variantes. Un objetivo típico es seleccionar un dímero de esta biblioteca que tiene una mayor afinidad que el monómero activo que era el punto de partida. [0228]Figure 22 and 46 show how microprotein or toxin domains that each bind to different sites of the same ion channel can be combined into a single protein. The two binding sites where these two microproteins bind can be on two channels from different families, two channels from the same family, but a different subfamily, two channels from the same subfamily, but a different species (gene product), o two different binding sites on the same channel (species) or they can bind (simultaneously or not) to the same binding site on the same channel (species), since the channels are multimeric. Binding modules and domains that bind to sites on the channels can be microprotein domains (natural or non-natural, containing 2 to 8 disulfides), one-disulfide peptides, or linear peptides. These modules can be selected independently and combined, or they can be selected from a library for joining in the presence of a fixed active joining module. In the latter case, the display library would display multiple modules of which one would contain a variant library. A typical goal is to select a dimer from this library that has a higher affinity than the active monomer that was the starting point.

[0229]En el presente documento también se desvela una proteína que comprende una pluralidad de dominios de unión a canales de iones, en la que los dominios individuales son dominios de microproteína que han sido modificados de forma que. [0229] Also disclosed herein is a protein comprising a plurality of ion channel binding domains, wherein the individual domains are microprotein domains that have been modified such that.

(a) los dominios de microproteína se unen a una familia diferente de canal con respecto a los dominios de microproteína sin modificar correspondientes; (b) los dominios de microproteína se unen a una subfamilia diferente de la misma familia del canal con respecto a los dominios de microproteína sin modificar correspondientes; (c) los dominios de microproteína se unen a una especie diferente de la misma subfamilia con respecto a los dominios de microproteína sin modificar correspondientes; (d) los dominios de microproteína se unen a un sitio diferente sobre el mismo canal con respecto a los dominios de microproteína sin modificar correspondientes; (e) los dominios de microproteína se unen al mismo sitio del mismo canal, pero dan un efecto biológico diferente con respecto a los dominios de microproteína sin modificar correspondientes; y/o (f) los dominios de microproteína se unen al mismo sitio del mismo canal y dan el mismo efecto biológico con respecto a los dominios de microproteína sin modificar correspondientes. Si se desea, los dominios de microproteína pueden comprender secuencias naturales o no naturales. Los dominios individuales pueden ligarse juntos mediante un ligador heterólogo. Los dominios individuales de microproteína pueden unirse a la misma familia de canales o diferente, la misma subfamilia de canales o diferente, la misma especie o diferente de la misma subfamilia, el mismo sitio o diferente sobre el mismo canal. (a) the microprotein domains bind a different channel family relative to the corresponding unmodified microprotein domains; (b) the microprotein domains bind to a different subfamily of the same channel family relative to the corresponding unmodified microprotein domains; (c) the microprotein domains bind to a different species of the same subfamily relative to the corresponding unmodified microprotein domains; (d) the microprotein domains bind to a different site on the same channel relative to the corresponding unmodified microprotein domains; (e) the microprotein domains bind to the same site of the same channel, but give a different biological effect relative to the corresponding unmodified microprotein domains; and/or (f) the microprotein domains bind to the same site of the same channel and give the same biological effect with respect to the corresponding unmodified microprotein domains. If desired, the microprotein domains may comprise natural or non-natural sequences. The individual domains can be linked together by a heterologous linker. Individual microprotein domains may bind to the same or different channel family, the same or different channel subfamily, the same or different species of the same subfamily, the same or different site on the same channel.

[0230]Las microproteínas objeto pueden ser una toxina. Preferentemente, la toxina retiene en parte o por completo su espectro de toxicidad. En particular, animales venenosos, tales como serpientes, tienen una gama de especies de presa e intrusas y las toxinas de veneno se diferencian en la actividad para los diferentes receptores de las diferentes especies. El veneno consiste en un gran número de toxinas relacionadas y sin relacionar, teniendo cada toxina un “espectro de actividad”, que puede definirse como todos los receptores de todas las especies sobre las que esa toxina tiene actividad medible. Todas las dianas en el 'espectro de actividad' se consideran “dianas nativas” y esto incluye cualquier diana humana contra la que la toxina es activa. La(s) diana(s) nativa(s) de una microproteína o toxina incluyen todas las dianas de las que se informa en la bibliografía que la toxina inhibe. Cuanto mayor sea la afinidad o actividad sobre una diana, más probable será que esa diana sea la diana nativa natural, pero es común para toxinas que actúan sobre múltiples dianas dentro de la misma especie. La(s) diana(s) nativa(s) puede(n) ser receptor(es) humano(s) o no humano(s) contra los que la toxina es activa. [0230]The target microproteins may be a toxin. Preferably, the toxin retains part or all of its toxicity spectrum. In particular, venomous animals, such as snakes, have a range of prey and intruder species and venom toxins differ in activity for different receptors of different species. Venom consists of a large number of related and unrelated toxins, each toxin having a “spectrum of activity,” which can be defined as all the receptors of all the species on which that toxin has measurable activity. All targets in the 'activity spectrum' are considered “native targets” and this includes any human target against which the toxin is active. The native target(s) of a microprotein or toxin include all targets reported to be inhibited by the toxin in the literature. The higher the affinity or activity on a target, the more likely that target is the natural native target, but it is common for toxins that act on multiple targets within the same species. The native target(s) may be human or non-human receptor(s) against which the toxin is active.

[0231]Para que la toxina retenga la capacidad para unirse a células después de la fusión con el vector de visualización, puede desearse probar tanto el extremo N como el extremo C para la fusión y probar una variedad de sitios de fusión (es decir, 0, 1, 2, 3, 4, 5, 6 aminoácidos antes de la primera cisteína o después de la última cisteína del dominio de toxina, si el dominio de toxina es un dominio que contiene cisteína) usando un enfoque de biblioteca de ADN sintético, que preferentemente codifica una biblioteca de ligadores ricos en glicina, que forman la cadena de aminoácidos más pequeña, no tienen carga y lo más probablemente es que sean compatibles con la unión de la toxina a la diana. Como el grupo amino del extremo N y los grupos carboxilo del extremo C pueden participar en la unión a diana, la biblioteca debe contener una lisina o una arginina para imitar el grupo amino positivamente cargado (o fusiones con el extremo N de la toxina) y un glutamato o un aspartato para imitar el grupo carboxilo negativamente cargado (para fusiones con el extremo C de la toxina). [0231]For the toxin to retain the ability to bind to cells after fusion with the display vector, it may be desired to test both the N-terminus and the C-terminus for fusion and to test a variety of fusion sites (i.e. 0, 1, 2, 3, 4, 5, 6 amino acids before the first cysteine or after the last cysteine of the toxin domain, if the toxin domain is a cysteine-containing domain) using a synthetic DNA library approach , which preferentially encodes a library of glycine-rich linkers, which form the smallest amino acid chain, are uncharged, and are most likely compatible with the binding of the toxin to the target. Since the N-terminal amino group and C-terminal carboxyl groups can participate in target binding, the library should contain a lysine or an arginine to mimic the positively charged amino group (or fusions to the N-terminus of the toxin) and a glutamate or an aspartate to mimic the negatively charged carboxyl group (for fusions to the C terminus of the toxin).

[0232]El (Los) inhibidor(s) que se usan para bloquear la diana durante la selección negativa pueden ser moléculas pequeñas, péptidos o proteínas, y naturales o no naturales. Además de la simple sustracción, la elección de la mezcla de inhibidores es una herramienta valiosa para controlar la especificidad de los inhibidores de los canales de iones que están siendo diseñados. Debido a que hay más de trescientos canales de iones en total, con especificidades parcialmente solapantes y similitudes de secuencia, y múltiples sitios moduladores por canal, teniendo cada uno un efecto diferente, el requisito de especificidad puede ser complejo. [0232]The inhibitor(s) used to block the target during negative selection can be small molecules, peptides or proteins, and natural or unnatural. In addition to simple subtraction, the choice of inhibitor mixture is a valuable tool to control the specificity of the ion channel inhibitors being designed. Because there are more than three hundred ion channels in total, with partially overlapping specificities and sequence similarities, and multiple modulatory sites per channel, each having a different effect, the specificity requirement can be complex.

[0233]Si se modifica la actividad de una toxina, o si se combinan dos toxinas diferentes en una única proteína, las dos toxinas pueden unirse al mismo canal en el mismo sitio y tener el mismo efecto fisiológico, o las dos toxinas pueden unirse al mismo canal en el mismo sitio y tener un efecto fisiológico diferente, o las dos toxinas pueden unirse al mismo canal en un sitio diferente, o las dos toxinas pueden unirse a diferentes canales que pertenecen a la misma subfamilia (es decir, Kv1.3 y Kv1.2; que significa producto de un gen o 'especie' diferente), o las dos toxinas pueden unirse a diferentes canales que pertenecen a la misma familia (es decir, ambos son canales de K), o las dos toxinas pueden unirse a canales que pertenecen a familias diferentes (es decir, canales de K frente a canales de Na). [0233]If the activity of a toxin is modified, or if two different toxins are combined into a single protein, the two toxins can bind to the same channel at the same site and have the same physiological effect, or the two toxins can bind to the same channel at the same site and have a different physiological effect, or the two toxins may bind to the same channel at a different site, or the two toxins may bind to different channels that belong to the same subfamily (i.e., Kv1.3 and Kv1.2; meaning product of a different gene or 'species'), or the two toxins can bind to different channels that belong to the same family (i.e., they are both K channels), or the two toxins can bind to channels that belong to different families (i.e., K channels vs. Na channels).

[0234]Los canales de iones tienen normalmente muchos segmentos transmembrana (24 para canales de sodio) y así ofrecen varios sitios de unión diferentes, no competitivos y no solapantes para que los moduladores alteren la actividad del canal de diferentes formas. Un enfoque es crear ligantes para un sitio sobre el mismo canal de iones de ligantes existentes para un sitio diferente, aunque estos sitios no estén relacionados. Para lograr esto, la toxina existente puede usarse como agente que elige diana para una biblioteca de proteínas de 1, 2, 3 ó 4 disulfuros que están separados de la toxina que elige diana por un ligador flexible de 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40 ó 50 aminoácidos. Es útil si la afinidad del agente que elige diana no es demasiada alta, de manera que la afinidad de la nueva biblioteca pueda tener una contribución significativa a la afinidad global. Otro enfoque es crear nuevos moduladores para canales de moduladores existentes para otros canales que están relacionados en secuencia o en estructura. La familia de las conotoxinas, por ejemplo, contiene moduladores relacionados con secuencia y relacionados con estructura para canales de Ca, K, Na y receptores de acetilcolina nicotínicos. Parece factible convertir un modulador de canales de K en un modulador de canales de Na usando una biblioteca de derivados de conotoxina, o viceversa. Por ejemplo, las conotoxinas kappa inhiben canales de K, las conotoxinas mu y las conotoxinas delta inhiben canales de Na, las conotoxinas omega inhiben canales de Ca y las conotoxinas alfa inhiben receptores de acetilcolina. [0234]Ion channels typically have many transmembrane segments (24 for sodium channels) and thus offer several different, non-competitive, non-overlapping binding sites for modulators to alter channel activity in different ways. One approach is to create binders for one site on the same ion channel as existing binders for a different site, even if these sites are unrelated. To achieve this, the existing toxin can be used as a targeting agent for a library of 1, 2, 3, or 4 disulfide proteins that are separated from the targeting toxin by a flexible 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40 or 50 amino acids. It is useful if the affinity of the targeting agent is not too high, so that the affinity of the new library can have a significant contribution to the overall affinity. Another approach is to create new modulators for channels from existing modulators for other channels that are related in sequence or structure. The conotoxin family, for example, contains sequence-related and structure-related modulators for Ca, K, Na channels, and nicotinic acetylcholine receptors. It seems feasible to convert a K channel modulator to a Na channel modulator using a library of conotoxin derivatives, or vice versa. For example, kappa conotoxins inhibit K channels, mu conotoxins and delta conotoxins inhibit Na channels, omega conotoxins inhibit Ca channels, and alpha conotoxins inhibit acetylcholine receptors.

[0235]La proximidad de sitios de unión diferentes, cada uno con un efecto diferente sobre la actividad de los canales, del mismo canal de iones hace atractivo ligar los inhibidores usando ligadores flexibles, que crean un único inhibidor con dos dominios, cada unión en un sitio diferente, o una única proteína con dos dominios que se unen en copias diferentes del mismo sitio, dando una interacción de alta afinidad bivalente (avidez). Este enfoque no ha sido tomado por toxinas naturales, supuestamente debido a que deben actuar rápidamente y así permanecer pequeñas con el fin de tener máxima penetración en el tejido, pero para la farmacéutica la velocidad de acción es menos importante, haciendo esto un enfoque atractivo. [0235]The proximity of different binding sites, each with a different effect on channel activity, of the same ion channel makes it attractive to ligate inhibitors using flexible linkers, which create a single inhibitor with two domains, each binding in a different site, or a single protein with two domains that bind on different copies of the same site, giving a high-affinity bivalent interaction (avidity). This approach has not been taken for natural toxins, supposedly because they must act quickly and thus remain small in order to have maximum tissue penetration, but for pharmaceuticals the speed of action is less important, making this an attractive approach.

[0236]Así pueden crearse bibliotecas combinatorias de toxinas/moduladores diméricos, triméricos, tetraméricos o multiméricos, cada uno nativo o modificado, y cribar directamente estas bibliotecas al nivel de proteínas o inmunopurificar estas bibliotecas usando paquetes genéticos para afinidad mejorada (avidez, si se produce la unión simultáneamente en múltiples sitios) y luego caracterizar la especificidad y actividad de tales clones multiméricos por expresión de proteínas y purificación, seguido de ensayos de actividad basados en células, que incluyen ensayos de fijación de parches. Los módulos individuales pueden inmunopurificarse y seleccionarse por separado, en aislamiento entre sí, o pueden diseñarse en presencia de los otros, de forma que el nuevo dominio se añade a un sistema de visualización como una biblioteca que también contiene una copia activa fija que sirve de elemento que elige diana para la biblioteca y solo clones que son significativamente mejores que el monómero activo fijado se seleccionan y se caracterizan. [0236]Combinatorial libraries of dimeric, trimeric, tetrameric or multimeric toxins/modulators, each native or modified, can thus be created and directly screen these libraries at the protein level or immunopurify these libraries using gene packages for improved affinity (avidity, if produces binding simultaneously at multiple sites) and then characterize the specificity and activity of such multimeric clones by protein expression and purification, followed by cell-based activity assays, including patch binding assays. Individual modules can be immunopurified and selected separately, in isolation from each other, or they can be engineered in the presence of each other, so that the new domain is added to a display system as a library that also contains a fixed active copy that serves as targeting element for the library and only clones that are significantly better than the fixed active monomer are selected and characterized.

[0237]Las Figs. 46 y 47 muestran algunos de los derivados monoméricos que pueden prepararse a partir de proteínas nativas (naturales), y algunos de los multímeros que pueden prepararse para unirse a múltiples sitios de unión diferentes de la diana. Los ligadores se muestran como PEGr rico en glicina, pero los ligadores podrían ser cualquier secuencia y también podrían optimizarse usando bibliotecas moleculares, seguido de inmunopurificación. Pueden crearse bibliotecas dentro de la propia toxina nativa activa usando una variedad de estrategias de mutagénesis como se ha descrito anteriormente, o pueden extender el área existente de contacto con la diana creando bibliotecas sobre el lado del extremo N o extremo C de las toxinas activas, esperando crear contactos adicionales con la diana. Tales bibliotecas pueden basarse en toxinas existentes con actividad conocida para ese sitio, o pueden ser o bibliotecas de 1, 2, 3, 4 disulfuros sin tratamiento previo basándose en andamiajes de microproteína sin relacionar. Estos elementos de contacto adicionales pueden añadirse a uno o ambos lados de los dominios activos, y pueden ser directamente adyacentes al dominio modulador existente o pueden separarse del mismo por ligadores flexibles. El multímero inicial o el multímero mejorado final puede ser un homomultímero o un heteromultímero, basándose en similitud de secuencias de los dominios o basándose en la especificidad diana de los dominios del multímero. Así, los monómeros que comprenden el multímero pueden unirse a los mismos sitios diana, pero tener las mismas secuencias o diferentes. Con 10-100 toxinas nativas diferentes que son conocidas por unirse a cada familia de canales, y con 2, 3, 4, 5 ó 6 dominios por clon, pueden crearse las bibliotecas de visualización con una enorme diversidad combinatoria, aunque solo una usa secuencias de toxina nativa. La mutagénesis sintética de bajo nivel basada en similitud de aminoácidos o en tasas de sustitución filogenética dentro de la familia puede usarse para crear bibliotecas de alta calidad de mutantes, de las cuales se espera que una fracción muy alta retenga la función, con una alta probabilidad de función potenciada en algunas de las propiedades de interés. [0237]Figs. 46 and 47 show some of the monomeric derivatives that can be prepared from native (natural) proteins, and some of the multimers that can be prepared to bind to multiple different binding sites on the target. The linkers are shown as glycine-rich PEGr, but the linkers could be any sequence and could also be optimized using molecular libraries, followed by immunopurification. Libraries can be created within the active native toxin itself using a variety of mutagenesis strategies as described above, or they can extend the existing area of contact with the target by creating libraries on the N-terminal or C-terminal side of the active toxins, hoping to create additional contacts with the target. Such libraries may be based on existing toxins with known activity for that site, or may be naive 1, 2, 3, 4 disulfide libraries based on unrelated microprotein scaffolds. These additional contact elements can be added to one or both sides of the active domains, and can be directly adjacent to the existing modulatory domain or can be separated from it by flexible linkers. The initial multimer or the final improved multimer may be a homomultimer or a heteromultimer, based on sequence similarity of the domains or based on the target specificity of the domains of the multimer. Thus, the monomers comprising the multimer may bind to the same target sites, but have the same or different sequences. With 10-100 different native toxins that are known to bind to each channel family, and with 2, 3, 4, 5 or 6 domains per clone, display libraries can be created with enormous combinatorial diversity, although only one uses sequences of native toxin. Low-level synthetic mutagenesis based on amino acid similarity or phylogenetic substitution rates within the family can be used to create high-quality libraries of mutants, of which a very high fraction is expected to retain function, with a high probability enhanced function in some of the properties of interest.

[0238]La capacidad de unión de las MURP objeto, microproteínas o toxinas a un canal de iones dado puede medirse en términos del coeficiente de Hill. El coeficiente de Hill indica la estequiometría de la interacción de unión. Un coeficiente de Hill de 2 indica que 2 inhibidores se unen a cada canal. También puede evaluarse la modulación alostérica, que es la modulación de la actividad en un sitio producida por la unión en un sitio remoto. [0238]The binding capacity of target MURPs, microproteins or toxins to a given ion channel can be measured in terms of the Hill coefficient. The Hill coefficient indicates the stoichiometry of the binding interaction. A Hill coefficient of 2 indicates that 2 inhibitors bind to each channel. Allosteric modulation, which is the modulation of activity at one site produced by binding at a remote site, can also be assessed.

[0239]La actividad biológica o efecto de un canal de iones y la capacidad de las MURP objeto, microproteínas o toxinas para regular una actividad de canal de iones puede evaluarse usando una variedad de ensayosin vitroein vivo.Por ejemplo, en la técnica están disponibles procedimientos para medir voltaje, medir corriente, medir potencial de membrana, medir flujo de iones, por ejemplo, potasio o rubidio, medir concentración de iones, medir regulación, medir segundos mensajeros y niveles de transcripción, y usar, por ejemplo, colorantes sensibles al voltaje, trazadores radiactivos y electrofisiología por fijación de parches. En particular, tales ensayos pueden usarse para probar microproteínas y toxinas que pueden inhibir o activar un canal de iones de interés. [0239]The biological activity or effect of an ion channel and the ability of the target MURP, microproteins or toxins to regulate an ion channel activity can be evaluated using a variety of in vitro and in vivo assays. For example, available in the art procedures for measuring voltage, measuring current, measuring membrane potential, measuring ion flux, for example, potassium or rubidium, measuring ion concentration, measuring regulation, measuring second messengers and transcription levels, and using, for example, color-sensitive dyes voltage, radioactive tracers and patch fixation electrophysiology. In particular, such assays can be used to test microproteins and toxins that can inhibit or activate an ion channel of interest.

[0240]Específicamente, pueden probarse inhibidores o activadores de canales de potencial en comparación con un control adecuado para examinar el grado de modulación. Las muestras de control también puede ser muestras sin tratar con los activadores o inhibidores candidatos. La inhibición está presente cuando un valor de actividad de canales de iones dado con respecto al control es aproximadamente el 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, o incluso menos. La CI<50>es una unidad comúnmente usada (la concentración de inhibidor que reduce la actividad del canal de iones al 50%) para determinar el efecto inhibidor. Similar a CI<90>. La activación de canales se logra cuando un valor de actividad de canal de iones dado con respecto al control aumenta el 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 500%, o más. [0240]Specifically, potential channel inhibitors or activators can be tested in comparison to an appropriate control to examine the degree of modulation. Control samples may also be samples untreated with the candidate activators or inhibitors. Inhibition is present when a given ion channel activity value relative to the control is approximately 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, or even less. The IC<50> is a commonly used unit (the concentration of inhibitor that reduces ion channel activity by 50%) to determine the inhibitory effect. Similar to IQ<90>. Channel activation is achieved when a given ion channel activity value relative to control increases by 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 200%, 500%, or more.

[0241]Pueden evaluarse cambios en el flujo de iones determinando cambios en la polarización (es decir, potencial eléctrico) de la célula o membrana que expresa el canal de interés. Por ejemplo, un procedimiento es determinar cambios en la polarización celular midiendo cambios en la corriente (midiendo así cambios en la polarización) con técnicas de fijación de voltaje y fijación de parches, por ejemplo, el modo “unido a célula”, el modo “al revés” y el modo “célula completa” (véase, por ejemplo, Ackerman y col., New Engl. J. Med. 336:1575-1595 (1997)). Las corrientes de célula completa se determinan convenientemente usando la metodología convencional (véase, por ejemplo, Hamil y col., Pflugers. Archiv. 391:85 (1981). Otros ensayos conocidos incluyen: ensayos de flujo de rubidio radiomacado y ensayos de fluorescencia usando colorantes sensibles al voltaje (véase, por ejemplo, Vestergarrd-Bogind y col., J. Membrane Biol. 88:67-75 (1988); Daniel y col., J. Pharmacol. Meth. 25:185-193 (1991); Holevinsky y col., J. Membrane Biology 137:59-70 (1994)). [0241]Changes in ion flux can be assessed by determining changes in the polarization (i.e., electrical potential) of the cell or membrane expressing the channel of interest. For example, one procedure is to determine changes in cell polarization by measuring changes in current (thus measuring changes in polarization) with voltage clamping and patch clamping techniques, for example, the “cell-attached” mode, the “ the other way around” and the “whole cell” mode (see, for example, Ackerman et al., New Engl. J. Med. 336:1575-1595 (1997)). Whole cell currents are conveniently determined using conventional methodology (see, for example, Hamil et al., Pflugers. Archiv. 391:85 (1981). Other known assays include: radiolabeled rubidium flux assays and fluorescence assays using voltage-sensitive dyes (see, for example, Vestergarrd-Bogind et al., J. Membrane Biol. 88:67-75 (1988); Daniel et al., J. Pharmacol. Meth. 25:185-193 (1991) ; Holevinsky et al., J. Membrane Biology 137:59-70 (1994)).

[0242]Los efectos de las MURP candidatas, microproteínas o toxinas sobre la función de un canal de interés pueden medirse por cambios en las corrientes eléctricas o flujo iónico o por las consecuencias de los cambios en las corrientes y flujo. Puede variarse el efecto aguas abajo de las proteínas candidatas sobre el flujo de iones. Por consiguiente, cualquier cambio fisiológico adecuado puede usarse para evaluar la influencia de una proteína candidata sobre los canales de prueba. Los efectos de la proteína candidata pueden medirse por un ensayo de unión a toxina. Si las consecuencias funcionales se determinan usando células o animales intactos, también puede medirse una variedad de efectos tales como liberación de transmisor (por ejemplo, dopamina), liberación de hormona (por ejemplo, insulina), cambios transcripcionales a tanto marcadores genéticos conocidos como no caracterizados (por ejemplo, transferencias Northern), cambios del volumen de células (por ejemplo, en glóbulos rojos), inmunorrespuestas (por ejemplo, activación de linfocitos T), cambios en el metabolismo de las células tal como crecimiento celular o cambios de pH, y cambios en los segundos mensajeros intracelulares tales como Ca2+. [0242]The effects of candidate MURPs, microproteins or toxins on the function of a channel of interest can be measured by changes in electrical currents or ion flow or by the consequences of changes in currents and flow. The downstream effect of candidate proteins on ion flux can be varied. Therefore, any suitable physiological change can be used to evaluate the influence of a candidate protein on the test channels. The effects of the candidate protein can be measured by a toxin binding assay. If functional consequences are determined using intact cells or animals, a variety of effects can also be measured such as transmitter release (e.g. dopamine), hormone release (e.g. insulin), transcriptional changes to both known and unknown genetic markers. characterized (e.g., Northern blots), cell volume changes (e.g., in red blood cells), immune responses (e.g., T cell activation), changes in cell metabolism such as cell growth or pH changes, and changes in intracellular second messengers such as Ca2+.

[0243]Otras actividades biológicas clave de los canales de iones son selectividad por iones y regulación. La selectividad es la capacidad de algunos canales para discriminar entre especies de iones, permitiendo que algunos pasen al poro mientras que excluyen otros. La regulación es la transición entre estados abiertos y cerrados. Puede evaluarse por cualquiera de los procedimientos conocidos en la técnica o desvelados en el presente documento[0244]Todavía otra propiedad biológica por la que la MURP objeto, microproteína o toxina puede seleccionarse es la frecuencia de apertura y cierre de los canales diana, llamado frecuencia de regulación. La frecuencia de regulación está influida por el voltaje (en canales regulados por voltaje, que se abren o se cierran por cambios en el voltaje de la membrana) y la unión a ligando. La tasa de transición entre estados abiertos y cerrados es normalmente <10 microsegundos, pero puede aumentarse o disminuirse por otras moléculas. La tasa de flujo (corriente) en el poro cuando se abre es del orden de 10e7 iones por segundo para canales de iones y mucho menos para intercambiadores acoplados. Tras la apertura, algunos canales regulados por voltaje entran en un estado no conductor inactivado en el que son resistentes a la despolarización. [0243]Other key biological activities of ion channels are ion selectivity and regulation. Selectivity is the ability of some channels to discriminate between ion species, allowing some to pass into the pore while excluding others. Regulation is the transition between open and closed states. It can be evaluated by any of the procedures known in the art or disclosed herein[0244]Still another biological property by which the target MURP, microprotein or toxin can be selected is the frequency of opening and closing of the target channels, called frequency of regulation. The regulation frequency is influenced by voltage (in voltage-gated channels, which open or close by changes in membrane voltage) and ligand binding. The transition rate between open and closed states is typically <10 microseconds, but can be increased or decreased by other molecules. The flow rate (current) in the pore when it opens is on the order of 10e7 ions per second for ion channels and much less for coupled exchangers. Upon opening, some voltage-gated channels enter an inactivated nonconducting state in which they are resistant to depolarization.

EJEMPLOSEXAMPLES

Ejemplo: Diseño de un oliaómero de alicina-serina basado en secuencias humanasExample: Design of an allicin-serine oliaomer based on human sequences

[0245]Se buscó en la base de datos del genoma humano secuencias que eran ricas en glicina. Se identificaron tres secuencias como secuencias de donante adecuadas como se muestra en la Tabla X. [0245]The human genome database was searched for sequences that were rich in glycine. Three sequences were identified as suitable donor sequences as shown in Table X.

Tabla X: Secuencias de donante para el diseño A de GRS. Table X: Donor sequences for GRS design A.

Acceso Secuencias Aminoácido ProteínaAccess Protein Amino Acid Sequences

NP_009060 GGGSGGGSGSGGGG 486-499 proteína de dedo de cinc NP_009060 GGGGSGGGSGSGGGG 486-499 zinc finger protein

Q9Y2X9 GSGSGGGGSGG 19-31 proteína de dedo de cinc CAG38801 SGGGGSGGGSGSG 7-19 MAP2K4 Q9Y2X9 GSGSGGGGSGG 19-31 zinc finger protein CAG38801 SGGGGSGGGSGSG 7-19 MAP2K4

[0246]Basándose en las secuencias en la Tabla X, los presentes inventores diseñaron una secuencia rica en glicina que contenía múltiples repeticiones del péptido A con la secuencia GGGSGSGGGGS. El péptido A puede oligomerizarse para formar estructuras con la fórmula (GGGSGSGGGGS)n en la que n está entre 2 y 40. La Figura 5 muestra que todas las posibles subsecuencias 9-meras en oligómeros del péptido A están contenidas en al menos una de las proteínas enumeradas en la Tabla 3. Así, los oligómeros del péptido A no contienen epítopes de linfocitos T humanos. La inspección de la Figura 5 revela que GRS basada en oligómeros de péptido A puede empezar y terminar en cualquiera de las posiciones del péptido A. [0246]Based on the sequences in Table Peptide A can oligomerize to form structures with the formula (GGGSGSGGGGS)n in which n is between 2 and 40. Figure 5 shows that all possible 9-mer subsequences in oligomers of peptide A are contained in at least one of the proteins listed in Table 3. Thus, peptide A oligomers do not contain human T cell epitopes. Inspection of Figure 5 reveals that GRS based on peptide A oligomers can start and end at any of the positions of peptide A.

Ejemplo: Diseño de un oligómero de glicina-prolina basado en secuencias humanasExample: Design of a glycine-proline oligomer based on human sequences

[0247]Se diseñaron secuencias ricas en glicina basándose en la secuencia GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG que representa los aminoácidos 146-182 del dominio POU de clase 4 humano con número de acceso NP_006228. La Figura 6 ilustra que los oligómeros del péptido B con la secuencia GGGGGPGGGGP pueden utilizarse como GRS. Todas las subsecuencias 9-meras que están contenidas en péptidos con la secuencia (GGGGGPGGGGP)n también están contenidas en la secuencia del dominio POU. Así, tales secuencias oligoméricas no contienen epítopes de linfocitos T. [0247]Glycine-rich sequences were designed based on the sequence GPGGGGGPGGGGGPGGGGPGGGGGGGPGGGGGGPGGG representing amino acids 146-182 of the human class 4 POU domain with accession number NP_006228. Figure 6 illustrates that peptide B oligomers with the sequence GGGGGPGGGGP can be used as GRS. All 9-mer subsequences that are contained in peptides with the sequence (GGGGPGGGGP)n are also contained in the POU domain sequence. Thus, such oligomeric sequences do not contain T cell epitopes.

[0248][0248]

Ejem plo: D iseño de o liaóm ero de a lic ina-ácido glutám icoExample: Design of alicine-glutamic acid oligomer

[0249]Pueden diseñarse secuencias ricas en glicina basándose en la subsecuencia GAGGEGGGGEGGGPGG que es parte de la proteína S6 cinasa ribosómica (número de acceso BAD92170). Por ejemplo, los oligómeros del péptido C con la secuencia GGGGE formarán secuencias en las que la mayoría de las subsecuencias 9-meras estarán contenidas en la secuencia de la proteína S6 cinasa ribosómica. Así, las GRS oligoméricas de la estructura general (GGGGE)n tienen un riesgo muy bajo de contener epítopes de linfocitos T. [0249]Glycine-rich sequences can be designed based on the GAGGEGGGGEGGGPGG subsequence which is part of the ribosomal protein S6 kinase (accession number BAD92170). For example, C-peptide oligomers with the sequence GGGGE will form sequences in which the majority of the 9-mer subsequences will be contained in the S6 ribosomal protein kinase sequence. Thus, oligomeric GRSs of the general structure (GGGGE)n have a very low risk of containing T cell epitopes.

Ejemplo: Identificación de secuencias ricas en glicina hidrófilas humanasExample: Identification of human hydrophilic glycine-rich sequences

[0250]Se buscó en una base de datos de proteínas humanas subsecuencias que eran ricas en residuos de glicina. Estas subsecuencias contuvieron al menos el 50% de glicina. Solo se dejo que se produjeran los siguientes residuos de no glicina en la GRS: ADEHKPRST. Se identificaron 70 subsecuencias que tenían una longitud mínima de 20 aminoácidos. Estas subsecuencias se enumeran en el Apéndice A. Pueden utilizarse para construir GRS con bajo potencial inmunogénico en seres humanos. [0250]A human protein database was searched for subsequences that were rich in glycine residues. These subsequences contained at least 50% glycine. Only the following non-glycine residues were allowed to occur in the GRS: ADEHKPRST. 70 subsequences were identified that had a minimum length of 20 amino acids. These subsequences are listed in Appendix A. They can be used to construct GRSs with low immunogenic potential in humans.

Ejemplo: Construcción de rPEG J288Example: Construction of rPEG J288

[0251]El siguiente ejemplo describe la construcción de un gen de codones optimizados que codifica una secuencia de URP con 288 aminoácidos y la secuencia (GSGGEG)48. Primero, los presentes inventores construyeron un vector de relleno pCW0051 como se ilustra en la Fig. 40. La secuencia del casete de expresión en pCW0051 se muestra en la Fig. 42. El vector de relleno se basó en un vector pET e incluyó un promotor T7. El vector codifica una secuencia Flag, seguida de una secuencia de relleno que está flanqueada por sitios BsaI, BbsI y KpnI. Los sitios BsaI y BbsI se insertaron de forma que generaron residuos protuberantes compatibles después de la digestión como se ilustra en la Fig. 42. La secuencia de relleno fue seguida de una marca His6 y el gen de proteína verde fluorescente (GFP). La secuencia de relleno contiene codones de terminación y así células deE. colique llevan el plásmido de relleno pCW0051 formaron colonias no fluorescentes. El vector de relleno pCW0051 se digirió con BsaI y KpnI. Una biblioteca de codones que codifica secuencias de URP de 36 aminoácidos de longitud se construyó como se muestra en la Fig. 41. La secuencia de URP se designó rPEG_136 y tuvo la secuencia de aminoácidos (GSGGEG)6. El inserto se obtuvo hibridando pares de oligonucleótidos sintéticos que codifican la secuencia de aminoácidos GSGGEGGSGGEG, además de un par de oligonucleótidos que codifican un adaptador con el sitio KpnI. Se usaron los siguientes oligonucleótidos: pr_LCW0057for: AGGTAGTGGWGGWGARGGWGGWTCYGGWGGAGAAGG, pr_LCW0057rev: [0251]The following example describes the construction of a codon-optimized gene that encodes a URP sequence with 288 amino acids and the sequence (GSGGEG)48. First, the present inventors constructed a filler vector pCW0051 as illustrated in Fig. 40. The sequence of the expression cassette in pCW0051 is shown in Fig. 42. The filler vector was based on a pET vector and included a promoter T7. The vector encodes a Flag sequence, followed by a filler sequence that is flanked by BsaI, BbsI, and KpnI sites. The BsaI and BbsI sites were inserted in a way that generated compatible overhang residues after digestion as illustrated in Fig. 42. The filler sequence was followed by a His6 tag and the green fluorescent protein (GFP) gene. The filler sequence contains stop codons and thus E cells. colique carrying the filler plasmid pCW0051 formed non-fluorescent colonies. The stuffing vector pCW0051 was digested with BsaI and KpnI. A codon library encoding URP sequences of 36 amino acids in length was constructed as shown in Fig. 41. The URP sequence was designated rPEG_136 and had the amino acid sequence (GSGGEG)6. The insert was obtained by hybridizing pairs of synthetic oligonucleotides encoding the amino acid sequence GSGGEGGSGGEG, in addition to a pair of oligonucleotides encoding an adapter with the KpnI site. The following oligonucleotides were used: pr_LCW0057for: AGGTAGTGGWGGWGARGGWGGWTCYGGWGGAGAAGG, pr_LCW0057rev:

[0252]ACCTCCTTCTCCWCCRGAWCCWCCYTCWCCWCCACT, pr_3KpnIstopperFor: AGGTTCGTCTTCACTCGAGGGTAC, pr_3KpnIstopperRev: CCTCGAGTGAAGACGA. Los pares de oligonucleótidos hibridados se ligaron, que produjo una mezcla de productos con longitud variable que representa el número variable de repeticiones de rPEG_J12. El producto correspondiente a la longitud de rPEG_J36 se aisló de la mezcla por electroforesis en gel de agarosa y se ligó al vector de relleno digerido con BsaI/KpnI pCW0051. La mayoría de los clones en la biblioteca resultante designada LCW0057 mostró fluorescencia verde después de la inducción, que muestra que la secuencia de rPEG_J36 se había ligado en marco con el gen GFP. El procedimiento de cribado y multimerización iterativa de secuencias de rPEG_J36 se ilustra en la Fig. 14. Los presentes inventores cribaron 288 cepas aisladas de la biblioteca LCW0057 para alto nivel de fluorescencia. Las 48 cepas aisladas con fuerte fluorescencia se analizaron por PCR para verificar la longitud del segmento de rPEG_J y se identificó que 16 clones tenían la longitud esperada de rPEG_J36. Este procedimiento produjo una colección de 16 cepas aisladas de rPEG_J36, que muestran alta expresión y que se diferencian en su uso de codones. Las cepas aisladas se reunieron y se dimerizaron usando un procedimiento explicado resumidamente en la Fig. 40. Una mezcla de plásmidos se digirió con BsaI/NcoI y un fragmento que comprendía la secuencia rPEG_J36 y una parte de GFP se aisló. La misma mezcla de plásmidos también se digirió con BbsI/NcoI y el fragmento de vector que comprende rPEG_J36, la mayor parte del vector de plásmido, y el resto del gen GFP se aisló. Ambos fragmentos se mezclaron, se ligaron y se transformaron en BL21 y se cribaron cepas aisladas para fluorescencia. Este procedimiento de dimerización se repitió dos rondas más como se ha explicado resumidamente en la Fig. 14. Durante cada ronda, los presentes inventores duplicaron la longitud del gen rPEG_J y por último lugar obtuvieron una colección de genes que codificaban rPEG_J288. La secuencia de aminoácidos y de nucleótidos de rPEG_J288 se muestra en la Fig. 15. Puede observarse que el módulo de rPEG_J288 contiene segmentos de rPEG_J36 que se diferencian en su secuencia de nucleótidos a pesar de tener secuencia de aminoácidos idéntica. Así, los presentes inventores minimizaron la homología interna en el gen y como resultado los presentes inventores redujeron el riesgo de recombinación espontánea. Los presentes inventores cultivaron b L21 deE. colique alojaba plásmidos que codificaban rPEG_J288 para al menos 20 duplicados y no se observó recombinación espontánea. [0252]ACCTCCTTCTCCWCCRGAWCCWCCYTCWCCWCCACT, pr_3KpnIstopperFor: AGGTTCGTCTTCACTCGAGGGTAC, pr_3KpnIstopperRev: CCTCGAGTGAAGACGA. The hybridized oligonucleotide pairs were ligated, which produced a mixture of products with variable length representing the variable number of rPEG_J12 repeats. The product corresponding to the length of rPEG_J36 was isolated from the mixture by agarose gel electrophoresis and ligated to the BsaI/KpnI-digested filler vector pCW0051. The majority of clones in the resulting library designated LCW0057 showed green fluorescence after induction, showing that the rPEG_J36 sequence had been ligated in frame with the GFP gene. The iterative screening and multimerization procedure of rPEG_J36 sequences is illustrated in Fig. 14. The present inventors screened 288 strains isolated from the LCW0057 library for high level fluorescence. The 48 isolates with strong fluorescence were analyzed by PCR to verify the length of the rPEG_J segment and 16 clones were identified as having the expected length of rPEG_J36. This procedure produced a collection of 16 rPEG_J36 isolates, which show high expression and differ in their codon usage. The isolated strains were pooled and dimerized using a procedure briefly explained in Fig. 40. A mixture of plasmids was digested with BsaI/NcoI and a fragment comprising the sequence rPEG_J36 and a portion of GFP was isolated. The same plasmid mixture was also digested with BbsI/NcoI and the vector fragment comprising rPEG_J36, the bulk of the plasmid vector, and the remainder of the GFP gene was isolated. Both fragments were mixed, ligated and transformed into BL21 and isolated strains were screened for fluorescence. This dimerization procedure was repeated two more rounds as briefly explained in Fig. 14. During each round, the present inventors doubled the length of the rPEG_J gene and finally obtained a collection of genes encoding rPEG_J288. The amino acid and nucleotide sequence of rPEG_J288 is shown in Fig. 15. It can be seen that the rPEG_J288 module contains segments of rPEG_J36 that differ in their nucleotide sequence despite having identical amino acid sequence. Thus, the present inventors minimized the internal homology in the gene and as a result the present inventors reduced the risk of spontaneous recombination. The present inventors cultivated b L21 of E. colique harbored plasmids encoding rPEG_J288 for at least 20 duplicates and no spontaneous recombination was observed.

Ejem plo: Construcción de rPEG H288Example: Construction of rPEG H288

[0253]Se construyó una biblioteca de genes que codifica un URP de 288 aminoácidos llamado rPEG_H288 usando el mismo procedimiento que se usó para construir rPEG_J288. rPEG_H288 tiene la secuencia de aminoácidos (GSGGEGGSGGSG)24. El diagrama de flujo del procedimiento de construcción se muestra en la Fig. 14. La secuencia de aminoácidos completa, además de la secuencia de nucleótidos de una cepa aislada de rPEG_H288, se facilitan en la Fig. 16. [0253]A gene library encoding a 288 amino acid URP called rPEG_H288 was constructed using the same procedure that was used to construct rPEG_J288. rPEG_H288 has the amino acid sequence (GSGGEGGSGGSG)24. The flow chart of the construction procedure is shown in Fig. 14. The complete amino acid sequence, as well as the nucleotide sequence of an rPEG_H288 isolate, is given in Fig. 16.

Ejemplo: Estabilidad en suero de rPEG J288Example: Serum stability of rPEG J288

[0254]Una proteína de fusión que contiene una marca Flag del extremo N y la secuencia de URP rPEG_J288 fusionada con el extremo N de la proteína verde fluorescente se incubó en 50% de suero de ratón a 37 °C durante 3 días. Las muestras se extrajeron en diversos momentos de tiempo y se analizaron por SDS-PAGE, seguido de detección usando análisis Western. Se usó un anticuerpo contra la marca Flag del extremo N para detección por Western. Los resultados se muestran en la Fig. 28, que indica que una secuencia de URP de 288 aminoácidos puede ser completamente estable en suero durante al menos tres días. [0254]A fusion protein containing an N-terminal Flag tag and the rPEG_J288 URP sequence fused to the N-terminus of green fluorescent protein was incubated in 50% mouse serum at 37°C for 3 days. Samples were extracted at various time points and analyzed by SDS-PAGE, followed by detection using Western analysis. An antibody against the N-terminal Flag tag was used for Western detection. The results are shown in Fig. 28, which indicates that a 288 amino acid URP sequence can be completely stable in serum for at least three days.

Ejemplo: Ausencia de anticuerpos preexistentes para rPEG J288 en sueroExample: Absence of preexisting antibodies to rPEG J288 in serum

[0255]La existencia de anticuerpos contra URP sería una indicación de una posible respuesta inmunogénica a esta secuencia rica en glicina. Para probar la presencia de anticuerpos existentes en suero, una fusión URP-GFP se sometió a un ELISA inmovilizando URP-GFP sobre un soporte y posteriormente incubando con 30% de suero. La presencia de anticuerpos unidos a URP-GFP se detectó usando un anticuerpo anti-IgG-peroxidasa de rábano picante y sustrato. Los datos se muestran en la Fig. 29. Los datos muestran que la proteína de fusión puede detectarse por anticuerpos contra GFP o Flag, pero no por suero murino. Esto indica que el suero murino no contiene anticuerpos que contienen la secuencia de URP. [0255]The existence of antibodies against URP would be an indication of a possible immunogenic response to this glycine-rich sequence. To test the presence of antibodies existing in serum, a URP-GFP fusion was subjected to an ELISA by immobilizing URP-GFP on a support and subsequently incubating with 30% serum. The presence of antibodies bound to URP-GFP was detected using an anti-IgG-horseradish peroxidase antibody and substrate. The data are shown in Fig. 29. The data show that the fusion protein can be detected by antibodies against GFP or Flag, but not by murine serum. This indicates that the murine serum does not contain antibodies containing the URP sequence.

Ejemplo: Purificación de una proteína de fusión que contiene rPEG J288Example: Purification of a fusion protein containing rPEG J288

[0256]Los presentes inventores purificaron una proteína con la arquitectura Flag-rPEG_J288-H6-GFP. La proteína se expresó en BL21 deE. colien medio SB. Los cultivos se indujeron con IPTG 0,5 mM durante la noche a 18 °C. Las células se recogieron por centrifugación. El sedimento se resuspendió en tampón TBS que contenía benzonasa y una mezcla de inhibidor de proteasa comercial. La suspensión se calentó durante 10 min a 75 °C en un baño de agua para lisar las células. El material insoluble se eliminó por centrifugación. El sobrenadante se purificó usando especificidad por ión metálico inmovilizado (IMAC), seguido de una columna con anticuerpo anti-Flag inmovilizado. La Fig. 43 muestra el análisis de PAGE del procedimiento de purificación. El procedimiento dio proteína con al menos el 90% de pureza. [0256]The present inventors purified a protein with the Flag-rPEG_J288-H6-GFP architecture. The protein was expressed in BL21 of E. colien medium SB. Cultures were induced with 0.5 mM IPTG overnight at 18°C. The cells were collected by centrifugation. The pellet was resuspended in TBS buffer containing benzonase and a commercial protease inhibitor mixture. The suspension was heated for 10 min at 75 °C in a water bath to lyse the cells. Insoluble material was removed by centrifugation. The supernatant was purified using immobilized metal ion (IMAC) specificity, followed by a column with immobilized anti-Flag antibody. Fig. 43 shows the PAGE analysis of the purification procedure. The procedure gave protein with at least 90% purity.

Ejemplo: Construcción de proteína de fusión entre rPEG J288 e interferón-alfaExample: Construction of fusion protein between rPEG J288 and interferon-alpha

[0257]Se diseñó un gen que codifica interferón alfa humano usando la optimización de codones para expresión deE. coli.El gen sintético se fusionó con un gen que codificaba rPEG_J288. Se dispuso una marca de His6 en el extremo N para facilitar la detección y purificación de la proteína de fusión. La secuencia de aminoácidos de la proteína de fusión se facilita en la Fig. 44. [0257]A gene encoding human alpha interferon was designed using codon optimization for expression of E. coli.The synthetic gene was fused to a gene encoding rPEG_J288. A His6 tag was provided at the N terminus to facilitate detection and purification of the fusion protein. The amino acid sequence of the fusion protein is given in Fig. 44.

Ejemplo: Construcción de la fusión de rPEG J288-G-CSFExample: Construction of the rPEG J288-G-CSF Fusion

[0258]Se diseñó un gen que codifica G-CSF humano usando la optimización de codones para expresión deE. coli.El gen sintético se fusionó con un gen que codificaba rPEG_J288. Se dispuso una marca de His6 en el extremo N para facilitar la detección y purificación de la proteína de fusión. La secuencia de aminoácidos de la proteína de fusión se facilita en la Fig. 44. [0258]A gene encoding human G-CSF was designed using codon optimization for expression of E. coli.The synthetic gene was fused to a gene encoding rPEG_J288. A His6 tag was provided at the N terminus to facilitate detection and purification of the fusion protein. The amino acid sequence of the fusion protein is given in Fig. 44.

Ejemplo: Construcción de la fusión de rPEG J288-hGHExample: Construction of the rPEG J288-hGH Fusion

[0259]Se diseñó un gen que codifica hormona de crecimiento humana usando la optimización de codones para expresión deE. coli.El gen sintético se fusionó con un gen que codificaba rPEG_J288. Se dispuso una marca de His6 en el extremo N para facilitar la detección y purificación de la proteína de fusión. La secuencia de aminoácidos de la proteína de fusión se facilita en la Fig. 44. [0259]A gene encoding human growth hormone was designed using codon optimization for expression of E. coli.The synthetic gene was fused to a gene encoding rPEG_J288. A His6 tag was provided at the N terminus to facilitate detection and purification of the fusion protein. The amino acid sequence of the fusion protein is given in Fig. 44.

Ejem plo: Expresión de proteínas de fusión entre rPEG J288 y proteínas hum anasExample: Expression of fusion proteins between rPEG J288 and human proteins

[0260]Las proteínas de fusión entre rPEG_J288 y dos proteínas humanas, interferón-alfa y hormona de crecimiento humana, se clonaron en un vector de expresión T7 y se transformaron en BL21 deE. coli.Las células se cultivaron a 37 °C a una densidad óptica de DO 0,5. Posteriormente, las células se cultivaron a 18 °C durante 30 min. Luego se añadió IPTG 0,5 mM y los cultivos se incubaron en una estufa de incubación con agitación a 18 °C durante la noche. Las células se recogieron por centrifugación y la proteína soluble se liberó usando BugBuster (Novagen). Ambas fracciones de proteína, insoluble e soluble, se separaron por SDS-PAGE y las proteínas de fusión se detectaron por Western usando un anticuerpo contra la marca His6 del extremo N para la detección. La Fig. 45 muestra el análisis Western de las dos proteínas de fusión, además de rPEG_J288-GFP como control. Todas las proteínas de fusión se expresaron y la mayoría de la proteína estuvo en la fracción soluble. Esto es una prueba de la alta solubilidad de rPEG_J288 debido a que la mayoría de los intentos en la expresión del interferón-alfa y hormona de crecimiento humana en el citosol deE. coli,que se han informado en la bibliografía, produjeron la formación de cuerpos de inclusión insolubles. La Fig. 45 muestra que la mayoría de las proteínas de fusión se expresan como proteínas de longitud completa, es decir, no se detectó ningún fragmento que sugiriera síntesis incompleta o degradación de la proteína parcial. [0260]Fusion proteins between rPEG_J288 and two human proteins, interferon-alpha and human growth hormone, were cloned into a T7 expression vector and transformed into BL21 fromE. coli.Cells were grown at 37°C to an optical density of OD 0.5. Subsequently, the cells were cultured at 18 °C for 30 min. Then 0.5 mM IPTG was added and the cultures were incubated in a shaking incubator at 18 °C overnight. Cells were collected by centrifugation and soluble protein was released using BugBuster (Novagen). Both insoluble and soluble protein fractions were separated by SDS-PAGE and the fusion proteins were detected by Western using an antibody against the N-terminal His6 tag for detection. Fig. 45 shows Western analysis of the two fusion proteins, plus rPEG_J288-GFP as a control. All fusion proteins were expressed and the majority of the protein was in the soluble fraction. This is a proof of the high solubility of rPEG_J288 because most attempts at the expression of interferon-alpha and human growth hormone in the cytosol of E. coli, which have been reported in the literature, resulted in the formation of insoluble inclusion bodies. Fig. 45 shows that most of the fusion proteins are expressed as full-length proteins, that is, no fragment was detected suggesting incomplete synthesis or degradation of the partial protein.

Ejemplo: Construcción y unión de un multímero de VEGFExample: Construction and binding of a VEGF multimer

[0261]Se construyeron bibliotecas de péptidos restringidos a cisteína como se ha publicado [Scholle, M. D. y col. (2005) Comb Chem High Throughput Screen, 8: 545-51]. Estas bibliotecas se inmunopurificaron contra VEGF humano y se identificaron dos módulos de unión constituidos por secuencias de aminoácidos FTCTNHWCPS o FQCTRHWCPI. Los oligonucleótidos que codifican la secuencia de aminoácidos FTCTNHWCPS se ligaron a una secuencia de nucleótidos que codifica la secuencia de URP rPEG_A36 con la secuencia (GGS)<12>. Posteriormente, la secuencia de fusión se dimerizó usando enzimas de restricción y etapas de ligación para construir una molécula que contenía 4 copias del módulo de unión de VEGF separado por rPEG_A36 fusionado con GFP. La afinidad de unión por VEGF de proteínas de fusión que contienen entre cero y cuatro unidades de unión a VEGF se comparó en la Fig. 30. Una proteína de fusión que contiene solo rPEG_A36 fusionado con GFP no muestra afinidad por VEGF. La adición de números crecientes de módulos de unión a VEGF aumenta la afinidad de las proteínas de fusión resultantes. [0261]Libraries of cysteine-restricted peptides were constructed as published [Scholle, M. D. et al. (2005) Comb Chem High Throughput Screen, 8: 545-51]. These libraries were immunopurified against human VEGF and two binding modules consisting of FTCTNHWCPS or FQCTRHWCPI amino acid sequences were identified. Oligonucleotides encoding the amino acid sequence FTCTNHWCPS were ligated to a nucleotide sequence encoding the URP sequence rPEG_A36 with the sequence (GGS)<12>. Subsequently, the fusion sequence was dimerized using restriction enzymes and ligation steps to construct a molecule containing 4 copies of the VEGF binding module separated by rPEG_A36 fused to GFP. The binding affinity for VEGF of fusion proteins containing between zero and four VEGF binding units was compared in Fig. 30. A fusion protein containing only rPEG_A36 fused to GFP shows no affinity for VEGF. The addition of increasing numbers of VEGF-binding modules increases the affinity of the resulting fusion proteins.

Ejemplo: Descubrimiento de módulos de unión 1SS contra dianas terapéuticasExample: Discovery of 1SS binding modules against therapeutic targets

[0262]Se generaron bibliotecas de péptidos aleatorias según Scholle y col. [Scholle, M. D. y col. (2005) Comb Chem High Throughput Screen, 8: 545-51]. Las bibliotecas de péptidos sin tratamiento previo visualizaron péptidos restringidos a cisteína separados 4 a 10 residuos aleatorios. El diseño de la biblioteca se ilustra en la tabla: [0262]Random peptide libraries were generated according to Scholle et al. [Scholle, M.D. et al. (2005) Comb Chem High Throughput Screen, 8: 545-51]. Naive peptide libraries displayed cysteine-restricted peptides spaced 4 to 10 random residues apart. The layout of the library is illustrated in the table:

[0263]Las bibliotecas se inmunopurificaron de nuevo contra una serie de dianas terapéuticamente relevantes usando el siguiente protocolo: pocilios sobre placas de ELISA inmunosorbentes se recubrieron con 5 pg/ml de antígeno diana en PBS durante la noche a 4 °C. Las placas recubiertas se lavaron con PBS, y los sitios no específicos se bloquearon con tampón de bloqueo (PBS que contenía tanto 0,5% de BSA como 0,5% de albúmina de huevo) durante 2 h a temperatura ambiente. Las placas se lavaron entonces con PBST (PBS que contiene 0,05% de Tween 20), y partículas de fago a 1-5x1012/ml en tampón de unión (tampón de bloqueo que contiene 0,05% de Tween 20) se añadieron a los pocillos y se incubaron con agitación durante 2 h a temperatura ambiente. Entonces, los pocillos se vaciaron y se lavaron con PBST. Las partículas de fago unidas se eluyeron de los pocillos por incubación con HCl 100 mM durante 10 min a temperatura ambiente, se transfirieron a tubos estériles y se neutralizaron con base TRIS 1 M. Para la infección, SS320 deE. colide fase logarítmica que se cultivan en Super Broth complementado con 5 pg/ml de tetraciclina se añadieron al eluato de fago neutralizado, y el cultivo se incubó con agitación durante 30 min a 37 °C. Entonces, los cultivos infectados se transfirieron a tubos mayores que contenían Super Broth con 5 pg/ml de tetraciclina y los cultivos se incubaron con agitación durante la noche a 37 °C. Los cultivos durante la noche se limpiaron deE. colipor centrifugación, y el fago precipitó en el sobrenadante tras la adición de una disolución de 20% de PEG y NaCl 2,5 M a una concentración de PEG final del 4%. El fago precipitado se recogió por centrifugación, y el sedimento de fago se resuspendió en 1 ml de PBS, se limpió deE. coliresidual por centrifugación y se transfirió a un tubo nuevo. Las concentraciones de fago se estimaron espectrofotométricamente y el fago se utilizó para la siguiente ronda de selección. Los clones individuales se cribaron para afinidad de unión a diana después de 3 ó 4 rondas de inmunopurificación en fago. Las placas individuales de los clones de fago seleccionadas durante la inmunopurificación se recogieron en Super Broth que contenía 5 pg/ml de tetraciclina y se cultivaron durante la noche con agitación a 37 °C. Se prepararon placas de ELISA por recubrimiento de antígeno y proteínas de control (BSA, albúmina de huevo, IgG) a 3 pg/ml en PBS durante la noche a 4 °C. Las placas se lavaron con PBS y se bloquearon con tampón de bloqueo (PBS que contiene 0,5% de BSA) durante 2 h a temperatura ambiente. Los cultivos durante la noche se limpiaron deE. colipor centrifugación y el sobrenadante se diluyó 1:10 en tampón de unión (tampón de bloqueo que contiene 0,05% de Tween 20) y se transfirió a placas de ELISA después de lavar con PBST (PBS que contenía 0,05% de Tween 20). Las placas se incubaron con agitación durante 2 h a temperatura ambiente. Tras el lavado con PBST, anti-M13-HRP (Pharmacia), dilución 1:5000 en PBS, se añadió a pocillos. Las placas se incubaron con agitación durante 30 min a temperatura ambiente y se lavaron con PBST, seguido de PBS. Una disolución de sustrato que contiene 0,4 mg/ml de ABTS y 0,001% de H<2>O<2>en tampón fosfato-citrato 50 mM se añadió a los pocillos, y se dejó que se revelaran durante 40 min después de que las placas se leyeran en un lector de placas a 405 nm. Estas lecturas de ELISA permitieron la determinación de la especificidad por clon, y clones específicos para antígeno se secuenciaron comercialmente mediante procedimientos establecidos. [0263]The libraries were again immunopurified against a series of therapeutically relevant targets using the following protocol: wells on immunosorbent ELISA plates were coated with 5 pg/ml of target antigen in PBS overnight at 4 ° C. The coated plates were washed with PBS, and nonspecific sites were blocked with blocking buffer (PBS containing both 0.5% BSA and 0.5% egg albumin) for 2 h at room temperature. The plates were then washed with PBST (PBS containing 0.05% Tween 20), and phage particles at 1-5x1012/ml in binding buffer (blocking buffer containing 0.05% Tween 20) were added. to the wells and incubated with shaking for 2 h at room temperature. The wells were then emptied and washed with PBST. Bound phage particles were eluted from the wells by incubation with 100 mM HCl for 10 min at room temperature, transferred to sterile tubes, and neutralized with 1 M TRIS base. For infection, SS320 ofE. Log phase colides grown in Super Broth supplemented with 5 pg/ml tetracycline were added to the neutralized phage eluate, and the culture was incubated with shaking for 30 min at 37 °C. Infected cultures were then transferred to larger tubes containing Super Broth with 5 pg/ml tetracycline and the cultures were incubated with shaking overnight at 37°C. Overnight cultures were cleared of E. coli by centrifugation, and the phage was precipitated in the supernatant after the addition of a solution of 20% PEG and 2.5 M NaCl to a final PEG concentration of 4%. The precipitated phage was collected by centrifugation, and the phage pellet was resuspended in 1 ml of PBS, cleaned of E. coliresidual by centrifugation and transferred to a new tube. Phage concentrations were estimated spectrophotometrically and the phage was used for the next round of selection. Individual clones were screened for target binding affinity after 3 or 4 rounds of phage immunopurification. Individual plaques of phage clones selected during immunopurification were collected in Super Broth containing 5 pg/ml tetracycline and grown overnight with shaking at 37°C. ELISA plates were prepared by coating antigen and control proteins (BSA, egg albumin, IgG) at 3 pg/ml in PBS overnight at 4 °C. The plates were washed with PBS and blocked with blocking buffer (PBS containing 0.5% BSA) for 2 h at room temperature. Overnight cultures were cleared of E. colipor centrifugation and the supernatant was diluted 1:10 in binding buffer (blocking buffer containing 0.05% Tween 20) and transferred to ELISA plates after washing with PBST (PBS containing 0.05% Tween twenty). The plates were incubated with shaking for 2 h at room temperature. After washing with PBST, anti-M13-HRP (Pharmacia), 1:5000 dilution in PBS, was added to wells. The plates were incubated with shaking for 30 min at room temperature and washed with PBST, followed by PBS. A substrate solution containing 0.4 mg/ml ABTS and 0.001% H<2>O<2>in 50 mM phosphate-citrate buffer was added to the wells, and allowed to develop for 40 min after The plates were read in a plate reader at 405 nm. These ELISA reads allowed determination of clone specificity, and antigen-specific clones were commercially sequenced using established procedures.

Tabla X: Secuencias de módulos de unión específica para EpCAM Table X: Specific binding module sequences for EpCAM

Tabla X: Secuencias de módulos de unión específica para VEGF Table X: Sequences of specific binding modules for VEGF

W E C T Q H W C P S sNG0025S3.021 A P F F S C S F G F C R D L Q T sNG0026S3.035 T P Y F R C Q F G F C F D S F S sNG0026S3.045 N P F F Y C V A G K C V D A P L sNG0026S3.029 W E C T Q H W C P S sNG0025S3.021 A P F F S C S F G F C R D L Q T sNG0026S3.035 T P Y F R C Q F G F C F D S F S sNG0026S3.045 N P F F Y C V A G K C V D A P L sNG0026S3.029

Tabla X: Secuencias de módulos de unión específica para CD28 T T A Y P D C F W C S L F G P P sNG0028S3.085 M L D T T I C P W C S L F G P V sNG0028S3.081 M L X T T I C P W C S L F G P V sNG0028S3.018 E L L L E R C S W C S L F G P P sNG0028S3.086 S L S Q Q S C D W C W L F G P P sNG0028S3.060 K R L L E C G A L C A L F G P P sNG0028S3.008 H T I L T C D S G F C T L F G P sNG0028S3.012 N L W H V C H T S L C H S R L A sNG0028S3.092 N S F Y L C H S S V C G Q L P S sNG0028S3.082 A G F S C E N Y F F C P P K N L sNG0028S3.016 S W C T V F G N H D P S C N S R sNG0028S3.004 Table 0028S3.086 S L S Q Q S C D W C W L F G P P sNG0028S3.060 K R L L E C G A L C A L F G P P sNG0028S3.008 H T I L T C D S G F C T L F G P sNG0028S3.012 N L W H V C H T S L C H S R L A sNG0028S3.0 92 N S F Y L C H S S V C G Q L P S sNG0028S3.082 A G F S C E N Y F F C P P K N L sNG0028S3. 016 S W C T V F G N H D P S C N S R sNG0028S3.004

C S S N G R W K A H C sNG0028S3.076 L P N M W R V V V P D V Y D R R sNG0028S3.068 C S S N G R W K A H C sNG0028S3.076 L P N M W R V V V P D V Y D R R sNG0028S3.068

Tabla X: Secuencias de módulos de unión específica para CD28 K H Y C F G P K S W T T C A R G sNG0030S3.096 P W C H L C P G S P S R C C Q P sNG0030S3.091 P E S K L I E E D L N G D V S sNG003053.042 Table

Tabla X: Secuencias de módulos de unión específica para Tiel I W D R V C R M N T C H Q H S H sNG0032S3.096 P Y T I F C L H S S C R s S S S sNG0032S3.087 D W C L T G P N T L S F c P R R sNG0032S3.031 Table

Tabla X: Secuencias de módulos de unión específica para DR4 L S T W C L H D V C W P P L K sNG0033S3.072 Table

Tabla X: Secuencias de módulos de unión específica para DR5 V Y L T Q C G A Q L C L K R T N sNG0034S3.039 P Y L T S C G D R V C L K R P P sNG0034S3.001 P V L S R C G G R I C M H D R L sNG0034S3.026 L K L T P C S H G V C M H R L R sNG0034S3.087 Y Y L T N C P K G H C L R R V D sNG0034S3.080 Table 034S3.087 Y Y L T N C P K G H C L R R V D sNG0034S3.080

(continuación) (continuation)

Tabla X: Secuencias de módulos de unión específica para DR5 Table X: Specific binding module sequences for DR5

L Y L H S C S R G I C L S P R V sNG0034S3.082 F S C Q S S F P G R R M C E L R sNG0034S3.040 H R C S A H G S S S S F C P G S sNG0034S3.029 L Y L H S C S R G I C L S P R V sNG0034S3.082 F S C Q S S F P G R R M C E L R sNG0034S3.040 H R C S A H G S S S S S F C P G S sNG0034S3.029

Tabla X: Secuencias de módulos de unión específica para TrkA Table X: Sequences of specific binding modules for TrkA

K T W D C N S G H C V J T F K sNG0035S3.074 A T W D C R D H N F S C V R L S sNG003SS3.089 K T W D C N S G H C V J T F K sNG0035S3.074 A T W D C R D H N F S C V R L S sNG003SS3.089

Ejemplo: Conjugados de fármaco de aEpCAMExample: aEpCAM drug conjugates

[0264]Se aislaron péptidos anti-EpCAM de bibliotecas de péptidos aleatorias que se generaron según Scholle y col. [Scholle, M. D. y col. (2005) Comb Chem High Throughput Screen, 8: 545-51]. Las bibliotecas de péptidos sin tratamiento previo visualizaron péptidos restringidos a cisteína con cisteínas separadas 4 a 10 residuos aleatorios. Después de tres rondas de selección por afinidad con las bibliotecas anteriores se aislaron varios ligandos de péptidos específicos para EpCAM (EpCam1) (Tabla X). Las cepas aisladas de EpCam1 tienen una separación de cisteínas conservadas de cuatro aminoácidos (CXXXXC). Los ligando de péptido EpCam1 se aleatorizaron entonces suavemente (excepto posiciones de cisteína) con codones que codificaban 3-9 residuos y se movieron en un vector de fagémido. Las bibliotecas de fagémido se seleccionaron posteriormente por afinidad contra EpCAM para aislar ligandos de péptido optimizados para la unión (Tabla X, EpCam2). Los ligandos EpCam2 contienen la separación de cisteínas CXXXXC conservada. Además, la mayoría de las secuencias anti-EpCam no contienen un residuo de lisina, que permite la conjugación con grupos amina libres fuera de las secuencias de unión. Además, ligandos de péptido anti-EpCam pueden fusionarse genéticamente con secuencias de URP (de cualquier longitud) y multimerizarse usando dimerización iterativa. Las MURP anti-EpCAM resultantes pueden usarse para elegir específicamente como diana EpCAM con afinidad elevada con respecto a secuencias de monómero. Un ejemplo de una secuencia de aminoácidos de EpCAM-URP de tetrámero se muestra en la Fig. 31. Esta secuencia solo contiene dos residuos de lisina que están localizados en la marca Flag del extremo N. Las cadenas laterales de estos residuos de lisina son particularmente adecuadas para la conjugación de fármacos. [0264]Anti-EpCAM peptides were isolated from random peptide libraries that were generated according to Scholle et al. [Scholle, M.D. et al. (2005) Comb Chem High Throughput Screen, 8: 545-51]. Naive peptide libraries visualized cysteine-restricted peptides with cysteines separated by 4 to 10 random residues. After three rounds of affinity selection with the above libraries several peptide ligands specific for EpCAM (EpCam1) were isolated (Table X). EpCam1 isolates have a conserved cysteine gap of four amino acids (CXXXXC). The EpCam1 peptide ligands were then gently randomized (except cysteine positions) with codons encoding 3-9 residues and moved into a phagemid vector. The phagemid libraries were subsequently affinity-screened against EpCAM to isolate peptide ligands optimized for binding (Table X, EpCam2). EpCam2 ligands contain the conserved CXXXXC cysteine cleavage. Furthermore, most anti-EpCam sequences do not contain a lysine residue, which allows conjugation with free amine groups outside the binding sequences. Additionally, anti-EpCam peptide ligands can be genetically fused to URP sequences (of any length) and multimerized using iterative dimerization. The resulting anti-EpCAM MURPs can be used to specifically target EpCAM with high affinity for monomer sequences. An example of a tetramer EpCAM-URP amino acid sequence is shown in Fig. 31. This sequence only contains two lysine residues that are located at the N-terminal Flag tag. The side chains of these lysine residues are particularly suitable for drug conjugation.

Tabla X. Secuencias anti-EpCam Table X. Anti-EpCam sequences

Nombre Secuencia Name Sequence

EpCam 1 LRCWGMLCYA EpCam 1 LRCWGMLCYA

LRCIGQICWR LRCIGQICWR

LKCLYNICWV LKCLYNICWV

LFCWGNVCHF LFCWGNVCHF

LTCWGQVCFR LTCWGQVCFR

RPGMACSGQLCWLNSP RPGMACSGQLCWLNSP

- PHALQCYGSLCWPSHL - PHALQCYGSLCWPSHL

RAGITCHGHLCWPITD RAGITCHGHLCWPITD

RPALKCIGTLCSLANP RPALKCIGTLCSLANP

PHGLWCHGSLCHYPLA PHGLWCHGSLCHYPLA

PHGLICAGSICFWPPP PHGLICAGSICFWPPP

PRNLTCYGQICFQSQH PRNLTCYGQICFQSQH

PHNLACQNSICVRLPR PHNLACQNSICVRLPR

PHGLTCTNQICFYGNT PHGLTCTNQICFYGNT

EpCam 2 HSLTCYGQICWVSNI EpCam 2 HSLTCYGQICWVSNI

PTLTCYNQVCWVNRT PTLTCYNQVCWVNRT

PALRCLGQLCWVTPT PALRCLGQLCWVTPT

PGLRCLGTLCWVPNR PGLRCLGTLCWVPNR

RNLTCWNTVCYAYPN RNLTCWNTVCYAYPN

RGLKCLGQLCWVSSN RGLKCLGQLCWVSSN

PTLKCSGQICWVPPP PTLKCSGQICWVPPP

RNLECLGNVCSLLNQ RNLECLGNVCSLLNQ

PTLTCLNNLCWVPPQ PTLTCLNNLCWVPPQ

RGLKCSGHLCWVTPQ RGLKCSGHLCWVTPQ

HGLTCHNTVCWVHHP HGLTCHNTVCWVHHP

HTLECLGNICWVINQ HTLECLGNICWVINQ

HGLTCYNQICWAPRP HGLTCYNQICWAPRP

HGLACYNQLCWVNPH HGLACYNQLCWVNPH

(continuación) (continuation)

Nombre Secuencia Name Sequence

RGLACQGNICWRLNP RGLACQGNICWRLNP

RAITCLGTLCWPTSP RAITCLGTLCWPTSP

LTLECIGNICYVPHH LTLECIGNICYVPHH

Ejemplo: Adición de secuencias aleatoriasExample: Adding random sequences

[0265]Los módulos de unión pueden madurarse por afinidad, o alargarse, mediante la adición de ligadores similares a URP y secuencia aleatoria para el extremo N, extremo C, o tanto el extremo N como C, de la secuencia de unión. La Fig. 32 muestra la adición de secuencias restringidas a cisteína sin tratamiento previo a un módulo de unión anti-EpCAM. Pueden generarse bibliotecas de adiciones de secuencias aleatorias usando un enfoque de clonación de ADN monocatenario o bicatenario. Una vez generadas, las bibliotecas pueden seleccionarse por afinidad contra la proteína diana inicial o una segunda proteína. Por ejemplo, puede usarse una biblioteca de adición que contiene un módulo de unión anti-EpCAM para seleccionar secuencias que contienen 2 o más sitios de unión a la proteína diana. [0265]The binding modules can be affinity matured, or elongated, by the addition of URP-like linkers and random sequence to the N terminus, C terminus, or both the N and C termini, of the binding sequence. Fig. 32 shows the addition of naïve cysteine-restricted sequences to an anti-EpCAM binding module. Libraries of random sequence additions can be generated using a single-stranded or double-stranded DNA cloning approach. Once generated, libraries can be selected by affinity against the initial target protein or a second protein. For example, an addition library containing an anti-EpCAM binding module can be used to select sequences containing 2 or more binding sites to the target protein.

Ejemplo: Construcción de una biblioteca de formación 2SSExample: Building a 2SS Training Library

[0266]Se diseñó una serie de oligonucleótidos para construir una biblioteca basada en el péptido 1SS de unión a VEGF FTCTNHWCPS. Los oligonucleótidos incorporan variaciones en los patrones de distancia de cisteína de las secuencias flanqueantes, mientras que la secuencia de péptidos de unión a VEGF se mantuvo fija. [0266]A series of oligonucleotides were designed to construct a library based on the VEGF binding peptide 1SS FTCTNHWCPS. The oligonucleotides incorporated variations in the cysteine distance patterns of the flanking sequences, while the VEGF-binding peptide sequence was kept fixed.

Oligonucleótidos directos: Direct oligonucleotides:

[0267]LMS70-1 CAGGCAGCGGGCCCGTCTGGCCCGTGYTTTACTT GTACGAATCATT GGT GTCCT [0267]LMS70-1 CAGGCAGCGGGCCCGTCTGGCCCGTGYTTTACTT GTACGAATCATT GGT GTCCT

[0268]LMS70-2 CAGGCAGCGGGCCCGTCTGGCCCGTGYN NKTTTAACTTGTACGAATCATTGGTGTCCT[0269]LMS70-3 [0268]LMS70-2 CAGGCAGCGGGCCCGTCTGGCCCGTGYN NKTTTAACTTGTACGAATCATTGGTGTCCT[0269]LMS70-3

CAGGCAGCGGGCCCGTCTGGCCCGTGYNNKNNKTTT ACTT GT ACGAATCATT GGT GTCCT CAGGCAGCGGGCCCGTCTGGCCCGTGYNNKNNKTTT ACTT GT ACGAATCATT GGT GTCCT

[0270]LMS70-4 CAGGCAGCGGGCCCGTCTGGCCCGTGYNHTNHTTTTACTTGTACGAATCATTGGTGTCCT [0270]LMS70-4 CAGGCAGCGGGCCCGTCTGGCCCGTGYNHTNHTTTTACTTGTACGAATCATTGGTGTCCT

[0271]LMS70-5 [0271]LMS70-5

CAGGCAGCGGGCCCGTCTGGCCCGTGYN HTNHTNHTNH'mTACTTGTACGAATCATTGCrrG TCCT CAGGCAGCGGGCCCGTCTGGCCCGTGYN HTNHTNHTNH'mTACTTGTACGAATCATTGCrrG TCCT

[0272]LMS70-6 [0272]LMS70-6

CAGGCAGCGGGCCCGTCTGGCCCGTGYKMTKMTKMTKMTKMTTTTACTTGTACGAATCAT CAGGCAGCGGGCCCGTCTGGCCCGTGYKMTKMTKMTKMTKMTTTTACTTGTACGAATCAT

Oliqonucleótidos inversos (complementados inversos): Reverse Oliqonucleotides (reverse complemented):

[0273]LMS70-1R ACCGGAACCACCAGACTGGCCRCACGAAGGACACCAATGATTCGT ACAA [0273]LMS70-1R ACCGGAACCACCAGACTGGCCRCACGAAGGACACCAATGATTCGT ACAA

[0274]LMS70-2R ACCGGAACCACCAGACTGGCCRCAMNNCGAAGGACACCAATGATTCGTACAA[0275]LMS70-3R ACCGGAACCACCAGACTGGCCRCAMNNMNNCGAAGGACACCAATGATTCGTACAA [0274]LMS70-2R ACCGGAACCACCAGACTGGCCRCAMNNCGAAGGACACCAATGATTCGTACAA[0275]LMS70-3R ACCGGAACCACCAGACTGGCCRCAMNNMNNCGAAGGACACCAATGATTCGTACAA

[0276]LMS70-4R ACCGGAACCACCAGACTGGCCRCAAADNADNDNCGAAGGACACCAATGATTCGTACAA [0276]LMS70-4R ACCGGAACCACCAGACTGGCCRCAAADNADNDNCGAAGGACACCAATGATTCGTACAA

[0277]LMS70-5R ACCGGAACCACCAGACTGGCCRCAAADNADNADNDNCGAAGGACACCAATGATTCGTACAA [0277]LMS70-5R ACCGGAACCACCAGACTGGCCRCAAADNADNADNDNCGAAGGACACCAATGATTCGTACAA

[0278]LMS70-6R [0278]LMS70-6R

ACCGGAACCACCAGACTGGCCRCAAKMAKMAKMAKMAKMCGAAGGACACCAATGATTCG ACCGGAACCACCAGACTGGCCRCAAKMAKMAKMAKMAKMCGAAGGACACCAATGATTCG

TACAA TACAA

Diluciones de oliqonucleótidos Oligonucleotide dilutions

[0279]Mezcla 1 (de mezclas madre 100 pM): 100 pl de 70-6, 33 pl de 70-5, 11 pl de 70-4, 3,66 pl de 70-3, 1,2 pl de 70-2, 0,4 pl de 70-1. Mezcla 2 (de mezclas madre 100 pM): 100 pl de 70-6R, 33 pl de 70-5R, 11 pl de 70-4R, 3,66 pl de 70-3R, 1,2 pl de 70-2R, 0,4 pl de 70-1R [0279]Mixture 1 (from 100 pM stock mixes): 100 pl of 70-6, 33 pl of 70-5, 11 pl of 70-4, 3.66 pl of 70-3, 1.2 pl of 70- 2, 0.4 pl of 70-1. Mixture 2 (from 100 pM stock mixes): 100 pl of 70-6R, 33 pl of 70-5R, 11 pl of 70-4R, 3.66 pl of 70-3R, 1.2 pl of 70-2R, 0 .4 pl of 70-1R

Ensamblaje por PCR PCR assembly

[0280]10,0 pl de oliqonucleótido molde (5 pM), 10,0 pl de 10 X tampón, 2,0 dNTP (10 mM), 1,0 pl de ADNc polimerasa (Clonetech), 77 pl de H<2>O destilada. Programa de PCR: 95 °C 1 min, (95 °C 15 s, 54 °C 30 s, 68 °C 15 s) x5, 68 °C 1 min [0280]10.0 µl template oligonucleotide (5 pM), 10.0 µl 10X buffer, 2.0 dNTPs (10 mM), 1.0 µl cDNA polymerase (Clonetech), 77 µl H<2 >Or distilled. PCR program: 95 °C 1 min, (95 °C 15 s, 54 °C 30 s, 68 °C 15 s) x5, 68 °C 1 min

Amplificación por PCR PCR amplification

[0281]Cebadores, 10,0 pl de mezcla ensamblada, 10,0 pl de 10 X tampón, 2,0 dNTP (10 mM), 10,0 pl de LlBPTF (5 pM), 10,0 pl de LIBPTR (5 pM), 1,0 pl de ADNc polimerasa (Clonetech), 57 pl de H<2>O destilada. Programa de PCR: 95 °C 1 min, (95 °C 15 s, 54 °C 30 s, 68 °C 15 s) x25, 68 °C 1 min. El producto se purificó por columna Y10 de Amicon. El producto ensamblado se digirió con Sfil y BstXI y se ligó en el vector de fagémido pMP003. La ligación se realizó durante la noche a 16 °C en una máquina de PCR MJ. La ligación se purificó entonces por precipitación con EtOH. Transformación en células ER2738 competentes frescas por electroporación. [0281]Primers, 10.0 µl of assembled mixture, 10.0 µl of 10 pM), 1.0 pl of cDNA polymerase (Clonetech), 57 pl of distilled H<2>O. PCR program: 95 °C 1 min, (95 °C 15 s, 54 °C 30 s, 68 °C 15 s) x25, 68 °C 1 min. The product was purified by Amicon Y10 column. The assembled product was digested with Sfil and BstXI and ligated into the phagemid vector pMP003. Ligation was performed overnight at 16°C in an MJ PCR machine. The ligation was then purified by precipitation with EtOH. Transformation into fresh competent ER2738 cells by electroporation.

[0282]La biblioteca resultante se inmunopurificó contra VEGF como se describe a continuación. Se identificaron varias cepas aisladas que mostraron unión mejorada a VEGF con respecto a la secuencia de partida de 1SS. Los datos de unión y expresión se muestran en la Fig. 38. Las secuencias y resultados del análisis Western de clones de formación se muestra en la Fig. 39. [0282]The resulting library was immunopurified against VEGF as described below. Several isolates were identified that showed improved VEGF binding over the 1SS starting sequence. Binding and expression data are shown in Fig. 38. Sequences and results of Western analysis of training clones are shown in Fig. 39.

Ejemplo: Inmunopurificación en fago de bibliotecas de formaciónExample: Phage immunopurification of training libraries

[0283]Primera ronda de inmunopurificación: [0283]First round of immunopurification:

[0284]1) Primera ronda, recubrir 4 pocillos por biblioteca a cribar. Recubrir el pocillo de una placa de ELISA de 96 pocillos Costar con 0,25 pg de antígeno VEGF<121>en 25 pl de PBS. Cubrir la placa con un sellante de placas. El recubrimiento puede realizarse durante la noche a 4 °C o durante 1 h a 37 °C. [0284]1) First round, coat 4 wells per library to be screened. Coat the well of a Costar 96-well ELISA plate with 0.25 pg of VEGF<121>antigen in 25 μl of PBS. Cover the plate with a plate sealant. Coating can be done overnight at 4°C or for 1 h at 37°C.

[0285]2) Después de sacudir la disolución de recubrimiento, bloquear el pocillo añadiendo 150 pl de PBS/1% DE bSa . Sellar e incubar durante 1 h a 37 °C. [0285]2) After shaking off the coating solution, block the well by adding 150 µl of PBS/1% bSa. Seal and incubate for 1 h at 37°C.

[0286]3) Después de sacudir la disolución de bloqueo, añadir 50 pl de fago recientemente preparado (véase el protocolo de reamplificación de bibliotecas) al pocillo. Solo para la primera ronda, añadir también 5 pl de 5% de Tween. Sellar la placa e incubar durante 2 h a 37 °C. [0286]3) After shaking off the blocking solution, add 50 µl of freshly prepared phage (see library reamplification protocol) to the well. Just for the first round, also add 5 pl of 5% Tween. Seal the plate and incubate for 2 h at 37°C.

[0287]Mientras tanto, inocular 2 ml de medio SB más 2 pl de 5 mg/ml de tetraciclina con 2 pl de una preparación de células ER 2738 y permitir el crecimiento a 250 rpm y 37 °C durante 2,5 h. Cultivar 1 cultivo para cada biblioteca que se criba que incluye selecciones negativas. Tomar todas las precauciones para evitar una contaminación del cultivo con fago. [0287]Meanwhile, inoculate 2 ml of SB medium plus 2 µl of 5 mg/ml tetracycline with 2 µl of an ER 2738 cell preparation and allow growth at 250 rpm and 37 °C for 2.5 h. Grow 1 culture for each library being screened that includes negative selections. Take all precautions to avoid contamination of the culture with phage.

[0288]4) Sacudir la disolución de fago, añadir 150 pl de PBS/0,5% de Tween al pocillo y pipetear 5 veces vigorosamente arriba y abajo. Esperar 5 min, sacudir y repetir esta etapa de lavado. En la primera ronda, lavar de este modo 5 veces, en la segunda ronda 10 veces, y en la tercera, cuarta y quinta ronda 15 veces. [0288]4) Shake the phage solution, add 150 µl of PBS/0.5% Tween to the well and pipet 5 times vigorously up and down. Wait 5 min, shake and repeat this washing step. In the first round, wash this way 5 times, in the second round 10 times, and in the third, fourth and fifth rounds 15 times.

[0289]5) Después de sacudir la disolución de lavado final, añadir 50 pl de 10 mg/ml de tripsina en PBS recientemente preparada, sellar e incubar durante 30 min a 37 °C. Pipetear 10 veces vigorosamente arriba y abajo y transferir el eluato (4 x 50 pl en la primera ronda, 2 x 50 ml en la segunda ronda, 1 x 50 pl en las rondas posteriores) al cultivo de 2 ml deE. colipreparado e incubar a temperatura ambiente durante 15 min. [0289]5) After shaking off the final wash solution, add 50 µl of 10 mg/ml trypsin in freshly prepared PBS, seal and incubate for 30 min at 37 °C. Pipet 10 times vigorously up and down and transfer the eluate (4 x 50 pl in the first round, 2 x 50 ml in the second round, 1 x 50 pl in subsequent rounds) to the 2 ml culture of E. coliprepared and incubate at room temperature for 15 min.

[0290]6) Añadir 6 ml de medio SB precalentado, 1,6 pl de carbenicilina y 6 pl de 5 mg/ml de tetraciclina. Transferir el cultivo a un tubo de polipropileno de 50 ml. [0290]6) Add 6 ml of prewarmed SB medium, 1.6 pl of carbenicillin and 6 pl of 5 mg/ml tetracycline. Transfer the culture to a 50 ml polypropylene tube.

[0291]7) Agitar el cultivo de 8 ml a 250 rpm y 37 °C durante 1 h, añadir 2,4 pl de 100 mg/ml de carbenicilina y agitar durante una hora adicional a 250 rpm y 37 °C. [0291]7) Shake the 8 ml culture at 250 rpm and 37 °C for 1 h, add 2.4 μl of 100 mg/ml carbenicillin and shake for an additional hour at 250 rpm and 37 °C.

[0292]8) Añadir 1 ml de fago auxiliar VCSM 13 y transferir a una botella de centrífuga de polipropileno de 500 ml. Añadir 91 ml de medio SB precalentado (37 °C) y 46 pl de 100 mg/ml de carbenicilina y 92 pl de 5 mg/ml de tetraciclina. Agitar el cultivo de 100 ml a 300 rpm y 37 °C durante 11/2 a 2 h. [0292]8) Add 1 ml of VCSM 13 helper phage and transfer to a 500 ml polypropylene centrifuge bottle. Add 91 ml of prewarmed SB medium (37 °C) and 46 μl of 100 mg/ml carbenicillin and 92 μl of 5 mg/ml tetracycline. Shake the 100 ml culture at 300 rpm and 37 °C for 11/2 to 2 h.

[0293]9) Añadir 140 pl de 50 mg/ml de kanamicina y continuar la agitación a 300 rpm y 37 °C durante la noche. [0293]9) Add 140 μl of 50 mg/ml kanamycin and continue stirring at 300 rpm and 37 °C overnight.

[0294]10) Centrifugar a 4000 rpm durante 15 min a 4 °C. Transferir el sobrenadante a una botella de centrífuga de 500 ml limpia y añadir 25 ml de 20% de PEG-8000/NaCl 2,5 M. Guardar sobre hielo durante 30 min. [0294]10) Centrifuge at 4000 rpm for 15 min at 4 °C. Transfer the supernatant to a clean 500 ml centrifuge bottle and add 25 ml of 20% PEG-8000/2.5 M NaCl. Store on ice for 30 min.

[0295]11) Centrifugar a 9000 rpm durante 15 min a 4 °C. Desechar el sobrenadante, drenar invertido sobre una toalla de papel durante al menos 10 min y limpiar el líquido restante de la parte superior de la botella de centrífuga con una toalla de papel. [0295]11) Centrifuge at 9000 rpm for 15 min at 4 °C. Discard the supernatant, drain inverted onto a paper towel for at least 10 min, and wipe the remaining liquid from the top of the centrifuge bottle with a paper towel.

[0296]12) Resuspender el sedimento de fago en 2 ml de tampón PBS/0,5% de BSA/0,5% de Tween pipeteando arriba y abajo a lo largo del lado de la botella de centrífuga y transferir a un tubo de microcentrífuga de 2 ml. Resuspender adicionalmente pipeteando arriba y abajo usando una punta de pipeta de 1 ml, centrifugar a velocidad completa en una microcentrífuga durante 1 min a 4 °C y pasar el sobrenadante a un filtro de 0,2 pm en un tubo de microcentrífuga de 2 ml estéril. [0296]12) Resuspend the phage pellet in 2 ml of PBS/0.5% BSA/0.5% Tween buffer by pipetting up and down along the side of the centrifuge bottle and transfer to a tube. 2 ml microcentrifuge. Resuspend further by pipetting up and down using a 1 mL pipette tip, centrifuge at full speed in a microcentrifuge for 1 min at 4 °C, and transfer the supernatant to a 0.2 μm filter in a sterile 2 mL microcentrifuge tube. .

[0297] 13) Continuar la etapa 3) durante la siguiente ronda o guardar la preparación de fago a 4 °C. Puede añadirse azida de sodio al 0,02% (peso/volumen) para almacenamiento a largo plazo. Solo debe usarse fago recientemente preparado para cada ronda. [0297] 13) Continue step 3) during the next round or store the phage preparation at 4 °C. 0.02% (w/v) sodium azide may be added for long-term storage. Only freshly prepared phage should be used for each round.

[0298] Segunda ronda de inmunopurificación [0298] Second round of immunopurification

[0299] Segunda ronda, recubrir 2 pocillos por biblioteca a cribar. Recubrir el pocillo de una placa de ELISA de 96 pocillos Costar con 0,25 pg de antígeno VEGF<121>en 25 pl de PBS. Cubrir la placa con un sellante de placas. El recubrimiento puede realizarse durante la noche a 4 °C o durante 1 h a 37 °C. [0299] Second round, coat 2 wells per library to be screened. Coat the well of a Costar 96-well ELISA plate with 0.25 pg of VEGF<121>antigen in 25 μl of PBS. Cover the plate with a plate sealant. Coating can be done overnight at 4°C or for 1 h at 37°C.

[0300] Bloquear también 2 pocillos sin recubrir para cada biblioteca que va a usarse como control negativo para el cálculo de la relación de enriquecimiento. [0300] Also block 2 uncoated wells for each library that is to be used as a negative control for the enrichment ratio calculation.

[0301] Tercera ronda de inmunopurificación [0301] Third round of immunopurification

[0302] Tercera ronda, recubrir 1 pocillo por biblioteca a cribar. Recubrir el pocillo de una placa de ELISA de 96 pocillos Costar con 0,25 pg de antígeno VEGF121 en 25 pl de PBS. Cubrir la placa con un sellante de placas. El recubrimiento puede realizarse durante la noche a 4 °C o durante 1 h a 37 °C. [0302] Third round, coat 1 well per library to be screened. Coat the well of a Costar 96-well ELISA plate with 0.25 pg of VEGF121 antigen in 25 µl of PBS. Cover the plate with a plate sealant. Coating can be done overnight at 4°C or for 1 h at 37°C.

[0303] Bloquear también 1 pocillos sin recubrir para cada biblioteca que va a usarse como control negativo para el cálculo de la relación de enriquecimiento. [0303] Also block 1 uncoated wells for each library that is to be used as a negative control for the enrichment ratio calculation.

Ejemplo: Inmunopurificación basada en disolución: Example: Solution-based immunopurification:

[0304] 1. Biotinilar la proteína diana según el fabricante. [0304] 1. Biotinylate the target protein according to the manufacturer.

[0305] 2. Recubrir un total de 8 pocillos (por selección) con 1,0 pg de neutravidina (Pierce) en PBS e incubar durante la noche a 4 °C. [0305] 2. Coat a total of 8 wells (per selection) with 1.0 pg neutravidin (Pierce) in PBS and incubate overnight at 4 °C.

[0306] 3. Bloquear los pocillos con SuperBlock (Pierce) durante 1 h a temp ambiente. Guardar la placa con tampón de bloqueo hasta que se necesite (en la etapa 6). [0306] 3. Block the wells with SuperBlock (Pierce) for 1 h at room temperature. Store the plate with blocking buffer until needed (in step 6).

[0307] 4. Usar 100 nM de proteína diana biotinilada y añadir 1012 fago/ml (en PBST) para un volumen total de 100-200 pl usando SuperBlock más 0,05% de Tween 20. [0307] 4. Use 100 nM of biotinylated target protein and add 1012 phage/ml (in PBST) for a total volume of 100-200 µl using SuperBlock plus 0.05% Tween 20.

[0308] 5. Voltear la mezcla de fago-diana a temp ambiente durante al menos 1 h. [0308] 5. Turn the phage-target mixture at room temperature for at least 1 h.

[0309] 6. Diluir 100 pl de mezcla de fago-diana con 700 pl de SuperBlock, mezclar y añadir 100 pl a cada uno de 8 pocillos recubiertos con neutravidina (de la etapa 3). [0309] 6. Dilute 100 µl of phage-target mixture with 700 µl of SuperBlock, mix and add 100 µl to each of 8 neutravidin-coated wells (from step 3).

[0310] 7. Incubar durante 5 min a temp ambiente. [0310] 7. Incubate for 5 min at room temperature.

[0311] 8. Lavar 8X con PBST. [0311] 8. Wash 8X with PBST.

[0312] 9. Eluir el fago con 100 pl de HCl 100 mM durante 10 min. [0312] 9. Elute the phage with 100 μl of 100 mM HCl for 10 min.

[0313] 10. Neutralizar añadiendo 10 pl de TRIS 1 M a pH=8,0. [0313] 10. Neutralize by adding 10 μl of 1 M TRIS at pH=8.0.

[0314] 11. Infectar las células para siembra o amplificar el fago para una ronda posterior de inmunopurificación en disolución. [0314] 11. Infect the cells for seeding or amplify the phage for a subsequent round of solution immunopurification.

Ejemplo: Cribado por ELISA de fago para clones positivos para VEGF Example: Phage ELISA screening for VEGF-positive clones

[0315] 1) Añadir 0,5 ml de SB que contiene 50 pg/ml de carbenicilina a placa de 96 pocillos profunda. Recoger una colonia e inocular pocilios. [0315] 1) Add 0.5 ml of SB containing 50 pg/ml carbenicillin to deep 96-well plate. Collect a colony and inoculate wells.

[0316]2) Agitar la placa que contiene los cultivos bacterianos a 300 rpm durante la noche a 37 °C. [0316]2) Shake the plate containing the bacterial cultures at 300 rpm overnight at 37 °C.

[0317]3) Preparar 4 ng/pl de disolución de proteína diana en PBS. Añadir 25 pl (100 ng) de proteína a cada pocillo e incubar durante la noche a 4 °C. [0317]3) Prepare 4 ng/pl of target protein solution in PBS. Add 25 µl (100 ng) of protein to each well and incubate overnight at 4 °C.

[0318]4) Sacudir las placas de ELISA recubiertas y lavar 2x con PBS. Añadir 150 pl/pocillo de PBS 0,5% de BSA (tampón de bloqueo). Bloquear durante 1 h a TA. [0318]4) Shake the coated ELISA plates and wash 2x with PBS. Add 150 µl/well of PBS 0.5% BSA (blocking buffer). Block for 1 h at RT.

[0319]5) Centrifugar las gradillas de microtubos (3000 rpm; 20 min). [0319]5) Centrifuge the microtube racks (3000 rpm; 20 min).

[0320]6) Preparar tampón de unión (tampón de bloqueo 0,5% de Tween 20). Tomar alícuotas de 135 pl de tampón de unión por pocillo en placa de 96 pocillos de baja unión a proteína. [0320]6) Prepare binding buffer (0.5% Tween 20 blocking buffer). Take 135 µl aliquots of binding buffer per well into a low protein binding 96-well plate.

[0321]7) Sacudir los pocillos sobre placas de ELISA y lavar 2 veces con PBST (PBS 0,5% de Tween 20). [0321]7) Shake the wells onto ELISA plates and wash 2 times with PBST (PBS 0.5% Tween 20).

[0322]8) Diluir 15 pl de fago de cultivos durante la noche 1:10 en PBST, mezclar por pipeteado y transferir 30 pl a cada pocillo recubierto de proteína. Incubar 2 h a TA con agitación suave. [0322]8) Dilute 15 µl of phage from overnight cultures 1:10 in PBST, mix by pipetting and transfer 30 µl to each protein-coated well. Incubate for 2 h at RT with gentle shaking.

[0323]9) Lavar las placas 6 veces con PBST. [0323]9) Wash the plates 6 times with PBST.

[0324]10) Añadir 50 pl de anti-M13-HRP 1:5000 en tampón de unión a los pocillos. Incubar 30 min con agitación suave a TA. [0324]10) Add 50 µl of anti-M13-HRP 1:5000 in binding buffer to the wells. Incubate for 30 min with gentle shaking at RT.

[0325]11) Lavar las placas 4 veces con PBST, seguido de 2 veces con H<2>O. [0325]11) Wash the plates 4 times with PBST, followed by 2 times with H<2>O.

[0326]12) Preparar 6 ml de disolución de ABTS (5,88 ml de tampón citrato más 120 pl de ABTS y 2 pl de H<2>O<2>). Tomar alícuotas de 50 pl por pocillo sobre cada placa de ELISA. [0326]12) Prepare 6 ml of ABTS solution (5.88 ml of citrate buffer plus 120 pl of ABTS and 2 pl of H<2>O<2>). Take 50 µl aliquots per well on each ELISA plate.

[0327]13) Incubar a TA y leer la DO a 405 nm usando un lector de placas de ELISA en momentos de tiempo apropiados dependiendo de la señal (hasta 1 h) [0327]13) Incubate at RT and read the OD at 405 nm using an ELISA plate reader at appropriate time points depending on the signal (up to 1 h)

Ejemplo: Dimerización de módulos de uniónExample: Dimming of junction modules

[0328]Se crearon bibliotecas visualizadas en fago de 10e9 a 10e11 péptidos cíclicos con 4, 5, 6, 7, 8, 9, 10, 11 y 12 aminoácidos aleatorizados o parcialmente aleatorizados entre las cistinas unidas a disulfuro, y en algunos casos aminoácidos aleatorizados adicionales sobre el exterior del par de cisteínas mediante procedimientos convencionales. La inmunopurificación de estas bibliotecas de péptidos cíclicos contra varias dianas, que incluyen VEGF humano, dio fidedignamente péptidos que se unieron específicamente a VEGFh y no a BSA, albúmina de huevo o IgG. [0328]Phage-displayed libraries of 10e9 to 10e11 cyclic peptides were created with 4, 5, 6, 7, 8, 9, 10, 11 and 12 amino acids randomized or partially randomized between disulfide-linked cystines, and in some cases amino acids additional randomizations on the exterior of the cysteine pair by conventional procedures. Immunopurification of these cyclic peptide libraries against several targets, including human VEGF, reliably yielded peptides that specifically bound hVEGF and not BSA, egg albumin, or IgG.

Ejemplo: Construcción e inmunopurificación de una biblioteca basada en plexinaExample: Construction and immunopurification of a plexin-based library

[0329]Se diseñaron dos bibliotecas basándose en el andamiaje de plexina. La base de datos de proteínas Pfam se usó para alineamiento filogenético de dominios de plexina que se producen naturalmente como se muestra en la Fig. 35. La parte central del andamiaje de plexina (Cys24-Gly25-Trp26-Cys27) se conserva en ambos diseños de biblioteca y sirvió de región cruzada para la generación de bibliotecas de N y C. Los esquemas de aleatorización de ambas bibliotecas de plexina se muestran en la Fig. 36. Las dos bibliotecas se generaron solapando dos oligonucleótidos que codifican bibliotecas en la región cruzada y usando PCR de estiramiento a través (“pullthrough”), seguida de clonación por restricción (Sfil/BstXI) y clonación en el vector de fagémido pMP003. Las bibliotecas de plexina resultantes se designaron LMP031 (biblioteca del extremo N) y LMP032 (biblioteca del extremo C) y cada una se representó por una complejidad de aproximadamente 5 x 108 transformantes independientes. Para la validación, aproximadamente 24 clones resistentes a Carb de cada biblioteca sin seleccionar se analizaron por PCR. Los clones que dieron un fragmento de tamaño correcto (375 pb) se analizaron adicionalmente por secuenciación de ADN. Las secuencias de plexina de longitud completa correctas se obtuvieron para el 50% y 67% de clones derivados de las bibliotecas LMP031 y LMP032, respectivamente. [0329]Two libraries were designed based on the plexin scaffold. The Pfam protein database was used for phylogenetic alignment of naturally occurring plexin domains as shown in Fig. 35. The central part of the plexin scaffold (Cys24-Gly25-Trp26-Cys27) is conserved in both designs. library and served as a crossover region for the generation of N and C libraries. The randomization schemes of both plexin libraries are shown in Fig. 36. The two libraries were generated by overlapping two oligonucleotides encoding libraries in the crossover region and using pull-through PCR, followed by restriction cloning (Sfil/BstXI) and cloning into the phagemid vector pMP003. The resulting plexin libraries were designated LMP031 (N-terminal library) and LMP032 (C-terminal library) and each was represented by a complexity of approximately 5 × 108 independent transformants. For validation, approximately 24 Carb-resistant clones from each unselected library were analyzed by PCR. Clones that gave a fragment of the correct size (375 bp) were further analyzed by DNA sequencing. Correct full-length plexin sequences were obtained for 50% and 67% of clones derived from the LMP031 and LMP032 libraries, respectively.

[0330]Las dos bibliotecas se mezclaron juntas a la relación 50/50 y se inmunopurificaron en paralelo contra VEGF, receptor de muerte Dr4, ErbB2 y HGFR inmovilizados sobre placas de ELISA de 96 pocilios. Se llevaron a cabo cuatro rondas de inmunopurificación usando 1000 ng de proteína diana en la primera ronda, 500 ng en la segunda ronda, 250 ng en la tercera ronda y 100 ng en la cuarta ronda. Después de la ronda final de inmunopurificación, 192 clones resistentes a Carb de cada selección se analizaron para unirse a 100 ng de proteína diana inmovilizada, IgG humana, albúmina de huevo y BSA por ELISA en fago usando Ab anti-M13 policlonal conjugado con peroxidasa de rábano picante para la detección. El mayor porcentaje de clones positivos se obtuvo para DR4 diana (69%), seguido de ErbB2 diana (53%), HGFR (13%) y BoNT diana (1%). Los clones positivos se analizaron adicionalmente por PCR y por secuenciación de ADN. Todos los clones revelaron secuencias únicas y todos, excepto uno (contra DR4), se derivaron de LMP032 (biblioteca del extremo C). Las secuencias de algunas de las cepas aisladas selectivas para diana identificadas se muestran en la Fig. 37. [0330]The two libraries were mixed together at a 50/50 ratio and immunopurified in parallel against VEGF, death receptor Dr4, ErbB2 and HGFR immobilized on 96-well ELISA plates. Four rounds of immunopurification were carried out using 1000 ng of target protein in the first round, 500 ng in the second round, 250 ng in the third round, and 100 ng in the fourth round. After the final round of immunopurification, 192 Carb-resistant clones from each screen were tested for binding to 100 ng of immobilized target protein, human IgG, egg albumin, and BSA by phage ELISA using peroxidase-conjugated polyclonal anti-M13 Ab. horseradish for detection. The highest percentage of positive clones was obtained for target DR4 (69%), followed by target ErbB2 (53%), HGFR (13%) and BoNT target (1%). Positive clones were further analyzed by PCR and DNA sequencing. All clones revealed unique sequences and all but one (against DR4) were derived from LMP032 (C-terminal library). The sequences of some of the identified target-selective isolates are shown in Fig. 37.

[0331]Para análisis adicional, una selección de ligantes específicos para diana seleccionada se subclona primero en el vector de expresión de proteína pVS001, luego se produjeron como microproteínas solubles, y finalmente se purificaron por lisis térmica. Las microproteínas específicas para diana purificadas se analizan por ELISA de proteínas para confirmar el reconocimiento de diana, por SDS-PAGE para confirmar la formación de monómeros y por resonancia de plasmones superficiales para medir sus afinidades por la diana. Los mejores clones se usan en la siguiente ronda de generación de bibliotecas para mejorar adicionalmente sus propiedades. [0331]For further analysis, a selection of selected target-specific binders were first subcloned into the protein expression vector pVS001, then produced as soluble microproteins, and finally purified by thermal lysis. Purified target-specific microproteins are analyzed by protein ELISA to confirm target recognition, by SDS-PAGE to confirm monomer formation, and by surface plasmon resonance to measure their affinities for the target. The best clones are used in the next round of library generation to further improve their properties.

Ejemplo: Construcción de una biblioteca basada en veneno de serpienteExample: Building a library based on snake venom

[0332]Se crearon bibliotecas visualizadas en fago de 10e8 a 10e10 del andamiaje de la toxina de 3 dedos (3FT) con aminoácidos parcialmente aleatorizados de la punta del dedo 1 y la parte descendente del dedo 2 o la punta del dedo 3 y la parte ascendente del dedo 2 mediante procedimientos convencionales. [0332]Phage-displayed libraries of 10e8 to 10e10 of the 3-finger toxin (3FT) scaffold were created with partially randomized amino acids from the tip of finger 1 and the descending part of finger 2 or the tip of finger 3 and the ascending finger 2 using conventional procedures.

[0333]Se usaron dos andamiajes de 3FT como molde para la generación de la biblioteca de 3FT (configuración de dedos 1 y 2). La estructura de un andamiaje de 3FT y un alineamiento de múltiples secuencias de secuencias relacionadas se muestra en la Fig. 33. Se diseñó una biblioteca de forma que dos bucles de superficie de la toxina están aleatorizados como se ilustra en la Fig. 34. La biblioteca de andamiaje de 3FT parcialmente aleatorizada se generó solapando cuatro oligonucleótidos que codifican la biblioteca en las regiones de hibridación y usando PCR de estiramiento a través (“puM-through”), seguido de clonación por restricción (Sfil/BstXI) en el vector de fagémido pMP003. La biblioteca de 3FT resultante se designó LMP041. [0333]Two 3FT scaffolds were used as templates for the generation of the 3FT library (finger configuration 1 and 2). The structure of a 3FT scaffold and a multiple sequence alignment of related sequences is shown in Fig. 33. A library was designed such that two surface loops of the toxin are randomized as illustrated in Fig. 34. The A partially randomized 3FT scaffold library was generated by overlapping four oligonucleotides encoding the library in the hybridization regions and using stretch-through PCR (puM-through), followed by restriction cloning (Sfil/BstXI) into the vector. phagemid pMP003. The resulting 3FT library was designated LMP041.

Ejemplo: Injerto de péptidos de unión en andamiajes de microproteína - aleatorización asistida por péptidos específicos para dianaExample: Grafting binding peptides onto microprotein scaffolds – target-specific peptide-assisted randomization

[0334]El objetivo aquí es usar los péptidos que se han identificado que son específicos para diana de interés con el fin de generar 3SS más ligantes específicos para diana. Esta estrategia se ilustra usando transferencia de péptidos específica para VEGF en la punta del dedo 1 de andamiaje de 3FT y modificando los residuos de AA del dedo 2, que están en estrecha proximidad de la secuencia específica para diana para generar ligantes de VEGF de alta afinidad. Las bibliotecas visualizadas de fago de 10e8 a 10e10 del andamiaje de la toxina de 3 dedos (3FT) con secuencia específica para VEGF de la punta de dedo 1 y parte descendente parcialmente aleatorizada del dedo 2 se creó mediante procedimientos convencionales como se describe en el ejemplo anterior, excepto que 2 cebadores directos del dedo 1 aleatorios se sustituyeron por cebador directo específico para F1-VEGF que codifica la siguiente secuencia: P S G P S C H T T N H W P I S A V T C P P. [0334]The goal here is to use peptides that have been identified to be specific for targets of interest in order to generate 3SS plus target-specific binders. This strategy is illustrated using VEGF-specific peptide transfer into the tip of finger 1 of the 3FT scaffold and modifying the AA residues of finger 2, which are in close proximity to the target-specific sequence to generate high-affinity VEGF binders. . Phage display libraries 10e8 to 10e10 of the 3-finger toxin (3FT) scaffold with VEGF-specific sequence of finger tip 1 and partially randomized downstream part of finger 2 were created by standard procedures as described in the example above, except that 2 random finger 1 forward primers were replaced with F1-VEGF-specific forward primer encoding the following sequence: P S G P S C H T T N H W P I S A V T C P P.

[0335]La biblioteca del andamiaje de 3FT (específica para VEGF) centrada con el dedo 2 parcialmente aleatorizado se generó solapando cuatro oligonucleótidos que codifican la biblioteca en las regiones de hibridación y usando PCR de estiramiento a través (“pull-through”), seguido de clonación por restricción (SfiI/BstXI) en el vector de fagémido pMP003. La biblioteca de 3FT resultante se designó LMP042. [0335]The 3FT scaffold library (specific for VEGF) centered with partially randomized finger 2 was generated by overlapping four oligonucleotides encoding the library in the hybridization regions and using pull-through PCR, followed by restriction cloning (SfiI/BstXI) into the phagemid vector pMP003. The resulting 3FT library was designated LMP042.

Ejemplo: Semivida en plasma de una MURPExample: Plasma half-life of a MURP

[0336]La semivida en plasma de MURP pueden medirse después de inyección i.v. o i.p. de la MURP en ratas cateterizadas esencialmente como se describe por [Pepinsky, R. B. y col. (2001) J Pharmacol Exp Ther, 297: 1059 66]. Pueden extraerse muestras de sangre en diversos momentos de tiempo (5 min, 15 min, 30 min, 1 h, 3 h, 5 h, 1 d, 2 d, 3 d) y la concentración en plasma de la MURP puede medirse usando ELISA. Los parámetros farmacocinéticos pueden calcularse usando WinNonlin versión 2.0 (Scientific Consulting Inc., Apex, NC). Para analizar el efecto del módulo de URP puede compararse la semivida en plasma de una proteína que contiene el módulo de URP con la semivida en plasma de la misma proteína que carece del módulo de URP. [0336]The plasma half-life of MURP can be measured after i.v. injection. or i.p. of MURP in catheterized rats essentially as described by [Pepinsky, R. B. et al. (2001) J Pharmacol Exp Ther, 297: 1059 66]. Blood samples can be drawn at various time points (5 min, 15 min, 30 min, 1 h, 3 h, 5 h, 1 d, 2 d, 3 d) and the plasma concentration of MURP can be measured using ELISA . Pharmacokinetic parameters can be calculated using WinNonlin version 2.0 (Scientific Consulting Inc., Apex, NC). To analyze the effect of the URP module, the plasma half-life of a protein containing the URP module can be compared with the plasma half-life of the same protein lacking the URP module.

Ejemplo: Prueba de solubilidad de una MURPExample: Solubility test of a MURP

[0337] La solubilidad de MURP puede determinarse concentrando muestras purificadas de MURP en tampones fisiológicos como solución salina tamponada con fosfato a concentraciones diversas en el intervalo de 0,01 mg/ml a 10 mg/ml. Las muestras pueden incubarse para hasta varias semanas. Muestras en las que la concentración supera la solubilidad de la MURP muestran precipitación como se indica por turbidez, que puede medirse en un lector de absorbancia. Puede eliminarse material precipitado por centrifugación o filtración y medir la concentración de proteína restante en el sobrenadante usando un ensayo de proteína como el ensayo de Bradford midiendo la absorbancia a 280 nm. Los estudios de solubilidad pueden acelerarse congelando las muestras a -20 °C y posterior descongelación. Este procedimiento frecuentemente conduce a la precipitación de proteínas escasamente solubles.[0337] The solubility of MURP can be determined by concentrating purified samples of MURP in physiological buffers such as phosphate-buffered saline at various concentrations in the range of 0.01 mg/ml to 10 mg/ml. Samples can be incubated for up to several weeks. Samples where the concentration exceeds the solubility of MURP show precipitation as indicated by turbidity, which can be measured in an absorbance reader. Precipitated material can be removed by centrifugation or filtration and the remaining protein concentration in the supernatant measured using a protein assay such as the Bradford assay by measuring absorbance at 280 nm. Solubility studies can be accelerated by freezing samples at -20°C and subsequent thawing. This procedure frequently leads to the precipitation of poorly soluble proteins.

Ejemplo: Actividad de unión a suero de MURPExample: Serum binding activity of MURP

[0338] Pueden recubrirse MURP de interés en placas de microtitulación y proteínas de control en otros pocillos de la placa. Posteriormente, pueden añadirse muestras de suero de interés a los pocillos durante 1 hora. Posteriormente, los pocillos pueden lavarse con un lavador de placas. Las proteínas del suero unidas pueden detectarse añadiendo anticuerpos contra las proteínas del suero que se han conjugado con enzimas como peroxidasa de rábano picante o fosfatasa alcalina para la detección. Otra forma de detectar la unión del suero a MURP, añadir la MURP de interés a suero durante aproximadamente 1 hora para permitir la unión. Posteriormente, puede inmunoprecipitarse la MURP usando un anticuerpo contra un epítope en la secuencia de MURP. Las muestras precipitadas pueden analizarse por PAGE y opcionalmente por Western para detectar cualquier proteína que co-precipitó con la MURP. Pueden identificarse proteínas del suero que muestran co-precipitación por espectrometría de masas.[0338] MURPs of interest can be coated on microtiter plates and control proteins on other wells of the plate. Subsequently, serum samples of interest can be added to the wells for 1 hour. The wells can then be washed with a plate washer. Bound serum proteins can be detected by adding antibodies against serum proteins that have been conjugated with enzymes such as horseradish peroxidase or alkaline phosphatase for detection. Another way to detect serum binding to MURP, add the MURP of interest to serum for approximately 1 hour to allow binding. MURP can then be immunoprecipitated using an antibody against an epitope in the MURP sequence. Precipitated samples can be analyzed by PAGE and optionally by Western to detect any proteins that co-precipitated with MURP. Serum proteins showing co-precipitation can be identified by mass spectrometry.

Claims

1. Procedure for increasing the serum half-life of a protein, comprising:

fusing said protein with one or more unstructured recombinant polymers (URP), wherein the URP comprises at least about 200 contiguous amino acids, and wherein

(a) The sum of the glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P) residues contained in the URP constitutes more than approximately 80% of the total amino acids of the URP; and

(b) at least 50% of the amino acids of the URP are not present in the secondary structure as determined by the Chou-Fasman algorithm; and wherein said URP is substantially incapable of binding non-specifically to a whey protein; and

(c) the URP has a T epitope score equal to or less than -4.

2. Method of claim 1, wherein the serum half-life of the protein is prolonged by at least 2-fold.

3. Method of claim 1, wherein the URP comprises a non-natural amino acid sequence.

4. Method of claim 1, wherein the URP substantially lacks secondary structure as determined by the Chou-Fasman algorithm.

5. Method of claim 1, wherein glycine residues contained in the URP constitute at least about 50% of the total amino acids of the URP.

6. Method of claim 1, wherein the URP comprises sequence repetition.

7. Method of claim 1, wherein the protein is a pharmaceutically active protein.

8. Method of claim 1, wherein the protein comprises one or more modules selected from the group consisting of binding modules, effector modules, multimerization modules, C-terminal modules and N-terminal modules.

9. Method of claim 7, wherein the pharmaceutically active protein is selected from the group consisting of cytokines, growth factors, enzymes, receptors, microproteins, hormones, erythropoietin, adenosine deiminase, asparaginase, arginase, interferon, growth hormone , growth hormone releasing hormone, G-CSF, GM-CSM, insulin, hirudin, TNF receptor, uricase, rasburicase, axokine, RNase, DNase, phosphatase, Pseudomonas exotoxin, ricin, gelonin, desmoteplase, laronidase, thrombin, enzyme blood coagulation, VEGF, protropin, somatropin, alteplase, interleukin, factor VII, factor VIII, factor

10. Method of claim 1, wherein any one type of amino acids alone selected from the group consisting of glycine (G), aspartate (D), alanine (A), serine (S), threonine (T), glutamate (E) and proline (P) contained in the URP constitute more than about 20% or more of the total amino acids of the URP.