MX2007005865A - Adamios de proteina y usos de los mismos. - Google Patents

Adamios de proteina y usos de los mismos.

Info

Publication number
MX2007005865A
MX2007005865A MX2007005865A MX2007005865A MX2007005865A MX 2007005865 A MX2007005865 A MX 2007005865A MX 2007005865 A MX2007005865 A MX 2007005865A MX 2007005865 A MX2007005865 A MX 2007005865A MX 2007005865 A MX2007005865 A MX 2007005865A
Authority
MX
Mexico
Prior art keywords
monomer
domain
domains
monomer domain
library
Prior art date
Application number
MX2007005865A
Other languages
English (en)
Inventor
Willem P C Stemmer
Martin Vogt
Josh Silverman
Joost A Kolkman
Original Assignee
Amben Mountain View Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Amben Mountain View Inc filed Critical Amben Mountain View Inc
Publication of MX2007005865A publication Critical patent/MX2007005865A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • C07K14/71Receptors; Cell surface antigens; Cell surface determinants for growth factors; for growth regulators
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6845Methods of identifying protein-protein interactions in protein mixtures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value
    • G01N2500/04Screening involving studying the effect of compounds C directly on molecule A (e.g. C are potential ligands for a receptor A, or potential substrates for an enzyme A)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Toxicology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Cell Biology (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Endocrinology (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La presente invencion proporciona dominios de monomero de trombospondina, tiroglobulina y trebol/PD y multimeros que comprenden los dominios de monomero. Tambien se incluyen metodos, composiciones, bibliotecas y celulas que expresan uno o mas miembros de biblioteca junto con equipos y sistemas integrados en la presente invencion.

Description

ANDAMIOS DE PROTEINA Y USOS DE LOS MISMOS ANTECEDENTES DE LA INVENCIÓN El análisis de secuencias de proteina y estructuras tridimensionales han revelado que muchas proteínas estén compuestas de un número de dominios de monómero discretos. Tales proteínas son llamadas frecuentemente "proteínas de mosaico" debido a que son un mosaico lineal de bloques de construcción recurrentes. La mayoría de las proteínas de dominio de monómero discreto son extracelulares o constituyen las partes extracelulares de proteínas membrana-enlazadas. Una característica importante de un dominio de monómero discreto es su habilidad para plegarse independientemente de los otros dominios en la misma proteína. El pliegue de estos dominios puede requerir asistencia limitada de, por ejemplo, una chaperonina (s) (por ejemplo, una proteína receptor-asociada (RAP) ) , un (os) ion (es) de metal, o un cofactor. La habilidad para plegarse independientemente impide el plegado equivocado del dominio cuando es insertado a una nueva proteína o un nuevo medio ambiente. Esta característica ha permitido que los dominios de monómero discretos sean evolucionalmente móviles. Como resultado, los dominios discretos se han esparcido durante la evolución y se presentan ahora en proteínas de otra manera no relacionadas. Tales dominios, en los que se incluyen los dominios de fibronectina tipo III y el dominio semejante a inmunoglobulina, se presentan en numerosas proteínas, en tanto que otros dominios son solamente encontrados en un número limitado de proteínas. Las proteínas que contienen estos dominios están involucradas en una variedad de procesos, tales como transportadores celulares, movimiento de colesterol, transducción de señal y funciones de señalización que están involucradas en el desarrollo y neurotransmisión. Véase Herz, (2001) Trends in Neurosciences 24(4): 193-195; Goldstein and Brown, (2001) Science 292: 1310-1312. La función de un dominio de monómero discreto es frecuentemente específica pero también contribuye a la actividad global de la proteína o polipéptido. Por ejemplo, el dominio del LDL-receptor clase A (también denominado como módulo de clase A, una repetición tipo complemento o un dominio A) está involucrado en el enlace de ligando, en tanto que el dominio de ácido gamma-carboxiglutámico (Gla) que es encontrado en las proteínas de coagulación de sangre dependiente de vitamina K está involucrado en el enlace de alta afinidad a membranas de fosfolípido. Otros dominios de monómero discreto incluyen, por ejemplo, el dominio semejante al factor de crecimiento epidérmico (EGF) en el activador de plasminógeno de tipo tejido que modera el enlace a las células del hígado y regula mediante esto el despeje de esta enzima fibrinolítica de la circulación y la cola citoplásmica del LDL-receptor que está involucrada en la endocitosis moderada por receptor.
Las proteínas individuales pueden poseer uno o más dominios de monómero discreto. Las proteínas que contienen un gran número de dominios recurrentes son frecuentemente llamadas proteínas de mosaico. Por ejemplo, los miembros de la familia del receptor LDL contienen un gran número de dominios que pertenecen a cuatro familias principales: las repeticiones de dominio A ricas en cisteína, repeticiones semejantes a precursor del factor de crecimiento epidérmico, un dominio de transmembrana y un dominio citoplásmico. La familia del receptor LDL incluye miembros que: (1) son receptores de la superficie celular; (2) reconocen ligandos extracelulares; y (3) los internalizan para su degradación por lisosomas. Véase Hussain et al., (1999) Annu. Rev. Nutr. 19:141-72. Por ejemplo, algunos miembros incluyen receptores de lipoproteína de muy baja densidad (VLDL-R), receptor 2 de alipoproteína E, proteína LDLR-relacionada (LRP) y megalina. Los miembros de familia tienen las siguientes características: (1) expresión de superficie celular; (2) enlace de ligando extracelular moderado por dominios A; (3) requerimiento de calcio para el plegado y enlace de ligando; (4) reconocimiento de proteína receptor-asociada y apolipoproteína (apo) E; (5) dominio de homología del precursor del factor de crecimiento epidérmico (EGF) que contienen repeticiones Y TD; (6) región que abarca una sola membrana; y (7) endocitosis moderada por receptor de varios ligandos. Véase Hussain, supra. Estos miembros de familia se enlazan a varios ligandos estructuralmente disimilares. Es ventajoso desarrollar métodos para generar y optimizar las propiedades deseadas de estos dominios de monómero discretos. Sin embargo, los dominios de monómero discretos, en tanto que frecuentemente son conservados estructuralmente, no son conservados a nivel de nucleótido o de aminoácido, excepto por ciertos aminoácidos, por ejemplo, los residuos de cisteína en el dominio A. Así, los métodos de recombinación de nucleótidos existentes caen cortos para generar y optimizar las propiedades deseadas de estos dominios de monómero discretos. La presente invención trata estos y otros problemas.
BREVE DESCRIPCIÓN DE LA INVENCIÓN La presente invención proporciona proteínas que comprenden dominios de monómero que se enlazan específicamente a moléculas objetivo, polinucleótidos que codifican las proteínas, métodos para usar tales proteínas, método para identificar dominios de monómero para uso en tales proteínas, y bibliotecas que comprenden dominios de monómero. Una modalidad de la invención proporciona proteínas que comprenden un dominio de monómero que no se presenta de manera estable en la naturaleza que se enlaza específicamente a una molécula objetivo. El dominio de monómero es de 30-100 aminoácidos de longitud y es seleccionado de un dominio de monómero de trombospondina y un dominio de monómero de tiroglobulina. En algunas modalidades, el dominio de monómero comprende por lo menos uno, dos, tres o más enlaces de disulfuro. En algunas modalidades, C_-C5, C2-C6 y C3-C4 del dominio de monómero de trombospondina forman enlaces de disulfuro y C?-C2, C3-C4 y C5-C6 del dominio de monómero de tiroglobulina forman enlaces de disulfuro. En algunas modalidades, la secuencia de dominio de monómero de trombospondina comprende no más de tres inserciones puntuales, mutaciones o cancelaciones de la siguiente secuencia: ( xx xx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx ( x) xxxC5 (x) xxxxC6 ; y el dominio de monómero de tiroglobulina comprende no más de tres inserciones puntuales, mutaciones o cancelaciones de la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxx QC3x (x) s (xxx) xxgxC C5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 ; en donde "x" es cualquier aminoácido. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) C!SXtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx ( x) xxxC5 (x) xxxxC6; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxx QC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 ; en donde "x" es cualquier aminoácido. En algunas modalidades, la secuencia de dominio de monómero de trombospondina comprende no más de tres inserciones puntuales, mutaciones o cancelaciones de la siguiente secuencia: (WxxWxx) C? [Stad] [Vkaq] [Tspl] C2xx [Gq] xx ( x) x [Re] x [Rktvm] x [C3vldr] xxxx ( [Pq] xx) xxxxx [C4ldae] xxxxxx (x) xxxC5 ( x)xxxxC6, en donde C1-C5, C2-C6 y C3-C4 forman enlaces de disulfuro; la secuencia de dominio de monómero de tiroglobulina comprende no más de tres inserciones puntuales, mutaciones o cancelaciones de la siguiente secuencia: Ci [qerl ] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahp] xPxC2xxxGx [a] xx [v krl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx (x) Gxxxx [fg] xxxxxgxx (xx )xC6, en donde C?-C2, C3-C4 y C5-C6 forman enlaces de disulfuro; a es seleccionado de: w, y, f, y 1; f es seleccionado de: d, e, y n; y "x" es seleccionado de cualquier aminoácido. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) Ci [Stnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [Rktvm] x [C3vldr] x xxx ( [Pq] xx) xxxxx [Cldae] xxxxxx (x) xxxC5 (x) xxxxC6, en donde C?-C5, C2-C6 y C3-C4 forman enlaces de disulfuro; el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahp] xPxC2xxxGx [a] xx [v krl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx (x) Gxxxx [fg] xxxxxgxx (xx )xCs, en donde C?-C2, C3-C4 y C5-C6 forman enlaces de disulfuro; y a es seleccionado de: w, y, f y 1 ; f es seleccionado de: d, e, y n; y "x" es seleccionado de cualquier aminoácido. En algunas modalidades, la secuencia de dominio de monómero de trombospondina comprende no más de tres inserciones puntuales, mutaciones o cancelaciones de la siguiente secuencia: Ci [nst] [aegildqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrst] x [ almrtv] xC3xxxxxxxxx (xxxxxxx) C4xxxxxxxxx (xx) C5xxxxC6 ; la secuencia de dominio de monómero de tiroglobulina comprende no más de tres inserciones puntuales, mutaciones o cancelaciones de la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Yf] xx [vkrl] QC3x (x [sa] xxx) xx [Gsa] xC4 [Wyf] C5V [Dnyf1] xx (x) Gxxxx [Gdne] xxx xxgxx (xx) xC6. En algunas modalidades, el monómero de trombospondina comprende la siguiente secuencia: Ci [nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrst] x [ almrtv] xC3Xx xxx (xxxxxxx) Cxxxxxxxxx (xx) C5xxxxC6 ,- y la secuencia de dominio de monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx(xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Yf] xx [vkrl] QC3x (x [sa] xxx) xx [Gsa] xC4 [Wyf] C5V [Dnyf1] xx (x) Gxxxx [Gdne] xxx xxgxx (xx) xC6. La invención también proporciona una proteína, un dominio de monómero que no se presentan de manera estable en la naturaleza que se enlaza específicamente a una molécula objetivo. La molécula objetivo no es enlazada por un dominio de monómero que se presenta de manera estable en la naturaleza que es por lo menos 75%, 80%, 85%, 90%, 85%, 98% o 99% idéntico al dominio de monómero que no se presenta de manera estable en la naturaleza y el dominio de monómero que no se presenta de manera estable en la naturaleza es seleccionado de un dominio de monómero de trombospondina, un dominio de monómero de trébol, y un dominio de monómero de tiroglobulina. En algunas modalidades, el dominio de monómero comprende por lo menos uno, dos, tres o más enlaces de disulfuro. En algunas modalidades, el dominio de monómero es de 30-100 aminoácidos de longitud. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx (x) xxxC5 (x) x xxxC6; el dominio de monómero de trébol comprende la siguiente secuencia : Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxgC4C5fdxxx ( x)xxxpwC6f; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 y "x" es cualquier aminoácido. En algunas modalidades, C!-C5, C2 -C6 y C3-C4 del dominio de monómero de trombospondina forman enlaces de disulfuro; y C?-C2, C3-C y C5-C6 del dominio de monómero de tiroglobulina forman enlaces de disulfuro. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) C? [Stnd] [Vkaq] [Tspl ] C2xx [Gq] xx (x) x [Re] x [Rktvm] x [C3vldr] x xxx ( [Pq] xx) xxxxx [C4ldae] xxxxxx (x) xxxC5 (x) xxxxC6 , en donde C?-C5 , C2-C6 y C3-C forman enlaces de disulfuro; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst] ( [de]x) [pskq] x [Ivap] [Ts a] xx [keqd] C3xx [krln] [Gnk]C4C5[a] [Dnrs] [sdpnte] xx (x) xxx [pki] [Weas h] C6 [Fy] ,- el dominio de monómero de tiroglobulina comprende la siguiente secuencia: C?[qerl]xxxxxxxxxxxxxx(xxxxxxxxxx)xxxxxxx [ahp] xPxC2xxxGx [a] xx [ vkrl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx ( x) Gxxxx [fg] xxxxxgxx ( xx ) xC6, en donde C?-C2, C3-C4 y C5-C6 forman enlaces de disulfuro; y a es seleccionado de: w, y, f y 1 ,- f es seleccionado de: d, e, y n; y "x" es seleccionado de cualquier aminoácido. En algunas modalidades, el monómero de trombospondina comprende la siguiente secuencia: Ci [nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrst] x [ almrtv] xC3xxxxxxxxx (xxxxxxx) C4xxxxxxxxx (xx) C5xxxxC6 ; el dominio de monómero de trébol comprende la siguiente secuencia: C?( [dnps]) [adiklnprstv] [dfilmv] [adenprst] [adelprv] [ehklnqrs] [ad egknsv] [kqr] [fiklqrtv] [dnpqs] C2 [agiy] [flpsvy] [dknpqs] [adfghlp] [ aipv] [st] [aegkpqrs] [adegkpqs] [deiknqt] C3 [adefknqrt] [adegknqs] [g n] C4C5 [wyf h] [deinrs] [adgnpst] [aefgqlrstw] [giknsvmq] ( [afmprstv] [ degklns] [afiqstv] [iknpv]w)C6; y el monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Yf ] xx [vkrl] QC3x(x[sa] xxx) xx [Gsa] xC4 [Wyf] C5V [Dnyf l]xx(x) Gxxxx [Gdne] xxx xxgxx (xx) xC6. La invención proporciona además una composición que comprende por lo menos dos dominios de monómero, en donde por lo menos un dominio de monómero es un dominio de monómero que no se presenta de manera estable en la naturaleza y los dominios de monómero se enlazan a un ion y por lo menos un dominio de monómero es seleccionado de: un dominio de monómero de trombospondina, un dominio de monómero de trébol, y un dominio de monómero de tiroglobulina. En algunas modalidades, por lo menos uno de los dos dominios de monómero es menor de aproximadamente 50 kD. En algunas modalidades, los dos dominios son enlazados por un enlazador de péptido. En algunas modalidades, en donde el enlazador es heterólogo a por lo menos uno de los dominios de monómero. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia : (WxxWxx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx ( x) xxxC5 (x) xxxxCs ; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxg C4C5fdxxx (x) xxxpwC6f ; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6; y "x" es cualquier aminoácido. En algunas modalidades, C?-C5/ C2-C6 y C3-C4 del dominio de monómero de trombospondina forman enlaces de disulfuro; y C?-C2, C3-C4 y C5-C6 del dominio de monómero de tiroglobulina forman enlaces de disulfuro. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) Ci [Stnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [Rktvm] x [C3vldr] xxxx ( [Pq] xx) xxxxx [C4ldae] xxxxxx (x) xx xC5 (x) xxxxC6, en donde C1-C5, C2-C6 y C3-C4 forman enlaces de disulfuro; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst] ([de]x) [pskq]x[Ivap] [Tsa] xx [keqd] C3xx [krln] [Gnk]C4C5[a] [Dnrs] [sd pnte] xx (x) xxx [pki] [Weash] C6 [Fy] ; el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahp] xPxC2xxxGx [a] xx [v krl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx (x) Gxxxx [fg] xxxxxgxx (xx )xC6, en donde C?-C2, C3-C4 y C5-C6 forman enlaces de disulfuro; y a es seleccionado de: w, y, f y 1 ; f es seleccionado de: d, e y n; y "x" es seleccionado de cualquier aminoácido. En algunas modalidades, el monómero de trombospondina comprende la siguiente secuencia: Ci [nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrst] x [ahmrtv] xC3xxxxxxxxx (xxxxxxx) C4xx xxxxxxx ( xx ) C5xxxxC6; el dominio de monómero de trébol comprende la siguiente secuencia: C?([dnps]) [adiklnprstv] [dfilmv] [adenprst] [adelprv] [ehklnqrs] [adegknsv] [kqr] [fiklqrtv] [dnpqs] C2 [agiy] [flpsvy] [dknp qs] [adfghlp] [aipv] [st] [aegkpqrs] [adegkpqs] [deiknqt] C3 [adef knqrt ] [adegknqs] [gn] C4C5 [Wyf h] [deinrs] [adgnpst] [aefgqlrstw] [giknsvmq ] ( [af inprstv] [degklns] [afiqstv] [iknpv]w)C6; y el monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Yf] xx [vkrl] QC3x (x [sa] xxx) xx [Gsa] x4 [Wyf] C5V [Dnyf1] xx (x ) Gxxxx [Gdne] xxxxxgxx (xx) xC6 - La invención proporciona además polinucleótidos aislados que codifica las proteínas descritas en la presente y células que comprenden los polinucleótidos. La invención también proporciona métodos para identificar un dominio de monómero que se enlaza a una molécula objetivo al: (1) proporcionar una biblioteca de dominios de monómero que no se presentan de manera estable en la naturaleza, en donde el dominio de monómero es seleccionado de: un dominio de monómero de trombospondina, un dominio de monómero de trébol, y un dominio de monómero de tiroglobulina, en donde el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx (x) xxxC5 (x) xxxxC6 ; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxgC4C5fdxxx (x) xxxpwC6f ; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxCxxx GxyxxxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 ; y "x" es cualquier aminoácido; (2) seleccionar la biblioteca de dominios de monómero en cuando a afinidad a una primera molécula objetivo; y (3) identificar por lo menos un dominio de monómero que se enlaza a por lo menos una molécula objetivo. En algunas modalidades, el por lo menos un dominio de monómero se enlaza específicamente a una molécula objetivo que no es enlazada por un dominio de monómero que se presenta de manera estable en la naturaleza que es por lo menos 90% idéntico al dominio de monómero que no se presenta de manera estable en la naturaleza. En algunas modalidades, C?-C5, C2-C6 y C3-C4 del dominio de monómero de trombospondina forman enlaces de disulfuro; y C?-C2, C3-C4 y C5-C6 del dominio de monómero de tiroglobulina forman enlaces de disulfuro. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) d [Stnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [Rktvm] x [C3vldr] xxxx ( [Pq] xx) xxxxx [C4ldae] xxxxxx (x) xx xC5 (x)xxxxC6, en donde C?-C5/ C2-C6 y C3-C4 forman enlaces de disulfuro; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst] ([de]x) [pskq]x[Ivap] [Tsa] xx [keqd] C3xx [krln] [Gnk] C4C5 [a] [Dnrs] [sd pnte] xx (x) xxx [pki] [Weash] Cß [Fy] ; el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahp] xPxC2xxxGx [a] xx [vkrl ] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx (x) Gxxxx [fg] xxxxxgxx (xx) xC6, en donde C?-C2, C3-C4 y C5-C6 forman enlaces de disulfuro; y a es seleccionado de: w, y, f y 1 ; f es seleccionado de: d, e y n; y "x" es seleccionado de cualquier aminoácido. En algunas modalidades, el monómero de trombospondina comprende la siguiente secuencia: Ci [nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrst] x [almrtv] xC3xxxxxxxxx (xxxxxxx) C4xxxxxxxxx (x x)C5xxxxC6; el dominio de monómero de trébol comprende la siguiente secuencia: C?([dnps]) [adiklnprstv] [dfilmv] [adenprst] [adelprv] [ehklnqrs] [adegknsv] [kqr] [fiklqrtv] [dnpqs] C2 [agiy] [flp svy] [dknpqs] [adfghlp] [aipv] [st] [aegkpqrs] [adegkpqs] [deiknqt] C3 [ adefknqrt] [adegknqs] [gn] C4C5 [wyfh] [deinrs] [adgnpst] [aefgqlrstw] [giknsvmq] ( [afmprstv] [degklns] [afiqstv] [iknpv]w)C6; y el monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Yf] xx [vkrl] QC3x(x[sa]xxx) xx[Gsa] xC4 [Wyf] C5V [Dnyf1] xx (x) Gxxxx [Gdne] xxx xxgxx (xx) xC6. En algunas modalidades, el método comprende además enlazar los dominios de monómero identificados a un segundo dominio de monómero para formar un biblioteca de multímeros, cada multímero comprende por lo menos dos dominios de monómero; seleccionar la biblioteca de multímeros en cuanto a la habilidad para enlazarse a la primera molécula objetivo; e identificar un multímero que se enlaza a la primera molécula objetivo. Cada dominio de monómero del multímero seleccionado se enlaza a la misma molécula objetivo o a diferentes moléculas objetivo. En algunas modalidades, el multímero seleccionado comprende dos, tres, cuatro o más dominios de monómero. En algunas modalidades, el método comprende además la etapa de mutar por lo menos un dominio de monómero, proporcionando mediante esto una biblioteca que comprende dominios de monómero mutados. En algunas modalidades, la etapa de mutación comprende recombinar una pluralidad de fragmentos de polinucleótido de por lo menos un polinucleótido que codifica un dominio de polipéptido. En algunas modalidades, los métodos comprenden además seleccionar la biblioteca de dominios de monómero en cuanto a afinidad a una segunda molécula objetivo; identificar un dominio de monómero que se enlaza a una segunda molécula objetivo; enlazar por lo menos un dominio de monómero con afinidad por la primera molécula objetivo con por lo menos un dominio de monómero con afinidad por la segunda molécula objetivo, formando mediante esto un multímero con afinidad por la primera y segunda molécula objetivo. En algunas modalidades, la biblioteca de dominios de monómero es expresada como una indicación o exhibición de fago, indicación o exhibición de ribosoma o indicación o exhibición de superficie celular. En algunas modalidades, la biblioteca de dominios de monómero es presentada en un microarreglo. La invención comprende además una biblioteca de proteínas que comprenden dominios de monómero que no se presentan de manera estable en la naturaleza, en donde el dominio de monómero es seleccionado de: un dominio de monómero de trombospondina, un dominio de monómero de trébol, y un dominio de monómero de tiroglobulina. En algunas modalidades, el dominio de monómero de trombospondina comprende la siguiente secuencia : (WxxWxx) dsxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxCxxxxxx (x) xxxC5 (X) XXXXC6 ; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxg C4C5fdxxx (x) xxxpwCsf ; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgx x(xx)xC6; y "x" es cualquier aminoácido. En algunas modalidades, cada dominio de monómero de los multímeros es un dominio de monómero que no se presentan de manera estable en la naturaleza. En algunas modalidades, la biblioteca comprende una pluralidad de multímeros, en donde los multímeros comprenden por lo menos dos dominios de monómero enlazados por un enlazador. En algunas modalidades, la biblioteca comprende por lo menos 100 proteínas diferentes que comprenden diferentes dominios de monómero . La presente invención proporciona métodos para identificar monómeros de dominio y multímeros que se enlazan a una molécula objetivo. En algunas modalidades, el método comprende: proporcionar una biblioteca de dominios de monómero; seleccionar la biblioteca de dominios de monómero en cuanto a afinidad a una primera molécula objetivo; e identificar por lo menos un dominio de monómero que se enlaza a por lo menos una molécula objetivo. En algunas modalidades, cada uno de los dominios de monómero se enlazan a un ion (por ejemplo, calcio) . En algunas modalidades, los métodos comprenden además enlazar los dominios de monómero identificados a un segundo dominio de monómero para formar un biblioteca de multímeros, cada multímero que comprende por lo menos dos dominios de monómero; seleccionar la biblioteca de multímeros en cuanto a la habilidad para enlazarse a la primera molécula objetivo; e identificar un multímero que se enlaza a la primera molécula objetivo . En algunas modalidades, cada dominio de monómero del multímero seleccionado se enlaza a la misma molécula objetivo. En algunas modalidades, el multímero seleccionado comprende tres dominios de monómero. En algunas modalidades, el multímero seleccionado comprende cuatro dominios de monómero. En algunas modalidades, los dominios de monómero son seleccionados de un dominio de trombospondina tipo I, un dominio de repetición de tiroglobulina tipo I, un dominio de trébol (tipo P) , y un dominio semejante a EGF (por ejemplo, un dominio semejante a EGF tipo laminina) . En algunas modalidades, los métodos comprenden una etapa adicional de mutar por lo menos un dominio de monómero, proporcionando mediante esto una biblioteca que comprende dominios de monómero mutados. En algunas modalidades, la etapa de mutación comprende recombinar una pluralidad de fragmentos de polinucleótido de por lo menos un polinucleótido que codifica un dominio de monómero. En algunas modalidades, la etapa de mutación comprende evolución directa; combinación de diferentes secuencias de bucle; mutagénesis dirigida al sitio; o recombinación dirigida al sitio para crear cruces que dan como resultado la generación de secuencias que son idénticas a secuencias humanas. En algunas modalidades, los métodos comprenden además: seleccionar la biblioteca de dominios de monómero en cuanto a afinidad a una segunda molécula objetivo; identificar un dominio de monómero que se enlaza a una segunda molécula objetivo; enlazar por lo menos un dominio de monómero con afinidad por la primera molécula objetivo con por lo menos un dominio de monómero con afinidad por la segunda molécula objetivo, formando mediante esto un multímero con afinidad por la primera y segunda molécula objetivo. En algunas modalidades, la molécula objetivo es seleccionada del grupo que consiste de un antígeno viral, un antígeno bacteriano, un antígeno fungal, una enzima, una proteína de superficie celular, una proteína intracelular, un inhibidor de enzima, una molécula reportero, una proteína de suero y un receptor. En algunas modalidades, el antígeno viral es un polipéptido requerido para replicación viral. En algunas modalidades, la biblioteca de dominios de monómero es expresada mediante despliegue de fago, despliegue de fagémido, despliegue de ribosoma, despliegue de polisoma o despliegue de superficie celular (por ejemplo, despliegue de superficie celular de E. coli), despliegue de superficie de célula de levadura o despliegue vía fusión a una proteína que se enlaza al polinucleótido que codifica la proteína. En algunas modalidades, la biblioteca de dominios de monómero es presentada en un microarreglo, que incluye cajas de microtítulo de 96 cavidades, 384 cavidades o de densidad más alta. En algunas modalidades, los dominios de monómero son enlazados mediante un enlazador de polipéptido. En algunas modalidades, el enlazador de polipéptido es un enlazador asociado naturalmente con el dominio de monómero. En algunas modalidades, el enlazador de polipéptido es un enlazador asociado naturalmente con la familia de dominios de monómero. En algunas modalidades, el enlazador de polipéptido es una variante de un enlazador asociado naturalmente con el dominio de monómero. En algunas modalidades el enlazador es un enlazador de gly-ser. En algunas modalidades, la etapa de enlace comprende enlazar los dominios de monómero con una variedad de enlazadores de diferentes longitudes y composición. En algunas modalidades, los dominios forman una estructura secundaria y terciaria mediante la formación de enlaces de disulfuro. En algunas modalidades, los multímeros comprenden un dominio A conectado a un dominio de monómero mediante un enlazador de polipéptido. En algunas modalidades, el enlazador es de 1-20 aminoácidos inclusive. En algunas modalidades, el enlazador está compuesto de de 5-7 aminoácidos. En algunas modalidades, el enlazador es de 6 aminoácidos de longitud. En algunas modalidades, el enlazador comprende las siguientes secuencias, A?A2A3A4A5As , en donde Ax es seleccionado de los aminoácidos A, P, T, Q, E y K; A2 y A3 son cualquier aminoácido excepto C, F, Y, W o M; A4 es seleccionado de los aminoácidos S, G y R; A5 es seleccionado de los aminoácidos H, P y R; A6 es el aminoácido T. En algunas modalidades, el enlazador comprende una secuencia que se presenta de manera estable en la naturaleza entre la cisteína C-terminal de un primer dominio A y la cisteína N-terminal de un segundo dominio A. En algunas modalidades el enlazador comprende glicina y serina . La presente invención también proporciona métodos para identificar un multímero que se enlaza a por lo menos una molécula objetivo, que comprende las etapas de: proporcionar una biblioteca de multímeros, en donde cada multímero comprende por lo menos dos dominios de monómero y en donde cada dominio de monómero exhibe una especificidad de enlace por una molécula objetivo; y seleccionar la biblioteca de multímeros en cuanto a multímeros de enlace de molécula objetivo. En algunas modalidades, los métodos comprenden además identificar multímeros de enlace de molécula objetivo que tienen avidez por la molécula objetivo que es mayor que la avidez de un dominio de un solo monómero por la molécula objetivo. En algunas modalidades, uno o más de los multímeros comprenden un dominio de monómero que se enlazan específicamente a una segunda molécula objetivo. Métodos alternativos para identificar un multímero que se enlaza a una molécula objetivo incluyen métodos que comprenden proporcionar una biblioteca de dominios de monómero y/o inmuno-dominios; seleccionar la biblioteca de dominios de monómero y/o inmuno-dominio en cuanto a afinidad a una primera molécula objetivo; identificar por lo menos un dominio de monómero y/o inmuno-dominio que se enlaza a por lo menos una molécula objetivo; enlazar el dominio de monómero identificado y/o inmuno-dominio a una biblioteca de dominios de monómero y/o inmuno-dominios para formar un biblioteca de multímeros, cada multímero comprende por lo menos dos dominios de monómero, inmuno-dominios o combinaciones de los mismos; seleccionar la biblioteca de multímeros en cuanto a la habilidad para enlazarse a la primera molécula objetivo; e identificar un multímero que se enlaza a la primera molécula objetivo. En algunas modalidades, cada uno de los dominios de monómero se enlazan a un ion. En algunas modalidades, el ion es seleccionado del grupo que consiste de calcio y zinc. En algunas modalidades, el enlazador comprende por lo menos 3 residuos de aminoácido. En algunas modalidades, el enlazador comprende por lo menos 6 residuos de aminoácido. En algunas modalidades, el enlazador comprende por lo menos 10 residuos de aminoácido. La presente invención también proporciona polipéptidos que comprenden por lo menos dos dominios de monómero separados por una secuencia de enlazador heteróloga. En algunas modalidades, cada dominio de monómero se enlaza específicamente a una molécula objetivo; y cada dominio de monómero es un dominio de monómero de proteína que no se presenta de manera estable en la naturaleza. En algunas modalidades, cada dominio de monómero se enlaza a un ion. En algunas modalidades, los polipéptidos comprenden un primer dominio de monómero que se enlaza a una primera molécula objetivo y un segundo dominio de monómero que se enlaza a una segunda molécula objetivo. En algunas modalidades, los polipéptidos comprenden dos dominios de monómero, cada dominio de monómero tiene una especificidad de enlace que es específica por un sitio diferente en la misma molécula objetivo. En algunas modalidades, los polipéptidos comprenden además un dominio de monómero que tiene una especificidad de enlace por una segunda molécula objetivo. En algunas modalidades, los dominios de monómero de una biblioteca, multímero o polipéptido son comúnmente alrededor 40% idénticos entre sí, usualmente alrededor de 50% idénticos, algunas veces alrededor de 60% idénticos y frecuentemente por lo menos 70% idénticos. La invención también proporciona polinucleótidos que codifican los polipéptidos descritos anteriormente. La presente invención también proporciona multímeros de inmuno-dominios que tienen especificidad de enlace por una molécula objetivo, también como métodos para generar y seleccionar bibliotecas de tales multímeros para enlace a una molécula objetivo deseada. Más específicamente, la presente invención proporciona un método para identificar un multímero que se enlaza a una molécula objetivo, el método que comprende, proporcionar una biblioteca de inmuno-dominios; seleccionar la biblioteca de inmuno-dominios en cuanto a afinidad a una primera molécula objetivo; identificar uno o más inmuno-dominios (por ejemplo, dos o más) que se enlazan a por lo menos una molécula objetivo; enlazar el dominio de monómero identificado para formar una biblioteca de multímeros, cada multímero comprende por lo menos tres inmuno-dominios (por ejemplo, cuatro o más, cinco o más, seis o más, etc.); seleccionar la biblioteca de multímeros en cuanto a la habilidad para enlazarse a la primera molécula objetivo; e identificar un multímero que se enlaza a la primera molécula objetivo. Bibliotecas de multímeros de por lo menos dos inmuno-dominios que son minicuerpos, anticuerpos de un solo dominio, Fabs o combinaciones de los mismos son también usados en la práctica de la presente invención. Tales bibliotecas pueden ser seleccionadas fácilmente en cuanto a multímeros que se enlazan a moléculas objetivo deseadas de acuerdo con los métodos de la invención descritos en la presente. La presente invención proporciona además métodos para identificar hetero- inmunomultímeros que se enlazan a una molécula objetivo. En algunas modalidades, los métodos comprenden, proporcionar una biblioteca de inmuno-dominios; seleccionar la biblioteca de inmuno-dominios en cuanto a afinidad a una primera molécula objetivo; proporcionar una biblioteca de dominios de monómero; seleccionar la biblioteca de dominios de monómero en cuanto a afinidad a una primera molécula objetivo; identificar por lo menos un inmuno-dominio que se enlaza a por lo menos una molécula objetivo; identificar por lo menos un dominio de monómero que se enlaza a por lo menos una molécula objetivo; enlazar el inmuno-dominio identificado con los dominios de monómero identificados para formar un biblioteca de multímeros, cada multímero comprende por lo menos dos dominios; seleccionar la biblioteca de multímeros en cuanto a la habilidad para enlazarse a la primera molécula objetivo; e identificar un multímero que se enlaza a la primera molécula objetivo. La presente invención también proporciona métodos para identificar un dominio de monómero de laminina EGF, un dominio de monómero de trombospondina tipo I, un dominio de monómero de tiroglobulina o un dominio de monómero de trébol que se enlaza a una molécula objetivo. En algunas modalidades, el método comprende proporcionar una biblioteca de dominios de monómero de laminina EGF, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol; seleccionar la biblioteca de dominios de monómero de laminina EGF, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol en cuando a afinidad a una molécula objetivo; e identificar un dominio de monómero de laminina-EGF, dominio de monómero de trombospondina tipo I, dominio de monómero de tiroglobulina o dominio de monómero de trébol que se enlaza a la molécula objetivo. En algunas modalidades, el método comprende enlazar cada miembro de una biblioteca de dominios de monómero de laminina-EGF, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol al dominio de monómero identificado para formar una biblioteca de multímeros; seleccionar la biblioteca de multímeros en cuanto a afinidad a la molécula objetivo; e identificar un multímero que se enlaza al objetivo. En algunas modalidades, el multímero se enlaza al objetivo con mayor afinidad que el monómero. En algunas modalidades, el método comprende además expresar la biblioteca utilizando un formato de despliegue seleccionado de un despliegue de fago, un despliegue de ribosoma, un despliegue de polisoma o un despliegue de superficie celular. En algunas modalidades, el método comprende además una etapa de mutar por lo menos un dominio de monómero, proporcionando mediante esto una biblioteca que comprende dominios de monómero de monómero de laminina-EGF mutados, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero de trébol. En algunas modalidades, la etapa de mutación comprende evolución dirigida; mutagénesis dirigida al sitio; al combinar diferentes secuencia de bucle o mediante recombinación dirigida al sitio para crear cruces que dan como resultado la generación de secuencias que son idénticas a las secuencias humanas. La presente invención también proporciona un método para producir un polipéptido que comprende el multímero identificado en un método que comprende proporcionar una biblioteca de dominios de monómeros de laminina-EGF, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol; seleccionar la biblioteca de dominios de monómero de laminina EGF, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol en cuanto a afinidad a una molécula objetivo; e identificar un dominio de monómero de laminina-EGF, dominio de monómero de trombospondina tipo I, dominio de monómero de tiroglobulina o dominio de monómero de trébol que se enlaza a la molécula objetivo. En algunas modalidades, el multímero es producido mediante expresión de genética recombinante. La presente invención también proporciona métodos para generar una biblioteca de dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol derivados de dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero de trébol. En algunas modalidades, los métodos comprenden proporcionar secuencias de bucle correspondientes a por lo menos un bucle de cada una de dos variantes que se presentan de manera estable en la naturaleza diferentes de dominios de monómero de laminina-EGF humanos, dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero trébol, en donde las secuencias de bucle son secuencias de polinucleótido o secuencias de polipéptido; combinar covalentemente secuencias de bucle para generar una biblioteca de secuencias de dominio de monómero quiméricas, cada secuencia quimérica codifica un dominio de monómero de trombospondina tipo I quimérico, dominio de monómero de tiroglobulina o dominio de monómero de trébol que tiene por lo menos dos bucles; expresar la biblioteca de dominios de monómero de trombospondina tipo I quiméricos, dominios de monómero tiroglobulina o dominios de monómero de trébol utilizando un formato de despliegue seleccionado de despliegue de fago, despliegue de ribosoma, despliegue de polisoma, y despliegue de superficie celular; seleccionar la biblioteca expresada de dominios de monómero de trombospondina tipo I quiméricos, dominios de monómero de tiroglobulina o dominios de monómero de trébol en cuanto a enlace a una molécula objetivo; e identificar un dominio de monómero de trombospondina tipo I quimérico, dominio de monómero de tiroglobulina o dominio de monómero de trébol que se enlaza a la molécula objetivo. En algunas modalidades, los métodos comprenden además enlazar el dominio de monómero de trombospondina tipo I quimérico identificado, dominio de monómero de tiroglobulina o dominio de monómero de trébol a cada miembro de la biblioteca de dominios de monómero de trombospondina tipo I quiméricos, dominios de monómero tiroglobulina o dominios de monómero de trébol para formar una biblioteca de multímeros; seleccionar la biblioteca de multímeros en cuando a la habilidad para enlazarse a la primera molécula objetivo con una afinidad incrementada; e identificar un multímero de dominios de monómero de trombospondina tipo I quiméricos, dominios de monómero tiroglobulina o dominios de monómero de trébol que se enlazan a la primera molécula objetivo con una afinidad incrementada. La presente invención también proporciona métodos de fabricación de dominio de monómero de trombospondina tipo I quimérico, dominio de monómero de tiroglobulina o dominio de monómero de trébol identificado en un método que comprende proporcionar secuencias de bucle correspondientes a por lo menos un bucle de cada una de dos variantes que se presentan de manera estable en la naturaleza diferentes de dominios de monómero de trombospondina tipo I humanos, dominios de monómero tiroglobulina o dominios de monómero de trébol, en donde las secuencias de bucle son secuencias de polinucleótidos o secuencias de polipéptidos; combinar covalentemente secuencias de bucle para generar una biblioteca de secuencias de dominio de monómero quiméricas, cada secuencia quimérica codifica un dominio de monómero de trombospondina tipo I quimérico, dominio de monómero de tiroglobulina o dominio de monómero de trébol que tiene por lo menos dos bucles; expresar la biblioteca de dominios de monómero de trombospondina tipo I quiméricos, dominios de monómero tiroglobulina o dominios de monómero de trébol utilizando un formato de despliegue seleccionado de: despliegue de fago, despliegue de ribosoma, despliegue de polisoma, y despliegue de superficie celular; seleccionar la biblioteca expresada de dominios de monómero de trombospondina tipo I quiméricos, dominios de monómero tiroglobulina o dominios de monómero de trébol en cuanto a enlace a una molécula objetivo; e identificar un dominio de monómero de trombospondina tipo I quimérico, dominio de monómero de tiroglobulina o dominio de monómero de trébol que se enlaza a la molécula objetivo. En algunas modalidades, el dominio de monómero de trombospondina tipo I quimérico, dominio de monómero de tiroglobulina o dominio de monómero de trébol es producido mediante expresión genética recombinante. En algunas modalidades, el dominio de monómero se enlaza una molécula objetivo. En algunas modalidades, el polipéptido es de 45 o menos aminoácidos de largo. En algunas modalidades, la secuencia de aminoácidos heteróloga es seleccionada de un péptido de afinidad, un dominio de monómero de trombospondina tipo I heterólogo, un dominio de monómero de tiroglobulina heterólogo o un dominio de monómero de trébol heterólogo, una etiqueta de purificación, una enzima (por ejemplo, peroxidasa de rábano o fosfatasa alcalina), y una proteína reportero (por ejemplo, proteína fluorescente verde o luciferasa) . En algunas modalidades, el objetivo no es una región variable o región hipervariable de un anticuerpo. La presente invención proporciona métodos para seleccionar una biblioteca de dominios de monómero o multímeros que comprenden dominios de monómero en cuanto a afinidad de enlace a múltiples ligandos. En algunas modalidades, el método comprende poner en contacto una biblioteca de dominios de monómero o multímeros de dominios de monómero a múltiples ligandos; y seleccionar dominios de monómero o multímeros que se enlazan a por lo menos uno de los ligandos. En algunas modalidades, los métodos comprenden (i.) poner en contacto una biblioteca de dominios de monómero a múltiples ligandos; (ii.) seleccionar dominios de monómero que se enlazan a por lo menos uno de los ligandos; (iii.) enlazar los dominios de manera seleccionados a una biblioteca de dominios de monómero para formar un biblioteca de multímeros, cada uno comprende un dominio de monómero seleccionado y un segundo dominio de monómero; (iv.) poner en contacto la biblioteca de multímeros a los múltiples ligandos para formar una pluralidad de complejos, cada complejo comprende un multímero y a ligando; y (v.) seleccionar por lo menos un complejo . En algunas modalidades, el método comprende además enlazar los multímeros de los complejos seleccionados a una biblioteca de dominios de monómero o multímeros para formar una segunda biblioteca de multímeros, cada una comprende un multímero seleccionado y por lo menos un tercer dominio de monómero; poner en contacto la segunda biblioteca de multímeros a los múltiples ligandos para formar una pluralidad de segundos complejos; y seleccionar por lo menos un segundo complejo. En algunas modalidades, la identidad del ligando y el multímero es determinada. En algunas modalidades, una biblioteca de dominios de monómero es puesta en contacto con múltiples ligandos. En algunas modalidades, una biblioteca de multímeros es puesta en contacto con múltiples ligandos. En algunas modalidades, los múltiples ligandos están en una mezcla. En algunas modalidades, los múltiples ligandos están en un arreglo. En algunas modalidades, los múltiples ligandos están en o sobre una célula o tejido. En algunas modalidades, los múltiples ligandos son inmovilizados sobre un soporte sólido. En algunas modalidades, los ligandos son polipéptidos. En algunas modalidades, los polipéptidos son expresados sobre la superficie del fago. En algunas modalidades, el dominio de monómero o biblioteca de multímero son expresados sobre la superficies del fago. En algunas modalidades, la biblioteca de multímeros es expresada sobre la superficie de fago para formar un fago que expresa biblioteca y los ligandos son expresados sobre la superficie de fago para formar el fago que expresa ligandos y el método comprende poner en contacto el fago que expresa bibliotecas con el fago que expresa ligando para formar pares de fago que expresa ligando/fago que expresa biblioteca; remover el fago que expresa ligando que no se enlaza al formato que expresa biblioteca o remover el fago que expresa biblioteca que no se enlaza al fago que expresa ligando; y seleccionar los pares de fago que expresa ligando/fago que expresa biblioteca. En algunas modalidades, los métodos comprenden además aislar polinucleótidos de los pares de fago y amplificar los polinucleótidos para producir un híbrido de polinucleótido que comprende polinucleótidos del fago que expresa ligando y el fago que expresa biblioteca. En algunas modalidades, los métodos comprenden aislar híbridos de polinucleótido a partir de una pluralidad de pares de fagos, formando mediante esto una mezcla de híbridos de polinucleótido. En algunas modalidades, los métodos comprenden poner en contacto la mezcla de polinucleótidos híbridos con una biblioteca de cADN bajo condiciones para permitir la hibridización de polinucleótido, hibridizando mediante esto un polinucleótido híbrido a un cADN en la biblioteca de cADN; y determinar la secuencia de nucleótidos del polinucleótido híbrido hibridizado, identificando mediante esto un dominio de monómero que se enlazan específicamente al polipéptido codificado por el cADN. En algunas modalidades, la biblioteca de dominio de monómero es expresada sobre la superficie del fago para formar el fago que expresa biblioteca y los ligandos son expresados sobre la superficie del fago para formar el fago que expresa ligando y los complejos seleccionados comprenden un fago que expresa biblioteca enlazado a un fago que expresa ligando y el método comprende: dividir los dominios de monómero seleccionados o multímeros a una primera y una segunda porción, enlazar los dominios de monómero o multímeros de la primera porción a una superficie sólida y poner en contacto una biblioteca de ligando fago-desplegada a los dominios de monómero o multímeros de la primera porción para identificar el fago de ligando objetivo que se enlaza a un dominio de monómero o multímero de la primera porción; infectar el fago que despliega los dominios de monómero o multímeros de la segunda porción a bacterias para expresar el fago; y poner en contacto el fago de ligando objetivo al fago expresado para formar pares de fago que consisten de un fago de ligando objetivo y un fago que despliega un dominio de monómero o multímero. En algunas modalidades, los métodos comprenden además aislar un polinucleótido de cada fago del par de fagos, identificando mediante esto un multímero o dominio de monómero que se enlaza al ligando en el par de fagos. En algunas modalidades, los métodos comprenden además amplificar los polinucleótidos para producir un híbrido de polinucleótido que comprende polinucleótidos del fago de ligando objetivo y el fago de biblioteca. En algunas modalidades, los métodos comprenden aislar y amplificar híbridos de polinucleótido de una pluralidad de pares de fago, formando mediante esto una mezcla de híbridos de polinucleótido. En algunas modalidades, los métodos comprenden poner en contacto la mezcla de polinucleótidos híbridos con una biblioteca de cADN bajo condiciones para permitir la hibridízación, hibridizando mediante esto un polinucleótido híbrido a un cADN en la biblioteca de cADN; y determinar la secuencia de nucleótidos del polinucleótido híbrido asociado, identificando mediante esto un dominio de monómero que se enlaza específicamente al ligando codificado por el cADN asociado a cADN. La presente invención también proporciona polipéptidos que no se presentan de manera estable en la naturaleza que comprenden una secuencia de aminoácidos en la cual : por lo menos 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20% o más de los aminoácidos en la secuencia son cisteína; y la secuencia de aminoácidos es por lo menos 10, 20, 30, 45, 50, 55, 60, 70, 80, 90, 100 o más aminoácidos de longitud; y/o la secuencia de aminoácidos es menor de 150, 140, 130, 120, 110, 100, 90, 80, 70, 60, 50 ó 40 aminoácidos de longitud; y/o por lo menos 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% o más de los aminoácidos son aminoácidos que no se presentan de manera estable en la naturaleza. Por ejemplo, en algunas modalidades, la secuencia de aminoácidos comprende por lo menos 10% de cisteínas y la secuencia de aminoácidos es de por lo menos 50 aminoácidos de longitud o por lo menos 25% de los aminoácidos no se presentan de manera estable en la naturaleza. En algunas modalidades, la secuencia de aminoácidos es un dominio A que no se presentan de manera estable en la naturaleza. En algunas modalidades, los polipéptidos de la invención comprenden uno, dos, tres, cuatro o más monómeros con por lo menos 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% o más aminoácidos que no se presentan de manera estable en la naturaleza. En algunas modalidades, el uno o más dominios de monómero comprende por lo menos 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50% o más aminoácidos que no se presentan en aquella posición en proteínas humanas naturales. En algunas modalidades, los dominios de monómero son derivados de una secuencia de proteínas humana que se presenta de manera estable en la naturaleza. En algunas modalidades, los polipéptidos de la invención tienen una vida media en el suero de por lo menos, por ejemplo, 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70 80, 90, 100, 150, 200, 250, 400, 500 o más horas.
DEFINICIONES A no ser que se indique de otra manera, las siguientes definiciones suplantan a aquellas en el arte. El término "dominio de monómero" o "monómero" es usado intercambiablemente en la presente para referirse a una región discreta encontrada en una proteína o polipéptido. Un dominio de monómero forma una estructura tridimensional natural en solución en ausencia de secuencias de aminoácido naturales de flanqueo. Dominios de monómero de la invención pueden ser seleccionados para enlazarse específicamente a una molécula objetivo. Como se usa en la presente, el término "dominio de monómero" no abarca la región que determina la complementareidad (CDR) de un anticuerpo. El término "variante dominio de monómero" se refiere a un dominio resultante de manipulación humana de una secuencia de dominio de monómero. Ejemplos de cambios manipulados por el hombre incluyen, por ejemplo mutagénesis aleatoria, mutagénesis específica del sitio, recombinación, evolución dirigida, eventos de cruce forzados oligo-dirigidos, incorporación de síntesis de gen directa de mutación, etc. El término "variante de dominio de monómero" no abarca una región que determina la complementareidad (CDR) mutagenizada de un anticuerpo. El término "bucle" se refiere a aquella porción de un dominio de monómero que está comúnmente expuesta al medio ambiente mediante el ensamble de la estructura de andamio de la proteína de dominio de monómero y que está involucrada en el enlace objetivo. La presente invención proporciona tres tipos de bucles que son identificados por aspectos o elementos específicos, tales como potencial para enlace de disulfuro, formación de puentes entre estructuras de proteína secundarias y dinámica molecular (esto es, flexibilidad) . Los tres tipos de secuencias de bucle son una secuencia de bucle definida por cisteína, una secuencia de bucle definida por estructura y una secuencia de bucle definida por el factor B. Como se usa en la presente, el término "secuencia de bucle definida por cisteína" se refiere a una subsecuencia de una secuencia de codificación de dominio de monómero que se presenta de manera estable en la naturaleza que está enlazada en cada extremo por un residuo de cisteína que es conservado con respecto a por lo menos otro dominio de monómero que se presenta de manera estable en la naturaleza de la misma familia. Secuencias de bucle definidas por cisteínas son identificadas mediante alineación de múltiples secuencias de los dominios de monómero que se presentan de manera estable en la naturaleza, seguido por análisis de secuencia para identificar residuos de cisteína conservados. La secuencia entre cada para consecutivo de residuos de cisteína conservados es una secuencia de bucle definida por cisteína. La secuencia de bucle definida por cisteína no incluye los residuos de cisteína adyacentes a cada término. Dominios de monómero que tienen secuencias de bucle definidas por cisteínas incluyen los dominios de monómero de trombospondina, dominios de tiroglobulina, dominios de trébol/PD y los semejantes. Así, por ejemplo, los dominios de monómero de trombospondina son representados por la secuencia de consenso, CX3CX?0CX?6CXnCX4C, en donde cada uno de X3, X?0, Xp y X representa una secuencia de bucle definida por cisteína; los dominios de monómero trébol/PD son representados por la secuencia de consenso, CX?0CX9CX4CCX?oC, en donde cada uno de X10, Xg, X y Xio representan una secuencia de bucle definida por cisterna y dominios de monómero de tiroglobulina son representados por la secuencia de consenso CX26CX?0CX?CX?8C en donde cada uno de X26, Xlio, Xß, i y Xiß representan una secuencia de bucle definida por cisterna. El término "multímero" es usado en la presente para indicar un polipéptido que comprende por lo menos dos dominios de monómero y/o inmuno-dominios (por ejemplo, por lo menos dos dominios de monómero, por lo menos dos inmuno-dominios o por lo menos un dominio de monómero y por lo menos un inmuno-dominio) . Los dominios de monómero y/o inmuno-dominios separados en un multímero pueden unidos conjuntamente mediante un enlazador. Un multímero es también conocido como una proteína de mosaico combinacional o una proteína de mosaico recombinante. El término "familia" y "clase de familia" son usados intercambiablemente para indicar proteínas que están agrupados conjuntamente en base a similaridades en sus secuencias de aminoácido. Estas secuencias similares son en general conservadas debido a que son importantes para la función de la proteína y/o el mantenimiento de la estructura tridimensional de la proteína. Ejemplos de tales familias incluyen la familia de dominio A de receptor LDL, la familia semejante a EGF y los semejantes . El término "ligando," también denominado en la presente como una "molécula objetivo," abarca una amplia variedad de substancias o moléculas, que fluctúan desde simples moléculas a objetivos complejos. Las moléculas objetivo pueden ser proteínas, ácidos nucleicos, lípidos, carbohidratos o cualquier otra molécula capaz de reconocimiento mediante un dominio de polipéptido. Por ejemplo, una molécula objetivo puede incluir un compuesto químico (esto es, compuesto no biológico tal como, por ejemplo, una molécula orgánica, una molécula inorgánica o una molécula que tiene tanto átomos orgánicos como inorgánicos, pero excluyendo polinucleótidos y proteínas), una mezcla de compuesto químicos, un arreglo de compuestos espacialmente localizados, una macromolécula biológica, una biblioteca de despliegue de péptido bacteriófago, una biblioteca de despliegue de péptido de polisoma, un extracto fabricado de materiales biológicos tales como bacterias, plantas, hongos o células o tejido animal (por ejemplo, mamífero), una proteína, una toxina, una hormona de péptido, una célula, un virus o los semejantes. Otras moléculas objetivo incluyen, por ejemplo, una célula entera, un tejido entero, una mezcla de proteínas relacionadas o no relacionadas, una mezcla de virus o cepas bacterianas o los semejantes. Moléculas objetivo pueden también ser definidas mediante inclusión en análisis de selección descritos en la presente o a mejorar o inhibir una interacción de proteína específica (esto es, un agente que inhibe selectivamente una interacción de enlace entre dos polipéptidos predeterminados) . Como se usa en la presente, el término "inmuno-dominios" se refiere a dominios de enlace de proteína que contienen por lo menos una región que determina la complementareidad (CDR) de un anticuerpo. Inmuno-dominios pueden ser dominios inmunológicos que se presentan de manera estable en la naturaleza (esto es, aislados de la naturaleza) o pueden ser dominios inmunológicos que no se presentan de manera estable en la naturaleza que han sido alterados mediante manipulación humana (por ejemplo, vía métodos de mutagénesis, tales como por ejemplo, mutagénesis aleatoria, mutagénesis específica del sitio, recombinación y los semejantes, también como mediante métodos de evolución dirigidos, tales como por ejemplo PCR propensa a error recursiva, recombinación recursiva y los semejantes) . Diferentes tipos de inmuno-dominios que son apropiados para uso en la práctica de la presente invención incluyen un minicuerpo, un anticuerpo de un solo dominio, un fragmento variable de una sola cadena (ScFv) y un fragmento de Fab. El término "minicuerpo" se refiere a un polipéptido que codifica solamente 2 regiones que determinan la complementareidad (CDR) de un dominio variable de cadena pesada o dominio variable de cadena ligera que se presentan de manera estable en la naturaleza o no se presenta de manera estable en la naturaleza (por ejemplo, mutagenizado) o combinación de los mismos. Un ejemplo de un minicuerpo es descrito por Pessi et al . , A designed metal-binding protein wit a novel fold, (1993) Nature 362:367-369. Como se usa en la presente, el término "anticuerpo de un solo dominio" se refiere al dominio variable de cadena pesada ( "VH" ) de un anticuerpo, esto es, un dominio variable de cadena pesada sin un dominio variable de cadena ligera. Anticuerpos de un solo dominio ejemplar usados en la práctica de la presente invención incluyen, por ejemplo el dominio variable de cadena pesada de Camelid (aproximadamente 118 a 136 residuos de aminoácido) como se describe en Hamers-Casterman, C. et al, Naturally occurring antbodies devoid of light chains (1993) Nature 363:446-448 y Dumoulin, et al., Single-domain antibody fragment with high conformational stability (2002) Protein Science 11:500-515. Los términos "fragmento variable de una sola cadena" o "ScFv" son usados intercambiablemente en la presente para referirse a dominios variables de cadena pesada y ligera de anticuerpo que son unidos por un enlazador de péptido que tiene por lo menos 12 residuos de aminoácido. Fragmentos variables de una sola cadena contemplados para uso en la práctica de la presente invención incluyen aquellos descritos en Bird, et al., (1988) Science 242 (4877) : 423-426 y Huston et al., (1988) PNAS USA 85(16) :5879-83. Como se usa en la presente, el término "fragmento de Fab" se refiere a un inmuno-dominio que tiene dos cadenas de proteína, una de los cuales es una cadena ligera que consiste de dos dominios de cadena ligera (dominio variable VL y dominio constante CL) y una cadena pesada que consiste de dos dominios pesados (esto es, un dominio variable VH y un dominio constante CH) • Los fragmentos de Fab usados en la práctica de la presente invención incluyen aquellos que tienen un enlace de disulfuro de intercadena en el término de cada componente pesado y ligero, también como aquellos que no tienen tal enlace de disulfuro C-terminal. Cada fragmento es de aproximadamente 47 kD. Fragmentos de Fab son descritos por Pluckthun and Skerra, (1989) Methods Enzymol 178:497-515.
El término "enlazador" es usado en la presente para indicar una porción o grupo de porciones que unen o conectan dos o más dominios de monómero separados discretos. El enlazador permite que los dominios de monómero separados discretos permanezcan separados cuando son unidos conjuntamente en un multímero. La porción enlazador es comúnmente una porción sustancialmente lineal. Enlazadores apropiados incluyen polipéptidos, ácidos polinucleicos, ácidos nucleicos de péptido y los semejantes. Enlazadores apropiados también incluyen porciones de alquileno opcionalmente sustituidas que tienen uno o más átomos de oxígeno incorporados a la cadena fundamental de carbono. Comúnmente, el peso molecular del enlazador es menor de aproximadamente 2000 daltons. Más comúnmente, el peso molecular del enlazador es menor de aproximadamente 1500 daltons y usualmente es menor de aproximadamente 1000 daltons. El enlazador puede ser suficientemente pequeño para permitir que los dominios de monómero separados discretos cooperen, por ejemplo, en donde cada uno de los dominios de monómero separados discretos en un multímero se enlaza a la misma molécula objetivo vía sitios de enlace separados. Enlazadores ejemplares incluyen un polinucleótido que codifica un polipéptido o un polipéptido de aminoácidos u otras porciones que no se presentan de manera estable en la naturaleza. El enlazador puede ser una porción de una secuencia natural, una variante de la misma o una secuencia sintética. Los enlazadores pueden comprender aminoácidos que se presentan de manera estable en la naturaleza, aminoácidos que no se presentan de manera estable en la naturaleza o una combinación de ambos. El término "separado" es usado en la presente para indicar una propiedad de una porción que es independientemente y sigue siendo independientemente aún cuando es acomplejada con otras porciones, en las que se incluyen, por ejemplo, otros dominios de monómero . Un dominio de monómero es un dominio separado en una proteína debido a que tiene una propiedad independiente que puede ser reconocida y separada de la proteína. Por ejemplo, la habilidad de enlace de ligando del dominio A en el LDLR es una propiedad independiente. Otros ejemplos de separado incluyen los dominios de monómero separados en un multímero que siguen siendo dominios independientes separados aún cuando son acomplejados o unidos conjuntamente en el multímero mediante un enlazador. Otro ejemplo de una propiedad separada son los sitios de enlace separados en un multímero para un ligando. Como se usa en la presente, "evolución dirigida" se refiere a un proceso mediante el cual variantes de polinucleótido son generadas, expresadas y seleccionadas en cuanto a una actividad (por ejemplo, un polipéptido con actividad de enlace) en un proceso recursivo. Uno o más candidatos en la selección son seleccionados y luego el proceso es repetido utilizando polinucleótidos que codifican los candidatos seleccionados para generar nuevas variantes. La evolución dirigida involucra por lo menos tres rondas de generación de variación y pueden incluir 3, 4, 5, 10, 20 o más rondas de generación de variación y selección. La variación puede ser generada mediante cualquier método conocido para aquellos de habilidad en el arte, en los que se incluyen, por ejemplo PCR propensa a error, recombinación de gen, mutagénesis química y los semejantes. El término "entremezcla" es usado en la presente para indicar recombinación entre secuencias no idénticas. En algunas modalidades, la entremezcla puede incluir cruce vía recombinación homologa o vía recombinación no homologa, tal como vía sistemas cre/lox y/o flp/frt. La entremezcla puede ser efectuada al emplear una variedad de formatos diferentes, en los que se incluyen, por ejemplo, formatos de entremezcla in vitro e in vivo, formatos de entremezcla in silico, formatos de entremezcla que utilizan ya sea plantillas de doble hebra o de una sola hebra, formatos de entremezcla a base de cebador, formatos de entremezcla a base de fragmentación de ácido nucleico y formatos de entremezcla moderados por oligonucleótido, todos los cuales están basados en eventos de recombinación entre secuencias no idénticas y son descritos en más detalle o se hace referencia a continuación como otros formatos a base de recombinación similares. El término "aleatorio" como se usa en la presente se refiere a una secuencia de polinucleótidos o una secuencia de aminoácidos compuesta de dos o más aminoácidos y construida mediante un proceso estocástico o aleatorio. La secuencia de polinucleótido o secuencia de aminoácidos aleatoria puede incluir porciones de estructura o porciones de andamio, que pueden comprender secuencias no variantes. El término "pseudoaleatorio" como se usa en la presente se refiere a un conjunto de secuencias, polinucleótido o polipéptido, que tienen variabilidad limitada, de tal manera que el grado de variabilidad de residuo en algunas posiciones es limitado, pero se permite cualquier posición pseudoaleatoria por lo menos algún grado de variación de residuo. Los términos "polipéptido", "péptido" y "proteína" son usados en la presente intercambiablemente para referirse a una secuencia de aminoácidos de dos o más aminoácidos. "Sustitución de aminoácido conservadora" se refiere a la intercambiabilidad de residuos que tienen cadenas laterales similares. Por ejemplo, un grupo de aminoácidos que tienen cadenas laterales alifáticas es glicina, alanina, valina, leucina e isoleucina; un grupo de aminoácidos que tienen cadenas laterales de hidroxilo alifáticas es serina y treonina; un grupo de aminoácidos que tienen cadenas laterales que contienen amida es asparagina y glutamina; un grupo de aminoácidos que tienen cadenas laterales aromáticas es fenilalanina, tirosina y triptófano; un grupo de aminoácidos que tienen cadenas laterales básicas es lisina, arginina e histidina; y un grupo de aminoácidos que tienen cadenas laterales que contienen azufre es cisteína y metionina. Grupos de sustitución de aminoácidos conservadores preferidos son: valina-leucina-isoleucina, fenilalanina-tirosina, lisina-arginina, alanina-valina y asparagina-glutamina . La frase "secuencia de ácido nucleico" se refiere a un polímero de una sola hebra o de doble hebra de bases de desoxiribonucleótido o ribonucleótido leídas del extremo 5' al extremo 3' . Incluye ADN cromosomal, plásmidos auto-replicantes y ADN o ARN que efectúa un papel principalmente estructural . El término "codificación" se refiere a una secuencia de polinucleótido que codifica una o más aminoácidos. El término no requiere un codón de inicio o un codón de retención. Una secuencia de aminoácidos puede ser codificada en cualquiera de seis cuadros de lectura diferentes provistos por una secuencia de polinucleótidos. El término "promotor" se refiere a regiones o secuencia localizadas corriente arriba y/o corriente abajo del inicio de transcripción que están involucradas en el reconocimiento y enlace de ARN polimerasa y otras proteínas para iniciar la transcripción. Un "vector" se refiere a un polinucleótido, que cuando está independiente del cromosoma huésped, es capaz de replicación en un organismo huésped. Ejemplos de vectores incluyen plásmidos. Los vectores tienen comúnmente un origen de replicación. Los vectores pueden comprender, por ejemplo, terminadores de transcripción y traducción, secuencias de inicio de transcripción y traducción y promotores útiles para la regulación de la expresión del ácido nucleico particular. El término "recombinante" cuando se usa con referencia, por ejemplo, a una célula o ácido nucleico, proteína o vector, indica que la célula, ácido nucleico, proteína o vector, ha sido modificado mediante la introducción de un ácido nucleico heterólogo o proteína heterólogo o la alteración de un ácido nucleico o proteína natural o que la célula es derivada de una célula así modificada. Así, por ejemplo, células recombinantes expresan genes que no son encontrados en forma notar (no recombinantes) de la célula o expresan genes naturales que son de otra manera expresados anormalmente, sub-expresados o no expresados. La frase "se enlaza específicamente (o selectivamente)" a un polipéptido, cuando se refiere a un monómero o multímero, se refiere a una reacción de enlace que puede ser determinante de la presencia del polipéptido en una población heterogénea de proteínas y otros compuestos biológicos. Así, bajo condiciones o análisis estándar usados en análisis de enlace de anticuerpo, el monómero o multímero específico se enlaza a una molécula objetivo particular por encima del fondo (por ejemplo, 2X, 5X, 10X o más por encima del fondo) y no se enlaza en una cantidad significativa a otras moléculas presentes en la muestra. Los términos "idéntico" o por ciento de "identidad" , en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos, se refiere a dos o más secuencias o subsecuentes que son las mismas. "Sustancialmente idénticas" se refiere a dos o más secuencias de ácidos nucleicos o polipéptidos que tienen un porcentaje específico de residuos de aminoácidos o nucleótidos que son los mismos (esto es, 60% de identidad, opcionalmente 65%, 70%, 75%, 80%, 85%, 90% o 95% de identidad con respecto a una región especificada o, cuando no se específica, en toda la secuencia) , cuando se comparan y alinean para correspondencia máxima sobre una ventana de comparación o región designada con medida utilizando uno de los siguientes algoritmos de comparación de secuencia o mediante alineación manual e inspección visual. Opcionalmente, la identidad o identidad sustancial existe en una región que es por lo menos de aproximadamente 50 nucleótidos de longitud o más preferiblemente sobre una región que es de 100 a 500 o 1000 o más nucleótidos o aminoácidos de longitud. Una secuencia de polinucleótidos o aminoácidos es "heteróloga a" una segunda secuencia si las dos secuencias no están enlazadas de la misma manera como se encuentra en secuencias que se presentan de manera estable en la natural . Por ejemplo, un promotor enlazado operativamente a una secuencia de codificación heteróloga se refiere a una secuencia de codificación que es diferente de cualesquier variantes alélicas que se presentan de manera estable en la natural. El término "enlazador heterólogo" , cuando se usa con referencia a un multímero, indica que el multímero comprende un enlazador y un monómero que son no son encontrados en la misma relación entre sí en la naturaleza (por ejemplo, forman una proteína de fusión) . Un "aminoácido que no se presenta de manera estable en la naturaleza" en una secuencia de proteínas se refiere a cualquier aminoácido diferente al aminoácido que presenta en la posición correspondiente en una alineación con un polipéptido que se presenta de manera estable en la naturaleza con la probabilidad de suma más pequeña más baja en donde la ventana de comparación es la longitud del dominio de monómero interrogado y cuando se compara con la base de datos no redundante ("nr") de Genbank utilizando BLAST 2.0 como se describe en la presente. "Porcentaje de identidad de secuencia" es determinado al comparar dos secuencias óptimamente alineadas en una ventana de comparación, en donde la porción de la secuencia de polinucleótidos en la ventana de comparación puede comprender adicionales o cancelaciones (esto es, espacios) en comparación con la secuencia de referencia (que no comprende adiciones o cancelaciones) para alineación óptima de las dos secuencias. El porcentaje es calculado al determinar el número de posiciones en las cuales la base de ácido nucleico idéntica o residuo de aminoácido ocurre en ambas secuencias para producir el número de posiciones correspondientes, dividir el número de posiciones correspondientes por el número total de posiciones en la ventana de comparación y multiplicar el resultado por 100 para producir el porcentaje de identidad de secuencia . Los términos "idéntico" o por ciento de "identidad", en el contexto de dos o más secuencias de ácidos nucleicos o polipéptidos, se refieren a dos o más secuencias o subsecuencias que son las mismas o tienen un porcentaje especificado de residuos de aminoácido o nucleótidos que son los mismos, cuando se comparan y alinean para correspondencia máxima en una ventana de comparación o región designada como se mide utilizando uno de los algoritmos de comparación de secuencia siguientes o mediante alineación manual e inspección visual. Se dice que tales secuencias entonces son "sustancialmente idénticas" . Esta definición también se refiere al complemento de una secuencia de prueba. Opcionalmente, la identidad existe sobre una región que es por lo menos de aproximadamente 50 aminoácidos o nucleótidos de longitud o más preferiblemente sobre una región que es de 75-100 aminoácidos o nucleótidos de longitud. Para la comparación de secuencia, comúnmente una secuencia actúa como secuencia de referencia, con la cual se secuencias de prueba son comparadas. Cuando se usa un algoritmo de comparación de secuencia, las secuencias de prueba y secuencias de referencia son introducidas a una computadora, se designan coordenadas de subsecuente, si es necesario y se designan los parámetros del programa de algoritmo de secuencia. Se pueden usar parámetros de programa predeterminados o se pueden designar parámetros alternativos. Luego, el algoritmo de comparación de secuencias calcula el por ciento de identidades de secuencia para las secuencias de prueba en relación con la secuencia de referencia, en base a los parámetros del programa. Una "ventana de comparación" , como se usa en la presente, incluye referencia a un segmento de cualquiera del número de posiciones contiguas seleccionadas del grupo que consiste de 20 a 600, usualmente alrededor de 50 a aproximadamente 200, más usualmente alrededor de 100 a aproximadamente 150 en los cuales una secuencia puede ser comparada con una secuencia de referencia del mismo número de posiciones contiguas después que las dos secuencias son alineadas óptimamente. Métodos de alineación de secuencias para comparación son bien conocidos en el arte. La alineación óptima de secuencias para comparación se puede efectuar, por ejemplo, mediante el algoritmo de homología local de Smith y Waterman (1970) Adv. Appl. Math. 2:482c, mediante el algoritmo de alineación de homología de Needleman y Wunsch (1970) J. Mol.
Biol. 48:443, mediante el método de búsqueda de similiaridad de Pearson y Lipman (1988) Proc. Nat'l. Acad. Sci. USA 85:2444, mediante implementaciones computarizadas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wl) o mediante alineación manual e inspección visual (véase, por ejemplo, Ausubel et al, Current Protocols in Molecular Biology (1995 supplement) ) . Un ejemplo de un algoritmo útil es el algoritmo BLAST 2.0, que es descrito en Altschul et al. (1990) J. Mol. Biol. 215:403-410, respectivamente. Software o elementos de programación para efectuar análisis de BLAST están disponibles públicamente a través del Centro Nacional para Información de Biotecnología (http://www.ncbi.nlm.nih.gov/). Este algoritmo involucra identificar primero pares de secuencias de alta puntuación (HSP) al identificar palabras cortas de longitud W en la secuencia de interrogación, las cuales ya sea coinciden o satisfacen alguna puntuación T de umbral de valor positivo cuado son alineadas con una palabra de la misma longitud en una secuencia de base de datos. T es referida como el umbral de puntuación de palabra vecina (Altschul et al., supra) . Estos aciertos de palabra vecina inicial actúan como semillas para iniciar búsquedas de HSP más largas que las contienen. Los aciertos de palabras son extendidos en ambas direcciones a lo largo de cada secuencia en tanto que la puntuación de alineación acumulativa puede estar incrementada. Puntuaciones acumulativas son calculadas utilizando, para secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos correspondientes; siempre > 0) y N (puntuación de penalidad para residuos que no corresponden; siempre < 0) . Para secuencias de aminoácido, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección es detenida cuando: la puntuación de alineación acumulativa por la cantidad X de su valor obtenido máximo; la puntuación acumulativa va a cero o menor, debido a la acumulación de uno o más alineaciones de residuo de puntuación negativa o se llega al final ya sea de una u otra secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótido) utiliza como predeterminados una longitud de palabra (W) de 11, una esperanza (E) de 10, M = 5, N = -4 y una comparación de ambas hebras. Para secuencias de aminoácido, el programa BLASTP utiliza como predeterminados una longitud de palabra de 3 y esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff y Henikoff (1989) Proc. Natl. Acad. Sci. USA 89:10915) alineaciones (B) de 50, esperanza (E) de 10 , M = 5 , N = -4 y una comparación de ambas hebras. El algoritmo también efectúa un análisis estadístico de la similaridad entre dos secuencias (véase, por ejemplo, Karlin and Altschul (1993) Proc. Natl. Acad. Sci . USA 90:5873-5787) . Una medida de similaridad provista por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), que proporciona una indicación de la probabilidad por la cual ocurriría una correspondencia entre dos secuencias de nucleótidos o aminoácidos por probabilidad. Por ejemplo, un ácido nucleico es considerado similar a una secuencia de referencia si la probabilidad de suma más pequeña en una comparación del ácido nucleico de prueba con el ácido nucleico de referencia es menor de aproximadamente 0.2, más preferiblemente menor de alrededor de 0.01 y más preferiblemente menos de alrededor de 0.001.
BREVE DESCRIPCIÓN DE LAS FIGURAS La figura 1 ilustra esquemáticamente un esquema general para identificar dominios de monómero que se enlazan a un ligando, aislar los dominios de monómero seleccionados, crear multímeros de los dominios de monómero seleccionados al unir los dominios de monómero seleccionados en varias combinaciones y seleccionar los multímeros para identificar multímeros que comprenden más de un monómero que se enlaza a un ligando. La figura 2 es una representación esquemática de otra estrategia de selección (selección guiada) . Un dominio de monómero con propiedades de enlace apropiadas es identificado de una biblioteca de dominios de monómero. Luego del dominio de monómero identificado es enlazado a dominios de monómero de otra biblioteca de dominios de monómero para formar una biblioteca de multímeros. La biblioteca de multímeros es seleccionada para identificar un par de dominios de monómero que se enlazan simultáneamente al objetivo. Este proceso puede luego ser repetido hasta que se obtiene las propiedades de enlace óptimas en el multímero. La figura 3 ilustra la selección en marcha para generar multímeros que se enlazan a un objetivo u objetivos con afinidad incrementada. La figura 4 ilustra la selección de una biblioteca de dominios de monómero contra múltiples ligandos desplegados sobre una célula. La figura 5 ilustra modalidades de dominio de monómero y multímero por avidez incrementada. En tanto que la figura ilustra productos de gen específicos y afinidades de enlace específicas, se apreciará que estos son solamente ejemplos y que otros objetivos de enlace pueden ser usados con las mismas o similares conformaciones. La figura 6 ilustra modalidades de dominio de monómero y multímero por avidez incrementada. En tanto que la figura ilustra productos de gen específicos y afinidades de enlace específicas, se apreciará que estos son solamente ejemplos y que otros objetivos de enlace pueden ser usados con las mismas o similares conformaciones. La figura 7 ilustra varias confirmaciones de monómero o multímero de anticuerpo posibles de la invención. En algunas modalidades, el monómero o multímero reemplaza el fragmento de Fab del anticuerpo. La figura 8 ilustra un método para la optimización intradominio de monómeros. La figura 9 ilustra una secuencia posible de etapas de optimización de multímero en las cuales monómeros óptimos y luego multímeros son seleccionados seguido por optimización de monómeros, optimización de enlazadores y luego optimización de multímeros . La figura 10 ilustra cuatro métodos ejemplares para recombinar bibliotecas de monómero y/o multímero para introducir nueva variación. La figura 10A ilustra una modalidad ejemplar de recombinación intra-dominio de monómeros en donde porciones de diferentes monómeros son recombinadas para formar nuevos monómeros. La figura 10B ilustra una segunda modalidad de recombinación intra-dominio en donde porciones de monómeros recombinados como se resume en la figura 10A son recombinados adicionalmente para formar nuevos monómeros adicionales. La figura 10C ilustra una modalidad de recombinación interdominio, en donde diferentes monómeros recombinados son enlazados entre sí, esto es, para formar multímeros. La figura 10D ilustra una modalidad de recombinación de inter-módulo en donde monómeros recombinados enlazados, esto es, multímeros que se enlazan a la misma molécula objetivo son enlazados a otros monómeros recombinados que reconocen una molécula objetivo diferente para formar nuevos multímeros que se enlazan simultáneamente a diferentes moléculas objetivo. La figura 11 ilustra una conformación posible de un multímero de la invención que comprende por lo menos un dominio de monómero que se enlaza a una molécula que prolonga la vida media y otros dominios de monómero que se enlazan a otras dos moléculas diferentes. En la figura, dos dominios de monómero se enlazan a una primera molécula objetivo y un dominio de monómero separado se enlaza a una segunda molécula objetivo.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La invención proporciona agentes de afinidad que comprenden dominios de monómero, también como multímeros de los dominios de monómero. Los agentes de afinidad pueden ser seleccionados en cuanto a la habilidad para enlazarse a un ligando deseado o mezcla de ligandos. Los dominios de monómero y multímeros pueden ser seleccionados para identificar aquellos que tienen una característica mejorada, tal como avidez o afinidad mejorada o especificidad alterada por el ligando o la mezcla de ligandos, en comparación con el dominio de monómero discreto. Los dominios de monómero de la presente invención incluyen variantes específicas de los dominios semejantes a EGF de laminina, los dominios de trombospondina tipo 1, los dominios de trébol y los dominios de tiroglobulina.
I . Dominios de monómero Muchos dominios de monómero apropiados pueden ser usados en los polipéptidos de la invención. Dominios de monómero comúnmente apropiados comprenden tres enlaces de disulfuro, 30 a 100 aminoácidos y tienen un sitio de enlace por un ion de metal divalente, tal como por ejemplo, calcio. En algunas modalidades, dominio de monómero de trombospondina tipo 1, dominios de monómero de trébol o dominios de monómero de tiroglobulina son usados en los andamios de la invención. En otras modalidades, se usan dominios de monómero de laminina-EGF. Los dominios de monómero pueden tener cualquier número de características. Por ejemplo, en algunas modalidades, los dominios de monómero tienen baja o ninguna inmunogenicidad en un animal (por ejemplo, un humano) . Los dominios de monómero pueden tener un tamaño pequeño. En algunas modalidades, los dominios de monómero son suficientemente pequeños para penetrar la piel u otros tejidos. Los dominios de monómero pueden tener un intervalo de vidas media o estabilidades in vivo. Las características de un dominio de monómero incluyen la capacidad para plegarse independientemente y la habilidad para formar una estructura estable.
Los dominios de monómero pueden ser cadenas de polipéptido de cualquier tamaño. En algunas modalidades, los dominios de monómero tienen aproximadamente 25 a aproximadamente 500, aproximadamente 30 a aproximadamente 200, aproximadamente 30 a aproximadamente 100, aproximadamente 35 a aproximadamente 50, aproximadamente 35 a aproximadamente 100, aproximadamente 90 a aproximadamente 200, aproximadamente 30 a aproximadamente 250, aproximadamente 30 a aproximadamente 60, aproximadamente 9 a aproximadamente 150, aproximadamente 100 a aproximadamente 150, aproximadamente 25 a aproximadamente 50 o aproximadamente 30 a aproximadamente 150 aminoácidos. Similarmente, un dominio de monómero de la presente invención puede comprender, por ejemplo, de aproximadamente 30 a aproximadamente 200 aminoácidos; de aproximadamente 25 a aproximadamente 180 aminoácidos; de aproximadamente 40 a aproximadamente 150 aminoácidos; de aproximadamente 50 a aproximadamente 130 aminoácidos; o de aproximadamente 75 a aproximadamente 125 aminoácidos. Los dominios de monómero e inmuno-dominios pueden mantener comúnmente una conformación estable en solución y son frecuentemente estables térmicamente, por ejemplo, estables a 95 °C durante por lo menos 10 minutos sin perder afinidad de enlace. Los dominios de monómero se enlazan comúnmente con una K^ de por lo menos aproximadamente ío-15 , ?o~14 , ?o"13 , ?o"12 , ío-11 , lo-10 , ?oA ?o~ß , ?oA ?oA 10A 10 10 10 0 . 01 µM, aproximadamente 0 . 1 µM o aproximadamente 1 µM. Algunas veces, los dominios de monómero e inmuno-dominios se pueden plegar independientemente a una conformación estable. En una modalidad, la conformación estable es estabilizada mediante iones de metal. La conformación estable puede contener opcionalmente enlaces de disulfuro (por ejemplo, por lo menos uno, dos o tres o más enlaces de disulfuro) . Los enlaces de disulfuro pueden opcionalmente ser formados entre dos residuos de cisteína. En algunas modalidades, dominios de monómero o variantes de dominio de monómeros, son sustancialmente idénticos a las secuencias ejemplificadas (por ejemplo, trombospondina, trébol o tiroglobulina) o de otra manera a los que se hace referencia en la presente. Dominios de monómero ejemplares que son particularmente apropiados para uso en la práctica de la presente invención son dominios ricos en cisteína que comprenden enlaces de disulfuro. Comúnmente, los enlaces de disulfuro promueven el plegado del dominio a una estructura tridimensional. Usualmente, los dominios ricos en cisteína tienen por lo menos dos enlaces de disulfuro, más comúnmente por lo menos tres enlaces de disulfuro. Los dominios de monómero ricos en cisteína apropiados incluyen, por ejemplo, el dominio de trombospondina tipo 1, el dominio de trébol o el dominio de tiroglobulina. Los dominios de monómero pueden también tener un grupo de residuos cargados negativamente. Los dominios de monómero se pueden enlazar al ion para mantener su estructura secundaria. Tales dominios de monómero incluyen, por ejemplo, dominios A, dominios EGF, EF Hand (por ejemplo, aquellos presentes en calmodulina y troponina C) , dominios de caderina, lectinas tipo C, dominios C2 , anexina, dominios Gla, dominios trombospondina tipo 3, todos los cuales se enlazan a calcio y dedos de zinc (por ejemplo, tipo C2H2 , tipo C3HC4 (dedo RING), dominio de enlace de zinc de integrasa, dedo PHD, dedo de zinc GATA, dedo de zinc FYVE, dedo de zinc bloque B) , que se enlazan a zinc. Sin pretender limitar la invención, se cree que el enlace de ion estabiliza la estructura secundaria en tanto que proporciona suficiente flexibilidad para permitir numerosas confirmaciones de enlace dependiendo de la secuencia primaria. La estructura del dominio de monómero es frecuentemente conservada, aunque la secuencia de polinucleótido que codifica el monómero no necesita ser conservada. Por ejemplo, la estructura de dominio puede ser conservada entre los miembros de la familia de dominio, en tanto que la secuencia de ácido nucleico de dominio no. Así, por ejemplo, un dominio de monómero es clasificado como un dominio de trombospondina tipo 1, un dominio de trébol o un dominio de tiroglobulina por sus residuos de cisteína y su afinidad por un ion de metal (por ejemplo calcio) , no necesariamente por su secuencia de ácido nucleico.
En algunas modalidades, dominios de monómero apropiados (por ejemplo, dominios con la habilidad para plegarse independientemente o con alguna asistencia limitada) pueden ser seleccionado de las familias de dominios de proteína que contienen estructuras de emparedado ß o estructura tridimensionales de barril ß como se define por tales herramientas de análisis de secuencia computacionales como Simple Modular Architecture Research Tool (SMART) , véase Shultz et al, SMART: a web-based tool for the study of genetically mobile domains, (2000) Nucleic Acids Research 28 (1) : 231-234) o CATH {véase Pearl et.al, Assigning genomic sequences to CATH, (2000) Nucleic Acids Research 28 (1) : 277-282) . En algunas modalidades, los dominios de monómero son modificados para enlazarse a sustratos para mejorar la función de proteína, en los que se incluyen, por ejemplo, actividad enzimática y/o conversión de sustrato. Como se describe en la presente, dominios de monómero pueden ser seleccionados en cuanto a la habilidad para enlazarse a objetivos diferentes al objetivo que un dominio que se presenta de manera estable en la naturaleza homólogo se puede enlazar. Así, en algunas modalidades, la invención proporciona dominios de monómero (y multímeros que comprenden tales monómeros) que no se enlazan al objetivo o la clase o familia de proteínas objetivo que un dominio que se presenta de manera estable en la naturaleza homólogo se puede enlazar.
Cada uno de los dominios descritos en la presente emplean porciones ejemplares (esto es, andamios) . Ciertas posiciones son marcadas con x, indicando que cualquier aminoácido puede ocupar la posición. Estas posiciones pueden incluir un número de diferentes posibilidades de aminoácidos, permitiendo mediante esto la diversidad de secuencia y así afinidad por diferentes moléculas objetivo. El uso de corchetes en porciones indica aminoácidos posibles alternativos en una posición (por ejemplo " [ekq] " indica que ya sea E, K o Q puede estar en aquella posición) . El uso de paréntesis en una porción indica que las posiciones dentro del paréntesis pueden estar presentes o ausentes (por ejemplo, "([ekq])" indica que la posición está ausente o ya sea uno de otro E, K o Q puede estar en aquella posición) . Cuando más de una "x" es usada en paréntesis (por ejemplo, " (xx) " ) , cada x representa una posición posible. Así " (xx) " indica que cero, uno o dos aminoácidos puede estar en aquella (s) posición (es) , en donde cada aminoácido es seleccionado independientemente de cualquier aminoácido, a representa un aminoácido aromático/hidrofóbico tal como, por ejemplo, W, Y, F o L; ß representa un aminoácido hidrofóbico tal como, por ejemplo, V, I, L, A, M o F; ? representa un aminoácido polar pequeño tal como, por ejemplo, G, A, S o T; d representa un aminoácido cargado tal como, por ejemplo, K, R, E, Q o D; e representa un aminoácido pequeño tal como, por ejemplo; V, A, S o T; y f representa un aminoácido cargado negativamente, tal como, por ejemplo, D, E o N. Dominios apropiados incluyen, por ejemplo dominios de trombospondina tipo I, dominios de trébol y dominios de tiroglobulina . Los dominios de trombospondina tipo I ("TSP1") contienen aproximadamente 30-50 o 30-65 aminoácidos. En algunas modalidades, los dominios comprenden aproximadamente 35-55 aminoácidos y en algunos casos aproximadamente 50 aminoácidos. Dentro de los 35-55 aminoácidos, hay comúnmente alrededor de 4 a aproximadamente 6 residuos de cisteína. De las seis cisteínas, enlaces de disulfuro comúnmente son encontrados entre las siguientes cisteínas: Cl y C5, C2 y C6 , C3 y C4. Los residuos de cisteína del dominio son enlazados por disulfuro para formar una porción compacta, estable, funcionalmente independiente que comprende las hebras beta distorsionadas. Grupos de estas repeticiones componen un dominio de enlace de ligando y la agrupación diferencial puede impartir especificidad con respecto al enlace del ligando. Secuencias de dominio de TSP1 y secuencias de consenso ejemplares son como sigue: (1) (xxxxxx) C?XxxC2xxxxx (x) xxxxxC3xxxx (xxx) xxxxxC xxxx xx (x) xxxC5 (x) xxxxC6 ; (2) (wxxWxx) C?XXxC2xxGxx (x) xRxxxC3xxxx (Pxx) xxxxxC4xxxx xx (x) xxxC5 (x) xxxxCe (3) (wxxWxx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxx xx (x) xxxC5 (x) xxxxC6 (4) (wxxWxx) CitStnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [ Rktvm] xC3 [vldr] xxxx ( [Pq] xx) xxxxxC4 [Idae] xxxxxx (x) xxxC5 (x) xxxxC6 ; (5) (WxxWxx) Ci [Stnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [Rktvm] xC3 [vldr] x xxx ( [Pq] xx) xxxxxC [Idae] xxxxxx (x) xxxC5 (x) xxxxC6; y (6) C?[nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ ikqrstv] x [aqrst] x [almrtv] xC3xxxxxxxxx (xxxxxxx) C4xxxxxxxxx (xx) C5x xxxC6 En algunas modalidades, las variantes del dominio de trombospondina tipo 1 comprenden secuencias sustancialmente idénticas a cualquiera de las secuencias descritas anteriormente . A la fecha, por lo menos 1677 dominios de trombospondina que se presentan de manera estable en la naturaleza han sido identificados en base a secuencias de cADN. Proteínas ejemplares que contienen los dominios de trombospondina que se presentan de manera estable en la naturaleza incluyen, por ejemplo, proteínas en la ruta de complemento {por ejemplo, properdina, C6, C7, C8A, C8B, y C9) , proteínas de matriz extracelular (por ejemplo, mindina, F-espondina, SCO-espondina, ) , proteína de superficie de circumesporozoito 2, y proteínas TRAP de Plasmodium. Dominios de trombospondina tipo 1 son descritos adicionalmente en, por ejemplo, Roszmusz et al, BBRC 296:156 (2002); Higgins et al, J Immunol. 155:5777-85 (1995); Schultz-Cherry et al, J. Biol Chem. 270:7304-7310 (1995); Schultz-Cherry et al, J. Biol Chem. 269:26783-8 (1994); Bork, FEBS Lett 327:125-30 (1993); y Leung-Hagesteijn et al, Cell 71:289-99 (1992). Otro dominio de monómero ejemplar apropiado para uso en la práctica de la presente invención es el dominio de trébol . Los dominios de monómero de trébol son comúnmente de alrededor de 30-50 o 30-65 aminoácidos. En algunas modalidades, los dominios comprenden aproximadamente 35-55 aminoácidos y en algunos casos aproximadamente 45 aminoácidos. Dentro de los 35-55 aminoácidos, hay comúnmente alrededor de 6 residuos de cisteína. De las seis cisteínas, enlaces de disulfuro comúnmente son encontrados entre las siguientes cisteínas: Cl y C5, C2 y C4, C3 y C6. A la fecha, por lo menos 149 dominios de trébol que se presentan de manera estable en la naturaleza han sido identificados en base a secuencias de cADN. Proteínas ejemplares que contienen los dominios de trébol que se presentan de manera estable en la naturaleza incluyen, por ejemplo proteína pS2 (TFFl) , péptido espasmolítico SP (TFF2) , factor de trébol intestinal (TFF3), surceasa-msomaltasa intestinal, y proteínas que pueden estar involucradas en defensa contra infecciones microbianas al proteger el epitelio (por ejemplo, Xenopus xPl, xP4 , mucmas integumentarias A.l y C.l. Dominios de trébol son descritos adicionalmente en, por ejemplo Sands and Podolsky, Annu. Rev. Physiol. 58:253-273 (1996); Can et al, PNAS USA 91:2206-2210 (1994); DeA et al, PNAS USA 91:1084-1088 (1994); Hoffinan et al, Trends Biochem Sci 18:239-243 (1993) . Secuencias de dominio de trébol y secuencias de consenso ejemplares son como sigue: (1) Ci (xx) xxxxxxxxxC2xx (x) xxxxxxxC3xxxxC4C5xxxxx (x) XXXXXCg (2) Ci (xx) xxxxxxRxxC2xx (x) xxxxxxxC3xxxxC4C5xxxxx (x) XXXXXCe (3 ) Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxgC C5fdxxx (x) xxxpwC.f (4) Ci (xx) xxx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst] ( [de]x) [pskq] x [Ivap] [Tsa] xx [qedk] C3xx [krln] [Gnk] C4C5 [Fwy] [Dnrs] [sdpnte] xx(x)xxx[pki] [Weash] C6 [Fy] (5) Ci (xx) xxx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst] ( [de]x) [pskq] x [Ivap] [Tsa] xx [keqd] C3xx [krln] [Gnk]C4C5[a] [Dnrs] [sdpnte] x x(x)xxx[pki] [Weash] C6 [Fy] (6) Ci ( [dnps] ) [adiklnprstv] [dfilmv] [adenprst] [ adelprv] [ehklnqrs] [adegknsv] [kqr] [fiklqrtv] [dnpqs] C2 [agiy] [flps vy] [dknpqs] [adfghlp] [aipv] [st] [aegkpqrs] [adegkpqs] [deiknqt] C3 [a defknqrt] [adegknqs] [gn] C4C5 [wyf h] [deinrs] [adgnpst] [aefgqlrstw] [ giknsvmq] ( [afmprstv] [degklns] [afiqstv] [iknpv]w)C6 Otro dominio de monómero ejemplar apropiado para uso en la presente invención es el dominio de tiroglobulina.
Dominios de monómero de tiroglobulina son comúnmente de alrededor de 30-85 o 30-80 aminoácidos, en algunas modalidades, los dominios comprenden aproximadamente 35-75 aminoácidos y en algunos casos aproximadamente 65 aminoácidos. Dentro de los 35-75 aminoácidos, hay comúnmente alrededor de 6 residuos de cisteína. De las seis cisteínas, enlaces de disulfuro comúnmente son encontrados entre las siguientes cisteínas: Cl y C2, C3 y C4, C5 y C6. A la fecha, por lo menos 251 dominios de tiroglobulina que se presentan de manera estable en la naturaleza han sido identificados en base a secuencias de cADN. La sección N-terminal de Tg contiene 10 repeticiones de un dominio de aproximadamente 65 aminoácidos que es conocido como la repetición Tg tipo 1 PUBMED: 3595599, PUBMED : 8797845. Proteínas ejemplares que contienen dominios de tiroglobulina que se presentan de manera estable en la naturaleza incluyen por ejemplo, la cadena invariante asociada HLA Clase II, proteínas marcadoras de carcinoma pancreático humanas, nidogen (entactina) , proteínas de enlace de factor de crecimiento semejantes a insulina (IGFBP) , saxifilina, inhibidor de proteinasa de cisteína de huevo de salmón chum y equistatina. Los dominios de Thyr-1 y dominios relacionados pertenecen a la familia del inhibidor de proteinasa MEROPS 131, clan IX. Dominios de tiroglobulina son descritos adicionalmente en, por ejemplo, Molina et at , Eur. J. Biochem. 240:125- 133 (1996); Guncar et al, EMBO J 18:793-803 (1999); Chong and Speicher, DW 276:5804-5813 (2001) . Secuencias de dominio de tiroglobulina y secuencias de consenso ejemplares son como sigue: (1) Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxxxxxC2xxxxxxxx xxC3x (x) x (xxx) xxxxC4xC5xxxx (x) xxxxxxxxxxxxxx (xx) xC6 (2) Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxxx xxQC3x (x) x (xxx) xxxxCWC5Vxxx (x) GxxxxGxxxxxxxx (xx) xC6 (3 ) Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyx xxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 (4) Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Yf] xx [vkrl] QC3x (x [sa] xxx) xx [Gsa]xC4 [Wyf] C5V[Dnyfl] xx ( x) Gxxxx [Gdne] xxxxxgxx (xx) xC6 (5) Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahp] xPxC2xxxGx [a] xx [vkrl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx ( x) Gxxxx [fg] xxxxxgxx (xx) xC6 Otro dominio de monómero ejemplar que puede ser usado en la presente invención es un dominio de laminina-EGF. Los dominios de laminina-EGF son comúnmente de alrededor de 30-85 o 30-80 aminoácidos. En algunas modalidades, los dominios comprenden aproximadamente 45-65 aminoácidos y en algunos casos aproximadamente 50 aminoácidos. Dentro de los 45-65 aminoácidos, hay comúnmente alrededor de 8 residuos de cisteína que interactúan para formar 4 enlaces de disulfuro. Las lamininas son un componente sin colágeno mayor de membranas básales que moderan la adhesión celular, migración de crecimiento y diferencia. Están compuestas de cadenas alfa, beta, y gamma distintas pero relacionadas. Las tres cadenas forman una molécula en forma de cruz que consiste de un brazo largo y tres brazos globulares cortos. El brazo largo consiste de una estructura de bobina enrollada contribuida por todas las tres cadenas y reticulada por enlaces de disulfuro de intercadena . Secuencias de dominio de laminina-EGF y secuencias de consenso ejemplares son como sigue: (1) C?xC2xxxxxx (xxx) xxC3xxx (xxxxxx) xxxxC4xC5xxxxxx xxC6xxC7xxxxxxx (xxxxx) xxxxxC8 (2) C?xC2xxxxxx (xxx) xxC3xxx (xxxxxx) xxgxC4xC5xxxxxG xxC6xxC7xxxxxxx (xxxxx) xxxxxC8 (3) C?xC2 [ndh] xxxxx (xxx) xxC3xxx (xxxxxx) xxgxCxC5xxx xxGxxC6. [denq] xC7xx [gn] [yfht] xxx (xxxxx) xxxxxCB Como se menciona anteriormente, los dominios de monómero pueden ser variantes que se presentan de manera estable en la naturaleza o variantes que no se presentan de manera estable en la naturaleza. El término "que se presentan de manera estable en la naturaleza" se usa en la presente para indicar que un objeto puede ser encontrado en la naturaleza. Por ejemplo, dominios de monómero natural pueden incluir dominios de monómero humano u opcionalmente, dominios derivados de especies o fuentes diferentes, por ejemplo mamíferos, primates, roedores, peces, aves, reptiles, plantas, etc. Los dominios de monómero que se presentan de manera estable en la naturaleza pueden ser obtenidos mediante una diversidad de métodos, por ejemplo mediante amplificación de PCR de ADN genómico o cADN. Bibliotecas de dominios de monómero usadas en la práctica de la presente invención pueden contener variantes de dominio de monómero que se presentan de manera estable en la naturaleza, variantes de dominio de monómero que no se presentan de manera estable en la naturaleza o una combinación de los mismos. Las variantes de dominio de monómeros pueden incluir dominios ancestrales, dominios aleatorizados, dominios quiméricos, dominios mutados y los semejantes. Por ejemplo, los dominios ancestrales pueden estar basados en análisis filogenético. Los dominios aleatorizados son dominios en los cuales una o más regiones están aleatorizadas . La aleatorización puede estar basada en plena aleatorización u opcionalmente, aleatorización parcial basada en distribución natural de diversidad de secuencia. Los dominios quiméricos son dominios en los cuales una o más regiones son reemplazadas por regiones correspondientes de otros dominios de la misma familia. Por ejemplo, dominios quiméricos pueden ser construidos al combinar secuencias de bucle de múltiples dominios relacionados de la misma familia para formar nuevos dominios con inmunogenicidad potencialmente disminuida.
Aquellos de habilidad en el arte reconocerán el beneficio inmunológico de construir monómeros de dominio de enlace modificados al combinar regiones de bucle de varios dominios relacionados de la misma familia en lugar de crear secuencias de aminoácido aleatorias. Por ejemplo, al construir dominios de variantes al combinar secuencias de bucle o aún múltiples secuencias de bucle que se presentan de manera estable en la naturaleza en dominios de monómero de Notch/LNR humanos, dominios de monómero de DSL, dominios de monómero de Anato, dominios de monómero de beta integrina o dominios de monómero de Ca-EGF, los dominios resultantes pueden contener nuevas propiedades de enlace pero pueden no contener alguna secuencia de proteína inmunogénica debido a que todos los bucles expuestos son de origen humano. La combinación de secuencias de aminoácido de bucle en el contexto endógeno puede ser aplicada a todos los constructos de monómero de la invención. Los dominios de monómero no naturales o dominios de monómero alterados pueden ser producidos mediante una diversidad de métodos. Cual método de mutagénesis, tal como mutagénesis dirigida al sitio y mutagénesis aleatoria (por ejemplo, mutagénesis química) puede ser usado para producir variantes. En algunas modalidades, se usa PCR propensa a error para crear variantes. Métodos adicionales incluyen alinear una pluralidad de dominios de monómero que se presentan de manera estable en la naturaleza al alinear aminoácidos conservados en la pluralidad de dominios de monómero que se presentan de manera estable en la naturaleza; y diseñar el dominio de monómero que no se presenta de manera estable en la naturaleza al mantener los aminoácidos conservados e insertar, cancelar o alterar aminoácidos alrededor de los aminoácidos conservados para generar el dominio de monómero que no se presenta de manera estable en la natural. En una modalidad, los aminoácidos conservados comprenden cisteínas. En otra modalidad, la etapa de inserción utiliza aminoácidos aleatorios u opcionalmente, la etapa de inserción usa porciones de los dominios de monómero que se presentan de manera estable en la naturaleza. Las porciones podrían idealmente codificar bucles de dominios de la misma familia. Los aminoácidos son insertados o intercambiados utilizando oligonucleótidos sintéticos o mediante entremezcla o mediante recombinación a base de enzima de restricción. Los dominios quiméricos humanos de la presente invención son útiles para aplicaciones terapéuticas en donde se desea mínima inmunogenicidad. La presente invención proporciona métodos para generar bibliotecas de dominios quiméricos humanos. Multímeros o dominios de monómero de la invención pueden ser productos de acuerdo con cualesquier métodos conocidos en el arte. En algunas modalidades, E. coli que comprende un plásmido que codifica los polipéptidos bajo control transcripcional de un promotor bacteriano son usados para expresar la proteína. Después de cosechar las bacterias, pueden ser sometidas a lisis mediante sonicación, calor u homogenización y clarificadas mediante centrifugación. Los polipéptidos pueden ser purificados utilizando elución de Ni-NTA agarosa (si es 6xHis marcado) o elución de DEAE sefarosa (si están sin marcar) y replegados mediante diálisis. Las proteínas mal plegadas pueden ser neutraliza al coronar los sulfhidrilos libres con ácido yodoacético. Elución de Q sefarosa, flujo pasante de sefarosa butilo, elución de SP sefarosa, elución de DEAE sefarosa, y/o elución de CM sefarosa pueden ser usados para purificar los polipéptidos. Etapas de purificación de intercambio de aniones y/o cationes equivalente o interacción hidrofóbica pueden también ser usadas. En algunas modalidades, los monómeros o multímeros son purificados utilizando lisis por calor, seguida comúnmente por un enfriamiento rápido para impedir que la mayoría de las proteínas se renaturalice . Debido a la estabilidad térmica de las proteínas de la invención, las proteínas deseadas no serán desnaturalizadas por el calor y por consiguiente permitirán una etapa de purificación (esto es, purificación que elimina las proteínas contaminantes) dando como resultado alta pureza. En algunas modalidades, un proceso de calentamiento de flujo continuo para purificar los monómeros o multímeros de cultivos de células bacteriana es usado. Por ejemplo, una suspensión celular se puede hacer pasar a través de un serpentín de acero inoxidable sumergido en un baño de agua ajustado a una temperatura que da como resultado lisis de las bacterias (por ejemplo, aproximadamente 55°C, 60°C, 65°C, 70°C, 75°C, 80°C, 85°C, 90°C, 95°C o 100°C por aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 ó 60 minutos). El efluente sometido a lisis es enrutado a un baño de enfriamiento para obtener rápido enfriamiento e impedir la renaturalización de las proteínas E. coli desnaturalizadas. Las proteínas E. coli se desnaturalizan y se impide que se renaturalice, pero el monómero o multímeros no se desnaturalizan bajo estas condiciones debido a la estabilidad excepcional de su andamio. El tiempo de calentamiento es controlado al ajustar la velocidad de flujo y longitud del serpentín. Este procedimiento produce proteínas activas con alto rendimiento y pureza excepcionalmente alta (por ejemplo, >60%, >65%, >70%, >75% o >80%) en comparación con procedimientos alternativos y es propenso a alto rendimiento de producción (por ejemplo, 96 cavidades o 384 cavidades) y producción a gran escala (por ejemplo, aproximadamente 100 µl a aproximadamente 1, 2, 5, 10, 15, 20, 50, 75, 100, 500 ó 1000 litros) de material que incluye material clínico y material para análisis de selección (por ejemplo, análisis de enlace e inhibición in vitro y análisis de actividad a base de células) . En algunas modalidades, enseguida de la manufactura de los monómeros o multímeros de la invención, los polipéptidos son tratados en una solución que comprende ácido yodoacético para coronar porciones libres de SH de cisteínas que no han formado enlaces de disulfuro. En algunas modalidades, se incluye ácido yodoacético 0.1-100 mM (por ejemplo, 1-10 mM) en las soluciones. Los polinucleótidos (también denominados como ácidos nucleicos) que codifican los dominios de monómero son usados comúnmente para fabricar dominios de monómero vía expresión. Los ácidos nucleicos que codifican dominios de monómero pueden ser derivados de una variedad de fuentes diferentes. Bibliotecas de dominios de monómero pueden ser preparadas al expresar una pluralidad de ácidos nucleicos diferentes que codifican dominios de monómeros que se presentan de manera estable en la naturaleza, dominios de monómero alterados (esto es, variantes de dominio de monómero) o una combinación de los mismos . Ácidos nucleicos que codifican fragmentos de dominios de monómero que se presentan de manera estable en la naturaleza y/o inmuno-dominios pueden también ser mezclados y/o recombinados (por ejemplo, al utilizar fragmentos producidos química o enzimáticamente) para generar dominios de monómero y/o inmuno-dominios modificados de plena longitud. Los fragmentos y el dominio de monómero pueden también ser recombinados mediante manipulación de ácidos nucleicos que codifican dominios o fragmentos de los mismos. Por ejemplo, la ligación de un constructo de ácido nucleico que codifica fragmentos del dominio de monómero pueden ser usados para generar un dominio de monómero alterado. Dominios de monómero alterados pueden también ser generados al proporcionar una colección de oligonucleótidos sintéticos (por ejemplo, oligonucleótidos de superposición) que codifican una secuencia conservada, aleatoria, pseudoaleatoria o una secuencia definida de secuencias de péptido que son luego insertadas mediante ligación a un sitio predeterminado en un polinucleótido que codifica un dominio de monómero. Similarmente, la diversidad de secuencias de uno o más dominios de monómero puede ser expandida mediante mutación del (los) dominio (s) de monómero con mutagénesis dirigida al sitio, mutación aleatoria, mutación pseudoaleatoria, mutación de kernel definido, mutación a base de codón y los semejantes. Las moléculas de ácido nucleico resultantes pueden ser propagadas en un huésped para clonación y amplificación. En algunas modalidades, los ácidos nucleicos son recombinados. La presente invención también proporciona un método para recombinar una pluralidad de ácidos nucleicos que codifican dominios de monómero y selección de la biblioteca resultante en cuando a dominios de monómero que se enlazan al ligando deseado o mezcla de ligandos o los semejantes. Ácidos nucleicos de dominio de monómero seleccionados pueden también ser cruzados en retroceso mediante recombinación con secuencias de polinucleótido que codifican secuencias neutras (esto es, que tienen efecto funcional no sustancial en el enlace) , tal como por ejemplo, mediante cruza en retroceso con una secuencia tipo silvestre o que se presenta de manera estable en la naturaleza sustancialmente idéntica a una secuencia seleccionada para producir dominios de monómero funcionales semejantes a los naturales. En general, durante la cruza en retroceso, se aplica selección subsecuente para retener la propiedad, por ejemplo enlace al ligando. En algunas modalidades, la biblioteca de monómero es preparada mediante recombinación. En tal caso, dominios de monómero son aislados y recombinados para recombinar combinatoriamente las secuencias de ácido nucleico que codifican los dominios de monómero (la recombinación puede ocurrir entre o dentro de dominios de monómero, o ambos) . La primera etapa involucra identificar un dominio de monómero que tiene la propiedad deseada, por ejemplo afinidad por un cierto ligando. En tanto que se mantienen los aminoácidos conservados durante la recombinación, las secuencias de ácido nucleicos que codifican los dominios de monómero pueden ser recombinadas o recombinadas y unidas a multímeros.
II. Multímeros Métodos para generar multímeros (esto es, proteínas de mosaico recombinantes o proteínas de mosaico combinatoriales) son un aspecto de la presente invención. Los multímeros comprenden por lo menos dos dominios de monómero.
Por ejemplo, los multímeros de la invención pueden comprender de 2 a aproximadamente 10 dominios de monómero, de 2 y aproximadamente 8 dominios de monómero, de aproximadamente 3 y aproximadamente 10 dominios de monómero, aproximadamente 7 dominios de monómero, aproximadamente 6 dominios de monómero, aproximadamente 5 dominios de monómero o aproximadamente 4 dominios de monómero. En algunas modalidades, el multímero comprende por lo menos 3 dominios de monómero. En vista del intervalo posible de tamaños de dominio de monómero, los multímeros de la invención pueden ser, por ejemplo de 100 kD, 90 kD, 80 kD, 70 kD, 60 kD, 50 kD, 40 kD, 30 kD, 25 kD, 20 kD, 15 kD, 10 kD, 5 kD o más grandes o más pequeños. Comúnmente, los dominios de monómero han sido pre-seleccionados para enlace a la molécula objetivo de interés. En algunas modalidades, cada dominio de monómero se enlaza específicamente a una molécula objetivo. En algunas de estas modalidades, cada monómero se enlaza a una posición diferente (análogo a un epítopo) sobre una molécula objetivo, múltiples dominios de monómero y/o inmuno-dominios que se enlazan a la misma molécula objetivo dan como resultado un efecto de avidez que produce avidez mejorada del multímero por la molécula objetivo en comparación con cada monómero individual. En algunas modalidades, el multímero tiene una avidez de por lo menos aproximadamente 1.5, 2, 3, 4, 5, 10, 20, 50 o 100 o 1000 veces la avidez de un dominio de monómero solo. ¡1 Comúnmente, el multímero tiene una K<j de menos de aproximadamente 10~15, l?~14, 10"13, 10"12, 10"11, l?"10, 10"9 ó 10A En algunas modalidades, por lo menos uno, dos, tres, cuatro o más (incluyendo todos) los monómeros de un multímero se enlazan a un ion tal como un ion de calcio u otro ion. En otra modalidad, el multímero comprende dominios de monómero con especificidades por diferentes moléculas objetivo. Por ejemplo, multímeros de tales diversos dominios de monómero se pueden enlazar específicamente a diferentes componentes en un sistema de replicación viral o diferentes serotipos de un virus. En algunas modalidades, por lo menos un dominio de monómero se enlaza a una toxina y por lo menos un dominio de monómero se enlaza a una molécula de superficie celular, actuando mediante esto como mecanismo para apuntar la toxina. En algunas modalidades, por lo menos dos dominios de monómero y/o inmuno-dominios del multímero se enlazan a diferentes moléculas objetivo en una célula o tejido objetivo. Similarmente, moléculas terapéuticas pueden ser apuntadas a la célula o tejido mediante enlace de un agente terapéutico a un monómero del multímero que también contiene otros dominios de monómero y/o inmuno-dominios que tienen especificidad de enlace de célula o tejido. En algunas modalidades, los diferentes monómeros se enlazan a diferentes componentes de una ruta de transducción de señal, una ruta metabólica o componentes de diferentes rutas metabólicas que ejercen el mismo efecto o efectos fisiológicos o biológicos aditivos o sinergísticos. Los multímeros pueden comprender una variedad de combinaciones de dominios de monómero. Por ejemplo, en un solo multímero, los dominios de monómero seleccionados pueden ser los mismos o idénticos, opcionalmente diferentes o no idénticos. Además, los dominios de monómero seleccionados pueden comprender varios dominios de monómero diferentes de la misma familia de dominio de monómeros o varios dominios de monómero de diferentes familias de dominio u opcionalmente una combinación de ambos. Los multímeros que son generados en la práctica de la presente invención pueden ser cualquiera de los siguientes: (1) Un homo-multímero (un multímero del mismo dominio, esto es, Al -Al -Al-Al) ; (2) un hetero-multímero de diferentes dominios de la misma clase de dominio, por ejemplo, A1-A2-A3-A4. Por ejemplo, el hetero-multímero incluye multímeros en donde Al, A2 , A3 y A4 son variantes que no se presentan de manera estable en la naturaleza diferentes de dominios de monómero de Notch/LNR particular, dominios de monómero de DSL, dominios de monómero de Anato, dominios de monómero de beta integrina o dominios de monómero de Ca-EGF o en donde algunos de Al, A2 , A3 y A4 son variantes que se presentan de manera estable en la naturaleza de un dominio de monómero de Notch/LNR, un dominio de monómero de DSL, un dominio de monómero de Anato, un dominio de monómero de beta integrina o un dominio de monómero de Ca-EGF. (3) Un hetero-multímero de dominios de diferentes clases de dominio de monómero, por ejemplo, A1-B2-A2-B1. Por ejemplo, en donde Al y A2 son dos dominios de monómero diferentes (ya sea que se presentan de manera estable en la naturaleza no se presentan de manera estable en la naturaleza) de Notch y Bl y B2 son dos dominios de monómero diferentes (ya sea que se presentan de manera estable en la naturaleza o no se presentan de manera estable en la naturaleza) de Anato. Bibliotecas de multímero empleadas en la práctica de la presente invención pueden contener homo-multímeros, hetero-multímeros de diferentes dominios de monómero (natural o no natural) de la misma clase de monómero o hetero-multímeros de dominios de monómero (natural o no natural) de diferentes clases de monómero o combinaciones de los mismos. Otros multímeros ejemplares incluyen, por ejemplo, trímeros y de nivel superior (por ejemplo, tetrámeros). Los dominios de monómero, como se describe en la presente, son también usados fácilmente en un heteromultímero que contiene inmuno-dominio (esto es, un multímero que tiene por lo menos una variante de inmuno-dominio y una variante de dominio de monómero) . Así, los multímeros de la presente invención pueden tener por lo menos un inmuno-dominio tal como un minicuerpo, un anticuerpo de un solo dominio, un fragmento variable de cadena individual (ScFv) o un fragmento de Fab; y por lo menos un dominio de monómero, tal como, por ejemplo, un dominio de trombospondina tipo I, un dominio de repetición de tiroglobulina tipo I, un dominio de trébol (tipo P) , un dominio semejante a EGF (por ejemplo, un dominio semejante a EGF tipo laminina), un dominio de Kringle, un dominio de fibronectina tipo I, un dominio de fibronectina tipo II, un dominio de fibronectina tipo III, un dominio de PAN, un dominio de Gla, un dominio de SRCR, un dominio de inhibidor de tripsina pancreático de Kunitz/bovino, un dominio de inhibidor de proteasa serina tipo Kazal, un dominio de factor de von Willebrand tipo C, un dominio semejante a anafilatoxina, un dominio de receptor de LDL de dominio CUB Clase A, un dominio de Sushi , un dominio de Link, un dominio de trombospondina tipo 3, un dominio semejante a inmunoglobulina, un dominio de lectina tipo C, un dominio de MAM, un dominio de factor de von Willebrand tipo A, un dominio de somatomedina B, un dominio de cuatro núcleos de disulfuro tipo WAP, un dominio F5/8 tipo C, un dominio de hemopexina, un dominio de SH2 , un dominio de SH3 , un dominio de EF Hand, un dominio de caderina, un dominio de anexina, un dominio de dedo de zinc y un dominio de C2 o variantes de los mismos. Los dominios no necesitan ser seleccionados antes de que los dominios sean enlazados para formar multímeros. Por otra parte, los dominios pueden ser seleccionados en cuanto a la habilidad para enlazarse a una molécula objetivo antes de ser enlazados a multímeros. Así, por ejemplo, un multímero puede comprender dos dominios que se enlazan a una molécula objetivo y un tercer dominio que se enlaza a una segunda molécula objetivo. Comúnmente, los multímeros de la presente invención son un solo polipéptido discreto. Multímeros de porciones de enlazador parcial-dominio-enlazador parcial son una asociación de múltiples polipéptidos, cada uno correspondiente a una porción de enlazador parcial-dominio-enlazador parcial. Así, los multímeros de la presente invención pueden tener las siguientes calidades: multivalentes, multiespecíficos , una sola cadena, estables térmicamente, vida media en el suero y/o vida media en almacenamiento extendida. Además, por lo menos uno, más de uno o todos los dominios de monómero se pueden enlazar a un ion (por ejemplo, un ion de metal o un ion de calcio) , por lo menos uno, más de uno o todos los dominios de monómero pueden ser derivados de dominios de monómero de trombospondina tipo I, dominios de monómero tiroglobulina o dominios de monómero de trébol, por lo menos uno, más de uno o todos de los dominios de monómero pueden ser que no se presenten de manera estable en la naturaleza y/o por lo menos uno, más de uno o todos los dominios de monómero pueden comprender 1, 2, 3 ó 4 enlaces de disulfuro por dominio de monómero. En algunas modalidades, los multímeros comprenden por lo menos dos (o por lo menos tres) dominios de monómero, en donde por lo menos un dominio de monómero es un dominio de monómero que no se presenta de manera estable en la naturaleza y los dominios de monómero se enlazan a calcio. En algunas modalidades, los multímeros comprenden por lo menos 4 dominios de monómero, en donde por lo menos un dominio de monómero no se presenta de manera estable en la naturaleza y en donde: (a) cada dominio de monómero es de entre 30-100 aminoácidos y cada uno de los dominios de monómero comprende por lo menos un enlace de disulfuro; o (b) cada dominio de monómero es de entre 30-100 aminoácidos y es derivado de una proteína extracelular; o (c) cada dominio de monómero es de entre 30-100 aminoácidos y se enlaza a una proteína objetivo. En algunas modalidades, los multímeros comprenden por lo menos 4 dominios de monómero, en donde por lo menos un dominio de monómero no se presenta de manera estable en la naturaleza, y en donde: (a) cada dominio de monómero es de entre 35-100 aminoácidos; o (b) cada dominio comprende por lo menos un enlace de disulfuro y es derivado de una proteína humana y/o una proteína extracelular. En algunas modalidades, los multímeros comprenden por lo menos dos dominios de monómero, en donde por lo menos un dominio de monómero no se presentan de manera estable en la naturaleza y en donde cada dominio es: (a) de 25-50 aminoácidos de longitud y comprende por lo menos un enlace de disulfuro; o (b) es de 25-50 aminoácidos de longitud y es derivado de una proteína extracelular; o (c) es de 25-50 aminoácidos y se enlaza a un objetivo de proteína; o (d) es de 35-50 aminoácidos de longitud. En algunas modalidades, los multímeros comprenden por lo menos dos dominios de monómero, en donde por lo menos un dominio de monómero no se presenta de manera estable en la naturaleza, y (a) cada dominio de monómero comprende por lo menos un enlace de disulfuro; o (b) por lo menos un dominio de monómero es derivado de una proteína extracelular; o (c) por lo menos un dominio de monómero se enlaza a una proteína objetivo. En algunas modalidades, los multímeros de la invención se enlazan al mismo u otros multímeros para formar agregados. La agregación puede ser moderada, por ejemplo, por la presencia de dominios hidrofóbicos sobre dos dominios de monómero y/o inmuno-dominios, dando como resultado la formación de interacciones no covalentes entre dos dominios de monómero y/o inmuno-dominios . Alternativamente, la agregación puede ser facilitada por uno o más dominios de monómero en un multímero que tiene especificidad de enlace por un dominio de monómero en otro multímero. También se pueden formar agregados debido a la presencia de péptidos de afinidad sobre los dominios de monómero o multímeros. Los agregados pueden contener más dominios de enlace de molécula objetivo que un solo multímero. Los multímeros con afinidad tanto por un objetivo de superficie celular y un segundo objetivo pueden proporcionar efectos de avidez incrementada. En algunos casos, la fluidez de membrana puede ser más flexible que los enlazadores de proteína en la optimización (mediante auto-montaje) del espaciamiento y valencia de las interacciones. En algunos casos, los multímeros se enlazarán a dos objetivos diferentes, cada uno sobre una célula diferente o uno sobre una célula y otro sobre una molécula con múltiples sitios de enlace.
III. Enlazadores Los dominios de monómero seleccionados pueden ser unidos mediante un enlazador para formar un multímero de una sola cadena. Por ejemplo, un enlazador es posicionado entre cada dominio de monómero discreto separado en un multímero. Comúnmente, los inmuno-dominios son también enlazados entre sí o a dominios de monómero vía una porción enlazadora. Porciones enlazadoras que pueden ser usadas fácilmente para enlazar variantes de inmuno-dominio conjuntamente son las mismas como aquellas descritas para multímeros de variantes dominio de monómeros. Porciones enlazadoras ejemplares apropiadas para unir variante de inmuno-dominio a otros dominios a multímeros son descritas en la presente. La unión de los dominios de monómero seleccionados vía un enlazador se puede efectuar utilizando una variedad de técnicas conocidas en el arte. Por ejemplo, el ensamble de combinación de polinucleótidos que codifican dominios de monómero seleccionados se puede obtener mediante digestión de restricción y re-ligación, mediante reacciones de superposición de auto-cebado a base de PCR, u otros métodos recombinantes. El enlazador puede ser anexado a un monómero antes de que el monómero sea identificado en cuanto a su habilidad para enlazarse a un multímero objetivo o después que el monómero ha sido seleccionado en cuanto a la habilidad para enlazarse a un multímero objetivo. El enlazador puede ser un enlazador que se presenta de manera estable en la naturaleza, sintético o una combinación de ambos. Por ejemplo, el enlazador sintético puede ser un enlazador aleatorizado, por ejemplo, tanto en secuencia como en tamaño. En un aspecto, el enlazador aleatorizado puede comprender una secuencia plenamente aleatorizada u opcionalmente, el enlazador aleatorizado puede ser a base de secuencias de enlazador naturales. El enlazador puede comprender, por ejemplo una porción que no es polipéptido, un polinucleótido, un polipéptido o los semejantes. Un enlazador puede ser rígido o alternativamente, flexible, o una combinación de ambos. La flexibilidad del enlazador puede ser función de la composición tanto del enlazador como los dominios de monómero con el cual el enlazador interactúa. El enlazador une dos dominio de monómero seleccionados y mantiene los dominios de monómero como dominios de monómero discretos separados. El enlazador puede permitir que los dominios de monómero discreto separados cooperen y todavía mantengan propiedades separadas, tales como múltiples sitios de enlace separados por el mismo ligando en un multímero o por ejemplo, múltiples sitios de enlace separados para diferentes ligandos en un multímero. En algunos casos, existe un puente de disulfuro entre dos dominios de monómero enlazados o entre un enlazador y un dominio de monómero. En algunas modalidades, los dominios de monómero y/o enlazadores comprenden centros de enlace de metal . La elección de un enlazador apropiado para un caso específico, en donde dos o más dominios de monómero (esto es, cadenas de polipéptido) van a ser conectados puede depender de una variedad de parámetros en los que se incluyen, por ejemplo, la naturaleza de los dominios de monómero, la estructura y naturaleza del objetivo al cual el multímero de polipéptido se debe enlazar y/o la estabilidad del enlazador de péptido hacia la proteólisis y oxidación.
La presente invención proporciona métodos para optimizar la elección de enlazador una vez que los dominios de monómero/variantes deseados han sido identificados. En general, bibliotecas de multímeros que tienen una composición que es fija con respecto a la composición del dominio de monómero, pero variables en composición y longitud de enlazador, pueden ser preparados fácilmente y seleccionadas como se describe anteriormente . Comúnmente, el polipéptido enlazador puede incluir predominantemente residuos de aminoácido seleccionados de Gly, Ser, Ala y Thr. Por ejemplo, el enlazador de péptido puede contener por lo menos 75% (calculado en base al número total de residuos presentes en el enlazador de péptido) , tal como por lo menos 80%, por ejemplo por lo menos 85% o por lo menos 90% de residuos de aminoácido seleccionado de Gly, Ser, Ala y Thr. El enlazador de péptido puede también consistir de Gly, Ser, Ala y/o Thr solamente. El polipéptido enlazador debe tener una longitud que es apropiada para enlazar dos dominios de monómero, de tal manera que asuman la formación correcta entre sí de tal manera que retenga la actividad deseada, por ejemplo como antagonista de un receptor dado. Una longitud apropiada para este propósito es una longitud de por lo menos uno y comúnmente menos de aproximadamente 50 residuos de aminoácido, tal como 2-25 residuos de aminoácido, 5-20 residuos de aminoácido, 5-15 residuos de aminoácido, 8-12 residuos de aminoácido u 11 residuos. Similarmente, el polipéptido que codifica un enlazador puede fluctuar en tamaño, por ejemplo, de aproximadamente 2 a aproximadamente 15 aminoácidos, de aproximadamente 3 a aproximadamente 15, de aproximadamente 4 a aproximadamente 12, aproximadamente 10, aproximadamente 8 ó aproximadamente 6 aminoácidos. En métodos y composiciones que involucran ácidos nucleicos, tales como ADN, ARN o combinaciones de ambos, el polinucleótido que contiene la secuencia de enlazador puede ser por ejemplo de entre aproximadamente 6 nucleótidos y aproximadamente 45 nucleótidos, entre aproximadamente 9 nucleótidos y aproximadamente 45 nucleótidos, entre aproximadamente 12 nucleótidos y aproximadamente 36 nucleótidos, aproximadamente 30 nucleótidos, aproximadamente 24 nucleótidos o aproximadamente 18 nucleótidos. Asimismo, los residuos de aminoácido seleccionados para inclusión en el polipéptido enlazador deben exhibir propiedades que no interfieren significativamente con la actividad o función del multímero de polipéptido. Así, el enlazador péptido debe en todo no exhibir una carga que sería inconsistente con la actividad o función del multímero de polipéptido o interferir con el plegado interno o formar enlaces u otras interacciones con residuos de aminoácido en uno o más de los dominios de monómero que impedirían seriamente el enlace del multímero de polipéptido multímero al objetivo en cuestión. En otra modalidad de la invención, el enlazador de péptido es seleccionado de una biblioteca en donde los residuos de aminoácidos en el enlazador de péptido son aleatorizados para un conjunto específico de dominios de monómero en un multímero de polipéptido particular. Un enlazador flexible podría ser usado para encontrar combinaciones apropiadas dominios de monómero, que es luego optimizado utilizando esta biblioteca aleatoria de enlazadores variables para obtener enlazadores con longitud y geometría óptimas. Los enlazadores óptimos pueden contener el número mínimo de residuos de aminoácido del tipo correcto que participan en el enlace al objetivo y restringen el movimiento de los dominios de monómero entre sí en el multímero de polipéptido cuando no están enlazados al objetivo. El uso que enlazadores de péptido que se presentan de manera estable en la naturaleza también como artificiales para conectar polipéptidos a nuevos polipéptidos de fusión enlazados es bien conocido en la literatura (Hallewell et al. (1989) , J. Biol. Chem. 264, 5260-5268; Alfthan et al. (1995) , Protein Eng. 8, 725-731; Robinson & Sauer (1996) , Biochemistry 35, 109-116; Khandekar et al. (1997) , J. Biol. Chem. 272, 32190-32197; Fares et al. (1998) , Endocrinology 139, 2459-2464; Smallshaw et al. (1999) , Protein Eng. 12, 623-630; US 5,856,456) . Un ejemplo en donde el uso de enlazadores de péptido está extendida es para la producción de anticuerpos de una sola cadena en donde las regiones variables de una cadena ligera (V) y una cadena pesada (VH) son unidas por medio de un enlazador artificial y un gran número de publicaciones existen dentro de este campo particular. Un enlazador de péptido ampliamente usado es un 15mero que consiste de tres repeticiones de una secuencia de aminoácido de Gly-Gly-Gly-Gly-Ser ((Gly4Ser)3) . Otros enlazadores han sido usados y tecnología de despliegue de fago, también como tecnología de fago infectiva selectiva se ha usado para diversificar y seleccionar secuencias de enlazador apropiadas (Tang et al . (1996), J. Biol. Chem. 271, 15682-15686; Hennecke et al. (1998) , Protein Eng. 11, 405-410) . Enlazadores de péptido han sido usados para conectar cadenas individuales en proteínas hetero- y homo-diméricas tales como el receptor de célula T, el represor de lambda Cro, el represor P22 Are IL-12, TSH, FSH, IL-5 e interferón-?. Enlazadores de péptido también han sido usados para crear polipéptidos de fusión. Varios enlazadores han sido usados y en el caso del represor Are se ha usado despliegue de fago para optimizar la longitud y composición del enlazador para estabilidad incrementada de la proteína de una escala cadena (Robinson and Sauer (1998), Proc. Natl. Acad. Sci. USA 95, 5929-5934). Otro tipo de enlazador es una inteina, esto es, un péptido estirado que es expresado con el polipéptido de una cadena, pero removido post-traduccionalmente mediante empalme de proteína. El uso de inteínas es revisado por F.S. Gimble en Chemistry and Biology, 1998, Vol 5, No. 10 pp . 251-256. Todavía otra manera de obtener un enlazador apropiado es al optimizar un enlazador simple, por ejemplo (Gly4Ser)n, por medio de mutagénesis aleatoria. Como se menciona anteriormente, es en general preferido que el enlazador de péptido posea por lo menos algo de flexibilidad. Así, en algunas modalidades, el enlazador de péptido contiene 1-25 residuos de glicina, 5-20 residuos de glicina, 5-15 residuos de glicina u 8-12 residuos de glicina. El enlazador de péptido contendrá comúnmente por lo menos 50% residuos de glicina, tal como por lo menos 75% residuos de glicina. En algunas modalidades de la invención, el enlazador de péptido contiene residuos de glicina solamente. El enlazador de péptido puede, además de los residuos de glicina, comprender otros residuos, en particular residuos seleccionados de Ser, Ala y Thr, en particular Ser. Así, un ejemplo de un enlazador de péptido específico incluye un enlazador de péptido que tiene la secuencia de aminoácidos Glyx-Xaa-Glyy-Xaa-Glyz, en donde cada uno de cada Xaa es seleccionado independientemente de Ala, Val, Leu, lie, Met, Phe, Trp, Pro, Gly, Ser, Thr, Cys, Tyr, Asn, Gln, Lys, Arg, His, Asp y Glu, y en donde x, y y z son cada uno números enteros en el intervalo de 1-5. En algunas modalidades, cada Xaa es seleccionado independientemente del grupo que consiste de Ser, Ala y Thr, en particular Ser. Más en particular, el enlazador de péptido tiene la secuencia de aminoácidos Gly-Gly-Gly-Xaa-Gly-Gly-Gly-Xaa-Gly-Gly-Gly, en donde cada Xaa es seleccionado independientemente del grupo que consiste de Ala, Val, Leu, lie, Met, Phe, Trp, Pro, Gly, Ser, Thr, Cys, Tyr, Asn, Gln, Lys, Arg, His, Asp y Glu. En algunas modalidades, cada Xaa es seleccionado independientemente del grupo que consiste de Ser, Ala y Thr, en particular Ser. En algunos casos puede ser deseable o necesario proporcionar algo de rigidez al enlazador de péptido. Esto se puede llevar a cabo al incluir residuos de prolina en la secuencia de aminoácido del enlazador de péptido. Así, en otra modalidad de la invención, el enlazador de péptido comprende por lo menos un residuo de prolina en la secuencia de aminoácido del enlazador de péptido. Por ejemplo, el enlazador de péptido tiene una secuencia de aminoácido, en donde por lo menos 25%, tal como por lo menos 50%, por ejemplo por lo menos 75% de los residuos de aminoácido son residuos de prolina. En una modalidad particular de la invención, el enlazador de péptido comprende residuos de prolina solamente. En algunas modalidades de la invención, el enlazador de péptido está modificado de tal manera que se introduce un residuo de aminoácido que comprende un grupo de anexión para una porción que no es de polipéptido. Ejemplos de tales residuos de aminoácido pueden ser un residuo de cisteína (al cual la porción que no es de polipéptido es luego anexada subsecuentemente) o la secuencia de aminoácido puede incluir un sitio de N-glicosilación in vivo (anexando mediante esto una porción de azúcar (in vivo) al enlazador de péptido) . Una opción adicional es incorporar genéticamente aminoácidos no naturales utilizando tARN y tARN sintetasas evolucionadas (véase, por ejemplo, publicación de solicitud de patente estadounidense 2003/0082575) a los dominios de monómero o enlazadores. Por ejemplo, la inserción de ceto-tirosina permite el acoplamiento específico de sitio para dominios de monómero o multímeros expresados. En algunas modalidades de la invención, el enlazador de péptido comprende por lo menos un residuo de cisteína, tal como un residuo de cisteína. Así, en algunas modalidades de la invención el enlazador de péptido comprende residuos de aminoácido seleccionados del grupo que consiste de Gly, Ser, Ala, Thr y Cys. En algunas modalidades, tal enlazador de péptido comprende un residuo de cisteína solamente. En una modalidad adicional, el enlazador de péptido comprende residuos de glicina y residuo de cisteína, tales como residuos de glicina y residuos de cisteína solamente. Comúnmente, solo un residuo de cisteína será incluido por enlazador de péptido. Así, un ejemplo de un enlazador de péptido específico que comprende un residuo de cisteína, incluye un enlazador de péptido que tiene una secuencia de aminoácidos Glyn-Cys-GlyTO, en donde n and m son cada uno números enteros de 1-12, por ejemplo de 3-9, de 4-8 o de 4-7. Más en particular, el enlazador de péptido puede tener la secuencia de aminoácidos GGGGG-C-GGGGG. Este procedimiento (esto es, introducción de un residuo de aminoácido que comprende un grupo de anexión para una porción que no es de polipéptido) puede también ser usado para los enlazadores que contienen prolina más rígidos. Así, el enlazador de péptido puede comprender residuos de prolina y cisteína, tales como residuos de prolina y cisteína solamente. Un ejemplo de un enlazador de péptido que contiene prolina específico que comprende un residuo de cisteína, incluye un enlazador de péptido que tiene la secuencia de aminoácido Pron-Cys-Prom, en donde cada uno de n y m son números enteros de 1-12, preferiblemente de 3-9, tal como de 4-8 o de 4-7. Más en particular, el enlazador de péptido puede tener la secuencia de aminoácidos PPPPP-C-PPPPP . En algunas modalidades, el propósito de introducir un residuo de aminoácido, tal como un residuo de cisteína, que comprende un grupo de anexión para una porción que no es de polipéptido es para anexar subsecuente una porción que no es de polipéptido al residuo. Por ejemplo, porciones que no son de polipéptido pueden mejorar la vida media en el suero del multímero de polipéptido. Así, el residuo de cisteína puede ser anexado covalentemente a una porción que no es de polipéptido. Ejemplos preferidos de porciones que no son de polipéptido incluyen moléculas de polímero, tales como PEG o mPEG, en particular mPEG también como agentes terapéuticos que no son polipéptido. La persona experimentada reconocerá que residuos de aminoácido diferentes a cisteína pueden ser usados para anexar un no polipéptido al enlazador de péptido. Un ejemplo particular de tales otros residuos incluyen acoplamiento de la porción que no es de polipéptido a un residuo de lisina. Otra posibilidad de introducir un grupo de anexión específico del sitio para una porción que no es de polipéptido en el enlazador de péptido es introducir un sitio de N-glicosilación in vivo, tal como un sitio de N-glicosilación in vivo, en el enlazador de péptido. Por ejemplo, un sitio de N-glicosilación in vivo puede ser introducido en un enlazador de péptido que comprende residuos de aminoácido seleccionados del grupo que consiste de Gly, Ser, Ala y Thr. Se comprenderá que con el fin de asegurar que una porción de azúcar esté en efecto anexada al sitio de N-glicosilación in vivo, la secuencia de nucleótidos que codifica el multímero de polipéptido debe ser insertada a un huésped de expresión eucarióntico de glicosilación. Un ejemplo específico de un enlazador de péptido que comprende un sitio de N-glicosilación in vivo es un enlazador de péptido que tiene la secuencia de aminoácidos Glyn-Asn-Xaa-Ser/Thr-Glyn, preferiblemente Glyn-Asn-Xaa-Thr-Glym, en donde Xaa es cualquier residuo de aminoácido excepto prolina, y en donde n y m son cada uno números enteros en el intervalo de 1-8, preferiblemente en el intervalo de 2-5. Frecuentemente, las secuencias de aminoácido de todos los enlazadores de péptido presentes en el multímero de polipéptido serán idénticas. No obstante, en ciertas modalidades, las secuencias de aminoácidos de todos los enlazadores de péptido presentes en el multímero de polipéptido pueden ser diferentes. Se cree que lo último es relevante en particular en el caso de que el multímero de polipéptido es un tri-mero o tetra-mero de polipéptido y particularmente en tales casos, en donde un residuo de aminoácido que comprende un grupo de anexión para una porción que no es de polipéptido es incluido en el enlazador de péptido. Bastante frecuente, será deseable o necesario anexar solamente unas pocas, comúnmente solo una porción/porciones que no son de polipéptido (tal como un mPEG, una porción de azúcar o un agente terapéutico que no es de polipéptido) al multímero de polipéptido con el fin de obtener el efecto deseado, tal como vida media en el suero prolongada. Evidentemente, en el caso de un tri-mero de polipéptido, el cual contendrá dos enlazadores de péptido, solamente se requerirá un enlazador de péptido a ser modificado por ejemplo mediante introducción de un residuo de cisteína, mientras la modificación del otro enlazador de péptido comúnmente no será necesaria. En este caso, todos (ambo) los enlazadores de péptido del multímero de polipéptido (tri-mero) son diferentes. Así, en una modalidad adicional de la invención, las secuencias de aminoácidos de todos los enlazadores de péptidos presentes en el multímero de polipéptido son idénticos excepto por uno, dos o tres enlazadores de péptido, tal como excepto por uno o dos enlazadores de péptido, en particular excepto por un enlazador de péptido, que tiene una secuencia de aminoácido que comprende un residuo de aminoácido que comprende un grupo de anexión para una porción que no es de polipéptido. Ejemplos preferidos de tales residuos de aminoácido incluyen residuos de cisteína de sitio de N-glicosilación in vivo. Un enlazador puede ser una secuencia de enlazador natural o sintético. Un enlazador natural ejemplar incluye, por ejemplo, la secuencia entre la última cisteína de un primer dominio de monómero de Notch/LNR, dominio de monómero de DSL, dominio de monómero de Anato, un dominio de monómero de beta integrina o dominio de monómero de Ca-EGF y la primera cisteína de un segundo dominio de monómero de Notch/LNR, dominio de monómero de DSL, dominio de monómero de Anato, un dominio de monómero de beta integrina o dominio de monómero de Ca-EGF puede ser usado como secuencia de enlazador. El análisis de varios enlaces de dominio revela que los enlazadores naturales fluctúan de por lo menos 3 aminoácidos a menos de 20 aminoácidos, por ejemplo, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17 ó 18 aminoácidos de largo. Sin embargo, aquellos de habilidad en el arte reconocerán que secuencias de enlazador más largas o más cortas pueden ser usadas. En algunas modalidades, el enlazador es un 6-mero de las siguientes secuencias A?A2A3A4A5A6 , en donde Ax es seleccionado de los aminoácidos A, P, T, Q, E y K; A2 y A3 son cualquier aminoácido excepto C, F, Y, W o M; A4 es seleccionado de los aminoácidos S, G y R; A5 es seleccionado de los aminoácidos H, P y R; y A6 es el aminoácido, T. Métodos para generar multímeros a partir de dominios de monómero y/o inmuno-dominios pueden incluir unir los dominios seleccionados con por lo menos un enlazador para generar por lo menos un multímero, por ejemplo el multímero puede comprender por lo menos dos de los dominios de monómero y/o inmuno-dominios y el enlazador. El (los) multímero (s) es (son) seleccionados por una avidez o afinidad mejorada o especificidad alterada por el ligando deseado o mezcla de ligandos en comparación con los dominios de monómero seleccionados. Una composición del multímero producido mediante el método es incluido en la presente invención. En otros métodos, los dominios de multímero seleccionados son unidos con por lo menos un enlazador para generar por lo menos dos multímeros, en donde los dos multímeros comprenden dos o más de los dominios de monómero seleccionado y el enlazador. Los dos o más multímeros son seleccionados por una avidez o afinidad mejorada o especificidad alterada por el ligando deseado o mezcla de ligandos en comparación con los dominios de monómero seleccionados. Composiciones de dos o más multímeros producidas mediante el método anterior también son aspectos de la invención. Los enlazadores, multímeros o multímeros seleccionados producidos mediante los métodos indicados anteriormente y a continuación son aspectos de la presente invención. Bibliotecas que comprenden multímeros, por ejemplo una biblioteca que comprende aproximadamente 100, 250, 500 o más miembros producidos mediante el método de la presente invención o seleccionados mediante los métodos de la presente invención son proporcionadas. En algunas modalidades, uno o más miembros que comprenden células de las bibliotecas son también incluidas. Bibliotecas de los polipéptidos recombinantes son también un aspecto de la presente invención, por ejemplo una biblioteca que comprende aproximadamente 100, 250, 500 o más polipéptidos recombinantes diferentes. Enlazadores apropiados usados en la práctica de la presente invención incluyen un heterodímero obligado de porciones de enlazador parciales. El término "heterodímero obligado" (también denominados como "péptidos de afinidad") se refiere en la presente a un dímero de dos porciones de enlazador parciales que difieren entre sí en composición y que se asocian entre sí de manera no covalente, específica para unir dos dominios conjuntamente. La asociación específica es de tal manera que los dos enlazadores parciales se asocian sustancialmente entre sí en comparación con asociarse con otros enlazadores parciales. Así, en contraste con los multímeros de la presente invención que son expresados como un solo polipéptido, multímeros de dominios que son enlazados conjuntamente vía heterodímeros son ensamblados a partir de unidades de enlazador parcial -monómero-enlazador parcial. El ensamble de los heterodímeros puede ser obtenida, por ejemplo mediante mezcla. Así, si los enlazadores parciales son segmentos de polipéptido, cada unidad de enlazador parcial-monómero-enlazador parcial puede ser expresada como un péptido discreto antes del ensamble del multímero. Un enlace de disulfuro puede ser agregado para bloquear covalentemente los péptidos conjuntamente enseguida del apareamiento no covalente correcto. Porciones de enlazado parciales que son apropiadas para formar heterodímeros obligados incluyen, por ejemplo polinucleótidos, polipéptidos y los semejantes. Por ejemplo, cuando el enlazador parcial es un polipéptido, dominios de enlace son producidos individualmente junto con su péptido de enlace único (esto es, un enlazador parcial) y más tarde combinados para formar multímeros. Véase, por ejemplo Madden, M., Aldwin, L., Gallop, M. A. y Stemmer, W. P. C. (1993) Peptide linkers: Unique self-associative high-affinity peptide linkers. Thirteenth American Peptide Symposium, Edmonton Canadá (extracto) . El orden espacial de los dominios de enlace en el multímero es así determinado por la especificidad de enlace heterodimérica de cada enlazador parcial . Enlazadores parciales que contiene secuencias de aminoácido terminales que se enlazan específicamente a una secuencia de aminoácido heteróloga definida. Un ejemplo de tal secuencia de aminoácido es el activador de cabeza de neuropéptido Hydra como se describe en Bodenmuller et al., The neuropeptide head activator loses its biological activity by dimerization, (1986) EMBO J 5(8): 1825-1829. Véase, por ejemplo, patente estadounidense No. 5,491,074 y WO 94/28173. Estos enlazadores parciales permiten que el multímero sea producido primero a medida que las unidades de monómero-enlazador parcial o unidades de enlazador parcial -monómero-enlazador parcial que son luego mezcladas conjuntamente y se le permite ensamblarse al orden ideal en base a las especificidades de enlace de cada enlazador parcial. Alternativamente, monómeros enlazado a enlazadores parciales pueden ser puestos en contacto con una superficie, tal como una célula, en la cual múltiples monómeros se pueden asociar para formar complejos de avidez más alta vía enlazadores parciales. En algunos casos, la asociación formará vía movimiento Browniano aleatorio.
Cuando el enlazador parcial comprende una porción de enlace de ADN, cada dominio de monómero tiene un enlazador parcial corriente arriba y un enlazador parcial corriente abajo (esto es, Lp-dominio-Lp, en donde "Lp" es una representación de un enlazador parcial) que contiene una proteína de enlace de ADN con especificidad de enlace de ADN exclusivamente única (estos dominios pueden ser producidos individualmente y luego ensamblados a un multímero específico mediante la mezcla de los dominios con fragmentos de ADN que contienen las secuencias de nucleótido apropiadas (esto es, los sitios de reconocimiento específicos para los proteínas de enlace de ADN de los enlazadores parciales de los dos dominios deseados) para unir los dominios en el orden deseado. Adicionalmente, los mismos dominios pueden ser ensamblados a muchos multímeros diferentes mediante la adición de secuencias de ADN que contienen varias combinaciones de sitios de reconocimiento de proteína de enlace de ADN. La aleatorización adicional de combinaciones de sitios de reconocimiento de proteína de enlace de ADN en los fragmentos de ADN puede permitir el ensamble de bibliotecas de multímeros. El ADN puede ser sintetizado con análogos de cadena fundamental para impedir la degradación in vivo. En algunas modalidades, el multímero comprende dominios de monómero con especificidades por diferentes proteínas. Las diferentes proteínas pueden ser relacionadas o no relacionadas. Ejemplos de proteínas relacionadas incluyen miembros de una familia de proteínas o diferentes serotipos de un virus. Alternativamente, los dominios de monómero de un multímero pueden apuntar diferentes moléculas en una ruta fisiológica (por ejemplo diferentes proteínas de coagulación de sangre) . En todavía otras modalidades, los dominios de monómero se enlazan a proteínas en rutas no relacionadas (por ejemplo, dos dominios se enlazan a factores de sangre, otros dos dominios se enlazan a proteínas relacionadas con la inflamación y un quinto se enlaza a albúmina de suero) . En otra modalidad, un multímero consiste de dominios de monómero que se enlazan a diferentes patógenos o contaminantes de interés. Tales multímeros son útiles como un solo agente de detección capaz de detectar la posibilidad de cualquiera de un número de patógenos o contaminantes. IV. Métodos para identificar dominios de monómero y/o multímeros con una afinidad de enlace deseada La invención proporciona métodos para identificar dominios de monómero que se enlazan a un ligando o mezcla de ligandos seleccionados o deseados. En algunas modalidades, dominios de monómero y/o inmuno-dominios son identificados o seleccionados en cuanto a una propiedad deseada (por ejemplo, afinidad de enlace) y luego los dominios de monómero y/o inmuno-dominios son formados en multímeros. Para aquellas modalidades, se puede usar cualquier método que de como resultado la selección de dominios con una propiedad deseada (por ejemplo, propiedades de enlace específica). Por ejemplo, los métodos pueden comprender proporcionar una pluralidad de diferentes ácidos nucleicos, cada ácido nucleico codifica un dominio de monómero; traducir la pluralidad de ácidos nucleicos diferentes, proporcionando mediante esto una pluralidad de diferentes dominios de monómero; seleccionar la pluralidad de dominios de monómero diferentes en cuanto a enlace del ligando o mezcla de ligandos deseados e identificar miembros de la pluralidad de diferentes dominios de monómero que se enlazan al ligando o mezclas de ligando deseados. La selección de dominios de monómero y/o inmuno-dominios de una biblioteca de dominios se puede efectuar mediante una variedad de procedimientos. Por ejemplo, un método para identificar dominios de monómero y/o inmuno-dominios que tienen una propiedad deseada involucra traducir una pluralidad de ácidos nucleicos, en donde cada ácido nucleico codifica un dominio de monómero y/o inmuno-dominio, seleccionar los polipéptidos codificados por la pluralidad de ácidos nucleicos e identificar aquellos dominios de monómero y/o inmuno-dominios que, por ejemplo, se enlazan a un ligando o mezcla de ligandos deseados, produciendo mediante esto un dominio de monómero y/o inmuno-dominio seleccionado. Los dominios de monómero y/o inmuno-dominios expresados por cada uno de los ácidos nucleicos puede ser probados en cuando a su habilidad para enlazarse al ligando mediante métodos conocidos en el arte (esto es, método de toma panorámica, cromatografía de afinidad, análisis de FACS) . Como se menciona anteriormente, la selección de dominios de monómero y/o inmuno-dominios puede estar basada en el enlace a un ligando tal como una proteína objetivo u otra molécula objetivo (por ejemplo, lípido, carbohidrato, ácido nucleico y los semejantes) . Otras moléculas pueden opcionalmente ser incluidas en los métodos junto con el objetivo, por ejemplo, iones tales como Ca+2. El ligando puede ser un ligando conocido, por ejemplo un ligando que se sabe que se enlaza a uno de la pluralidad de dominios de monómero o por ejemplo, el ligando deseado puede ser un ligando de dominio de monómero desconocido. Otras selecciones de dominios de monómero y/o inmuno-dominios pueden estar basadas, por ejemplo en la inhibición o mejora de una función específica de una proteína objetivo o una actividad. La actividad de proteína objetivo puede incluir, por ejemplo endocitosis o internalización, inducción del segundo sistema mensajero, regulación ascendente o regulación descendente de un gen, enlace a una matriz extracelular, liberación de una(s) molécula (s) o cambio en conformación. En este caso, el ligando no necesita ser conocido. La selección puede también incluir utilizar análisis de alto rendimiento. Cuando un dominio de monómero y/o inmuno-dominio es seleccionado en base a su habilidad para enlazarse a un ligando, la base de selección puede incluir selección basada en una velocidad de disociación lenta, que es usualmente predictiva de alta afinidad. La valencia de ligando puede también ser variada para controlar la afinidad de enlace promedio de dominios de monómero y/o inmuno-dominio seleccionados. El ligando puede ser enlazado a una superficie o sustrato a densidad variables, tal como al incluir un compuesto competidor, mediante dilución o mediante otro método conocido para aquellos experimentados en el arte. La alta densidad (valencia) del ligando predeterminado puede ser usada para enriquecer dominios de monómero que tienen relativamente baja afinidad, mientras que una baja densidad (valencia) puede enriquecer preferiblemente para dominios de monómero de afinidad más alta. Una variedad de vectores o sistemas de despliegue reporteros pueden ser usados para expresar ácidos nucleicos que codifican los dominios de monómero y/o inmuno-dominios y/o multímeros de la presente invención y para probar en cuanto a una actividad deseada. Por ejemplo, un sistema de despliegue de fago es un sistema en el cual dominios de monómero son expresados como proteínas de fusión sobre la superficie del fago (Pharmacia, Milwaukee Wis.). El despliegue de fago puede involucrar la presentación de una secuencia de polipéptido que codifica dominios de monómero y/o inmuno-dominios sobre la superficie de un bacteriófago filamentoso, comúnmente como una fusión con una proteína de recubrimiento de bacteriófago. En general, en estos métodos, en general cada partícula de fago o célula sirve como miembro de biblioteca individual que despliega una sola especie del polipéptido desplegado además del fago natural o secuencia de proteína de célula. La pluralidad de ácidos nucleicos son clonados al ADN de fago en un sitio que da como resultado la transcripción de una proteína de fusión, una porción de la cual es codificada por la pluralidad de ácidos nucleicos. El fago que contiene una molécula de ácido nucleico sufre replicación y transcripción en la célula. La secuencia líder de la proteína de fusión dirige el transporte de la proteína de fusión a la punta de la partícula de fago. Así, la proteína de fusión que es parcialmente codificada por el ácido nucleico es desplegada sobre la partícula de fago para detección y selección mediante los métodos descritos anteriormente y a continuación. Por ejemplo, la biblioteca de fago puede ser incubada con un ligando predeterminado (deseado) , de tal manera que las partículas de fago que presentan una secuencia de proteína de fusión que se enlaza al ligando pueden ser repartidas diferencialmente de aquellas que no presentan secuencias de polipéptido que se enlazan al ligando predeterminado. Por ejemplo, la separación puede ser provista al inmovilizar el ligando predeterminado. Las partículas de fago (esto es, miembros de biblioteca) que son enlazados al ligando y movilizado son luego recuperadas y replicadas para amplificar la sub-población de fago seleccionada para una ronda subsecuente de enriquecimiento de afinidad y replicación de fago. Después de varias rondas de enriquecimiento de afinidad y replicación de fago, los miembros de la biblioteca de fago que son así seleccionados son alineados y la secuencia de nucleótidos que codifica la secuencia de polipéptidos desplegada es determinada, identificando mediante esto la(s) secuencia (s) de polipéptidos que se enlazan al ligando predeterminado. Tales métodos son descritos adicionalmente en las publicaciones de patente PCT Nos. 91/17271, 91/18980 y 91/19818 y 93/08278. Ejemplos de otros sistemas de despliegue incluyen despliegues de ribosoma, un despliegue nucleótido-enlazado (véase, por ejemplo, patentes estadounidenses Nos. 6,281,344; 6,194,550, 6,207,446, 6,214,553 y 6,258,558), despliegue de polisoma, despliegue de superficie celular y los semejantes. Los despliegues de superficie celular incluyen una variedad de células, por ejemplo células E. coli, levadura y/o mamíferas. Cuando se usa una célula como despliegue, los ácidos nucleicos, por ejemplo obtenidos mediante amplificación de PCR seguida por digestión, son introducidos a la célula y traducidos. Opcionalmente, los polipéptidos que codifican los dominios de monómero y multímeros de la presente invención pueden ser introducidos, por ejemplo mediante inyección a la célula.
Aquellos de habilidad en el arte reconocerán que las etapas de generar variación y selección por una propiedad deseada pueden ser repetidas (esto es, efectuadas recursivamente) para optimizar los resultados. Por ejemplo, en una biblioteca de despliegue de fago u otro formato semejante, una primera selección de una biblioteca se puede efectuar a una severidad relativamente más baja, seleccionando mediante esto tantas partículas asociadas con una molécula objetivo como sea posible. Luego las partículas seleccionadas pueden ser aisladas y los polinucleótidos que codifican el monómero o multímero pueden ser aislados de las partículas. Luego variaciones adicionales pueden ser generadas a partir de esta secuencia y seleccionadas subsecuentemente a una afinidad más alta. Dominios de monómero puede ser seleccionados para enlazarse a cualquier tipo de molécula objetivo, en las que se incluyen objetivos de proteína. Objetivos ejemplares incluyen, pero no están limitados a, por ejemplo IL-6, Alpha3 , cMet, ICOS, IgE, IL-I-R11, BAFF, CD40L, CD28, Her2 , TRAIL-R, VEGF, TPO-R, TNFa, LFA-1, TACI , IL-lb, B7.1,- B7.2 ó OX40. Cuando el objetivo es un receptor por un ligando, los dominios de monómero pueden actuar como antagonistas o agonistas del receptor. Cuando multímeros capaces de enlace de objetivos relativamente grandes son deseados, pueden ser generados mediante un método de selección "ambulante" . Como se muestra en la figura 3, este método es llevado a cabo al proporcionar una bibliotecas de dominio de monómero y selección de la bibliotecas de dominio de monómero por afinidad a una primera molécula objetivo. Una vez que por lo menos un monómero que se enlaza al objetivo es identificado, aquel monómero particular es enlazado covalentemente a una nueva biblioteca o cada miembro restante de la biblioteca original de dominios de monómero. Los miembros de la nueva biblioteca comprenden cada uno un dominio común y por lo menos un dominio que es diferente, esto es, aleatorizado. Así, en algunas modalidades, la invención proporciona una biblioteca de multímeros generados utilizando el método de selección "ambulante" . Esta nueva biblioteca de multímeros (por ejemplo, dímeros, trímeros, tetrámeros y los semejantes) es luego seleccionada en cuanto a multímeros que se enlazan al objetivo con una afinidad incrementada y un multímero que se enlaza al objetivo con una afinidad incrementada puede ser identificado. El método de selección de monómero "ambulante" proporcionar una manera para ensamblar un multímero que está compuesto de monómeros que pueden actuar aditivamente o aún sinergísticamente entre sí dadas las restricciones de la longitud del enlazador. Esta técnica ambulante es muy útil cuando se selecciona y ensamblan multímeros que son aptos de enlazarse a proteínas objetivo grandes con alta afinidad. El método ambulante puede ser repetido para agregar más monómeros, dando como resultado mediante esto un multímero que comprende 2, 3, 4, 5, 6, 7, 8 o más monómeros enlazados conjuntamente. En algunas modalidades, el multímero seleccionado comprende más de dos dominios. Tales multímeros pueden ser generados por etapas, por ejemplo, en donde la adición de cada nuevo dominio es probada individualmente y el efecto de los dominios es probada de manera secuencial. En una modalidad alternativa, los dominios son enlazados para formar multímeros que comprenden más de dos dominios y seleccionados en cuanto a enlace sin previo conocimiento de cuantos multímeros más pequeños o alternativamente, como cada dominio se enlaza. Los métodos de la presente invención también incluyen métodos para desarrollar monómeros o multímeros. Como se ilustra en la figura 10, la recombinación de intra-dominio puede ser introducida a monómeros a través de todo el monómero o al tomar porciones de diferentes monómeros para formar nuevas unidades recombinadas. Los diferentes monómeros se pueden enlazar al mismo objetivo o diferentes objetivos. Por ejemplo, en algunas modalidades, porciones de diferentes monómeros anato pueden ser recombinadas. En algunas modalidades, una porción de un monómero anato puede ser combinada con una porción de un monómero de DSL y/o una porción de un monómero de LNR. La recombinación de inter-dominio (por ejemplo, recombinación de diferentes monómeros a o entre multímeros) o recombinación de módulos (por ejemplo, múltiples monómeros dentro de un multímero) pueden ser obtenidos. La recombinación inter-biblioteca es también contemplada. La figura 8 ilustra el proceso de optimización intradominio mediante recombinación. Se muestra una reacción de superposición de PCR de tres fragmentos, que recombina tres segmentos de un solo dominio relativo entre sí. Se pueden usar dos, tres, cuatro, cinco o más reacciones de superposición de fragmento de la misma manera como se ilustra. Este proceso de recombinación tiene muchas aplicaciones. Una aplicación es recombinar un cúmulo grande cientos de clones previamente seleccionados sin información de secuencia. Todo lo que se necesita para que cada superposición funcione es una región conocida de secuencia (relativamente) constante que existe en la misma ubicación en cada uno de los clones (procedimiento de sitio fijo) . El método de recombinación intra-dominio puede también ser efectuado sobre un cúmulo de dominios de monómero secuencia-relacionados mediante recombinación de ADN estándar (por ejemplo, Stemmer, Nature 370:389-391 (1994)) en base a fragmentación aleatoria y re-ensamble en base a homología de secuencia de ADN, que no requiere un sitio de superposición fijo en todos los clones que van a ser recombinados. Otra aplicación de este proceso es crear múltiples bibliotecas naturales separadas (lo que significa sin toma panorámica) en cada uno de los cuales solamente uno de los bucles de tinte cisteína es aleatorizado, para aleatorizar un bucle diferente en cada biblioteca. Después de la toma panorámica de estas bibliotecas separadamente contra el objetivo, los clones seleccionados son luego recombinados. De cada biblioteca tomada panorámicamente, solamente el segmento aleatorizado es amplificado mediante PCR y luego múltiples segmentos aleatorizados son combinados en un solo dominio, creando una biblioteca de entremezcla que es tomada panorámicamente y/o seleccionada en cuando a potencia incrementada. Este proceso puede también ser usado para entremezclar un número pequeño de clones de secuencia conocida. Cualquier secuencia común puede ser usada como puntos de cruce. Para monómeros que contienen cisteína, los residuos de cisteína son lugares lógicos para el cruce. Sin embargo, hay otras maneras para determinar sitios de cruce óptimos, tales como modelado por computadora. Alternativamente, residuos con entropía más alta o el número mínimo de contactos intramoleculares, pueden también ser sitios buenos para cruces. Los métodos para desarrollar monómeros o multímeros pueden comprender, por ejemplo, cualquiera o todas las siguientes etapas: proporcionar una pluralidad de diferentes ácidos nucleicos, en donde cada ácido nucleico codifica un dominio de monómero; traducir la pluralidad de diferentes ácidos nucleicos, que proporciona una pluralidad de diferentes dominios de monómero; seleccionar la pluralidad de diferentes dominios de monómero en cuanto a enlace de ligando o mezcla de ligandos deseados; identificar miembros de la pluralidad de diferentes dominios de monómero que se mezcla al ligando o mezcla de ligandos deseados, que proporciona dominio de monómero seleccionado; unir los dominios de monómero seleccionados con por lo menos un enlazador para generar por lo menos uno multímero, en donde el por lo menos un multímero comprende por lo menos dos de los dominios de monómero seleccionados y el por lo menos un enlazador; y seleccionar el por lo menos un multímero en cuanto afinidad o avidez mejorada o especificidad alterada por el ligando o mezcla de ligando deseados en comparación con los dominios de monómero seleccionados . Se puede introducir variación a sea a los monómeros o multímeros. Como se discute anteriormente, un ejemplo de mejora de monómeros incluye recombinación de íntra-dominio en la cual dos o más (por ejemplo, tres, cuatro, cinco o más) porciones del monómero son amplificadas separadamente bajo condiciones para introducir variación (por ejemplo mediante entremezcla u otro método de recombinación) en los productos de amplificación resultantes, sintetizando mediante esto una biblioteca de variantes por diferentes porciones de monómero. Al localizar los extremos 5' de los cebadores medios en una secuencia "media" o "superposición" que ambos de los fragmentos de PCR tienen en común, las bibliotecas de lado "izquierdo" y lado "derecho" resultantes pueden ser combinadas mediante PCR de superposición para generar nuevas variantes del cúmulo original de monómeros . Luego estas nuevas variantes pueden ser seleccionadas en cuanto a propiedades deseadas, por ejemplo mediante toma panorámica contra un objetivo o seleccionadas en cuanto a un efecto funcional. El (los) cebador (es) "medios" pueden ser seleccionados para corresponder a cualquier segmento del monómero y comúnmente estará basado en el andamio o uno o más aminoácidos de consenso dentro del monómero (por ejemplo, cisteínas tales como aquellas encontradas en dominios A) . Similarmente, los multímeros pueden ser creados al introducir variación a nivel del monómero y luego recombinación de bibliotecas de variante de monómero. En una escala más grande, multímeros (individuales o cúmulo) con propiedades deseadas pueden ser recombinados para formar multímeros más grandes. En algunos casos se introduce variación (comúnmente de manera sintética) a los monómeros o a los enlazadores para formar bibliotecas. Esto se puede obtener por ejemplo, con dos multímeros diferentes que se enlazan a dos objetivos diferentes, seleccionando mediante esto eventualmente un multímero con una porción que se enlaza a un multímero y una porción que se enlaza a un segundo objetivo. Véase, por ejemplo figura 9. Variación adicional se puede introducir al insertar enlazadores de diferente longitud y composición entre dominios. Esto permite la selección de enlazadores óptimos entre dominios. En algunas modalidades, la longitud óptima y composición de enlazadores permitirá el enlace óptimo de dominios. En algunas modalidades, los dominios con una(s) afinidad (es) de enlace particular son enlazados vía diferentes enlazadores y enlazadores óptimos son seleccionados en un análisis de enlace. Por ejemplo, dominios son seleccionados en cuanto a propiedades de enlace deseadas y luego formados a una biblioteca que comprende una variedad de enlazadores. La biblioteca puede luego ser seleccionada para identificar enlazadores óptimos. Alternativamente, bibliotecas de multímero pueden ser formadas en donde el efecto de dominio o enlazador sobre el enlace de molécula objetivo no es conocido. Los métodos de la presente invención también incluyen generar uno o más multímeros seleccionados al proporcionar una pluralidad de dominios de monómero y/o inmuno-dominios. La pluralidad de dominios de monómero y/o inmuno-dominios es seleccionada en cuanto a enlace de un ligando o mezcla de ligandos deseada. Miembros de la pluralidad de dominios que se enlazan al ligando o mezcla de ligandos deseados son identificadas, proporcionando mediante esto dominios con una afinidad deseada. Los dominios identificados son unidos con por lo menos un enlazador para generar los multímeros, en donde cada multímero comprende por lo menos dos de los dominios seleccionados y el por lo menos un enlazador y los multímeros son seleccionados en cuanto a una afinidad o avidez mejorada o especificidad alterada por el ligando o mezcla de ligandos deseados en comparación con los dominios seleccionados, identificando mediante esto el uno o más multímeros seleccionados . Bibliotecas de multímero pueden ser generadas, en algunas modalidades, al combinar dos o más bibliotecas o monómeros o multímeros en un procedimiento a base de recombinasa, en donde cada miembro de biblioteca comprende un sitio de recombinación (por ejemplo, un sitio lox) . Un cúmulo más grande de miembros de biblioteca molecularmente diversos en principio alberga más variantes con propiedades deseadas, tales como afinidades de enlace objetivo más altas y actividades funcionales. Cuando se construyen bibliotecas en vectores de fago, que pueden ser transformadas a E. coli, el tamaño de biblioteca (109-1010 es limitado por la eficiencia de transformación de E. coli. Un sitio de sistema de recombinasa/recombinación (por ejemplo, el sistema Cre-LoxP) y la recombinación in vivo pueden ser aprovechados para generar bibliotecas que no están limitadas en tamaño por la eficiencia de transformación de E. coli. Por ejemplo, el sistema Cre-loxP puede usado para generar bibliotecas de dímero con 1010, 1011, 1012, 1013 ó mayor diversidad. En algunas modalidades, E. coli como huésped para una biblioteca de monómero natural y un fago filamentoso que porta una segunda biblioteca de monómero natural son usados. El tamaño de biblioteca en este caso está limitado solamente por el número de fago infectivo (que porta una biblioteca) y el número de células de E. coli infectables (que portan la otra biblioteca). Por ejemplo, la infección de 1012 células de E. coli (1 L a OD600=1) con >1012 fago podría producir tantas como 1012 combinaciones de dímero. La selección de multímeros se puede efectuar utilizando una variedad de técnicas en las que se incluyen aquellas mencionadas anteriormente para identificar dominios de monómero. Otros métodos de selección incluyen, por ejemplo una selección a base de afinidad mejorada o avidez mejorada o especificidad alterada por el ligando en comparación con dominios de monómero seleccionados. Por ejemplo, una selección puede estar basada en el enlace selectivo a tipos de células específicos o a un conjunto de células relacionadas o tipos de proteína (por ejemplo, diferentes serotipos de virus) . La optimización de la propiedad seleccionada en cuando a avidez de un ligando, puede luego ser obtenida mediante recombinación de los dominios, también como manipulación de secuencia de aminoácidos de los dominios de monómero individuales o el dominio de enlazador o la secuencia de nucleótidos que codifica tales dominios, como se menciona en la presente invención. Un método para identificar multímeros se puede efectuar el desplegar los multímeros. Como con los dominios de monómero, los multímeros son opcionalmente expresados o desplegados en una variedad de sistemas de despliegue, por ejemplo despliegue de fago, despliegue de ribosoma, despliegue de polisoma, despliegue de nucleótido-enlazado (véase, por ejemplo patentes estadounidenses Nos. 6,281,344; 6,194,550, 6,207,446, 6,214,553 y 6,258,558) y/o exhibición de superficie celular, como se describe anteriormente. Los despliegues de superficie celular pueden incluir, pero no están limitados a células de E. coli, levadura o células mamíferas. Además, bibliotecas de despliegue de multímeros con múltiple sitios de enlace pueden ser tomadas panorámicamente en cuanto a avidez o afinidad o especificidad alterada por un ligando o por múltiples ligandos. Monómeros o multímeros pueden ser seleccionados en cuando a actividad de enlace objetivo en células de levadura utilizando un análisis de selección de dos híbridos. En este tipo de selección, la biblioteca de monómeros o multímeros a ser seleccionada es clonada a un vector que dirige la formación de una proteína de fusión entre cada monómero o multímero de la biblioteca y un fragmento activador de transcripción de levadura (esto es, Gal4) . Secuencias que codifican la proteína "objetivo" son clonadas a un vector que da como resultado la producción de una proteína de fusión entre el objetivo y el resto de la proteína de Gal4 (el dominio de enlace de ADN) . Un tercer plásmido contiene un gen reportero corriente abajo de la secuencia de ADN del sitio de enlace de GA14. Un monómero que se puede enlazar a la proteína objetivo trae con el mismo el dominio de activación de GA14, reconstituyendo así una proteína Gal4 funcional. Esta proteína de Gal4 funcional enlazada al sitio de enlace corriente arriba del gen reportero da como resultado la expresión del gen reportero y selección del monómero o multímero como una proteína de enlace objetivo.
(Véase Chien et al. (1991) Proc. Natl. Acad. Sci. (USA) 88:9578; Fields S. and Song O. (1989) Nature 340: 245) +-.-.-.
Using a two-hybrid system for library screening is further described in la patente estadounidense No. 5,811,238 (véase también Silver S.C. and Hunt S.W. (1993) Mol. Biol. Rep. 17:155; Durfee et al. (1993) Genes Devel. 7:555; Yang et al. (1992) Science 257:680; Luban et al. (1993) Cell 73:1067; Hardy et al. (1992) Genes Devel. 6:801; Bartel et al. (1993) Biotechniques 14:920; y Vojtek et al. (1993) Cell 74:205). Otro sistema de selección útil para efectuar la presente invención es el sistema de selección interactivo E.coli/BCCP (Germino et al. (1993) Proc. Nat. Acad. Sci. (U.S.A.) 90:993; Guarente L. (1993) Proc. Nat. Acad. Sci. (U.S.A.) 90:1639) . Otras variaciones incluyen el uso de múltiples compuestos de enlace, de tal manera que dominios de monómero, multímeros o bibliotecas de estas moléculas pueden ser simultáneamente seleccionadas por una multiplicidad de ligandos o compuestos que tienen diferente especificidad de enlace. Múltiples ligandos o compuestos predeterminados pueden ser seleccionados concomitantemente en una sola biblioteca o selección secuencial contra un número de dominios de monómero o multímeros. En una variación, múltiples ligandos o compuestos, cada uno codificados sobre una perla separada (o subconjunto de perlas) pueden ser mezclados o incubados con dominios de monómero, multímeros o bibliotecas de estas moléculas bajo condiciones de enlace apropiadas. La colección de perlas, que comprende múltiples ligandos o compuestos, puede luego ser usada para aislar, mediante selección de afinidad, dominios de monómero seleccionado, multímeros seleccionados o miembros de biblioteca seleccionados. En general, subsecuentes rondas de selección de afinidad pueden incluir la misma mezcla de perlas, subconjuntos de las mismas o perlas que contienen solamente uno o dos ligandos o computadoras individuales. Este procedimiento proporciona selección deficiente y es compatible con la automatización de laboratorio, procesamiento por lotes y métodos de selección de alto rendimiento. En otra modalidad, los multímeros pueden ser seleccionados simultáneamente en cuando la habilidad para enlazar múltiples ligandos, en donde cada ligando comprende una etiqueta diferente. Por ejemplo, cada ligando puede ser marcado con una etiqueta fluorescente diferente, puesto en contacto simultáneamente con un multímero o biblioteca de multímeros. Multímeros con la afinidad deseada son luego identificados (por ejemplo, mediante clasificación de FACS) en base a la presencia de las etiquetas enlazadas a las etiquetas deseadas. Bibliotecas ya sea de dominios de monómero o multímeros (denominados en la siguiente discusión por conveniencia como "agentes de afinidad") pueden ser seleccionadas (esto es, tomadas panorámicamente) simultáneamente contra múltiples ligandos en un número de formatos diferentes. Por ejemplo, múltiples ligandos pueden ser seleccionados en una mezcla simple, en una disposición, desplegados sobre una célula o tejido (por ejemplo una célula o tejido proporcionan numerosas moléculas que pueden ser enlazadas mediante los dominios de monómero o multímeros de la invención) y/o inmovilizados. Véase, por ejemplo figura 4. Las bibliotecas de agentes de afinidad pueden opcionalmente ser desplegadas sobre sistema de despliegue de levadura o fago. Similarmente, si se desea, los ligandos (esto es, codificados en una biblioteca de cADN) pueden ser desplegados en un sistema de despliegue de levadura o fago. Inicialmente, la biblioteca de agente de afinidad es tomada panorámicamente contra los múltiples ligandos. Opcionalmente, los "aciertos" resultantes son tomados panorámicamente contra los ligandos una o más veces para enriquecer la población resultante de agentes de afinidad. Si se desea, la identidad de los agentes de afinidad individuales y/o ligandos puede ser determinada. En algunas modalidades, los agentes de afinidad son desplegados sobre fago. Los agentes de afinidad identificados que se enlazan en la selección inicial son divididos en una primera porción y una segunda porción. La primera porción es infectada a bacterias, dando como resultado ya sea placas o colonias bacterianas, dependiendo del tipo de fago usado. Los fagos expresados son inmovilizados y luego probados con ligandos desplegados en fago seleccionados como se describe a continuación. La segunda porción es acoplada a perlas o de otra forma inmovilizada y una biblioteca de despliegue de fago que contiene por lo menos alguno de los ligandos en la mezcla original es puesta en contacto con la segunda porción inmovilizada. Aquellos que se enlazan a la segunda porción son subsecuentemente eluidos y puestos en contacto con el fago inmovilizado descrito en el párrafo anterior. Se detectan interacciones de fago-fago (por ejemplo, utilizando un anticuerpo monoclonal específico para el fago que expresa ligando) y los polinucleótidos de fago resultantes pueden ser aislados . En algunas modalidades, la identidad de un par de agente afinidad-ligando es determinada. Por ejemplo, cuando tanto el agente de afinidad como el ligando son desplegados sobre un fago o levadura, el ADN del par puede ser aislado y secuenciado. En algunas modalidades, polinucleótidos específicos para el ligando y agente de afinidad son amplificados. Cebadores de amplificación para cada reacción pueden incluir secuencias 5' que son complementarias, de tal manera que los productos de amplificación resultantes son fusionados, formando mediante esto un polinucleótido híbrido que comprende un polinucleótido que codifica por lo menos una porción del agente de afinidad y por lo menos una porción del ligando. El híbrido resultante puede ser usado para probar el agente de afinidad o ligando (por ejemplo, cADN codificado) , bibliotecas de polinucleótido para identificar tanto el agente de afinidad como ligando. Véase por ejemplo figura 10. Los métodos descritos anteriormente pueden ser combinados fácilmente con "ambulante" para generar simultáneamente e identificar múltiples multímeros, cada uno de los cuales se enlaza a un ligando en una mezcla de ligandos. En estas modalidades, una primera biblioteca de agentes de afinidad (dominios de monómero, inmuno-dominios o multímeros) son sometidos a toma panorámica contra múltiples ligandos y los agentes de afinidad eluidos son enlazados a la primera o una segunda biblioteca de agentes de afinidad para formar una biblioteca de agentes de afinidad multiméricos (por ejemplo, que comprende 2, 3, 4, 5, 6, 7, 8, 9, o más dominios de monómero o inmuno-dominios) , que son subsecuentemente sometidos a toma panorámica contra los múltiples ligandos. Este método puede ser repetido para continuar generando agentes de afinidad multiméricos más grandes. El incremento del número de dominios de monómero puede dar como resultado afinidad y avidez incrementada por un objetivo particular. Por supuesto, en cada etapa, la toma panorámica es repetida opcionalmente para enriquecer aglutinantes significativos. En algunos casos, el ambulante será facilitado al insertar sitios de recombinación (por ejemplo, sitios de lox) en los extremos de monómeros y recombinar bibliotecas de monómero mediante un evento moderado por recombinasa. Los multímeros seleccionados de los métodos anteriores pueden ser manipulados adicionalmente, por ejemplo mediante recombinación o entremezcla de los multímeros seleccionados (la recombinación puede ocurrir entre o dentro de multímeros o ambos) , mutación de los multímeros seleccionados y los semejantes. Esto da como resultado multímeros alterados que luego pueden ser seleccionados y filtrados en cuanto a elementos que tienen una propiedad mejorada en comparación con el multímero seleccionado, produciendo mediante esto multímeros alterados seleccionados . En vista de la descripción en la presente, es claro que el siguiente proceso puede ser seguido. Dominios de monómero que se presentan de manera estable en la naturaleza o no se presentan de manera estable en la naturaleza pueden ser recombinados o se pueden formar variantes. Opcionalmente, los dominios inicialmente o más tarde son seleccionados para aquellas secuencias que son menos probables a ser inmunogénicas en el huésped para el cual están diseñadas. Opcionalmente, una biblioteca de fago que comprende los dominios recombinados es sometida a toma panorámica por una afinidad deseada. Dominios de monómero o multímeros expresados por el fago pueden ser seleccionados en cuando IC50 por un objetivo. Multímeros hetero- u homo-méricos pueden ser seleccionados. Los polipéptidos seleccionados pueden ser seleccionados en cuando a su afinidad a cualquier objetivo, en los que se incluyen objetivos hetero- u homo- multiméricos. Una ventaja significativa de la presente invención es que los ligandos conocidos o ligandos desconocidos pueden ser usados para seleccionar los dominios de monómero y/o multímeros. No se requiere ninguna información previa concerniente con la estructura del ligando para aislar los dominios de monómero de interés o los multímeros de interés. Los dominios de monómero y/o multímeros identificados pueden tener actividad biológica, lo que significa incluir por lo menos afinidad de enlace específica por un ligando seleccionado o deseado y en algunos casos, incluirá adicionalmente la habilidad para bloquear el enlace de otros compuestos, para estimular o inhibir rutas metabólicas, para actuar como una señal o mensajero, para estimular o inhibir la actividad celular y los semejantes. Dominios de monómero pueden ser generados para funcionar como ligandos para receptores en donde el ligando natural para el receptor todavía no ha sido identificado (receptores huérfanos) . Estos ligandos huérfanos pueden ser creados ya sea para bloquear o activar el receptor al cual se enlazan. Un solo ligando puede ser usado u opcionalmente una variedad de ligandos pueden ser usados para seleccionar los dominios de monómero y/o multímeros. Un dominio de monómero y/o inmuno-dominio de la presente invención se puede enlazar a un solo ligando o una variedad de ligandos. Un multímero de la presente invención puede tener múltiples sitios de enlace discretos para un solo ligando u opcionalmente, puede tener múltiples sitios de enlace para una variedad de ligandos.
V. Bibliotecas La presente invención también proporciona bibliotecas de dominios de monómero y bibliotecas de ácidos nucleicos que codifican dominios de monómero y/o inmuno-dominios. Las bibliotecas pueden incluir, por ejemplo, aproximadamente 10, 100, 250, 500, 1000 ó 10,000 o más ácidos nucleicos que codifican dominios de monómero o la biblioteca puede incluir, por ejemplo, aproximadamente 10, 100, 250, 500, 1000 ó 10,000 o más polipéptidos que codifican dominios de monómero. Las bibliotecas pueden incluir dominios de monómero que contienen el mismo cuadro de cisteína, por ejemplo, dominios de trombospondina, dominios de tiroglobulina o dominios de trébol/PD. En algunas modalidades, se generan variantes al recombinar dos o más secuencias diferentes de la misma familia de dominios de monómero (por ejemplo, el dominio del receptor LDL Clase A) . Alternativamente, dos o más dominios de monómero diferentes de familias diferentes pueden ser combinados para formar un multímero. En algunas modalidades, los multímeros son formados a partir de monómeros o variantes de monómero de por lo menos una de las siguientes clases de familia: un dominio de trombospondina tipo I, un dominio de repetición de tiroglobulina tipo I, un dominio de trébol (tipo P) , un dominio semejante a EGF (por ejemplo, un dominio semejante a EGF tipo laminina), un dominio de Kringle, un dominio de fibronectina tipo I, un dominio de fibronectina tipo II, un dominio de fibronectina tipo III, un dominio de PAN, un dominio de Gla, un dominio de SRCR, un dominio de inhibidor de tripsina pancreático de Kunitz/bovino, un dominio de inhibidor de proteasa serina tipo Kazal, un dominio de factor de von Willebrand tipo C, un dominio semejante a anafilatoxina, un dominio de receptor de LDL de dominio CUB Clase A, un dominio de Sushi , un dominio de Link, un dominio de trombospondina tipo 3, un dominio semejante a inmunoglobulina, un dominio de lectina tipo C, un dominio de MAM, un dominio de factor de von Willebrand tipo A, un dominio de somatomedina B, un dominio de cuatro núcleos de disulfuro tipo WAP, un dominio de F5/8 tipo C, un dominio de hemopexina, un dominio de SH2 , un dominio de SH3 , un dominio de EF Hand, un dominio de caderina, un dominio de anexina, un dominio de dedo de zinc, y un dominio de C2 y derivados de los mismos. En otra modalidad, el dominio de monómero y el dominio de monómero diferente pueden incluir uno o más dominios encontrados en la base de datos Pfam y/o la base de datos SMART. Las bibliotecas producidas mediante los métodos anteriores, una o más célula (s) que comprenden uno o más miembros de la biblioteca, y uno o más despliegues que comprenden uno o más miembros de la biblioteca son también incluidos en la presente invención. Opcionalmente, un conjunto de datos de cadenas de caracteres de ácidos nucleicos que codifican dominios de monómero pueden ser generadas, por ejemplo al mezclar una primera cadena de caracteres que codifica un dominio de monómero, con una o más cadenas de caracteres que codifican un dominio de monómero diferente, produciendo mediante esto un conjunto de datos de cadenas de caracteres de ácidos nucleicos que codifican dominios de monómero, en los que se incluyen aquellos descritos en la presente. En otra modalidad, el dominio de monómero y el dominio de monómero diferente pueden incluir uno o más dominios encontrados en la base de datos Pfam y/o la base de datos SMART. Los métodos pueden comprender además inserta la primera cadena de caracteres que codifica el dominio de monómero y la una o más segunda cadena de caracteres que codifica el dominio de monómero diferente a una computadora y generar una(s) cadena (s) de caracteres de multímero o biblioteca (s) del mismo en la computadora. Las bibliotecas pueden ser seleccionadas por una propiedad deseada tal como enlace de un ligando deseado o mezcla de ligandos o de otra manera expuestas a condiciones selectivas. Por ejemplo, miembros de la biblioteca de dominios de monómero pueden ser desplegados y pre-seleccionados en cuanto a enlace a un ligando o mezcla de ligandos conocidos o desconocidos e incubados en suero para remover aquellos clones que son sensibles a las proteasas del suero. Luego las secuencias de dominio de monómero pueden ser mutagenizadas (por ejemplo, recombinadas, alteradas químicamente, etc.) o alteradas de otra manera y los nuevos dominios de monómero pueden ser seleccionados otra vez en cuando a enlace al ligando o la mezcla de ligandos con una afinidad mejorada. Los dominios de monómero seleccionados pueden ser combinados u unidos para formar multímeros, los cuales pueden luego ser seleccionados por una afinidad o avidez mejorada o especificidad alterada por el ligando o mezcla de ligandos. Especificidad alterada puede significar que la especificidad es ampliada, por ejemplo el enlace de múltiples virus relacionados u opcionalmente, especificidad alterada puede significar que la especificidad es estrechada, por ejemplo enlace dentro de una región específica de un ligando. Aquellos de habilidad en el arte reconocerán que hay un número de métodos disponibles para calcular la avidez. Véase, por ejemplo Mammen et al., Angew Chem Int. Ed. 37:2754-2794 (1998); Muller et al., Anal. Biochem. 261:149-158 (1998). La presente invención también proporciona un método para generar una biblioteca de dominios de monómero quiméricos derivados de proteína humanas, el método comprende: proporcionar secuencias de bucle correspondientes a por lo menos un bucle de cada uno de por lo menos dos variantes que se presentan de manera estable en la naturaleza diferentes de una proteína humana, en donde las secuencias de bucle son secuencias de polinucleótido o polipéptidos; y combinar covalentemente secuencias de bucle para generar una biblioteca de por lo menos dos secuencias quiméricas diferentes, en donde cada secuencia quimérica codifica un dominio de monómero quimérico que tiene por lo menos dos bucles. Comúnmente, el dominio quimérico tiene por lo menos cuatro bucles y usualmente por lo menos seis bucles. Como se describe anteriormente, la presente invención proporciona tres tipos de bucles que son identificados por aspectos específicos, tales como, potencial para enlace de disulfuro, formación de puentes entre estructuras de proteínas secundarias y dinámica molecular (esto es, flexibilidad) . Los tres tipos de secuencias de bucle son una secuencia de bucle definida por cisteína, una secuencia de bucle definida por estructura y una secuencia de bucle definida por factor B. Alternativamente, una biblioteca de dominio quimérico humana puede ser generada al modificar dominios de monómero humano que se presenta de manera estable en la naturaleza a nivel de aminoácido, en comparación con a nivel de bucle. Para minimizar el potencial por inmunogenicidad, solamente aquellos residuos que se presentan de manera estable en la naturaleza en secuencias de proteína de la misma familia de dominios de monómero humano son utilizados para crear las secuencias quiméricas. Esto se puede obtener al proporcionar una alineación de secuencia de por lo menos dos dominios de monómero humanos de la misma familia de dominios de monómero. Identificar residuos de aminoácido en posiciones correspondientes en las secuencias de dominio de monómero humano que difieren entre los dominios de monómero humano, generar dos o más dominios de monómero quimérico humanos, en donde cada secuencia de dominio de monómero quimérico humano consiste de residuos de aminoácido que corresponden en tipo y posición a residuos de dos o más dominios de monómero humano de la misma familia de dominios de monómero. Bibliotecas de dominios de monómero quimérico humano pueden ser usadas para identificar dominios de monómero quimérico humano que se enlazan a un objetivo de interés mediante: selección de la biblioteca de dominios de monómero quimérico humanos en cuanto a enlace con una molécula objetivo e identificación de un dominio de monómero quimérico humano que se enlaza a la molécula objetivo. Secuencias de dominio de monómero humano que se presenta de manera estable en la naturaleza apropiadas usadas en la etapa de alineación de secuencia inicial incluyen aquellas correspondientes a cualquiera de los dominios de monómero que se presenta de manera estable en la naturaleza descritos en la presente. Bibliotecas de dominio quimérico humanos de la presente invención (ya sea generadas al hacer variar bucles o residuos de aminoácido individuales) pueden ser preparadas mediante métodos conocidos para aquellos que tienen habilidad ordinaria en el arte. Métodos particularmente apropiados para generar estas bibliotecas son formato de división-acumulación y formato de síntesis de trinucleótido como se describe en WO01/23401.
VI. Proteínas de fusión En algunas modalidades, los monómeros o multímeros de la presente invención son enlazados a otro polipéptido para formar una proteína de fusión. Cualquier polipéptido en el arte puede ser usado como socio de fusión, aunque puede ser útil si el socio de fusión forma multímeros. Por ejemplo, monómeros o multímeros de la invención pueden por ejemplo, ser fusionados a los siguientes sitios o combinaciones de sitios de un anticuerpo : 1. En el término N de los dominios VH1 y/o VL1, opcionalmente justo después del péptido líder y antes de que el dominio inicie (región de estructura 1) ; 2. En el término N del dominio CH1 o CL1, reemplazando el dominio VH1 o VL1; 3. En el término N de la cadena pesada, opcionalmente después del dominio CH1 y antes de los residuos de cisteína en el engozne (fusión Fc) ; 4. En el término N del dominio CH3 ; 5. En el término C del dominio CH3 , anexado opcionalmente al último residuo de aminoácido vía un enlazador corto; 6. En el término C del dominio CH2 , reemplazando el dominio CH3 ; 7. En el término C del dominio CL1 o CH1 , opcionalmente después de la cisteína que forma el disulfuro de intercadena; o 8. En el término C del dominio VH1 o VL1. Véase, por ejemplo figura 7. En algunas modalidades, el monómero o dominio de multímero es enlazado a una molécula (por ejemplo, una proteína, ácido nucleico, molécula pequeña orgánica, etc.) útil como farmacéutico. Proteínas farmacéuticas ejemplares incluyen, por ejemplo citocinas, anticuerpos, quimiocinas, factores de crecimiento, interleucinas, proteínas de superficie celular, dominios extracelulares, receptores de superficie celular, citotoxinas, etc. Farmacéuticos de molécula pequeña ejemplares incluyen toxinas de molécula pequeña o agentes terapéuticos.
En algunas modalidades, el monómero o multímeros son seleccionados para enlazarse a una proteína objetivo específica del tejido o específica de la enfermedad. Las proteínas específicas del tejido son proteínas que son expresadas exclusivamente o a un nivel significativamente más alto, en uno o varios tej ido (s) particular (es) en comparación con otros tejidos en un animal. Similarmente, proteínas específicas de enfermedad son proteínas que son expresadas exclusivamente o a un nivel significativamente más alto, en una o varias células de enfermedad o tejidos en comparación con otras células o tejidos sin enfermedad en un animal. Ejemplos de tales enfermedades incluyen, pero no están limitadas a, una alteración proliferativa celular tal como queratosis actínica, arteriosclerosis, aterosclerosis, bursitis, cirrosis, hepatitis, enfermedad de tejido conectivo mezclada (MCTD) , mielofibrosis, hemoglobinuria nocturnal paroxismal, policitemia vera, psoriasis, trombocitopenia primaria y cánceres en los que se incluyen adenocarcinoma, leucemia, linfoma, melanoma, mieloma, sarcoma, teratocarcinoma, y en particular, un cáncer de la glándula adrenal, vejiga, hueso, médula ósea, cerebro, pecho, cervix, vesícula biliar, ganglios, sistema tracto gastrointestinal, corazón, riñon, hígado, pulmón, músculo, ovario, páncreas, paratiroides, pene, próstata, glándulas salivales, piel, bazo, testículos, timo, tiroides y útero; una alteración autoinmune/inflamatoria tal como síndrome de inmunodeficiencia adquirida (SIDA) , enfermedad de Addison, síndrome de dificultad respiratoria adulta, alergias, espondilitis anquilosante, amiloidosis, anemia, asma, aterosclerosis, anemia hemolítica autoinmune, tiroiditis autoinmune, distrofia poliendocrinopaticandidiasis-ectodérmica autoinmune (APECED) , bronquitis, colecistitis, dermatitis de contacto, enfermedad de Crohn, dermatitis atópica, dermatomiositis, diabetes mellitus, enfisema, linfopenia episódica con linfocitotoxinas, eritroblastosis fetalis, eritema nodoso, gastritis atrófica, glomerulonefritis, síndrome de Goodpasture, gota, enfermedad de Graves, tiroiditis de Hashimoto, hipereosinofilia, síndrome de intestino irritable, esclerosis múltiple, miastenia gravis, inflamación miocardial o pericardial, osteoartritis, osteoporosis, pancreatitis, polimiositis, psoriasis, síndrome de Reiter, artritis reumatoide, escleroderma, síndrome de Sjogren, anafilaxis sistémica, lupus eritematoso sistémico, esclerosis sistémica, púrpura trombocitopénica, colitis ulcerativa, uveítis, síndrome de Werner, complicaciones de cáncer, hemodiálisis y circulación extracorpórea, infecciones virales, bacterianas, fúngales parasitarias, protozoarias y helmínticas y trauma; una alteración cardiovascular tal como insuficiencia cardiaca congestiva, enfermedad del corazón isquémica, angina pectoris, infarto al miocardio, enfermedad del corazón hipertensiva, enfermedad del corazón valvular degenerativa, estenosis de válvula aórtica calcífica, válvula aórtica congenitalmente bicúspide, calcificación anular mitral, prolapso de válvula mitral, fiebre reumática y enfermedad del corazón reumática, endocarditis infectiva, endocarditis trombótica no bacteriana, endocarditis de lupus eritematoso sistémico, enfermedad del corazón carcinoide, cardiomiopatía, miocarditis, pericarditis, enfermedad del corazón neoplásica, enfermedad del corazón congenital, complicaciones de transplante cardiaco, fístula arteriovenosa, aterosclerosis, hipertensión, vasculitis, enfermedad de Raynaud, aneurísmos, disecciones arteriales, venas varicosas, tromboflebitis y flebotrombosis, tumores vasculares y complicaciones de trombólisis, angioplastía transluminal percutánea, reemplazo vascular y cirugía de injerto de desviación de arteria coronaria; una alteración neurológica tal como epilepsia, enfermedad cerebrovascular isquémica, accidente cerebrovascular, neoplasmas cerebrales, enfermedad de Alzheimer, enfermedad Pick, enfermedad de Huntington, demencia, enfermedad de Parkinson y otras alteraciones extrapiramidales, esclerosis lateral amiotrófica y otras alteraciones de neuronas motoras, atrofia muscular neural progresiva, retinitis pigmentosa, ataxias hereditarias, esclerosis múltiple y otras enfermedades desmielinizantes, meningitis bacteriana y viral, absceso de cerebro, empiema subdural, absceso epidural, tromboflebitis intracraneal supurativa, mielitis y radiculitis, enfermedad del sistema nervioso central, enfermedades de prion en los que se incluyen kuru, enfermedad de Creutzfeldt-Jakob y síndrome de GerstmannStraussler-Scheinker, insomnio familiar fatal, enfermedades nutricionales y metabólicas del sistema nervioso, neurofibromatosis , esclerosis tuberosa, hemangioblastomatosis cerebeloretinal , síndrome encefalotrigeminal , retardo mental y otras alteraciones de desarrollo del sistema nervioso central en los que se incluyen síndrome de Down, parálisis cerebral, alteraciones neuroesqueletales, alteraciones del sistema nervioso autónomo, alteraciones de nervio craneal, enfermedades de la médula espinal, distrofia muscular y otras alteraciones neuromusculares, alteraciones del sistema nervioso periférico, dermatomiositis y polimiositis, miopatías hereditarias, metabólicas, endocrinas y tóxicas, miastenia gravis, parálisis periódica, alteraciones mentales en las que se incluyen alteraciones del estado de animo, ansiedad y alteraciones esquizofrénicas, alteración afectiva estacional (SAD), acatesia, amnesia, catatonía, neuropatía diabética, discinesia tardía, distonias, psicosis paranoicas, neuralgia posterpética, alteración de Tourette, parálisis supranuclear progresiva, degeneración corticobasal y demencia frontotemporal familiar; y una alteración de desarrollo tal como acidosis tubular renal, anemia, síndrome de Cushing, enanismo acondroplásico, distrofia muscular de Duchenne y Becker, epilepsia, disgenesis gonadal, síndrome de WAGR (tumor de Wilms, aniridia, anormalidades genitourinarias y retardo mental), síndrome de Smith-Magenis, síndrome mielodisplásico, displasia mucoepitelial hereditaria, queratodermas hereditarias, neuropatías hereditarias tales como enfermedad de Charcot-Marie-Tooth y neurofibromatosis, hipotiroidismo, hidrocéfalo, alteraciones de ataques tales como Syndenham chorea y parálisis cerebral, espina bífida, anencefalia, craniorachischisis, glaucoma congenital, cataratas y pérdida de audición sensorineural . Enfermedades o condiciones ejemplares incluyen, por ejemplo MS, SLE, ITP, IDDM, MG, CLL, CD, RA, hemofilia de factor VIII, transplante, arteriosclerosis, síndrome de Sjogren, enfermedad de Kawasaki, Ab anti-fosfolípido, AHA, colitis ulcerativa, mieloma múltiple, glomerulonefritis, alergias estacionales y nefropatía de IgA. En algunas modalidades, los monómeros o multímeros que se enlazan a la proteína objetivo son enlazados a la proteína o molécula pequeña farmacéutica de tal manera que el complejo o fusión resultante es apuntado a la(s) célula (s) relacionadas con el tejido o enfermedad específicas en donde la proteína objetivo es expresada. Los monómeros o multímeros para uso en tales complejos o fusiones pueden ser seleccionados inicialmente en cuanto a enlace a la proteína objetivo y pueden ser seleccionados subsecuentemente mediante selección negativa contra otras células o tejido (por ejemplo, para evitar el apuntamiento a la médula ósea u otros tejidos que ajustan el límite inferior de toxicidad del fármaco) en donde se desea que el enlace sea reducido o eliminado en otras células o tejidos no objetivo. Al mantener el farmacéutico alojado de tejidos sensibles, la ventana terapéutica es incrementada, de tal manera que una dosis más alta puede ser administrada de manera segura. En otra alternativa se puede efectuar toma panorámica in vivo en animales al inyectar una biblioteca de monómeros o multímeros a un animal y luego aislar los monómeros o multímeros que se enlazan a un tejido o célula particular de interés . Las proteínas de fusión descritas anteriormente pueden también incluir un péptido enlazador entre la proteína farmacéutica y el monómero o multímeros. Una secuencia de enlazador de péptido puede ser empleada para separar, por ejemplo, los componentes de polipéptido por una distancia suficiente para asegurar que cada polipéptido se pliegue a sus estructuras secundarias y terciarias. Proteínas de fusión pueden en general ser preparadas utilizando técnicas estándar, en las que se incluyen conjugación química. Las proteínas de fusión pueden también ser expresadas como proteínas recombinantes en un sistema de expresión mediante técnicas estándar. Proteínas específicas del tejido o específicas de la enfermedad ejemplares se pueden encontrar en, por ejemplo, tablas I y II de la publicación de patente estadounidense No. 2002/0107215. Tejidos ejemplares en donde proteínas objetivo pueden ser expresadas específicamente incluyen, por ejemplo hígado, páncreas, glándula adrenal, tiroides, glándula salival, glándula pituitaria, cerebro, médula espinal, pulmón, corazón, pecho, músculo esqueletal, médula ósea, timo, bazo, nodo linfático, colorectal, estómago, ovario, intestino delgado, útero, placenta, próstata, testículos, colon, gástrico, vejiga, tráquea, riñon o tejido adiposo.
VII. Composiciones La invención también incluye composiciones que son producidas mediante métodos de la presente invención. Por ejemplo, la presente invención incluye dominios de monómero seleccionados o identificados de una biblioteca y/o bibliotecas que comprenden dominios de monómero producidos mediante los métodos de la presente invención. Composiciones de ácidos nucleicos y polipéptidos son incluidas en la presente invención. Por ejemplo, la presente invención proporciona una pluralidad de diferentes ácidos nucleicos en donde cada ácido nucleico codifica por lo menos un dominio de monómero o inmuno-dominio . En algunas modalidades, por lo menos un dominio de monómero es seleccionado de: un dominio semejante a EGF (por ejemplo, un dominio de laminina-EGF) , un dominio de trébol (tipo P) , una repetición de tiroglobulina tipo I, un dominio de trombospondina tipo I, y variantes de uno o más de los mismos. Dominios de monómero apropiados también incluyen aquellos enlistados en la base de datos Pfam y/o la base de datos SMART. La presente invención también proporciona ácidos nucleicos recombinantes que codifican uno o más polipéptidos que comprenden una pluralidad de dominios de monómero, tales dominios de monómero son alterados en orden o secuencia en comparación con un polipéptido que se presenta de manera estable en la naturaleza. Por ejemplo, el polipéptido que se presenta de manera estable en la naturaleza puede ser seleccionado de: un dominio semejante a EGF (por ejemplo, un dominio de laminina-EGF) , un dominio de trébol (tipo P) , un dominio de repetición de tiroglobulina tipo I, un dominio de trombospondina tipo I, y variantes de uno o más de los mismos. En otra modalidad, el polipéptido que se presenta de manera estable en la naturaleza codifica un dominio de monómero encontrado en la base de datos Pfam y/o la base de datos SMART. Todas las composiciones de la presente invención, en las que se incluyen las composiciones producidas mediante los métodos de la presente invención, por ejemplo, dominios de monómero también como multímeros y bibliotecas de los mismos pueden ser enlazados opcionalmente a una matriz de un material de afinidad. Ejemplos de material de afinidad incluyen perlas, una columna, un soporte sólido, un microarreglo, otras acumulaciones de reactivo-soportes y los semejantes. En algunas modalidades, la selección en solución utiliza un objetivo que ha sido biotinilado. En estas modalidades, el objetivo es incubado con la biblioteca de fago y los objetivos con el fago enlazado, son capturados utilizando perlas de estreptavidina. Las composiciones de la presente invención pueden ser enlazadas a una matriz de un material de afinidad, por ejemplo, los polipéptidos recombinantes. Ejemplos de material de afinidad incluyen, por ejemplo, perlas, una columna, un soporte sólido y/o los semejantes.
VIII. Métodos de tratamiento terapéutico y profiláctico La presente invención también incluye métodos de tratamiento terapéutico o profiláctico de una enfermedad o alteración al administrar in vivo o ex vivo uno o más ácidos nucleicos o polipéptido de la invención descritos anteriormente (o composiciones que comprenden un excipiente aceptable farmacéuticamente y uno o más de tales ácidos nucleicos o polipéptidos) a un sujeto, en los que se incluyen, por ejemplo un mamífero, en los que se incluyen un humano, primate, ratón, puerco, vaca, cabra, conejo, rata, conejillo de indias, hámster, caballo, oveja; o un vertebrado no mamífero tal como un ave (por ejemplo, un pollo o pato), pez o invertebrado. En un aspecto de la invención, en métodos ex vivo, una o más células o una de células interés del sujeto (por ejemplo, células de tumor, muestra de tejido de tumor, células de órganos, células de sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestino, bazo, estómago, sistema linfático, cervix, vagina, próstata, boca, lengua, etc.) son obtenidas o removidas del sujeto y puestas en contacto con una cantidad de un dominio de monómero y/o multímero seleccionado de la invención que es efectiva en el tratamiento profiláctica o terapéuticamente de la enfermedad, alteración u otra condición. Luego las células contactadas son devueltas o entregadas al sujeto al sitio del cual fueron obtenidas o a otro sitio (por ejemplo, en los que se incluyen aquellos obtenidos anteriormente) de interés en el sujeto a ser tratado. Si se desea, las células contactadas pueden ser injertadas sobre un tejido, órgano o sitio de sistema (en los que se incluyen todos los descritos anteriormente) de interés en el sujeto utilizando técnicas de insertación estándar o bien conocidas o por ejemplo, entregadas a la sangre o sistema linfático utilizando técnicas de administración o transfusión estándar. La invención también proporciona métodos in vivo en los cuales una o más células o una población de células de interés del sujeto son puestas en contacto directa o indirectamente con una cantidad de un dominio de monómero y/o multímero seleccionado de la invención efectiva en el tratamiento profiláctica o terapéuticamente de la enfermedad, alteración u otra condición. En formatos de contacto/administración directa, el dominio de monómero y/o multímero seleccionado es comúnmente administrado o transferido directamente a las células a ser tratadas o al sitio de tejido de interés (por ejemplo, células de tumor, muestra de tejido de tumor, célula de órganos, células de sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestino, bazo, estómago, sistema linfático, cervix, vagina, próstata, boca, lengua, etc.) mediante cualquiera de una variedad de formatos, en los que se incluyen administración tópica, inyección (por ejemplo, al utilizar una aguja o jeringa) o vacuna o administración de pistola de gen, empujando a un tejido, órgano o sitio de la piel. El dominio de monómero y/o multímero seleccionado puede ser administrado, por ejemplo intramuscular, intradérmica, subdérmica, subcutánea, oral, intraperitoneal, intratecal, intravenosamente o colocado dentro de una cavidad del cuerpo (en los que se incluyen, por ejemplo durante cirugía) o mediante inhalación o administración vaginal o rectal. En algunas modalidades, las proteínas de la invención son preparadas a concentraciones de por lo menos 25 mg/ml, 50 mg/ml, 75 mg/ml, 100 mg/ml, 150 mg/ml o más. Tales concentraciones son útiles, por ejemplo para formulaciones subcutáneas . En los formatos de contacto indirecto/administración in vivo, el dominio de monómero y/o multímero seleccionado es administrado comúnmente o transferido indirectamente a las células a ser tratadas o al sitio de tejido de interés, en los que se incluyen aquellos descritos anteriormente (tales, como por ejemplo células de la piel, sistemas de órganos, sistema linfático o sistema de células de sangre, etc.), al poner en contacto o administrar el polipéptido de la invención directamente a una o más células o población de células de las cuales el tratamiento puede ser facultad. Por ejemplo, células de tumor dentro del cuerpo del sujeto pueden ser tratadas al poner en contacto las células de la sangre o sistema linfático, piel o un órgano con una cantidad suficiente del dominio de monómero y/o multímero seleccionado, de tal manera que la administración del dominio de monómero y/o multímero seleccionado al sitio de interés (por ejemplo tejido, órgano o células de interés o sangre o sistema linfático en el cuerpo) ocurre y da como resultado tratamiento profiláctico o terapéutico efectivo. Tal contacto, administración o transferencia se efectúa comúnmente al utilizar una o más de las rutas o modos de administración descritos anteriormente. En otro aspecto, la invención proporciona métodos ex vivo en los cuales una o más células de interés o una población de células de interés en el sujeto (por ejemplo, células de tumor, muestra de tejido de tumor, células de órganos, células de sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestino, bazo, estómago, sistema linfático, cervix, vagina, próstata, boca, lengua, etc.) son obtenidas o removidas del sujeto y transformadas al poner en contacto la una o más células o población de células con un constructo de polinucleótido que comprende una secuencia de ácido nucleico de la invención que codifica un polipéptido biológicamente activo de interés (por ejemplo, un dominio de monómero y/o multímero seleccionado) que es efectivo en el tratamiento profiláctica o terapéuticamente de la enfermedad, alteración u otra condición. La una o más células o población de células es puesta en contacto con una cantidad suficiente del constructo de polinucleótido y un promotor que controla la expresión de la secuencia de ácido nucleico, de tal manera que la absorción del constructo de polinucleótido (y promotor) a la(s) célula (s) ocurre y se tiene como resultado la expresión suficiente de la secuencia de ácido nucleico objetivo de la invención para producir una cantidad del polipéptido biológicamente activo, que codifica un dominio de monómero y/o multímero seleccionado, efectivo para tratar profiláctica o terapéuticamente la enfermedad, alteración o condición. El constructo de polinucleótido puede incluir una secuencia de promotor (por ejemplo secuencia de promotor de CMV) que controla la expresión de la secuencia de ácido nucleico de la invención y/o si se desea, una o más secuencias de nucleótidos adicionales que codifican por lo menos uno o más de otros polipéptidos de la invención, una citocina, adyuvante o molécula co-estimulatoria u otro polipéptido de interés. Enseguida de la transfección, las células transformadas son devueltas, administradas o transferidas al sujeto al sitio de tejido o sistemas del cual fueron obtenidas o a otro sitio (por ejemplo células de tumor, muestra de tejido de tumor, células de órgano, células de sangre, células de la piel, pulmón, corazón, músculo, cerebro, mucosas, hígado, intestino, bazo, estómago, sistema linfático, cervix, vagina, próstata, boca, lengua, etc.) a ser tratado en el sujeto. Si se desea, las células pueden ser injertadas sobre un tejido, piel, órgano o sistema corporal de interés en el sujeto utilizando técnicas de injertación estándar y bien conocidas o administradas a la sangre o sistema linfático utilizando técnicas de administración o transfusión estándar. Tal entrega, administración o transferencia de células transformadas se efectúa comúnmente al utilizar una o más de las rutas o modos de administración descritos anteriormente. La expresión del ácido nucleico objetivo ocurre de manera natural o puede ser inducida (como se describe en mayor detalle posteriormente en la presente) y una cantidad del polipéptido codificado es expresada suficiente y efectiva para tratar la enfermedad o condición en el sitio o sistema de tejido. En otro aspecto, la invención proporciona métodos in vivo en los cuales una o más células de interés o una población de células del sujeto (por ejemplo, en las que se incluyen aquellas células y sistemas de células y sujetos descritos anteriormente) son transformadas en el cuerpo del sujeto al poner en contacto la(s) célula (s) o población de células con (o administración y transferencia a la(s) célula (s) o población de células utilizando una o más rutas o modos de administración descritos anteriormente) un constructo de polinucleótido que comprende una secuencia de ácido nucleico de la invención que codifica un polipéptido biológicamente activo de interés (por ejemplo, un dominio de monómero y/o multímero seleccionado) que es efectivo en el tratamiento profiláctica o terapéuticamente de la enfermedad, alteración u otra condición. El constructo de polinucleótido puede ser administrado o transferido directamente a la(s) célula (s) que sufre (n) de la enfermedad o alteración (por ejemplo, mediante contacto directo utilizando una o más de las rutas o modos de administración descritos anteriormente). Alternativamente, el constructo de polinucleótido puede ser administrado indirectamente o transferido a célula (s) que sufre (n) de la enfermedad o alteración al poner en contacto directamente la(s) célula (s) no enferma (s) u otras células con enfermedad utilizando una o más de las rutas o modos de administración descritos anteriormente con una cantidad suficiente del constructo de polinucleótido que comprende la secuencia de ácido nucleico que codifica el polipéptido biológicamente activo y un promotor que controla la expresión de la secuencia de ácido nucleico, de tal manera que la absorción del constructo de polinucleótido (y promotor) a la(s) célula (s) ocurre y se tiene como resultado expresión suficiente de la secuencia de ácido nucleico de la invención para producir una cantidad de polipéptido biológicamente activo efectiva para tratar profiláctica o terapéuticamente la enfermedad o desorden y mediante esto el constructo de polinucleótido o el polipéptido expresado resultante es transferido de manera natural o automáticamente desde el sitio de alimentación inicial, sistema, tejido u órgano del cuerpo del sujeto al sitio, tejido, órgano o sistema enfermo del cuerpo del sujeto (por ejemplo, vía la sangre o sistema linfático) . La expresión del ácido nucleico objetivo ocurre de manera natural o puede ser inducida (como se describe en mayor detalle posteriormente en la presente) de tal manera que una cantidad de polipéptido expresado es suficiente y efectiva para tratar la enfermedad o condición en el sitio o sistema de tejido. El constructo de polinucleótido puede incluir una secuencia de promotor (por ejemplo, una secuencia de promotor de CMV) que controla la expresión de la secuencia de ácido nucleico y/o si se desea, una o más secuencias de nucleótidos adicionales que codifican por lo menos uno o más de otro polipéptido de la invención, una citocina, adyuvante o molécula co-estimulatoria u otro polipéptido de interés. En cada uno de los métodos de tratamiento in vivo y ex vivo, como se describe anteriormente, una composición que comprende un excipiente y el polipéptido o ácido nucleico de la invención puede ser administrado o alimentado. En un aspecto, una composición que comprende un excipiente aceptable farmacéuticamente y un polipéptido o ácido nucleico de la invención es administrado o alimentado al sujeto como se describe anteriormente en una cantidad efectiva para tratar la enfermedad o alteración. En otro aspecto, en cada método de tratamiento in vivo y ex vivo descrito anteriormente, la cantidad del polinucleótido administrado a la(s) célula (s) o sujeto puede ser una cantidad, de tal manera que la absorción del polinucleótido a una o más células del sujeto ocurre y se tiene como resultado expresión suficiente de la secuencia de ácido nucleico para producir una cantidad de un polipéptido biológicamente activo efectiva para mejorar una respuesta inmune en el sujeto, en los que se incluyen una respuesta inmune inducida por un inmunógeno (por ejemplo, antígeno) . En otro aspecto, para cada uno de tales métodos, la cantidad del polipéptido administrado a célula (s) o sujeto puede ser una cantidad suficiente para mejorar una respuesta inmune en el sujeto, en los que se incluyen aquella inducida por un inmunógeno (por ejemplo, antígeno) . En todavía otro aspecto, en un método de tratamiento in vivo o in vivo, en el cual un constructo de polinucleótido (o composición que comprende un constructo de polinucleótido) es usado para administra un polipéptido fisiológicamente activo a un sujeto, la expresión del constructo de polinucleótido puede ser inducida al utilizar un sistema de expresión genética a intervalos inducible. Ejemplos de tales sistemas de expresión de genética a intervalos incluyen el sistema de expresión genética Tet-On™ y sistema de expresión genética Tet -Off™ (véase, por ejemplo, catálogo Clontech 2000, página 110-111 para una descripción detallada de cada uno de tales sistema) , respectivamente. Otros sistemas de expresión genética a intervalos controlables o inducibles son conocidos por aquellos de habilidad ordinaria en el arte. Con tal sistema, la expresión del ácido nucleico objetivo del constructo de polinucleótido puede ser regulada de manera precisa, reversible y cuantitativa. La expresión genética del ácido nucleico objetivo puede ser inducida, por ejemplo, después que las células transfectadas estables que contienen el constructo de polinucleótido que comprende el ácido nucleico objetivo son administradas o transferidas a o se hace que se pongan en contacto con el sitio de tejido, órgano o sistema de interés. Tales sistemas son de beneficio particular en métodos y formatos de tratamiento en los cuales es ventajoso retardar o controlar de manera precisa la expresión del ácido nucleico objetivo (por ejemplo, para permitir tiempo para la consumación de cirugía y/o cicatrización enseguida de la cirugía; para permitir tiempo para que el constructo de polinucleótido que comprende el ácido nucleico objetivo llegue al sitio, células, sistema o tejido a ser tratado; para permitir tiempo para que el injerto que contiene células transformadas con el constructo sea incorporado al tejido u órgano sobre o al cual ha sido empalmado o anexado, etc.) . IX. Usos de multímero adicionales Las aplicaciones potenciales de los multímeros de la presente invención son diversas e incluyen cualquier uso en donde se desea un agente de afinidad. Por ejemplo, la invención puede ser usada en la aplicación para crear antagonistas, en donde los dominios de monómero o multímero seleccionados bloquean la interacción entre dos proteínas. Opcionalmente, la invención puede generar agonistas. Por ejemplo, multímeros que enlazan dos proteínas diferentes, por ejemplo enzima y sustrato, pueden mejorar la función de proteína, en las que se incluyen, por ejemplo actividad enzimática y/o conversión del sustrato. Otras aplicaciones incluyen apuntamiento celular. Por ejemplo, multímeros que consisten de dominios de monómero y/o inmuno-dominios que reconocen proteínas de superficie celular específicas se pueden enlazar selectivamente a ciertos tipos de células. También se incluyen aplicaciones que involucran dominios de monómero y/o inmuno-dominios como agentes antivirales. Por ejemplo, multímeros que se enlazan a diferentes epítopos sobre la partícula de virus pueden ser útiles como agentes antivirales debido a la polivalencia. Otras aplicaciones pueden incluir, pero no están limitadas a, purificación de proteína, detección de proteína, biosensores, experimentos de captura de ligando-afinidad y los semejantes. Además, dominios o multímeros pueden ser sintetizados globalmente mediante medios convencionales para cualquier uso apropiado, tal como un agente terapéutico o de diagnóstico. En algunas modalidades, los dominios de monómero son usados para la inhibición de ligando, despeje de ligando o estimulación de ligando. Ligandos posibles en estos métodos incluyen, por ejemplo, citocinas, quimiocinas o factores de crecimiento . Si se desea la inhibición del enlace de ligando a un receptor, un dominio de monómero es seleccionado que se enlaza al ligando en una porción del ligando que se pone en contacto con el receptor de ligando o que se enlaza al receptor en una porción del receptor que se enlaza a los contactos de ligando, impidiendo mediante esto la interacción de ligando-receptor. Los dominios de monómero pueden opcionalmente ser enlazados a un agente extensor de vida media, si se desea. El despeje de ligando se refiere a la modulación de la vida de un ligando soluble en fluido corporal. Por ejemplo, la mayoría de los dominios de monómero, ausentes de un agente extensor de vida media, tienen una vida media corta. Así, el enlace de un dominio de monómero al ligando reducirá la vida media del ligando, reduciendo mediante esto la concentración del ligando. La porción del ligando enlazada por el dominio de monómero en general no importará, aunque puede ser benéfico enlazar el ligando en la porción de ligando que se enlaza a su receptor, inhibiendo mediante esto adicionalmente el efecto del ligando. Este método es útil para reducir la concentración de cualquier molécula en la corriente sanguínea. En algunas modalidades, la concentración de una molécula en la corriente sanguínea es reducida al mejorar la velocidad de despeje del riñon de la molécula. Comúnmente, el complejo de dominio de monómero-molécula es menor de aproximadamente 40 kD, menor de aproximadamente 50 KDa o menor de aproximadamente 60 KDa. Alternativamente, un multímero que comprende un primer dominio de monómero que se enlaza a un extensor de vida media y un segundo dominio de monómero que se enlaza a una porción del ligando que no se enlaza al receptor de ligando puede ser usado para incrementar la vida media del ligando. La invención proporciona además dominios de monómero que se enlazan a un factor de la sangre (por ejemplo, albúmina de suero, inmunoglobulina o eritrocitos) . En algunas modalidades, los dominios de monómero se enlazan a un polipéptido de inmunoglobulina o una porción del mismo. Cuatro familias (esto es, familias 1, 2, 3 y 4) de dominios de monómero que se enlazan a inmunoglobulina han sido identificadas.
Las secuencias para la familia 1 son resumidas posteriormente en la presente. Los guiones son incluidos solamente para el espaciamiento. Faml CASGQFQCRSTSICVPMW RCDGVPDCPDNSDEK--SCEPP--—T CASGQFQCRSTSICVPMWWRCDGVPDCVDNSDET--SCTST VHT CASGQFQCRSTSICVPMWRCDGVPDCADGSDEK—DCQQH T CASGQ C^RSTSICVP WWRCDGVl.DCGDGSDEA---DCGRPGPGATSAPAA-- CASGQFQCRSTSICVPMMWRCDGVPDCI.DSSDEK—SCNAP ASEPPGSL CASGQFQORSTSICTPMWWRCDGVP CRDGSDEAPAHCSAP ASEPPGSL CASGQFQCRSTSICVPQWWVCDGVPDCRDGSDEP-EQCTPP T C SSQFRCRD GICVPQW VCDGVPDCGDGSDEKG---CGRT GHT CLSSQFRCRDTGICVPQWWVCDGVPDCRDGSDEAAV-CGRP GHT CLSSQFRCRDTGICVPQWÍVCDGVPDCRDGSDEAPAHCSAP ASEPPGSL La familia 2 tiene la siguiente porción: [EQ] FXCRX [ST] XRC [IV] XXXWfILV] CDGXXDCXD[DN] SDE Secuencias ejemplares que comprenden la porción de familia 2 IgG son resumidas a continuación. Los guiones son incluidos solamente para el espaciamiento. Fam2 CGAS-EFTCRSSSRCIPQASÍVCDGENDCRDNSDE~ADCSAPASEPPGSL CRSN-EFTCBSSERCIPIA¡WVCDGDNDC DDSDE— AHCSAPASEPPGSL CVSN-EFQCRGTRRCIPR WLCDGLPDCGDNSDBAPAKCSAPASEPPGSL CHPTGQFRCRSSGRCVSPTWVCDGDNDCGDNSDE— ENCSAPASEPPGSL CQAG-EFCK:--GNGRCISPMrVCDGEl.DCRDGSDE--ANCSAPASEPPGSL La famil ia 3 t iene ya sea una u otra de las dos siguientes porciones : CXSSGRCIPX5 WVCDGXXDCRDXSDE; o CXSSGRCIPXX LCDGXXDCRDXSDE Secuencias ejemplares que comprenden la porción de familia 3 de IgG son resumidas a continuación. Los guiones son incluidos solamente para el espaciamiento. Fam3 CPPSQFTCKSNDKCIPVHWLCDGDNDCGDSSDE--ANCGRPGPGATSAPAA CPSGEFPCRSSGRCIPLAWLCDGDNDCRDNSDEPPALCGRPGPGATSAPAA CAPSEFQCRSSGRCIPLPWVC GEDDCRDGSDES-AVCGAPAP--T CQASEFTCKSSGRCIPQEWLCDGEDDCRDSSDE--KNCQQPT CLSSEFQCQSSGRCIPLAWVCDGDNDCRDDSDE--KSCKPRT En base a alineaciones de la familia 3, dominio de monómero que no se presentan de manera estable en la naturaleza adicionales que se enlazan a IgG y tienen la secuencia SSGR inmediatamente precedente a la tercer cisteína en un andamio de dominio A. Las secuencias de estos dominios de monómero son resumidas posteriormente en la presente. Los guiones son incluidos solamente para el espaciamiento.
Fam4 CPANEPQCSNGRCISPA LCDGENDCVDGSDE--KGCTPRT CPPSEFQCGNGRCISPAWLCDGDNDCVDGSDE--TNCTTSGPT CPPGEFQCGNGRCISAGWVCDGEHDCVDDSDE---KDCPART CGSGEFQCSNGRCIS GWVCDGEDDCPDGSDE—TNCGDSHILPFSTPGPST CPADEFTCGNGRCISPAWCDGEPDCRDGSDE-AAVCETHT CPSNEFTCGNGRC?SIAWLCDGEPI>CRDSSDESLAICSQDPEFHKV Dominios de monómero que se enlazan a células de sangre roja (RBC) o albúmina de suero (CSA) son descritos en la publicación de patente estadounidense No. 2005/0048512, e incluyen, por ejemplo: RBCA CRSSQFQCNDSRICIPGRWRCDGDNDCQDGSDETGCGDSHILPFSTPGPST RBCB CPAGEFPCKNGQCLPVTWLCDGVNDCLDGSDEKGCGRPGPGATSAPAA RBC11 CPPDEFPCKNGQCIPQDWLCDGVNDCLDGSDEKDCGRPGPGATSAPAA CSA-A8 CGAGQFPCKNGHCLPLNLLCDGVNDCEDNSDEPSELCKALT La presente invención proporciona un método para prolongar la vida media en el suero de una proteína, en las que se incluyen, por ejemplo, un multímero de la invención o una proteína de interés en un animal . La proteína de interés puede ser cualquier proteína con funcionalidad terapéutica, profiláctica o de otra manera funcionalidad deseable (en las que se incluyen otro dominio de monómero o multímero de la presente invención) . Este método comprende proporcionar primero un dominio de monómero que ha sido identificado como una proteína de enlace que se enlaza específicamente a un agente extensor de la vida media tal como molécula portada por sangre o célula, tales como proteínas de suero tales como albúmina (por ejemplo, albúmina de suero humano) o transferrina, IgG o una porción de la misma, células de sangre roja, etc. En algunas modalidades, el monómero de enlace del agente extensor de vida media puede ser enlazado covalentemente a otro dominio de monómero que tiene una afinidad de enlace por la proteína de interés. Este multímero, que enlaza opcionalmente la proteína de interés, puede ser administrado a un mamífero, en donde se asociará con el agente extensor de vida media (por ejemplo, HSA, transferrina, IgG, células de sangre roja, etc.) para formar un complejo. Esta formación de complejo da como resultado la extensión de vida media que protege el multímero y/o proteína (s) enlazada (s) de la degradación proteolítica y/u otra remoción del multímero y/o proteína (s) y prolongar mediante esto la vida media de la proteína y/o multímero (véase, por ejemplo el ejemplo 3 a continuación) . Una variación de este uso de la invención incluye el monómero de enlace del agente extensor de vida media enlazado covalentemente a la proteína de interés. La proteína de interés puede incluir un dominio de monómero, un multímero de dominios de monómero o un fármaco sintético. Alternativamente, se podrían generar monómeros que se enlazan ya sea a inmunoglobulinas o eritrocitos utilizando el método anterior y podrían ser usados para la extensión de la vida media. Los multímeros de enlace del agente extensor de vida media son comúnmente multímeros de por lo menos dos dominios, dominios quiméricos o dominios mutagenizados de dos dominios, dominios quiméricos o dominios mutagenizados (esto es, uno que se enlaza a un objetivo de interés y uno que se enlaza a la molécula o célula portada por la sangre) . Dominios apropiados, por ejemplo aquellos descritos en la presente, pueden ser seleccionados y filtrados adicionalmente en cuando a enlace a un agente extensor de vida media. Los multímeros de enlace del agente extensor de vida media son generados de acuerdo con los métodos para fabricar multímeros descritos en la presente utilizando por ejemplo dominios de monómero pre-seleccionados en cuanto a actividad de enlace del extensor de vida media. Por ejemplo, algunos monómeros de dominio de clase A del receptor de LDL de enlace del agente extensor de vida media, son descritos en el ejemplo 2 a continuación. En algunas modalidades, los multímeros comprenden por lo menos un dominio que se enlaza a HSA, transferrina, IgG, una célula de sangre roja u otro agente extensor de la vida media, en donde el dominio comprende una porción de dominio de Notch/LNR, una porción de dominio de DSL, porción de dominio de Anato, porción de dominio de beta integrina o porción de dominio de Ca-EGF como se estipula en la presente y el multímero comprende por lo menos un segundo dominio que se enlaza a una molécula objetivo, en donde el segundo dominio comprende una porción de dominio de Notch/LNR, porción de dominio de DSL, porción de dominio de Anato, una porción de dominio de beta integrina o porción de dominio de Ca-EGF como se estipula en la presente. La vida media en el suero de una molécula puede ser prolongada para ser, por ejemplo, de por lo menos 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70 80, 90, 100, 150, 200, 250, 400, 500 o más horas. La presente invención también proporciona un método para la supresión o disminución de una respuesta inmune en un mamífero. Este método comprende primero seleccionar un dominio de monómero que se enlaza a un objetivo inmunosupresor. Tal "objetivo inmunosupresor" es definido como cualquier proteína que cuando es enlazada por otra proteína produce un resultado inmunosupresor en un mamífero. Luego el dominio de monómero inmunosupresor puede ser ya sea administrado directamente o puede ser enlazado covalentemente a otro dominio de monómero o a otra proteína que proporcionará el apuntamiento deseado del monómero inmunosupresor. Los multímeros inmunosupresores son comúnmente multímeros de por lo menos dos dominios, dominios quiméricos o dominios mutagenizados. Dominios apropiados incluyen todos aquellos descritos en la presente y son seleccionados y filtrados adicionalmente en cuando a enlace a un objetivo inmunosupresor. Multímeros inmunosupresores son generados de acuerdo con los métodos para fabricar multímeros descritos en la presente, utilizando por ejemplo, dominios de monómero de trébol/PD, dominios de monómero de trombospondina o dominios de monómero de tiroglobulina. En otra modalidad, un multímero que comprende un primer dominio de monómero que se enlaza al ligando y un segundo dominio de monómero que se enlaza al receptor puede ser usado para incrementar la afinidad efectiva del ligando por el receptor. En otra modalidad, se usan multímeros que comprenden por lo menos dos monómeros que se enlazan a receptores para traer dos receptores en proximidad, que se enlazan ambos al multímero, activando mediante esto los receptores.
En algunas modalidades, multímeros con dos monómeros diferentes pueden ser usados para usar un incremento de avidez impulsada por objetivo. Por ejemplo, un primer monómero puede ser apunado a una molécula de superficie celular sobre un primer tipo de célula y un segundo monómero puede ser apuntado a una molécula de superficie sobre un segundo tipo de célula. Al enlazar los dos monómeros para formar un multímero y luego agregar el multímero a una mezcla de los dos tipos de células, el enlace ocurrirá entre las células una vez que ocurre un evento de enlace inicial entre un multímero y dos células, otros multímeros también se enlazarán a ambas células. Ejemplos adicionales de usos potenciales de la invención incluyen dominios de monómero y multímeros de los mismos, que son aptos de enlace de fármaco (por ejemplo, enlace de radionucleótidos para apuntamiento, enlace farmacéutico para extensión de vida media de fármacos, enlace de sustancia controlada para tratamiento de sobredosis y terapia de adicción), modulación de función inmune (por ejemplo, bloqueo de inmunogenicidad mediante enlace de tales receptores como CTLA-4, inmunogenicidad que mejora mediante el enlace de tales receptores como CD80, o activación de complemento mediante enlace tipo Fc) y administración especializada (por ejemplo, liberación lenta mediante escisión del enlazador, dominios de electrotransporte, dominios de dimerización o enlace específico a: dominios de entrada de célula, receptores de despeje tales como FcR, receptores de administración oral, tales como plgR para transporte trans-mucosal y receptores de transferencia de sangre-cerebro tales como transferrinaR) . En modalidades adicionales, monómeros o multímeros puede ser enlazados a una etiqueta detectable (por ejemplo, Cy3 , Cy5 , etc.) o enlazados a un producto de gen reportero (por ejemplo, CAT, luciferasa, peroxidasa de rábano, fosfatasa alcalina, GFP, etc.). En algunas modalidades, los monómeros de la invención son seleccionados en cuanto a la habilidad para enlazarse a anticuerpos de animales específicos, por ejemplo, cabra, conejo, ratón, etc., para uso como un reactivo secundario en análisis de detección. En algunos casos, un par de monómeros o multímeros son seleccionados para enlazar al mismo objetivo (esto es, para uso en análisis a base de emparedados) . Para seleccionar un monómero o par de multímeros correspondientes o coincidentes, dos monómeros o multímeros diferentes comúnmente son aptos de enlazarse a la proteína objetivo simultáneamente. Un procedimiento para identificar tales pares involucra lo siguiente : (1) inmovilizar el fago o mezcla de proteínas que fue previamente seleccionado para enlazar la proteína objetivo ,- (2) poner en contacto la proteína objetivo con el fago o proteína inmovilizado y lavado; (3) poner en contacto el fago o mezcla de proteína al objetivo enlazado y lavado, y (4) eluir el fago enlazado o proteína sin eluir el fago o proteína inmovilizada. En algunas modalidades, se usan diferentes poblaciones de fago con diferentes marcadores de fármacos. Un uso de los multímeros o dominios de monómero de la invención es el uso para reemplazar anticuerpos u otros agentes de afinidad en análisis de detección u otros análisis a base de afinidad. Así, en algunas modalidades, dominios de monómero o multímeros son seleccionados contra la habilidad para enlazarse a componentes diferentes que un objetivo en una mezcla. El procedimiento general puede incluir efectuar la selección de afinidad bajo condiciones que se asemejan estrechamente a las condiciones del análisis, en las que se incluyen imitar la composición de una muestra durante el análisis. Así, una etapa de selección podría incluir poner en contacto un dominio de monómero o multímero con una mezcla que no incluye el ligando objetivo y seleccionar contra cualquier dominio de monómero o multímeros que se enlazan a la mezcla. Así, las mezclas (ausentes de ligando objetivo, las cuales podrían ser agotadas utilizando un anticuerpo, dominio de monómero o multímero) que representan la muestra en un análisis (suero, sangre, tejido, células, orina, semen, etc.) pueden ser usadas como agente de bloqueo. Tal sustracción es útil, por ejemplo, para crear proteínas farmacéuticas que se enlazan a su objetivo pero no a otras proteínas de suero o tejidos no objetivo.
X. Manipulación adicional de dominios de monómero y/o ácidos nucleicos de multímero y polipéptidos Como se menciona anteriormente, el polipéptido de la presente invención puede ser alterado. Descripciones de una variedad de procedimientos generadores de diversidad para generar secuencias de ácido nucleico modificadas o alteradas que codifican estos polipéptidos son descritas anteriormente y a continuación en las siguientes publicaciones y las referencias citadas en las mismas: Soong et al., (2000) Nat Genet 25 (4) : 436-439 ; Stemmer, et al., (1999) Tumor Targeting 4:1-4; Ness et al., (1999) Nat Biotech. 17:893-896; Chang et al., (1999) Nat. Biotech. 17:793-797; Minshull and Stemmer, (1999) Curr. Op . Chem. Biol. 3:284-290; Christians et al., (1999) Nat. Biotech. 17:259-264; Crameri et al., (1998) Nature 391:288-291; Crameri et al., (1997) Nat. Biotech. 15:436-438: Zhang et al., (1997) PNAS USA 94:4504-4509; Patten et al., (1997) Curr. Op . Biotech. 8:724-733; Crameri et al., (1996) Nat. Med. 2:100-103; Crameri et al., (1996) Nat. Biotech. 14:315-319; Gates et al., (1996) J. Mol. Biol. 255:373-386; Stemmer, (1996) En: The Encyclopedia of Molecular Biology. VCH Publishers, New York, pp.447-457; Crameri and Stemmer, (1995) BioTechniques 18:194-195; Stemmer et al., (1995) Gene, 164:49-53; Stemmer, (1995) Science 270: 1510; Stemmer, (1995) Bio/Technology 13:549-553; Stemmer, (1994) Nature 370:389-391; y Stemmer, (1994) PNAS USA 91:10747-10751. Métodos mutacionales para generar diversidad incluyen, por ejemplo mutagénesis dirigida al sitio (Ling et al., (1997) Anal Biochem. 254(2): 157-178; Dale et al., (1996) Methods Mol. Biol. 57:369-374; Smith, (1985) Ann. Rev. Genet. 19:423-462; Botstein & Shortle, (1985) Science 229:1193-1201; Cárter, (1986) Biochem. J. 237:1-7; y Kunkel, (1987) in Nucleic Acids & Molecular Biology (Eckstein, F. and Lilley, D.M.J, eds., Springer Verlag, Berlín)); mutagénesis utilizando plantillas que contienen uracilo (Kunkel, (1985) PNAS USA 82:488-492; Kunkel et al., (1987) Methods in Enzymol. 154, 367-382; y Bass et al., (1988) Science 242:240-245); mutagénesis dirigida al oligonucleótido ((1983) Methods in Enzymol. 100: 468-500; (1987) Methods in Enzymol. 154: 329-350; Zoller & Smith, (1982) Nucleic Acids Res. 10:6487-6500; Zoller & Smith, (1983) Methods in Enzymol. 100:468-500; y Zoller & Smith, (1987) Methods in Enzymol. 154:329-350); mutagenesis de ADN fosforotioato-modificada (Taylor et al., (1985) Nucí. Acids Res. 13: 8749-8764; Taylor et al., (1985) Nucí. Acids Res. 13: 8765-8787; Nakamaye & Eckstein, (1986) Nucí. Acids Res. 14: 9679-9698; Sayers et al., (1988) Nucí. Acids Res. 16:791-802; y Sayers et al., (1988) Nucí. Acids Res. 16: 803-814); mutagénesis utilizando ADN dúplex con espacios (Kramer et al., (1984) Nucí. Acids Res. 12: 9441-9456; Kramer & Fritz (1987) Methods in Enzymol. 154:350-367; Kramer et al., (1988) Nucí. Acids Res. 16: 7207; y Fritz et al., (1988) Nucí. Acids Res. 16: 6987-6999) . Métodos apropiados adicionales incluyen reparación de desajuste de punto (Kramer et al., Point Mismatch Repair, (1984) Cell 38:879-887), mutagénesis utilizando cepas de huésped deficientes de reparación (Cárter et al., (1985) Nucí. Acids Res. 13: 4431-4443; y Cárter, (1987) Métodos in Enzymol. 154: 382-403), mutagénesis de cancelación (Eghtedarzadeh & Henikoff, (1986) Nucí. Acids Res. 14: 5115), restricción-selección y restricción-purificación (Wells et al., (1986) Phil. Trans. R. Soc. Lond. A 317: 415-423), mutagénesis mediante síntesis de gen total (Nambiar et al., (1984) Science 223: 1299-1301; Sakamar and Khorana, (1988) Nucí. Acids Res. 14: 6361-6372; Wells et al., (1985) Gene 34:315-323; y Grundstrom et al., (1985) Nucí. Acids Res. 13: 3305-3316), reparación de ruptura de doble hebra, (1986) PNAS USA. 83:7177-7181 ,- y Arnold, (1993) Curr. Op . Biotech. 4:450-455). Detalles adicionales en muchos de los métodos anteriores se pueden encontrar en Methods in Enzymology Volume 154, que también describe controles útiles para resolver problemas con varios métodos de mutagénesis. Detalles adicionales con respecto a varios métodos para generar diversidad se pueden encontrar en las patentes estadounidenses Nos. 5,605,793; 5,811,238; 5,830,721; 5,834,252; 5,837,458; WO 95/22625; WO 96/33207; WO 97/20078; WO 97/35966; WO 99/41402; WO 99/41383; WO 99/41369; WO 99/41368; EP 752008; EP 0932670; WO 99/23107; WO 99/21979; WO 98/31837; WO 98/27230; WO 98/27230; WO 00/00632; WO 00/09679; WO 98/42832; WO 99/29902; WO 98/41653; WO 98/41622; WO 98/42727; WO 00/18906; WO 00/04190; WO 00/42561 ; WO 00/42559; WO 00/42560; WO 01/23401 ; PCT/USOl/06775. Otro aspecto de la presente invención incluyen la clonación y expresión de dominios de monómero, dominios de manera seleccionados, multímeros y/o multímeros seleccionados que codifican ácidos nucleicos. Así, dominios de multímero puede ser sintetizados como una sola proteína utilizando sistemas de expresión bien conocidos en el arte. Además de los muchos textos indicados anteriormente, textos generales que describen técnicas de biología molecular útiles en la presente, en las que se incluyen el uso de vectores, promotores y muchos otros tópicos relevantes a la expresión de ácidos nucleicos tales como dominios de monómero, dominios de monómero seleccionados, multímeros y/o multímeros seleccionados, incluyen Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (2nd Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook") and Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., Current Protocols, a joint venture between Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (complementado a través de 1999) ("Ausubel")). Ejemplos de técnicas suficientes para dirigir a las personas de habilidad a través de métodos de amplificación in vitro, útiles para identifica, aislar, y clonar dominios de monómero y multímeros que codifican ácidos nucleicos, en los que se incluyen reacción en cadena de polimerasa (PCR) , reacción en cadena de ligasa (LCR) , amplificación de Q-replicasa y otras técnicas moderadas por ARN polimerasa (por ejemplo, NASBA), son encontrados en Berger, Sambrook y Ausubel, también como Mullís et al, (1987) patente estadounidense No. 4,683,202; PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, CA (1990) (Innis); Arnheim & Levinson (El 1 de octubre de 1990) C&EN 36-47; The Journal of NIH Research (1991) 3, 81-94; (Kwoh et al. (1989) Proc. Natl. Acad. Sci. USA 86, 1173; Guatelli et al. (1990) Proc. Natl. Acad. Sci. USA 87, 1874; Lomell et al. (1989) J. Clin. Chem 35, 1826; Landegren et al., (1988) Science 241, 1077-1080; Van Brunt (1990) Biotechnology 8, 291-294; Wu and Wallace, (1989) Gene 4, 560; Barringer et al. (1990) Gene 89, 117 y Sooknanan and Malek (1995) Biotechnology 13: 563-564. Métodos mejorados de clonación in vitro de ácidos nucleicos amplificados son descritos en la patente estadounidense No. 5,426,039 expedida a Wallace et al. Métodos mejorados para amplificar ácidos nucleicos grandes mediante PCR son resumidos en Cheng et al . (1994) Nature 369: 684-685 y las referencias en la misma, en las cuales se generan amplicones de PCR de hasta 40 kb. Aquel de habilidad en el arte apreciará que esencialmente cualquier ARN puede ser convertido a un AD? de doble hebra apropiado para digestión de restricción, expansión de PCR y secuenciación utilizando transcriptasa inversa y una polimerasa. Véase, Ausubel, Sambrook and Berger, all supra . La presente invención también es concerniente con la introducción de vectores de la invención a células huésped y la producción de dominios de monómero, dominios de monómero seleccionados, inmuno-dominios, multímeros y/o multímeros seleccionados de la invención mediante técnicas recombinantes. Células huésped son diseñadas genéticamente (esto es, transducidas, transformadas o transfectadas) con los vectores de la invención, los cuales pueden ser por ejemplo, un vector de clonación o un vector de expresión. El vector puede estar, por ejemplo en forma de un plásmido, una partícula viral, un fago, etc. Las células huésped diseñadas pueden ser cultivadas en medios nutrientes convencionales modificados como sea apropiado para activar promotores, seleccionar transformantes o amplificar el dominio de monómero, dominio de monómero seleccionado, multímero y/o gen (es) de multímero seleccionado de interés. Las condiciones de cultivo, tales como temperatura, pH y los semejantes, son aquellos previamente usados con la célula huésped seleccionada para expresión y serán evidentes para aquellos experimentados en el arte y en las referencias citadas en la presente, en las que se incluyen, por ejemplo, Freshney (1994) Culture of Animal Cells, a Manual de Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas en la misma. Como se menciona anteriormente, los polipéptidos de la invención pueden también ser producidos en células no animales tales como plantas, levadura, hongos, bacterias y los semejantes. Por supuesto, como se indica de principio a fin, el despliegue de fago es una técnica especialmente relevante para producir tales polipéptidos. Además de Sambrook, Berger and Ausubel, detalles concernientes al cultivo celular se pueden encontrar en Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg and Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlín Heidelberg New York) y Atlas and Parks (eds) The Handbook de Microbiological Media (1993) CRC Press, Boca Ratón, FL. La presente invención también incluye alteraciones de dominios de monómero, inmuno-dominios y/o multímeros para mejorar las propiedades farmacológicas, para reducir la inmunogenicidad o para facilitar el transporte del multímero y/o dominio de monómero a una célula o tejido (por ejemplo, a través de la barrera sangre- -cerebro o a través de la piel) . Estos tipos de alteraciones incluyen una variedad de modificaciones (por ejemplo, la adición de grupos azúcar o glicosilación) , la adición de PEG, la adición de dominios de proteína que se enlazan a una cierta proteína (por ejemplo, HSA u otra proteína del suero) , la adición de fragmentos de proteínas o secuencias que señalan el movimiento o transporte hacia dentro, fuera de y a través de una célula. Componentes adicionales pueden también ser agregados a un multímero y/o dominio de monómero para manipular las propiedades del multímero y/o dominio de monómero. Una variedad de componentes pueden también ser agregados, en los que se incluyen, por ejemplo, un dominio que se enlaza a un receptor conocido (por ejemplo, un dominio de proteína de región Fc que se enlaza a un receptor de Fc) , una(s) toxina (s) o parte de una toxina, un pro-dominio que puede ser escindido opcionalmente para activar el multímero o dominio de monómero, una molécula reportero (por ejemplo, proteína fluorescente verde), un componente que se enlaza a una molécula reportero (tal como un radionúclido para radioterapia, biotina o avidina) o una combinación de modificaciones .
XI . Métodos de selección adicionales La presente invención también proporciona un método para seleccionar una proteína en cuanto a inmunogenicidad potencial al : proporcionar una secuencia de proteína candidata; comparar la secuencia de proteína candidata con una base de datos de secuena-ias de proteína humanas; identificar porciones de la secuencia de proteína candidata que corresponden a porciones de las secuencias de proteína humana de la base de datos; y determinar la extensión de correspondencia entre la secuencia de proteína candidata y las secuencias de proteína humana a partir de la base de datos. En general, mientras mayor es la extensión de correspondencia entre la sección de proteína candidata y una o más de las secuencias de proteína humana de la base de datos, más bajo es el potencial para inmunogenicidad predecido en comparación con una proteína candidata que tiene poca correspondencia con cualquiera de las secuencias de proteína humanas de la base de datos. La remoción o limitación del número de aminoácidos y/o secuencias inmunógenas pueden también ser usados para reducir la inmunogenicidad de los dominios de monómero, por ejemplo ya sea antes o después que las bibliotecas son seleccionadas. Secuencias inmunogénicas que incluyen, por ejemplo secuencias o sitios de proteosoma tipo I o tipo II de HLA. Una variedad de productos comerciales y programas de computadora están disponibles para identificar estos aminoácidos, por ejemplo Tepitope (Roche), the Parker Matrix, ProPred-I matrix, Biovation, Epivax, Epimatrix. Una base de datos de secuencias de proteína humana que es apropiada para uso en la práctica del método de la invención para seleccionar proteínas candidatas se puede encontrar en ncbi.nlm.nih.gov/blast/Blast.cgi en el World Wide Web (además, el siguiente sitio web puede ser usado para búsqueda corta, coincidencias casi exactas: cbi . nlm. nih . gov/blast/Blast . cgi?CMD=Web&LAYOUT=TwoWindows&AUTO_ FORMAT=Semiaut?&ALIGNMENTS=50dcALIGNMENT_VIEW=Pairwise&CLIENT=we b&DATABASE=nr&DESCRIPTIONS=100&ENTREZ_QUERY= (none) &EXPECT=1000& FORMAT_OBJECT=Alignment&FORMAT_TYPE=HTML&NCBI_GI=on&PAGE=Nucleo tides&PROGRAM=blastn&SERVICE=plain&SET_DEFAULTS.x=29&SET_DEFAUL TS . y=6&SH0W_0VERVIEW=on&W0RD_SIZE=7&END_0F_HTTPGET=Yes&SH0W_LIN K0UT=yes at the World Wide Web) . El método es particularmente útil para determinar si una secuencia de cruce en una proteína quimérica, tal como por ejemplo un dominio de monómero quimérico, es probable que provoque un evento inmunogénico. Si la secuencia de cruce corresponde a una porción de una secuencia encontrada en la base de datos de secuencias de proteína humana, se cree que es menos probable que la secuencia de cruce provoque un evento inmunogénico. Bibliotecas de dominio quimérico humanas preparadas de acuerdo con los métodos de presente invención pueden ser seleccionadas en cuanto a inmunogenicidad potencial, además de afinidad de enlace. Además, información perteneciente a porciones de secuencias de proteína humana de la base de datos puede ser usada para diseñar una biblioteca de proteínas, de proteínas quiméricas semejantes a humanas. Tal biblioteca puede ser generada al utilizar información perteneciente "secuencias de cruce" que existen en las proteínas humanas que se presentan de manera estable en la naturaleza. El término "secuencias de cruce" se refiere en la presente a una secuencia que es encontrada en su totalidad en por lo menos una proteína humana que se presenta de manera estable en la naturaleza, en la cual porciones de las secuencias son encontradas en dos o más proteínas que se presentan de manera estable en la naturaleza. Así, la recombinación de las últimas dos o más proteínas que se presentan de manera estable en la naturaleza generarían una proteína quimérica en la cual la porción quimérica de la secuencia corresponde realmente a una secuencia encontrada en otra proteína que se presenta de manera estable en la naturaleza. La secuencia de cruce contiene una unión quimérica de dos posiciones de residuos de aminoácido consecutivas en las cuales la primera posición de aminoácido es ocupada por un residuo de aminoácido idéntico en tipo y posición encontrado en una primera y segunda secuencia de proteína humana que se presenta de manera estable en la naturaleza, pero no una tercera secuencia de proteína humana que se presenta de manera estable en la naturaleza. La segunda posición de aminoácido es ocupada por un residuo de aminoácido idéntico en tipo y posición encontrado en una segunda y tercera secuencia de proteína humana que se presenta de manera estable en la naturaleza, pero no la primera secuencia de proteína humana que se presenta de manera estable en la naturaleza. En otras palabras, la "segunda" secuencia de proteína humana que se presenta de manera estable en la naturaleza corresponde a la proteína humana que se presenta de manera estable en la naturaleza en la cual la secuencia de cruce aparece en su totalidad, como se describe anteriormente. De acuerdo con la presente invención, una biblioteca de proteínas quiméricas semejantes a humana es generada al: identificar secuencias de proteína humana de una base de datos que corresponden a proteínas de la misma familia de proteínas; alinear las secuencias de proteína humana de la misma familia de proteínas con una secuencia de proteína de referencia ,-identificar un conjunto de subsecuencias derivadas de diferentes secuencias de proteína humana de la misma familia, en donde cada subsecuencia comparte una región de identidad con por lo menos otra subsecuencia derivada de una secuencia de proteína humana que se presenta de manera estable en la natural diferente; identificar una unión quimérica de una primera, una segunda y una tercera subsecuencia, en donde cada subsecuencia es derivada de una secuencia de proteína humana que se presenta de manera estable en la naturaleza diferente y en donde la unión quimérica comprende dos posiciones de residuo de aminoácido consecutivas en las cuales la primera posición de aminoácido es ocupada por un residuo de aminoácido común a la primera y segunda secuencia de proteína humana que se presenta de manera estable en la naturaleza, pero no la tercera secuencia de proteína humana que se presenta de manera estable en la naturaleza y la segunda posición de aminoácido es ocupada por un residuo de aminoácido común a la segunda y tercera secuencia de proteína humana que se presenta de manera estable en la naturaleza y generar moléculas de proteína quiméricas semejantes a humana cada una correspondientes en secuencia a dos o más subsecuencias del conjunto de subsecuencias y cada una comprende una o más de las uniones quiméricas identificadas . Así, por ejemplo, si la primera secuencia de proteína humana que se presenta de manera estable en la naturaleza es, A-B-C y la segunda es, B-C-D-E y la tercera es, D-E-F, entonces la unión quimérica es C-D. Alternativamente, si la primera secuencia de proteína humana que se presentan de manera estable en la naturaleza es D-E-F-G y la segunda es B-C-D-E-F y la tercera es A-B-C-D, entonces la unión quimérica es D-E. Moléculas de proteína quiméricas semejantes a humana pueden ser generadas de una variedad de maneras. Por ejemplo, oligonucleótidos que comprende secuencias que codifican las uniones quiméricas pueden ser recombinados con oligonucleótidos correspondientes en secuencias a dos o más subsecuencias del conjunto de subsecuencias descrito anteriormente para generar una proteína quimérica semejante a humana y bibliotecas de la misma. La secuencia de referencia usada para alinear las proteínas humanas que se presentan de manera estable en la naturaleza es una secuencia de la misma familia de proteínas humanas que se presentan de manera estable en la naturaleza o una quimera u otras variantes de proteínas en la familia.
XII. Modelos de animal Otro aspecto de la invención es el desarrollo de modelos de animal no humanos específicos en los cuales se prueba la inmunogenicidad del monómero o dominios de multímero. El método para producir tal modelo de animal no humano comprende: introducir a por lo menos algunas células de un animal no humano receptor, vectores que comprenden genes que codifican una pluralidad de proteínas humanas de la misma familia de proteínas, en donde cada uno de los genes están enlazados operativamente a un promotor que es funcional en por lo menos algunas de las células a las cuales los vectores son introducidos de tal manera que un animal no humano modificado genéticamente es obtenido que puede expresar la pluralidad de proteínas humanas a partir de la misma familia de proteínas. Animales no humanos apropiados usados en la práctica de la presente invención incluyen todos los animales vertebrados, excepto humanos (por ejemplo, ratón, rata, conejo, oveja y los semejantes) . Comúnmente, la pluralidad de miembros de una familia de proteínas incluye por lo menos dos miembros de aquella familia y usualmente por lo menos diez miembros de familia. En algunas modalidades, la pluralidad incluye todos los miembros conocidos de la familia de proteínas. Genes ejemplares que pueden ser usados incluyen aquellos que codifican dominios de monómero, tales como por ejemplo, miembros del dominio de monómero de Notch/LNR, dominio de monómero de DSL, dominio de monómero de Anato, un dominio de monómero de beta integrina o dominio de monómero de Ca-EGF, también como las otras familias de dominio descritas en la presente . Los modelos de animal no humanos de la presente invención pueden ser usados para seleccionar en cuanto a inmunogenicidad de un monómero o dominio de multímero que es derivado de la misma familia de proteínas expresadas por el modelo de animal no humano. La presente invención incluyen el modelo de animal no humano fabricado de acuerdo con los métodos descritos anteriormente, también como animales no humanos transgénicos cuyas células somáticas y de germinación contienen y expresan moléculas de ADN que codifican una pluralidad de proteínas humanas de la misma familia de proteínas (tales como los dominios de monómero descritos en la presente) , en donde las moléculas de ADN han sido introducidas al animal no humano transgénico en una etapa embriónica y en donde las moléculas de ADN están cada una enlazadas operativamente a un promotor en por lo menos algunas de las células en las cuales moléculas de ADN han sido introducidas. Un ejemplo de un modelo de ratón útil para la selección de proteínas de enlace derivadas de dominio de trombospondina tipo I, dominio de tiroglobulina o dominio de trébol es descrito como sigue. Grupos de genes que codifican los dominios de monómero de trombospondina tipo I humanos tipo silvestre, dominios de monómero de tiroglobulina o dominios de monómero de trébol son amplificados a partir de células humanas utilizando PCR. Luego estos fragmentos son usados para generar ratones transgénicos de acuerdo con el método descrito anteriormente. Los ratones transgénicos reconocerán los dominios de trombospondina tipo I humanos, dominios de tiroglobulina o dominios de trébol como "individuales" , imitando así la "individualidad" de un humano con respecto a dominios de trombospondina tipo I, dominios de tiroglobulina o dominios de trébol. Monómeros derivados de trombospondina tipo I individuales, monómeros derivados de tiroglobulina o monómeros derivados de trébol o multímeros son probados en estos ratones al inyectar los monómeros o multímeros derivados de trombospondina tipo I, monómeros o multímeros derivados de tiroglobulina o monómeros o multímeros derivados de trébol a los ratones, luego analizando la respuesta (o carencia de respuesta) generada. Los ratones son probados para determinar si han desarrollado una respuesta anti-humana de ratón (MAHR) . Los monómeros y multímeros que no dan como resultado la generación de una MAHR es probable que sean no inmunogénicos cuando son administrados a humanos. Históricamente, la prueba de MAHR en ratones transgénicos es usada para probar proteínas individuales en ratones que son transgénicos para aquella proteína individual. En contraste, el método descrito anteriormente proporciona un modelo de animal no humano que reconoce toda la familia de proteínas humanas como "individual" y que puede ser usado para evaluar un gran número de proteínas variantes que son aptas cada una de actividades de enlace vastamente variadas y usos.
XIII. Equipos Equipos que comprenden los componentes necesarios en los métodos (comúnmente en una forma sin mezclar y componentes de equipos (materiales de empaque, instrucciones para usar los componentes y/o los métodos, uno o más recipientes (tubos de reacción, columnas, etc.)) para retener los componentes son un aspecto de la presente invención. Los equipos de la presente invención pueden contener una biblioteca de multímeros o un solo tipo de multímero. Los equipos pueden también incluir reactivos apropiados para promover el enlace de molécula objetivo, tales como soluciones reguladoras del pH o reactivos que facilitan la detección, en las que se incluyen moléculas marcadas detectablemente. Estándares para calibrar un enlace de ligando a un dominio de monómero o los semejantes, pueden también ser incluidos en los equipos de la invención. La presente invención también proporciona análisis de enlace comercialmente valiosos y equipos para llevar a la práctica los análisis. En algunos de los análisis de la invención, uno o más ligandos son usados para detectar el enlace de un dominio de monómero, inmuno-dominios y/o multímero. Tales análisis están basados en cualquier método conocido en el arte, por ejemplo citometría de flujo, microscopía fluorescente, resonancia de plasmón y los semejantes, para detectar el enlace de un (os) ligando (s) al dominio de monómero y/o multímero. También se proporcionan equipos basados en el análisis. Los equipos incluyen comúnmente un recipiente y uno o más ligandos. Los equipos comprenden opcionalmente instrucciones para efectuar los análisis, reactivos de detección adicionales, soluciones reguladoras del pH o instrucciones para el uso de cualquiera de estos componentes o los semejantes. Alternativamente, los equipos pueden incluir células, vectores (por ejemplo, vectores de expresión, vectores de secreción que comprenden un polipéptido de la invención) , para la expresión de un dominio de monómero y/o un multímero de la invención.
En un aspecto adicional, la presente invención proporciona el uso de cualquier composición, dominio de monómero, inmuno-dominio, multímero, célula, cultivo celular, aparato, componente de aparato o equipo en la presente, para la práctica de cualquier método o análisis de la presente y/o para el uso de cualquier aparato o equipo para llevar a la práctica cualquier análisis o método de la presente y/o para el uso de células, cultivos celulares, composiciones u otros aspectos en la presente como una formulación terapéutica. También se proporciona la manufactura de todos los componentes en la presente como formulaciones terapéuticas para los tratamientos descritos en la presente.
XIV. Sistemas integrados La presente invención proporciona computadoras, medios que se pueden leer por computadora y sistemas integrados que comprenden cadenas de caracteres correspondientes a dominios de monómero, dominios de monómero seleccionados, multímeros y/o multímeros seleccionados y ácidos nucleicos que codifican tales polipéptidos. Estas secuencias pueden ser manipuladas mediante métodos de recombinación in silico o mediante elementos de programación de alineación de secuencias o procesamiento de palabras estándar. Por ejemplo, diferentes tipos de similaridad y consideraciones de varia severidad y longitud de cadena de lí caracteres pueden ser detectados y reconocidos en los sistemas integrados de la presente. Por ejemplo, muchos métodos de determinación de homología han sido diseñados para el análisis comparativo de secuencias de biopolímeros, para verificación de escritura en el procesamiento de palabras y para recuperación de datos de varias bases de datos. Con el entendimiento de interacciones de complemento de par en par de doble hélice entre cuatro nucleobases principales en polinucleótidos naturales, modelos que estimulan el recocido de cadenas de polinucleótido homologas complementarias pueden también ser usados como base de alineación de secuencia u otras operaciones efectuadas comúnmente sobre las cadenas de caracteres correspondientes a las secuencias de la presente (por ejemplo, manipulaciones de procesamiento de palabras, construcción de figuras que comprenden cadenas de caracteres de secuencias o subsecuencia, tablas de resultados, etc.). Un ejemplo de un paquete de elementos de programación con GO para calcular similaridad de secuencia es BLAST, que puede ser adaptado a la presente invención al introducir cadenas de caracteres correspondientes a las secuencias en la presente. BLAST es descrito en Altschul et al, (1990) J. Mol. Biol. 215:403-410. Elementos de programación para efectuar análisis de BLAST están disponibles públicamente a través del Centro Nacional para Información de Biotecnología (disponible en la World Wide Web en ncbi.nlm.nih.gov). Este algoritmo involucra identificar primero pares de secuencia de alta puntuación (HSP) al identificar palabras cortas de longitud W en la secuencia de interrogación, que ya sea, coinciden o satisfacen alguna puntuación T de umbral de valor positivo cuando son alineadas con una palabra de la misma longitud en una secuencia de base de datos. T es denominada como el umbral de puntuación de palabra vecina (Altschul et al, supra) . Estos aciertos de palabra vecina inicial actúan como semillas para iniciar búsquedas para encontrar HSP más largas que las contienen. Los aciertos de palabras son luego extendidos en ambas direcciones a lo largo de cada secuencia en tanto que la puntuación de alineación acumulativa puede ser incrementada. Puntuaciones acumulativas son calculadas utilizando, para secuencias de nucleótidos, los parámetros M (puntuación hacia atrás para un par de residuos coincidentes, siempre >0) y N (puntuación de penalidad para residuos no coincidentes; siempre <0) . Para secuencias de aminoácido, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección son detenidos cuando: la puntuación de alineación acumulativa cae por la cantidad X de su valor obtenido máximo; la puntuación acumulativa va a cero o menor, debido a la acumulación de una o más alineaciones de residuos de puntuación negativa o se llega al final ya sea de una u otra secuencia. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y velocidad de la alineación. El programa BLASTN (para secuencias de nucleótido) utiliza como predeterminados una longitud de palabra (W) de 11, una esperanza (E) de 10, un corte de 100, M=5, N=-4 y una comparación de ambas hebras. Para secuencias de aminoácido, el programa BLASTP usa como predeterminados una longitud de palabra (W) de 3, una esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff (1989) Proc. Natl. Acad. Sci. USA 89:10915). Un ejemplo adicional de un algoritmo de alineación de secuencia útil es PILEUP. PILEUP crea una alineación de secuencia múltiple a partir de un grupo de secuencias relaciona utilizando alineaciones de par en par progresivas. Puede también trazar un árbol que muestra las relaciones de agrupación usadas para crear la alineación. PILEUP utiliza una simplificación del método de alineación progresiva de Feng & Doolittle, (1987) J. Mol. Evol. 35:351-360. El método usado es similares al método descrito por Higgins & Sharp, (1989) CABIOS 5:151-153. El programa puede alinear, por ejemplo, hasta 300 secuencias de una longitud máxima de 5,000 letras. El procedimiento de alineación múltiple comienza con la alineación de par en par de las dos secuencias más similares, produciendo un grupo de dos secuencias alineadas. Luego este grupo puede ser alineado con la siguiente secuencia más relacionada o grupos de secuencias alineadas. Dos grupos de secuencias pueden ser alineadas por una simple extensión de la alineación de par en par de dos secuencias individuales. La alineación final es obtenida por una serie de alineaciones de par en par progresivas. El programa puede también ser usado para trazar un dendograma o representación en árbol de relaciones de agrupación. El programa es ejecutado al diseñar secuencias específicas y sus coordenadas de aminoácidos o nucleótidos para regiones de comparación de secuencia. Por ejemplo, con el fin de determinar aminoácidos conservados en una familia de dominio de monómero o para comparar las secuencias de dominio de monómero en una familia, la secuencia de la invención o ácidos nucleicos de codificación, son alineados para proporcionar información de estructura- función. En un aspecto, se usa el sistema de computadora para efectuar recombinación de secuencia "in silico" o entremezcla de cadenas de caracteres correspondientes a los dominios de monómero. Una variedad de tales métodos son resumidos en "Methods For Making Character Strings, Polynucleotides & Polypeptides Having Desired Characteristics" por Selifonov and Stemmer, presentada el 5 de febrero de 1999 (USSN 60/118854) y "Methods For Making Character Strings, Polynucleotides & Polypeptides Having Desired Characteristics" por Selifonov and Stemmer, presentada el 12 de octubre de 1999 (USSN 09/416,375). En breve, se usan operadores genéticos en algoritmos genéticos para cambiar secuencias dadas, por ejemplo al limitar eventos genéticos tales como mutación, recombinación, muerte y los semejantes. Análisis multidimensionales para optimizar secuencias pueden también ser efectuados en el sistema de computadora, por ejemplo como se describe en la solicitud ? 375. Un sistema digital puede también instruir a un sintetizador de oligonucleótidos que sintetice oligonucleótidos, por ejemplo, usados para reconstrucción genética o recombinación o que ordene oligonucleótidos de fuentes comerciales (por ejemplo, al imprimir formas de pedido apropiadas o al enlazarse a una forma de pedido en internet) . El sistema digital puede también incluir elementos de salida para controlar la síntesis de ácido nucleico (por ejemplo, en base a una secuencia o una alineación de un recombinante, por ejemplo dominio de monómero recombinado en la presente), esto es, un sistema integrado de la invención incluyen opcionalmente un sintetizador de oligonucleótidos o un controlador de síntesis de oligonucleótidos. El sistema puede incluir otras operaciones que ocurren corriente abajo de una alineación u otra operación efectuada utilizando una cadena de caracteres correspondiente a una secuencia de la presente, por ejemplo como se indica anteriormente con referencia a los análisis .
EJEMPLOS Los siguientes ejemplos son ofrecidos para ilustrar, pero no para limitar la invención reivindicada.
Ejemplo 1 Este ejemplo describe la selección de dominios de monómero y la creación de multímeros. Los materiales de partida para identificar dominios de monómero y crear multímeros a partir de los dominios de monómero seleccionados y procedimientos pueden ser derivados de cualquiera de una variedad de secuencias humanas y/o no humanas. Por ejemplo, para producir un dominio de monómero seleccionado con enlace específico por un ligando o mezcla de ligandos deseados, uno o más gen (es) de dominio de monómero son seleccionados a partir de una familia de dominios de monómeros que se enlazan a un cierto ligando. Las secuencias de ácido nucleico que codifica el uno o más genes de dominio de monómero pueden ser obtenidos mediante amplificación de PCR de ADN genómico o cADN u opcionalmente, pueden ser producidos sintéticamente utilizando oligonucleótidos de superposición. Más comúnmente, estas secuencias son luego clonadas a un formato de despliegue de superficie celular (esto es, despliegue de superficie de célula bacteriana, levadura o mamífera (COS); despliegue de fago) para expresión y selección. Las secuencias recombinantes son transfectadas (transducidas o transformadas) a la célula huésped apropiada en donde son expresadas y desplegadas sobre la superficie celular. Por ejemplo, las células pueden ser teñidas con un ligando deseado marcado (por ejemplo, marcado fluorescentemente) . Las células teñidas son clasificadas mediante citometría de flujo y los dominios de monómero seleccionados que codifican genes son recuperados (por ejemplo, mediante aislamiento de plásmido, PCR o expansión y clonación) de las células positivas. El proceso de teñido y clasificación puede ser repetido múltiples veces (por ejemplo, utilizando concentraciones progresivamente decrecientes del ligando deseado hasta que se obtiene un nivel deseado de enriquecimiento) . Alternativamente, cualquier método de selección o detección conocido en el arte que puede ser usado para identificar células que se enlazan al ligando o mezclas de ligando deseados puede ser usado. Los genes que codifican el dominio de monómero seleccionado recuperados de las células de enlace de ligando mezcla de ligandos deseados pueden ser opcionalmente recombinados de acuerdo con cualquiera de los métodos descritos en la presente o en las referencias citadas. La secuencia recombinante producidas en esta ronda de diversificación son luego seleccionadas mediante el mismo método o un método diferente para identificar genes recombinantes con una afinidad mejorada por el ligando deseado o ligando objetivo. El proceso de diversificación y selección es repetido opcionalmente hasta que se obtiene una afinidad deseada. Los ácidos nucleicos del dominio de monómero seleccionado, seleccionados mediante los métodos pueden ser unidos conjuntamente vía una secuencia de enlazador para crear multímeros, por ejemplo mediante el ensamble combinacional de secuencias de ácido nucleico que codifican dominios de monómeros seleccionados mediante ligación de ADN u opcionalmente, reacciones de superposición de auto-cebado a base de PCR. Las secuencias de ácido nucleico que codifican los multímeros son luego clonadas a un formato de despliegue de superficie celular (esto es, despliegue de superficie de célula bacteriana, levadura o mamífera (COS) ,-despliegue de fago) para expresión y selección. Las secuencias recombinantes son transfectadas (transducidas o transformadas) a la célula huésped apropiada en donde son expresadas y desplegadas sobre la superficie celular. Por ejemplo, las células pueden ser teñidas con un ligando o mezcla de ligandos deseados marcados, por ejemplo marcados fluorescentemente. Las células teñidas son clasificadas mediante citometría de flujo y los genes que codifican multímeros seleccionados son recuperados (por ejemplo, mediante PCR o expansión y clonación) de las células positivas. Células positivas incluyen multímeros con una avidez o afinidad mejorada o especificidad alterada al ligando o mezcla de ligandos deseados en comparación con el (los) dominio (s) de monómero seleccionado (s) . El proceso de teñido y clasificación puede ser repetido múltiples veces (por ejemplo, utilizando concentraciones progresivamente decrecientes del ligando o mezcla de ligandos deseados hasta que se obtiene un nivel deseado de enriquecimiento) .
Alternativamente, cualquier método de selección o detección conocido en el arte puede ser usado para identificar células que se enlazan al ligando o mezcla de ligandos deseados. Los genes que codifican el multímero seleccionados recuperados de las células de enlace del ligando o mezcla de ligandos deseados pueden ser recombinados opcionalmente de acuerdo con cualquiera de los métodos descritos en la presente o en las referencias citadas, las secuencias recombinantes introducidas en esta ronda de diversificación son luego seleccionadas mediante el mismo método o un método diferente para identificar genes recombinantes con avidez o afinidad mejorada o especificidad alterada por el ligando deseado o ligando objetivo. El proceso de diversificación y selección es repetido opcionalmente hasta que se obtiene una avidez o afinidad deseada o especificidad alterada.
Ejemplo 2 Este ejemplo describe la selección de dominios de monómero que son capaces de enlazarse a albúmina de suero humanos (HSA) . Para la producción de fagos, células de DH10B de E. coli (Invitrogen) fueron transformadas con vectores de fago que codifican una biblioteca de variantes de dominio de clase A del receptor de LDL como fusiones a la proteína de fago pIII. Para transformar estas células, se usó el sistema de electroporación MicroPulser (Bio-Rad) junto con cubetas proporcionadas por el mismo fabricante. La solución de ADN fue mezclada con 100 µl de la suspensión celular, incubada sobre hielo y transferida a la cubeta (espacio de electrodo 1 mm) . Después de la pulsación 2 ml de medio de SOC (2% en volumen/peso de triptona), 0.5% de peso/volumen de extracto de levadura, NaCl 10 mM, MgS04 10 mM, MgCl2 10 mM) fueron agregados y la mezcla de transformación fue incubada a 37°C durante 1 hora. Múltiples transformaciones fueron combinadas y diluidas en 500 ml del medio 2xYT que contiene 20 µg/m de tetraciclina y CaCl2 2 mM. Con 10 electroporaciones utilizando un total de 10 µg de ADN ligado se obtuvieron 1.2xl08 clones independientes. 160 ml del cultivo, que contiene las células que fueron transformadas con los vectores de fago que codifican la biblioteca de fagos de variante de dominio A, fueron cultivados durante 24 h a 22 °C, 250 rpm y después de esto transferidas en tubos de centrifuga estériles. Las células fueron sedimentadas mediante centrifugación (15 minutos, 5000 g, 4°C) . El sobrenadante que contiene las partículas de fago fue mezclado con 1/5 volúmenes de PEG 8000 al 20% peso/volumen, NaCl 15% os peso/volumen y fue incubado por varias horas a 4°C. Después de centrifugación (20 minutos, 10000 g, 4°C) las partículas de fago precipitadas fueron disueltas en 2 ml de TBS frío (Tris 50 mM, NaCl 100 mM, pH 8.0) que contiene CaCl2 2 mM. La solución fue incubada sobre hielo durante 30 minutos y fue distribuida en dos recipientes de reacción de 1.5 ml . Después de la centrifugación para remover los componentes sin disolver (5 minutos, 18500 g, 4°C) los sobrenadantes fueron transferidos a un nuevo recipiente de reacción. Los fagos fueron reprecipitados al agregar 1/5 volúmenes de PEG 8000 al 20% peso/volumen, NaCl 15% peso/volumen e incubación durante 60 minutos sobre hielo. Después de la centrifugación (30 minutos, 18500 g, 4°C) y remoción de los sobrenadantes, las partículas de fago precipitadas fueron disueltas en un total de 1 ml de TBS que contiene CaCl2 2 mM. Después de incubación durante 30 minutos sobre hielo, la solución fue centrifugada como se describe anteriormente. El sobrenadante que contiene las partículas de fago fue usado directamente para el enriquecimiento de afinidad. El enriquecimiento de afinidad de fago fue efectuado utilizando cajas de 96 cavidades (Maxisorp, NUNC , Dinamarca) . Las cavidades individuales fueron recubiertas durante 12 horas a temperatura ambiente mediante incubación con 150 µl de una solución de 100 µg/ml de albúmina de suero humano (HSA, Sigma) en TBS. Los sitios de enlace remanentes después de la incubación con HSA fueron saturados mediante incubación con 250 µl de albúmina de suero bovino al 2% peso/volumen (BSA) en TBST (TBS con Tween 20 al 0.1% volumen/volumen) durante 2 horas a temperatura ambiente. Después de esto, 40 µl de la solución de fago, que contiene aproximadamente 5x1o11 partículas de fago, fueron mezclados con 80 µl de TBST que contiene BSA al 3% y CaCl2 2 mM durante 1 hora a temperatura ambiente. Con el fin de remover las partículas de fago que no se enlazan, las cavidades fueron lavadas 5 veces por 1 minuto utilizando 130 µl de TBST que contiene CaCl2 2 mM. Los fagos enlazados a la superficie de la cavidad fueron eluidos ya sea mediante incubación durante 15 minutos con 130 µl de glicina/HCl 0.1 M, pH 2.2 o de manera competitiva al agregar 130 µl de HSA 500 µg/ml en TBS. En el primer caso, el pH de la fracción de elución fue inmediatamente neutralizado después de la remoción de la cavidad al mezclar el eluido con 30 µl de Tris/HCl 1 M, pH 8.0. Para la amplificación de fago, el eluido fue usado para infectar células K91BluKan E. coli (F+) . 50 µl de la solución de fago eluida fueron mezclados con 50 µl de una preparación de células e incubados durante 10 minutos a temperatura ambiente. Después de esto, 20 ml de medio de LB que contiene 20 µg/ml de tetraciclina fueron agregados y las células infectadas fueron cultivadas durante 36 h a 22 °C, 250 rpm. Después de esto, las fueron sedimentadas (10 minutos, 5000 g, 4°C) . Los fagos fueron recuperados del sobrenadante mediante precipitación como se describe anteriormente. Para el enriquecimiento de afinidad repetido de partículas de fago, se uso el mismo procedimiento como se describe en este ejemplo. Después de dos rondas subsecuentes, de toma panorámica contra HSA, colonias aleatorias fueron recolectadas y probadas en cuando a sus propiedades de enlace contra la proteína objetivo utilizada . En tanto que este ejemplo demuestra el uso de dominios de receptor de LDL, aquellos de habilidad en el arte apreciarán que las mismas técnicas pueden se usadas para generar propiedades de enlace deseadas en dominios de monómero de la presente invención.
Ejemplo 3 Este ejemplo describe la determinación de actividad biológica de dominios de monómero que son aptos de enlazarse a HSA. Con el fin de mostrar la habilidad de un dominio de enlace de HSA para prolongar la vida media en el suero de una proteína in vivo, se llevó a cabo el siguiente montaje experimental. Un dominio A multimérico, que consiste de un dominio A que fue desarrollado para enlace de HSA (véase ejemplo 2) y un dominio A de enlace de estreptavidina fue comparado con el dominio A de enlace de estreptavidina mismo, las proteínas fueron inyectadas a ratones, los cuales fueron ya sea cargados o sin cargar (como control) con albúmina de suero humanos (HSA) . Los niveles en el suero de proteínas de dominio A fueron verificados. Por consiguiente, un dominio A, que fue desarrollo para enlace de HSA (véase ejemplo 1) fue fusionado a nivel genético con uno multímero de dominio A de enlace de estreptavidina utilizando métodos de biología molecular estándar (véase Maniatis et al.). El constructo genético resultante, que codifica para un multímero de dominio A también como una etiqueta de hexahistidina y HA, fueron usados para producir proteína en E. coli. Después del repliegue y purificación moderada por etiqueta de afinidad, las proteínas fueron sometidas a diálisis varias veces contra NaCl 150 mM, Tris 5 mM, pH 8.0, CaCl2 100 µM y filtrados estériles (0.45 µM) . Dos conjuntos de experimentos de animales fueron efectuados. En un primer conjunto, 1 ml de cada solución de proteína preparada con una concentración de 2.6 µM fueron inyectadas a la vena de cola de ratones separados y muestras de suero fueron tomadas 2, 5 y 10 minutos después de la inyección. En un segundo conjunto, la solución de proteína descrita anteriormente fue complementada con 50 mg/ml de albúmina de suero humano. Como se describe anteriormente, 1 ml de cada solución fue inyectado por animal . En el caso del dímero de dominio A de enlace de estreptavidina inyectado, muestras de suero fueron tomadas 2, 5 y 10 minutos después de la inyección, en tanto que en el caso del trímero, muestras de suero fueron tomadas después de 10, 30 y 120 minutos. Todos los experimentos fueron efectuados como duplicados y los animales individuales fueron analizados por punto en el tiempo. Con el fin de detectar los niveles en el suero de dominios A en las muestras de suero, se llevó a cabo un análisis inmunoabsorbente enlazado a enzima (ELISA) . Por consiguiente, cavidades de una caja de microtítulo de 96 cavidades maxisorp (NUNC , Dinamarca) fueron recubiertas con cada uno de 1 µg de anticuerpo anti-His6 en TBS que contiene CaCl2 2 mM durante 1 h a 4°C. Después del bloqueo de los sitios de enlace restantes con solución de caseína (Sigma) durante 1 hora, las cavidades fueron lavadas tres veces con TBS que contiene Tween al 0.1% y CaCl2 2 mM. Diluciones de concentración seriales de las muestras de suero fueron preparadas e incubadas en las cavidades durante 2 horas, con el fin de capturar las proteínas de dominio A. Después del lavado como antes, el anticuerpo anti-HA-etiqueta acoplado a peroxidasa de rábano (HRP) (Roche Diagnostics, 25 µg/ml) fue agregada e incubada durante 2 h. Después de lavado como se describe anteriormente, sustrato de HRP (Pierce) fue agregado la reacción de detección desarrollada de acuerdo con las instrucciones del fabricante. La absorción de luz, que refleja la cantidad de proteína de dominio A presente en las muestras de suero, fue medida a una longitud de onda de 450 nm. Los valores obtenidos fueron normalizados y graficados contra una escala de tiempo. La evaluación de los valores obtenidos mostró una vida media en el suero para el dominio A de enlace de estreptavidina de aproximadamente 4 minutos sin presencia de HSA respectivamente 5.2 minutos cuando el +++-. animal fue cargado con HSA. El trímero de dominios A, que contenía el dominio A de enlace de HSA, exhibía una vida media en el suero de 6.3 minutos sin la presencia de HSA por una vida media sustancialmente incrementada de 38 minutos cuando HSA estaba presente en el animal. Esto indica claramente que el dominio A de enlace de HSA puede ser usado como socio de fusión para incrementar la vida media en el suero de cualquier proteína, incluyendo terapéuticos de proteína.
Ejemplo 4 Este ejemplo describe experimentos que demuestran la extensión de la vida media de proteínas en la sangre. Para demostrar adicionalmente que la vida media en la sangre de proteínas puede ser prolongada utilizando dominios de monómero de la invención, proteínas de dominio de monómero individual seleccionadas contra albúmina de suero de chango, albúmina suero humano, IgG humanos y células de sangre roja humana fueron agregadas alícuotas de sangre entera, sangre humana heparinizada o sangre de chango. La siguiente lista proporciona secuencias de dominios de monómero analizados en este ejemplo.
IG156 |LSSEFQ|QSSGR|IPLAWV|DGDND|RDDSDEKS|KPRT RBCA |RSSQFQ|NDSRAPGRWRÍDGDN[D|QDGSDETG|GDSHILPFSTPGPST RBCB |PAGEFP|KNG(^PVTWI1DGVND|LDGSDEKG^RPGPGATSAPAA RBCII 1PPDEFP|KNG^IPQD L|DGVN8LDGSDEK[)|GRPGPGATSAPAA CSA-A8 ÍGAGQFE KNGHÍLPLNLLIDGVNCÍEDNSDEPSELÍKA T Alícuotas de sangre que contienen proteína de monómero fueron luego agregadas a bolsas de diálisis individuales (25,000 MWCO), selladas y agitadas en 4 litros de solución salina de pH regulado con Tris a temperatura ambiente durante toda la noche. El anticuerpo anti-6xHis fue inmovilizado mediante interacción hidrofóbica a una caja de 96 cavidades (Nunc) . Diluciones seriales de suero de cada muestra de sangre fueron incubadas con el anticuerpo inmovilizado durante 3 horas. Las cajas fueron lavadas para remover la proteína sin enlazar y probadas con a-HA-HRP para detectar el monómero. Los monómeros identificados por tener vidas medias largas en experimentos de diálisis fueron construidos para contener ya sea una etiqueta de HA, FLAG, etiqueta E o etiqueta de epítopo myc. Cuatro monómeros fueron acumulados, que contienen una proteína para cada etiqueta, para fabricar dos acumulaciones . Un chango fue inyectado subcutáneamente por acumulación, a una dosis de 0.25 mg/kg/monómero en un volumen total de 2.5 mL en solución salina. Muestras de sangre fueron extraídas a 24, 48, 96 y 120 horas. El anticuerpo anti-6xHis fue inmovilizado mediante interacción hidrofóbica a una caja de 96 cavidades (Nunc) . Diluciones seriales de suero de cada muestra de sangre fueron incubadas con el anticuerpo inmovilizado durante 3 horas. Las placas fueron lavadas para remover la proteína sin enlazar y probadas separadamente con a- HA-HRP, a-FLAG-HRP, a-ETag-HRP, y a-myc-HRP para detectar el monómero . Lo siguiente ilustra una comparación entre anticuerpos comerciales y un multímero anti-IgG: Ejemplo 5 Este ejemplo describe el desarrollo de dominios de monómero específicos de proteína y dímeros mediante "ambulante" .
Una biblioteca de secuencias de ADN que codifican dominios monoméricos es creada mediante PCR de ensamble como se describe en Stemmer et al., Gene 164:49-53 (1995). Fragmentos de PCR fueron digeridos con enzimas de restricción apropiadas {por ejemplo, Xmal y Sfil) . Los productos de digestión fueron separados sobre gel de agarosa al 3% y los fragmentos de dominio son purificados del gel. Fragmentos de ADN son ligados a los sitios de restricción correspondientes del vector de despliegue de fago ++++ fuse5-HA, un derivado de fuse5 que porta un epítopo de HA en cuadro. La mezcla de ligación es sometida a electroforesis a células de E. coli electrocompetentes TransforMax™ EC 100™. Las células de E. coli transformadas son cultivas durante toda la noche a 37°C en un medio 2xYT que contiene 20 µg/ml de tetraciclina y CaCl2 2 mM. Las partículas de fago son purificadas del medio de cultivo mediante precipitación de PEG. Las cavidades individuales de una caja de microtítulo de 96 cavidades (Maxisorp) son recubiertas con proteína objetivo (1 µg/cavidad) en NaHC03 0.1 M. Después de bloquear las cavidades, con solución reguladora del pH TBS que contiene 10 mg/ml de caseína, el fago purificado es agregado a un número típico de -1-3 x 1011. La caja de microtítulos es incubada a 4°C durante 4 horas, lavadas 5 veces con solución reguladora del de pH lavado (TBS/Tween) y los fagos enlazados son eluidos al agregar solución reguladora del pH de glicina-HCl, pH 2.2. El eluido es neutralizado al agregar Tris-HCl 1 M (pH 9.1) . El fago eluido es amplificado utilizando células K91BlueKan de E. coli y después de la purificación usado como entrada a una segunda y una tercera ronda de selección de afinidad (repitiendo las etapas anteriores) . El fago del eluido final es usado directamente, sin purificación adicional, como plantilla a secuencias de ADN que codifican dominio de amplificación de PCR. Los productos de PCR son purificados y subsecuentemente sometidos a digestión con enzimas de restricción apropiadas (por ejemplo, 50% con Bpml y 50% con BsrDI) . Los fragmentos de monómero sometidos a digestión son "encaminados" a dímeros al anexar una biblioteca de fragmentos de dominio natural utilizando ligación de ADN. Secuencias de dominio natural son obtenidas mediante amplificación de PCR de la biblioteca de dominio inicial (resultante de la etapa de purificación de PEG descrita anteriormente) utilizando cebadores apropiados para amplificar los dominios. Los fragmentos de PCR son purificados, divididos en dos cantidades iguales y luego sometidos a digestión con enzimas de restricción apropiadas (por ejemplo, ya sea Bpml o BsrDI) . Los productos de digestión son separados sobre un gel de agarosa 2% y los fragmentos de dominio fueron purificados del gel. Los fragmentos purificados son combinados en 2 acumulaciones separadas (por ejemplo, natural/Bpml + seleccionado/BsrDI & natural/BsrDI + seleccionado/Bpml) y luego ligados durante toda la noche a 16 °C. Los fragmentos de dominio diméricos son amplificados mediante PCR (5 ciclos) , sometidos a digestión con enzimas de restricción apropiadas (por ejemplo, Xmal y Sfil) y purificados de un gel de agarosa al 2%. Las etapas de selección son repetidas como se describe anteriormente excepto por el lavado, que se hace más severamente para obtener aglutinantes de alta afinidad. Después de la infección, células K91BlueKan son depositadas sobre cajas de agar 2xYT que contienen 40 µg/ml de tetraciclina y cultivadas durante toda la noche. Colonias individuales son recolectadas y cultivadas durante toda la noche en medio de 2xYT que contiene 20 µg/ml de tetraciclina y CaCl2 2 mM. Las partículas de fago son purificadas de estos cultivos . El enlace de los clones de fago individuales a sus proteínas objetivo fue analizado mediante ELISA. Los clones que producen las señales de ELISA más altas fueron secuenciados y reclonados subsecuentemente a un vector de expresión de proteína . La producción de proteína es inducida en los vectores de expresión con IPTG y purificadas mediante cromatografía de afinidad de quelato de metal. Los monómeros específicos de proteína son caracterizados como sigue. B i acore Doscientos cincuenta RU de proteína son inmovilizadas mediante acoplamiento de NHS/EDC a un chip de CM5 (Biacore) . Soluciones de 0.5 y 5 µM de proteína de monómero se hacen fluir sobre el chip derivado y los datos son analizados utilizando el paquete de elementos de programación Biacore estándar. ELISA Diez nanogramos de proteína por cavidad son inmovilizados mediante interacción hidrofóbica a cajas de 96 cavidades (Nunc) . Las cajas fueron bloqueadas con 5 mg/mL de caseína. Diluciones seriales de proteína de monómero fueron agregadas a cada cavidad e incubadas durante 3 horas. Las cajas fueron lavadas para remover la proteína sin enlazar y probadas con a-HA-HRP para detectar monómeros.
Análisis funcionales Análisis funcionales para determinar la actividad biológica de los monómeros también se pueden efectuar e incluyen, por ejemplo, análisis para determinar la especificidad de enlace de los monómeros, análisis para determinar si los monómeros antagonizan o estimulan una ruta metabólica mediante enlace a su molécula objetivo y los semejantes .
Ejemplo 6 Este ejemplo describe la recombinación intra-proteína in vivo para generar bibliotecas de mayor diversidad. Un vector de plásmido que codifica monómero (vector pCK-derivado, véase a continuación) , flanqueado por sitios de loxP ortólogos, fue recombinado de manera Cre-dependiente con un vector de fago vía sus sitios de loxP compatibles. Los vectores de fago recombinantes fueron detectados mediante PCR utilizando cebadores específicos para el constructo recombinante. La secuenciación de ADN indicó que el producto recombinante correcto fue generado.
Reactivos y procedimientos experimentales pCK- cre-lox-Mb-loxP . Este vector tiene dos aspectos particularmente relevantes. En primer lugar, porta el gen cre, que codifica la recombinasa de ADN específica del sitio Cre, bajo el control de P?a • Cre fue amplificado por PCR de p705-cre (de GeneBridges) con cebadores ere-específicos que incorporaron Xbal (5') y SflI (3 ' ) en los extremos del producto de PCR. Este producto fue sometido a digestión con Xbal y Sfil y clonado a los sitios indicados de pCK, un bla~ , derivado de CmR de pCK110919-HC-Bla (pACYC ori) , produciendo pCK-cre. El segundo aspecto es la biblioteca de dominio A natural flanqueada por dos sitios loxP ortólogos, loxP (tipo silvestre) y loxP(FAS) , que son requeridos para la recombinación de ADN específica del sitio catalizada por Cre. Véase, por ejemplo, Siegel, R. W. , et al, FEBS Letters 505:467-473 (2001) . Estos sitios raramente se recombinan entre sí. Sitios loxP fueron integrados a pCK- cre secuencialmente. Oligonucleótidos 5' -fosforilados loxP(K) y loxP(K_rc), que portan salientes de loxP (WT) y EcoRI y HiríDIII -compatibles para permitir la ligación a EcoJ.1 y HinDI11 -digeridos fueron hibridizados conjuntamente y ligados a pCK- cre en una reacción de ligación estándar (T4 ligasa; durante toda la noche a 16°C) . El plásmido resultante fue sometido a digestión con EcoRI y Sphl y ligado a los oligos 5 ' -fosforilados hibridizados loxP(L) y loxP(L_rc), que portan salientes de loxP(FAS) y EcoRI y Sphl -compatibles . Para preparar la construcción de bibliotecas, una purificación a gran escala (Qiagen MAXI prep) de pCK-cre-lox-P (wt) -loxP (FAS) fue efectuada de acuerdo con protocolo de Qiagen. El plásmido Qiagen-purificado fue sometido a centrifugación de gradiente de CsCl para purificación adicional. Luego este constructo fue sometido a digestión con Sphl y Bglll y ligado a inserto de biblioteca de dominio A natural digerido, que fue obtenido vía una amplificación de PCR de una acumulación de biblioteca de dominio A pre-existente. Por diseño, los sitios loxP y Mb están en cuadro, que genera Mbs con enlazadores loxP-codificados . Esta biblioteca fue utilizada en el procedimiento de recombinación in vivo como se detalla posteriormente en la presente.
Vector fUSE5HA-Mb-lox-lox. El vector es un derivado de fUSE5 de George Smith's laboratory (universidad de Missouri) . Fue modificado subsecuentemente para portar una etiqueta de HA para análisis de inmunodetección. Sitios de loxP fueron integrados a ÍUSE5HA secuencialmente. Oligos 5'-fosforilados loxP(I) y loxP(I)_rc, que portan loxP(WT), una cadena de codones de retención y salientes de Xmal y Sfi l -compatibles, fueron hibridizados conjuntamente y ligados a Xmal y Sfi l , en una reacción de ligación estándar (New England Biolabs T4 ligasa; durante toda la noche a 16°C) . El vector de fago resultante fue enseguida sometido a digestión con Xmal y Sphl y ligado a los oligos hibridizados loxP(J) y loxP(J)_rc, que portan loxP (FAS) y salientes compatibles con Xmal y Sphl . Este constructo fue sometido a digestión con Xmal / Sfil y luego ligado a un inserto de biblioteca de dominio A natural de (Xmal / Sfil ) pre-cortado (producto de PCR) . Los codones de retención están localizados entre los sitios loxP, impidiendo la expresión de gilí y consecuentemente la producción de fago infeccioso. El vector/biblioteca ligado fue transformado subsecuentemente a un huésped de E. coli que porta un plásmido que expresa gilí, que permite el rescate del fago fUSE5HA-Mb-lox-lox, como se detalla posteriormente en la presente. pCK-g XT. Este plásmido porta gilí bajo el control de su promotor natural. Fue construido mediante amplificación de PCR gJJT y su promotor del fago auxiliar VCSM13 (Stratagene) con cebadores gIIIPromotor_EcoRI y gIIIPromotor_HinDIII . Este producto fue sometido a digestión con Ecoi.1 y Hi__DI I I y clonado a los mismos sitios de pCK110919-?C-Bla . Ya que gilí está bajo el control de su propio promotor, la expresión de gilí es supuestamente constitutiva. pCK-gJJI fue transformado a E. coli EC1000 (Epicentre) . Procedimiento de recombinación in vivo. En resumen, el procedimiento involucra las siguientes etapas clave: (a) Producción de infectiva (esto es, rescate) de biblioteca de fUSE5HA-Mb-lox-lox con un huésped de E. coli que expresa gilí a partir de un plásmido; (b) Clonación de una segunda biblioteca (pCK) y transformación a F+ TGl E. coli; (c) Infección del cultivo que porta la segunda biblioteca con la biblioteca de fago fUSE5HA-Mb-lox-lox rescatada. a. Rescate del vector de fago . Células electrocompetentes que portan pCK-gJJI fueron preparadas mediante un protocolo estándar. Estas células tenían una frecuencia de transformación de 4 x 108/µg de ADN y fueron sometidas a electroporesis con ligaciones a gran escala (~5 µg ADN vector) del vector fUSE5HA-lox-lox y el inserto de biblioteca de dominio A natural. Después de electroporaciones individuales (100 ng de ADN/electroporación) con -70 µL células/cubeta, 930 µL de medio de SOC caliente fueron agregados y se permite que las células se recuperen con agitación a 37°C durante 1 hora. Enseguida, se agrega tetraciclina a una concentración final de 0.2 µg/mL y las células fueron agitadas durante -45 minutos a 37°C. Una alícuota de este cultivo fue removida, diluida serialmente 10 veces y depositada para determinar el tamaño de biblioteca resultante (1.8 x 107) . El cultivo remanente fue diluido a 2 x 500 mL de 2xYT (con 20 µg/mL cloranfenicol y 20 µg/mL de tetraciclina para seleccionar por pCK-gJJI y el vector a base de ÍUSE5HA, respectivamente) y cultivados durante toda la noche a 30°C. Los fagos rescatados fueron cosechados utilizando un protocolo de precipitación de PEG/NaCl estándar. El título fue aproximadamente 1 x 1012 unidades de transducción/mL. i?. Clonación de la segunda biblioteca y transformación a un huésped de E. coli . El pCK ligado/biblioteca de dominio A natural es sometido a electroporesis a un huésped bacteriano F+ con un tamaño de biblioteca esperado de aproximadamente 108. Después de un período de recuperación largo de una hora a 37°C con agitación, las células sometidas a electroporesis son diluidas a OD60o~0.05 en 2xYT (más 20 µg/mL de cloranfenicol) y cultivadas a fase logarítmica media a 37°C antes de infección por fUSEHA-Mb-lox-lox. c Infección del cul tivo que porta la segunda biblioteca con la biblioteca de fago fUSE5HA-Mb-lox-lox rescatada . Para maximizar la generación de recombinantes, una alta velocidad de infección (> 50%) de E. coli dentro de un cultivo es deseable. La infectividad de de E. coli depende de un número de factores, en los que se incluyen la expresión del pilo F y condiciones de cultivo. Fondos de E. coli TGl (que porta un F' ) y K91 (una cepa Hfr) fueron huéspedes para el sistema de recombinación.
Oligonucleótidos: loxP( ) [P-5' agcttataacttcgtatagaaaggtatatacgaagttatagatctcgtgctgcatgcggtgcg] loxP(K_rc) [P-5 ' aattcgcaccgcatgcagcacgagatctataacttcgtatatacctttctatacgaagttataagct] loxP(L) [P-5* ataacttcgtatagcatacattatacgaagttatcgag] loxP (L_rc) [P-5' ctcgataacttcgtataaigtatgctatacgaagttatg] loxP(I) [P5'ccgggagcagggcatgctaagtgagtaataagtgagíaaataacttcgtatatac«tttctatacgaagtta?cg ctg] lo__P(I _?: [P-5* acgataacttcgtatagaaaggtatatacgaagttat actcacttattactcacttagcatgccctgctc] loxP<J) [5' ccgggaccagtggcctctggggccataacttcgtatagcatacattatacgaagttatg] loxP(J)_re [ 5 ' cataacttcgtataatgtatgctatacgaagttatggccccagaggccactggtc] gIIIProtaoter_EcoRI [5' atggcgaattctcat gtcggcgcaactat gIIIPromoter_Hip DIlI [5' gataagctttcattaagactccttattacgcag] Ejemplo 7 Este ejemplo describe la optimización de multímeros al optimizar monómeros y/o enlazadores en cuando a enlace a un objetivo. La figura 8 ilustra un procedimiento para optimizar el enlace del multímero a objetivo, como se ejemplifica con un multímero trimérico. En la figura, en primer lugar, una biblioteca de monómeros es sometida a toma panorámica para enlace al objetivo (por ejemplo BAFF) . Sin embargo, algunos de los monómeros pueden enlazar en sitios sobre el objetivo que están bastantes alojados entre sí, de tal manera que los dominios que se enlazan a estos sitios no pueden ser conectados mediante un péptido enlazador. Por consiguiente es útil crear un seleccionar una biblioteca grande de homo- o heterotrímeros a partir de estos monómeros antes de la optimización de los monómeros. Estas bibliotecas de trímero pueden ser seleccionadas, por ejemplo sobre fago (típico para heterotrímeros creados a partir de una gran acumulación de monómeros) o fabricadas y analistas separadamente (por ejemplo, para homotrimeros) . Mediante este método, el mejor trímero es identificado. Los análisis pueden incluir análisis de enlace a un objetivo o agonista o determinación de potencia de antagonista del multímero en análisis de proteína o a base de célula funcionales. El (los) dominio (s) monomérico (s) del mejor trímero individual son luego optimizados como una segunda etapa. Los homomuítímeros son más fáciles de optimizar, puesto que solamente existe una secuencia de dominio, aunque los heteromultímeros pueden también ser sintetizados. Para homomuítímeros, un incremento en el enlace por el multímero en comparación con el monómero es un efecto de avidez. Después de la optimización de la secuencia de dominio misma (por ejemplo, mediante recombinación o aleatorización de NNK) y toma panorámica de fago, los monómeros mejorados son usados para construir un dímero con una biblioteca de enlazador. Bibliotecas de enlazador pueden ser formadas, por ejemplo, a partir de enlazadores con una composición de NNK y/o longitud de secuencia variable. Después de la toma panorámica de esta biblioteca de enlazador, los mejores clones (por ejemplo, determinados mediante potencia en la inhibición u otro análisis funcional) son convertidos a multímeros compuestos de múltiples dominios de secuencia optimizada (por ejemplo dos, tres, cuatro, cinco, seis, siete, ocho, etc.) y enlazadores optimizados por longitud y secuencia. Para demostrar este método, un multímero es optimizado para enlace a BAFF. El clon de enlace de BAFF, anti-BAFF 2 , se enlaza con BAFF con afinidad casi igual como un trímero o como un monómero. Las secuencias de enlazador que separan los monómeros dentro del trímero son de cuatro aminoácidos de longitud, que es inusualmente corta. Se propuso que la expansión de la longitud del enlazador entre monómeros permitirá múltiples contactos de enlace de cada monómero en el trímero, mejorando extensamente la afinidad del trímero en comparación con la molécula de monómero. Para probar esto, bibliotecas de secuencia de enlazador son creadas entre dos monómeros, creando moléculas de dímero de afinidad potencialmente más alta. Luego la porción de enlazador óptima identificada es usada para crear una molécula de enlace de BAFF de trímero de afinidad potencialmente aún más alta . Estas bibliotecas consisten de codones aleatorios, NNK, que varían en longitud de 4 a 18 aminoácidos. Los oligonucleótidos enlazadores para estas bibliotecas son: 1. S^AAAACTGCAATGACNNMN WMWAC^^ 2. 5*-AAAACTGCAATGACNNMNNMNNMNNM ^^ 3. 5'-,AAAACTGCAATGAC WMNNMNN^^ 4. 5,AAAACTGCAATGAC>?^MNNMNNMN^M^^^ CTGCTTC ATCCG A-3 ' GCCGGCTTCATCCGA^' 6. S'-AAAACTGCAATGACNNMNNMN Mh^ MNNMNNACAGCCTGCTTCATCCGA-3' 7. 5^AAAACTOCAATGAOWMNNMNNMN MN^^ NMN ttlNNMNNACAGCCTGCTTCATCCGA-3' 8. 5*-AAAACp X;AATGAClWMNNMhp^ MN MNNMNNM MNNACAGCCGGCTTCATCCGA-3' Bibliotecas de estas secuencias son creadas mediante PCR. Un cebador genérico, Sfil (5 ' -TCAACAGTTTCGGCCCCAGA-3 ' ) , es usado con los oligonucleótidos de enlazador en una PCR con el clon anti-BAFF2 como plantilla. Los productos de PCR son purificados con columnas Qiaquick de Qiagen y luego sometidos a digestión con BsrDI . El clon anti-BAFF 2 original es sometido a digestión con Bpml . Estos digestos son purificados con columnas de Qiaquick de Qiagen y ligados conjuntamente. La ligación es amplificadas por 10 ciclos de PCR con el cebador Sfil y el cebador Bpml (5 ' -ATGCCCCGGGTCTGGAGGCGT-3 ' ) . Después de purificación con columnas Qiaquick de Qiagen, los ADN son sometidos a digestión con Xmal y Sfil. Productos de digestión son separados sobre gel de agarosa 3% y los fragmentos de dominio BAFF diméricos son purificados del gel. Los fragmentos de ADN son ligados a los sitios de restricción correspondientes del vector de despliegue de fago fuse5-HA, un derivado de fuse5 que porta un epítopo de HA en cuadro. La mezcla de ligación es sometida a electroporesis en células de E. coli electrocompetentes TransforMax™ EC 100™. Células de E. coli. Transformadas son cultivadas durante todo a noche a 37°C en un medio de 2xYT que contiene 20 µg/ml de tetraciclina. Las partículas de fago son purificadas del medio de cultivo mediante precipitación de PEG y utilizadas para la toma panorámica .
Ejemplo 8 Este ejemplo describe la recombinación intra-dominio para identificar dominios de monómero con función mejorada.
Secuencias de monómero fueron generadas mediante varias etapas de toma panorámica y una etapa de recombinación para identificar monómeros que se enlazan ya sea al ligando CD40 o albúmina de suero humano. CD40L y HSA fueron sometidos a toma panorámica contra tres diferentes bibliotecas de fago de dominio A. Después de dos rondas de toma panorámica, las acumulaciones de fago eluidas fueron amplificadas por PCR con dos conjuntos de oligonucleótidos para producir dos fragmentos traslapantes. Los dos fragmentos fueron luego fusionados conjuntamente y clonados al vector fagémido, pID, para fusionar los productos de recombinación de dos fragmentos. Luego las bibliotecas recombinadas (de tamaño 1010 cada una) fueron sometidas a tomas panorámicas dos rondas contra objetivos de CD40L y HSA utilizando toma panorámica de solución y captura de perla magnética de estreptavidina. Luego las acumulaciones de fagémido seleccionadas fueron reclonadas al vector de expresión de proteína pET, un vector impulsado por T7 polimerasa, para la alta expresión de proteína. Casi 1400 clones fueron seleccionados para monómeros de enlace anti-CD40L mediante ELISA estándar y aproximadamente 2000 clones fueron seleccionados para HSA. Todos los clones fueron de secuencias únicas. Cavidades de caja de ELISA fueron recubiertas con 0.2 µg de CD40L o 0.5 µg de HSA y 5 µl del lisado del clon de expresión de monómero fueron aplicados a cada cavidad. Los monómeros enlazados (los cuales fueron producidos como una fusión de hemaglutinina (HA) ) fueron luego detectados mediante anticuerpo anti-HA-HRP conjugado, desarrollados mediante actividad de enzima de peroxidasa de rábano y leídas a una OD de 450 nm. Los clones positivos fueron seleccionados al comparar la lectura de ELISA con el trímero existente anti-CD40L 2.2 y fueron seleccionados y secuenciados con el cebador T7. Para las muestras de anti-CD40L, dos clones anti-CD40L 2.2Ig fueron cultivados en la misma caja como los clones de monómero seleccionados y procesados lado a lado como el control positivo. Dos clones de vector de pET vacíos transformados fueron cultivados y procesados como controles negativos. La lectura de ELISA a OD 450 y las secuencias de clon correspondientes son mostradas . Los mismos procesos de selección y filtración se aplican a HSA. El monómero de anti-HSA y trímero existentes fueron usados como controles positivos. El vector de pET vacío fue usado como controles negativos. Aglutinantes positivos fueron seleccionados como aquellos con una señal de ELISA igual o mejor que el trímero anti-HSA. La proporción positiva de cones con OD450 mayor o igual al enlace de anti-CD40L 2.2Ig fue de aproximadamente 0.7% para CD40L y 0.4% para HSA. Las secuencias identificadas son enlistadas a continuación : Clones positivos anti - CD40L después de recombinación de 2 f ragmentos y toma panorámica de solución pmA2_84 CRPNQFT CGNGH CLPRTWL CDGVPD CQDSSDETPIP CKSSVPTSLQ A5C1 CQSSQFR CRDNST CLPLRLR CDGVND CRDGSDESPAL CGRPGPGATSAPAASLQ pmA2_18 CPADQFQ CKNGS CIPRPLR CDGVED CADGSDEGQD CGRPGPGATSAPAASLQ pp&5_79 CARDGEFR CAMNGR CI PSSWV CDGEDD CGDGSDESQVY CGGGGSLQ A2F10 CLPSQFP CQNSSI CVPPALV CDGDAD CGDDSDEAS CAPPGSLSLQ A1E9 CAPGEFT CGNGH CLSRALR CDGDDG CLDNSDEKN CPQRTSLQ pmAl l_40 CLANECT CDSGR CLPLPLV CDGVPD CEDDSDEKN CTKPTSLQ Clones positivos ant i -HSA después de recombinación y toma panorámica de solución A5B 10 CRPSQFR CGSG CIPQPWG CDGVPD CEDNSDETD CKTPVRTSLQ A5 2 68 CPASQFR CENGH CV PEWL CDGVDD CQDDSDESSAT CQPRTSLQ A5 8~93 CAPGQFR CRNYGT CISLRWG CDGVND CGGKSSDEQN CTPHTSLQ Al 4 CLANQFK CESGH CLPPALV CDGVDD CQDSSDEASAN C Al 34 CNPTGKFK CRSGR CVPRESCR CDGVDD CEDNSDEKD CQPHTSLQ A2 10 CESSEFQ CENGH CLPVPWL CDGVND CADGSDEKN CPKPTSLQ En tanto que este ej emplo demuestra el uso de dominios de receptor A de LDL , aquel los de habil idad en el arte apreciarán que las mismas técnicas pueden ser usadas para generar propiedades de enlace deseadas en dominios de monómero de la presente invención .
Ej emplo 9 Este ejemplo describe un método ejemplar para el diseño y análisis de bibliotecas que comprenden monómeros que comprenden solamente residuos observados en dominios naturales en cualquier posición de secuencia dada. Para este fin, una alineación de secuencia de todos los dominios naturales de una familia dada es construida. Puesto que los residuos de cisteína tienden a ser el aspecto más conservado de la alineación, estos residuos son usados como guía para el diseño adicional . Cada estiramiento de secuencia entre dos cisteínas es considerado separadamente para tomar en cuenta la variabilidad estructural debido a variaciones de longitud. Para cada secuencia de inter-cisteína, un histograma de longitudes es construido. Las longitudes observadas a aproximadamente 10% o mayor frecuencia en dominios conocidos son consideradas para uso en el diseño de biblioteca. Una alineación separada de secuencias es construida para cada longitud y los aminoácidos que ocurren a mayor de aproximadamente 5% a una posición dada en la sub-alineación son permitidos en el diseño de biblioteca final para aquella longitud. Este proceso es repetido para cada segmento de secuencia de inter-cisteína para generar el diseño de biblioteca final. Oligonucleótidos con codones degenerados diseñados para expresar óptimamente la diversidad de proteína deseada son luego sintetizados y ensamblados usando métodos estándar para crear la biblioteca final. Comúnmente, cuatro conjuntos de oligonucleótidos que se traslapan son diseñados con una superposición de 9 bases entre los conjuntos 1 y 2, conjuntos 2 y 3, también como conjuntos 3 y 4 para el ensamble de PCR. En algunos casos, dos conjuntos de oligonucleótidos superpuestos son diseñados con una superposición de 9 bases entre los dos conjuntos. Las bibliotecas son construidas con el siguiente protocolo: Oligonucleótidos : una solución de trabajo 10 µM de cada oligonucleótido es preparada. Cantidades molares iguales de oligos para cada conjunto son mezcladas (conjuntos 1, 2, 3 y 4) . Los oligonucleótidos son ensamblados en dos etapas de ensamble de PCR: la primera ronda de PCR ensambla los conjuntos 1 y 2, también como los conjuntos 3 y 4 y la segunda ronda de PCR utiliza los productos de la primera ronda de PCR para ensamblar la plena longitud de cada biblioteca. Ensamble de PCR - Ronda 1 : S efectúan reacciones de PCR separadas efectuadas utilizando los siguientes pares de oligos. Cada oligo del conjunto 1 contra el conjunto 2 acumulado; cada oligo del conjunto 2 contra el conjunto 1 acumulado; cada oligo del conjunto 3 contra el conjunto 4 acumulado; cada oligo del conjunto 4 contra el conjunto 3 acumulado. Mezclas de reacción de PCR son de 50 µL en volumen y comprenden 5 µL de solución reguladora del pH PCR 10X, 8 de de dNTP 2.5 mM, 5 µL cada uno de oligo y acumulación de oligo de apareamiento, 0.5 µL de LA Taq polimerasa y 26.5 µL de agua. Las condiciones de reacción de PCR son como sigue: 18 ciclos de [94°C/10", 25°C/30", 72°C/30"] y 2 ciclos de [94°C/30", 25°C/30", 72°C/1']. 5 µL de cada reacción de PCR se hace correr sobre gel de Agarosa de bajo punto de fusión al 3% en solución reguladora del pH de TBE para verificar la presencia del producto de PCR esperado.
Ensamble de PCR - Ronda 2 : Todos los productos de PCR de ronda 1 son acumulados con 5 µL para cada reacción de PCR. El producto de plena longitud de cada andamio de biblioteca es ensamblado mediante PCR utilizando un volumen de reacción de 50 µL que comprende 4 µL de solución reguladora del pH de PCR 10X, 8 µL de dNTP 2.5 mM, 10 µL de productos de PCR de ronda 1 acumulado, 0.5 µL de LA Taq y 27.5 µL de agua y las siguientes condiciones de reacción: 8 ciclos de [94°C/10", 25°C/30", 72°C/30"] y 2 ciclos de [94°C/30", 25°C/30", 72°C/l']. PCR de rescate y digestión de Sfi : Los andamios de biblioteca plenamente ensamblados son amplificados vía PCR para generar material suficiente para la producción de biblioteca. Se efectúan cuatro reacciones de PCR de 50 µL separadas. Cada mezcla de reacción comprende: 2.5 µL de solución reguladora del pH PCR 10X, 8 µL de dNTP 2.5 mM, 25 µL de productos de PCR de ronda 2, 0.5 µL de LA Taq, 5 µL cada uno de cebadores de PCR de rescate 5' y 3' 10 µM (Tabla 2) y 4 µL de agua. Las condiciones de reacción son como sigue: 8 ciclos de [94°C/10", 25°C/30", 72°C/30"] y 2 ciclos de [94°C/30", 45°C/30", 72°C/l']. 5 µL de la mezcla de reacción se hace correr sobre un gel de Agarosa de bajo punto de fusión al 3% en solución reguladora del pH de TBE para confirmar que el producto de amplificación es del tamaño correcto. Luego el producto de amplificación es purificado mediante columnas QIAquick de Qiagen, eluidos en solución reguladora del pH EB y sometidos a digestión con enzima de restricción Sfi para clonación al vector ARI 2 Sfi-digerido. 20 µg del andamio de biblioteca ensamblado son sometidos a digestión con 200 unidades de enzima de restricción Sfi en 1,000 µL de volumen total y 3 horas a 50°C. El ADN digerido es purificado con columnas QIAquick de QIAGEN y eluido en agua. Ligación de prueba : Para determinar la proporción de inserto de biblioteca/vector óptimo para ligación, 1 µL de cada una de una serie de dilución de inserto de biblioteca Sfi -digerido (1/1, 1/5, 1/25, 1/125 y 1/625) es usado para ligación con 1 µL de vector ARI 2 Sfi-digerido, 1 µL de T4 ADN ligasa, 1 µL de solución reguladora del pH 1 de ligasa 10X y 7 µL de agua. La mezcla de reacción de ligación es incubada a temperatura ambiente durante 2 horas para generar un producto ligado. 1 µL de producto ligado es mezclado con 40 µL de células EC100 en cubeta de 0.1 cm, incubado sobre hielo durante 5 minutos, sometido a electroporación y recuperado en 1 mL de SOC durante 1 hora a 37°C. Para cada electroporación, 5 µL cada uno de una serie de dilución (1/1, 1/10, 1/100, 1/1,000) es manchada sobre placa de agar con tetraciclina para determinar la proporción óptima de inerte/vector. Además, 50 µL de cada dilución es depositada para cultivar colonias individuales para QC de biblioteca. Análisis de secuencia y expresión de proteína : Clones individuales son recolectados y cultivados durante toda la noche en 0.4 mL de 2xYT con 20 µg/mL de tetraciclina en cajas de 96 cavidades. Las células cultivadas durante toda la noche son centrifugadas y se usa 0.5 µL de sobrenadante 1/5 diluido para amplificar los insertos de biblioteca utilizando el cebador de rescate 5' y 3' para la secuenciación. Análisis de secuencia de ADN son usados para verificar la presencia de los insertos de biblioteca esperados. Para examinar la expresión de proteína, los insertos de biblioteca son transferidos a un vector de expresión de pEVE . Los 0.5 µL de sobrenadantes acumulados de clones seleccionados del cultivo de toda la noche son amplificados utilizando un par de cebadores de PCR con sitios de restricción de Sfi que están en cuadro con el epítopo de HA en el término N y etiqueta His8 en el término C. La mezcla de reacción de PCR comprende: 0.5 µL de fago (acumulación de 32 sobrenadantes) , 5 µL de solución reguladora del pH LA Taq lOx, 8 µL de dNTP 2.5 mM, 5 µL cada uno de EGF Eve 5 10 µM y cebadores 3Sfi N 10 µM y 0.5 µL de LA Taq polimerasa. Las condiciones de reacción de PCR son como sigue: 23 ciclos de [94°C/10", 45°C/30", 72°C/30"] y 2 ciclos de [94°C/", 45°C/30", 72°C/1']. El producto de amplificación es purificado mediante columnas QIAquick y sometido a digestión con enzima Sfi y ligado con vector de pEVE Sfi -digerido durante 2 horas a temperatura ambiente de acuerdo con especificaciones del fabricante. 1 µL de producto ligado es transformado en 40 µL de células BL21 mediante electroporación, depositados sobre placa de Kanamicina y cultivo en el incubador a 37°C durante toda la noche. Las colonias son recolectadas y cultivadas durante toda la noche en 0.5 mL de medios 2xYT. El siguiente día, 50 µL del cultivo de toda la noche son inoculados a 1 mL de medios 2xYT y cultivados por aproximadamente 2.5 horas hasta que OD600 llega a aproximadamente 0.8, punto en el cual se agrega IPTG a una concentración final de 1 mM para la expresión de proteína. Las células son centrifugadas a 3,600 rpm por 15 minutos, las pelotillas son suspendidas en 100 µL de TBS/2 mM Ca++, calentadas a 65°C por 5 minutos para liberar la proteína y centrifugados a 3,600 rpm durante 15 minutos. El sobrenadante de cada clon se hace correr sobre un gel de NuPAGE 4-12%, 10 µL cada uno con o sin agente reductor (Invitrogen) . La posición de desplazamiento en banda entre las muestras reducidas y sin reducir indica que es probable que las proteínas expresadas se plieguen apropiadamente. Escalamiento ascendente de biblioteca : La plena biblioteca es ligada en un vector ARI 2, transformada en células EC100, luego expandida en células K91. La ligación es efectuada durante toda la noche a temperatura ambiente en un volumen final de 2.5 mL con 25 µg de vector Sfi-digerido, 2.5 µg de inserto de biblioteca Sfi-digerido, 5 µL de T4 ADN ligasa y 250 µl de solución reguladora del pH de ADN ligasa lOx. El producto ligado es precipitado con acetato de sodio y etanol, suspendido en 400 µL de agua, reprecipitado con NaAc/EtOH y resuspendido en 50 µL de H20. La biblioteca es sometida a electroporesis en recipiente que comprende 10 µL de ADN y 200 µL de células EC100, transferida a 50 mL de medio SOC y cultivado a 37°C por 1 hora a 300 rpm. Una alícuota de 5 µL es removida y (1) diluida serialmente para determinar el tamaño de biblioteca, y (2) depositada para la verificación de secuencia. La EC100 transformada en 50 mL de SOC es dividida igualmente, agregada a seis cultivos de 500 mL de células K91 con OD600 de 0.5 e incubadas durante 30 minutos a 37°C sin agitación. Se agrega tetraciclina a una concentración de 0.2 µg/mL y los cultivos son cultivados durante 30 minutos a 37°C a 300 rpm. Finalmente, se agregue tetraciclina a una concentración final de 20 µg/mL y los cultivos son cultivados durante toda la noche a 37°C a 300 rpm. Las células son centrifugadas a 8,000 rpm durante 10 minutos. Los fagos en el sobrenadante son precipitados al agregar 40 g de PEG y 30 g de NaCl/1000 mL y centrifugación a 8,000 rpm durante 10 minutos. Los fagos son resuspendidos en 50 mL de TBS/2 mM Ca++ y centrifugados a 5,000 rpm durante 10 minutos para remover los desechos de células. El sobrenadante es agregado con una concentración final de PEG al 20% y NaCl 1.5 M y colocado sobre hielo durante 40 minutos y los fagos son centrifugados a 5,000 rpm durante 10 minutos y resuspendidos en 10 mL de TBS/2 M Ca++. El título del fago es determinado mediante dilución serial .
Ejemplo 10 Este ejemplo describe el diseño y análisis de una biblioteca de dominios de trébol/PD utilizando los métodos resumida en el ejemplo 9 anterior. En base a alineaciones de secuencia de dominios de trébol/PD que se presentan de manera estable en la naturaleza, un panel de oligonucleótidos degenerados fueron diseñados que codifican dominios de trébol/PD que comprenden aminoácidos en cada posición que son encontrados solamente en dominios de trébol/PD que se presentan de manera estable en la naturaleza. El diseño de biblioteca de trébol/PD es resumido posteriormente en la presente.
L e A ß o a i |D A _ A A B O K F O Q . 0 A A S A A 0 Sßm ÍFr Do AA A A GG AA OO AA II wBlF F O D A A D A D T S L O A N D F O D H 6 R 1 N C L D i T e o e O O K . we o e i . P E F .K- Y H P K I B B O E P 1 1 C E K N K P I P N P P G G I ¡ El y t N P K M ß 1 N K B L N H G S K S K _ N L l 8 L ß V ß P T V K ß K P G M N P O N P K Q P V V N P I P O t L 1- P P N V 0 V Q H P N K K R R ß O S R L S V p ß K o N a N V ft R 0 Y 8 L Q P 0 N H « T I V . K T Q 3 H T Q P ß V T p n o T Q Q R t ß V R T S V e a n s S V T v T T 8 T T T V A AAKAK FD P D ? Q M- OV OD- DOI N HM R Q B EPN BRKO s S P V R ß V V H Las secuencias de oligonucleótido degeneradas son resumidas de la tabla a continuación: PO.1 1 CTG GAQ GCGTCT GGTGGTTCGTGTYC SYAWTK RAY GWB RY GWSARRAVAGACTGC GCG PD112 CTG GAG GCGTCT GGTGGTTCGTGTRAYANM GWY MSYCBN CWRARYARR C AGACTGC GCG PD1 1 3 CTG GAG GCG TCT GGT GGT TCG TGT RAY ANM WTK GMR CBN RAR GWS ARR DTC GAC TGC GCG PD114 CTG GAG GCGTCT GGT GGTTCGTGTRAYSYA GWY GMR GWB RARARYARRDTCGACTGC GCG PD121 CTG GAG GCGTCT GGT GGTTCGTGTTCN RTG SCN GWY CTN KCN MRRAWAGACTGC QCG PD122 CTG GAQ GCG TCT GGT GGTTCGTGTGVS RTG GAD SCN ARN GDY MRR KTY GAC TGCGCG PD12_3 CTG GAG GCGTCT GGT GGTTCGTGT GVS RTG SCN SCN CTN RARMRR KTYGACTGC GCG PD124 CTG GAG GCGTCTGGTGGTTCGTGTTCN RTG GAD GWYARN RARMRRAWAGACTGC GCG PD2 1 GCA GCA CCC TMK YTB RAA RCAWRT YYB YYB RST DAYAAR NGR DGR CGC GCA GTC PD2 2 GCA GCA CCC NTT BGC YYG RCA YTB NGR CGV RST NGS RBC RTY RWA CGC GCA GTC PD2 3 GCA GCA CCC NTT RYY WKY RCA RTY RBC YYB RST NGS RKG YTK YAM CGC GCA GTC PD2 4 GCA GCA CCC TMK RYY WKY RCA RTY RBC CGV RST DAY RKG YTK YAM CGC GCA GTC PD3 1 1 GGG TGC TGC TWY MGY HCN DSG RKY KYY RAR DYY AAH TGG TGC TAC PD3 1 2 GGG TGC TGC TGG AWY RMY SAR AAH ABG YTRCARRTH TGG TGC TAC PD3_1_3 GGGTGCTGCTWY GAS RMYYTT RKY BCN RRYCAR CCN TGG TGCTAC PD314 GGG TGCTGCTWY GAS HCN YTT AAH BCN RRY DYY RTH TGG TGCTAC PD3 2 1 GGG TGC TGC TTY RAY GGA CRR ATG TQG TGC TAC PD322 GGG TGCTGCAAY RAYGGACRRCARTGGTGCTAC PD3 2 3 GGG TGC TGC AAY RAY GGA CRR TCN TGG TGC TAC PD324 GGG TGCTGCTTY RAY GGACRRTCN TGGTGCTAC PD4 1 GGC CTG CAA TGA CGT CSW RBY NGK RTD YKG YMG NGR YTT GTA GCA CCA PD42 GGC CTG CAATGA CGTYWKYTS YTS YDC RHT RTY NMC RAAGTAGCACCA PD4 .3 GGC CTG CAA TGA CGT STY YTS RYC TWT NGY YKK NGR RTR GTA GCA CCA PD4 4 GGC CTG CAA TGA CGT STY RBY RYC TWT NGY YKK NMC RTR GTA GCA CCA Rescue g.AAAAGGCCTCGAGGGCCTGGAGGCGTCTGGTGGTTCGTGT 3' Rescue 5' AAAAGGCCCCAGAGGCCTGCAATGACGT 3' N representa A, T, G o C: B representa G, C o T; D representa G, A o T; H representa A, T o C; K representa G o T; M representa A o C; R representa A o G; S representa G o C; V representa G, A o C; W representa A o T; e Y representa T o C. Treinta y dos fagos individuales de cada biblioteca fueron amplificados mediante PCR y los productos de amplificación fueron secuenciados. Los resultados de la secuenciación confirmaron que el fago contenía insertos de los tamaños y secuencias esperadas para la biblioteca. La biblioteca comprendía 2.31 x 109 dominios de monómero que comprenden 57, 58, 61 ó 62 aminoácidos. Los resultados de secuenciación son mostrados en la tabla a continuación. Los clones 5 y 6 fueron identificados como clones que no contienen un inserto de dominio, sino que en lugar de esto representan un fondo de vector vacío de la transformación.
Los clones de la biblioteca de trébol/PD fueron probados en cuanto a su habilidad para producir proteína plegada . SDS-PAGE verif icó que los clones producían proteína soluble de plena longitud enseguida de la lisis térmica .
Ej emplo 11 Este ejemplo describe diseño y análisis de una biblioteca a partir de dominios de trombospondina, utilizando los métodos resumidos en el ejemplo 9 anterior. En base a la alineaciones de secuencia de dominios de trombospondina que se presentan de manera estable en la naturaleza, un panel de oligonucleótidos degenerados fueron diseñados que modifican dominios de trombospondina que comprenden aminoácidos en cada posición que son encontrados solamente en dominios de trombospondina que se presentan de manera estable en la naturaleza. El diseño de biblioteca de trombospondina es resumido posteriormente en la presente.
L e t matl I» A Al ,. « M I e A * * A iL A ? . ? C a? A- • 3* E A A A 0 A A A - _ a o D E ? (t P 00 L E Qa ßoo o . a D Í C O P- E E - O E O O O I DI E DWtt r ae e ß F QH B B MS Rltl l F P » . ß L E í F 0 F I _ OCI E ß E V 0 e B E I H H . l f K RK IP HS | C H L ßK RH K R HOP O I H UK BK K P ß L I * R T I T I ¥ 00 8 P MU 1 01. 11 Cl a irs i o _ i. O M X T U K V K T ß R T 8 P H R l l l M I. H l l l T _ 7 P a R M l V N _ T T o Rß a W M II tt V * P O R e P u P v u r t «IP o ß T o 0 R o ß TV Y 8 R P P R o o T R R ß R I O A F G? ? A OE . T V Y T eS OOS s T V s 1 T s - K ß N l O OO ß O V TR R T T t v 1 .« H«Pf Il V ß V V Y V R MR 00 P V H y V O R T ß P A AA AK P A AA B A V T R 0 E 6 L R 60 B . P V «HM P (E I 10 O L . I I « L P Oß o p o a a O A P A A A F O CA A . mi l a s R 1 HO( ß<ll)« K 0 . Y T T Ml VH P K H N ß o Hl K t M OP a ß H L O R R I T 0 P R Y 8 P V R R ß y » ß T I O A ? A D S . A DO E . K DOF E I t 0 E E . L BHP tßPI t r OI MH ? 0 N H OV RO 8 - 0K H I V K R PH T B R N P M O S Oa v R ßa R a e ß v T T Las secuencias de oligonucleótido degeneradas son resumidas en la tabla a continuación: M representa A o C; R representa A o G; S representa G o C; V representa G, A o C; W representa A o T; e Y representa T o C. Treinta y dos fagos individuales de la biblioteca fueron amplificados mediante PCR y los productos de amplificación fueron secuenciados. Los resultados de la secuenciación confirmaron que el fago contenía insertos de los tamaños y secuencias esperados para la biblioteca. La biblioteca contenía 1.98 x 109 dominios de monómero que comprenden 60-70 aminoácidos. Los resultados de secuenciación son mostrados en la tabla a continuación. Los clones 1, 4, 8, 11, 12, 22, 26 y 30 fueron identificados como clones que no contienen un inserto de dominio, sino que en lugar de esto representan fondo de vector vacío de la transformación.
Clones de la biblioteca de trombospondina fueron probados en cuanto a su habilidad para producir proteína plegada. SDS-PAGE verificó que los clones producen proteína soluble de plena longitud enseguida de la lisis por calor.
Ejemplo 12 Este ejemplo describe un método ejemplar para generar bibliotecas que comprenden proteínas con bucles de inter-cisteína aleatorizados. En este ejemplo, en contraste con el procedimiento de bucle separado, biblioteca separada descrito anteriormente, múltiples bucles de inter-cisteína son aleatorizados simultáneamente en la misma biblioteca. Una biblioteca de NNK de dominio A que codifica un dominio de proteína de 39-45 aminoácidos que tiene el siguiente patrón fue construida: Cl-X{4,f-El-F-m-C2-A-X(2,4^ G3-D4-G4-S3-D5-E3-X(4,6)-C6; en donde , C1-C6: cisteínas; X (n) : secuencia de n aminoácidos con cualquier residuo en cada posición; E1-E3: glutamina; F: fenilalanina; R1-R2: arginina; A: alanina; G1-G4: glicina; I : isoleucina; P: prolina; S1-S3 : serina; W: triptófano; V: valina; D1-D5: ácido aspártico; y C1-C3, C2-C5 y C4-C6 forman disulfuros

Claims (28)

  1. REIVINDICACIONES 1. Un método para identificar un dominio de monómero que se enlaza a una molécula objetivo, el método está caracterizado porque que comprende: (a) proporcionar una biblioteca de dominios de monómero que no se presentan de manera estable en la naturaleza, en donde el dominio de monómero es seleccionado del grupo que consiste de: un dominio de monómero de trombospondina, un dominio de monómero de trébol, y un dominio de monómero de tiroglobulina, en donde el dominio de monómero de trombospondina comprende la siguiente secuencia: (wxxWxx) C?SXtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx (x) xxxC5 (x) xxxxC6 ; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxgC C5fdxxx (x) xxxpwC6f; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxG xyxxxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xCe ; en donde "x" es cualquier aminoácido; (b) seleccionar la biblioteca de dominios de monómero en cuanto a afinidad a una primera molécula objetivo; y (c) identificar por lo menos un dominio de monómero que se enlaza a por lo menos una molécula objetivo. 2. El método de conformidad con la reivindicación 1, caracterizado porque el por lo menos un dominio de monómero se enlaza específicamente a una molécula objetivo no enlazada por un dominio de monómero que se presenta de manera estable en la naturaleza por lo menos 90% idéntico al dominio de monómero que no se presenta de manera estable en la naturaleza. 3. El método de conformidad con la reivindicación 1, caracterizado porque: C?-C5, C2-C6 y C3-C4 del dominio de monómero de trombospondina forman enlaces de disulfuro; y C?-C2, C3-C4 y C5-C6 del dominio de monómero de tiroglobulina forman enlaces de disulfuro. 4. El método de conformidad con la reivindicación 1, caracterizado porque: el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) Ci [Stnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [Rktvm] xC3 [vldr] xxxx ( [Pq] xx) xxxxxC4 [Idae] xxxxxx (x) xxxC5 (x) xxxxC6 , en donde C1-C5, C2-C6 y C3-C4 forman enlaces de disulfuro; el dominio de monómero de trébol comprende la siguiente secuencia:
  2. Ci (xx) xxx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst ] ( [de] x) [pskq] x [ Iva p] [Tsa] xx [keqd] C3xx [krln] [Gnk] C4C5 [ ] [Dnrs] [sdpnte] xx (x) xxx [pki]
  3. [Weash] C6 [Fy] ; el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahp] xPxC2 xxxGx [a] xx [vkrl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx (x) Gxxxx [fg ] xxxxxgxx (xx) Ce , en donde C?-C2, C3-C4 y C5-C3 forman enlaces de di sul furo; y en donde a es seleccionado del grupo que consiste de: w, y, f y 1; f es seleccionado del grupo que consiste de: d, e, y n; y "x" es seleccionado de cualquier aminoácido. 5. El método de conformidad con la reivindicación 1, caracterizado porque: el monómero de trombospondina comprende la siguiente secuencia :
  4. C?[nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrs t] x [almrtv] xC3xxxxxxxxx (xxxxxxx) C4xxxxxxxxx (xx) C5xxxxC_; el dominio de monómero de trébol comprende la siguiente secuencia:
  5. C?([dnps]) [adiklnprstv] [dfilmv] [adenprst] [adelprv] [ehklnqr s] [adegknsv] [kqr] [fiklqrtv] [dnpqs] C2 [agiy] [flpsvy] [dknpqs] [adfg hlp] [aipv] [st] [aegkpqrs] [adegkpqs] [deiknqt] C3 [adefknqrt] [adegkn qs] [gn] C4C5 [wyfh] [deinrs] [adgnpst] [aefgqlrstw] [giknsvmq] ( [afmpr stv] [degklns] [afiqstv] [iknpv]w)C6; y el monómero de tiroglobulina comprende la siguiente secuencia :
  6. Ci [qerl ] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2xxxGx [Y f] xx [Vkrl] QC3x (x [Sa] xxx) xx [Gsa] xC4 [Wyf] C5V [Dnyf1] xx (x) Gxxxx [Gdne ] xxxxxgxx (xx) xC6. 6. El método de conformidad con la reivindicación 1, caracterizado porque comprende además enlazar los dominios identificados a un segundo dominio de monómero para formar una biblioteca de multímeros, cada multímero comprende por lo menos dos dominios de monómero; seleccionar la biblioteca de multímeros en cuando a la habilidad para enlazarse a la primera molécula objetivo, y identificara multímero que se enlaza a la primera molécula objetivo.
  7. 7. El método de conformidad con la reivindicación 6, caracterizado porque cada dominio de monómero del multímero seleccionado se enlaza a la misma molécula objetivo.
  8. 8. El método de conformidad con la reivindicación 6, caracterizado porque el multímero seleccionado comprende tres dominios de monómero .
  9. 9. El método de conformidad con la reivindicación 6, caracterizado porque el multímero seleccionado comprende cuatro dominios de monómero .
  10. 10. El método de conformidad con la reivindicación 1, caracterizado porque comprende además la etapa de mutación de por lo menos un dominio de monómero, proporcionando mediante esto una biblioteca que comprende dominios de monómero mutados.
  11. 11. El método de conformidad con la reivindicación 10, caracterizado porque la etapa de mutación comprende recombinación de una pluralidad de fragmentos de polinucleótido de por lo menos un polinucleótido que codifica un dominio de polipéptido.
  12. 12. El método de conformidad con la reivindicación 1, caracterizado porque comprende además: seleccionar la biblioteca de dominios de monómero en cuanto a afinidad a una segunda molécula objetivo; identificar un dominio de monómero que se enlaza a una segunda molécula objetivo; enlazar por lo menos un dominio de monómero con afinidad por la primera molécula objetivo con por lo menos un dominio de monómero con afinidad por la segunda molécula objetivo, formando mediante esto un multímero con afinidad por la primera y segunda molécula objetivo.
  13. 13. El método de conformidad con la reivindicación 1, caracterizado porque la biblioteca de dominios de monómero es expresada como un despliegue de fago, un despliegue de ribosoma o despliegue de superficie celular.
  14. 14. El método de conformidad con la reivindicación 1, caracterizado porque la biblioteca de dominios de monómero es presentada sobre un microarreglo.
  15. 15. Una proteína, que comprende un dominio de monómero que no se presenta de manera estable en la naturaleza que se enlaza específicamente a una molécula objetivo, caracterizada porque la molécula objetivo no es enlazada por un dominio de monómero que se presenta de manera estable en la naturaleza por lo menos 90% idéntico al dominio de monómero que no se presenta de manera estable en la naturaleza, en donde el dominio de monómero no se presenta de manera estable en la naturaleza es seleccionado del grupo que consiste: un dominio de monómero de trombospondina, un dominio de monómero de trébol y un dominio de monómero de tiroglobulina .
  16. 16. La proteína de conformidad con la reivindicación 15, caracterizada porque el dominio de monómero comprende por lo menos un enlace de disulfuro.
  17. 17. La proteína de conformidad con la reivindicación 15, caracterizada porque el dominio de monómero comprende por lo menos tres enlaces de disulfuro.
  18. 18. La proteína de conformidad con la reivindicación 15, caracterizada porque el dominio de monómero es de 30-100 aminoácidos de longitud.
  19. 19. La proteína de conformidad con la reivindicación 15, caracterizada porque el dominio de monómero de trombospondina comprende la siguiente secuencia: (wxxWxx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx ( x) xxxC5 (x) xxxxC6 ,- el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxgC4C5fdxxx (x) xxx pwC6f; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxxQC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 ; en donde "x" es cualquier aminoácido.
  20. 20. La proteína de conformidad con la reivindicación 19, caracterizada porque: C?-C5, C2-C6 y C3-C4 del dominio de monómero de trombospondina forman enlaces de disulfuro; y C?-C2, C3-C4 y C5-C6 del dominio de monómero de tiroglobulina forman enlaces de disulfuro.
  21. 21. La proteína de conformidad con la reivindicación 15, caracterizada porque el dominio de monómero de trombospondina comprende la siguiente secuencia: (WxxWxx) Ci [Stnd] [Vkaq] [Tspl] C2xx [Gq] xx (x) x [Re] x [Rktvm] xC3 [vldr] xxxx ( [Pq] xx) xxxxxC4 [Idae] xxxxxx (x) xxxC5 (x) xxxxC6 , en donde C1-C5, C2-C6 y C3-C4 forman enlaces de disul furo; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxx [Pvae] xxRx [ndpm] C2 [Gaiy] [ypfst] ([de]x) [pskq] x [Ivap ] [Tsa]xx[keqd] C3xx [krln] [Gnk] C4C5 [a] [Dnrs] [sdpnte] xx (x) xxx [pki] [ Weash] C6 [Fy] ; el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [ahP] xPxC xxxGx [a] xx [Vkrl] QC3x (x [sa] xxx) xx [gas] xC4 [a] C5V [Dna] xx (x) Gxxxx [fg ] xxxxxgxx (xx) xC6, en donde C?-C2, C3-C4 y C5-C6 forman enlaces de disul furo; y en donde a es seleccionado del grupo que consiste de: w, y, f y 1 ; f es seleccionado del grupo que consiste de: d, e, y n; y "x" es seleccionado de cualquier aminoácido.
  22. 22. La proteína de conformidad con la reivindicación 15, caracterizada porque el monómero de trombospondina comprende la siguiente secuencia: C_[nst] [aegiklqrstv] [adenpqrst] C2 [adetgs] xgx [ikqrstv] x [aqrst] x [almrtv] xC3xxxxxxxxx (xxxxxxx) C4xxxxxxxxx (xx) C5xxxxC6; el dominio de monómero de trébol comprende la siguiente secuencia: Ci ( [dnps] ) [adiklnprstv] [dfilmv] [adenprst] [adelprv] [ehklnqr s] [adegknsv] [kqr] [fiklqrtv] [dnpqs] C2 [agiy] [flpsvy] [dknpqs] [adfg hlp] [aipv] [st] [aegkpqrs] [adegkpqs] [deiknqt] C3 [adefknqrt] [adegkn qs] [gn] C C5 [wyfh] [deinrs] [adgnpst] [aefgqlrstw] [giknsvmq] ( [afmpr stv] [degklns] [afiqstv] [iknpv] w) C6; y el monómero de tiroglobulina comprende la siguiente secuencia : Ci [qerl] xxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxx [Yfhp] xPxC2 xxxGx [Yf ] xx [vkrl] QC3x(x[sa] xxx) xx [Gsa] xC4 [Wyf] CSV [Dnyf1] xx (x) Gxx xx [Gdne] xxxxxgxx (xx) xC6.
  23. 23. Un polinucleótido aislado caracterizado porque codifica la proteína de conformidad con la reivindicación 15.
  24. 24. Una biblioteca de proteínas que comprenden dominios de monómero que no se presentan de manera estable en la naturaleza, caracterizada porque el dominio de monómero es seleccionado del grupo que consiste de: un dominio de monómero de trombospondina, un dominio de monómero de trébol, y un dominio de monómero de tiroglobulina, en donde el dominio de monómero de trombospondina comprende la siguiente secuencia: (wxxWxx) C?SxtC2xxGxx (x) xRxrxC3xxxx (Pxx) xxxxxC4xxxxxx ( x) xxxC5 (x) xxxxC6 ; el dominio de monómero de trébol comprende la siguiente secuencia: Ci (xx) xxxpxxRxnC2gx (x) pxitxxxC3xxxgC4C5fdxxx (x) xxxpwC6f; y el dominio de monómero de tiroglobulina comprende la siguiente secuencia: Cixxxxxxxxxxxxxxx (xxxxxxxxxx) xxxxxxxyxPxC2xxxGxyxxx QC3x (x) s (xxx) xxgxC4WC5Vdxx (x) GxxxxGxxxxxgxx (xx) xC6 ; en donde "x" es cualquier aminoácido.
  25. 25. La biblioteca de conformidad con la reivindicación 24, caracterizado porque cada dominio de monómero de los multímeros es un dominio de monómero que no se presentan de manera estable en la naturaleza.
  26. 26. La biblioteca de conformidad con la reivindicación 24, caracterizada porque la biblioteca comprende una pluralidad de multímeros, en donde los multímeros comprenden por lo menos dos dominios de monómero enlazados por un enlazador.
  27. 27. La biblioteca de conformidad con la reivindicación 24, caracterizada porque la biblioteca comprende por lo menos 100 proteínas diferentes que comprende diferentes dominios de monómero .
  28. 28. Una biblioteca de polinucleótidos caracterizada porque codifica la biblioteca de proteínas de conformidad con la reivindicación 24.
MX2007005865A 2004-11-16 2005-11-16 Adamios de proteina y usos de los mismos. MX2007005865A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62859604P 2004-11-16 2004-11-16
PCT/US2005/041639 WO2006127040A2 (en) 2004-11-16 2005-11-16 Protein scaffolds and uses therof

Publications (1)

Publication Number Publication Date
MX2007005865A true MX2007005865A (es) 2008-02-25

Family

ID=37452497

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2007005865A MX2007005865A (es) 2004-11-16 2005-11-16 Adamios de proteina y usos de los mismos.

Country Status (6)

Country Link
EP (1) EP1817444A4 (es)
JP (1) JP2008520208A (es)
AU (1) AU2005332022A1 (es)
CA (1) CA2587463A1 (es)
MX (1) MX2007005865A (es)
WO (1) WO2006127040A2 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040005673A1 (en) 2001-06-29 2004-01-08 Kevin Jarrell System for manipulating nucleic acids
US7435562B2 (en) 2000-07-21 2008-10-14 Modular Genetics, Inc. Modular vector systems
WO2006053131A1 (en) 2004-11-11 2006-05-18 Modular Genetics, Inc. Ladder assembly and system for generating diversity
EP3385279B1 (en) 2009-03-20 2020-02-26 Amgen Inc. Carrier immunoglobulins and uses thereof
JP6159660B2 (ja) 2010-09-22 2017-07-05 アムジエン・インコーポレーテツド 担体としての免疫グロブリンおよびその使用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030082630A1 (en) * 2001-04-26 2003-05-01 Maxygen, Inc. Combinatorial libraries of monomer domains
US20030157561A1 (en) * 2001-11-19 2003-08-21 Kolkman Joost A. Combinatorial libraries of monomer domains
US7655411B2 (en) * 2002-08-23 2010-02-02 W2 Holdings, Inc. Thrombospondin fragments and binding agents in the detection, diagnosis and evaluation of cancer

Also Published As

Publication number Publication date
JP2008520208A (ja) 2008-06-19
EP1817444A2 (en) 2007-08-15
WO2006127040A2 (en) 2006-11-30
WO2006127040A3 (en) 2009-04-09
AU2005332022A1 (en) 2006-11-30
EP1817444A4 (en) 2010-02-17
CA2587463A1 (en) 2006-11-30

Similar Documents

Publication Publication Date Title
US20060223114A1 (en) Protein scaffolds and uses thereof
MX2007005884A (es) Andamios de proteina y usos de los mismos.
US20050164301A1 (en) LDL receptor class A and EGF domain monomers and multimers
US20050089932A1 (en) Novel proteins with targeted binding
US20050053973A1 (en) Novel proteins with targeted binding
AU2005265150B2 (en) C-MET kinase binding proteins
JP4369662B2 (ja) 単量体ドメインのコンビナトリアルライブラリー
JP5667207B2 (ja) リガンドへの結合能を有するヘテロ多量体修飾ユビキチンタンパク質の同定方法
US9441017B2 (en) Water-soluble polypeptides comprised of repeat modules, method for preparing the same and method for a target-specific polypeptide and analysis of biological activity thereof
US20060286603A1 (en) Combinatorial libraries of monomer domains
US7786262B2 (en) IL-6 binding proteins
JP2008503216A5 (es)
MX2007005865A (es) Adamios de proteina y usos de los mismos.
US20090203541A1 (en) Msp and its domains as frameworks for novel binding molecules

Legal Events

Date Code Title Description
FA Abandonment or withdrawal