MX2010011453A - Armazones proteinicos artificiales. - Google Patents

Armazones proteinicos artificiales.

Info

Publication number
MX2010011453A
MX2010011453A MX2010011453A MX2010011453A MX2010011453A MX 2010011453 A MX2010011453 A MX 2010011453A MX 2010011453 A MX2010011453 A MX 2010011453A MX 2010011453 A MX2010011453 A MX 2010011453A MX 2010011453 A MX2010011453 A MX 2010011453A
Authority
MX
Mexico
Prior art keywords
protein
amino acids
seq
target molecule
amino acid
Prior art date
Application number
MX2010011453A
Other languages
English (en)
Inventor
Jonathan H Davis
Original Assignee
Merck Patent Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Merck Patent Gmbh filed Critical Merck Patent Gmbh
Publication of MX2010011453A publication Critical patent/MX2010011453A/es

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Peptides Or Proteins (AREA)

Abstract

La presente invención provee proteínas que tienen una o más similitudes a la proteína Top7 artificial o a un derivado de Top7. Las proteínas de la invención tienen uno o más lazos que son más largos que los lazos correspondientes de Top7, y/o que se unen a una molécula objetivo preseleccionada. La invención también provee ácidos nucleicos y células útiles en la producción de las proteínas y métodos para su uso.

Description

ARMAZONES PROTEINICOS ARTIFICIALES Campo de la Invención Esta invención generalmente se refiere a armazones proteínicos artificiales y su diseño, producción y uso. Especialmente, . la invención se refiere a armazones proteínicos artificiales que se derivan del doblez de proteína T0P7.
Antecedentes de la Invención La naturaleza ha provisto un número de proteínas en las cuales se pueden insertar péptidos cortos de diversas secuencias. Los anticuerpos son un ejemplo muy conocido y tienen dominios de unión a antígeno definidos por regiones variables de cadena pesada y ligera, en donde cada región variable incluye regiones determinantes de complementariedad (CDRs) interpuestas entre regiones de marco de trabajo (FRs) . Los lazos de CDR3 tanto de cadenas de anticuerpo pesadas como ligeras se forman por un proceso en el cual una exonucleasa y transíerasa terminal operan para insertar una secuencia de ADN esencialmente aleatoria en cada gen V que codifica un lazo de péptido. Cuando este proceso se combina con la diversidad más limitada que existe en los lazos CDR1 y CDR2 , los dominios VH y VL son aleatoriamente pareados para producir un número muy grande de secuencias de proteína específicas. Las proteínas nativas resultantes presentan una Ref.213722 diversidad muy grande de especificidades de unión. Las llamadas FRs de los dominios del anticuerpo V sirven efectivamente como un armazón proteínico sobre el cual están fusionados los lazos de CDR.
Sin embargo, los anticuerpos tienen un número de problemas técnicos que deben ser enfrentados. Por ejemplo, generalmente deben ser producidos en células de mamífero, lo cual es costoso y consume tiempo. Además, los diversos métodos para generar -anticuerpos monoclonales son generalmente lentos, costosos o ambos. Como resultado de estos problemas, varios grupos han explorado armazones proteínicos alternativos para el despliegue de péptidos. Por ejemplo, LaVallie et al. ((1993) Biotechnology 11:187-93; y patente de E.U.A. No. 5,270,181) usaron tioredoxina de E. coli para desplegar péptidos en E. coli de manera que evitara la formación de cuerpos de inclusión. Colas et al. ((1996) Nature 380:548-50) extendieron este enfoque para mostrar que péptidos aleatorios podrían ser insertados en un lazo natural en tioredoxina, y * aptámeros' de tioredoxina-péptido se podrían seleccionar por sus especificidades de unión a varias proteínas. Otros grupos han identificado otras proteínas naturales que se pueden usar como armazones proteínicos. Sin embargo, estos enfoques- tienen ciertas limitaciones. En general, un armazón proteínico con base en una proteína que ocurre naturalmente es mejor expresada en el sistema que normalmente produce la proteína natural. Por ejemplo, aptámeros a base de tioredoxina son generalmente expresados en E. coli. Por el contrario, los aptámeros a base de fibronectina de tipo III generalmente son mejor expresados en células de mamífero y/o mediante el uso de un sistema secretor que promueve la formación de enlace de disulfuro. Además, el uso de proteínas que ocurren naturalmente como armazones proteínicos siempre tiene el riesgo inherente de que una característica biológica desconocida de la proteína natural interferirán con su función como un armazón proteínico en un contexto particular. Por lo tanto, existe la necesidad en la técnica de sistemas de armazón proteínico con propiedades mejoradas.
Sumario de la Invención La invención se basa, en parte, en la perspectiva de que una proteína completamente artificial, diseñada de novo, puede tener propiedades diseñadas por el ingeniero de proteínas, con base en las necesidades de su uso pretendido. En el centro de la invención están proteínas artificiales que incorporan o simulan elementos de la proteína Top7, una proteína altamente estable diseñada de novo por Kuhlmann et al. (2003) Science 302:1364-1368. Estas proteínas artificiales están diseñadas para ser altamente estables y doblarse eficientemente, con ciertas posiciones en las cuales lazos aleatorios o diversos pueden ser genéticamente • incorporados. La estabilidad de estos armazones proteínicos artificiales permite la incorporación de péptidos que podrían conducir a desestabilizar la proteína, lo que permite a la proteína doblarse a pesar de la presencia de lo que pueden ser lazos desestabilizadores. Si las secuencias de aminoácidos aleatorizadas son introducidas, la biblioteca de proteína resultante puede ser determinada selectivamente para la capacidad para unirse a una molécula objetivo preseleccionada . Las proteínas que resultan de esa determinación selectiva se pueden usar en diagnóstico y terapéutica.
Por consiguiente, en un aspecto, la invención provee a proteína que tiene un doblez de Top7.
Top7 es un doblez de proteína globular (Kuhlman at al., 2003, Science 302, 1364) y tiene la secuencia de aminoácidos : DIQVQV IDDNGK FDYTYTVTTESELQKVLNELKDYIKKQGAKRVRISITARTKKEAEK FAAILIKVFAELGYNDI VTFDGDTVTVEGQLE (figura 5) Uno o más lazos en el doblez de Top7 se unen específicamente a una molécula objetivo preseleccionada, a la cual la proteína se une con una constante de disociación de no más de 10 µ? (v.gr., 5-10 µ?, 1-10 µ?, 0.5-10 µ?, 0.1-10 µ?, 0.05-10 µ?, 0.01-10 µ?, 0.001-10 µ?, etc.).
En otro aspecto, la invención provee una proteína que tiene un doblez de Top7 que define dos extremos. Por lo menos dos lazos en un extremo de la proteína son cada uno por lo menos un aminoácido más largo que los lazos correspondientes de Top7. En una modalidad, uno o ambos de los dos lazos se unen específicamente a una molécula objetivo preseleccionada . En ciertas modalidades, la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ? (v.gr., 5-10 µ?, 1-10 µ?, 0.5-10 µ?, 0.1-10 µ?, 0.05-10 µ?, 0.01-10 µ?> 0.001-10 µ?, etc.) .
En otro aspecto, la invención provee una proteína que incluye por lo menos cinco cadenas ß antiparalelas, por lo menos dos hélices a paralelas, y lazos que conectan las hélices a y cadenas ß. Generalmente, las hélices a paralelas forman una capa y las cadenas ß antiparalelas forman una segunda capa. La proteína tiene dos extremos, generalmente correspondientes a los extremos de las hélices a y cadenas ß. Cada uno de los dos extremos de la proteína incluye dos lazos que conectan una hélice con una cadena ß y un lazo que conecta dos cadenas ß. Por lo menos dos lazos en un extremo de la proteína son cada uno por lo menos un aminoácido más largo que los lazos correspondientes de Top7. En algunas modalidades, las hélices y cadenas ß definen una estructura de base de carbono a que tiene una estructura cuya desviación cuadrática media (RMSD) de la estructura del esqueleto de carbono a de las hélices OÍ y cadenas ß de Top7 es no mayor que 4.0 (v.gr., no mayor que 3.5, no mayor que 3.0, no mayor que 2.5, no mayor que 2.0, no mayor que 1.9, no mayor que 1.8, no mayor que 1.7, no mayor que 1.6, no mayor que 1.5, no mayor que 1.4, no mayor que 1.3, no mayor que 1.2, no mayor que 1.1 , o no mayor que 1.0) . En ciertas modalidades, por lo menos uno de los dos lazos se une específicamente a una molécula objetivo preseleccionada. Por ejemplo, en algunas modalidades la proteína une una molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ? (v.gr., 5-10 µ?, 1-10 µ?, 0.5-10 µ?, 0.1-10 µ?, 0.05-10 µ?, 0.01-10 µ?, 0.001-10 µ?, etc.) .
En otro aspecto, la invención provee una proteína que incluye por lo menos cinco cadenas ß antiparalelas y por lo 'menos dos hélices paralelas, las hélices a y cadenas ß definen un esqueleto de carbono a que tiene una estructura cuya desviación cuadrática media (RMSD) de la estructura del esqueleto de carbono a de las hélices a. y cadenas ß de Top7 es no mayor que 4.0 (v.gr., no mayor que 3.5, no mayor que 3.0, no mayor que 2.5, no mayor que 2.0, no mayor que 1.9, no mayor que 1.8, no mayor que 1.7, no mayor que 1.6, no mayor que 1.5, no mayor que 1.4, no mayor que 1.3, no mayor que 1.2, no mayor que 1.1, o no mayor que 1.0) . La proteína incluye lazos que conectan las hélices OÍ y cadenas ß. Cada uno de los dos extremos de la proteína incluye dos lazos que conectan una hélice con una cadena p y un lazo que conecta dos cadenas ß. Uno o más de los lazos en un extremo se une específicamente a una molécula objetivo preseleccionada a la cual la proteína se une. con una constante de disociación de no más de 10 µ? (v.gr., 5-10 µ?, 1-10 µ?, 0.5-10 µ?, 0.1-10 µ?, 0.05-10 µ?, 0.01-10 µ?, 0.001-10 µ?, etc.). En algunas modalidades, las hélices paralelas ("a") y las cadenas ß antiparalelas ("ß") están presentes en un solo polipéptido, en el orden ßßaßaßß. En otras modalidades, la proteína incluye dos polipéptidos , v.gr., como un heterodímero u homodímero, cada polipéptido incluye una hélice a y tres cadenas ß antiparalelas en el orden ßaßß.
En algunas modalidades de cualquiera de las proteínas anteriormente descritas, por lo menos tres lazos (v.gr., tres lazos en el mismo extremo de la proteína) son cada uno por lo menos un aminoácido más largo que el lazo correspondiente de Top7.
La invención también provee proteínas que incluyen secuencias de aminoácidos relacionadas con una secuencia de aminoácidos de Top7 o de un derivado de Top7. La secuencia de aminoácidos de uno de esos derivados, referida aquí como "Consenso RD1.3/1.4", es presentada como SEQ ID NO: 5. Los aminoácidos seleccionados de porciones de las hélices a y cadenas ß de Consenso RD1.3/1.4 han sido concatenadas y presentadas como SEQ ID NO: 6. La secuencia de aminoácidos de otro derivado de Top7 , r referida como "RDl-DI-Del_ys , " es presentada como SEQ ID NO: 2, y porciones seleccionadas de sus hélices y cadenas ß han sido concatenadas y presentadas como SEQ ID NO: 3.' Una concatenación de porciones seleccionadas correspondientes de una secuencia de consenso adicional que abarca varios derivados de Top7 predichos para demostrar inmunogenicidad reducida es presentada como SEQ ID NO: 7. De manera específica, para cada una de SEQ ID NO.3, SEQ ID NO: 6 y SEQ ID NO : 7 , los aminoácidos 1-5 corresponden a una porción de la primera cadena ß; los aminoácidos 6-8 corresponden a una porción de la segunda cadena ß; los aminoácidos 9-20 corresponden a una porción de la primera hélice a; los aminoácidos 21-23 corresponden a una porción de la tercera cadena ß; los aminoácidos 24-32 corresponden a una porción de la segunda hélice OÍ; los aminoácidos 33-37 corresponden a una porción de la cuarta cadena ß; y los aminoácidos 38-42 corresponden a una porción de la, quinta cadena ß .
Por consiguiente, en un aspecto, la invención provee una proteína que incluye una secuencia de aminoácidos de la fórmula B(4) -L(45) -A(5) -L(56) -B(6) -L(67) -B(7) . B(4), A(5), B(6) y B(7) corresponden ya sea a (i) los aminoácidos 21-23, 24-32, 33-37 y 38-42 de SEQ ID NO:3 o una secuencia por lo menos 80% idéntica a los aminoácidos 21-42 de la SEQ ID NO:3 (v.gr., que difieren de los aminoácidos 21-42 en no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones, o no más de una posición) ; o (ii) los aminoácidos 21-23,. 24-32, 33-37 y 38-42 de la SEQ ID N0:6 o una secuencia por lo menos 90% idéntica a los aminoácidos 21-42 de la SEQ ID NO:6 (v.gr., que difiere de los aminoácidos 21-42 en no más de dos posiciones o no más de una posición) ; o (iii) aminoácidos 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO: 7 o una secuencia por lo menos 95% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 7. Las longitudes mínimas de L(45), L(56) y L(67) se 10 aminoácidos, 7 aminoácidos y 4 aminoácidos, respectivamente. Por lo menos uno de L(45) , L(56) y L(67) específicamente se une a una molécula objetivo preseleccionada, a la cual la proteína se une con una constante de afinidad de no más de 10 µ .
En otro aspecto, la invención provee una proteína que incluye una secuencia de aminoácidos de la fórmula B(4)-L(45) -A(5) -L(56) -B(6) -L(67) -B(7) . B(4), A(5), B(6) y B(7) corresponden ya sea a (i) los aminoácidos 21-23, 24-32, 33-37, y 38-42 de la SEQ ID NO: 3 o una secuencia por lo menos 80% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 3 (v.gr., que difiere de aminoácidos 21-42 en no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones, o no más de una posición) ; o (ii) los aminoácidos 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO: 6 o una secuencia por lo menos 90% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 6 (v.gr., que difiere de los aminoácidos 21-42 en no más de dos posiciones o no más de una posición) ; o (iii) los aminoácidos 21- 23, 24-32, 33-37 y 38-42 de la SEQ ID NO:7 o una secuencia por lo menos 95% idéntica a los aminoácidos 21-42 de la SEQ ID NO:7. Las longitudes mínimas de L(45), L(56), y L(67) son 10 aminoácidos, 7 aminoácidos y 4 aminoácidos, respectivamente, y por lo menos dos de L(45), L(56), y L(67) cada uno excedió su longitud mínima por lo menos por un aminoácido. En algunas modalidades, por lo menos uno de L(45), L(56) y L(67) específicamente se une a una molécula objetivo preseleccionada, a la cual la proteína se une con una constante de afinidad de no más de 10 µ?.
En ciertas modalidades, una proteína de la invención incluye dos secuencias de aminoácidos de la fórmula B(4) -L(45) -A(5) -L(56) -B(6) -L(67) -B(7) (v.gr., en cadenas de polipéptido separadas) .
En otro aspecto, la invención provee una proteína que incluye una secuencia de aminoácidos de la fórmula B(l)-L(12) -B(2) -L(23) -A (3) -L(34) -B(4) -L(45) -A (5) -L(56) -B(6) -L(67) -B(7). B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponde ya sea a (i) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO: 3 o una secuencia por lo menos 80% idéntica a los aminoácidos 1-42 de la SEQ ID NO : 3 (v.gr., que difiere de los aminoácidos 1-42 en no más de ocho posiciones, no más de siete posiciones, no más de seis posiciones, no más de cinco posiciones, no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones, o no más de una posición); o (ii) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 6 o una secuencia por lo menos 90% idéntica a los aminoácidos 1-42 de la SEQ ID NO : 6 (v.gr., que difiere de los aminoácidos 1-42 en no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones o no más de una posición) ; o (iii) los aminoácidos 1-5, 6- 8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 7 o una secuencia por lo menos 95% idéntica a la SEQ ID NO : 7. Las longitudes mínimas de L(12), L(23), L(34), L(45), L(56) y L(67) son 10 aminoácidos, 7 aminoácidos, 9 aminoácidos, 10 aminoácidos, 7 aminoácidos y 4 aminoácidos, respectivamente. Por lo menos uno de L(12), 1.(23) , L(34), L(45), L(56) y L(67) específicamente se une a una molécula objetivo preseleccionada , a la cual la proteína se une con una constante de afinidad de no más de 10 µ?. En algunas modalidades, B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponde a (i) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 3 o una secuencia por lo menos 85% idéntica a la SEQ ID NO : 3 ; o (ii) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37, y 38-42 de la SEQ ID NO : 6 o una secuencia por lo menos 95% idéntica a la SEQ ID NO : 6. ; o (iii) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 7.
En otro aspecto, la invención provee una proteína que incluye una secuencia de aminoácidos de la fórmula B(l)-L(12)-B(2)-L(23)-A(3)-L(34)-B(4)-L(45)-A(5)-L(56) -B(6) -L(67) -B(7) . B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponden ya sea a (i) aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 3 o una secuencia por lo menos 80% idéntica a los aminoácidos 1-42 de la SEQ ID NO: 3 (v.gr., que difiere de los aminoácidos 1-42 en no más de ocho posiciones, no más de siete posiciones, no más de seis posiciones, no más de cinco posiciones, no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones, o no más de una posición); o (ii) los aminoácidos 1-5, 6.-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 6 o una secuencia por lo menos 90% idéntica a los aminoácidos 1-42 de la SEQ ID NO : 6 (v.gr., que difiere de los aminoácidos 1-42 en no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones o no más de una posición); o (iii) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37, y 38-42 de la SEQ ID NO : 7 o una secuencia por lo menos 95% idéntica a los aminoácidos 1-42 de la SEQ ID NO : 7. Las longitudes mínimas de L(12), L(23), L(34), L(45), L(56) y L(67) son 10 aminoácidos, 7 aminoácidos, 9 aminoácidos, 10 aminoácidos, 7 aminoácidos, y 4 aminoácidos, respectivamente. En algunas modalidades, por lo menos dos de L(12), L(34) o L(56) cada uno excede su longitud mínima por lo menos por un aminoácido. En algunas modalidades, por lo menos dos de L(23), L(45) o L(67) cada una excede su longitud mínima por lo menos por un aminoácido.
En otro aspecto, la invención provee una proteína que incluye una secuencia de aminoácidos de la fórmula B(l)-L(12)-B(2)-L(23)-A(3)-L(34)-B(4)-L(45)-A(5)-L(56) -B(6) -L(67) -B(7) . B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponden ya sea a (i) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 3 o una secuencia por lo menos 85% idéntica a los aminoácidos 1-42 de la SEQ ID NO .3 (v.gr., que difiere de los aminoácidos 1-42 en no más de seis posiciones, no más de cinco posiciones, no más de cuatro posiciones, no más de tres posiciones, no más de dos posiciones, o no más de una posición); o (ii) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 6 O una secuencia por lo menos 95% idéntica a los aminoácidos 1-42 de la SEQ ID NO : 6 (v.gr., que difiere de los aminoácidos 1-42 en no más de dos posiciones o no más de una posición) ; o (iii) los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO : 7. Las longitudes mínimas de L(12), L(23), L(34), L(45), L(56) y L(67) son 10 aminoácidos, 7 aminoácidos, 9 aminoácidos, 10 aminoácidos, 7 aminoácidos y 4 aminoácidos, respectivamente, y L(12), L(23), L(34), L(45), L(56) o L(67) excede su longitud mínima por lo menos por un aminoácido. En algunas modalidades, B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO: 3 o una secuencia por lo menos 90% idéntica o por lo menos 95% idéntica a la misma. En algunas modalidades, la proteína específicamente se une a una molécula objetivo preseleccionada de una manera dependiente de la secuencia de aminoácidos de L(12), L(23), L(34), L(45), L(56), y/o L(67) .
Para cualquier proteína que incluye una secuencia de aminoácidos de la fórmula ( 1 ) -L ( 12 ) -B ( 2 ) -L(23)-A(3)-L(34)-B(4)-L(45)-A(5)-L(56)-B(6)-L(67)-B(7), en algunas modalidades, por lo menos dos, por lo menos tres, por lo menos cuatro, por lo menos cinco, o todos los seis de L(12), L(23), L(34), L(45), L(56) y L(67) cada uno excede su longitud mínima por lo menos por un aminoácido. Estas combinaciones de longitudes se ilustran en la siguiente Tabla 1, en la cual "min" indica que la longitud iguala la longitud mínima y ">min" indica que la longitud excede la longitud mínima por lo menos por un aminoácido.
Tabla 1 Modalidad L(12) L(23) L(34) L(45) L(56) L(67) 1 min min min min min min 2 min min min min min >min 3 min min min min >min min 4 min min min min >min >min 5 min min min >min min min 6 min min min >min min >min 7 min min min >min >min min 8 min min min >min >min >min 9 min min >min , min min min 10 min min >min min min >min 11 min min >min min >min min 12 min min >min min >min >min 13 min min >min >min min min 14 min min >min >min min >min 15 min. min >min >min >min min 16 min min >min >min >min >min 17 min >min min min min min . 18 min >min min min min >min 19 min >min min min >min min 20 min >min min min >min >min 21 min >min min >min min min 22 min >min min >min min >min 23 min >min min >min >min min 24 min >min min >min >min >min 25 min >min >min min min min 26 min >min >min min min >min 27 min >min >min min >min min 28 min >min >min min >min >min 29 min >min >min >min min min 30 min >min >min >min min >min 31 min >min >min >min >min min 32 min >min >min >min >min >min 33 >min min min min min min 34 >min min min min min >min 35 >min min min min >min min 36 >min min min min >min >min 37 >min min min >min min min 38 >min min min >min min >min 39 >min min min >min >min min 40 >min min min >min >min >min Tabla 1 cont.
Para cualquier proteína de la invención, en algunas modalidades la proteína incluye un efector establemente asociado con la misma. En este contexto, un "efector" provee una actividad, tal como una actividad terapéutica u otra biológica. Un efector puede ser tan pequeño como un radioisótopo, útil para el suministro local de (preferiblemente una dosis terapéuticamente efectiva de) radiación, o puede ser sustancialmente más grande, tal como una molécula pequeña orgánica (tal como un agente farmacéutico) , un ligando (tal como una citocina, por ejemplo, una interleucina) , una toxina (tal como un agente quimioterapéutico) , una porción de unión, un compuesto macrocíclico, una enzima u otro catalizador, una proteína de señalización, etc. El efector se puede incorporar, v.gr., como una secuencia de aminoácidos, y se puede conectar covalentemente, tal como mediante una porción de entrelazamiento a una cadena lateral de aminoácidos o al amino- o carboxi-terminal de la proteína.
Para cualquier proteína de la invención, en algunas modalidades la proteína incluye un marcador detectable establemente asociado con la misma. El marcador detectable se puede incorporar, v.gr., como una secuencia de aminoácidos, y puede ser covalentemente conectado, tal como mediante una porción de entrelazamiento a una cadena lateral de aminoácidos o al amino- o carboxi-terminal de la proteína. El marcador detectable puede incluir, por ejemplo, un metal coloidal (v.gr., oro coloidal), un radiomarcador, una etiqueta de epítope, una enzima u otro catalizador, un fluoróforo, un cromóforo, un punto de quantum, etc.
Para cualquier proteína de la invención, en algunas modalidades la proteína del armazón proteínico de la invención incluye una proteína portadora establemente asociada con la misma, v.gr., como una proteína de fusión, o covalentemente asociada como por un enlace de disulfuro o un entrelazador químico. La proteína portadora puede ser, por ejemplo, un anticuerpo, ,o una porción del mismo, tal como una porción Fe, un dominio variable de anticuerpo, o una porción scFv. En ciertas modalidades, una proteína portadora heterodimérica, tal. como una portadora heterodimérica diseñada por ingeniería genética como se describe en la publicación de solicitud de patente de E.U.A. US 2007/0287170, se incluye, lo que permite la asociación de una, dos o más proteínas del armazón proteínico de la invención una con otra y/o con otras porciones tales como proteínas de unión, moléculas efectoras, y/o marcadores detectables de una manera diseñada, manipulada por ingeniería genética .
Para cualquier proteína de la invención, en ciertas modalidades, la proteína: no se une específicamente a CD4 ; no incluye un péptido de virus de inmunodeficiencia humana (HIV) ; no incluye un péptido de VIH inmunogénico; no incluye un péptido viral; no incluye un péptido bacteriano; y/o no se combina o co-administra con un adyuvante.
En un aspecto, la invención provee una proteína de fusión que incluye por lo menos dos de las proteínas anteriormente descritas .
En un aspecto, la invención provee una biblioteca de proteína de una pluralidad de proteínas no idénticas. Las proteínas no idénticas son como se describió antes, pero difieren una de otra en las secuencias de aminoácidos de uno o más lazos, o en por lo menos uno de L(12), L(23), L(34), L(45), L(56) o L(67). La invención también provee una biblioteca de ácido nucleico que codifica una biblioteca de proteína, así como ácidos nucleicos que codifican cualesquiera proteínas descritas anteriormente y células que contienen esos ácidos nucleicos. La invención también provee métodos para identificar una proteína que se une específicamente a una molécula objetivo preseleccionada. El método incluye exponer la biblioteca de proteína a una molécula objetivo e identificar por lo menos una proteína asociada con la molécula objetivo.
En un aspecto, la invención provee un método para detectar una molécula objetivo. El método incluye exponer una muestra a una proteína de la invención que tiene una afinidad para la molécula objetivo bajo condiciones que permiten que una molécula objetivo, si está presente, se una a la proteína. El método además incluye detectar la presencia o ausencia de un complejo que incluya la proteína y la molécula objetivo.
La invención también provee un complejo que incluye una molécula objetivo preseleccionada y una proteína de la invención que tiene una afinidad para la molécula objetivo preseleccionada. La proteína opcionalmente incluye un marcador detectable, que puede facilitar la detección del complejo.
En un aspecto, la invención provee un método para unir un objetivo in vivo. El método incluye administrar una proteína de la invención que se une específicamente a un objetivo in vivo. En algunas modalidades, la proteína incluye un marcador detectable, que opcionalmente es adecuada para la formación de imagen in vivo (v.gr., un radiomarcador) . En algunas modalidades, la proteína incluye un efector, tal como un agente terapéutico, una citocina, o una toxina.
• En resumen, la invención se refiere a lo siguiente: · Una proteína que comprende un doblez de Top7, en donde uno o más lazos en el doblez de Top7 se unen específicamente a una molécula objetivo preseleccionada, en donde la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
• Una proteína que comprende un doblez de Top7 que define dos extremos, en donde por lo menos dos lazos en un extremo de la proteína son por lo menos un aminoácido más largo que los lazos correspondientes de Top7.
· Una proteína respectiva, en donde por lo menos uno de los dos lazos se une específicamente a una molécula objetivo preseleccionada.
• Una proteína respectiva, en donde la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
• Una proteína que comprende dos hélices paralelas y cinco cadenas ß antiparalelas; y lazos que conectan las hélices a y cadenas ß, en donde cada uno de dos extremos de la proteína comprende dos lazos que conectan una hélice a con una cadena ß y un lazo que conecta dos cadenas ß, en donde por lo menos dos lazos en un extremo de la proteína son cada uno por lo menos un aminoácido más largo que los lazos correspondientes de Top7.
• Una proteína respectiva, en donde las hélices a y cadenas ß definen un esqueleto de carbono OÍ que tiene una estructura cuya desviación cuadrática media (R SD) de la estructura del esqueleto de carbono de las hélices y cadenas ß de Top7 es no mayor que 4.0.
• Una proteína respectiva, en donde la RMSD es no mayor que 2.0.
• Una proteína respectiva, en donde por lo menos uno de los dos lazos se une específicamente a una molécula objetivo preseleccionada.
• Una proteína respectiva, en donde la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
• Una proteína que comprende dos hélices a paralelas y cinco cadenas ß antiparalelas, las -hélices y cadenas ß definen un esqueleto de carbono que tiene una estructura cuya desviación cuadrática media de la estructura del esqueleto de carbono a de las hélices y cadenas ß de Top7 es no mayor que 4.0; y lazos que conectan las hélices y cadenas ß , en donde cada uno de los dos extremos de la proteína comprende dos lazos que conectan ,una hélice con una cadena ß y un lazo que conecta dos cadenas ß, en donde uno o más de los lazos en un extremo se une específicamente a una molécula objetivo preseleccionada, en donde la proteína se une a la molécula objetivo con una constante de disociación de no más de 10 µ?.
· Una proteína, en donde las hélices a paralelas ("a") y las cadenas ß antiparalelas ("ß") están presentes en un solo polipéptido en el orden ßßaß ßß.
• Una proteína, en donde la proteína comprende por lo menos dos polipéptidos cada uno comprende una hélice o¡ ("a") y tres cadenas ß antiparalelas ("ß") en el orden ßaßß.
• Una proteína, en donde por lo menos tres lazos son por lo menos un aminoácido más largo que el lazo correspondiente de Top7.
• Una proteína respectiva, en donde los tres lazos están en el mismo extremo de la proteína.
• Una proteína que comprende una secuencia de aminoácidos de la fórmula B (4) -L (45) -A(5) - L(56) -B(6) -L(67) -B(7), en donde B(4), A(5), B(6) y B(7) corresponden a los aminoácidos 21-23, 24-32, 33-37 y 38-42 de (i) SEQ ID N0:3 o una secuencia de aminoácidos por lo menos 80% idéntica a los aminoácidos 21-42 de la SEQ ID NO : 3 ; o (ii) SEQ ID NO: 6 o una secuencia de aminoácidos por lo menos 90% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 6; o (iii) por lo menos 95% idéntica a la SEQ ID NO: 7, en donde la longitud mínima de L(45) es 10 aminoácidos, en donde la longitud mínima de L(56) es 7 aminoácidos, en donde la longitud mínima de L(67) es 4 aminoácidos, y en donde por lo menos uno de L(45) , L(56) o L(67) específicamente se une a la molécula objetivo preseleccionada, en donde la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
• Una proteína que comprende una secuencia de aminoácidos de la fórmula B (4 ) -L (45) -A(5) -L (56) -B (6 ) -L (67) -B(7), en donde B(4), A(5), B(6) y B(7) corresponde a los aminoácidos 21-23, 24-32, 33-37 y 38-42 de una secuencia de aminoácidos (i) por lo menos 80% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 3; o (ii) por lo menos 90% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 6; o (iii) por lo menos 95% idéntica a la SEQ ID NO: 7, en donde la longitud mínima de L(45) es 10 aminoácidos, en donde la longitud mínima de L(56) es 7 aminoácidos, en donde la longitud mínima de L(67) es 4 aminoácidos, y en donde por lo menos dos de L(45), L(56) o L(67) cada uno excede su longitud mínima por lo menos por un aminoácido .
· Una proteína, en donde la proteína comprende dos secuencias de aminoácidos de la fórmula B (4 ) -L (45 ) -A ( 5 ) -L(56) -B (6) -L (67) -B (7) .
• Una proteína, en donde por lo menos uno de L(45), L(56) o L(67) específicamente se une a una molécula objetivo preseleccionada, en donde la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
• Una proteína que comprende una secuencia de aminoácidos de la fórmula B (1) -L (12 ) -B (2) -L (23 ) -A(3 ) -L (34 ) -B(4) -L(45) -A(5) -L(56) -B(6) -L(67) -B(7) , en donde B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de (i) una secuencia de aminoácidos por lo menos 80% idéntica a la SEQ ID NO: 3; o (ii) una secuencia por lo menos 90% idéntica a la SEQ ID NO: 6; o (iii) una secuencia por lo menos 95% idéntica a la SEQ ID NO: 7, en donde la longitud mínima de L(12) es 10 aminoácidos, en donde la longitud mínima de L(23) es 7 aminoácidos, en donde la longitud mínima de L(34) es 9 aminoácidos, en donde la longitud mínima de L(45) es 10 aminoácidos, en donde la longitud mínima de L(56) es 7 aminoácidos, en donde la longitud mínima de L(67) es 4 aminoácidos, y en donde por lo menos uno de L(12), L(23), L(34), L(45), L(56) o L(67) específicamente se une a una molécula objetivo preseleccionada, en donde la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ .
• Una proteína respectiva, en donde B(l), B(2), A(3) , B(4), A(5) , B(6) y B(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y'3'8-42 de una secuencia (i) por lo menos 85% idéntica a la SEQ ID NO: 3 o (ii) por lo menos 95% idéntica a la SEQ ID NO: 6.
• Una proteína que comprende una secuencia de aminoácidos de la fórmula B(l) -L(12) -B(2) -L(23) -A(3) -L(34) -B(4) -L(45) -A(5) -L(56) -B(6) -L(67) -B(7) , en donde B(l), B(2), A(3) , B(4), A(5), B(6) yB(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de (i) una secuencia de aminoácidos por lo menos 80% idéntica a la SEQ ID NO: 3; o (ii) una secuencia por lo menos 90% idéntica a la SEQ ID NO: 6; o (iii) una secuencia por lo menos 95% idéntica a la SEQ ID NO:7, en donde la longitud mínima de L(12) es 10 aminoácidos, en donde la longitud mínima de L(23) es 7 aminoácidos, en donde la longitud mínima de L(34) es 9 aminoácidos, en donde la longitud mínima de L(45) es 10 aminoácidos, en donde la longitud mínima de L(56) es 7 aminoácidos, en donde la longitud mínima de L(67) es 4 aminoácidos, y (a) por lo menos dos de L(12) , L(34) o L(56) cada uno excede su longitud mínima por lo menos por un aminoácido; o (b) por lo menos dos de L(23), L(45) o L(67) cada uno excede su longitud mínima por lo menos por un aminoácido.
• Una proteína respectiva, en donde por lo menos dos de L(12), L(34) o L(56) cada uno excede su longitud mínima por lo menos por un aminoácido.
• Una proteína, en donde por lo menos dos de L(23), L(45) o L(67) cada uno excede su longitud mínima por lo menos por un aminoácido.
· Una proteína que comprende una secuencia de aminoácidos de la fórmula B (1) -L (12 ) -B (2 ) -L (23 ) -A (3 ) -L (34 ) -B(4) -L(45) -A(5) -L(56) -B(6) -L(67) -B(7) , en donde B(l), B(2), A(3) , B(4), A(5) , B(6) y B(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de (i) una secuencia de aminoácidos por lo menos 85% idéntica a la SEQ ID NO: 3; o (ii) una secuencia por lo menos 95% idéntica a la SEQ ID NO: 6; o (iii) una secuencia idéntica a la SEQ ID NO: 7, en donde la longitud mínima de L(12) es 10 aminoácidos, en donde la longitud mínima de L(23) es 7 aminoácidos, en donde la longitud mínima de L(34) es 9 aminoácidos, en donde la longitud mínima de L(45) es 10 aminoácidos, en donde la longitud mínima de L(56) es 7 aminoácidos, en donde la longitud mínima de L(67) es 4 aminoácidos, y en donde L(12), L(23), L(34), L(45), L(56) o L(67) excede su longitud mínima por lo menos por un aminoácido.
• Una proteína - respectiva, en donde por lo menos dos de L(12), L(23), L(34), L(45), L(56) o L(67) exceden sus longitudes mínimas por lo menos por un aminoácido.
• Una proteína respectiva, en donde por lo menos tres de L(12), L(23), L(34), L(45), L(56) o L(67) exceden sus longitudes mínimas por lo menos por un aminoácido.
• Una proteína, en donde B(l), B(2), A(3) , B(4), A(5) , B(6) y B(7)- corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de una secuencia por lo menos 90% idéntica a la SEQ ID NO: 3.
• Una proteína, en donde B(l), B(2), A(3), B(4), A(5) , B(6) y B(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de una secuencia por lo menos 95% idéntica a la SEQ ID NO: 3.
· Una proteína, en donde la proteína específicamente se une a una molécula objetivo preseleccionada, en donde la unión específica depende de la secuencia de aminoácidos de la secuencia de aminoácidos de L(12), L(23), L(34), L(45), L(56) o L(67).
· Una proteína, en donde L(12) es más largo que 10 aminoácidos .
• Una proteína, en donde L(23) es más largo que 7 aminoácidos.
• Una proteína, en donde L(34) es más largo que 9 aminoácidos.
• Una proteína, en donde L(45) es más largo que 10 aminoácidos .
• Una proteína, en donde L(56) es más largo que 7 aminoácidos .
· Una proteína, en donde L(67) es más largo que 4 aminoácidos .
• Una proteína, que comprende además un efector establemente asociado con la misma.
• Una proteína, que comprende además a marcador detectable establemente asociado con la misma.
• Una proteína, en dónde la proteína no se une específicamente a CD4.
• Una proteína, en donde la proteína no comprende un péptido de virus de inmunodeficiencia humana.
· Una proteína, en donde la proteína no comprende un péptido de virus de inmunodeficiencia humana inmunogénico .
• Una proteína, en donde la proteína no comprende un péptido viral .
• Una proteína, en donde la proteína no comprende un péptido bacteriano.
• Una proteína de fusión que comprende por lo menos dos proteínas como se especificó antes y en las reivindicaciones .
• Una biblioteca de proteína que comprende una pluralidad de proteínas no idénticas como se especifica antes y más adelante, en donde las proteínas no idénticas difieren unas de otras en las secuencias de aminoácidos de uno o más de los lazos .
• Una biblioteca de proteína que comprende una pluralidad de proteínas no idénticas como se especifica antes y más adelante, en donde las proteínas no idénticas difieren unas de otras en las secuencias de aminoácidos de uno o más de L(45) , L(56) o L(67) .
• Una biblioteca de proteína que comprende una pluralidad de proteínas no idénticas cada una como se especifica antes y más adelante, en donde las proteínas no idénticas tienen secuencias de aminoácidos que difieren en por lo menos uno de L(12), L(23), L(34), L(45), L(56) o L(67) .
· Una biblioteca de ácido nucleico que codifica esa biblioteca de proteína.
• Un ácido nucleico que codifica a proteína o una proteína de fusión como se especifica antes y más adelante.
• Un complejo que comprende una proteína como se especifica, y la molécula objetivo preseleccionada .
• Un complejo respectivo, que comprende además un marcador detectable .
• Un método de identificación de una proteína que específicamente se une a una molécula objetivo preseleccionada, el método comprende (i) exponer una biblioteca de proteína como se especifica a una molécula objetivo; y (ii) identificar por lo menos una proteína asociada con la molécula objetivo.
• Un método para detectar una molécula objetivo, el método comprende (i) exponer una muestra a una proteína como se especifica bajo condiciones que permiten que una molécula objetivo, si está presente, se una a la proteína; y detectar la presencia o ausencia de un complejo que comprende la proteína y la molécula objetivo.
« Un método de unión a un objetivo in vivo, el método comprende administrar una proteína como se especifica, en donde la proteína específicamente se une a un objetivo in vivo.
• Un método respectivo, en donde la proteína además comprende un marcador detectable.
• Un método respectivo, en donde la proteína además comprende un efector establemente asociado con la misma.
Estos y otros aspectos y ventajas de la invención serán evidentes al considerar las siguientes figuras, descripción detallada y reivindicaciones.
Breve Descripción de las Figuras La figura 1 ilustra la estructura tridimensional de Top7 , como se ve a lo largo del eje de la primera cadena ß. La flecha blanca indica la orientación contra las manecillas del reloj de los primeros tres elementos estructurales de la proteína, que empieza a partir de la primera cadena ß cuando se ve desde el N-terminal de la proteína.
La figura 2 contiene la base de datos del Banco de Datos de Proteína (1QYS) con las coordenadas atómicas de la estructura de To 7.
La figura 3 ilustra el ordenamiento de elementos de estructura secundaria, lazos y extremos en la estructura de Top .
Las figuras 4A y 4B ilustran las estructuras de un dominio VH de anticuerpo y Top7( respectivamente.
La figura 5 provee una alineación de las secuencias de aminoácidos de Top7 (SEQ ID No. 4), RD1.3, y RDILibl.
La figura 6 ilustra un ácido nucleico ilustrativo de la invención.
La figura 7 ilustra un método ilustrativo para entremezclar lazos entre miembros de una biblioteca.
La figura 8 provee una alineación de secuencias de aminoácidos ilustrativas de la invención.
La figura 9 provee secuencias de aminoácidos ilustrativas adicionales de la invención con SEQ ID NOs : 2, 3, 5, 6 y 7.
Las figuras 10 y 11 son alineaciones de proteínas derivadas de RDILibl ilustrativas con una afinidad para el dominio variable de un anticuerpo a la cadena aV de integrinas OÍV humanas.
La figura 12 es una alineación de proteínas derivadas de RDILibl ilustrativas con una afinidad para el dominio variable de un anticuerpo KS .
Las figuras 13 y 14 son alineaciones de proteínas derivadas de RDILibl ilustrativas con una afinidad para el dominio variable de un anticuerpo anti-CD19.
La figura 15 es una alineación de proteínas del armazón proteínico ilustrativas que portan lazos injertados de proteínas de unión seleccionadas de una biblioteca.
La figura 16 es un cromatograma de exclusión de tamaño de una proteína de fusión de Fc-RDI ilustrativa.
La figura 17 es un cromatograma de exclusión de tamaño de una proteína de fusión de Fc-RDI-DI-DeLys ilustrativa .
La figura 18 es un cromatograma de exclusión de tamaño de una proteína de fusión de Fc-"Guy 1" ilustrativa.
La figura 19 ilustra secuencias de aminoácidos ilustrativas adicionales, de la invención. Estas incluyen: 6-1, una proteína Top7 con un sitio de glicosilación mutado; 6-2 a 6-4, variantes ligeras de RD1.3, 6-5 a 6-9, variantes RDl .3 con menos epítopos inmunogénicos y menos lisinas; 6-10 = un miembro de biblioteca de RDl del ejemplo 9; y 6-11, una variante en la proteína M7 de Dallüge et al.
Descripción Detallada de la Invención La invención se basa, en parte, en la apreciación de que la estabilidad y estructura de proteínas relacionadas con Top7 permite su uso como un armazón proteínico para la presentación de una o más secuencias heterólogas de aminoácidos, que pueden ser insertadas en el armazón proteínico y/o pueden reemplazar aminoácidos existentes del armazón proteínico.
El doblez de Top7 Las secuencias heterólogas de aminoácidos pueden ser insertadas en una proteína que incorpora elementos del doblez de Top7. La estructura de la proteína Top7, como se determina por cristalografía de rayos X por Kuhlman et al. ((2003) Science 302:1364-1368 y depositada en la Base de Datos de Proteína con el número de acceso IQYS, se muestra en la figura 1. Las coordenadas de la estructura también se presentan en la figura 2. Como se ve en la figura 1, Top7 es una proteína de dos capas, con dos hélices OÍ paralelas en un lado de la proteína que forma una primera capa (la capa inferior en la figura 1) empacada contra una segunda capa (la capa superior en la figura 1) formada de cinco cadenas ß antiparalelas. Cada elemento de estructura secundaria (hélice a o cadena ß) es directamente conectado al siguiente. En otras palabras, ninguno de los lazos atraviesa la longitud de un elemento estructural para conectar el "extremo cercano" de un elemento al "extremo lejano" del siguiente; más bien, los lazos conectan los extremos más cercanos de los elementos.
El ordenamiento de los elementos de estructura secundaria de Top7 en el polipéptido Top7 se muestra en la figura 3. En la figura 3, las cinco cadenas ß se ilustran como flechas y las dos hélices se ilustran como cilindros. Los elementos son numerados secuencialmente de 1-7, con base en el orden en el cual aparecen en la secuencia de aminoácidos de To 7. Por lo tanto, las cadenas ß ("ß") y hélices a ("a") están presentes en el orden ßßaß ßß, y las primeras dos cadenas ß son numeradas 1 y 2; la primera hélice a es numerada 3; la siguiente cadena ß es numerada 4; la segunda hélice OÍ es numerada 5 , y las últimas dos cadenas ß son numeradas 6 y 7. Aunque el orden de los elementos, del amino terminal al carboxi terminal de Top7, es 1234567, en la . figura 3 el orden de los elementos de izquierda a derecha es 2134576. Esto refleja que la lámina ß de Top7 está ordenada con la segunda cadena ß ("2") en el lado de la lámina, seguida por la primera cadena ß ("1"), la tercera cadena ß (elemento estructural "4"), la quinta cadena ß (elemento estructural "7") y, en el extremo lejano de la lámina, la cuarta cadena ß (elemento estructural "6") . En la figure 3, los lazos que conectan los elementos se nombran de conformidad con los elementos estructurales que conectan. Por lo tanto, el lazo que conecta los elementos 1 y 2 se nombra "Lazo 12," el lazo que conecta los elementos 2 y 3 se nombra "Lazo 23," y así sucesivamente. El extremo de la proteína que incluye los lazos 12, 34 y 56 se denomina el "extremo norte" y el extremo de la proteína que incluye los lazos 23, 45 y 67 se denomina el "extremo sur" .
En la figura 1, la proteína Top7 es orientada para proveer una perspectiva que mira desde el N-terminal de la proteína hacia la primera cadena ß (elemento estructural "1") . Como se ve en la figura 1, las hélices se colocan con respecto a las cadenas ß de tal manera que una línea trazada desde la primera cadena ß a la segunda cadena ß y la primera hélice a procedería en una dirección contraria a las manecillas del reloj (mostrada con la flecha blanca) La topología- de la proteína Top7 nunca se ha observado en proteínas naturales . La estructura global fue diseñada de novo por Kuhlman et al., quien intencionalmente seleccionó una topología -novedosa para la proteína. Una vez que las restricciones topológicas se fijaron, Kuhlman et al. usó una "estrategia computacional que itera entre diseño de secuencia y predicción de estructura" para diseñar, in silico, una proteína de 93 aminoácidos (Top7) con una estructura tridimensional particular predichá. Kuhlman et al. encontró que la proteína podría ser expresada como una proteína monomérica altamente soluble con una estructura 3-D que concordara con la estructura in silico predicha. De hecho, la estructura del esqueleto de proteína experimentalmente determinada tiene una desviación cuadrática media ("RMSD") de sólo 1.1 A de la estructura in silico. Top7 es también excepcionalmente estable, ya que el calentamiento de la proteína a 98°C no parece desnaturalizar la proteína. Incluso en presencia de 4.8 M del clorhidrato de guanidina desnaturalizante, temperaturas que exceden 80°C se requieren para desnaturalizar completamente la proteína.
De manera intrigante, también se ha reportado que los 49 aminoácidos de Top7 C-terminales también pueden ser eficientemente expresados como un homodímero excepcionalmente estable (Dantas et al. (2006) J. Mol. Biol. 362:1004-1024). Estos 49 aminoácidos incluyen la tercera cadena ß, la segunda hélice a, y las últimas dos cadenas ß de Top7 (es decir, elementos estructurales 4, 5, 6 y 7, en el orden ßaßß) . Cada subunidad retiene el mismo doblez que la secuencia correspondiente tiene en Top7 de longitud completa, con una hélice a empacada contra tres cadenas de una lámina ß. Igual que Top7, el homodímero forma una estructura de dos capas globular con dos hélices a en una capa empacada contra una segunda capa de cadenas ß antiparalelas, aunque mientras que la lámina ß de Top7 tiene cinco cadenas ß antiparalelas, el homodímero tiene seis. Igual que Top7, el homodímero es extremadamente estable, ya que Dantas et al. reportó que la estructura secundaria para una solución 12 µ? del fragmento C-terminal ("CFr") parece invariable a 98 °C o en clorhidrato de guanidina 3M y que, incluso en clorhidrato de guanidina 4 M, se requieren temperaturas que exceden 80°C para desnaturalizar por completo la proteína. Dantas et al. tuvo éxito en estabilización posterior de CFr al introducir un enlace de disulfuro que conecta el N- y C-terminal del fragmento; este fragmento estabilizado, denominado "SS.CFR", sólo empieza a desdoblarse a clorhidrato de guanidina 6.5 M, una concentración de desnaturalizante que desdobla casi completamente CFr y Top7.
Como la estructura de Top7 fue diseñada de novo, quizás no es sorprendente que secuencias de aminoácidos ampliamente diferentes se puedan seleccionar in silico para lograr el doblez de Top7. Por ejemplo, Dallüge et al. usaron un algoritmo diferente, con base en formaciones de esqueleto de tetrapéptido, para crear secuencias de polipéptido de novo predichas para adoptar el doblez de Top7 ( (2007) Proteins 68:839-849). Dos de sus secuencias de polipéptido diseñadas, M5 y M7 , cada una doblada en proteínas que se reportó que eran estables a todas las temperaturas accesibles en ausencia de desnaturalizante y que no fueron completamente desnaturalizadas a -80°C en presencia de clorhidrato de guanidina 4M (o incluso clorhidrato de guanidina 6M, para M7) . Ni la proteína es más de 30% idéntica a la secuencia de aminoácidos de Top7.
Inserciones/secuencias heterólogas Por lo tanto, las tecnologías existentes permiten el diseño de proteínas de secuencia ampliamente variable, cada una sin embargo demuestra doblez apropiado y una estabilidad que permite latitud significativa en la introducción de secuencias heterólogas. Estas secuencias heterólogas se pueden usar para reemplazar aminoácidos en los elementos de estructura secundaria de los armazones proteínicos, o en los lazos de interconexión. Alternativamente, o además, las secuencias heterólogas pueden ser insertadas en la molécula de armazón proteínico, preferiblemente dentro de uno o más de' los lazos de interconexión. Las secuencias heterólogas también pueden ser anexadas al N- y/o C-terminal del armazón proteínico.
Como se muestra en la figura 3, Top7 de longitud completa incluye seis lazos de interconexión, que la figura 3 identifica como lazos 12, 23, 34, 45, 56 y 67. Para armazones proteínicos que tienen una estructura completa de Top7, las secuencias heterólogas pueden ser insertadas en cualquiera de estos lazos, o en cualquier combinación de estos lazos. Las proteínas que incluyen sólo una porción de la estructura de Top7, tal como CFr o derivados de la misma (v.gr., SS.CFr) también se pueden usar como armazones proteínicos. Cuando sólo una porción de la estructura de Top7 está presente, las secuencias heterólogas pueden ser insertadas en cualquiera de los lazos presentes en esa porción. Por lo tanto, por ejemplo, CFr incluye los lazos 45, 56 y 67, cualquiera o todos los cuales podrían incorporar secuencias heterólogas.
En algunas modalidades de la invención, las secuencias heterólogas son introducidas en múltiples lazos del armazón proteínico, preferiblemente en el mismo extremo de la proteína. Tres lazos están presentes en cada extremo de la proteína, reminiscentes de las CDRs en dominios variables de anticuerpo. Como se muestra en las figuras 4A-4B, los lazos de Top7 y los lazos de CDRs de anticuerpo están orientados más o menos de manera similar. De hecho, el lazo 12 en Top7 es casi exactamente el mismo que CDR3 en un dominio VH. Por lo tanto, armazones proteínicos que incorporan una o- más características de Top7 se pueden usar como el marco de trabajo de un dominio variable de anticuerpo para presentar lazos de secuencia variable, algunos de los cuales tendrán en forma separada o en combinación una afinidad útil para una molécula objetivo.
Secuencias de aminoácidos Debido a que las secuencias de aminoácidos con poca identidad de secuencia (v.gr., menor que 30% de identidad, como se observa en M5 y 7) sin embargo pueden doblarse en estructuras estables adecuadas para usarse como armazones proteínicos, una amplia variedad de secuencias de aminoácidos correspondientemente son abarcadas por la presente invención. Más allá de Top7, los armazones proteínicos útiles incluyen, por ejemplo, CFr; SS.CFr; proteínas descritas en Dállüge et al., que incluyen pero no se limitan a M5 y M7. El armazón proteínico puede incorporar cualquier mutación que no impida el doblez apropiado. Por ejemplo, de las diecisiete mutaciones puntuales manipuladas por ingeniería genética en Top7 en atters et al. (2007) CeH 128: 613-624, ninguna' de ellas (K41 E/K42E/K57E; F17Q/Y19L; G14A; Y21L; L29A; N34G; V48A; F63A; A64G/A65G; L67A; G85A; y V90A) impidió el doblez apropiado de la proteína. De manera no sorprendente, puesto que Top7, M7 , y otras proteínas relacionadas son excepcionalmente estables, pueden incorporar varias mutaciones sin perder su única característica requerida, es decir, su capacidad para doblarse en una estructura estable.
Un armazón proteínico relacionado con Top7 se refiere aquí como "RDl.3/1.4 de Consenso" y se presenta como SEQ ID NO: 5. RDl.3/1.4 de Consenso representa una variante de Top7 manipulada por ingeniería genética para incorporar varias substituciones de aminoácidos. Otro armazón proteínico relacionado con Top7 se refiere aquí como RDl-DI-DeLys, y representa una variante de RDl .3 manipulada por ingeniería genética para reducir el número de residuos de lisina presentes en la proteína, lo que facilita modificación específica del sitio de residuos de lisina y reduce las oportunidades para la proteólisis. RDl-DI-DeLys también ha sido manipulada por ingeniería genética para reducir la disponibilidad de epítopos potencialmente inmunogénicos . La secuencia de aminoácidos de RDl-DI-DeLys se presenta como SEQ ID NO: 2. Por consiguiente, algunos armazones proteínicos que se pueden usar en la práctica de la invención tienen secuencias de aminoácidos que asemejan porciones de RDl .3 y/o RDl-DI-DeLys. Ciertas porciones de RDl.3/1.4 de Consenso de sus siete elementos estructurales han sido concatenadas y presentadas en SEQ ID NO: 6; porciones correspondientes de RDl-DI-DeLys han sido concatenadas y presentadas en SEQ ID NO : 3. Para cada una de SEQ ID NO : 3 y SEQ ID NO : 6 , los aminoácidos 1-5 corresponden a una porción de la primera cadena ß; los aminoácidos 6-8 corresponden a una porción de la segunda cadena ß ; los aminoácidos 9-20 corresponden a una porción de la primera hélice ; los aminoácidos 21-23 corresponden a una porción de la tercera cadena ß; los aminoácidos 24-32 corresponden a una porción de la segunda hélice a; los aminoácidos 33-37 corresponden a una porción de la cuarta cadena ß ; y los aminoácidos 38-42 corresponden a una porción de la quinta cadena ß.
Dado que se entiende que los extremos de la proteína, que incluyen los extremos de los elementos estructurales y los lazos de interconexión, se pueden variar significativamente o reemplazar completamente en un armazón proteínico, estas porciones de RD1.3/1.4 de Consenso y RDl-DI-DeLys han sido omitidas de SEQ ID NO: 6 y SEQ ID NO: 3. Sin embargo, se entiende que los elementos estructurales se conectarán por lazos de interconexión que, en la mayoría de los casos, serán secuencias de aminoácidos que incluyen por lo menos tantos aminoácidos como se encuentran normalmente para separar esos elementos estructurales (v.gr., el número de aminoácidos que separan las porciones correspondientes de Top7. Por lo tanto, por ejemplo, un armazón proteínico que incluye una secuencia de aminoácidos de la fórmula B(l)-L(12) -B(2) -L(23) -A (3) -L(34) -B(4) -L(45) -A (5) -L(56) -B(6) -L(67) -B(7) se puede usar, en donde B(l), B(2), A(3) , B(4), A(5) , B(6) y B(7) corresponden generalmente a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de la SEQ ID N0:3, o una secuencia por lo menos 80% idéntica a la SEQ ID NO.3, o SEQ ID NO: 6, o una secuencia por lo menos 90% idéntica a la SEQ ID NO: 6. Las longitudes mínimas de L(12), L(23), L(34) , L(45) , L(56) , L(67) son generalmente 10, 7, 9, 10, 7 y 4 aminoácidos, respectivamente. A menudo, uno, dos, tres o más de 1. (12), L(23), L(34), L(45), L(56) y L(67) exceden sus longitudes mínimas, tal como por 1-3 aminoácidos, por 2-6 aminoácidos, por 3-8 aminoácidos, por 4-12 aminoácidos, o por 5-14 aminoácidos o más.
Alternativamente, como se demuestra con CFr, se puede usar cualquier porción de una. molécula similar a Top7 que es capaz de doblarse confiablemente. Por lo tanto, por ejemplo, se puede usar un armazón proteínico que incluye una secuencia de aminoácidos de la fórmula B (4 ) -L (45) -A(5)--L (56) -B(6) -L(67) -B(7) , en donde B(4), A(5), B(6) y B(7) corresponden generalmente a los aminoácidos 21-23, 24-32, 33-37 y 38-42 de la SEQ ID NO: 3, o una secuencia por lo menos 80% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 3, o por lo menos 90% idéntica a los aminoácidos 21-42 de la SEQ ID NO: 6.
Bibliotecas y selección Una ventaja de una molécula de armazón estable es que permite la preparación de bibliotecas de proteínas que presentan secuencias aleatorizadas . Proteínas individuales con una propiedad deseada, tal como la capacidad para unirse a una molécula objetivo preseleccionada, pueden ser aisladas de la biblioteca. Las secuencias aleatorizadas pueden incluir secuencias de lazo aleatorizadas, que incluyen inserciones aleatorizadas en secuencias de lazo, y también pueden incluir secuencias aleatorizadas en los elementos estructurales de la proteína del armazón, en cualquier combinación. Un ejemplo de una biblioteca de proteína, denotada "RDlLibl" , se ilustra en la figura 5 y su secuencia se presenta como SEQ ID NO: 7. Como se muestra en la figura 5, RDlLibl reemplaza cinco aminoácidos del lazo 12 con ocho aminoácidos aleatorios (X) ,· aleatoriza una posición de aminoácido en elemento estructural 2, reemplaza seis aminoácidos del lazo 34 con ocho aminoácidos aleatorios, aleatoriza un aminoácido en el elemento estructural 4, aleatoriza tres aminoácidos en el lazo 56 y aleatoriza los últimos dos aminoácidos de la proteína. Más allá de aleatorizar cualquier combinación de lazos 12, 23, 34, 45, 56 y 67, una biblioteca de proteína puede incluir aleatorización u otra modificación en las posiciones correspondientes, por ejemplo, a cualquiera de las siguientes posiciones de Top7 : N7, D16, R47, N78, y/o E89 de la cadena ß sobre el extremo norte; N3 , T20, S49, T80 y T87 de las cadenas ß en el extremo sur; K39 a Q41 y A70 y D71 de las hélices a del extremo norte; y/o E26 y K55-E57 de las hélices a del extremo sur. Además, residuos que son internos y cerca de los extremos podrían ser aleatorizados , a fin de proveer un "cimiento" de forma diferente para la superficie de unión. Por ejemplo, los aminoácidos en las posiciones correspondientes a uno o más de 18, V46, 177, F69, y 138 de Top7 podrían ser aleatorizadas en una biblioteca de proteína.
Los N- y C-terminales de una biblioteca de proteína también pueden ser aleatorizados con respecto a composición y longitud, por ejemplo, el N- o C- terminal de la proteína podría ser acortado por un residuo, comparado con RD1.3 , o extendido hasta por diez residuos. La localización aleatorizada de codones de detención en el extremo de la proteína se podrían usar para generar la diversidad de longitud en el C-terminal.
En algunos casos, la aleatoriedad de una posición de aminoácido puede ser restringida, v.gr., para evitar residuos de cisteína, para evitar residuos de lisina o para favorecer aminoácidos hidrofílicos para reducir inmnogenicidad.
Una biblioteca de proteína se puede construir en el contexto de vectores de plásmido o vectores de fago, por ejemplo. Es particularmente útil construir esos vectores y sistemas . hospederos en una forma que los miembros de la biblioteca de proteína que se unen a un objetivo dado se puedan seleccionar. Por ejemplo, sistemas de despliegue que usan fagos de cadena sencilla tales como M13 o fd, fagos de doble cadena tales como T7 o lambda, proteína de flagelos u otras proteínas de superficie de bacterias tales como E. coli, despliegue a base de ribosoma, despliegue de AR mensajero, proteínas de superficie tales como Aga2 de levadura o sistemas únicamente de proteína se pueden usar.
Una vez que se ha preparado una biblioteca de proteína, los miembros de la biblioteca se pueden seleccionar con base en afinidad para una molécula objetivo preseleccionada, tal como un ácido nucleico, un dominio variable de anticuerpo, un azúcar, un oligosacárido, un lípido u otro compuesto orgánico o inorgánico. En un tipo de protocolo de selección, una biblioteca de proteína es expresada en un fago tal como M13 o T7 de conformidad con técnicas estándares. Cabe notar que una ventaja para armazones proteínicos relacionados con Top7 es que el N-terminal y C-terminal están disponibles para fusión genética a una proteína hospedera, y el extremo opuesto se puede usar para inserción de lazo y fusión de péptido. Las bibliotecas de proteína descritas en los ejemplos tienen sus N-terminales fusionadas a proteína de revestimiento T7 y C-terminal y extremo de unión adyacente disponibles. La orientación de reversa es también practicable, por lo que el extremó de unión sería orientado en el extremo N-terminal del armazón, y su C-terminal fusionado a una proteína de despliegue, tal como la proteína del gen III del bacteriófago M13.
Como un ejemplo, una biblioteca de armazón de expresión de fago se puede aplicar a un objetivo inmovilizado bajo condiciones que favorecen la unión, uno o más pasos de lavado se ejecutan, y después los fagos unidos se eluyen mediante el uso de condiciones tales como sal elevada, pH bajo o elevado, un detergente tal como SDS, u otras condiciones de solvente determinadas por las necesidades particulares del experimento. Los fagos eluidos son expandidos, por ejemplo, por crecimiento en hospedero bacteriano. Técnicas a base de PCR también se pueden usar para expandir ácidos nucleicos que codifican proteínas de unión potenciales después del paso de unión/selección seguido por reclonación en el vector apropiado y empaque en una partícula de fago o transformación en un hospedero bacteriano. Después de la amplificación, la población que ha sido enriquecida para estos fagos que codifican proteínas de unión específica es nuevamente expuesta a la molécula objetivo preseleccionada, enlazadores seleccionados en esta nueva ronda, y el ciclo de recuperación se repite. Este ciclo es opcionalmente repetido, por ejemplo, tres a cinco veces. Si se desea, el éxito de- los pasos de enriquecimiento se puede monitorear por titulación del número de fagos que son retenidos después de cada paso; el título debe incrementar si ocurre enriquecimiento. En cierto punto, que puede ser indicado por titulación del número de fagos que se adhieren después de cada paso de unión o que pueden ser determinados por experimentación de rutina, es útil para probar candidatos individuales para la capacidad para unirse a un objetivo dado. Los ejemplos 5 y 6 describen métodos particulares para ese análisis, aunque se puede usar una amplia variedad de métodos.
En otras circunstancias, es útil seleccionar proteínas de unión de una biblioteca y después recombinar porciones aleatorizadas de miembros de la población seleccionada unos con otros para generar proteínas de unión que pueden tener afinidad más alta. Ácidos nucleicos Las proteínas de la invención pueden ser expresadas mediante el uso de cualquier ácido nucleico adecuado que codifique la proteína o biblioteca de proteína, en cualquier sistema procariótico (bacteriano) o eucariótico (v.gr., levadura, insecto o mamífero, tal como un humano, primate, hámster, etc.) . Para bibliotecas de proteína puede ser ventajoso incorporar sitios de restricción para facilitar la excisión y transferencia del ácido nucleico que codifica la proteína. Sitios de restricción apropiadamente colocados también pueden facilitar la excisión selectiva de uno o más lazos u otras secuencias aleatorizadas . Un ácido nucleico ilustrativo se ilustra en la figura 6. La figura 6 ilustra un ácido nucleico con sitios de inserción en los lazos 12, 34 y 56. Cada lazo es flanqueado por dos sitios de restricción, que permiten la excisión selectiva- (y/o inserción) de secuencia de lazo de interés.
Por ejemplo, los sitios de restricción de intervención se pueden usar para "entremezclar" lazos entre miembros de una biblioteca. Un ejemplo se ilustra en la figura 7. Como se muestra en la figura 7, después de que los miembro de una biblioteca han sido seleccionados para proteínas con una propiedad particular (tal como una afinidad para un objetivo particular) , los miembros de biblioteca pueden ser cortados en uno o más sitios de restricción internos y nuevamente ligados, lo que conduce a la recombinación y re-entremezclado de lazos entre miembros de biblioteca, que pude conducir a la identificación de interaccionadores de afinidad mayor.
A lo largo de la descripción, en donde se describen composiciones que tienen, incluyen o comprenden componentes específicos, se contempla que las composiciones también consisten esencialmente de o consisten de, los componentes mencionados. De manera similar, en donde se describen procedimientos que tienen, incluyen o comprenden pasos de procedimiento específicos, los procedimientos también consisten esencialmente de, o consisten de, los pasos de procedimiento mencionados. Excepto en donde se indica de otra manera, el orden de los pasos u orden para realizar ciertas acciones son inmateriales siempre que la invención permanezca operable. Más aún, a menos que se indique otra' cosa, dos o más pasos o acciones se pueden conducir en forma simultánea.
Ejemplos La invención se explica con más detalle con referencia a los siguientes ejemplos, que han de ser considerados como ilustrativos y no considerados como limitantes del alcance de la invención como se expone en las reivindicaciones anexas.
Ejemplo 1 Propiedades termodinámicas de armazones proteínicos con inserciones de péptido Para confirmar la adecuación de RD1.3 como un armazón proteínico que contiene lazos de péptido aleatorios grandes, los lazos 12, 34 y 56 son reemplazados por ocho glicinas cada uno. Estos se escogieron debido a que la glicina es la de más alteración de todos los aminoácidos desde un punto de vista de entropía de estructura de base -si la proteína aún se dobla y es estable con 8 glicinas, debe doblarse con la mayoría de otras secuencia aleatorias razonablemente solubles. Otra secuencia, el lazo de 15 aminoácidos "péptido S" también se insertó en la proteína RD1.3, sola y en combinación con los lazos de glicina. El péptido S es parte de la enzima ARNasa-S que se sabe que se une a la enzima truncada y la completa, lo que restaura la función. Este péptido, como una inserción de lazo, proveería tanto una unión como una prueba enzimática para demostrar la capacidad de RD1.3 para desplegar lazos útiles. La secuencia de aminoácidos de cada una de estas proteínas de prueba se muestra alineada a la secuencia Top7 en la figura 8.
Cada proteína probada, con los lazos de glicina o los lazos de glicina y los lazos de péptido S, fue soluble y homogénea. Hubo poca agregación, incluso después de múltiples ciclos de congelamiento-descongelamiento y almacenamiento a largo plazo a 4°C. Cada solución de proteína fue estable a 4-5 mg/ml. Por lo tanto, incluso las inserciones de entropía alta grandes son bien toleradas, supuestamente debido a la estabilidad sustancial de la estructura de inicio de RD1.3.
Ejemplo 2 Armazones proteínicos diseñados Una variedad de proteínas relacionadas con Top7 fueron diseñadas para usarse como armazones proteínicos. Las secuencias de aminoácidos de las proteínas se ilustran en la alineación mostrada en la figura 9. Como es evidente en la figura 9, inserciones en cada uno de los lazos 12, 23, 34, 45, 56 y 67 fueron exitosamente diseñadas con o sin mutaciones puntuales en varias posiciones a lo largo del armazón proteínico. Se contempla que estas proteínas, y otras proteínas relacionadas por lo menos 50% idénticas, por lo menos 60% idénticas, por lo menos 70% idénticas, por lo menos 80% idénticas, por lo menos 90% idénticas, o por lo menos 95% idénticas a una o más de estas proteínas o a las hélices a y cadenas ß de una o más de estas proteínas, son útiles como armazones proteínicos y como la base para bibliotecas de proteína que incorporan una o más secuencias heterologas como se describe en esta solicitud.
Ejemplo 3 Diseño y síntesis de biblioteca RDlLibl ilustrativa Para construir una biblioteca de genes con lazos de péptido variables, se utilizaron las siguientes técnicas. Primero, se escogió un conjunto de aminoácidos y distribuciones de frecuencia, como se indica en la siguiente tabla.
En esta construcción de biblioteca particular, sólo se escogieron 11 aminoácidos. Será evidente para los expertos en la técnica de ingeniería de proteína que se puede usar una variedad de aminoácidos y distribuciones. A menudo es útil evitar el uso de cisteína, porque este aminoácido puede conducir a la formación de enlaces de disulfuro no deseados, y selenocisteína, porque este aminoácido es codificado por un codón UGA que también puede ser interpretado como un codón de detención.
Los oligonucleótidos listados a continuación se obtuvieron a partir de un proveedor comercial (TriLink BioTechnologies (San Diego, CA) ) .
SEQ. El: Ll GCT CCT GAT GTA CAG GTA ACC CGT (XXX) , GAC XXX TAC TAT GCA TAC ACG GTG ACC SEQ. E2: L2 CTG AAC GAG CTC AAA GAC TAC ATT AAA (XXX) ß GTT XXX ATT TCT ATT ACC GCG CGC ACT AAA SEQ. E3 r L3 AA GTA TTC GCT GAC CTA GGA (XXX)3 ATT AAC GTC ACT TGG ACC GGT GAC ACA SEQ. E4: C-TERM ( "CT" ) ACT TGG ACC GGT GAC ACA GTA ACA GTA GAA GGA (XXX) 2 TAA TAA CTC GAG GAA GCT TGG Los codones marcados "XXX" son inserciones de la mezcla de codones descrita anteriormente. Los sitios de restricción están subrayados. Para cada uno de los cuatro oligonucleótidos con segmentos aleatorios, un par de cebadores de PCR fueron sintetizados (mostrados a continuación) que se unen a las colas fijas. Los sitios de reconocimiento de enzima de restricción están subrayados y las enzimas de restricción apropiadas se listan debajo de la secuencia.
Ll: 5' GCT CCT GA_CTA_CAG GTA ACC CGT 3' (Ll-F) BsrGI 5' GGT CAC CGT GTA TGC ATA GTA 3' (Ll-R) Nsil L2: 5' CTG AAC GAG CTC AAA GAC TAC ATT AAA 3' (L2-F) Sacl 5' TTT ÁGT GCG CGC GGT AAT AGA AAT 3' (L2-R) BssHI L3: 5' AA GTA TTC GCT GAC CTA GGA 3' (L3-F) Avrll 5* TGT GTC ACC GGT CCA AGT GAC GTT AAT 3' (L3-R) C-term (CT) : 5' ACT TGG ACC GGT GAC ACA GTA ACA GTA GAA GGA 3' (CT-F) 5' CCA AGC TTC CTC GAG TTA TTA 3' (CT-R) xhoi En estos y todos los ejemplos subsecuentes, la amplificación por PCR se realizó bajo condiciones estándares, y las reacciones se monitorearon por gel de agarosa. Cuando la banda de producto fue claramente visible y no incrementó significativamente en intensidad entre dos muestras tomadas dos ciclos aparte, la reacción se consideró completa. A fin de asegurar ADN de doble cadena limpio durante estos pasos de amplificación, generalmente se usó la siguiente modificación para procedimientos de PCR estándares. Cuando el ADN es simplificado por PCR, durante los ciclos posteriores la realineación del ADN de longitud completa se puede completar con alineación de cebador. En el caso de un acervo de oligonucleótidos diversos, este efecto puede conducir a regiones de ADN no pareadas, en donde las porciones fijas se alinean, lo que deja las regiones aleatorias no pareadas como túbulos . Particularmente si el túbulo está cerca de un sitio de restricción que no se ha de usar para clonar, esas regiones de cadena sencilla pueden reducir la eficiencia de ligación. Para crear ADN de doble cadena completamente sin las regiones no pareadas, el producto de PCR completamente amplificado fue diluido tres veces en mezcla de PCR fresca con los mismos cebadores, y se realizó un solo ciclo de desnaturalización, alineación de cebador y alargamiento. Toda la digestión de restricción se realizó con enzimas compradas de New England Biolabs (Beverly, MA) , mediante el uso de reguladores de pH suministrados y ocasionalmente modificados como se describe.
Los lazos individuales con segmentos aleatorios se combinaron en un acervo de genes que codifican esencialmente proteínas de longitud completa como sigue . Cada uno de los cuatro acervos de oligonucleótidos fue amplificado mediante el uso de oligonucleótidos directos y de reversa apropiados listados anteriormente. A partir de las reacciones de PCR de L3 y CT, un µ? de cada reacción se combinó después en 100 µ? de reacción de PCR fresca, y se amplificó posteriormente mediante el uso de oligonucleótidos L3-F y CT-R. Este acervo de oligonucleótido más largo, que comprendía tanto los elementos de diversidad de L3 y CT, se denominó L3/CT.
La reacción L3/CT se limpió con extracción de fenol/cloroformo/alcohol isoamílico (25:24:1), seguido por extracción con cloroformo 2X y precipitación de etanol . El ADN se disolvió en regulador de pH después se cortó con enzima de restricción Avrll y Xhol en una sola reacción en regulador de pH NEB 2 complementado con BSA, a 37°C, al seguir las instrucciones del fabricante. Las reacciones Ll y L2 también fueron limpiadas con extracción de fenol/cloroformo/alcohol isoamílico (25:24:1), seguido por extracción con cloroformo 2X y precipitación de etanol. El ADN de Ll fue digerido con BsrGI en regulador de pH 2 de NEB más BSA a 37°C, después 1/20 volumen de NaCl 1M y 1/25 volumen de TRIS-HC1 1M (pH 7.9) se añadió, y el ADN posteriormente digerido con Nsil a 37°C. El ADN de L2 fue digerido con Sacl en regulador de pH NEB 1 más BSA a 37°C, después BssHII se añadió y la muestra fue digerida a 50°C, de conformidad ' con las instrucciones del fabricante. Se hicieron tres alícuotas de pUC19 que contenían el gen de armazón. La primera alícuota fue digerida con enzima de restricción Avrll y Xhol en una sola reacción en regulador de pH de NEB 2 complementado con BSA, a 37°C, al seguir las instrucciones del fabricante. La segunda alícuota fue digerida con BsrGI en regulador de pH de NEB 2 más BSA a 37°C, después se añadió 1/20 de volumen de NaCl 1M y.1/25 de volumen de TRIS-HC1 1M (pH 7.9), y el ADN posteriormente fue digerido con Nsil a 37 °C. La tercera alícuota fue digerida con Sacl en regulador de pH NEB 1 más BSA a 37 °C, después BssHII se añadió y la muestra fue digerida a 50°C, de conformidad con las instrucciones del fabricante. No se añadió fosfatasa alcalina a ninguna de las reacciones anteriores.
El ADN digerido con Ll, L2 , y L3/CT fue purificado en gel por separado mediante el uso de 3% de geles de agarosa de fusión baja con colorante Gel-Star (Cambrex, Walkersville, MD) , de acuerdo con las instrucciones el fabricante. Bandas correctas fueron cortadas y el ADN extraído mediante el uso de fenol tibio seguido por cloroformo (2 X) y precipitación de etanol . Cada alícuota de pUC19/RDl doblemente digerida fue purificada por gel separadamente en 0.8% de geles de agarosa hechos con colorante Gel-Star, de conformidad con instrucciones del fabricante. Las bandas fueron cortadas y el ADN extraído mediante el uso de un kit de extracción de gel Qiagen.
El siguiente paso en la construcción de la biblioteca fue ligar cada uno de los tres ADN recortados con segmentos de diversidad en el vector linealizado purificado que había sido digerido con las mismas dos enzimas de restricción que el ADN que ha de ser insertado. Para que se realizara cada una de las tres ligaciones, una reacción de ligación de 20 µ? se preparó con 50 nanogramos de vector linealizado, un exceso molar de tres veces de ADN de inserto que contenía diversidad, y el regulador de pH y enzima apropiados (New England Biolabs, Beverly, A) , de conformidad las instrucciones del fabricante. Los resultados de esta ligación fue un conjunto, de tres acervos de ADN de vector circularizados , cada uno de los cuales contenía el gen de RD1 con diversidad en una de las tres regiones (Ll, L2, o L3/CT) . Puesto que no se usó fosfatasa alcalina en ningún punto, el vector circularizado generalmente no debe tener mellas, pero no sería apretadamente superenrrollado .
La transformación bacteriana es un proceso ineficiente, en donde la mayor parte del vector circularizado no es exitosamente transformada. A fin de conservar la complejidad de biblioteca máxima, se usó el siguiente procedimiento para extraer y amplificar virtualmente toda la diversidad de ADN exitosamente ligada. 5 µ? del material ligado se puso directamente en una reacción de PCR de 100 µ? con cebadores que se alinearon al vector de pUC en cualquier lado del inserto (M13For y 13Rev) . Se realizó PCR, con puntos de tiempo de 5 µ? removidos cada dos ciclos después de aproximadamente 10 ciclos. Con base en la cantidad de ADN presente en los puntos de tiempo, la cantidad mínima de ADN de biblioteca ligada competente- de PCR en la mezcla antes del inicio de PCR se retro-calculó, con base en la tasa de amplificación máxima de duplicación de cada ciclo. El cálculo usó la siguiente ecuación: C >= m / (2??) , en donde C es complejidad inicial (número de moléculas de las cuales los genes que contienen diversidad pueden ser extraídos por PCR) , y m es el número de moléculas en la reacción de PCR después de n ciclos de PCR. Como un ejemplo, el fragmento de pUC19 que contenía armazón proteínico amplificado por PCR con M13For y M13Rev es aproximadamente de 590 pares de bases. Después de n ciclos de PCR, la cantidad total de ADN de longitud 590 en la reacción de PCR se puede medir al comparar la intensidad de la banda (del punto de tiempo 'n') con las bandas de un marcador cuantitativo tal como masa baja (Invitrogen, Carlsbad, CA) . Si después de, por ejemplo, 10 ciclos (n=10) la banda tiene 50 ng de ADN, de 4 µ? de PCR (12.5 ng/µ?) , entonces el resto, v.gr., 80 µ? de reacción de PCR tiene 80 µ? * 12.5 ng/µ? = 1000 ng = 1 pg. Un fragmento de ADN de · doble caden de 590 pares de bases tiene un peso molecular de aproximadamente 590 p.b.. * (660 AMU / p.b..) = 3.9E+05 AMU/molécula. Para calcular el número de moléculas en 1 gramo: (6.02E+23 moléculas/mol) / (3.9E+05 gramos/mol) = 1.5E+18 moléculas/g = 1.5E+12 moléculas/^g . Para calcular la complejidad inicial mínima C, m = 1.5E+12 y n = 10. Por lo tanto, C = 1.5E+12 / (2?10) = 1.5E+09. Para Ll y L2 , si C excedió 1.0E+09, la complejidad se consideró suficiente y el ADN ligado se usó para el siguiente paso. Para L3/CT, C > 10E+06 se consideró suficiente.
Ensamble de la biblioteca RDlLibl completa: Se han diseñado cebadores para amplificar asimétricamente el gen de armazón del vector pUC19. pUC-Top+600, es aproximadamente 600 p.b. removida del inserto (en el lado que contenía el N-terminal de la proteína expresada) , mientras que pUC de fondo +150 es aproximadamente 150 p.b. para el otro lado del inserto. Cuando un gen del armazón es amplificado mediante el uso de estos iniciadores, el fragmento de PCR puede ser cortado por cualquier enzima con un sitio de reconocimiento único dentro o que delimita el gen y los dos fragmentos resultantes diferirán por lo menos por 100 p.b., por lo que pueden ser fácilmente separados por electroforesis de gel de agarosa.
La mezcla final de productos de reacción de Ll .1/L2.1/L3.1/CT se estimó que tenía una complejidad de por lo menos 5xl09.
Kits de empaque de sistema de despliegue de fagos selecto T7 (P/N 70014) y ADN de vector selecto 10-3 T7 (P/N 70548) se obtuvieron de Novagen (San Diego, CA) y una biblioteca que usó el producto de reacción Ll .1/L2.1/L3.1/CT se construyó de conformidad con las instrucciones del fabricante.
El producto de reacción Ll .1/L2.1/L3.1/CT fue digerido con EcoRI y HindIII, purificado en gel, después ligado en brazos de vector 10-3b T7 a una relación molar de 3:1 de inserto:ADN de fago. Después de ligación durante la noche de 20 ug de brazos de vector en un volumen de 200 microlitros, la reacción de ligación se mezcló después con un total de 1 mi de extracto de empaque y se incubó durante 2 horas a temperatura ambiente, se diluyó 9:1 con LB estéril, después se tituló, todo de conformidad con las instrucciones del fabricante. El título dio un número total de fago empacado de 1.5 x 109. La secuenciación subsecuente de la biblioteca reveló que aproximadamente 30% de los genes tuvieron un desplazamiento de marco, de modo que la complejidad de biblioteca de los genes de armazón de longitud completa fue de aproximadamente 1 x 109. El fago se expandió en 1 litro de E. coli, cepa 5403 (CalBiochem) , y bajo lisis los fagos fueron concentrados dos veces por precipitación de PEG seguido por purificación de gradiente de CsCI y diálisis, como se describe por las instrucciones del kit de biblioteca de fago.
Cabe notar que algunas variaciones en este procedimiento para crear una biblioteca se pueden realizar. Por ejemplo, para la biblioteca descrita anteriormente, se usó la versión l0-3b del fago T7 ; esta versión expresa aproximadamente 5 a 15 copias de proteína de fusión sobre la superficie de cada partícula de fago, de conformidad con el fabricante (Novagen) . También es posible usar otros genomas de fago, tales como 1-lb, que despliegan 0.1 a 1 proteína de fusión/partícula de fago, de conformidad con el mismo fabricante.
Ejemplo 4 Selección de proteínas de unión Proteínas individuales que se unen a objetivos específicos se aislaron de la biblioteca RDlLibl basada en T7 construida en el ejemplo 3 por los siguientes procedimientos. En términos generales, el procedimiento general fue unir una proteína objetivo a esferas, mezclar la biblioteca T7 -RDlLibl con las esferas, lavar, eluir los fagos T7 unidos, infectar E. coli con los fagos eluidos para expandir esta población, y proceder a través de varios ciclos más de unión, elusión y expansión hasta que una fracción significativa de la población de fago expresara una proteína que se une al objetivo. En este punto, los miembros de biblioteca individuales se probaron para su capacidad para unirse al objetivo y opcionalmente para no unirse a moléculas objetivo relacionadas. En algunos casos, se incluyeron pasos de selección negativos. Por ejemplo, cuando se aislan proteína que se unen específicamente a un par de región de anticuerpo V particular, un paso de selección negativa contra un anticuerpo con las mismas regiones constantes pero diferentes dominios V se realizó generalmente antes de seleccionar proteínas que se unieran a un anticuerpo con el objetivo de región V deseado.
Por ejemplo, se identificaron proteínas que se unieron específicamente a las regiones V de un anticuerpo anti-CD19 (véase publicación de solicitud de patente No. US2007/0154473) ; un anticuerpo 14.18 humanizado (véase patente de E.U.A. No. 7,169,904); ov un anticuerpo anti-EpCAM (véase patente de E.U.A. No. 6,969,517). Las proteínas de anticuerpo fueron producidas a partir de líneas de células de mamífero genéticamente manipuladas como se describe.
Los siguientes procedimientos específicos se usaron para selecciones específicas en el aislamiento de proteínas que se unen al anticuerpo anti-CD19. La estrategia global fue realizar una ronda de selección positiva bajo condiciones de astringencia baja, amplificar el fago seleccionado, realizar una ronda de selección negativa seguido inmediatamente de una segunda ronda de selección positiva bajo condiciones más astringentes, otra ronda de amplificación, un paso de redistribución en el cual los ADN que codifican porciones de N- y C-terminales de las poblaciones RD1 seleccionadas se combinan y subsecuentemente se colocan en un vector de expresión T7 de copia baja, seguido por una ronda de selección positiva y dos rondas de selecciones negativa más positiva, con amplificaciones después de las rondas de selección positiva. Al final de este proceso, miembros de biblioteca individuales se probaron como se describe en los ejemplos 5 y 6.
Para producir un sustrato de unión, el anticuerpo anti-CD19 se unió primero a esferas de DYNAL revestidas con estreptavidina (producto 112.06 de Invitrogen Corp., Carlsbad, CA) mediante el uso de un antisuero anti-humano de cabra biotinilado como un puente (Jackson Immunolabs, MD) . Para preparar una sola ronda de selección, aproximadamente 100 µ? de esferas a 6.7xl08 esferas/ml se colocaron en un tubo de plástico de 1.5 mi en una gradilla magnética y se dejaron sedimentar durante aproximadamente 1 minuto hasta que todas las esferas estaban apretadamente sostenidas contra el lado del tubo. El sobrenadante se removió, 1 mi de TBS (Pierce) se añadió, las esferas se mezclaron en el TBS, las esferas nuevamente se dejaron sedimentar en la gradilla magnética, se extrajo el sobrenadante, 1 mi de TBS se añadió nuevamente y las esferas nuevamente se dejaron sedimentar. Finalmente las · esferas fueron resuspendidas en aproximadamente 30 µ? de TBS. Aproximadamente 10 pg de anticuerpo anti-humano de cabra biotinilado en forma de 20 µ? de abastecimiento de glicerol se añadieron a las esferas. La suspensión se colocó sobre un rotor y se dejó girar durante aproximadamente 6 a 9 horas a temperatura ambiente . Las esferas después se lavaron 4 veces en 1 mi de TBS y se resuspendieron en 30 µ? de TBS.
Para seleccionar inicialmente miembros de biblioteca que se unen a regiones V de anticuerpo anti-CD19, aproximadamente 10 µg del anticuerpo anti-CD19 se mezclaron con las esferas. El tubo se colocó sobre el rotor durante la noche a 4°C para permitir que el anticuerpo anti-CD19 se uniera al IgG anti-humano de cabra sobre las esferas. A la mañana siguiente, las esferas se lavaron dos veces en 1 mi de TBS como se describió antes, se resuspendieron en 3% de BSA en PBS, se hicieron girar durante otras 2 horas a temperatura ambiente, se lavaron dos veces en 1 mi de TBS, y se resuspendieron en una solución que contenía partículas de fago T7 preparadas al mezclar e incubar 100 µ? de biblioteca T7-RDlLibl con un título de 5x1o11 a 1Ó12 unidades formadoras de placa por mi y 11 µ? de 30% de BSA durante 2 horas a temperatura ambiente. La mezcla que contenía el fago y las esferas se incubó durante aproximadamente 30 a 60 minutos a temperatura ambiente en el rotor. Las esferas con fago adsorbido se lavaron después seis veces en 1 mi de TBS con Tween 20 al 0.05% a temperatura ambiente. Después de cada adición de TBS-Tween, las esferas se dejaron suspender durante 1 minuto, después se separaron magnéticamente como se describió antes, el sobrenadante se removió y se añadió TBS-Tween fresco. Después de cada lavado, la mezcla se pasó a un tubo nuevo. Después del lavado final, el fago unido se eluyó de las esferas al añadir 100 µ? de SDS al 1% en TBS, se incubó durante 5 minutos, y se removió el sobrenadante de las esferas magnéticamente como se describió antes. Los 100 µ? de sobrenadante se añadieron inmediatamente a 900 µ? de TBS.
Los fagos seleccionados fueron amplificados como sigue. Aproximadamente 20 a 30 µ? del fago eluido se removieron para titulación y el resto se añadió a 35 mi de E. coli 5403 que crecía exponencialmente a 37°C en un medio rico complementado con 50 mg/1 de ampicilina a una D.O. de aproximadamente 0.5. El cultivo fue aireado a 37°C hasta lisis, que usualmente ocurrió después de aproximadamente 2-4 horas y fue definido por una caída en la D.O. a menos de 0.3 y la presencia de residuos viscosos. En este punto, 3.5 mi de NaCl 3M se añadió, el cultivo fue transferido a un tubo de 50 mi y se centrífugo a 8,000 x G durante 10 minutos para remover los residuos . El sobrenadante se removió un tubo fresco y 1/5 volumen de 50% de polietilenglicol (PEG) 8000 en agua se añadió, se mezcló y se dejó incubar a 4°C durante la noche. A la mañana siguiente, el precipitado de PEG se hizo girar a 10,000 G durante 20 minutos, y el comprimido se obtuvo después de remover cuidadosamente todo el sobrenadante. El comprimido fue resuspendido en 3 mi de TBS, dividido en dos tubos de plástico de 2 mi y se hizo girar en una microcentrífuga a una velocidad máxima durante 10 minutos para remover los residuos, y el sobrenadante se recolectó. Aproximadamente 1/6 volumen de 50% de PEG se añadió a cada tubo durante un segundo paso de precipitación y la mezcla se incubó sobre hielo durante 60 minutos y después se hizo girar a velocidad máxima durante 10 minutos en una microcentrífuga. El sobrenadante se desechó y el comprimido se resuspendió en 300 µ? de TBS . La solución resultante se hizo girar nuevamente a velocidad máxima en una microcentrífuga durante 10 minutos para remover residuos. El sobrenadante resultante se tituló y contenía típicamente aproximadamente 5x1o11 partículas de fago (pfu) por mi. Esta preparación se usó para los siguientes pasos.
Después se realizó un paso de selección negativa. El anticuerpo monoclonal hul4.18 se unió a esferas de DYNAL a través de antisuero anti-humano de cabra biotinilado como se describió antes. 100 µ? de la preparación de fago producida como se describe en el párrafo anterior fue adsorbida a las esferas durante 1 hora a temperatura ambiente en una solución de regulador de pH de bloqueo lx. Las esferas estaban magnéticamente separadas como se describió antes, y el sobrenadante se extrajo. Este sobrenadante después se usó para realizar una segunda ronda de selección positiva realizada como se describió antes, excepto que las mezclas de adsorción de esfera de fago se lavaron 12 veces durante un minuto cada una con TBS que contenía Tween al 0.1%. El propósito de estos cambios fue incrementar la astringencia de selección. Los fagos unidos fueron eluidos, expandidos y purificados como se describió antes. La preparación de fago resultante fue titulada. La preparación de fago después se usó para realizar otra ronda de selección negativa y positiva mediante el uso de las mismas condiciones descritas al ' principio de este párrafo, cuyos propósitos dobles fueron servir como un respaldo en caso de que fallaran los siguientes pasos, y proveer una indicación de la trayectoria de la selección. El número de fago que sobrevivió a esta tercera ronda de selección fue significativamente incrementada en comparación con el número de fagos que sobrevivió la segunda ronda de selección, lo que sugiere un enriquecimiento de secuencias de unión.
La población de fago amplificada de la segunda ronda de selección se usó para generar proteínas recombinadas por el siguiente procedimiento. Sin desear estar limitado por la teoría, el razonamiento para este paso fue que las interacciones proteína-objetivo de los fagos inicialmente seleccionados se pudo deber sólo a un subconjunto de los lazos en un miembro de biblioteca RDlLibl dado, y que la unión más apretada se puedo lograr al parear esos lazos con una variedad de lazos en otras posiciones, seguido por selección de enlazadores apretados. Este paso es análogo a los pasos que naturalmente introducen diversidad en secuencias de anticuerpo.
Aproximadamente 1 µ? de la preparación de fago que había sido eluida de la segunda selección y amplificada, así como 1 µ? de la población de fagos no seleccionada inicial, se usaron para iniciar una amplificación por PCR de secuencias codificantes de miembro de biblioteca. Cada reacción de amplificación se cicló hasta que apareció una banda fuerte sobre un gel, que representó aproximadamente 10 ng/µ? en la reacción. La reacción después fue diluida 2-3 veces con regulador de pH de PCR fresco, dNTPs, polimerasa y cebadores, y un solo ciclo se realizó para reducir la incidencia de miembros de biblioteca imperfectamente pareados.
Los productos amplificados fueron purificados con un kit de Qiagen y cortados con la enzima de restricción BstAPI, que dio por resultado la producción de cuatro fragmentos: un fragmento 5' y un fragmento 3' de la población seleccionada, y un fragmento 5' y un fragmento 3' de la población no seleccionada. Estos fueron purificados en gel de conformidad con procedimientos estándares.
Tres reacciones de ligación se realizaron entonces: 5' seleccionado más 3' seleccionado; 5' no seleccionado más 3' seleccionado; y 5' seleccionado más 3' no seleccionado. Cada reacción de ligación fue amplificada. Durante las amplificaciones, se extrajeron muestras en varios tiempos y se cuantificaron sobre un gel de agarosa, a partir del cual se verificó que por lo menos aproximadamente 109 moléculas ligadas independientes y amplificables habían sido creadas en cada reacción de ligación. Las mezclas de reacción de ligación fueron purificadas con un kit de Qiagen y digeridas simultáneamente con EcoRI y HindIII. Un fragmento de ADN de 320 pb fue purificado en gel y después ligado en T7Select 1-lb y empacado mediante el uso de un kit de empaque in vitro de Novagen de conformidad con las instrucciones del fabricante.
La nueva biblioteca fue amplificada y concentrada por el mismo protocolo que la biblioteca original, lo que dio por resultado suspensiones de fago concentradas con título de por lo menos 5.0 x 1011/ml. Los procedimientos de selección delineados anteriormente se usaron para seleccionar enlazadores de alta afinidad de la nueva biblioteca. En este caso, la tercera ronda de selección no fue para respaldar sino que la ronda final de la cual los enlazadores mejores fueron determinados selectivamente.
Ejemplo 5 Miembros de biblioteca RDlLibl a base de fagos individuales para unión a proteínas objetivo Después de una serie de selecciones para proteínas de unión a base de fago, las poblaciones resultantes generalmente contendrán una mezcla de algunos fagos que expresan un miembro de biblioteca que se une a un objetivo y otros fagos que no lo hacen. Para identificar fagos individuales que expresan miembro de biblioteca RDlLibl capaz de unirse a un objetivo dado, placas de tipo ELISA fueron revestidas con una molécula objetivo particular, fagos clónales que expresaban un miembro de biblioteca se añadieron, y la extensión de la unión de fago fue detectada mediante el uso de un anticuerpo contra una proteína de cápside de fago mayor.
El siguiente protocolo específico se usó en algunos casos. Los pozos de inmunoplacas Nunc-Immuno Module MaxiSorp 8-Framed Immunoplates (catálogo CA#468667) fueron incubados con 100 µ? de 1 µg/ml de proteína objetivo durante la noche a 4°C para revestir el pozo con la proteína objetivo. Los pozos fueron lavados cuatro veces con PBS más Tween-20 al 0.05%. Los pozos fueron incubados durante 2 horas a temperatura ambiente con 100 µ? de PBS más 3% de albúmina de suero de bovino para bloquear, y nuevamente lavados cuatro veces con PBS más Tween-20 'al 0.05%.
En paralelo, fagos clónales que expresaban un miembro de biblioteca RDlLibl específico fueron generados como sigue. La recolección de fagos de la selección en el ejemplo 4 fueron titulados de conformidad con procedimientos estándares. De una placa de agar con placas de pozos separados por lo menos 1-2 mm de diámetro, placas individuales fueron usadas como tapones de agar mediante el uso de 200 µ? de puntas de pipeta de agujero ancho y colocadas en los pozos de una placa de fondo de U de 96 pozos de plástico Falcon que contenía 50 µ? de regulador de pH TE (100 mM Tris/HCl pH 8.0, 10 mM EDTA, pH 8.0) en cada pozo. Las placas se agitaron sobre un agitador de mesa (Eppendorf) a temperatura ambiente durante aproximadamente 30 minutos para eluir las partículas de fago, aproximadamente 100 µ? de E. coli cepa 5403 que crecía exponencialmente (Novagen) a una D.O. de 0.5 a 600 nm se colocó en los pozos de una segunda placa de cultivo de tejido e fondo de U de 96 pozos y aproximadamente de 15 a 20 µ? de fago eluido se añadieron de la primera placa de 96 pozos. Dos pozos se dejaron libres de fago para usarse como controles de modo que la lisis pudiera ser observada visualmente. La placa se cubrió con "cinta respirable" y se colocó en un agitador giratorio New Brunswick a aproximadamente 900-1000 rotaciones por minuto. La placa se monitoreó visualmente para lisis, que usualmente ocurrió después de aproximadamente 2 o más horas. Aproximadamente 20 µ? de lisado crudo de cada pozo se añadió después a los pozos de una placa de fondo redondo de 1 mi Costar 3958, en donde cada pozo contenía 0.7 mi de E. coli cepa 5403 que crecía exponencialmente a una D.O. de aproximadamente 0.5. La placa fue cubierta con cinta respirable y se colocó en un agitador giratorio New Brunswick a aproximadamente 900-1000 rotaciones por minuto. La placa se monitoreó visualmente para lisis, que usualmente ocurrió después de aproximadamente 2 o más horas.
Para cada placa de 96 pozos de clones de fago aislados, una placa de ELISA de 96 pozos fue revestida con objetivo como se describió antes, y una placa de ELISA de 96 pozos fue revestida con una molécula no objetivo para servir como un control negativo. En el caso de un objetivo de anticuerpo anti-CD19, la segunda placa contenía ya sea anticuerpo KS quimérico o anticuerpo quimérico 14.18. 100 µ? de fago filtrado fueron extraídos de cada pozo de la preparación de fago, después 50 µ? son añadidos al pozo correspondiente sobre las placas de ELISA revestidas con objetivo y 50 µ? se añadieron a un pozo en la placa de control negativo. Las placas objetivo y de control, fueron incubadas durante aproximadamente 1 hora a temperatura ambiente. Las placas fueron lavadas cuatro veces con PBS más Tween-20 al 0.05%. Aproximadamente 100 µ? de una dilución de 1:10,000 de un anticuerpo monoclonal de proteína de cola anti-T7 (Novagen catálogo # 71530; Madison, I) se añadieron a cada pozo, y la incubación procedió durante aproximadamente 1 hora a temperatura ambiente. Las placas se lavaron cuatro veces con PBS más Tween 20 al 0.05%. Aproximadamente 100 µ? de IgG anti-ratón de cabra, Fe HRP (Jackson Immuno catálogo # 115-035-071) a 1:10,000 se añadieron y la incubación procedió durante aproximadamente 1 hora a temperatura ambiente . Las placas se lavaron cuatro veces con PBS más Tween 20 al 0.05%. Aproximadamente 100 µ? de solución de HRP de componente Bio FX TMB TMBW 1000-01 se añadieron a cada pozo durante aproximadamente 10-20 minutos, la reacción se terminó mediante la adición de 100 µ? de HC1 1 N, y las placas se leyeron a 450 nm en un espectrofotómetro de lectura de placas.
Ejemplo 6 Prueba de miembros de biblioteca RDlLibl aislados para unión a proteínas objetivo Como una alternativa o después del paso para la caracterización descrita en el ejemplo 5, el procedimiento descrito más adelante se usó para generar miembros de biblioteca etiquetados con histidina derivados de los miembros de biblioteca a base de fago generados en el ejemplo 4, pero separados del fago.
Como primer paso, una 'mini-biblioteca' fue generada a partir del fago seleccionado mediante amplificación por PCR de los segmentps que codifican RDlLibl dentro de los ADNs de fagos . El ADN resultante se cortó con las enzimas Ncol y Xhol, y se insertó en el vector pET30 (Novagen) , de tal manera que una versión etiquetada con histidina N-terminal de cada miembro de biblioteca RDlLibl sería expresado. Las reacciones de ligación se realizaron de conformidad con condiciones estándares y células BIrl (Novagen) fueron transformadas con la mezcla de reacción de ligación y se colocaron en placas con LB + 50 mg/litros de Kanamicina de conformidad con procedimientos estándares.
Colonias individuales fueron recogidas en placas de 96 pozos de fondo redondo con 100 µ? de 2x-NZCYM-Kan' en cada pozo, y se hicieron crecer durante la noche a 37 grados C, con agitación a aproximadamente 900 RPM. El día siguiente, los cultivos durante la noche se diluyeron 1:50 ó 1:100 en una placa de 96 pozos de pozo profundo nuevas con 1 mi de 2xNZCYM + Kan, que crecieron a 37°C durante varias horas hasta que un pozo típico mostró una DO a 600 nm de 0.5, inducido con IPTG 0.5 mM y después se dejó crecer a 37°C durante 4 horas adicionales. Este paso da por resultado la expresión citoplásmica de miembros de biblioteca etiquetados con histidina individuales. Los cultivos después se lisaron mediante el uso ,ya sea de "Bug Buster" o "Pop Culture" (ambos de Novagen) , de conformidad con las instrucciones del fabricante. Después del paso de centrifugación que remueve residuos de células después de lisis, el sobrenadante se movió a una placa fresca. Este sobrenadante contenía las proteínas de RDlLibl soluble . Los pozos aleatorios se seleccionaron para PAGE, para asegurarse que la expresión fue adecuada por lo menos en un número significativo de los clones. Los cultivos durante la noche originales fueron retenidos, ya sea como abastecimientos de glicerol a menos 80 °C, o como una réplica en una placa de LB-Kan, para secuenciación futura o prueba adicional.
Las propiedades de unión de los varios clones se probaron como sigue. Para cada placa de 96 pozos de clones, dos placas de 96 pozos Nickel-NTA (Pierce) se prepararon, una para ser experimental y la otra un control. 80 µ? de regulador de pH de unión (NaCl 300 mM, fosfato de sodio 25 mM, pH 8.0) se añadió a cada pozo en ambas placas, después 20 µ? de sobrenadante de la preparación RDl se añadió a las dos placas, en la misma posición como en la preparación original. El lisado se mezcló bien con el regulador de pH de unión, después se dejó incubar durante una hora, para saturar lo más completamente posible los sitios de Nickel-NTA en el fondo de la placa. Las placas después se lavaron 4 veces con TBS más Tween al 0.05% (TBS-T) . Dos soluciones se prepararon en TBS, una con el objetivo (anti-CD19) a 2 µg/ml, la otra con el control negativo (14.18) también a 2 g/ml. 100 µ? de la solución objetivo se añadió a cada pozo de las placas experimentales, y 100 µ? de la solución de control añadida, a cada pozo de las placas de control. Después de una hora, las placas se lavaron 4x con TBS-T, después anticuerpo de IgG (Fe) anti-humano de cabra conjugado a. HRP (Jackson Immunolaboratories) a una dilución de 1:10,000 en TBS se añadió y se incubó durante 1 hora. Las placas después se lavaron 4x en TBS-T, y la señal desarrollada por la adición de 100 µ?/???? de Bio-FX TMB como se describe en el ejemplo 5.
Aproximadamente 50% de los miembros de biblioteca RDlLibl probados parecieron unirse al objetivo de molécula de anti-CD19 preseleccionada . En este caso, los miembros de biblioteca también se probaron para unirse al anticuerpo 14.18. Sólo uno de los miembros de biblioteca seleccionados también pareció unirse a 14.18. Este miembro de biblioteca muy probablemente se une a una región constante de los anticuerpos, y por lo tanto parece representar un escape de los pasos de selección negativa descrita en el ejemplo 4.
Tomados juntos, estos resultados confirman que los miembros de biblioteca de RDlUbl pueden ser identificados que se unen a una molécula objetivo preseleccionada de una manera específica.
Ejemplo 7 Proteínas de unión a dominio variable de anticuerpo anti-ocV Una biblioteca RDlLibl fue exitosamente determinada selectivamente para proteínas con una afinidad para el dominio variable de un anticuerpo a la cadena V de integrinas aV humanas (véase patente de E.U.A. No. 5,985,278). Las secuencias de aminoácidos de las proteínas identificadas se presentan en las figuras 10 y 11.
Ejemplo 8 Proteínas de unión a KS Una biblioteca RDlLibl fue exitosamente determinada selectivamente para proteínas con una afinidad para el dominio variable de un anticuerpo KS humanizado, que reconoce el antígeno EpCAM humano. Las secuencias de aminoácidos de las proteínas identificadas se presentan en la figura 12.
Ejemplo 9 Proteínas de unión a dominio variable de anticuerpo anti-CDI Una biblioteca RDlLibl fue exitosamente determinada selectivamente para proteínas con una afinidad para el dominio variable de un anticuerpo anti-CD19. Las secuencias de aminoácidos de las proteínas identificadas se presentan en las figuras 13 y 14.
Una proteína de unión a anticuerpo anti-CD19, designada CIO, se seleccionó para un trabajo de diseño de proteína adicional. De manera específica, proteínas adicionales se diseñaron en las cuales las secuencias aleatorizadas de CIO fueron injertadas en secuencias de armazón proteínico alternativas. El primer armazón proteínico, designado "RDl no CHO" o simplemente "no CHO, " es una versión de RDl .3 con un sitio de glicosilación mutado. El segundo armazón proteínico, designado "DI," es una versión desinmunizada de RDl.3. El tercer armazón proteínico, designado "DI-DeLys " , es una versión de DI en el cual cada lisina ha sido reemplazada por una arginina. Una proteína de unión a IgG, designada D26, también se seleccionó para el injerto de sus secuencias aleatorizadas en estos otros armazones proteínicos. Las secuencias de aminoácidos resultantes se ilustran en la figura 15.
Ejemplo 10 Confirmación de non-agregación de variantes RDl y proteínas de fusión Fe Tres proteínas de armazón proteínico fueron sometidas a cromatografía de exclusión de tamaño para confirmar que las proteínas estaban presentes principalmente como monómeros no agregados. Estas incluían una proteína de fusión con un fragmento de anticuerpo Fe en el N-terminal de la proteína de fusión y RDl .3 en el C-terminal ; RDl-DI-DeLys ; y variante RDl'"Guy 1" de la figura 9. Los cromatogramas de exclusión de tamaño para Fe-RDl, RDl-DI-DeLys , y Guy 1 se muestran en la figuras 16, 17 y 18, respectivamente. Como se puede ver en las figuras, cada proteína está presente principalmente como un pico sencillo en los cromatogramas, lo que indica que la proteína está presente en una forma no agregada .
Ejemplo 11 Síntesis de variantes adicionales Proteínas de armazón proteínico de variantes adicionales fueron diseñadas y sintetizadas. Las secuencias de estas proteínas se ilustran en la figura 19. Estas incluyen: 6-1, una proteína Top7 con un sitio de glicosilación mutado; 6-2 a 6-4, variantes ligeras de RDl.3, 6-5 a 6-9, variantes RDl.3 con menos epítopos inmunogénicos y menos lisinas; 6-10 = un. miembro de biblioteca RDl del ejemplo 9; y 6-11, una variante sobre la proteína M7 de Dallüge et al . Todas estas proteínas fueron exitosamente expresadas, como se determina por electroforesis de gel de desnaturalización y no desnaturalización subsecuente.
La invención puede ser modalizada en otras formas sin apartarse del espíritu o características esenciales de las mismas. Las modalidades anteriores por lo tanto han de ser consideradas en todos los aspectos ilustrativos y no limitantes sobre la invención descrita aquí. El alcance de la invención está por lo tanto indicado por las reivindicaciones anexas y no por la descripción anterior, y todos los cambios que caen dentro del significado e intervalo de equivalencia de las reivindicaciones se pretende que sean abarcados en la presente .
Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (27)

REIVINDICACIONES Habiéndose descrito la invención como antecede, se reclama como, propiedad lo contenido en las . siguientes reivindicaciones.
1. Una proteína que se deriva de proteína Top7 de tipo silvestre caracterizada porque comprende dos hélices a paralelas y cinco cadenas ß antiparalelas; y lazos que conectan las hélices a y cadenas ß, por lo que cada uno de los dos extremos de la proteína comprenden dos lazos que conectan una hélice a con una cadena ß y un lazo que conectan dos cadenas ß, en donde por lo menos dos lazos en un extremo de la proteína son cada uno por lo menos un aminoácido más largo que los lazos correspondientes de Top7, y por lo menos uno de los dos lazos se une específicamente a una molécula objetivo preseleccionada.
2. La proteína de conformidad con la reivindicación 1, caracterizada porque las hélices a y cadenas ß definen un esqueleto de carbono que tiene una estructura cuya desviación cuadrática media (RMSD) de la estructura del esqueleto de carbono a de las hélices o¡ y cadenas ß de Top7 es no mayor que 4.0.
3. La proteína de conformidad con la reivindicación 2, caracterizada porque el RMSD es no mayor que 2.0.
4. La proteína de conformidad con cualquiera de las reivindicaciones 1-3, caracterizada porque se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?. .
5. La proteína de conformidad con cualquiera de las reivindicaciones 1-4, caracterizada porque las hélices paralelas ("a") y las cadenas ß antiparalelas ("ß") están presentes en un solo polipéptido en el orden ßßaßaßß.
6. La proteína de conformidad con cualquiera de las reivindicaciones 1-5, caracterizada porque comprende por lo menos dos polipéptidos cada uno de los cuales comprende una hélice ("a") y tres cadenas ß antiparalelas ("ß") en el orden ßaßß.
7. La proteína de conformidad con cualquiera de las reivindicaciones 1-6, caracterizada porque por lo menos tres lazos son por lo menos un aminoácido más largo que el lazo de Top7 correspondiente .
8. La proteína de conformidad con la reivindicación 7, caracterizada porque los tres lazos están en el mismo extremo de la proteína.
9. La proteína de conformidad con cualquiera de las reivindicaciones 1-8, caracterizada porque comprende una secuencia de aminoácidos de la fórmula B (4) -L (45) -A(5) -L(56) -B(6) -L ( 67 ) -B(7) , en donde B(4), A(5) , B{6) y B(7) corresponden a los aminoácidos 21-23, 24-32, 33-37 y 38-42 de (i) SEQ ID NO:3 o una secuencia de aminoácidos por lo menos 80% idéntica a los aminoácidos 21-42 de SEQ ID NO: 3; o (ii) SEQ ID NO: 6 o una secuencia de aminoácidos por lo menos 90% idéntica a los aminoácidos 21-42 de la SEQ . ID NO:6; o (iii) por lo menos 95% idéntica a la SEQ ID NO : 7 , en donde (i) la longitud mínima de L(45) es 10 aminoácidos, (ii) la longitud mínima de L(56) es 7 aminoácidos, (iii) en donde la longitud mínima de L(67) es 4 aminoácidos, y (iv) en donde por lo menos uno de L(45), L(56) o L(67) específicamente se une a una molécula objetivo preseleccionada, y por lo menos dos de L(45), L(56) o L(67) cada uno excede su longitud mínima por lo menos por un aminoácido.
10. La proteína de conformidad con la reivindicación 9, caracterizada porque comprende dos secuencias de aminoácidos de la fórmula B (4 ) -L (45) -A (5) -L(56) -B (6) -L(67) -B (7) .
11. La proteína de conformidad con la reivindicación 9 ó 10, caracterizada porque por lo menos uno de L(45), L(56) o L(67) específicamente se une a una molécula objetivo preseleccionada, por lo que la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
12. La proteína de conformidad con cualquiera de las reivindicaciones 1-8, caracterizada porque comprende una secuencia de aminoácidos de la fórmula B ( 1) -L ( 12 ) -B (2 ) -L ( 23 ) -A(3) -L(34) -B(4) -L{45) -A(5) -L(56) -B(6) -L(67) -B(7) , en donde B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponde a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de (i) una secuencia de aminoácidos por lo menos 80% idéntica a la SEQ ID NO: 3; o (ii) una secuencia por lo menos 90% idéntica a la SEQ ID NO: 6; o (iii) una secuencia por lo menos 95% idéntica a la SEQ ID NO: 7, en donde (i) la longitud mínima de L(12) es 10 aminoácidos, (ii) la longitud mínima de L(23) es 7 aminoácidos, (iii) la longitud mínima de L(34) es 9 aminoácidos, (iv) la longitud mínima de L(45) es 10 aminoácidos, (v) la longitud mínima de L(56) es 7 aminoácidos, (vi) la longitud mínima de L(67) es 4 aminoácidos, y (vii) por lo menos uno de L(12), L(23), L(34), L(45), L(56) o L(67) específicamente se une a una molécula objetivo preseleccionada, por lo que la proteína se une a la molécula objetivo preseleccionada con una constante de disociación de no más de 10 µ?.
13. La proteína de conformidad con la reivindicación 12, caracterizada porque B(l), B(2), A(3), B(4), A(5), B(6) y B(7) corresponden a los aminoácidos 1-5, 6-8, 9-20, 21-23, 24-32, 33-37 y 38-42 de una secuencia (i) por lo menos 85% idéntica a la SEQ ID NO: 3 o (ii) por lo menos 95% idéntica a la SEQ ID NO.6.
14. La proteína de conformidad con la reivindicación 12 ó 13, caracterizada porque L(12) es más largo que 10 aminoácidos.
15. La proteína de conformidad con cualquiera de las reivindicaciones 12-14, caracterizada porque L(23) es más largo que 7 aminoácidos.
16. La proteína de conformidad con cualquiera de las reivindicaciones 12-15, caracterizada porque L(34) es más largo que 9 aminoácidos.
17. Una proteína de conformidad con cualquiera de las reivindicaciones 12-16, caracterizada porque L(45) es más largo que 10 aminoácidos.
18. La proteína de conformidad con cualquiera de las reivindicaciones 12-17, caracterizada porque L(56) es más largo que 7 aminoácidos.
19. La proteína de conformidad con cualquiera -de las reivindicaciones 12-18, caracterizada porque L(67) es más largo que 4 aminoácidos.
20. La proteína de conformidad con cualquiera de las reivindicaciones 1-19, caracterizada porque comprende además un efector y/o un marcador detectable establemente asociado con el mismo.
21. La proteína de conformidad con cualquiera de las reivindicaciones 1-20, caracterizada porque no: (i) se une específicamente a CD4 , y/o (ii) comprende un péptido de virus de inmunodeficiencia humana, y/o (iii) comprende un péptido de virus de inmunodeficiencia humana inmunogénico, y/o (iv) comprende un péptido viral o bacteriano.
22. Una proteína de fusión caracterizada porque comprende por lo menos dos proteínas de conformidad con cualquiera de las reivindicaciones anteriores.
23. Una biblioteca de proteína caracterizada porque comprende una pluralidad de proteínas no idénticas cada una de conformidad con cualquiera de las reivindicaciones 1-21, en donde las proteínas no idénticas difieren unas de otras en las secuencias de aminoácidos de uno o más de los lazos.
2 . Una biblioteca de ácido nucleico caracterizada porque codifica una biblioteca de proteína de conformidad con la reivindicación 23.
25. Un ácido nucleico caracterizado porque codifica a proteína de conformidad con cualquiera de las reivindicaciones 1-21 o una proteína de fusión de la reivindicación 22. . _
26. Un método de identificación de una proteína que se une específicamente a una molécula objetivo preseleccionada, caracterizado porque comprende exponer una biblioteca de proteína de conformidad con la reivindicación 23 a una molécula objetivo; e identificar por lo menos una proteína asociada con la molécula objetivo.
27. Un método para detectar una molécula objetivo, caracterizado porque comprende exponer una muestra a una proteína de conformidad con cualquiera de las reivindicaciones 1-21 bajo condiciones que permiten a una molécula objetivo, si está presente, unirse a la proteína; y detectar la presencia o ausencia de un comple o que comprende la proteína y la molécula objetivo.
MX2010011453A 2008-04-25 2009-04-24 Armazones proteinicos artificiales. MX2010011453A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US4809908P 2008-04-25 2008-04-25
PCT/EP2009/002984 WO2009130031A1 (en) 2008-04-25 2009-04-24 Artificial protein scaffolds

Publications (1)

Publication Number Publication Date
MX2010011453A true MX2010011453A (es) 2010-11-09

Family

ID=41057619

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2010011453A MX2010011453A (es) 2008-04-25 2009-04-24 Armazones proteinicos artificiales.

Country Status (12)

Country Link
US (1) US20100029499A1 (es)
EP (1) EP2283032A1 (es)
JP (1) JP2011519276A (es)
KR (1) KR20110003547A (es)
CN (1) CN102015752A (es)
AU (1) AU2009240234A1 (es)
BR (1) BRPI0910484A2 (es)
CA (1) CA2722329A1 (es)
EA (1) EA201071226A1 (es)
MX (1) MX2010011453A (es)
WO (1) WO2009130031A1 (es)
ZA (1) ZA201008447B (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2421896A1 (en) * 2009-04-22 2012-02-29 Merck Patent GmbH Antibody fusion proteins with modified fcrn binding sites
DE202014011119U1 (de) * 2013-02-15 2017-12-15 Nissin Chemical Industry Co., Ltd Leitfähige Zusammensetzung, antistatische Harzzusammensetzung und antistatischer Harzfilm

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5270181A (en) * 1991-02-06 1993-12-14 Genetics Institute, Inc. Peptide and protein fusions to thioredoxin and thioredoxin-like molecules
RU2306320C9 (ru) * 2001-05-03 2008-01-27 Мерк Патент Гмбх Рекомбинантное опухолеспецифичное антитело (варианты) и его применение
US7574306B1 (en) * 2003-11-20 2009-08-11 University Of Washington Method and system for optimization of polymer sequences to produce polymers with stable, 3-dimensional conformations
US7846445B2 (en) * 2005-09-27 2010-12-07 Amunix Operating, Inc. Methods for production of unstructured recombinant polymers and uses thereof
JP2009521912A (ja) * 2005-12-30 2009-06-11 メルク パテント ゲゼルシャフト ミット ベシュレンクテル ハフツング 低減された免疫原性を有する抗cd19抗体
CA2646965C (en) * 2006-03-24 2016-06-21 Jonathan H. Davis Engineered heterodimeric protein domains

Also Published As

Publication number Publication date
ZA201008447B (en) 2012-01-25
AU2009240234A1 (en) 2009-10-29
JP2011519276A (ja) 2011-07-07
BRPI0910484A2 (pt) 2018-03-27
EA201071226A1 (ru) 2011-06-30
WO2009130031A1 (en) 2009-10-29
WO2009130031A9 (en) 2011-01-27
CA2722329A1 (en) 2009-10-29
EP2283032A1 (en) 2011-02-16
CN102015752A (zh) 2011-04-13
US20100029499A1 (en) 2010-02-04
KR20110003547A (ko) 2011-01-12

Similar Documents

Publication Publication Date Title
CA2710140C (en) Polypeptide libraries with a predetermined scaffold
CA2583009C (en) Ubiquitin or gamma-crystalline conjugates for use in therapy, diagnosis and chromatography
JP7429765B2 (ja) 酵母に発現または提示されたペプチド・ライブラリー及びその使用
JP3210342B2 (ja) 全合成親和性試薬
JP2002532072A (ja) 抗体模倣物および他の結合タンパク質のタンパク質骨格
EP2161278B1 (en) Single-chain coiled coil scaffold
KR100961392B1 (ko) 항체 파지 표면제시 라이브러리 제조방법, 상기 방법에의해 제조된 항체 파지 표면제시 라이브러리, 상기 항체파지 표면제시 라이브러리 유전자를 포함한 파지미드 벡터
US8969253B2 (en) Method for screening phage display libraries against each other
JP2023016842A (ja) タンパク質ライゲーションの方法及びその使用
WO2014103203A1 (ja) 微小タンパク質の骨格構造に基づく分子ライブラリ
CA2694364C (en) Improved methods for the formation of disulphide bonds
MX2010011453A (es) Armazones proteinicos artificiales.
CN107043421B (zh) 抗c-Myc标签的单域重链抗体
JP2005519595A (ja) モジュラーリコンビナトリアルディスプレイライブラリー
CN106831993B (zh) 一种特异识别c-Myc标签的单域重链抗体
CN106946993B (zh) 一种能特异性结合c-Myc标签的单域重链抗体
CN116348479A (zh) 用于产生丝状噬菌体的细菌菌毛蛋白质复合物FimGt-DsF稳定蛋白质复合物
JP3994291B6 (ja) 抗体遺伝子発現ベクターのマルチコンビネーションライブラリの作製方法
WO2017189624A1 (en) Engineered fha domains
JPH09509055A (ja) 抗体遺伝子発現ベクターのマルチコンビネーションライブラリの作製方法

Legal Events

Date Code Title Description
FG Grant or registration