ES2691717T3

ES2691717T3 - Bibliotecas universales del dominio de unión del lado inferior de tipo iii de la fibronectina de tipo III

Info

Publication number: ES2691717T3
Application number: ES10771435.4T
Authority: ES
Inventors: Andreas Loew; Brian Edward Vash
Original assignee: Novartis AG
Current assignee: Novartis AG
Priority date: 2009-10-30
Filing date: 2010-10-27
Publication date: 2018-11-28
Anticipated expiration: 2030-10-27
Also published as: EP3434769B1; EP2494046A1; US9139825B2; ES2860453T3; US20120208704A1; WO2011051333A1; US10253313B2; EP2494046B1; US20160194626A1; EP3434769A1

Abstract

Un procedimiento para formar una biblioteca de polipéptidos del dominio de fibronectina de tipo 3 (Fn3) útiles para explorar la presencia de uno o más polipéptidos que tienen una actividad enzimática o de unión seleccionada, donde dichos polipéptidos tienen las secuencias de aminoácidos de tipo silvestre en las regiones de cadena beta A, AB, B, C, CD, D, E, EF, F y G del 10º módulo de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, el procedimiento que comprende las etapas de: (i) alinear secuencias de bucle de aminoácidos AB, CD y EF en una colección de polipéptidos del dominio de fibronectina de tipo 3 nativo, (ii) segregar las secuencias de bucle alineadas según la longitud del bucle, (iii) para un bucle y una longitud bucle seleccionados de la etapa (ii), realizar un análisis de frecuencia posicional de aminoácidos para determinar las frecuencias de aminoácidos en cada posición del bucle, en el que la longitud del bucle EF está fijada en 6 aminoácidos (EF/6), (iv) para cada bucle y longitud de bucle analizados en la etapa (iii), identificar en cada posición un aminoácido de consenso conservado o semiconservado seleccionado y otros aminoácidos de variante natural, (v) para al menos el bucle EF, formar: (1) una biblioteca de secuencias de mutagénesis expresadas por una biblioteca de secuencias codificantes que codifican, en cada posición del bucle, el aminoácido de consenso, y si el aminoácido de consenso tiene una frecuencia de aparición igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un único aminoácido diana común y cualquier aminoácido coproducido, o (2) una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posición del bucle, un aminoácido de consenso y, si el aminoácido de consenso tiene una frecuencia de aparición igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoácidos de variantes naturales, incluidos aminoácidos semiconservados y aminoácidos variables cuya frecuencia de aparición está por encima de un umbral mínimo seleccionado en esa posición, o sus equivalentes químicos, (vi) incorporar la biblioteca de secuencias codificantes en las secuencias codificantes de Fn3 marco para formar una biblioteca de expresión de Fn3, y (vii) expresar los polipéptidos de Fn3 de la biblioteca de expresión.

Description

DESCRIPCION

Bibliotecas universales del dominio de union del lado inferior de tipo iii de la fibronectina de tipo III 5 REFERENCIA CRUZADA A SOLICITUDES RELACIONADAS

[0001] Esta solicitud reivindica el beneficio del numero de serie de la solicitud de los EE. UU. 61/256 409 presentada el 30 de octubre de 2009.

10 ANTECEDENTES DE LA INVENCION

[0002] Las protelnas de union basadas en andamiajes se estan convirtiendo en alternativas legltimas a los anticuerpos en su capacidad para unirse a objetivos de ligandos especlficos. Estas protelnas de union de andamiaje comparten la calidad de tener un nucleo estructural estable que puede tolerar multiples sustituciones en las regiones

15 de union del ligando. Algunos armazones de andamiajes tienen una arquitectura de dominio de protelna similar a la inmunoglobulina con bucles que se extienden desde un nucleo de sandwich beta. A continuacion, se puede disenar sinteticamente un nucleo de armazon de andamiaje a partir del cual se puede construir una biblioteca de diferentes variantes de secuencia. La diversidad de secuencias normalmente se concentra en las superficies exteriores de las protelnas tales como estructuras de bucle u otras superficies exteriores que pueden servir como regiones de union 20 de ligandos.

[0003] El dominio de la fibronectina de tipo III (Fn3) se identifico por primera vez como uno de los dominios repetitivos en la protelna de fibronectina. El dominio Fn3 constituye una protelna p-sandwich monomerica pequena (~94 aminoacidos) formada por siete cadenas p con tres bucles de conexion. Los tres bucles cerca del extremo N de

25 Fn3 son funcionalmente analogos a las regiones determinantes de complementariedad de los dominios de inmunoglobulina. Las bibliotecas de bucles Fn3 pueden modificarse para unirse a una variedad de dianas tales como citoquinas, factores de crecimiento y moleculas receptoras y otras protelnas.

[0004] Un posible problema al crear estas bibliotecas sinteticas es la alta frecuencia de variantes 30 improductivas que dan lugar, por lo tanto, a selecciones de candidatos ineficientes. Por ejemplo, la creacion de

diversidad en las variantes a menudo implica tecnicas in vitro tales como mutagenesis aleatoria, mutagenesis de saturacion, PCR propensa a errores y mezcla de genes. Estas estrategias son intrlnsecamente estocasticas y, a menudo, requieren la construccion de bibliotecas excesivamente grandes para explorar exhaustivamente la suficiente diversidad de secuencias. Ademas, no hay forma de enumerar el numero, que tipo y en que parte de la 35 protelna se han producido las mutaciones. Ademas, estas estrategias aleatorias crean sustituciones indiscriminadas que causan la desestabilizacion de la arquitectura proteica. Se ha demostrado que la mejora en una caracterlstica, como la optimization de afinidad, por lo general da lugar a una disminucion de la estabilidad termica en comparacion con el armazon de andamiaje de la protelna original.

40 [0005] Por consiguiente, existe la necesidad de una biblioteca de dominio de union a fibronectina que sea de

construccion sistematica. Por diseno dirigido por bioinformatica, los candidatos de bucle son flexibles para su insertion en multiples andamiajes Fn3. Mediante sustituciones especlficas de bucles dirigidos, se maximiza la estabilidad general del andamiaje mientras que al mismo tiempo se minimizan las sustituciones no inmunogenicas. Ademas, la biblioteca se puede adaptar a medida para que la diversidad general se pueda analizar facilmente en 45 diferentes sistemas. Ademas, la diversidad representativa de los bucles disenados todavla es capaz de unirse a varias dianas de ligando predefinidos. Ademas, el diseno sistematico de bucles todavla permite la maduracion por afinidad posterior de clones de union recuperados.

[0006] El documento US 2002/019517 A1 describe un monocuerpo polipeptldico de fibronectina de tipo III 50 (Fn3), una molecula de acido nucleico que codifica el monocuerpo y una biblioteca de acido nucleico variada que

codifica el monocuerpo.

[0007] El documento WO2009/058379 A2 describe un armazon polipeptldico recombinante que comprende siete dominios de cadena beta designados A, B, C, D, E, F y G, unidos a seis regiones de bucle, en el que una

55 region de bucle conecta cada cadena beta y se designa aB, BC, CD, DE, EF y FG. Tambien se describe una biblioteca de presentation en polipeptidos que comprende el andamiaje.

[0008] Bloom y Calabro (2009) FN3: a new protein scaffold reaches the clinic, Drug Discovery Today 14:949955 se refieren a "CT-322", una FN3 modificada que entro en ensayos de Fase II para glioblastoma multiforme.

[0009] Koide et al. (2002) Probing protein conformational changes in living cells by using designer binding proteins: application to the estrogen receptor, Proc. Natl. Acad. Sci. USA 99:1253-1258 describe la seleccion de biblioteca combinatoria de monocuerpos para clones que se unen al receptor de estrogenos a.

5

[0010] El documento WO 2009/023184 A2 describe la mutagenesis directa y las bibliotecas de polipeptidos combinatorios de fibronectina de tipo III (FN3) de variante natural junto con su procedimiento de construccion y uso.

[0011] Koide et al. (1998) The fibronectin type III domain as a scaffold for novel binding proteins, J. Mol. Biol. 10 284:1141-1151 describe la preparacion de una biblioteca de presentacion en fagos de FN3 en la que se

aleatorizaron los restos en dos bucles de superficie.

[0012] Karatan et al. (2004) Molecular recognition properties of FN3 monobodies that bind the Src SH3 domain, Chem. Biol. 11:835-844 describe la construccion de una biblioteca presentada en fagos basada en el

15 andamiaje de la decima fibronectina humana tipo III (FN3) aleatorizando restos en sus bucles FG y BC.

RESUMEN DE LA INVENCION

[0013] En un aspecto, esta descripcion incluye una biblioteca combinatoria de variantes naturales de 20 polipeptidos de fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas polipeptidos que tienen

una actividad enzimatica o de union seleccionada. Los polipeptidos de la biblioteca incluyen (a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre de un polipeptido o polipeptidos de fibronectina de tipo 3 nativos seleccionados, y (b) regiones de bucle AB, CD y EF que tienen longitudes seleccionadas (bucles inferiores). La Fn3 tambien puede tener regiones de bucle BC, De y FG que tienen 25 secuencias de aminoacidos de tipo silvestre, que tienen longitudes seleccionadas (bucles superiores) o secuencias de aminoacidos mutagenizadas.

[0014] De acuerdo con esto, en un aspecto, esta descripcion se refiere a un procedimiento para formar una biblioteca de polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o

30 mas polipeptidos que tienen una actividad enzimatica o de union seleccionada. El procedimiento comprende (i) alinear secuencias de bucle de aminoacidos AB, CD y EF en una coleccion de polipeptidos del dominio de fibronectina de tipo 3 nativo, (ii) segregar las secuencias de bucle alineadas segun la longitud de bucle, (iii) para un bucle y longitud de bucle seleccionados de la etapa (ii), realizar analisis de frecuencia de aminoacidos posicionales para determinar las frecuencias de aminoacidos en cada posicion del bucle, (iv) para cada bucle y longitud de bucle 35 analizados en la etapa (iii), identificar en cada posicion un aminoacido de consenso conservado o semiconservado seleccionado y otros aminoacidos de variantes naturales, (v) para al menos un bucle y longitud de bucle seleccionados, formar: (1) una biblioteca de secuencias de mutagenesis expresadas por una biblioteca de secuencias codificantes que codifican, en cada posicion del bucle, el aminoacido de consenso, y si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 40 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido, o (2) una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variantes naturales, incluidos aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por 45 encima de un umbral mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos, (vi) incorporar la biblioteca de secuencias codificantes dentro de las secuencias codificantes de Fn3 para formar una biblioteca de expresion de Fn3, y (vii) expresar los polipeptidos Fn3 de la biblioteca de expresion.

[0015] La biblioteca puede tener un umbral dado del 100 %, a menos que la posicion de aminoacidos del 50 bucle contenga solo un aminoacido dominante y uno variante, y los aminoacidos dominantes y variantes sean

aminoacidos qulmicamente similares, en cuyo caso el umbral dado puede ser del 90 %. En este caso, la biblioteca contiene todas las variantes naturales o sus equivalentes qulmicos que tienen al menos cierta frecuencia razonable de aparicion, por ejemplo, del 10 %, en el bucle y la posicion del bucle seleccionados.

55 [0016] Las secuencias combinatorias de variantes naturales pueden estar en una combination de bucles y

longitudes de bucle seleccionadas de bucles AB y CD, AB y EF, y CD y EF, donde el bucle AB comprende 1-3 aminoacidos (AB/1-3), y preferentemente 3 aminoacidos (AB/3); el bucle CD comprende 4-10 aminoacidos (CD/4- 10), y preferentemente 5, 6, o 7 aminoacidos (CD/5, CD/6, CD/7); y el bucle EF comprende 3-9 aminoacidos (EF/3- 9), y preferentemente 6 aminoacidos (EF/6). Las secuencias combinatorias de variantes naturales pueden estar en

una combinacion de bucles y longitudes de bucle seleccionadas del grupo que consiste en AB/1-3, AB/3, CD/4-10, CD/5, CD/6, CD/7 y EF/3-9, EF/6.

[0017] La biblioteca puede tener en dos de las combinaciones de bucle AB y CD, AB y EF, y CD y EF, 5 mutaciones beneficiosas identificadas mediante la seleccion de una biblioteca combinatoria de variantes naturales

que contiene variantes de aminoacidos en la combinacion de dos bucles, y en el tercer bucle, identificados por AB, CD y EF, respectivamente.

[0018] En un caso, la biblioteca puede tener las secuencias de aminoacidos de tipo silvestre en las regiones 10 A, AB, B, C, CD, D, E, EF, F y G del 10° modulo de fibronectina de tipo III de la fibronectina humana. En otro caso, la

biblioteca puede tener las secuencias de aminoacidos de tipo silvestre en las regiones A, AB, B, C, CD, D, E, EF, F y G del 14° modulo de fibronectina de tipo III de la fibronectina humana.

[0019] En otro aspecto, esta descripcion se refiere a una biblioteca de polipeptidos del dominio de 15 fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas polipeptidos que tienen una actividad

de union o enzimatica seleccionada, dichos polipeptidos que comprenden (a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre de un polipeptido de fibronectina de tipo 3 nativo seleccionado, y (b) regiones de bucle AB, CD y eF que tienen longitudes seleccionadas, donde al menos una region de bucle seleccionada de una longitud seleccionada contiene una biblioteca de secuencias de mutagenesis 20 expresadas por una biblioteca de secuencias codificantes que codifican, en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido.

25 [0020] En otro aspecto, esta descripcion se refiere a una biblioteca combinatoria de variantes naturales de

polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas polipeptidos que tienen una actividad enzimatica o de union seleccionada. Los polipeptidos comprenden (a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre de un polipeptido de fibronectina de tipo 3 nativo seleccionado, y (b) regiones de bucle AB, CD, y EF que tiene longitudes seleccionadas, 30 donde al menos una region de bucle seleccionada de una longitud seleccionada contiene una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variante natural, incluidos los aminoacidos semiconservados y 35 aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos.

[0021] La biblioteca tiene una biblioteca de secuencias combinatorias de variantes naturales en una combinacion de bucles y longitudes de bucle seleccionadas de bucles AB y CD, AB y EF, y CD y EF, donde el bucle

40 AB se selecciona de uno de AB/1-3, AB/3, y el bucle CD se selecciona de uno de Cd/4-10, CD/5, CD/6, CD/7, o el bucle AB se selecciona de uno de AB/1-3, Ab/3, y el bucle EF se selecciona de uno de EF/3-9, EF/6, o el bucle CD se selecciona de uno de CD/4-10, CD/5, CD/6, CD/7 y el bucle EF se selecciona de uno de EF/3-9, EF/6, o una combinacion de los tres bucles seleccionados del grupo que consiste en AB/1-3, AB/3, CD/4-10, CD/5, CD/6, CD/7, EF/3-9 y EF/3. La biblioteca tiene un umbral dado del 100 %, a menos que la posicion del aminoacido de bucle 45 contenga solo un aminoacido dominante y uno variante, y los aminoacidos dominantes y variantes tengan cadenas laterales con propiedades fisicoqulmicas similares, en cuyo caso el umbral dado es del 90 %. Los polipeptidos tienen las secuencias de aminoacidos de tipo silvestre en las regiones de cadena beta A, AB, B, C, CD, D, E, Ef, F y G del 10° modulo de fibronectina de tipo III de la fibronectina humana, o 14° modulo de fibronectina de tipo III de la fibronectina humana.

50

[0022] En un caso, la biblioteca tiene una longitud de bucle AB de 3. En otro caso, la biblioteca tiene una longitud de bucle CD de 5, 6 o 7. En otro caso, la biblioteca tiene una longitud de bucle EF de 6. Los polipeptidos de la biblioteca estan codificados por una biblioteca de expresion seleccionada del grupo que consiste en una biblioteca de presentacion en ribosomas, una biblioteca de presentacion en polisomas, una biblioteca de presentacion en

55 fagos, una biblioteca de expresion bacteriana y una biblioteca de presentacion en levaduras.

[0023] En otro aspecto, esta descripcion se refiere a una biblioteca de expresion de polinucleotidos que codifica la biblioteca de polipeptidos y se produce sintetizando polinucleotidos que codifican una o mas regiones marco de cadena beta y una o mas regiones de bucle en las que los polinucleotidos estan predeterminados, donde

los polinucleotidos que codifican dichas regiones ademas comprenden suficiente secuencia de solapamiento por lo que las secuencias de polinucleotidos, en condiciones de reaccion en cadena de la polimerasa (PCR), son capaces de ensamblarse en polinucleotidos que codifican dominios de union a fibronectina completos.

5 [0024] En otro aspecto mas, esta descripcion se refiere a un procedimiento para identificar un polipeptido que

tiene una afinidad de union deseada con respecto a un antlgeno seleccionado. El procedimiento comprende hacer reaccionar la biblioteca combinatoria de variantes naturales de polipeptidos de Fn3 con el antlgeno seleccionado, y cribar los polipeptidos de Fn3 para seleccionar los que tienen una afinidad de union deseada con respecto al antlgeno seleccionado.

10

[0025] El procedimiento comprende ademas la etapa de identificar el polinucleotido que codifica el dominio de

union a fibronectina seleccionado.

Basandose en la descripcion que esta contenida en el presente documento, la presente invencion proporciona un procedimiento para formar una biblioteca de polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles para 15 explorar la presencia de uno o mas polipeptidos que tienen una actividad enzimatica o de union seleccionada, en el que dichos polipeptidos tienen las secuencias de aminoacidos de tipo silvestre en las regiones de cadena beta A, AB, B, C, CD, D, E, EF, F y G del 10° modulo de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, el procedimiento que comprende las etapas de:

20 (i) alinear secuencias de bucle de aminoacidos AB, CD y EF en una coleccion de polipeptidos del dominio de fibronectina de tipo 3 nativo,

(ii) segregar las secuencias de bucle alineadas segun la longitud del bucle,

(iii) para un bucle y una longitud bucle seleccionados de la etapa (ii), realizar un analisis de frecuencia posicional de aminoacidos para determinar las frecuencias de aminoacidos en cada posicion del bucle, en el que la longitud del

25 bucle EF esta fijada en 6 aminoacidos (EF/6),

(iv) para cada bucle y longitud de bucle analizados en la etapa (iii), identificar en cada posicion un aminoacido de consenso conservado o semiconservado seleccionado y otros aminoacidos de variante natural,

(v) para al menos el bucle EF, formar:

30 (1) una biblioteca de secuencias de mutagenesis expresadas por una biblioteca de secuencias codificantes que

codifican, en cada posicion del bucle, el aminoacido de consenso, y si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido, o

(2) una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de 35 secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variantes naturales, incluidos aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos,

40

(vi) incorporar la biblioteca de secuencias codificantes en las secuencias codificantes de Fn3 marco para formar una biblioteca de expresion de Fn3, y

(vii) expresar los polipeptidos de Fn3 de la biblioteca de expresion.

45 [0026] La presente invencion tambien proporciona una biblioteca de polipeptidos del dominio de fibronectina

de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas polipeptidos que tienen una actividad de union o enzimatica seleccionada, dichos polipeptidos que comprenden:

(a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre del 10° modulo 50 de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, y

(b) regiones de bucle AB, CD y EF que tienen longitudes seleccionadas, en las que la longitud del bucle EF esta fijada en 6 aminoacidos (EF/6), donde al menos la region de bucle EF contiene una biblioteca de secuencias de mutagenesis expresadas por una biblioteca de secuencias codificantes que codifican, en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una

55 frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido.

[0027] Ademas, la presente invencion proporciona una biblioteca combinatoria de variantes naturales de

polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas

polipeptidos que tienen una actividad de union o enzimatica seleccionada, dichos polipeptidos que comprenden:

(a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre del 10° modulo de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, y 5 (b) regiones de bucle AB, CD y EF que tienen longitudes seleccionadas, en las que la longitud del bucle EF esta fijada en 6 aminoacidos (EF/6), donde al menos la region de bucle EF contiene una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 10 50 %, otros aminoacidos de variantes naturales, que incluyen aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos.

[0028] Otros aspectos y realizaciones de la presente invencion se exponen en las reivindicaciones adjuntas. 15

Breve descripcion de las figuras

[0029]

20 La Fig. 1 es un diagrama esquematico que ilustra el procedimiento para construir una biblioteca de dominio de union del lado inferior de la fibronectina usando biominerla de bases de datos geneticas asistidas por ordenador y delineacion de estructuras de bucles y andamiajes beta.

La Fig. 2 representa un esquema que muestra las caras de bucle superior e inferior de Fn3 que ilustra el dominio de las dos laminas beta antiparalelas. Una mitad esta compuesta de cadenas beta (ABE) y la otra mitad esta 25 compuesta por (CDFG). Los 6 bucles similares a CDR tambien estan indicados: AB, BC, CD, DE, EF y FG. Los bucles BC, De y FG estan presentes en el extremo N del dominio Fn3 y estan dispuestos para formar superficies de union del ligando. La secuencia RGD se encuentra en el bucle FG.

La Fig. 3A es un grafico de barras que muestra la diversidad de la longitud del bucle AB derivada del analisis bioinformatico de todos los modulos de Fn3. La longitud del bucle AB 3 es el tamano mas predominante observado 30 en las secuencias de Fn3 expresadas.

La Fig. 3B es una tabla que muestra la distribucion de la longitud del bucle en la longitud del bucle AB, mostrando que 3 es el tamano mas predominante observado en las secuencias expresadas de Fn3.

La Fig. 4A es una tabla que muestra la distribucion posicional de aminoacidos en las posiciones 1, 2 y 3 de un tamano de longitud de bucle AB de 3 y los 7 porcentajes mas altos de abundancia de aminoacidos de los 35 aminoacidos en cada posicion.

La Fig. 4B es un grafico de barras que muestra la diversidad de secuencia de una region de bucle ejemplar en forma de perfil de variabilidad de aminoacidos (distribucion de frecuencia) para el tamano de longitud de bucle AB de 3.

La Fig. 5A es un grafico de barras que muestra la diversidad de la longitud del bucle CD derivada del analisis bioinformatico de todos los modulos de Fn3. Las longitudes del bucle CD de 5, 6 y 7 son los tamanos mas 40 predominantes observados en las secuencias de Fn3 expresadas.

La Fig. 5B es una tabla que muestra la distribucion de la longitud del bucle en la longitud del bucle CD. Las longitudes del bucle CD de 5, 6 y 7 son los tamanos mas predominantes observados en las secuencias de Fn3 expresadas.

La Fig. 6A es una tabla que muestra la distribucion posicional de aminoacidos en las posiciones 1, 2, 3, 4 y 5 del 45 tamano de longitud del bucle CD de 5 y los 7 porcentajes mas altos de abundancia de aminoacidos de los aminoacidos en cada posicion.

La Fig. 6B es un grafico de barras que muestra la diversidad de secuencia de una region de bucle ejemplar en forma de perfil de variabilidad de aminoacidos (distribucion de frecuencia) para el tamano 5 de longitud de bucle CD.

La Fig. 7A es una tabla que muestra la distribucion posicional de aminoacidos en las posiciones 1, 2, 3, 4, 5 y 6 del 50 tamano de longitud del bucle CD de 6 y los 7 porcentajes mas altos de abundancia de aminoacidos de los aminoacidos en cada posicion.

La Fig. 7B es un grafico de barras que muestra la diversidad de secuencia de una region de bucle ejemplar en forma de perfil de variabilidad de aminoacidos (distribucion de frecuencia) para el tamano 6 de longitud de bucle CD.

La Fig. 8A es una tabla que muestra la distribucion posicional de aminoacidos en las posiciones 1, 2, 3, 4, 5, 6 y 7 55 del tamano de longitud del bucle CD de 7 y los 7 porcentajes mas altos de abundancia de aminoacidos de los aminoacidos en cada posicion.

La Fig. 8B es un grafico de barras que muestra la diversidad de secuencias de una region de bucle ejemplar en forma de perfil de variabilidad de aminoacidos (distribucion de frecuencia) para el tamano 7 de longitud de bucle CD. La Fig. 9A es una tabla que muestra la distribucion de la longitud del bucle en la longitud del bucle EF, que muestra

que 6 es el tamano mas predominante observado en las secuencias de Fn3 expresadas.

La Fig. 9B es un grafico de barras que muestra la diversidad de la longitud del bucle EF derivada del analisis bioinformatico de todos los modulos de Fn3. La longitud del bucle EF de 6 es el tamano mas predominante observado en las secuencias de Fn3 expresadas.

5 La Fig. 10 A es una tabla que muestra la distribucion posicional de aminoacidos en las posiciones 1, 2, 3, 4, 5 y 6 de un tamano de longitud de bucle EF de 6 y los 7 porcentajes mas altos de abundancia de aminoacidos de los aminoacidos en cada posicion.

La Fig. 10B es un grafico de barras que muestra la diversidad de secuencias de una region de bucle ejemplar en forma de perfil de variabilidad de aminoacidos (distribucion de frecuencia) para el tamano de longitud de bucle EF de 10 6.

Description detallada de la invention

Definiciones

15

[0030] Los terminos a continuation tienen los siguientes significados a menos que se indique lo contrario en la especificacion:

[0031] Como se usa en el presente documento, el termino "dominio de fibronectina de tipo III" o "dominio 20 Fn3" se refiere a un dominio Fn3 silvestre de cualquier organismo, as! como a dominios Fn3 quimericos construidos

a partir de cadenas beta de dos o mas dominios Fn3 diferentes. Como es sabido en la materia, los dominios Fn3 naturales tienen una estructura beta-sandwich compuesta por siete cadenas beta, denominadas A, B, C, D, E, F y G, unidas por seis bucles, a las que se hace referencia como bucles AB, BC, CD, DE, EF y FG (Vease, por ejemplo, Bork y Doolittle, Proc. Natl. Acad. Sci. USA 89: 8990, 1992; Bork et al., Nature Biotech., l5: 553, 1997; Meinke et al., 25 J. Bacteriol. 175: 1910, 1993; Watanabe et al., J. Biol. Chem. 265: 15659, 1990; Main et al., 1992; Leahy et al., 1992; Dickinson et al., 1994; Patente de Estados Unidos 6 673 901; Publication del Tratado de cooperation en materia de patente WO/03104418; y, Solicitud de patente de Estados Unidos 2007/0082365).

[0032] Tres bucles estan en la parte superior del dominio (los bucles BC, DE y FG) y tres bucles estan en la 30 parte inferior del dominio (los bucles aB, CD y EF) (Fig. 2). En un caso particular de esta descripcion, por ejemplo en

las realizaciones de la presente invencion, el dominio Fn3 es del decimo dominio Fn3 de la fibronectina humana (10Fn3) (SEQ ID NO: 1). Los polipeptidos del dominio Fn3 individuales se denominan por el numero de modulo y el nombre de la protelna, por ejemplo, el 10° o 14° modulo de la fibronectina humana (10Fn o 14Fn).

35 [0033] Como se usa en este documento, la expresion "molecula de union basada en Fn3" o "molecula de

union basada en fibronectina de tipo III" se refiere a un dominio de Fn3 que se ha alterado para que contenga una o mas secuencias de union que no sean de Fn3. En un caso particular, uno o mas de los bucles AB, CD y/o EF inferiores estan alterados en comparacion con el dominio Fn3 natural correspondiente para que contenga una o mas secuencias que no se unen a Fn3. En otro caso, uno o mas de los bucles aB, CD o EF inferiores y uno o mas de los 40 bucles superiores BC, DE y FG estan alterados en comparacion con el dominio Fn3 silvestre correspondiente para contener una o mas secuencias de union no Fn3. Dichas moleculas se denominan en el presente documento moleculas de union basadas en Fn3 biespeclficas. En un ejemplo adicional, por ejemplo en una realization adicional de la invencion, dos o mas moleculas de union basadas en Fn3 o moleculas de union basadas en Fn3 biespeclficas estan unidas entre si. Dichas moleculas se denominan en la presente memoria "moleculas de union basadas en Fn3 45 multiespeclficas" (vease, por ejemplo, el documento US n.° de serie 61/050142).

[0034] El termino "secuencia de union no Fn3" se refiere a una secuencia de aminoacidos que no esta presente en el dominio Fn3 de origen natural (por ejemplo, de tipo silvestre) y que se une a una diana especlfica. Dichas secuencias de union no Fn3 normalmente se introducen modificando (por ejemplo, mediante sustitucion y/o

50 adicion) el dominio Fn3 de tipo silvestre (por ejemplo, dentro de los bucles inferiores y/o las regiones de bucle superior). Esto se puede lograr, por ejemplo, mediante mutation aleatoria o predeterminada de restos de aminoacidos dentro del dominio Fn3 de tipo silvestre.

[0035] El termino "monoespeclfico" como se usa en el presente documento se refiere a una molecula de 55 union basada en Fn3 que se une a una o mas moleculas diana que comprenden dominios Fn3 en los que solo se

usan para unir la region inferior del dominio Fn3 o la region superior del dominio Fn3, pero no ambas. Por ejemplo, una molecula de union basada en Fn3 monoespeclfica inferior es aquella que utiliza solo los bucles inferiores, como los bucles AB, CD o EF, o el C-terminal del dominio Fn3 para unirse a una diana, mientras que una molecula de union basada en Fn3 monoespeclfica superior solo utiliza los bucles superiores del dominio Fn3, como los bucles

BC, DE y FG, para unir la diana. Debe entenderse que no es necesario usar los tres bucles de la region superior o inferior para unir la molecula diana.

[0036] Los dominios monoespeclficos de Fn3 tambien se pueden unir entre si (por ejemplo, en forma de 5 perlas) para formar una molecula de union basada en Fn3 multiespeclfica que comprende, por ejemplo, al menos

dos dominios Fn3 monoespeclficos que estan unidos entre si. Para moleculas de union monoespeclficas inferiores, cada uno de los dominios Fn3 usa al menos un bucle inferior o region C-terminal para unirse a una o mas moleculas diana. En un caso, por ejemplo, en una realization, esta molecula de union multiespeclfica basada en Fn3 se une a diferentes regiones objetivo de la misma molecula diana (por ejemplo, la Diana A). Por ejemplo, un dominio Fn3 10 puede unirse a una primera region objetivo de la Diana A y otro dominio Fn3 puede unirse a una segunda region

objetivo de la Diana A. Esto puede usarse para aumentar la avidez de la molecula de union basada en Fn3 por la

molecula diana. En otro caso, por ejemplo en otra realizacion, la molecula de union multiespeclfica basada en Fn3 se une a multiples moleculas diana. Por ejemplo, un dominio Fn3 puede unirse a la Diana A y otro dominio Fn3 puede unirse a la Diana B (por ejemplo, extensor de la semivida). En otro caso mas, por ejemplo en otra realizacion, 15 la molecula de union basada en Fn3 multiespeclfica comprende al menos dos dominios Fn3 monoespeclficos que se unen a diferentes regiones objetivo de la Diana A y al menos dos dominios Fn3 monoespeclficos que se unen a diferentes regiones objetivo de la Diana B. El experto en la materia apreciara que cualquier numero de dominios Fn3 se puede unir de esta manera para crear una molecula de union multiespeclfica basada en Fn3 que sea capaz de unirse a diferentes regiones objetivo de la misma molecula diana o de diferentes moleculas diana.

20

[0037] El termino "biespeclfico" como se usa en el presente documento se refiere a una molecula de union

basada en Fn3 que se une a una o mas dianas usando tanto la region inferior del dominio Fn3 como la region

superior del dominio Fn3. Por ejemplo, una molecula de union biespeclfica basada en Fn3 comprende dominios Fn3 que usan los bucles inferiores, como los bucles AB, CD o EF, o C-terminal de la molecula y los bucles superiores de

25 la molecula, como los bucles BC, DE, y FG, para unir la diana. Las moleculas de union biespeclficas basadas en Fn3 pueden usarse para unir la misma molecula diana, por ejemplo, la Diana A, que puede unirse a la parte superior e inferior de la molecula de union biespeclfica basada en Fn3 (vease Figura 3b). Como alternativa, la molecula de union biespeclfica basada en Fn3 se puede usar para unirse a dos moleculas diana diferentes, por ejemplo, la Diana A y la Diana B. En este caso, los bucles superiores se pueden usar para unirse a la Diana A y los bucles inferiores 30 se pueden usar para unir a la Diana B, o viceversa (vease Figura 3b). Las moleculas de union biespeclficas basadas en Fn3 tambien se pueden unir entre si (por ejemplo, de forma similar a perlas) para formar una molecula de union multiespeclfica basada en Fn3.

[0038] El termino "multiespeclfico" como se usa en el presente documento se refiere a una molecula de union 35 basada en Fn3 que comprende al menos dos moleculas de union basadas en Fn3 monoespeclficas unidas entre si o

al menos dos moleculas de union basadas en Fn3 biespeclficas unidas entre si.

[0039] El termino "region determinante de complementariedad (CDR)" se refiere a un bucle hipervariable de un dominio variable de anticuerpo o de un receptor de celula T. La position de las CDR dentro de una region

40 variable del anticuerpo se ha definido con precision (vease, Kabat, EA, et al. Sequences of Proteins of Immunological Interest, quinta edition, Departamento de Salud y Servicios Humanos de los EE. UU., Publication NIH n.° 91-3242, 1991, y Chothia, C. et al., J. Mol. Biol. 196: 901-917, 1987).

[0040] El termino "anticuerpos de dominio unico" se refiere a cualquier dominio variable unico de origen 45 natural y fragmentos de union modificados correspondientes, que incluyen anticuerpos de dominio humano como los

descritos por Domantis (Domantis/GSK (Cambridge, RU) o nanoanticuerpos de camelidos como se define a continuacion.

[0041] El termino "anticuerpo de cadena sencilla" se refiere a una portion de union a antlgeno de una region 50 variable de cadena ligera y una porcion de union a antlgeno de una region variable de cadena pesada, unidas,

usando procedimientos recombinantes, por un enlazador sintetico que permite que se preparen como una unica cadena de protelna en la que las regiones VL y VH se aparean para formar moleculas monovalentes (conocidas como Fv de cadena sencilla (scFv); vease, por ejemplo, Bird et al. (1988) Science 242: 423-426 y Huston et al., (1988) Proc. Natl. Acad. Sci. USA 85: 5879-5883).

55

[0042] El termino "SCALP" se refiere a una protelna de tipo cadena de anticuerpo de cadena sencilla. La agrupacion SCALP incluye una cadena pesada aislada de un anticuerpo, o fragmento del mismo; o una region variable fusionada a otra. Por lo tanto, el grupo de SCALPS incluye Vhh (NANOBODY); y Vhh mas una o mas regiones constantes de la cadena pesada (por ejemplo, CH1, CH2 y/o CH3). Por lo tanto, una SCALP se ejemplifica

con un Vhh; a Vhh + CH1; un Vhh + CH2; un Vhh + CH3; un Vhh + CH1 + CH2; un Vhh + CH1 + CH2 + CH3; un Vhh + CH2 + CH3; un Vhh + CH1 + CH3; etc. Las SCALP incluyen anticuerpos de dominio unico.

[0043] El termino "NANOBODY®" se refiere a una region de un anticuerpo camelido que es el pequeno

5 dominio variable unico desprovisto de cadena ligera y que puede obtenerse mediante ingenierla genetica para producir una protelna pequena que tiene una alta afinidad por una diana, dando como resultado un bajo peso de protelna derivada de anticuerpos. Vease documento WO07042289 y Patente de EE.UU. numero 5 759 808 expedida el 2 de junio de 1998; vease tambien Stijlemans, B. et al., 2004. Las bibliotecas manipuladas por ingenierla de anticuerpos camelidos y fragmentos de anticuerpos estan disponibles en el mercado, por ejemplo, en Ablynx, Ghent,

10 Belgica. Como con otros anticuerpos de origen no humano, una secuencia de aminoacidos de un anticuerpo camelido se puede alterar de forma recombinante para obtener una secuencia que se asemeja mas a una secuencia humana, es decir, el NANOBODY® puede estar "humanizado". Por lo tanto, la baja antigenicidad natural de los anticuerpos camelidos hacia los seres humanos se puede reducir aun mas.

15 [0044] El termino "SmALP" se refiere a cualquier protelna pequena similar a anticuerpo. SmALP incluye

fragmentos Fab, que comprenden las porciones VH, CH, vL y VH; Fv, que comprende las porciones VH y VL; ScFv, que comprende una porcion VH y VL fusionadas entre si; dAbs; di-ScFv, que comprende dos fragmentos ScFv; y Fcabs. Estas y otras SmALP se describen en Classical and Heavy Chain Antibodies, de Muyldermans, S. (2001), J Biotechnol. 74, 277-302, y son bien conocidos en la materia. Los dAbs (anticuerpos de dominio) corresponden a las

20 regiones variables de las cadenas pesada (VH) o ligera (VL) de los anticuerpos humanos y tienen un peso molecular de aproximadamente 13 kDa, o menos de una decima parte del tamano de un anticuerpo completo. Los dAbs estan disponibles en Domantis Limited, una subsidiaria de GlaxoSmithKline. Un Fcab (Fc de union a antlgeno) es un anticuerpo comprimido que comprende un dominio CH2 y CH3, con dos sitios de union a antlgeno identicos disenados en los dominios CH3, como se puede obtener de f-star Biotechnologische Forschungs- und

25 Entwicklungsges, M.b.H. Un cuerpo ASCP puede estar fusionado a una region CH1 y/o CH2 y/o CH3, y/o VL. El cuerpo ASCP puede estar dentro del contexto de SCALP o SmALP.

[0045] El termino "diana" se refiere a un antlgeno o epltopo reconocido por la molecula de union basada en Fn3 de la invencion. Las dianas incluyen, pero no se limitan a, epltopos presentes en protelnas, peptidos,

30 carbohidratos y/o llpidos.

[0046] El termino "conjugado" se refiere a una molecula de union basada en Fn3 ligada qulmica o geneticamente a uno o mas restos no Fn3.

35 [0047] El termino "resto no Fn3" se refiere a una entidad biologica o qulmica que confiere funcionalidad

adicional a una molecula a la que esta unido. En una realizacion particular, el resto no Fn3 es un polipeptido, por ejemplo, albumina de suero humano (HSA), o una entidad qulmica, por ejemplo, polietilenglicol (PEG) que aumenta la semivida in vivo de la molecula de union basada en Fn3.

40 [0048] El termino "biblioteca" de polipeptidos Fn3 se refiere a una coleccion de polipeptidos Fn3 que tienen

una variacion o diversidad de secuencia seleccionada en al menos uno de los bucles AB, CD y EF de una longitud definida. El termino "biblioteca" tambien se usa para referirse a la coleccion de secuencias de aminoacidos dentro de un bucle seleccionado AB, CD y EF de una longitud seleccionada, y a la coleccion de secuencias codificantes que codifican bibliotecas de aminoacidos de bucle o polipeptido.

45

[0049] El termino "biblioteca universal de union del lado inferior de Fn3" se refiere a una biblioteca de

polipeptidos Fn3 en la que la diversidad de aminoacidos en una o mas de las regiones de bucle AB, CD y EF esta determinada por o refleja las variantes de aminoacidos presentes en una coleccion de secuencias conocidas de Fn3.

50 [0050] El termino "biblioteca universal de union a N+-" o "bibliotecas N+/-" se refiere a una biblioteca mas

sofisticada o ajustada en la que los aminoacidos mas frecuentes que rodean a un aminoacido fijo se determinan en el diseno de la biblioteca. Estas bibliotecas N+/- estan construidas con variaciones en los bucles inferiores, AB, CD y EF, los bucles superiores, BC, DE, FG o cualquier combinacion de bucles superiores e inferiores. Para "bibliotecas N+/-", N es el aminoacido predominante en una posicion particular y los aminoacidos aguas arriba o aguas abajo se

55 designan +N o -N, respectivamente. Por ejemplo, N+3 es un aminoacido 3 posiciones aguas arriba de N, mientras que N-3 es un aminoacido 3 posiciones aguas abajo de N en una estructura tridimensional de Fn3. Del mismo modo, N+2 y N+1 son aminoacidos en las posiciones 2 y 1 aguas arriba de N, respectivamente, mientras que N-2 y N-1 son aminoacidos en las posiciones 2 y 1 aguas abajo de N, respectivamente. Al alterar N del aminoacido predominantemente mas abundante a un aminoacido menos abundante, se puede evaluar el efecto de esa

modificacion en la abundancia de aminoacidos a 1, 2 o 3 posiciones de distancia de N. Al disenar dicha biblioteca, se determinan la frecuencia y la abundancia de aminoacidos que rodean la posicion N fija. Estas diferencias pueden usarse para generar bibliotecas universales de dominio de union en el lado inferior de la fibronectina, bibliotecas de dominio de union en el lado superior o una combinacion de bibliotecas de dominio de union tanto en el lado inferior 5 como en el lado superior.

[0051] El termino "resto de aminoacido conservado" o "aminoacido fijo" se refiere a un resto de aminoacido

que se determina que se produce con una frecuencia que es alta, normalmente al menos un 50 % o mas (por ejemplo, aproximadamente un 60 %, 70 %, 80 %, 90 %, 95 % o un 100 %), para una posicion de resto dada. Cuando 10 se determina que un resto dado se produce a una frecuencia tan alta, es decir, por encima de un umbral de aproximadamente un 50 %, se puede determinar que se conserva y se representa en las bibliotecas de esta descripcion, por ejemplo, en las bibliotecas de la presente invencion, como un resto "fijo" o "constante", al menos para esa posicion de resto de aminoacido en la region de bucle que se analiza.

15 [0052] El termino "resto de aminoacido semiconservado" se refiere a restos de aminoacidos que se

determinan que se producen con una frecuencia que es alta, de 2 a 3 restos para una posicion de resto dada. Cuando 2-3 restos, preferentemente 2 restos, que juntos, estan representados a una frecuencia de aproximadamente un 40 % del tiempo o superior (por ejemplo, un 50 %, 60 %, 70 %, 80 %, 90 % o mas), se determina que los restos estan semiconservados y por lo tanto representados en las bibliotecas de esta descripcion, 20 por ejemplo en las bibliotecas de la presente invencion, como "semifijos" al menos para esa posicion de resto de aminoacido en la region de bucle que se analiza. Normalmente, se introduce un nivel apropiado de mutagenesis/variabilidad de acido nucleico para una posicion de aminoacido semiconservada (codon) de modo que los 2 a 3 restos esten representados apropiadamente. Asl, cada uno de los 2 a 3 restos puede decirse que es "semifijo" para esta posicion. Un "resto de aminoacido semiconservado seleccionado" es uno de los 2 o mas restos 25 de aminoacido semiconservados seleccionados, normalmente, aunque no necesariamente, el resto que tiene la mayor frecuencia de aparicion en esa posicion.

[0053] El termino "resto de aminoacido variable" se refiere a restos de aminoacidos que se determinan que se producen con una frecuencia inferior (inferior al 20 %) para una posicion de resto dada. Cuando muchos restos

30 aparecen en una posicion determinada, se determina que la posicion del resto es variable y esta representada en las bibliotecas de esta descripcion, por ejemplo en las bibliotecas de la presente invencion, como variable al menos para esa posicion de restos de aminoacidos en la region del bucle analizada. Normalmente, se introduce un nivel apropiado de mutagenesis/variabilidad de acido nucleico para una posicion variable de aminoacido (codon) de manera que se represente adecuadamente un espectro preciso de restos. Por supuesto, se entiende que, si se 35 desea, las consecuencias o la variabilidad de cualquier posicion de resto de aminoacido, es decir, conservada, semiconservada o variable, se pueden representar, explorar o alterar utilizando, segun sea apropiado, cualquiera de los procedimientos de mutagenesis descritos en este documento. Una frecuencia umbral mas baja de aparicion de aminoacidos variables puede ser, por ejemplo, del 5-10 % o inferior. Por debajo de este umbral, los aminoacidos variables pueden omitirse de los aminoacidos de variante natural en esa posicion.

40

[0054] El termino "consenso" se refiere a un aminoacido en un bucle AB, CD y EF de un polipeptido Fn3 que

es un aminoacido conservado o uno seleccionado de aminoacidos semiconservados que aparece predominantemente en una posicion dentro del bucle.

45 [0055] El termino "aminoacidos de variante natural" incluye restos de aminoacidos conservados,

semiconservados y variables observados, de acuerdo con sus frecuencias de aparicion, en una posicion dada en un bucle seleccionado de una longitud seleccionada. Los aminoacidos de variante natural pueden estar sustituidos por aminoacidos qulmicamente equivalentes y pueden excluir restos de aminoacidos variables por debajo de una frecuencia de aparicion seleccionada, por ejemplo, el 5-10 %, o restos de aminoacidos que son qulmicamente 50 equivalentes a otros aminoacidos de variante natural.

[0056] El termino "biblioteca de secuencias de mutagenesis" se refiere a una biblioteca de secuencias dentro

de un bucle Fn3 seleccionado y una longitud de bucle que se expresa mediante una biblioteca de secuencias codificantes que codifican, en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado 55 seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido. Asl, para cada uno de los aminoacidos diana, la biblioteca de secuencias dentro de un bucle dado contendra el aminoacido diana en todas las combinaciones de una a todas las posiciones dentro del bucle en el que el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a la frecuencia umbral dada. Si esta

frecuencia umbral se establece en el 100 %, cada posicion en el bucle contendra el aminoacido diana en al menos un miembro de la biblioteca. Las "secuencias de mutagenesis de la biblioteca" se pueden generar a partir de las tablas y figuras descritas en este documento usando proveedores comerciales tales como Geneart o DNA2.0.

5 [0057] El termino "biblioteca de secuencias combinatorias de variantes naturales" se refiere a una biblioteca

de secuencias dentro de un bucle Fn3 seleccionado y una longitud de bucle que se expresa mediante una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variantes naturales, incluidos 10 aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral de aparicion mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos. Por lo tanto, para cada posicion de aminoacido en un bucle y longitud de bucle seleccionada, la biblioteca de secuencias combinatorias de variantes naturales contendra el aminoacido de consenso en esa posicion mas otras variantes de aminoacidos identificadas como que tienen al menos cierta frecuencia minima en esa posicion, por ejemplo, al menos un 5-10 % de frecuencia, 15 o aminoacidos qulmicamente equivalentes. Ademas, las variantes naturales pueden sustituirse o descartarse si la secuencia codificante de ese aminoacido produce un numero significativo de aminoacidos coproducidos, a traves de la degeneration del codon.

[0058] El termino "perfil de variabilidad" o "VP" se refiere a la catalogacion de aminoacidos y sus respectivas 20 frecuencias de aparicion presentes en una posicion del bucle particular. Las posiciones del bucle se derivan de un

conjunto de datos de fibronectina alineados.

[0059] El termino "aminoacido" o "resto de aminoacido" normalmente se refiere a un aminoacido que tiene su definition reconocida en la materia, tal como un aminoacido seleccionado del grupo que consiste en: alanina (Ala,

25 A); arginina (Arg, R); asparagina (Asn, N); acido aspartico (Asp, D); cistelna (Cys, C); glutamina (Gln, Q); acido glutamico (Glu, E); glicina (Gly, G); histidina (His, H); isoleucina (Ile, I): leucina (Leu, L); lisina (Lys, K); metionina (Met, M); fenilalanina (Phe, F); prolina (Pro, P); serina (Ser, S); treonina (Thr, T); triptofano (Trp, W); tirosina (Tyr, Y); y valina (Val, V), aunque pueden usarse aminoacidos modificados, sinteticos o raros segun se desee.

30 [0060] El termino "aminoacidos qulmicamente equivalentes" se refiere a aminoacidos que tienen propiedades

estericas, de carga y de solubilidad similares. Un esquema comun agrupa aminoacidos de la siguiente manera: (1) glicina, que tiene una cadena lateral de hidrogeno; (2) alanina (Ala, A), valina (Val, V), leucina (Leu, L) e isoleucina (Ile, I), que tienen hidrogeno o una cadena lateral alifatica no sustituida; (3) serina (Ser, S) y treonina (Thr, T) que tienen una cadena lateral alifatica que lleva un grupo hidroxilo; (4) acido aspartico (Asp, D) y glutamico (Glu, E), que 35 tienen una cadena lateral que contiene carboxilo; (5) asparagina (Asn, N) y glutamina (Glu, Q), que tienen una cadena lateral alifatica que termina en un grupo amida; (6) arginina (Arg, R), lisina (Lys, L) e histidina (His, H), que tienen una cadena lateral alifatica que termina en un grupo amino basico; (7) cistelna (Cys, C) y metionina (Met, M), que tienen una cadena lateral alifatica que contiene azufre; (8) tirosina (Tyr, Y) y fenilalanina (Phe, F), que tienen una cadena lateral aromatica; y (9) triptofano (Trp, W), prolina (Pro, P) e histidina (His, H), que tienen una cadena 40 lateral heterociclica.

[0061] El termino "polinucleotido(s)" se refiere a acidos nucleicos tales como moleculas de ADN y moleculas de ARN y analogos de los mismos (por ejemplo, ADN o ARN generado usando analogos de nucleotidos o usando quimica de acidos nucleicos). Segun se desee, los polinucleotidos pueden prepararse sinteticamente, por ejemplo,

45 usando quimica de acidos nucleicos reconocida en la materia o usando enzimaticamente, por ejemplo, una polimerasa, y, si se desea, modificarse. Las modificaciones tipicas incluyen metilacion, biotinilacion y otras modificaciones conocidas en la materia. Ademas, la molecula de acido nucleico puede ser monocatenaria o bicatenaria y, cuando se desee, unirse a un resto detectable. Las bases polinucleotidicas y los pares de bases alternativos reciben sus abreviaturas habituales en el presente documento: Adenosina (A), Guanosina (G), Citidina 50 (C), Timidina (T), Uridina (U), puRina (R = A/G), pirimidina (Y = C/T o C/U), aMino (M = A/C), ceto (K = G/T o G/U), fuerte (S = G/C), debil (W = A/T o A/U), V (A o C o G, pero no T), N o X, (cualquier base).

[0062] El termino "mutagenesis" se refiere, a menos que se especifique lo contrario, a cualquier tecnica reconocida en la materia para alterar una secuencia polinucleotidica o polipeptidica. Los ejemplos de mutagenesis

55 incluyen, pero no se limitan a, mutagenesis de paso (WTM), mutagenesis combinatoria de variantes naturales y mutagenesis combinatoria de variantes naturales beneficiosa, aunque se pueden emplear otras bibliotecas de mutagenesis, tales como mutagenesis directa (LTM).

II. Description general del procedimiento y las bibliotecas

[0063] Los andamiajes de anticuerpos artificiales que se unen a ligandos especlficos se estan convirtiendo en

alternativas legltimas a los anticuerpos. Los anticuerpos han sido utiles como herramientas diagnosticas y terapeuticas. Sin embargo, la obtencion de anticuerpos especlficos que reconocen ciertas dianas ha sido diflcil. Las 5 bibliotecas de anticuerpos actuales estan sesgadas contra ciertas clases de antlgenos solo despues de la exposition inmunologica. Por lo tanto, con frecuencia es necesario inmunizar un animal huesped con un antlgeno particular antes de que pueda producirse la recuperation de anticuerpos especlficos. Ademas, los anticuerpos son diflciles y caros de producir y requieren reactores de fermentation celular y procedimientos de purification especiales.

10 [0064] Las limitaciones de los anticuerpos han estimulado el desarrollo de protelnas de union alternativas

basadas en pliegues de tipo inmunoglobulina u otras topologlas de protelnas. Estos andamiajes que no son anticuerpos comparten la cualidad general de tener un nucleo estructural estable que es tolerante a las sustituciones multiples en otras partes de la protelna.

15 [0065] La presente description proporciona dominios de union universales del lado inferior de la fibronectina

y una biblioteca de dominios de union del lado inferior de la fibronectina que usan las regiones del bucle del lado inferior (AB, CD o EF). Estos dominios de union a Fn3 del lado inferior y las bibliotecas de los dominios de union a Fn3 del lado inferior son mas completos y estan disenados para tener diversidad artificial en los bucles de union a la diana. Al crear una diversidad artificial, el tamano de la biblioteca se puede controlar de modo que se pueda cribar

20 facilmente utilizando, por ejemplo, procedimientos de alto rendimiento para obtener nuevas terapias. La biblioteca de fibronectina universal con regiones de bucle del lado inferior se puede explorar usando selection de clones flsicos positivos mediante FACS, seleccion de fagos o retention selectiva de ligandos. Estas evaluaciones in vitro evitan la metodologla convencional y tediosa inherente a la generation de una biblioteca de hibridomas de anticuerpos y la deteccion de sobrenadantes.

25

[0066] Ademas, la biblioteca de fibronectina universal con las regiones de bucle del lado inferior (AB, CD o

EF) tiene el potencial de reconocer cualquier diana ya que los aminoacidos constituyentes en el bucle de union diana se crean mediante tecnicas de diversidad in vitro. Esto produce las ventajas significativas de la biblioteca que controla el tamano de la diversidad y la capacidad de reconocer autoantlgenos. Ademas, la biblioteca de dominio de

30 union del lado inferior de la fibronectina con las regiones de bucle del lado inferior (AB, CD o EF) se puede propagar y volver a seleccionar para descubrir modulos de union de fibronectina adicionales contra otras dianas deseadas.

Revision de fibronectina: (Fn)

35 [0067] Las protelnas de Fibronectina de Tipo III (Fn3) se refieren a un grupo de protelnas compuestas por

subunidades monomericas que tienen una estructura o motivo de Fibronectina de Tipo III (Fn3) compuesto de siete cadenas p con tres bucles de conexion. Las cadenas p A, B y E forman una mitad p-sandwich y cadenas las p C, D, F y G forman la otra mitad (vease Fig. 1), y que tiene pesos moleculares de aproximadamente 94 aminoacidos y pesos moleculares de aproximadamente 10 KDa. El pliegue global del dominio Fn3 esta estrechamente relacionado

40 con el de los dominios de inmunoglobulina, y los tres bucles cerca del extremo N-terminal de Fn3, denominados BC, DE y FG, pueden considerarse estructuralmente analogos a regiones determinantes de la complementariedad del dominio variable de anticuerpo (VH), CDR1, CDR2 y CDR3, respectivamente. Se ha pensado generalmente que los bucles inferiores de Fn3 confieren estabilidad estructural en lugar de usarse para unirse a dianas. Sin embargo, los procedimientos de la descripcion demuestran que los bucles inferiores pueden usarse para la union a dianas y para

45 generar bibliotecas de moleculas de union de Fn3 que usan los bucles superiores, los bucles inferiores o cualquier combination de bucles superior e inferior para la union.

[0068] La secuencia de aminoacidos de la fibronectina revela tres tipos de repeticiones o modulos internamente homologos separados por secuencias de conexion (generalmente) cortas. Hay 12 modulos de tipo 1, 2

50 de tipo II y 16 de tipo III, y se conocen como Fn I, Fn II y Fn III, respectivamente. Cada modulo Fn constituye una unidad plegada independientemente, a menudo denominada dominio. Dentro de la fibronectina en si, hay dieciseis dominios Fn3 y tienen estructuras terciarias notablemente similares. Si bien la conformation de Fn3 esta altamente conservada, la similitud entre diferentes modulos del mismo tipo dentro de una protelna de fibronectina dada es bastante baja, normalmente menos del 20 %.

55

Identification y seleccion de componentes de andamiaje y fibronectina mediante bioinformatica

[0069] El primer paso para construir una biblioteca de fibronectina universal de esta descripcion es seleccionar secuencias que cumplan con ciertos criterios predeterminados. Se hizo una busqueda en PFAM, ProSite

y bases de datos similares para secuencias que contengan dominios Fn3 (Fig. 1). Estas bases de datos electronicas contienen fibronectina expresada catalogada y secuencias de protelnas de tipo fibronectina y se pueden consultar para aquellos modulos de Fn3 y secuencias similares (por ejemplo, usando el algoritmo de busqueda BLAST). Las secuencias del modulo Fn3 se pueden agrupar segun criterios predefinidos, como subclases de modulo, similitud de 5 secuencia u organismo(s) de origen. La seleccion de secuencia marco tambien se puede realizar para protelnas de andamiaje tales como Fn I, Fn II o anquirina y otras protelnas, tales como SCALP, SmALP, NANOBODIES y similares.

[0070] A continuacion, se delinean secuencias de marco de andamiaje de la cadena p de Fn3 candidatas con 10 lo que a continuacion se identifican las regiones del bucle intermedio y los aminoacidos constituyentes. Esto

determina entonces la longitud de los bucles existentes, los perfiles de aminoacidos para cada longitud de bucle y, por lo tanto, el tamano flsico y la diversidad de aminoacidos que se pueden acomodar dentro de estos marcos. Una vez que se identifican los bucles, las secuencias dentro de cada bucle se alinean, y las secuencias alineadas se dividen en grupos segun la longitud del bucle. Se identifico la distribucion de las longitudes del bucle para los bucles 15 AB, CD y EF. Con esta informacion, se seleccionan los tamanos de bucle mas comunes. En un ejemplo general de esta descripcion, las longitudes del bucle seleccionadas son AB/3, CD/5, CD/6, CD/7 y EF/6, DE/6. Para cada cadena p, uno puede determinar los sitios preferidos de aceptores de bucle en los marcos basados tanto en analisis comparativo estructural como de secuencia. Por ejemplo, se puede usar la comparacion de superposition estructural de los andamiajes de bucle entero y bucle p entre la fibronectina 10Fn3, 14Fn3 o cualquiera de los otros dominios Fn3 20 conocidos. En la identification de posiciones del bucle precisas, la etapa anterior minimiza en gran medida las mutaciones del bucle de diversidad necesarias que no darlan como resultado una especificidad de union al ligando funcional.

[0071] Una vez que se seleccionan las longitudes del bucle, se realiza un analisis de frecuencia posicional de 25 aminoacidos en cada position del bucle, para determinar la frecuencia de aparicion, en un conjunto de modulos de

Fn3 nativos. Este procedimiento incluye un analisis de frecuencia y la generation de los correspondientes perfiles de variabilidad (VP) de las secuencias de bucle existentes (Vease Ejemplos y Figs. 3-10) Las posiciones de alta frecuencia (por ejemplo, > 50 %) se consideran conservadas o fijas. Los aminoacidos de frecuencia moderadamente alta o "semiconservados" o (cuando se combinan 2 o 3 representan > 40 %) se eligen como "tipo silvestre" en otras 30 posiciones. Estos aminoacidos de tipo silvestre se alteran sistematicamente usando mutagenesis, por ejemplo, mutagenesis directa, para generar la biblioteca de bucle universal. Las posiciones "variables" son aquellas en las que, por lo general, ningun aminoacido representa mas del 20 % del conjunto representado.

[0072] La election de las estructuras candidatas basadas en los criterios de esta descripcion dicta tanto los 35 tamanos de bucle que se introduciran como la diversidad inicial de la secuencia de aminoacidos.

[0073] Un analisis de perfil de variabilidad de bucle de las bases de datos de Fn3 permite la identificacion de posiciones de restos de aminoacidos de bucle que se dividen en tres categorlas, por ejemplo, 1) posiciones que deben conservarse o "fijas" y 2) posiciones semiconservadas y/o 3) posiciones variables que son adecuadas para la

40 generacion de diversidad. Se realiza un analisis de perfil de variabilidad y se utiliza una frecuencia umbral para identificar las secuencias mas favorables que se utilizaran para designar la diversidad global de bucles.

[0074] La secuencia conservada o una secuencia semiconservada seleccionada (normalmente el aminoacido mas frecuente en los restos semiconservados) se considera el resto de "tipo silvestre" o "consenso" en la secuencia

45 de bucle. Este enfoque de "consenso" o "frecuencia" identifica aquellos aminoacidos particulares bajo alta presion selectiva que ocurre con mayor frecuencia en una posicion particular.

[0075] De acuerdo con esto, estas posiciones de restos normalmente son fijas, introduciendose la diversidad en las posiciones de aminoacidos restantes (teniendo en cuenta la preferencia identificada para que ciertos

50 aminoacidos esten presentes en estas posiciones). El umbral para la frecuencia de aparicion a la cual se introducira la variation de aminoacidos puede variar entre niveles seleccionados tan bajos como del 40 %, preferentemente del 50 % hasta tan alto como del 100 %. En la frecuencia umbral del 100 %, la mutagenesis de los aminoacidos se puede introducir en todas las posiciones del bucle, y las unicas limitaciones en los aminoacidos de variantes naturales seran el numero total de variantes y si hay equivalentes qulmicos disponibles.

55

[0076] Cuando se disena la diversidad para cualquiera de los bucles mencionados anteriormente, los restos de aminoacidos modificados, por ejemplo, restos fuera de los 20 aminoacidos tradicionales usados en la mayorla de los polipeptidos, por ejemplo, homocistelna, pueden incorporarse en los bucles segun se desee. Esto se lleva a cabo usando tecnicas reconocidas en la materia que normalmente introducen codones de parada en el polinucleotido

donde se desea el resto de aminoacido modificado. La tecnica proporciona entonces un ARNt modificado unido al aminoacido modificado que se va a incorporar (un denominado ARNt supresor de, por ejemplo, el codon de parada ambar, opalo u ocre) en el polipeptido (vease, por ejemplo, Kohrer et al., Import of amber and ochre suppressors tRNAs into mammalian cells: A general approach to site-specific insertion of amino acid analogues into proteins, 5 PNAS, 98, 14310-14315 (2001)).

[0077] El analisis bioinformatico se centra en los genes del modulo Fn3 con fines descriptivos, pero se entendera que los genes para otros modulos Fn y otras protelnas de andamiaje se evaluan de forma similar. En un caso, el analisis bioinformatico se puede aplicar para protelnas de tipo anticuerpo de cadena sencilla (SCALP),

10 nanoanticuerpos y similares.

Construction de la biblioteca de fibronectina universal asistida por ordenador

[0078] Las bibliotecas universales del bucle inferior de la fibronectina de esta description, por ejemplo las de 15 la invention, y su construccion se llevan a cabo con el beneficio de information secuencial y estructural de manera

que se incrementa el potencial para generar dominios de union a fibronectina mejorados. La informacion de modelado de reemplazo molecular estructural tambien se puede usar para guiar la selection de la diversidad de aminoacidos a introducir en las regiones de bucle definidas. Ademas, los resultados reales obtenidos con los dominios de union a fibronectina de esta descripcion, por ejemplo con los de la invencion, pueden guiar la seleccion 20 (o exclusion), por ejemplo, la maduracion de afinidad, de dominios de union de fibronectina posteriores para realizar y cribar de forma iterativa.

[0079] En un caso, por ejemplo, en una realization, el modelado in silico se usa para eliminar la production de cualquier dominio de union a fibronectina que se prediga que tiene una estructura y/o funcion pobre o no

25 deseada. De esta forma, el numero de dominios de union a fibronectina que se van a producir puede reducirse bruscamente, aumentando de este modo la senal a ruido en ensayos de cribado posteriores. En otro ejemplo particular, por ejemplo en otra realizacion particular, el modelado in silico se actualiza continuamente con informacion de modelado adicional, desde cualquier fuente relevante, por ejemplo, desde secuencias de genes y protelnas y bases de datos tridimensionales y/o resultados de dominios de union a fibronectina probados 30 previamente, de modo que la base de datos in silico se vuelve mas precisa en su capacidad predictiva (Fig. 1).

[0080] En otro ejemplo mas, por ejemplo en otra realizacion, la base de datos in silico se proporciona con los resultados del ensayo, por ejemplo, afinidad/avidez de union de dominios de union a fibronectina probados previamente y categoriza los dominios de union a fibronectina, basandose en el criterio o criterios de ensayo, como

35 respondedores o no respondedores, por ejemplo, como moleculas de dominio de union a fibronectina que se unen bien o no tan bien. De esta forma, la maduracion de afinidad de esta descripcion, por ejemplo la de la invencion, puede equiparar un rango de respuestas funcionales con informacion estructural y de secuencia particular y usar dicha informacion para guiar la produccion de futuros dominios de union a fibronectina a analizar. El procedimiento es especialmente adecuado para el cribado de dominios de union a fibronectina para una afinidad de union particular 40 a un ligando diana usando, por ejemplo, un ensayo Biacore.

[0081] Por consiguiente, puede ser deseable la mutagenesis de restos no contiguos dentro de una region de bucle si se conoce, por ejemplo, a traves de la modelizacion in silico, que ciertos restos en la region no participaran en la funcion deseada. La estructura de coordenadas y la interrelation espacial entre las regiones definidas, por

45 ejemplo, se pueden considerar y modelar los restos de aminoacidos funcionales en las regiones definidas del dominio de union a fibronectina, por ejemplo, la diversidad que se ha introducido. Dichos criterios de modelado incluyen, por ejemplo, qulmica del grupo lateral de restos de aminoacidos, distancias entre atomos, datos de cristalografla, etc. En consecuencia, el numero de dominios de union a fibronectina que se van a producir se puede minimizar de forma inteligente.

50

[0082] En un caso, por ejemplo, en una realizacion, una o mas de las etapas anteriores estan asistidas por ordenador. En un caso particular, por ejemplo en una realizacion particular, la etapa asistida por ordenador comprende, por ejemplo, extraer de las bases de datos NCBI, Genbank, PFAM y ProSite y, opcionalmente, hacer referencias cruzadas de los resultados contra la base de datos estructural PDB, por lo que ciertos criterios de la

55 invencion se determinan y se usan para disenar la diversidad de bucles deseada (Fig. 1). El procedimiento tambien se puede llevar a cabo, en parte o en su totalidad, por un dispositivo, por ejemplo, un dispositivo accionado por ordenador. Por ejemplo, la seleccion de secuencia del modulo de fibronectina de minerla de datos, el diseno de diversidad, la slntesis de oligonucleotidos, el ensamblaje mediado por PCR de los anteriores, y la expresion y seleccion de dominios de union de fibronectina candidatos que se unen a una diana dada, puede llevarse a cabo en

parte o completamente, mediante dispositivos entrelazados. Ademas, las instrucciones para llevar a cabo el procedimiento, en parte o en su totalidad, se pueden conferir a un medio adecuado para su uso en un dispositivo electronico para llevar a cabo las instrucciones. En resumen, los procedimientos de esta description, que incluyen los de la invention, son modificables para un enfoque de alto rendimiento que comprende software (por ejemplo, 5 instrucciones legibles por ordenador) y hardware (por ejemplo, ordenadores, robotica y chips).

Bibliotecas universales de mutagenesis

[0083] La presente descripcion se refiere a una biblioteca de mutagenesis de polipeptidos del dominio de 10 fibronectina de Tipo 3 utiles en el cribado para la presencia de uno o mas polipeptidos que tienen una actividad

enzimatica o de union seleccionada. Los polipeptidos de la biblioteca incluyen (a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre de un polipeptido o polipeptidos de fibronectina de tipo 3 nativos seleccionados, y (b) regiones de bucle Ab, CD y EF que tienen una o mas longitudes seleccionadas. Al menos una region de bucle seleccionada de una longitud seleccionada contiene una biblioteca de secuencias 15 codificadas por una biblioteca de secuencias codificantes que codifican, en cada position del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una aparicion frecuencia igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido (aminoacidos producidos por las secuencias codificantes en una posicion dada como resultado de la degeneracion del codon).

20

[0084] Al construir una biblioteca dentro de un bucle dado de una longitud de bucle dada, el perfil de variabilidad se usa para definir una secuencia de posiciones fijas y "variables", es decir, posiciones en las que puede introducirse un aminoacido diana. El numero de posiciones fijas dependera de la frecuencia umbral seleccionada para el aminoacido de consenso en cada posicion.

25

[0085] Una vez que se seleccionan las secuencias de bucle, se construye una biblioteca de oligonucleotidos de secuencia codificante que codifica todas las secuencias identificadas, haciendo las sustituciones de codones como se muestra que son eficaces para conservar el aminoacido de consenso existente, pero tambien codifican el aminoacido diana seleccionado, y cualquier otro aminoacido coproducto codificado por codones degenerados.

30

[0086] La biblioteca de secuencias codificantes para los bucles se anade a las secuencias marco, para construir la biblioteca de secuencias codificantes para las bibliotecas de polipeptidos. La biblioteca de polipeptidos puede estar codificada por un formato de biblioteca de expresion que incluye una biblioteca de presentation en ribosomas, una biblioteca de presentacion en polisomas, una biblioteca de presentacion en fagos, una biblioteca de

35 expresion bacteriana o una biblioteca de presentacion en levaduras.

[0087] Las bibliotecas se pueden usar en un procedimiento para identificar un polipeptido que tiene una afinidad de union deseada, en el que la biblioteca combinatoria de variantes naturales se criba para seleccionar un dominio de union a fibronectina que tiene una afinidad de union deseada.

40

[0088] En otro caso, pueden generarse bibliotecas universales de mutagenesis combinatoria de variantes naturales. La descripcion incluye una biblioteca combinatoria de variantes naturales de polipeptidos del dominio de fibronectina de Tipo 3 utiles en el cribado de la presencia de uno o mas polipeptidos que tienen una actividad enzimatica o de union seleccionada. Los polipeptidos de la biblioteca incluyen (a) regiones A, AB, B, C, CD, D, E,

45 EF, F y G que tienen secuencias de aminoacidos de tipo silvestre de un polipeptido o polipeptidos de fibronectina de tipo 3 nativos seleccionados, y (b) regiones de bucle AB, CD y EF que tienen longitudes seleccionadas. Al menos una region de bucle seleccionada de una longitud seleccionada contiene una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso 50 tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variantes naturales, incluidos aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral de aparicion mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos.

55 [0089] Al construir una biblioteca combinatoria de variantes naturales para un bucle y una longitud de bucle

dados, el perfil de variabilidad se usa para definir una secuencia de posiciones fijas y "variables", es decir, posiciones en las que pueden introducirse variaciones de aminoacidos. En las bibliotecas, el numero de posiciones fijas dependera de la frecuencia umbral seleccionada para el aminoacido de consenso en cada posicion. Si, por ejemplo, el umbral de frecuencia seleccionado se establecio en aproximadamente un 60 %, los restos conservados o

semiconservados y las sustituciones de variantes naturales no se realizarlan en estas posiciones. Por el contrario, si la frecuencia umbral se establece en el 100 %, todas las posiciones se considerarlan abiertas a la variacion, reconociendo que un solo aminoacido con una frecuencia del 100 % en una posicion del bucle no se sustituirla, y una posicion que tenia un aminoacido muy dominante, por ejemplo, con una frecuencia del 90 %, podrla sustituirse 5 solo si la variante o variantes de baja frecuencia fueran qulmicamente diferentes al aminoacido dominante.

[0090] A partir del perfil de aminoacidos para un bucle y una longitud de bucle dados, y sabiendo cual de las posiciones se mantendra fija y cuales admitiran variaciones, se pueden seleccionar las sustituciones de aminoacidos en cada posicion variable. En general, el numero de variaciones que se seleccionan (incluidos los aminoacidos

10 coproducidos) dependera del numero de posiciones de sustitucion variable en el bucle y del numero promedio de variaciones por posicion del bucle sustituido. Por supuesto, si las sustituciones de variante natural se introducen en un unico bucle unico, se pueden acomodar muchas mas variaciones por posicion.

[0091] Los aminoacidos de variantes naturales particulares que se seleccionan para cada posicion 15 generalmente incluiran los aminoacidos que tienen las frecuencias mas altas, al tiempo que limitan el numero de

aminoacidos coproducidos, y de forma secundaria, preservan la diversidad qulmica en cada sitio. Una vez que se seleccionan las secuencias de bucle de variante natural, se construye una biblioteca de oligonucleotidos de secuencia codificante que codifican todas las secuencias variantes naturales identificadas, realizando sustituciones de codones que son eficaces para conservar el aminoacido de consenso existente y codifican los aminoacidos de 20 variantes seleccionadas, incluidas variantes codificadas por codones degenerados.

[0092] La biblioteca de secuencias codificantes para los bucles de variantes naturales se anade a las secuencias marco, para construir la biblioteca de secuencias codificantes para las bibliotecas de polipeptidos variantes naturales. En un caso, la biblioteca codificante incluye secuencias codificantes para un par de bucles

25 AB/CD, AB/EF o CD/EF, donde cada bucle en el par tiene una longitud seleccionada. Despues de seleccionar polipeptidos (o enzimaticos) de alta afinidad de union de esta biblioteca, se puede construir una segunda biblioteca "beneficiosa" que incluya las mutaciones beneficiosas contenidas en una o ambas de la biblioteca original de variacion natural de dos bucles, y aminoacidos de variantes naturales en el tercer bucle, es decir, el bucle de secuencia previamente fija. En otro caso, la biblioteca codificante incluye secuencias codificantes para los tres 30 bucles, AB, CD y EF.

[0093] La biblioteca de polipeptidos puede estar codificada por una biblioteca de expresion que tiene el formato de una biblioteca de presentation en ribosomas, una biblioteca de presentation en polisomas, una biblioteca de presentacion en fagos, una biblioteca de expresion bacteriana o una biblioteca de presentacion en levaduras.

35

Sintesis de bibliotecas universales de dominio de union del lado inferior de la fibronectina

[0094] En un caso, por ejemplo en una realization, los dominios universales de union del lado inferior de la fibronectina de esta description, por ejemplo los de la invention, se generan para el cribado sintetizando

40 oligonucleotidos individuales que codifican la region definida del polipeptido y no tienen mas de un codon para el aminoacido predeterminado. Esto se lleva a cabo incorporando, en cada posicion del codon dentro del oligonucleotido, el codon requerido para la sintesis del polipeptido de tipo silvestre o un codon para el aminoacido predeterminado y se denomina mutagenesis directa (LTM) (vease, por ejemplo, Publication de Patente de Estados Unidos n.° 20050136428).

45

[0095] En otro caso, por ejemplo, en otra realizacion, cuando se requiere diversidad en multiples posiciones de aminoacidos, puede usarse la mutagenesis de paso (WTM) (vease, por ejemplo, Patente de Estados Unidos n.° 6 649 340; 5 830 650; y 5 798 208; y Publicacion de Patente de Estados Unidos n.° 20050136428). En otro caso, por ejemplo en otra realizacion, se puede crear diversidad usando los procedimientos disponibles de proveedores

50 comerciales tales como DNA2.0 y Geneart proporcionando information sobre la longitud del bucle de los bucles AB, CD y EF, la distribution posicional de aminoacidos en cada posicion del bucle, y la abundancia de 7 aminoacidos superiores en cada posicion del bucle.

[0096] Ademas, los procedimientos de la descripcion tambien proporcionan otras bibliotecas denominadas 55 "bibliotecas N+/-". Estas bibliotecas N+/- estan construidas con variaciones en los bucles inferiores, AB, CD y EF, los

bucles superiores, BC, DE, FG o cualquier combination de bucles superior e inferior. Para "bibliotecas N+/-", N es el aminoacido predominante en una posicion particular y los aminoacidos aguas arriba o aguas abajo se designan +N o -N, respectivamente. Por ejemplo, N+3 es un aminoacido 3 posiciones aguas arriba de N, mientras que N-3 es un aminoacido 3 posiciones aguas abajo de N en una estructura tridimensional de Fn3. Del mismo modo, N+2 y N+1

son aminoacidos en las posiciones 2 y 1 aguas arriba de N, respectivamente, mientras que N-2 y N-1 son aminoacidos en las posiciones 2 y 1 aguas abajo de N, respectivamente. Alterando N del aminoacido predominantemente mas abundante a un aminoacido menos abundante, el efecto de esa modification puede evaluarse en la abundancia de aminoacidos a 1, 2 o 3 posiciones de distancia de N. Al disenar dicha biblioteca, se 5 determinan la frecuencia y la abundancia de aminoacidos que rodean la position N fija. Estas diferencias pueden usarse para generar bibliotecas universales de dominio de union en el lado inferior, bibliotecas de dominio de union en el lado superior o una combination de bibliotecas de dominio de union tanto en el lado inferior como en el lado superior de la fibronectina.

10 [0097] Solo con fines ilustrativos, la secuencia de consenso en el bucle CD/5 como se muestra en las Figs.

6AB, es GDGQP en las posiciones del bucle 1, 2, 3, 4 y 5, siendo G el aminoacido predominante. Usando la teorla N+/-, si G en la posicion 3 del bucle se fija ya que es el aminoacido predominante (N), entonces se determina el efecto estructural y microambiental de G en la posicion 1 del bucle (N-2), la posicion 2 del bucle (N-1), la posicion 4 del bucle (N+1) y la posicion 5 del bucle (N+2). Se calcula la frecuencia de aminoacidos de cada posicion N-2, N-1, 15 N+1, N+2 en el contexto de un G fijo en la posicion N. Entonces, si G en la posicion 3 del bucle se cambia a S, se determina el efecto de S en las posiciones N-2, N-1, N+1, N+2 (es decir, las posiciones del bucle 1, 2 y 4, 5), y as! sucesivamente. Despues de calcular todas las combinaciones posibles, la information producida es una distribution de aminoacidos (N-2, N-1, N, N+1, N+2) de una posicion N dada dentro de una region de bucle predeterminada en el contexto de un aminoacido especlfico en esta posicion N. Esta informacion se puede usar para generar una 20 biblioteca.

[0098] En otra ilustracion, la secuencia de consenso de EF/6 como se muestra en las Figs. 10AB, es

GLKPGT en las posiciones del bucle 1, 2, 3, 4, 5 y 6, respectivamente, del bucle EF. Usando la teorla N+/-, si L en la posicion 2 se mantiene fijo ya que es el aminoacido predominante (N), entonces se determina el efecto 25 microambiental estructural y local sobre G en la posicion 1 (N-1), K en la posicion 3 (N+1), P en la posicion 4 (N+2), G en la posicion 5 (N+3), y T en la posicion 6 (N+4). Ademas, si L en la posicion 2 se cambia a V, entonces se determina el efecto de este cambio en las posiciones N-1, N+1, N+2, N+3 y N+4 (es decir, las posiciones del bucle 1, 3, 4, 5 y 6).

30 [0099] La mezcla de oligonucleotidos para la generation de la biblioteca se puede sintetizar facilmente

mediante procedimientos conocidos para la slntesis de ADN. El procedimiento preferido implica el uso de la fase solida qulmica de beta-cianoetil fosforamidita (por ejemplo, vease la Patente de EE.uU. n.° 4 725 677). Por conveniencia, se puede usar un instrumento para la slntesis automatizada de ADN que contiene recipientes reactivos especificados de nucleotidos. Los polinucleotidos tambien se pueden sintetizar para que contengan sitios 35 de restriction o sitios de hibridacion de cebador para facilitar la introduction o el ensamblaje de los polinucleotidos que representan, por ejemplo, una region definida, en un contexto de un gen mas grande.

[0100] Los polinucleotidos sintetizados se pueden insertar en un contexto de un gen mas grande, por ejemplo, un dominio de andamiaje unico usando tecnicas de ingenierla genetica convencionales. Por ejemplo, se

40 puede hacer que los polinucleotidos contengan sitios de reconocimiento flanqueantes para las enzimas de restriccion (por ejemplo, vease la Patente de EE.UU. n.° 4 888 286). Los sitios de reconocimiento pueden disenarse para que correspondan a sitios de reconocimiento que existen de forma natural o se introducen en el gen proximo al ADN que codifica la region. Despues de la conversion en una forma bicatenaria, los polinucleotidos se ligan en el gen o vector genetico mediante tecnicas convencionales. Por medio de un vector apropiado (que incluye, por 45 ejemplo, vectores de fagos, plasmidos), los genes pueden introducirse en un extracto libre de celulas, fago, celula procariota o celula eucariotica adecuada para la expresion de las moleculas del dominio de union a fibronectina.

[0101] Cuando se usan polinucleotidos parcialmente solapantes en el ensamblaje del gen, tambien se puede incorporar directamente un conjunto de nucleotidos degenerados en lugar de uno de los polinucleotidos. La cadena

50 complementaria apropiada se sintetiza durante la reaction de extension a partir de un polinucleotido parcialmente complementario de la otra cadena mediante extension enzimatica con una polimerasa. La incorporation de los polinucleotidos degenerados en la etapa de slntesis tambien simplifica la donation en la que mas de un dominio o region definida de un gen se muta o disena para tener diversidad.

55 [0102] En otro enfoque, el dominio de union a fibronectina esta presente en un plasmido de cadena sencilla.

Por ejemplo, el gen puede clonarse en un vector de fago o un vector con un origen de replication de fago filamentoso que permite la propagation de moleculas monocatenarias con el uso de un fago auxiliar. La plantilla monocatenaria puede reasociarse con un conjunto de polinucleotidos degenerados que representan las mutaciones deseadas y alargarse y ligarse, incorporando as! cada cadena analoga en una poblacion de moleculas que pueden

introducirse en un huesped apropiado (vease, por ejemplo, Sayers, J. R. et al. al., Nucleic Acids Res. 16: 791-802 (1988)). Este enfoque puede evitar multiples pasos de clonacion donde se seleccionan multiples dominios para la mutagenesis.

5 [0103] La metodologla de la reaccion en cadena de la polimerasa (PCR) tambien se puede usar para

incorporar polinucleotidos en un gen, por ejemplo, la diversidad de bucles en las regiones marco de la cadena p. Por ejemplo, los propios polinucleotidos pueden usarse como cebadores para la extension. En este enfoque, los polinucleotidos que codifican los casetes mutagenicos correspondientes a la region definida (o parte de la misma) son complementarios entre si, al menos en parte, y pueden extenderse para formar un gran casete genico (por 10 ejemplo, un dominio de union a fibronectina) usando un polimerasa, por ejemplo, usando amplificacion por PCR.

[0104] El tamano de la biblioteca variara dependiendo de la longitud del bucle y la cantidad de diversidad de secuencia que necesita representarse utilizando procedimientos de mutagenesis. Por ejemplo, la biblioteca esta disenada para contener menos de 1015, 1014, 1013, 1012, 1011, 1010, 109, 108, 107 y 1o6 dominios de union a

15 fibronectina.

[0105] La descripcion anterior se ha centrado en representar la diversidad del dominio de union a fibronectina alterando el polinucleotido que codifica el polipeptido correspondiente. Se entiende, sin embargo, que el alcance de esta descripcion tambien abarca los procedimientos de representacion de la diversidad del dominio de union a

20 fibronectina descrita en este documento por slntesis directa de las regiones polipeptldicas deseadas utilizando qulmica de protelnas. Al llevar a cabo este enfoque, los polipeptidos resultantes todavla incorporan las caracterlsticas de esta descripcion, excepto por que puede eliminarse el uso de un intermedio de polinucleotido.

[0106] Para las bibliotecas descritas anteriormente, ya sea en forma de polinucleotidos y/o polipeptidos 25 correspondientes, se entiende que las bibliotecas tambien pueden estar unidas a un soporte solido, tal como un

microchip, y preferentemente dispuestas en matrices, usando tecnicas reconocidas en la materia.

[0107] El procedimiento de esta descripcion es especialmente util para modificar las moleculas de dominio de union a fibronectina candidatas por medio de la maduracion de afinidad. Se pueden introducir alteraciones en los

30 bucles y/o en la region marco (constante) de la cadena p de un dominio de union a fibronectina. La modificacion de las regiones de bucle puede producir dominios de union a fibronectina con mejores propiedades de union a ligando y, si se desea, propiedades catallticas. La modificacion de la region marco de la cadena p tambien puede conducir a la mejora de las propiedades qulmico-flsicas, tales como la solubilidad o la estabilidad, que son especialmente utiles, por ejemplo, en la produccion comercial, la biodisponibilidad y la afinidad por el ligando. Normalmente, la 35 mutagenesis se dirigira a la region o regiones de bucle del dominio de union a fibronectina, es decir, la estructura responsable de la actividad de union a ligando que puede estar constituida por las tres regiones de bucle. En un caso preferido, una molecula de union candidata identificada se somete a maduracion por afinidad para aumentar la afinidad/avidez de la molecula de union por un ligando diana.

40 Sistemas de expresion y cribado

[0108] Las bibliotecas de polinucleotidos generadas mediante cualquiera de las tecnicas anteriores u otras tecnicas adecuadas se pueden expresar y cribar para identificar moleculas de dominio de union a fibronectina que tienen la estructura y/o actividad deseadas. La expresion de las moleculas del dominio de union a fibronectina se

45 puede llevar a cabo usando extractos libres de celulas (y, por ejemplo, presentacion en ribosomas), presentacion en fagos, celulas procariotas o celulas eucarioticas (por ejemplo, presentacion en levaduras).

[0109] En un caso, por ejemplo, en una realizacion, los polinucleotidos se modifican por ingenierla genetica para que sirvan como plantillas que se pueden expresar en un extracto libre de celulas. Se pueden usar vectores y

50 extractos como se describe, por ejemplo, en la Patente de Estados Unidos n.° 5 324 637; 5 492. 817; 5 665 563, y muchos estan disponibles en el mercado. Se puede usar la presentacion en ribosomas y otras tecnicas libres de celulas para unir un polinucleotido (es decir, un genotipo) a un polipeptido (es decir, un fenotipo), por ejemplo, Profusion™ (vease, por ejemplo, Patente de Estados Unidos n.° 6 348 315; 6 261 804; 6 258 558; y 6 214 553).

55 [0110] Como alternativa, los polinucleotidos de esta descripcion, por ejemplo los de la invencion, pueden

expresarse en un sistema de expresion de E. coli conveniente, tal como el descrito por Pluckthun y Skerra. (Pluckthun, A. y Skerra, A., Meth. Enzymol. 178: 476-515 (1989); Skerra, A. et al., Biotechnology 9: 273-278 (1991)). Las protelnas mutantes se pueden expresar para la secrecion en el medio y/o en el citoplasma de la bacteria, como se describe por M. Better y A. Horwitz, Meth. Enzymol. 178: 476 (1989). En un caso, por ejemplo, en una realizacion,

el dominio de union a fibronectina esta unido al extremo 3' de una secuencia que codifica una secuencia senal, tal como la secuencia senal ompA, phoA o pelB (Lei, SP et al., J. Bacteriol. 169: 4379 (1987)). Estas fusiones de genes se ensamblan en una construccion dicistronica, de modo que se pueden expresar a partir de un solo vector, y se secretan en el espacio periplasmico de E. coli donde se replegaran y se pueden recuperar en forma activa. (Skerra, 5 A, et al., Biotechnology 9: 273-278 (1991)).

[0111] En otro caso, por ejemplo en otra realizacion, las secuencias del dominio de union a fibronectina se expresan en la superficie de la membrana de un procariota, por ejemplo, E. coli, usando una senal de secrecion y resto de lipidacion como se describe, por ejemplo, en los documentos US20040072740A1; US20030100023A1; y

10 US20030036092A1.

[0112] En otro caso mas, por ejemplo, en otra realizacion mas, los polinucleotidos pueden expresarse en celulas eucariotas tales como levadura usando, por ejemplo, presentacion en levaduras como se describe, por ejemplo, en la Patente de Estados Unidos n.° 6 423 538; 6 331 391; y 6 300 065. En este enfoque, las moleculas del

15 dominio de union a fibronectina de la biblioteca se fusionan a un polipeptido que se expresa y se muestra en la superficie de la levadura.

[0113] Tambien se pueden usar celulas eucariotas superiores para la expresion de las moleculas del dominio de union a fibronectina de esta descripcion, por ejemplo las de la invencion, tales como celulas de mamlfero, por

20 ejemplo celulas de mieloma (por ejemplo, celulas NS/0), celulas de hibridoma o celulas de ovario de hamster chino (CHO). Normalmente, las moleculas del dominio de union a fibronectina, cuando se expresan en celulas de mamlfero, se disenan para expresarse en el medio de cultivo, o expresarse en la superficie de dicha celula. El dominio de union a fibronectina puede producirse, por ejemplo, como un solo modulo individual o como cadenas multimericas que comprenden dlmeros, trlmeros, que pueden estar compuestos del mismo modulo o de diferentes

25 tipos de modulos. (10Fn3-10Fn3: homodlmero, 10Fn3-8Fn3: heterodlmero).

[0114] El cribado del dominio de union a fibronectina expresado (o dominio de union a fibronectina producido por slntesis directa) puede realizarse por cualquier medio apropiado. Por ejemplo, la actividad de union se puede evaluar mediante inmunoensayo convencional y/o cromatografla de afinidad. El cribado del dominio de union a

30 fibronectina de la invencion para la funcion catalltica, por ejemplo, la funcion proteolltica, puede realizarse usando un ensayo de placa de hemoglobina convencional como se describe, por ejemplo, en la Patente de EE.UU. n.° 5 798 208. La determinacion de la capacidad de un dominio de union a fibronectina candidato para unirse a dianas terapeuticas puede analizarse in vitro usando, por ejemplo, un instrumento Biacore, que mide las velocidades de union de un dominio de union a fibronectina a una diana o ligando dados. Los ensayos in vivo se pueden realizar

35 usando cualquiera de una serie de modelos animales y posteriormente se prueban, segun corresponda, en seres humanos.

Analisis y cribado de bibliotecas Fn3 para la funcion catalltica.

40 [0115] Las bibliotecas de Fn3 tambien se pueden usar para detectar protelnas Fn3 que poseen actividad

catalltica. El estudio de las protelnas ha revelado que ciertos aminoacidos desempenan un papel crucial en su estructura y funcion. Por ejemplo, parece que solo un numero discreto de aminoacidos participa en el evento catalltico de una enzima. Las serina proteasas son una familia de enzimas presentes en practicamente todos los organismos, que han desarrollado un sitio catalltico estructuralmente similar caracterizado por la presencia

45 combinada de serina, histidina y acido aspartico. Estos aminoacidos forman una trlada catalltica que, posiblemente junto con otros determinantes, estabiliza el estado de transicion del sustrato. El papel funcional de esta trlada catalltica se ha confirmado por sustituciones individuales y multiples de serina, histidina y acido aspartico por mutagenesis dirigida de serina proteasas y la importancia de la interaction entre estos restos de aminoacidos en la catalisis ahora ha sido bien establecida.

50

[0116] De manera similar, un gran numero de otros tipos de enzimas se caracterizan por la conformation peculiar de su sitio catalltico y la presencia de ciertos tipos de restos de aminoacidos en el sitio que son los principales responsables del evento catalltico. Para una revision extensa, vease Enzyme Structure and Mechanism, 1985, por A. Fersht, Freeman Ed., Nueva York.

55

[0117] Aunque esta claro que ciertos aminoacidos son crlticos para el mecanismo de catalisis, es diflcil, cuando no imposible, predecir que posicion (o posiciones) debe ocupar un aminoacido para producir un sitio funcional tal como un sitio catalltico. Desafortunadamente, la configuration espacial compleja de las cadenas laterales de aminoacidos en las protelnas y la interrelation de las diferentes cadenas laterales en el bolsillo catalltico

de las enzimas no se comprenden lo suficiente como para permitir dichas predicciones. La mutagenesis selectiva dirigida a sitio y la mutagenesis de saturacion son de utilidad limitada para el estudio de la estructura y funcion de protelnas en vista del enorme numero de variaciones posibles en protelnas complejas.

5 [0118] Las bibliotecas de protelnas generadas por cualquiera de las tecnicas anteriores u otras tecnicas

adecuadas pueden cribarse para identificar variantes de estructura o actividad deseadas.

[0119] Al comparar las propiedades de una protelna de tipo silvestre y las variantes generadas, es posible identificar aminoacidos individuales o dominios de aminoacidos que confieren actividad de union y/o catalltica. Por lo

10 general, la region estudiada sera un dominio funcional de la protelna, como un dominio de union. Por ejemplo, la region puede ser las regiones de union del bucle AB, CD y EF del dominio Fn3. El cribado puede realizarse por cualquier medio apropiado. Por ejemplo, la actividad catalltica puede determinarse mediante ensayos adecuados para la conversion del sustrato y la actividad de union se puede evaluar mediante inmunoensayo convencional y/o cromatografla de afinidad.

15

[0120] A partir de las propiedades qulmicas de las cadenas laterales, parece que solo un numero seleccionado de aminoacidos naturales participa preferencialmente en un evento catalltico. Estos aminoacidos pertenecen al grupo de aminoacidos polares y neutros tales como Ser, Thr, Asn, Gln, Tyr y Cys, el grupo de aminoacidos cargados, Asp y Glu, Lys y Arg, y especialmente el aminoacido His. Las cadenas laterales polares y

20 neutras tlpicas son las de Cys, Ser, Thr, Asn, Gln y Tyr. La Gly tambien se considera un miembro limltrofe de este grupo. La Ser y la Thr juegan un papel importante en la formacion de enlaces de hidrogeno. La Thr tiene una asimetrla adicional en el carbono beta, por lo tanto, solo se usa uno de los estereoisomeros. La amida de acido Gln y Asn tambien pueden formar enlaces de hidrogeno, con los grupos amido que funcionan como donadores de hidrogeno y los grupos carbonilo que funcionan como aceptores. La Gln tiene un grupo CH2 mas que la Asn, lo que 25 hace que el grupo polar sea mas flexible y reduce su interaction con la cadena principal. La Tyr tiene un grupo hidroxilo muy polar (OH fenolico) que puede disociarse a valores de pH altos. La Tyr se comporta como una cadena lateral cargada; sus enlaces de hidrogeno son bastante fuertes.

[0121] La histidina (His) tiene una cadena lateral aromatica heteroclclica con un valor de pK de 6,0. En el 30 rango de pH fisiologico, su anillo de imidazol puede estar descargado o cargado, despues de tomar un ion de

hidrogeno de la solution. Dado que estos dos estados estan facilmente disponibles, la His es muy adecuada para catalizar reacciones qulmicas. Se encuentra en la mayorla de los centros activos de enzimas.

[0122] La Asp y la Glu estan cargadas negativamente a pH fisiologico. Debido a su cadena lateral corta, el 35 grupo carboxilo de la Asp es bastante rlgido con respecto a la cadena principal. Esta puede ser la razon por la cual

el grupo carboxilo en muchos sitios catallticos es proporcionado por la Asp y no por la Glu. Los acidos cargados generalmente se encuentran en la superficie de una protelna.

[0123] Por lo tanto, varias regiones diferentes o bucles de un dominio de protelna Fn3 pueden mutagenizarse 40 simultaneamente. Esto permite la evaluation de sustituciones de aminoacidos en regiones relacionadas

conformacionalmente tales como las regiones que, al plegar la protelna, se asocian para formar un sitio funcional tal como el sitio catalltico de una enzima o el sitio de union de un anticuerpo. Este procedimiento proporciona una forma de crear sitios catallticos modificados o completamente nuevos. Las tres regiones de bucle de Fn3, que pueden disenarse para conferir union al ligando diana, pueden mutagenizarse simultaneamente, o por separado dentro de 45 los bucles AB, CD y EF para analizar las funciones catallticas contribuyentes en este sitio de union. Por lo tanto, la introduction de aminoacidos "catallticamente importantes" adicionales en una region de union a ligando de una protelna puede dar como resultado una actividad catalltica de novo hacia el mismo ligando diana.

[0124] Por lo tanto, se pueden construir nuevas estructuras en el "andamiaje" natural de una protelna 50 existente mutando solo regiones relevantes mediante el procedimiento de esta description, por ejemplo, mediante el

procedimiento de la invention. El procedimiento de esta descripcion, por ejemplo, el procedimiento de la invention, es adecuado para el diseno de protelnas de union catalltica de novo en comparacion con el aislamiento de anticuerpos catallticos de origen natural. En la actualidad, los anticuerpos catallticos se pueden preparar mediante una adaptation de tecnicas convencionales de fusion de celulas somaticas. En este proceso, un animal se inmuniza 55 con un antlgeno que se asemeja al estado de transition del sustrato deseado para inducir la production de un anticuerpo que se une al estado de transicion y cataliza la reaction. Las celulas productoras de anticuerpos se recogen del animal y se fusionan con una celula de inmortalizacion para producir celulas hlbridas. Estas celulas se criban para detectar la secretion de un anticuerpo que cataliza la reaccion. Este proceso depende de la disponibilidad de analogos del estado de transicion de un sustrato. El proceso puede ser limitado porque es probable

que dichos analogos sean diflciles de identificar o sintetizar en la mayorla de los casos.

[0125] El procedimiento de esta descripcion, por ejemplo, el procedimiento de la invention, se puede usar para producir muchas enzimas o anticuerpos catallticos diferentes, que incluyen oxidorreductasas, transferasas,

5 hidrolasas, liasas, isomerasas y ligasas. Entre estas clases, sera de particular importancia la production de proteasas, carbohidrasas, lipasas, dioxigenasas y peroxidasas mejoradas. Estas y otras enzimas que pueden prepararse mediante el procedimiento de esta descripcion, por ejemplo mediante el procedimiento de la invencion, tienen aplicaciones comerciales importantes para conversiones enzimaticas en el cuidado de la salud, cosmeticos, alimentos, elaboration de cerveza, detergentes, medioambiente (por ejemplo, tratamiento de aguas residuales), 10 agricultura, curtido, textiles y otros procesos qulmicos. Estos incluyen, entre otros, aplicaciones de diagnostico y terapeuticas, conversiones de grasas, carbohidratos y protelnas, degradation de contaminantes organicos y slntesis de productos qulmicos. Por ejemplo, podrlan disenarse por ingenierla genetica proteasas terapeuticamente efectivas con actividad fibrinolltica, o actividad contra las estructuras virales necesarias para la infectividad, tales como las protelnas de la cubierta viral. Dichas proteasas podrlan ser agentes antitromboticos o agentes antivirales utiles 15 contra virus tales como el del sida, rinovirus, la gripe o la hepatitis. En el caso de las oxigenasas (por ejemplo, dioxigenasas), una clase de enzimas que requieren un cofactor para la oxidacion de anillos aromaticos y otros dobles enlaces, aplicaciones industriales en procesos de biopulpaje, conversion de biomasa en combustibles u otros productos qulmicos, la conversion de contaminantes en aguas residuales, el bioprocesamiento de carbon y la detoxification de compuestos organicos peligrosos son posibles aplicaciones de nuevas protelnas.

20

Procedimientos para generar bibliotecas universales de dominio de union en el lado inferior de la fibronectina

[0126] En general, la practica de la presente descripcion, que incluye la practica de la presente invencion, emplea, a menos que se indique lo contrario, tecnicas convencionales de qulmica, biologla molecular, tecnologla de

25 ADN recombinante, tecnologla de PCR, inmunologla (especialmente, por ejemplo, tecnologla de anticuerpos), expresion sistemas (por ejemplo, expresion libre de celulas, presentation en fagos, presentation en ribosomas y Profusion™), y cualquier cultivo celular necesario que este dentro de la experiencia de la tecnica y se explica en la bibliografla. Vease, por ejemplo, Sambrook, Fritsch y Maniatis, Molecular Cloning: Cold Spring Harbor Laboratory Press (1989); DNA Cloning, Vols. 1 and 2, (D.N. Glover, Ed. 1985); Oligonucleotide Synthesis (M.J. Gait, Ed. 1984); 30 PCR Handbook Current Protocols in Nucleic Acid Chemistry, Beaucage, Ed. John Wiley & Sons (1999) (Editor); Oxford Handbook of Nucleic Acid Structure, Neidle, Ed., Oxford Univ Press (1999); pCr Protocols: A Guide to Methods and Applications, Innis et al., Academic Press (1990); PCR Essential Techniques: Essential Techniques, Burke, Ed., John Wiley & Son Ltd (1996); The PCR Technique: RT-PCR, Siebert, Ed., Eaton Pub. Co. (1998); Current Protocols in Molecular Biology, eds. Ausubel et al., John Wiley & Sons (1992); Large-Scale Mammalian Cell 35 Culture Technology, Lubiniecki, A., Ed., Marcel Dekker, Pub., (1990). Phage Display: A Laboratory Manual, C. Barbas (Ed.), CSHL Press, (2001); Antibody Phage Display, P O'Brien (Ed.), Humana Press (2001); Border et al., Yeast surface display for screening combinatorial polypeptide libraries, Nature Biotechnology, 15(6):553-7 (1997); Border et al., Yeast surface display for directed evolution of protein expression, affinity, and stability, Methods Enzymol., 328:430-44 (2000); presentacion en ribosomas segun lo descrito por Pluckthun et al. en la Patente de 40 EE.Uu. n.° 6 348 315 y Profusion™ como se describe en Szostak et al. en la Patente de EE.UU. n.° 6 258 558; 6 261 804; y 6 214 553, y expresion periplasmica bacteriana como se describe en la patente US20040058403A1.

[0127] Se pueden encontrar mas detalles con respecto a la clasificacion, identification y analisis de fibronectina y secuencia de Fn3, por ejemplo, PFAM. A program to screen aligned nucleotide and amino acid

45 sequences, Methods Mol. Biol. 1995; 51:1-15, y Wu et al. Clustering of highly homologous sequences to reduce the size of large protein databases. Bioinformatics. 2001 March; 17(3):282-3; las bases de datos y los programas de busqueda y analisis incluyen la base de datos PFAM en el Instituto Sanger (pfam.sanger.ac.uk); la base de datos ExPASy PROSITE (
www.expasv.ch/prosite/); la web SBASE (hydra.icgeb.trieste.it/sbase/); BLAST (
www.ncbi.nlm.nih.gov/BLAST/); CD-HlT (bioinformatics.ljcrf.edu/cd-hi/); EMBOSS

50 (
www.hqmp.mrc.ac.uk/Software/EMBOSS/); PHYLIP (evolution.genetics.washington.edu/phylip.html); y FASTA (fasta.bioch.virginia.edu).

Levadura:

55 [0128] La biblioteca de dominio de union del lado inferior de la fibronectina se transfecta en los hospedadores

bacterianos/de levadura receptores usando tecnicas convencionales como se describe en los Ejemplos. La levadura puede acomodar facilmente tamanos de biblioteca de hasta 107, con 103-105 copias de cada protelna de fusion Fn II que se presentan en cada superficie celular. Las celulas de levadura se criban y separan facilmente usando citometrla de flujo y clasificacion celular activada por fluorescencia (FACS) o perlas magneticas. El sistema de

secrecion eucariota de la levadura y las vlas de glucosilacion de la levadura tambien permiten que las moleculas de tipo Fn3 se muestren con azucares unidos a N y O sobre la superficie celular. Los detalles de la presentacion en levaduras se describen en la seccion de Ejemplos.

5 [0129] En otro caso, por ejemplo, en otra realizacion, el sistema de presentacion en levaduras utiliza el

receptor de adhesion de levadura a-aglutinina para presentar las protelnas en la superficie celular. Las protelnas de interes, en este caso, las bibliotecas de Fn3, se expresan como socios de fusion con la protelna Aga2.

[0130] Estas protelnas de fusion se secretan desde la celula y se unen por puentes disulfuro a la protelna 10 Aga1, que esta unida a la pared celular de la levadura (vease Invitrogen, literatura del producto pYD1 Yeast Display).

El plasmido, por ejemplo, pYD1, preparado a partir de un huesped de E. coli mediante purificacion de plasmido (Qiagen), se digiere con las enzimas de restriccion, BamHI y Notl, desfosforiladas terminalmente con fosfatasa alcalina intestinal de ternera. La ligacion de las bibliotecas de productos pYD1 y CR, la transformation y selection de E. coli (DH5a) en placas de LB-ampicilina (50 mg/ml) se realizaron usando protocolos de biologla molecular 15 convencional para amplificar las bibliotecas antes de la electroporation en huespedes de celulas de levadura.

[0131] Los procedimientos para seleccionar variantes de bibliotecas de Fn3 expresadas que tienen afinidades sustancialmente mas altas para ligandos diana (por ejemplo, TNF, VEGF, VEGF-R, etc.), en relation con el dominio Fn3 de tipo silvestre de referencia, se pueden lograr de la siguiente manera.

20

[0132] Los ligandos de prueba candidatos (por ejemplo, TNF, VEGF, VEGF-R, etc.) estan marcados fluorescentemente (directa o indirectamente mediante un enlace biotina-estreptavidina como se describe anteriormente). Aquellos clones de la biblioteca que se unen eficazmente a los antlgenos marcados entonces se enriquecen mediante el uso de FACS. Esta poblacion de celulas de levadura se vuelve a cultivar y se somete a

25 rondas de seleccion posteriores usando niveles aumentados de rigurosidad para aislar un subconjunto mas pequeno de clones que reconocen la diana con mayor especificidad y afinidad. Las bibliotecas son facilmente susceptibles a formatos de alto rendimiento, utilizando, por ejemplo, moleculas de dominio de union a FN3 marcadas con FITC anti- Myc-tag y analisis FACS para su identification y confirmation rapidas. Ademas, hay etiquetas de carboxilo terminales que pueden utilizarse para controlar los niveles de expresion y/o normalizar las mediciones de afinidad de 30 union.

[0133] Para verificar la visualization de la protelna de fusion Aga2-Fn3, una allcuota de celulas de levadura (8 x 105 celulas en 40 pl) del medio de cultivo se centrifuga durante 5 minutos a 2300 rpm. El sobrenadante se aspira y el sedimento celular se lava con 200 pl de tampon de PBS/BSA enfriado en hielo (PBS/BSA al 0,5 % en

35 p/v). Las celulas se vuelven a sedimentar y se elimina el sobrenadante antes de volver a suspender en 100 pl de tampon que contiene el TNFa biotinilado (200 nM). Se dejo que las celulas se unieran al TNFa a 20 °C durante 45 minutos, despues de lo cual se lavaron dos veces con tampon PBS/BSA antes de la adicion e incubation con estreptavidina-FITC (2 mg/l) durante 30 minutos en hielo. Se realizo otra ronda de lavado en tampon antes del volumen de resuspension final de 400 pl en PBS/BSA. Las celulas se analizaron entonces en FACSscan (Becton 40 Dickinson) usando el software CellQuest segun las instrucciones del fabricante.

[0134] Para generar una biblioteca contra TNFa, las selecciones cineticas de las bibliotecas del dominio de union a fibronectina de TNF-a presentadas en levadura implican el marcaje inicial de celulas con ligando de TNF-a biotinilado seguido de persecution dependiente del tiempo en presencia de un gran exceso de ligando de TNF-a no

45 biotinilado. Los clones con una cinetica de disociacion mas lenta se pueden identificar mediante marcaje con estreptavidina-PE despues del perlodo de persecucion y se pueden clasificar usando un clasificador de FACS de alta velocidad. Despues de la induction de Aga2-Fn3, las celulas se incuban con TNFa biotinilado a concentraciones de saturation (400 nM) durante 3 horas a 25 °C bajo agitation. Despues de lavar las celulas, se realizo una persecucion en frlo de 40 horas usando TNFa no marcado (1 pM) a 25 °C. Las celulas se lavan entonces dos veces 50 con tampon PBS/BSA, marcado con estreptavidina-PE (2 mg/ml) anti-HIS-FITC (25 nM) durante 30 minutos en hielo, se lavaron y se resuspendieron y a continuation se analizaron en un clasificador FACS ARIA.

Presentacion en ribosomas:

55 [0135] La presentacion en ribosomas utiliza una maquinaria de transcripcion/traduccion acoplada in vitro libre

de celulas para producir bibliotecas de protelnas. Los genes de la biblioteca Fn3 se insertan aguas arriba en el gen de la inmunoglobulina kappa ligera que no tiene un codon de termination que hace que el ribosoma se bloquee, pero no se libere, cuando alcanza el extremo del ARNm. Adicionalmente, el espaciador del dominio kappa sirve para distanciar flsicamente la protelna Fn3 del complejo ribosomico de modo que el dominio de union a Fn3 tenga un

mejor acceso para reconocer su ligando afln. La biblioteca de ARNm se introduce en preparaciones de extracto de ribosoma S30 de E. coli (Roche) o en lisado reticulado de conejo (Promega). En cualquier caso, el extremo 5' del ARNm naciente se puede unir a los ribosomas y someterse a la traduccion. Durante la traduccion, la protelna de union al ligando permanece unida de forma no covalente al ribosoma junto con su progenitor de ARNm en un 5 complejo macromolecular.

[0136] Las protelnas Fn3 funcionales pueden unirse a un ligando especlfico que esta unido a perlas magneticas o a la superficie del pocillo de microtitulacion. Durante el proceso de enriquecimiento, las variantes no especlficas se eliminan por lavado antes de que se eluyan los aglutinantes de Fn3 especlficos. El ARNm unido se

10 detecta mediante RT-PCR usando cebadores especlficos para la porcion 5 'Fn3 y 3' del gen kappa, respectivamente. El ADNc de doble cadena amplificado a continuacion se clona en un vector de expresion para el analisis de la secuencia y la produccion de protelnas.

[0137] Para reacciones de traduccion procariotas, la mezcla de reaccion puede contener 0,2 M de glutamato 15 de potasio, 6,9 mM de acetato de magnesio, 90 mg/ml de protelna disulfuro isomerasa (Fluka), 50 mM de Tris

acetato (pH 7,5), 0,35 mM de aminoacidos, 2 mM de ATP, 0,5 mM de GTP, 1 mM de AMPc, 30 mM de acetil fosfato, 0., mg/ml de ARNt de E. coli, 20 mg/ml de acido follnico, 1,5 % de PEG 8000, 40 ml de extracto S30 de E. coli y 10 mg de ARNm en un volumen total de 110 ml. La traduccion se puede realizar a 37 °C durante 7 min, despues de lo cual los complejos ribosomicos se pueden estabilizar mediante dilucion 5 veces en tampon de seleccion enfriado con 20 hielo (50 mM de Tris acetato (pH 7,5), 150 mM de NaCl, 50 mM de acetato de magnesio, 0,1 % de Tween 20, 2,5 mg/ml de heparina).

Seleccion de afinidad para ligandos diana.

25 [0138] Los complejos de ribosomas estabilizados pueden incubarse con hapteno biotinilado (50 nM de

fluorescelna-biotina (Sigma)) o antlgeno (100 nM de IL-13 (Peprotech) biotinilado) segun corresponda a 4 °C durante 1-2 h, seguido de captura en perlas magneticas recubiertas de estreptavidina M280 (Dynal). Las perlas se lavaron a continuacion para eliminar complejos de ribosomas no especlficamente unidos. Para las selecciones procariotas, se pueden realizar cinco lavados en tampon de seleccion enfriado en hielo. Para las selecciones eucariotas, se 30 realizaron tres lavados en PBS que contenlan BSA al 0,1 % y acetato de magnesio 5 mM, seguido de un unico lavado en PBS solo. Entonces se pueden incubar los complejos de eucariotas con 10 U de ADNasa I en 40 mM de Tris-HCl, 6 mM de MgCl2, 10 mM de NaCl, 10 mM de CaCl2 durante 25 min a 37 °C, seguido por tres lavados con PBS, acetato de magnesio 5 mM, Tween 20 al 1 %.

35 Recuperacion de ARNm de complejos ribosomicos seleccionados

[0139] Para el analisis de recuperacion de ARNm sin una etapa de interrupcion especlfica, los complejos

ribosomicos unidos a perlas magneticas pueden procesarse directamente en la reaccion de transcripcion inversa. Para la recuperacion de ARNm de selecciones procariotas por disrupcion del complejo ribosomico, se pueden 40 incubar complejos seleccionados en EB20 [Tris acetato 50 mM (pH 7,5), NaCl 150 mM, EDTA 20 mM, 10 mg/ml de ARN de Saccharomyces cerevisae] durante 10 min a 4 °C. Para evaluar la eficacia del EDTA 20 mM para la recuperacion de ARNm de selecciones eucariotas, los complejos ribosomicos pueden incubarse en PBS20 (PBS, EDTA 20 mM, 10 mg/ml de ARN de S. cerevisae) durante 10 minutos a 4 °C. El ARNm puede purificarse usando un kit comercial (High Pure RNA Isolation Kit, Roche). Para muestras procariotas, se realizo la opcion de digestion con 45 el kit de ADNasa I; sin embargo, este paso no es necesario para muestras eucariotas, ya que la digestion con ADNasa I se realizo durante los lavados posteriores a la seleccion. La transcripcion inversa se puede realizar en 4 ml de ARN purificado o 4 ml de complejos ribosomicos seleccionados, inmovilizados (es decir, una suspension de perlas).

50 [0140] Para muestras procariotas, las reacciones contenlan Tris-HCl 50 mM (pH 8,3), KCl 75 mM, MgCl2 3

mM, DTT 10 mM, cebadores 1,25 mM, 0,5 mM de mezcla de nucleotidos PCR (Amersham Pharmacia), 1 URNAsin (Promega) y 5 U SuperScript II (Invitrogen) y se realizaron mediante incubacion a 50 °C durante 30 min. Para muestras eucariotas, las reacciones contenlan Tris-HCl 50 mM (pH 8,3), KCl 50 mM, MgCl2 10 mM, espermina 0,5 mM, DTT 10 mM, cebadores de RT 1,25 mM, mezcla de nucleotidos de PCR 0,5 mM, 1 U de RNasin y 5 U de AMV 55 transcriptasa inversa (Promega) y se puede realizar mediante incubacion a 48 °C durante 45 min.

PCR de salidas de seleccion

[0141]

La PCR de punto final se puede realizar para visualizar la amplificacion de la construccion de longitud

completa. Una muestra de 5 ml de cada reaccion de transcripcion inversa se puede amplificar con 2,5 UTaq polimerasa (Roche) en Tris-HCl 20 mM (pH 8,4), KCl 50 mM, MgCl2 1 mM, 5 % de DMSO, que contiene mezcla de nucleotidos de PCR 0,25 mM, cebador directo 0,25 mM (T7B o T7KOZ para experimentos procarioticos y eucarioticos, respectivamente) y cebador RT 0,25 mM. El ciclo termico comprendio 94 °C durante 3 min, a 5 continuacion 94 °C durante 30 s, 50 °C durante 30 s y 72 °C durante 1,5 min durante 30 ciclos, con un paso final a 72 °C durante 5 min. Los productos de PCR se visualizaron mediante electroforesis en geles de agarosa tenidos con bromuro de etidio. Los productos de PCR aislados se pueden subclonar en un vector de expresion de pBAD bacteriano para la produccion de protelna soluble.

10 Expresion y produccion bacteriana:

[0142] Las celulas huesped de E. coli competentes se preparan segun las instrucciones del fabricante (sistema de expresion de Invitrogen PBAD). Brevemente, 40 pl de celulas competentes LMG 194 y 0,5 pl de constructos de pBAD Fn3 (aproximadamente 1 pg de ADN) pueden incubarse juntas en hielo durante 15 minutos,

15 despues de lo cual se aplica un choque termico de 42 °C durante un minuto. Las celulas a continuacion se dejan recuperar durante 10 minutos a 37 °C en medio SOC antes de colocarlas en placas LB-Amp y crecimiento a 37 °C durante la noche. Las colonias individuales se recogen al dla siguiente para cultivos llquidos a pequena escala para determinar inicialmente las concentraciones de induccion de L-arabinosa optimas para la produccion de Fn3. Las replicas de cada clon despues de alcanzar una DO600 = 0,5 se pueden probar inducidas con valoraciones en serie

20 (1:10) de L-arabinosa (concentration final del 0,2 % al 0,00002 %) despues del crecimiento durante la noche a temperatura ambiente. Se pueden recolectar cultivos de prueba (1 ml), se anadieron 100 pl de tampon 1xBBS (10 mM, NaCl 160 mM, acido borico 200 mM, pH = 8,0) para resuspender las celulas antes de la adicion de 50 pl de solution de lisozima durante 1 hora (37 °C). Los sobrenadantes celulares de las digestiones de lisozima se pueden recoger despues de la centrifugacion y puede anadirse MgSO44 a una concentracion final de 40 mM. Esta solucion

25 se puede aplicar a columnas de Ni-NTA preequilibradas con PBS. Las muestras de Fn3 unidas con His se lavan dos veces con tampon PBS sobre el que se puede lograr la elucion con la adicion de imidazol 250 mM. La pureza de la expresion de Fn3 soluble se puede examinar mediante SDS-PAGE.

Ejemplificacion

30 Ejemplo 1: Procedimientos para la identification guiada por bioinformatica de secuencias universales de bibliotecas de dominios de union al lado inferior de la fibronectina

[0143] En este ejemplo, las secuencias universales de bucle AB, CD y EF para secuencias de bibliotecas de dominio de union a fibronectina se identifican y seleccionan usando bioinformatica y los criterios de la invention. Un

35 esquema generalizado de este proceso se presenta en la Fig. 1.

[0144] Brevemente, se busco en la base de datos PFAM una alineacion multiple de secuencias que contenla solo secuencias pertenecientes a la familia Fibronectina de Tipo III en todas las especies conocidas, incluyendo mamlferos y seres humanos (Fn3, PFAM ID PF00041) en el formato de alineacion de Stockholm 1.0

40 (
http://pfam.janelia.org/family?entry=fn3#tabview=tab2).

[0145] Esta busqueda arrojo un conjunto de datos inicial de 15 520 secuencias de protelnas "conjunto de datos de base". Sin embargo, se observa que este conjunto de secuencias puede aumentar en numero a medida que se clonan secuencias adicionales y se ingresan en la base de datos. Dentro de las 15 520 secuencias

45 compiladas iniciales, las secuencias variaran con respecto a las especies de origen, los modulos de origen, las longitudes del bucle y otras cualidades. De este modo, se llevo a cabo un refinamiento adicional a partir de las secuencias compiladas de partida de tal manera que los conjuntos de datos de subconjuntos comparten una o mas propiedades elegidas de interes, es decir, la presencia de bucles. Por lo tanto, a partir de las 15 520 secuencias descargadas iniciales, se eliminaron las secuencias redundantes o duplicadas, o las secuencias incompletas y se

50 identificaron las que contenlan las tres secuencias de bucle, reduciendo el numero de secuencias a 12 452 "conjunto de datos convencional".

[0146] El siguiente paso implicaba la designation del marco de andamiaje p, longitudes del bucle y secuencias de aminoacidos de bucle, seguido de un analisis de frecuencia de estas secuencias de bucle candidato.

55 Por lo tanto, la determination de los perfiles de variabilidad implica la recopilacion y selection de secuencias de aminoacidos alineados que comparten una o mas propiedades definidas de interes para crear un conjunto de datos. Se diseno un sistema de clasificacion posicional de cadenas p y bucles utilizando la arquitectura de numeration posicional de los dominios Fn3 como punto de referencia. Las cadenas p se identificaron primero en base a la estructura cristalina de todos los modulos de protelna de fibronectina Fn3 disponibles en RCSb Protein Data Bank

(
www.rcsb.org, HM Berman, J. Westbrook, Z. Feng, G. Gilliland, TN Bhat, H. Weissig, IN Shindyalov, PE Bourne; "The Protein Data Bank", Nucleic Acid Research, 28 pags. 235-242 (2000)). Una alineacion de todas las estructuras cristalinas identifico regiones de cadenas p y regiones potenciales de bucles.

5 [0147] Se escribio una secuencia de comandos en Python para extraer datos sobre los bucles por alineacion

y agrupamiento segun la longitud del bucle. El experto en la materia apreciara que, para este proposito, puede usarse cualquier metodologla que alinee las regiones de bucle e identifique los aminoacidos en cada posicion. El analisis identifico las siguientes longitudes del bucle para los bucles del lado inferior:

10 El bucle AB contenla de 1 a 3 aminoacidos.

El bucle CD contenla de 4 a 10 aminoacidos.

El bucle EF contenla de 3 a 9 aminoacidos.

Las secuencias aceptables contenlan los 3 bucles.

15 [0148] La secuencia de comandos en Python acepta 12 452 de las 15 520 secuencias descargadas (80 %)

[0149] El comando en Python analizo cada ciclo para las secuencias aceptadas en cada posicion para cada longitud y catalogo la longitud del bucle, la distribucion de aminoacidos y el porcentaje de abundancia de restos de aminoacidos en cada posicion de los bucles. Un experto en la materia puede apreciar que otras secuencias genicas

20 relacionadas con Fn1, Fn2 y otros dominios del marco de andamiaje de protelna, tales como SCALPs, o nanoanticuerpos tambien pueden buscarse en estas bases de datos e identificarse de manera similar.

[0150] Los resultados de estos analisis se muestran en las Figs. 3-10. Por ejemplo, los llmites externos del bucle AB se determino que estaban entre 1-3, con la mayorla de las secuencias que requieren una longitud de bucle

25 de 3 (12, 265, Figs. 3A y B). Despues de establecer los llmites externos, los datos se segregaron en tamanos de bucle AB y se determino su composicion de frecuencia de aminoacidos (Figs. 4A y B). El mismo principio se aplico a los bucles CD y EF como se muestra en las Figs. 5-10A-B.

[0151] En base a estas definiciones de llmites alineados de la cadena p, no se encontraron bucles de un

30 tamano, sino que se producen en longitudes diferentes. Se analizo la distribucion de frecuencias de los tamanos de

los bucles AB (Figs. 3AB), CD (Figs. 5AB) y EF (Figs. 9AB). La clasificacion y la descripcion del tamano de los

bucles siguen la nomenclatura de: Fn3 BUCLE/LONGITUD. Por ejemplo, AB/1-3 se refiere a la longitud del bucle Fn3 AB de 1 a 3 aminoacidos, y AB/3 se refiere a la longitud del bucle Fn3 AB de 3 aminoacidos. En la definicion del bucle AB, los llmites del bucle del andamiaje se establecieron originalmente para 1-3 aminoacidos de longitud, AB/1- 35 3. La distribucion de las 12 452 secuencias identifico la longitud 3 del bucle como la mas predominante en las

secuencias, AB/3. Se realizo un examen adicional de la longitud del bucle AB de 3 (Figs. 3-4 AB).

[0152] En la definicion del bucle CD, los llmites del bucle del andamiaje se establecieron originalmente para una longitud de 4-10 aminoacidos, CD/4-10. La distribucion de las 12 452 secuencias identifico las longitudes del

40 bucle 5, 6 y 7 como las mas predominantes en las secuencias, CD/5, CD/6 y CD/7. Se realizo un examen adicional de las longitudes del bucle CD de 5, 6 y 7, ya que captura aproximadamente el 80 % de las moleculas de Fn3 del conjunto de datos de 12 452 secuencias (Figs. 5-8AB).

[0153] En la definicion del bucle EF, los llmites del bucle del andamiaje se establecieron originalmente para 45 una longitud de 3-9 aminoacidos, EF/3-9. La distribucion de las 12 452 secuencias identifico que la longitud 6 del

bucle fue la mas predominante en las secuencias, EF/6. Se realizo un examen adicional de la longitud del bucle 6 (Figs. 9-10AB).

Ejemplo 2: Evaluacion de perfiles de variabilidad de bucle mediante bioinformatica por filtrado y analisis de cluster de 50 secuencias genicas

[0154] Las bibliotecas universales de dominio de union a fibronectina se disenaron determinando los perfiles de variabilidad para los bucles expresados in vivo. Los perfiles de variabilidad representan la catalogacion de los diferentes aminoacidos y sus respectivas tasas de aparicion, presentes en una posicion particular en un conjunto de

55 datos de secuencias alineadas. Se pueden identificar y delinear las familias de secuencias de bucle relacionadas con el tamano usando los parametros establecidos anteriormente dentro de este "conjunto de datos base" de inicio. El analisis comparativo de estos bucles alineados multiples proporciona informacion de perfil de variabilidad en cuanto a la diversidad existente y "tolerada" para introducir cambios de aminoacidos que pueden conducir a la union potencial del ligando. La designacion de bucles y sus aminoacidos que tambien comprenden se puede describir para

otras protelnas de tipo andamiaje usando definiciones similares.

[0155] La distribucion de frecuencia de los seis tamanos de bucle se genero para determinar si existlan tamanos de bucle AB, CD y EF preferidos para secuencias de Fn3. Para el bucle AB, el tamano de bucle de 3

5 aminoacidos fue el mas predominante y represento el 98,50 % de la poblacion del bucle AB (Fig. 3AB). En este caso, se eligio el tamano de bucle AB de 3 para un analisis de perfil de variabilidad adicional, AB/3. (Fig. 4AB)

[0156] Para el bucle CD, los tamanos de bucle CD 5, 6 y 7 fueron los tamanos comunes que ocurren en el 15,56 %, 40,59 % y 21,00 % de la poblacion del bucle CD, respectivamente (Fig. 5AB). Los tamanos de bucle CD 5,

10 6 y 7 fueron elegidos para el analisis del perfil de variabilidad, CD/5 (Fig. 6Ab), CD/6 (Fig. 7AB) y CD7 (Fig. 8AB), respectivamente.

[0157] El analisis de tamano de frecuencia del bucle EF demostro que el tamano del bucle 6 se producla en casi el 98,83 % de las secuencias de Fn3 analizadas (Fig. 9AB). En este caso, solo se eligio el tamano de bucle EF

15 6 para un analisis de perfil de variabilidad adicional, EF/6 (Fig. 10AB).

Tabla 1: Longitudes de los bucles Fn3 AB, CD y EF analizados junto con el numero de secuencias indican el numero

Bucle: Longitud Cantidad de secuencias Porcentaje de secuencias

AB: 3 12 265 98,50

CD: 5 1937 15,56

CD: 6 5054 40,59

CD: 7 2615 21,00

EF: 6 12 306 98,83

[0158] Para cada uno de los 5 bucles seleccionados (Tabla 1) se realizo un analisis de frecuencia separado 20 para determinar el uso de aminoacidos posicionales en el contexto del bucle seleccionado. La salida se visualiza

como graficos de frecuencia y los resultados se muestran para el bucle AB/3 en las Figs. 4AB; para el bucle CD/5 en las Figs. 6AB, el bucle CD/6 en las Figs. 7AB, el bucle CD/7 en las Figs. 8AB; y para el bucle eF/6 en las Figs. 10AB.

Ejemplo 3: Identificacion de posiciones del bucle fijas y no fijas con umbrales 25

[0159] En una realizacion, se disena una biblioteca combinatoria de variantes naturales con un aminoacido de consenso conservado o semiconservado seleccionado de la siguiente manera.

[0160] Los conjuntos de datos de bucle Fn3 se enumeran como anteriormente para la variabilidad de 30 aminoacidos y sus frecuencias relativas en cada posicion alineada (Figs. 3-10). El analisis anterior identifico las

preferencias posicionales en todos los bucles del modulo Fn3 y se denominan "perfiles de variabilidad". Por ejemplo, en el bucle AB de tamano 3 (Fig. 4AB), se encuentra una treonina (T) en la posicion 1 en aproximadamente el 35 %. No hubo posiciones del bucle donde un solo aminoacido representase mas del 35 % de los aminoacidos posicionales representativos. Hubo una ligera preferencia por la serina (S) en la posicion 2 con respecto a la alanina 35 (A); y para la treonina (T) en la posicion 3 sobre el acido aspartico (D). Sin embargo, en este caso, no hubo acidos predominantes por encima de un nivel umbral del 40 % para ser considerados aminoacidos "fijos" y todas las posiciones del bucle se consideran "variables". Para la construccion de la biblioteca, el aminoacido mas comun en cada posicion del bucle sirve como aminoacido de partida para la mutagenesis de primera ronda. Por lo tanto, el bucle AB/tiene una secuencia de bucle de inicio totalmente "variable" de: X1 X2 X3, donde X1 es uno cualquiera de 40 los aminoacidos T, S, N, D, K, Q; X2 es uno cualquiera de los aminoacidos S, A, K, P, D, E, T; y X3 es uno cualquiera de los aminoacidos T, D, S, N, E, R, G.

[0161] Para el bucle EF de 6 aminoacidos, se encuentra una leucina (L) en la posicion 2 dentro del bucle en mas del 90 % de todas las posiciones del bucle Fn3 que demuestran un alto grado de presion selectiva para su

45 presencia. Por lo tanto, la posicion 2 del bucle EF se considerarla "conservada" para la leucina (L), ya que se produjo por encima de un nivel umbral predeterminado del 40 % y fue mas del doble de comun que el siguiente aminoacido mas frecuente en esa posicion. Este resto "fijo" se ve como el aminoacido dominante con respecto a los otros aminoacidos que se producen en esa posicion del bucle. Una posicion "fija" puede no estar sujeta a la diversificacion mutagenica en la construccion de la primera ronda de la biblioteca. Ademas, la prolina (P) en la 50 posicion 4 dentro del bucle ocurre a una frecuencia de > 46 % y tambien puede considerarse "fija". Al determinar primero estas posiciones "fijas" y posiciones no fijas (indicadas por "X"), EF/6 tendrla una secuencia inicial "fija" de: G1 L2 X3 P4 G5 X6, donde X3 es uno cualquiera de los aminoacidos K, T, E, Q, L, S e I, y X6 es uno cualquiera de

los aminoacidos T, V, S, K, R, A y H. En bibliotecas posteriores, G1 tambien se puede alterar para que sea uno cualquiera de los aminoacidos G, N, D, K, E, S, R; L2 tambien se puede alterar para que sea uno cualquiera de los aminoacidos L, V, I, M, T, F, A; P4 tambien se puede alterar para que sea cualquiera de los aminoacidos P, E, A, K,

S, T, N; y G5 tambien se puede alterar para que sea uno cualquiera de los aminoacidos G, N, D, A, S, Y, F. El 5 experto en la materia puede apreciar que las bibliotecas se pueden generar usando cualquier combinacion de

aminoacidos en cualquier posicion del bucle EF/6, como se describe en las Figs. 10AB.

[0162] Para el bucle CD/5, la glicina (G) en la posicion 3 dentro del bucle se encuentra en > 49 % y se considerarla conservada y "fija". No parece haber ningun aminoacido predominante en las posiciones 1, 2, 4 y 5 del

10 bucle CD/5, por lo tanto, se considerarlan como posiciones "variables". Por lo tanto, una secuencia fija de inicio para el bucle CD/5 serla X1, X2, G3, X4, X5, donde X1 es uno cualquiera de los aminoacidos G, T, A, S, E, R, K; X2 es uno cualquiera de los aminoacidos D, G, N, S, E, Q, T; X4 es uno cualquiera de los aminoacidos Q, S, G, V, E, T, K; y X5 es uno cualquiera de los aminoacidos P, W, E, T, S, V, L. G3 tambien se puede alterar para que sea uno cualquiera de los aminoacidos G, S, K, D, A, T, N.

15

[0163] Para el bucle CD/6, el triptofano (W) en la posicion 6 dentro del bucle se encuentra en > 59 % y se considerarla conservado y "fijo". No parece haber ningun aminoacido predominante en las posiciones 1, 2, 3, 4 y 5 del bucle CD/6, por lo tanto, se considerarlan como posiciones "variables". Por lo tanto, una secuencia fija de inicio para el bucle CD/6 serla X1, X2, X3, X4, X5, W6, donde X1 es uno cualquiera de los aminoacidos K, T, A, V, S, L, E;

20 X2 es uno cualquiera de los aminoacidos G, D, S, N, E, T, K; X3 es uno cualquiera de los aminoacidos S, T, G, R, E,

D, A; X4 es uno cualquiera de los aminoacidos G, E, D, T, K, N, S; y X5 es uno cualquiera de los aminoacidos E, R,

T, K, D, A, Q. W6 tambien se puede alterar para que sea uno cualquiera de los aminoacidos W, E, P, T, A, Y, S.

[0164] Para el bucle CD/7, no parece haber ningun aminoacido predominante en las posiciones 1, 2, 3, 4, 5, 6 25 o 7 dentro del bucle, por lo que se considerarlan todas como posiciones "variables". Por lo tanto, se usarla la

secuencia de bucle de inicio de X1 X2 X3 X4 X5 X6 X7, donde X1 es uno cualquiera de los aminoacidos K, A, E, T, S, V, G; X2 es uno cualquiera de los aminoacidos G, N, D, S, E, T, K; X3 es uno cualquiera de los aminoacidos G, S,

E, T, A, K, D; X4 es uno cualquiera de los aminoacidos G, E, P, T, S, D, K; X5 es uno cualquiera de los aminoacidos G, E, S, D, T, R, A; X6 es uno cualquiera de los aminoacidos E, W, P, D, Y, T, A; y X7 es uno cualquiera de los

30 aminoacidos T, W, V, E, A, S, P.

[0165] El perfil de variabilidad para cada conjunto de datos de bucle identifica las caracterlsticas deseadas de una posicion del bucle dada para una mayor introduccion de la representation de diversidad. Estos resultados anteriores demuestran que la diversidad de aminoacidos de bucle introducida en una biblioteca puede "afinarse"

35 dependiendo del nivel de frecuencia de aparicion. Estas posiciones del bucle "fijo" intentan reproducir parte de la diversidad natural para promover posibles efectos de estabilizacion estructural.

[0166] Esta "fijacion" de posiciones tambien tiene el efecto de "estrechar" la diversidad de posiciones variables en secuencias de bucle de inicio. Sin embargo, puede haber la ocasion de hacer lo contrario, es decir,

40 obtener bibliotecas mas grandes y mas diversas. En este caso, el efecto de "ensanchamiento" se logra elevando el umbral de frecuencia de aparicion utilizado para designar aminoacidos "fijos". De esta forma, el perfil de variabilidad capturara menos de las posiciones del bucle mas conservadas y las clasificara como posiciones "fijas". Las posiciones del bucle restantes serlan parte de los aminoacidos "variables" mas amplios que pueden diversificarse.

45 [0167] Cada una de las posiciones denotadas como X codificara para los aminoacidos presentes en el perfil

de variabilidad relacionado o para un subconjunto de los qulmicamente equivalentes. De hecho, en algunos casos, dos o mas aminoacidos presentes en una determinada posicion son qulmicamente muy similares. En tales situaciones, es posible incluir en el diseno de mutagenesis solo un subconjunto de los aminoacidos y aun preservar las caracterlsticas de la qulmica natural de esa posicion. Esto reducira el numero total de mutantes y dara mas 50 flexibilidad para la optimization de la slntesis de oligonucleotidos.

Ejemplo 5: Identification de posiciones del bucle fijas y no fijas sin umbrales

[0168] En otra realization, es posible disenar diversidad combinatoria de variation natural en cada uno de los

55 5 bucles seleccionados (Tabla 1) sin definir un umbral de variabilidad, es decir, cuando el umbral seleccionado es del 100 %. En esta realizacion, cada bucle mutado esta disenado para contener aminoacidos que imitan su perfil de variabilidad en terminos de caracterlsticas de variabilidad y quimica. En cada posicion especifica del bucle, la sintesis de oligonucleotidos se optimiza para contener un codon degenerado que coincidiria/imitaria la quimica y la variabilidad en esa posicion. Las posiciones que tienen dos o mas aminoacidos en sus perfiles de variabilidad se

mutaran independientemente del grado de variabilidad de esa posicion.

Ejemplo 6: Procedimientos para disenar diversidad de bucles para bibliotecas de dominio Fn3 con restricciones de umbral 5

[0169] En este ejemplo, se presentan procedimientos para optimizar la diversidad de bucles de una biblioteca de dominios de union a Fn3. La eleccion de las estructuras candidatas, como se ha indicado anteriormente, dicta los tamanos de bucle a introducir y la selection inicial de la secuencia de aminoacidos. El procedimiento se ilustra particularmente para el bucle EF/6.

10

[0170] Para disenar la biblioteca de bucles EF/6 para andamiajes basados en Fn3, las consideraciones de perfil de variabilidad son las siguientes: Como se ha indicado anteriormente, se determina que un resto de aminoacido "fijo" tiene lugar con una frecuencia umbral que normalmente es de al menos un 40 % (normalmente a al menos un 50 %) y es dos veces mas frecuente que el siguiente aminoacido mas frecuente para una posicion dada

15 de bucle. Tras la inspection del perfil de variabilidad de Fn3 EF/6 (Fig. 10AB), se puede ver que la leucina (L) en la posicion 2 dentro del bucle EF/6 aparecla a > 92 %. El siguiente aminoacido que se produce con mayor frecuencia fue a una frecuencia inferior al 5 % y no se registro en el valor umbral mlnimo. Cuando se determina que un resto dado, en este caso la leucina, se produce a una frecuencia tan alta, esta altamente conservado y, por lo tanto, se representa en las bibliotecas de la invention como "fijo", lo que significa que no se mutara en la diversification de 20 bibliotecas de la primera ronda.

[0171] De manera similar, la glicina (G) en la posicion 1, la prolina (P) en la posicion 4 y la glicina (G) en la

posicion 5 dentro del bucle EF/6 estan "altamente conservadas" ya que aparecen a una frecuencia del 40 %, > 46 % y > 45 % respectivamente y estan "fijas" en la primera biblioteca de diversidad. En algunos casos, puede ser que

25 haya dos restos de aminoacidos semiconservados en una posicion del bucle dada. Una posicion "semifija" es aquella que tiene una fuerte presion selectiva con un primer aminoacido (por ejemplo, > 60 %) y una menor presion selectiva para un segundo aminoacido en la misma posicion (por ejemplo, > 30 %).

[0172] La razon para no crear diversidad en todos los sitios, excepto por el uso de una secuencia de inicio 30 "fija", es restringir el tamano de diversidad inicial de la biblioteca para facilitar la expresion y presentation eficiente de

todas las variantes. Estas posiciones iniciales "fijas" indican fuertes presiones selectivas para su preservation. Sin embargo, todavla son sitios para un mayor refinamiento durante la maduracion de afinidad. En otras palabras, las posiciones "fijas" iniciales pueden mutarse posteriormente. El objetivo general en las posiciones de "fijacion" en la primera ronda de diversificacion de la biblioteca es doble: 1) maximizar el numero de clones funcionales 35 incorporando la mayorla de los restos de bucle preferidos y 2) minimizar el tamano total de la biblioteca.

[0173] El termino resto de aminoacido "variable" se refiere a restos de aminoacidos que se determina que se producen con una frecuencia inferior (menor que el valor de umbral alto del 20 %) para una posicion de resto dada. Tras la inspeccion del perfil de variabilidad EF/6 por ejemplo (Fig. 10AB), se puede ver que la posicion variable 3

40 dentro del bucle no tiene un unico aminoacido prevalente que se produce a una frecuencia superior al 40 %. Para la posicion 3 de EF/6, cada uno de los bucles EF/6 tiene muchos aminoacidos diferentes que se producen a un nivel de frecuencia bastante bajo. En consecuencia, el sitio de la posicion 3 se usa para la creation de la diversidad de secuencia de bucle inicial mediante mutagenesis. Todos los 20 aminoacidos y aminoacidos no naturales que utilizan el codon ambar se pueden usar potencialmente para la mutagenesis. (Vease por ejemplo, el documento 45 US2009/0176654).

Ejemplo 7: Production de bibliotecas de dominios de union en el lado inferior de la fibronectina

[0174] En este ejemplo, se describen las etapas para realizar y ensamblar una biblioteca de dominio de union 50 del lado inferior de la fibronectina universal usando tecnicas de ingenierla genetica.

[0175] Brevemente, los modulos de fibronectina se clonan usando tecnicas convencionales de biologla molecular. Los oligonucleotidos que codifican el armazon del andamiaje de la cadena beta y los bucles de diversidad de las regiones variables se pueden ensamblar usando reacciones de reaction en cadena de la polimerasa. Las

55 moleculas de longitud completa a continuation se amplifican usando cebadores 5' y 3' flanqueantes que contienen sitios de restriction que facilitan la donation en el vector o vectores de expresion-presentacion. La diversidad total de las bibliotecas generadas depende del numero de secuencias marco y numero de posiciones en los bucles elegidos para la mutagenesis.

[0176] Luego se seleccionan los clones aleatorios de cada biblioteca para la verificacion de la secuencia y la evaluacion de la calidad de la biblioteca con respecto a la diversidad mutacional deseada, las mutaciones puntuales no deseadas, las deleciones y las inserciones. Esta eficacia contrasta con estrategias de mutagenesis aleatoria/estocastica donde la introduccion descontrolada de varias bases produce niveles mas altos de efectos de

5 cambio de base no deseados que dan lugar a una baja expresion de la funcionalidad de dominios de union a fibronectina debido al uso desfavorable de aminoacidos y codones de parada inadvertidos.

[0177] Mas especfficamente, 10Fn3 se usa para disenar, aislar y manipular bibliotecas universales de dominio de union del lado inferior de la fibronectina.

10

Construction de la biblioteca

[0178] Se uso la secuencia de tipo silvestre 10Fn3 como se muestra en la SEQ ID NO: 1 como base para generar bibliotecas de aglutinantes que utilizan los bucles superior o inferior.

15

VSDVPRDLEVVAATPTSLLISWDAPAVTVRYYRITYGETGGNSPVQEFTVPGSKSTA TISGLKPGVDYTITVYAVTGRGDSPASSKPISINYRTEI (SEQ ID NO: 1)

[0179] Usando los procedimientos descritos en los Ejemplos anteriores, la 10Fn3 de tipo silvestre se mutageno en los bucles inferiores AB, CD, EF para generar una biblioteca de dominios de union del lado inferior de

20 la fibronectina (Biblioteca inferior). El mismo procedimiento puede usarse para generar una biblioteca de dominios de union del lado superior de la fibronectina usando los bucles superiores BC, DE y FG (Biblioteca superior).

[0180] Las secuencias de ADN correspondientes a la biblioteca inferior se optimizan para la expresion en E. coli en Geneart AG, Alemania. La biblioteca inferior se ensambla a partir de oligonucleotidos sinteticos degenerados

25 y genes correspondientes a fragmentos de longitud completa y se purifica en gel. La amplificacion se realiza con los cebadores terminales y la ligacion subsiguiente de la biblioteca amplificada en el vector de clonacion pCR-Script que produce las bibliotecas de inicio. La Biblioteca inferior de inicio a continuacion se criba para identificar los aglutinantes monoespecfficos como se describe en el Ejemplo 8 a continuacion.

30 Ejemplo 8: Cribado de moleculas de union monoespecificas basadas en fibronectina

[0181] El presente ejemplo describe como seleccionar aglutinantes monoespecfficos de fibronectina generados a partir de la Biblioteca inferior descrita en el Ejemplo 7. La Biblioteca inferior se subclona en un vector de presentacion en levadura tal como pYD1 (Invitrogen) usando procedimientos de recombinacion homologa y se

35 transforma en una cepa adecuada tal como EBY100 utilizando tecnicas convencionales de biologfa molecular.

[0182] La presentacion y seleccion de aglutinantes basados en fibronectina contra una diana, por ejemplo, lisozima de huevo de gallina, se realizo siguiendo esencialmente el protocolo previamente publicado por Lipovsek, D. et al. (J Mol Biol. 11 de mayo de 2007; 368 (4): 1024-41) con algunas modificaciones menores

40

(i) Selection para la union a la lisozima de clara de huevo de gallina utilizando clasificacion de perlas magneticas

[0183] Para todas las selecciones, los cultivos de levadura que presentan la Biblioteca inferior de moleculas basadas en 10Fn3 se inducen durante 18 h a 30 °C en medio que contiene galactosa (90 % de SG-CAA/10 % de SD-

45 CAA, 50 pg/ml de kanamicina, 100 U/ml de penicilina G, 200 U/ml de estreptomicina). Las 109 celulas de levadura inducidas de la Biblioteca inferior se lavan con 25 ml de solucion salina tamponada con fosfato (PBS), pH 7,4, acido etilendiaminotetraacetico (EDTA) 2,2 mM, albumina de suero bovino al 0,5 % (BSA) y a continuacion se incuban en 5 ml del mismo tampon que contiene 1 pM de lisozima de clara de huevo de gallina biotinilada (HEL-b, Sigma, St. Louis, MO) durante 1 h a temperatura ambiente con rotacion suave. Despues de la incubacion, la muestra se enfrfa 50 en hielo, se lava con 25 ml de PBS helado, pH 7,4, EDTA 2 mM, BSA al 0,5 % y se resuspende en 2,5 ml del mismo tampon. Se anade una alfcuota de 100 pl de perlas magneticas Streptavidin MicroBeads (Miltenyi Biotec, Auburn, CA) a la levadura y se incuba en hielo durante 10 min. Se anade PBS enfriado con hielo, pH 7,4, EDTA 2 mM, 0,5 % de BSA a la muestra hasta un volumen total de 25 ml inmediatamente antes de someterlo a separacion en un separador de celulas AutoMACS (Miltenyi Biotec), usando el programa preestablecido para la seleccion positiva de 55 celulas raras (possas). Las celulas seleccionadas se recogen en 6 ml de SD-CAA, pH 4,5, 50 pg/ml de kanamicina, 100 U/ml de penicilina G, 200 U/ml de estreptomicina; se cuantifica por dilucion en serie seguido de siembra en placas de agar SD-CAA; y se crece en 50 ml del mismo medio durante 2 dfas a 30 °C.

(ii) Selection para la union a lisozima de clara de huevo de gallina usando clasificacion celular activada por fluorescencia

5 [0184] Las siguientes rondas de seleccion se realizan por FACS, comenzando con 2 * 106 a 3 * 106 celulas

de levadura inducidas. Las celulas se lavan con 1 ml de PBS, pH 7,4, BSA al 0,1 %, se resuspenden en 100 pl del mismo tampon que contiene lisozima de clara de huevo de gallina biotinilada, y se incuban a temperatura ambiente con rotacion suave durante 1 h.

10 [0185] Despues de lavar con 1 ml de PBS enfriado con hielo, pH 7,4, BSA al 0,1 %, las celulas se marcan

con anticuerpos y estreptavidina. El anticuerpo monoclonal anti-c-myc conjugado con FITC (AbD Serotec) se usa para marcar la levadura para la presentacion en la superficie de mimeticos del anticuerpo marcado con c-myc, y la estreptavidina marcada con PE (Invitrogen) o anticuerpo anti-biotina (Miltenyi) se utiliza para marcar HEL-b asociado con mimeticos del anticuerpo de union a la lisozima. Las clasificaciones FACS se realizan en celulas de levadura 15 marcadas con anticuerpo anti-c-myc de raton conjugado con FITC y estreptavidina conjugada con PE (Invitrogen).

[0186] Las celulas de levadura doblemente marcadas se clasifican en un clasificador de celulas Dako MoFlo de alta velocidad con un laser de 488 nm, a 6000-10 000 celulas/s. Las puertas se ajustan para recoger las celulas de levadura con el 0,1-1 % mas alto de la senal asociada a HEL-b (PE) y en la mitad superior de la senal asociada a

20 la expresion (FITC). Las muestras duplicadas marcadas con el mismo anticuerpo y los mismos reactivos de estreptavidina, pero en ausencia de HEL-b se usan para evitar seleccionar las celulas que unen los reactivos de deteccion en lugar de la lisozima.

[0187] Para todas las bibliotecas, las primeras dos clasificaciones FACS se realizan en levadura marcada con 25 HEL-b 1 pM. Una vez que se observa una poblacion de celulas que esta marcada con PE en presencia, pero no en

ausencia de HEL-b, la concentracion de HEL-b en la ronda siguiente disminuye en un orden de magnitud. Las celulas seleccionadas se recogen en 0,5 ml de SD-CAA, pH 4,5, 50 pg/ml de kanamicina, 100 U/ml de penicilina G y 200 U/ml de estreptomicina. Las celulas recolectadas se cultivan hasta la saturacion en 5 ml del mismo medio, con agitacion, durante 2 dlas a 30 °C, antes de inducirse y marcarse para la siguiente ronda de clasificacion.

30

[0188] Despues de varias rondas de clasificacion de FACS, la poblacion enriquecida final se pone en placas SDCAa y se incuba a 30 °C durante 2 dlas. Las colonias individuales se recogen usando un Genetix Clonepix y se vuelven a formar en placas de 96 pocillos que contienen medio SD-CAA. Despues de la incubacion durante 24 horas, las celulas se recogen por centrifugacion y se resuspenden en medio SD-GAA para la induccion de moleculas

35 de Fn3 unicas expresadas en superficie. Los clones positivos se identifican mediante ELISA convencional. El ADN del plasmido correspondiente a los clones positivos de Fn3 unicos se purifica y se secuencia para identificar aglutinantes monoespeclficos.

[0189] Una vez identificados y seleccionados los aglutinantes monoespeclficos de la Biblioteca inferior, 40 pueden usarse para generar moleculas terapeuticas. En particular, los aglutinantes monoespeclficos generados a

partir de la Biblioteca inferior se pueden usar para generar nuevas moleculas de union terapeutica contra una diana de interes. Diversos aglutinantes monoespeclficos de la Biblioteca inferior se pueden combinar con enlazadores para producir una molecula de union a Fn3 que es capaz de unirse a una o mas regiones de una unica diana (por ejemplo, TNF). Como alternativa, tambien puede disenarse una molecula de union a Fn3 que comprende 45 aglutinantes de la Biblioteca inferior para que se unan a una o mas regiones de dianas multiples (por ejemplo, una o mas regiones de HSA y TNF).

[0190] Ademas, los aglutinantes monoespeclficos generados a partir de la Biblioteca inferior se pueden combinar con la Biblioteca superior usando tecnicas convencionales de biologla molecular para generar aglutinantes

50 biespeclficos y multiespeclficos.

Ejemplo 9: Generacion de moleculas de union basadas en fibronectina bifuncional

[0191] El modelado por ordenador de las regiones aleatorizadas en la estructura de rayos X de Fn3 humana 55 muestra que combinando aglutinantes monoespeclficos de cada una de las bibliotecas A y B, se pueden crear

moleculas de union a fibronectina biespecificas. Estas moleculas de union pueden manipularse de manera que reconozcan regiones diferentes en la misma molecula diana, o que los diferentes sitios de union de la molecula de fibronectina biespecifica o multiespecifica puedan unirse a diferentes regiones en dos o mas dianas diferentes.

[0192] Por ejemplo, una secuencia adecuada correspondiente a los Bucles inferiores (obtenida al seleccionar la Biblioteca Inferior) y una secuencia adecuada correspondiente a los Bucles superiores (obtenida al seleccionar la Biblioteca superior) se pueden combinar en una sola molecula, Aglutinante C que usa ambos Bucles inferiores y superiores para unir, generando as! una molecula biespeclfica.

5

[0193] El ADN correspondiente a la secuencia de aminoacidos combinada de Aglutinante C se sintetiza y optimiza para la expresion en E. coli en Geneart AG, Alemania. La clonacion en E. coli y la posterior purificacion sigue protocolos convencionales como se describe en el capltulo 4 ( Procedimientos de fabricacion).

10 [0194] Como alternativa, se puede generar una molecula de union basada en Fn3 bifuncional uniendo dos o

mas moleculas de union basadas en Fn3 monoespeclficas.

Equivalentes

15 [0195] Los expertos en la materia reconoceran o seran capaces de determinar, usando nada mas que

experimentacion de rutina, muchos equivalentes de las realizaciones especlficas de la invencion descrita en el presente documento.

Claims

REIVINDICACIONES

1. Un procedimiento para formar una biblioteca de polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles para explorar la presencia de uno o mas polipeptidos que tienen una actividad enzimatica o de union

5 seleccionada, donde dichos polipeptidos tienen las secuencias de aminoacidos de tipo silvestre en las regiones de cadena beta A, AB, B, C, CD, D, E, EF, F y G del 10° modulo de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, el procedimiento que comprende las etapas de:

(i) alinear secuencias de bucle de aminoacidos AB, CD y EF en una coleccion de polipeptidos del dominio de 10 fibronectina de tipo 3 nativo,

(ii) segregar las secuencias de bucle alineadas segun la longitud del bucle,

(iii) para un bucle y una longitud bucle seleccionados de la etapa (ii), realizar un analisis de frecuencia posicional de aminoacidos para determinar las frecuencias de aminoacidos en cada posicion del bucle, en el que la longitud del bucle EF esta fijada en 6 aminoacidos (EF/6),

15 (iv) para cada bucle y longitud de bucle analizados en la etapa (iii), identificar en cada posicion un aminoacido de consenso conservado o semiconservado seleccionado y otros aminoacidos de variante natural,

(v) para al menos el bucle EF, formar:

(1) una biblioteca de secuencias de mutagenesis expresadas por una biblioteca de secuencias codificantes que 20 codifican, en cada posicion del bucle, el aminoacido de consenso, y si el aminoacido de consenso tiene una

frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido, o

(2) una biblioteca de secuencias combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso y, si el aminoacido

25 de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variantes naturales, incluidos aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral mlnimo seleccionado en esa posicion, o sus equivalentes qulmicos,

30 (vi) incorporar la biblioteca de secuencias codificantes en las secuencias codificantes de Fn3 marco para formar una biblioteca de expresion de Fn3, y

(vii) expresar los polipeptidos de Fn3 de la biblioteca de expresion.
2. El procedimiento de la reivindicacion 1, en el que la frecuencia umbral dada es del 100 %.

35
3. El procedimiento de la reivindicacion 1, en el que la frecuencia umbral dada es una frecuencia seleccionada entre el 50-95 %.
4. El procedimiento de la reivindicacion 1, en el que la etapa (ii) segrega los bucles y las longitudes de 40 bucle en el grupo que consiste en AB/1-3, y CD/4-10.
5. El procedimiento de la reivindicacion 1, en el que la etapa (ii) segrega los bucles y las longitudes de bucle en el grupo que consiste en AB/3, CD/5, CD/6 y CD/7.

45 6. El procedimiento de la reivindicacion 1, en el que la biblioteca formada tiene una biblioteca de

secuencias combinatorias naturales en una combinacion de bucles y longitudes de bucle seleccionadas de los bucles AB y EF, y CD y EF, donde el bucle AB se selecciona de uno de AB/1-3 y AB/3, y el bucle CD se selecciona de uno de CD/4-10, cD/5, CD/6 y CD/7, o una combinacion de los tres bucles AB, CD y EF, donde los bucles AB y CD se seleccionan del grupo que consiste en AB/1-3, AB/3, CD/4-10, CD/5, CD/6 y CD/7.

50
7. El procedimiento de la reivindicacion 6, en el que el umbral dado es del 100 %, a menos que la posicion del aminoacido del bucle contenga solo un aminoacido dominante y uno variante, y los aminoacidos dominantes y variantes tengan cadenas laterales con propiedades fisicoqulmicas similares, en cuyo caso el umbral dado es del 90 %.

55
8. Una biblioteca de polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas polipeptidos que tienen una actividad de union o enzimatica seleccionada, dichos polipeptidos que comprenden:

(a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre del 10° modulo de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, y

(b) regiones de bucle AB, CD y EF que tienen longitudes seleccionadas, en las que la longitud del bucle EF esta fijada en 6 aminoacidos (EF/6), donde al menos la region de bucle EF contiene una biblioteca de secuencias de

5 mutagenesis expresadas por una biblioteca de secuencias codificantes que codifican, en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, un unico aminoacido diana comun y cualquier aminoacido coproducido.

10 9. La biblioteca de la reivindicacion 8, en la que la frecuencia umbral dada es del 100 %.
10. La biblioteca de la reivindicacion 8, en la que la frecuencia umbral dada es una frecuencia

seleccionada entre el 50-95 %.

15 11. La biblioteca de la reivindicacion 8, en la que los bucles y las longitudes de bucle se seleccionan del

grupo que consiste en bucles AB y EF, y CD y EF, donde el bucle AB se selecciona de uno de AB/1-3 y AB/3, y el bucle CD se selecciona de uno de CD/4-10, CD/5, CD/6 y CD/7, o una combination de los tres bucles aB, CD y EF, donde los bucles AB y CD se seleccionan del grupo compuesto por AB/1-3, AB/3, CD/4-10, CD/5, CD/6 y CD/7, y que tiene una biblioteca de secuencias de mutagenesis formadas en cada uno de los bucles y longitudes de bucle 20 seleccionadas del grupo compuesto por AB/1-3, AB/3, CD/4-10, CD/5, CD/6 y CD/7.
12. Una biblioteca combinatoria de variantes naturales de polipeptidos del dominio de fibronectina de tipo 3 (Fn3) utiles en el cribado de la presencia de uno o mas polipeptidos que tienen una actividad de union o enzimatica seleccionada, dichos polipeptidos que comprenden:

25

(a) regiones A, AB, B, C, CD, D, E, EF, F y G que tienen secuencias de aminoacidos de tipo silvestre del 10° modulo de fibronectina de tipo III de la fibronectina humana que tiene la secuencia de SEQ ID NO: 1, y

(b) regiones de bucle AB, CD y EF que tienen longitudes seleccionadas, en las que la longitud del bucle EF esta fijada en 6 aminoacidos (EF/6), donde al menos la region de bucle EF contiene una biblioteca de secuencias

30 combinatorias de variantes naturales expresadas por una biblioteca de secuencias codificantes que codifican en cada posicion del bucle, un aminoacido de consenso conservado o semiconservado seleccionado y, si el aminoacido de consenso tiene una frecuencia de aparicion igual o inferior a una frecuencia umbral seleccionada de al menos un 50 %, otros aminoacidos de variantes naturales, que incluyen aminoacidos semiconservados y aminoacidos variables cuya frecuencia de aparicion esta por encima de un umbral mlnimo seleccionado en esa posicion, o sus 35 equivalentes qulmicos.
13. La biblioteca de la reivindicacion 12, que tiene una biblioteca de secuencias combinatorias de variantes naturales en una combinacion de bucles y longitudes de bucle seleccionadas de bucles AB y EF, y CD y EF, donde el bucle AB se selecciona de uno de AB/1-3 y AB/3, y el bucle CD se selecciona de uno de cD/4-10,

40 CD/5, CD/6 y CD/7, o una combinacion de los tres bucles AB, CD y EF, donde los bucles AB y CD se seleccionan del grupo que consiste en AB/1-3, AB/3, CD/4-10, CD/5, CD/6, CD/7.
14. La biblioteca de la reivindicacion 13, en la que el umbral dado es del 100 %, a menos que la posicion del aminoacido del bucle contenga solo un aminoacido dominante y uno variante, y los aminoacidos dominantes y

45 variantes tengan cadenas laterales con propiedades fisicoqulmicas similares, en cuyo caso el umbral dado es del 90 %.
15. La biblioteca de la reivindicacion 13, en la que la longitud del bucle AB es 3.

50 16. La biblioteca de la reivindicacion 13, en la que la longitud del bucle CD es 5.
17. La biblioteca de la reivindicacion 13, en la que la longitud del bucle CD es 6.
18. La biblioteca de la reivindicacion 13, en la que la longitud del bucle CD es 7.

55
19. La biblioteca de la reivindicacion 13, en la que los polipeptidos estan codificados por una biblioteca de expresion seleccionada del grupo que consiste en una biblioteca de presentation en ribosomas, una biblioteca de presentation en polisomas, una biblioteca de presentacion en fagos, una biblioteca de expresion bacteriana y una biblioteca de presentacion en levaduras.
20. Una biblioteca de expresion de polinucleotidos que codifica la biblioteca de polipeptidos de la reivindicacion 13, y producida sintetizando polinucleotidos que codifican una o mas regiones marco de la cadena beta y una o mas regiones de bucle en las que los polinucleotidos estan predeterminados, en la que los

5 polinucleotidos que codifican dichas regiones comprenden adicionalmente suficiente secuencia de superposicion mediante la cual las secuencias de polinucleotidos, en condiciones de reaccion en cadena de la polimerasa (PCR), son capaces de ensamblarse en polinucleotidos que codifican dominios de union a fibronectina completos.
21. Un procedimiento para identificar un polipeptido que tiene una afinidad de union deseada con respecto 10 a un antlgeno seleccionado, que comprende hacer reaccionar la biblioteca combinatoria variante natural de

polipeptidos Fn3 de la reivindicacion 13 con el antlgeno seleccionado, y cribar los polipeptidos Fn3 para seleccionar los que tienen una afinidad de union deseada con respecto al antlgeno seleccionado.
22. El procedimiento de la reivindicacion 21, en el que el procedimiento comprende adicionalmente la 15 etapa de identificar el polinucleotido que codifica el dominio de union a fibronectina seleccionado.