ES2819123T3 - Proteínas del factor VIII que tienen secuencias ancestrales, vectores de expresión, y usos relacionados con ellos - Google Patents

Proteínas del factor VIII que tienen secuencias ancestrales, vectores de expresión, y usos relacionados con ellos Download PDF

Info

Publication number
ES2819123T3
ES2819123T3 ES16744021T ES16744021T ES2819123T3 ES 2819123 T3 ES2819123 T3 ES 2819123T3 ES 16744021 T ES16744021 T ES 16744021T ES 16744021 T ES16744021 T ES 16744021T ES 2819123 T3 ES2819123 T3 ES 2819123T3
Authority
ES
Spain
Prior art keywords
seq
domain
protein
acid sequence
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16744021T
Other languages
English (en)
Inventor
H Spencer
Christopher Doering
Philip Zakas
Eric Gaucher
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Emory University
Georgia Tech Research Institute
Georgia Tech Research Corp
Original Assignee
Emory University
Georgia Tech Research Institute
Georgia Tech Research Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Emory University, Georgia Tech Research Institute, Georgia Tech Research Corp filed Critical Emory University
Application granted granted Critical
Publication of ES2819123T3 publication Critical patent/ES2819123T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides

Abstract

Una proteína FVIII recombinante o quimérica que comprende una o más mutaciones ancestrales y una eliminación del dominio B, y en donde la secuencia de la proteína no se produce de forma natural; y en donde la proteína tiene: un dominio A1 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 22, 4, o 13; un dominio A2 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 23, 5, o 14; un dominio de ap que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 25, 7, o 16; un dominio A3 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 26, 8, o 17; un dominio C1 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 27, 9, o 18; y un dominio C2 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 28, 10, o 19.

Description

DESCRIPCIÓN
Proteínas del factor VIII que tienen secuencias ancestrales, vectores de expresión, y usos relacionados con ellos Referencia cruzada a solicitudes relacionadas
La presente solicitud reivindica prioridad a la solicitud provisional de EE. UU. número 62/109.964 presentada el 30 de enero de 2015.
DECLARACIÓN CON RESPECTO A LA INVESTIGACIÓN CON FONDOS FEDERALES
La presente invención se realizó con el apoyo del gobierno con las subvenciones R01 HL092179 y U54 HL112309 otorgadas por el National Institutes of Health. El gobierno posee ciertos derechos sobre la invención.
INCORPORACIÓN POR REFERENCIA DE MATERIAL PRESENTADO COMO ARCHIVO DE TEXTO A TRAVÉS DEL SISTEMA DE ARCHIVO ELECTRÓNICO DE LA OFICINA (EFS-WEB)
El listado de secuencias asociado con la presente solicitud se proporciona en formato de texto en lugar de una copia impresa, y por tanto se incorpora en la presente como referencia en la presente memoria descriptiva. El nombre del archivo de texto que contiene el listado de secuencias es 15072PCT_2016-01-27_ST25.txt. El archivo de texto es de 399 KB, fue creado el 27 de enero de 2016 y se presenta electrónicamente a través de EFS-Web.
Antecedentes
Las mutaciones en el gen del factor de coagulación VIII dan como resultado una proteína disminuida o defectuosa del factor de coagulación (FVIII) que da lugar a la hemofilia A caracterizada por un sangrado incontrolado. El tratamiento de la hemofilia A generalmente implica una infusión intravenosa de varias semanas de por vida de productos con FVIII recombinante o derivado de plasma humano. Los pacientes tratados con productos de reemplazo de FVIII a menudo desarrollan anticuerpos neutralizantes que hacen que el tratamiento futuro sea ineficaz. Por tanto, existe la necesidad de identificar terapias mejoradas.
Las terapias génicas se basan generalmente en virus genéticamente modificados diseñados para suministrar transgenes funcionales al paciente para que sus propias células puedan biosintetizar una proteína carente o defectuosa. Se han realizado avances clínicos usando vectores víricos adenoasociados recombinantes (rAAV) para la expresión de factores sanguíneos en el hígado. McIntosh et al. notifican niveles terapéuticos de FVIII tras la administración del vector rAAV que codifica una variante del factor VIII humano. Blood. 2013, 121(17):3335-44. Véanse también Brown et al. Molecular Therapy, Methods & Clinical Development (2014) 1, 14036; Doering et al. J. Biol. Chem.
2004, 279:6546-6552; Zakas et al., J Thromb Haemost, 2015, 13(1):72-81; y la publicación de solicitud de patente de EE. UU. US20040197875.
Las referencias citadas en el presente documento no constituyen una admisión de la técnica anterior.
Sumario
La presente divulgación se refiere a proteínas FVIII recombinantes o quiméricas, variantes y vectores que codifican las proteínas que contienen una o más mutaciones ancestrales. En ciertas realizaciones, uno o más dominios proteicos comprenden secuencias de aminoácidos que se derivan de secuencias de aminoácidos reconstruidas de forma ancestral. En ciertas realizaciones, la divulgación se refiere a composiciones farmacéuticas que comprenden las proteínas o vectores y métodos relacionados de inducción de la coagulación de la sangre.
En ciertas realizaciones, las mutaciones en los dominios ancestrales son aquellas contenidas en SEQ ID NO: 2, 11, 20 y 29-38. En ciertas realizaciones, el dominio ancestral es una secuencia dentro del dominio A1, dominio A2, dominio de péptido de activación (ap), dominio A3, dominio C1 o dominio C2 que opcionalmente tiene un dominio de péptido de señalización (sp). En ciertas realizaciones, la variante de FVIII comprende un domino B eliminado.
En ciertas realizaciones, la variante de FVIII comprende un dominio A1, un dominio A2, una secuencia RHQR (SEQ ID NO: 245), un dominio A3, un dominio C1 y un dominio C2.
En ciertas realizaciones, la variante de FVIII comprende un dominio A1, un dominio A2, un dominio de péptido de activación (ap), un dominio A3, un dominio C1 y un dominio C2. En ciertas realizaciones, la variante de FVIII comprende opcionalmente un domino B eliminado.
En ciertas realizaciones, la variante de FVIII comprende un enlazador de entre dos y cincuenta, o dos y veinticinco, o dos y quince aminoácidos entre el dominio A2 y el un dominio de péptido de activación (ap).
En ciertas realizaciones, el dominio de sp ancestral es SEQ ID NO: 3, 12 o 21 o sus variantes. En ciertas realizaciones, el dominio A1 ancestral es SEQ ID NO: 4, 13 o 22 o sus variantes.
En ciertas realizaciones, el dominio A2 ancestral es SEQ ID NO: 5, 14 o 23 o sus variantes. En ciertas realizaciones, el dominio B ancestral es SEQ ID NO: 6, 15 o 24 o sus variantes. En ciertas realizaciones, el dominio de ap ancestral es SEQ ID NO: 7, 16 o 25 o sus variantes. En ciertas realizaciones, el dominio A3 ancestral es SEQ ID NO: 8, 17 o 26 o sus variantes. En ciertas realizaciones, el dominio C1 ancestral es SEQ ID NO: 9, 18 o 27 o sus variantes. En ciertas realizaciones, el dominio C2 ancestral es SEQ ID NO: 10, 19 o 28 o sus variantes. En ciertas realizaciones, las variantes son aquellas que tienen más del 80, 85, 90, 95, 96, 97, 98 o 99 % de identidad o similitud con los dominios. En ciertas realizaciones, las variantes son aquellas que tienen una, dos o más sustituciones o sustituciones conservativas de aminoácidos. En ciertas realizaciones, las variantes son aquellas que tienen una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve o más sustituciones, eliminaciones o adiciones de aminoácidos.
En ciertas realizaciones, la proteína FVIII recombinante tiene la SEQ ID NO: 39, 40 o 42 o sus variantes. En ciertas realizaciones, las variantes son aquellas que tienen más del 80, 85, 90, 95, 96, 97, 98 o 99 % de identidad o similitud con las proteínas que incluyen o que no incluyen el péptido de señalización. En ciertas realizaciones, las variantes son aquellas que tienen una, dos o más sustituciones o sustituciones conservativas de aminoácidos. En ciertas realizaciones, las variantes son aquellas que tienen una, dos, tres, cuatro, cinco, seis, siete, ocho, nueve o más sustituciones, eliminaciones o adiciones de aminoácidos.
En ciertas realizaciones, la divulgación se refiere a la proteína FVIII recombinante o quimérica que tiene una o más secuencias ancestrales o sus variantes tales como SEQ ID NOs: 44-244 y 247-277 en los dominios correspondientes. En ciertas realizaciones, la divulgación se refiere a la proteína FVIII recombinante que tiene un dominio ancestral seleccionado entre un dominio de péptido de señalización (sp), dominio A1, dominio de péptido de activación (ap) y dominio A3 en donde uno o más aminoácidos en el dominio B son opcionalmente eliminados o el dominio B tiene una o más sustituciones de origen natural o no natural.
En ciertas realizaciones, la proteína FVIII recombinante o quimérica tiene la mutación E434V como se notifica en la Figura 1 del documento US20040197875, en donde la proteína tiene un dominio A2 que tiene TDVTF (SEQ ID NO: 43).
En ciertas realizaciones, la divulgación se refiere a ácidos nucleicos que codifican una proteína FVIII recombinante o quimérica divulgada en el presente documento.
En ciertas realizaciones, la divulgación se refiere a vectores que comprenden una secuencia de ácido nucleico promotora en combinación operable con una secuencia de ácido nucleico heterólogo que codifica una proteína FVIII recombinante o quimérica divulgada en el presente documento. En ciertas realizaciones, el vector comprende un promotor específico del hígado y repeticiones terminales invertidas (ITR) del AVV 5' y 3'.
En ciertas realizaciones, la divulgación contempla la terapia génica lentivírica dirigida a células madre hematopoyéticas. En ciertas realizaciones, el vector es un vector retrovírico o lentivírico tal como un vector lentivírico autoinactivante derivado de VIH-1. En ciertas realizaciones, el vector contiene un promotor constitutivo interno tal como EF1-alfa, PGK o UbC o un promotor específico de célula tal como GPIb-alfa, CD68 o RCL de la beta globina.
En ciertas realizaciones, la divulgación contempla composiciones farmacéuticas que comprenden una proteína FVIII recombinante o quimérica y un excipiente farmacéuticamente aceptable.
En ciertas realizaciones, la divulgación contempla métodos de inducción de la coagulación de la sangre que comprenden administrar una cantidad eficaz de una composición farmacéutica divulgada en el presente documento a un sujeto que lo necesite. En ciertas realizaciones, el sujeto está en riesgo de, se sospecha que, presenta síntomas de, o se le diagnostica un trastorno de la coagulación de la sangre, p. ej., en donde el sujeto es diagnosticado con hemofilia A o hemofilia adquirida.
En ciertas realizaciones, la divulgación contempla una composición farmacéutica que comprende un vector de codificación de una proteína divulgada en el presente documento.
En ciertas realizaciones, la divulgación contempla un método de inducción de la coagulación de la sangre que comprende administrar una cantidad eficaz de una composición farmacéutica que comprende un vector que codifica una proteína divulgada en el presente documento a un sujeto que lo necesite, en donde el sujeto es diagnosticado con hemofilia A o hemofilia adquirida en condiciones tales que la proteína se expresa induciendo la coagulación de la sangre. En ciertas realizaciones, es poco probable que el sujeto responda a infusiones exógenas de FVIII.
En ciertas realizaciones, la divulgación se refiere a sistemas de expresión que comprenden ácidos nucleicos o vectores que comprenden ácidos nucleicos divulgados en el presente documento.
En ciertas realizaciones, la divulgación se refiere a métodos de inducción de la coagulación de la sangre que comprenden administrar una cantidad eficaz de células alogénicas o autólogas transducidas ex vivo con un vector para expresar un FVIII divulgado en el presente documento.
Breve descripción de las figuras
La Figura 1 muestra un árbol filogenético que se construyó para genes de FVIII de mamíferos usando secuencias de aminoácidos conocidas. Los nodos intermedios ancestrales que fueron reconstruidos a través de la síntesis de genes están numerados dentro de los círculos. Estos genes con eliminación del dominio B se han optimizado por codones para la expresión de células humanas y se han subclonado en el plásmido de expresión de mamíferos ReNeo.
La Figura 2 muestra datos de la actividad de FVIII relativa donde las células HEK293T-17 se transfectaron de manera transitoria con el plásmido de FVIII a través de PEI. Veinticuatro horas después de reemplazar el medio DMEM con Aim-V libre de suero, se analizó el sobrenadante para determinar la actividad de FVIII mediante un ensayo de coagulación de una fase y se mostró como el coeficiente de aumento medio sobre el FVIII humano a partir de dos experimentos separados. La actividad total se normalizó con respecto a los recuentos celulares tomados en el momento de la detección de FVIII y luego se normalizó con respecto a los niveles de actividad de FVIII humano.
La Figura 3 muestra datos de actividad. Se generaron clones de BHK-M estables usando la selección G418 después de la transfección del plásmido de FVIII con Lipofectamine 2000. Se seleccionaron veinticuatro clones de cada tratamiento con FVIII. Se muestran los niveles de actividad de FVIII de los 4 clones de mayor producción determinados por coagulación de una fase y normalizados con respecto a los recuentos celulares. Las líneas discontinuas indican el valor medio de cada tratamiento con FVIII. De las secuencias ancestrales de FVIII, la producción de los nodos 52, 53 y 68 de FVIII es significativamente diferente de la de FVIII humano. Es más, los nodos ancestrales 53 y 68 producen concentraciones significativamente más altas de FVIII en comparación con FVIII porcino.
La Figura 4 muestra la velocidad de desintegración del nodo 68 ancestral de InM de FVIlla determinada por el ensayo cromogénico para Xase. Se recogió la proteína FVIII del clon principal de BHK-M productor y se purificó a partir de un medio libre suero usando cromatografía de intercambio iónico de una etapa. El FVIII se capturó con una columna SPHP HiTrap y se eluyó con una concentración creciente de NaCl. En comparación con la semivida del FVIII humano de 1,8 minutos, la proteína del nodo 68 ancestral muestra una semivida prolongada 9 veces de 16,2 minutos, n = 1. Cabe destacar que, el nodo 68 conserva el 75 % de identidad con el FVIII murino y el 71 % de identidad con el FVIII porcino.
La Figura 5 muestra datos sobre la reactividad cruzada de anticuerpos monoclonales (MAb) anti-ratón humanos inhibidores contra An-53 (círculos negros) y An-68 (círculos blancos) mediante ELISA directo. Los MAb se seleccionaron por su alta potencia (> 1000 BU/mg) y especificidad para el dominio A2 o C2. Los grupos de epítopos dentro del dominio se enumeran entre paréntesis. La reactividad cruzada con FVIII ancestral se define como el porcentaje de absorbancia en comparación con FVIII humano.
La Figura 6 muestra datos sobre la capacidad del mutante E434 en A2 para evadir la inhibición de 4A4.
La Figura 7 muestra un diagrama esquemático de un plásmido de FVIII del AAV. FVIII fue optimizado por codones humanos y se subclonó en un casete de expresión de AAV bajo el promotor HLP dirigido al hígado.
La Figura 8 muestra datos que comparan los niveles de An-53 (blanco) y ET3 (negro) de FVIII después de la inyección hidrodinámica en ratones con dos dosis de ADN plasmídico de FVII de AAV. Los círculos representan 3 |jg y los triángulos hacia abajo representan 0,75 |jg por ratón. La actividad del FVIII se midió mediante un ensayo cromogénico de dos fases en comparación con un patrón FACT y las barras de error representan la desviación típica de 4 ratones.
La Figura 9 muestra el análisis SDS-PAGE de An-53 y An-68 después de un intercambio iónico de dos etapas. CS: cadena sencilla; CP: cadena pesada; CL: cadena ligera; CLe: cadena ligera escindida; A1 y A2: dominios A de FVIII
Discusión detallada
Antes de que la presente divulgación se describa con más detalle, debe entenderse que la presente divulgación no se limita a las realizaciones particulares descritas, y, como tal, por supuesto, puede variar. También debe entenderse que la terminología usada en el presente documento únicamente tiene el fin de describir realizaciones particulares y no se pretende que sea limitante, dado que el alcance de la presente divulgación estará limitado únicamente por las reivindicaciones adjuntas.
A menos que se defina lo contrario, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el que entiende comúnmente una persona normalmente experta en la materia a la cual pertenece la presente divulgación. Aunque también pueden usarse en la puesta en práctica o el ensayo de la presente invención cualquier método y material similar o equivalente a los que se describen en la presente divulgación, a continuación se describen los métodos y materiales preferidos.
La mención de cualquier publicación es para su divulgación antes de la fecha de presentación y no debe interpretarse como admisión de que la presente divulgación no tiene derecho a preceder a dicha publicación en virtud de la divulgación anterior. Además, las fechas de publicación proporcionadas pueden ser diferentes de las fechas de publicación reales que pueden necesitar su confirmación independientemente.
Tal como será evidente para los expertos en la materia tras la lectura de la presente divulgación, cada una de las realizaciones individuales descritas e ilustradas en el presente documento tiene características y componentes discretos que fácilmente pueden separarse o combinarse con las características de cualquiera de las otras realizaciones sin apartarse del alcance o espíritu de la presente divulgación. Cualquier método citado puede llevarse a cabo en el orden de los eventos citados o en cualquier otro orden que sea posible lógicamente.
Las realizaciones de la presente divulgación emplearán, a menos que se indique lo contrario, técnicas de medicina, química orgánica, bioquímica, biología molecular, farmacología y similares, que están dentro de las habilidades de la técnica. Dichas técnicas se explican con todo detalle en la bibliografía.
Debe destacarse que, como se usa en la memoria descriptiva y las reivindicaciones adjuntas, las formas en singular "un", "una", y "el/la" incluyen referentes en plural a menos que el contexto indique claramente lo contrario. En la presente memoria descriptiva y en las reivindicaciones que se presentan a continuación, se hará referencia a varios términos que se definirán por tener los siguientes significados a menos que sea evidente una intención contraria.
Antes de describir las diversas realizaciones, se proporcionan las siguientes definiciones y deben usarse a menos que se indique lo contrario.
Como se usa en el presente documento, una secuencia de "origen no natural" es aquella para la que ningún organismo se produce o alguna vez se ha producido durante el curso de eventos naturales. Una proteína es de origen no natural si se sustituyen uno o más aminoácidos de manera que la secuencia completa de aminoácidos nunca se produjo debido al curso de eventos naturales.
Como se usa en el presente documento, "mutaciones ancestrales" se refieren a alteraciones en la secuenciación de ácidos nucleicos que da como resultado sustituciones de aminoácidos en la proteína correspondiente cuando se compara con la secuencia de consenso humana, es decir, SEQ ID NO: 1. Se puede identificar una posición de la sustitución de aminoácidos por referencia a posiciones numéricas dentro de SEQ ID NO: 1 con o sin referencia a la proteína que tiene el péptido señal. Con respecto a las mutaciones, es común referirse al sistema de numeración anterior en donde FVIII no contiene el péptido señal ya que normalmente se escinde durante el procesamiento celular. Como se usa en el presente documento, una "mutación ancestral única" se refiere a una mutación ancestral que tampoco se encuentra en la secuencia de ningún primate o mamífero conocido.
Los términos "proteína" y "polipéptido" se refieren a compuestos que comprenden aminoácidos unidos mediante enlaces peptídicos y se usan indistintamente.
Como se usa en el presente documento, cuando "secuencia de aminoácidos" se menciona en el presente documento, se refiere a una secuencia de aminoácidos de una molécula proteica. Se puede deducir una "secuencia de aminoácidos" a partir de la secuencia de ácido nucleico que codifica la proteína. Sin embargo, términos como "polipéptido" o "proteína" no pretenden limitar la secuencia de aminoácidos a la secuencia de aminoácidos deducida, sino que incluyen modificaciones postraduccionales de las secuencias de aminoácidos deducidas, tales como eliminaciones, adiciones y modificaciones de aminoácidos tales como glucosilaciones y adición de restos lipídicos.
La expresión "ácido nucleico" se refiere a un polímero compuesto por nucleótidos o polinucleótidos. La expresión se usa para designar una sola molécula o una colección de moléculas. Los ácidos nucleicos pueden ser monocatenarios o bicatenarios o autocomplementarios, y pueden incluir regiones codificantes y regiones de varios elementos de control.
La expresión "una secuencia de ácido nucleico que codifica" un polipéptido especificado se refiere a una secuencia de ácido nucleico que comprende la región codificante de un gen o, en otras palabras, la secuencia de ácido nucleico que codifica una proteína. La región codificante puede estar presente en forma de ADNc, ADN genómico o ARN. Cuando está presente en forma de ADN, el oligonucleótido, el polinucleótido o el ácido nucleico puede ser monocatenario (es decir, cadena sentido) o bicatenario. Los elementos de control adecuados tales como potenciadores/promotores, uniones de corte y empalme, señales de poliadenilación, etc. pueden colocarse muy cerca de la región codificante del gen si es necesario para permitir el inicio adecuado de la transcripción y/o el procesamiento correcto del transcrito de ARN primario. Como alternativa, la región codificante utilizada en los vectores de expresión de la presente divulgación puede contener potenciadores/promotores endógenos, uniones de corte y empalme, secuencias de intervención, señales de poliadenilación, etc., o una combinación de elementos de control tanto endógenos como exógenos.
El término "recombinante" cuando hace referencia a una molécula de ácido nucleico se refiere a una molécula de ácido nucleico que está comprendida por segmentos de ácido nucleico unidos entre sí mediante técnicas de biología molecular. El término "recombinante" cuando hace referencia a una proteína o a un polipéptido se refiere a una molécula proteica que se expresa usando una molécula de ácido nucleico recombinante.
El término "quimera", cuando se usa en referencia a un polipéptido o polinucleótido, se refiere al producto de expresión de dos o más secuencias codificantes obtenidas de diferentes genes, que se han clonado en conjunto y que, después de la traducción, actúan como una única secuencia polipeptídica de manera que la secuencia polipeptídica única o entera, o la secuencia de nucleótidos, no es de origen natural. Los polipéptidos quiméricos también se denominan polipéptidos "híbridos". Las secuencias codificantes incluyen aquellas obtenidas de la misma especie de organismos o de diferentes especies de organismos.
La expresión "ácido nucleico heterólogo" se refiere a un ácido nucleico que no se encuentra en su entorno natural (es decir, ha sido alterado por la mano del hombre). Por ejemplo, un ácido nucleico heterólogo incluye un gen de una especie introducido en otra especie. Un ácido nucleico heterólogo también incluye un gen nativo en un organismo que ha sido alterado de alguna manera (p. ej., mutado, añadido en múltiples copias, ligado a una secuencia promotora o potenciadora no nativa, etc.). Los ácidos nucleicos víricos heterólogos se distinguen de los genes víricos endógenos en que las secuencias de genes heterólogos normalmente se unen a secuencias de nucleótidos que comprenden elementos reguladores tales como promotores que no se encuentran asociados de forma natural con el gen de la proteína codificada por el gen heterólogo o con secuencias de genes víricos en el cromosoma, o están asociados con porciones del cromosoma que no se encuentra en la naturaleza (p. ej., genes expresados en loci donde el gen no se expresa normalmente).
Los términos "variante" y "mutante", cuando se usan en referencia a un polipéptido, se refieren a una secuencia de aminoácidos que difiere en uno o más aminoácidos de otro polipéptido, normalmente relacionado. La variante puede tener cambios "conservativos", en donde el aminoácido sustituido tiene propiedades estructurales o químicas similares. Un tipo de sustituciones de aminoácidos conservativas se refiere a la intercambiabilidad de residuos que tienen cadenas laterales similares. Por ejemplo, un grupo de aminoácidos que tienen cadenas laterales alifáticas es glicina, alanina, valina, leucina e isoleucina; un grupo de aminoácidos que tienen cadenas laterales de hidroxilo alifático es serina y treonina; un grupo de aminoácidos que tienen cadenas laterales que contienen amida es asparagina y glutamina; un grupo de aminoácidos que tienen cadenas laterales aromáticas es fenilalanina, tirosina y triptófano; un grupo de aminoácidos que tienen cadenas laterales básicas es lisina, arginina e histidina; y un grupo de aminoácidos que tienen cadenas laterales que contienen azufre es cisteína y metionina. Son grupos de sustitución de aminoácidos conservativa preferidos: valina-leucina-isoleucina, fenilalanina-tirosina, lisina-arginina, alanina-valina y asparaginaglutamina. Más raramente, una variante puede tener cambios "no conservativos" (p. ej., reemplazo de una glicina con un triptófano). Las variaciones menores similares también pueden incluir eliminaciones o inserciones (en otras palabras, adiciones) de aminoácidos o ambas. Puede encontrarse orientación para determinar qué y cuántos residuos de aminoácidos pueden sustituirse, insertarse o eliminarse sin afectar a la actividad biológica usando programas informáticos bien conocidos en la técnica, por ejemplo, el software DNAStar. Las variantes se pueden probar en ensayos funcionales. Las variantes preferidas tienen menos del 10 %, y preferentemente menos del 5 %, y aún más preferentemente menos del 2 % de cambios (ya sean sustituciones, eliminaciones, etc.).
En ciertas realizaciones, la expresión "porcentaje de identidad de secuencia" se calcula al comparar dos secuencias alineadas de manera óptima a lo largo de la ventana de comparación, determinando el número de posiciones en las que la base de ácido nucleico idéntica (p. ej., A, T, C, G, U, o I) ocurre en ambas secuencias para obtener el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes entre el número total de posiciones en la ventana de comparación (es decir, el tamaño de la ventana) y multiplicando el resultado por 100 para producir el porcentaje de identidad de secuencia.
En ciertas realizaciones, la "identidad" de secuencia se refiere al número de aminoácidos o nucleótidos que coinciden exactamente (expresado como un porcentaje) en un alineamiento de secuencia entre dos secuencias del alineamiento calculado usando el número de posiciones idénticas dividido por el número mayor de la secuencia más corta o el número de posiciones equivalentes excluyendo los segmentos protuberantes en donde los espacios internos se cuentan como una posición equivalente. Por ejemplo, los polipéptidos GGGGGG y GGGGT tienen una identidad de secuencia de 4 de 5 u 80 %. Por ejemplo, los polipéptidos GGGPPP y GGGAPPP tienen una identidad de secuencia de 6 de 7 u 85 %. En ciertas realizaciones, cualquier mención de la identidad de secuencia expresada en el presente documento puede sustituirse por la similitud de secuencia. El porcentaje de "similitud" se usa para cuantificar la similitud entre dos secuencias del alineamiento. Este método es idéntico para determinar la identidad, excepto que determinados aminoácidos no tienen que ser idénticos para tener una coincidencia. Los aminoácidos se clasifican como coincidencias si se encuentran entre un grupo con propiedades similares de acuerdo con los siguientes grupos de aminoácidos: aromático - F Y W; hidrófobo - A V I L; cargado positivamente: R K H; cargado negativamente - D E; polar - S T N Q.
Las expresiones "vector" o "vector de expresión" se refieren a un ácido nucleico recombinante que contiene una secuencia codificante deseada y secuencias de ácido nucleico apropiadas necesarias para la expresión de la secuencia codificante ligada operativamente en un organismo huésped o sistema de expresión particular, p. ej., celular o libre de células. Las secuencias de ácido nucleico necesarias para la expresión en procariotas por lo general incluyen un promotor, un operador (opcional) y un sitio de unión a ribosoma, a menudo junto con otras secuencias. Se sabe que las células eucariotas utilizan promotores, potenciadores y señales de terminación y poliadenilación.
Los "sistemas de expresión" de proteínas se refieren a sistemas in vivo e in vitro y libres de células. Los sistemas para la expresión de proteínas recombinantes utilizan normalmente células que se transfectan con un vector de expresión de ADN que contiene la plantilla. Las células se cultivan en condiciones tales que traduzcan la proteína deseada. Las proteínas expresadas se extraen para su posterior purificación. Los sistemas de expresión de proteínas in vivo que usan células procariotas y eucariotas son bien conocidos. Asimismo, algunas proteínas se recuperan usando desnaturalizantes y procedimientos de replegamiento de proteínas. Los sistemas de expresión de proteínas in vitro y libres de células normalmente usan extractos de células enteras compatibles con la traducción o composiciones que contienen componentes suficientes para la transcripción, la traducción y, opcionalmente, modificaciones postraduccionales, como la ARN polimerasa, factores proteicos reguladores, factores de transcripción, ribosomas, cofactores de ARNt, aminoácidos y nucleótidos. En presencia de un vector de expresión, estos extractos y componentes pueden sintetizar proteínas de interés. Los sistemas libres de células normalmente no contienen proteasas y permiten el etiquetado de la proteína con aminoácidos modificados. Algunos sistemas libres de células incorporaron componentes codificados para la traducción en el vector de expresión. Véase, p. ej., Shimizu et al., Cellfree translation reconstituted with purified components, 2001, Nat. Biotechnol., 19, 751-755 y Asahara & Chong, Nucleic Acids Research, 2010, 38(13): e141.
En ciertas realizaciones, la divulgación se refiere a los vectores recombinantes que comprenden un ácido nucleico que codifica un polipéptido divulgado en el presente documento o una proteína quimérica del mismo.
En ciertas realizaciones, el vector recombinante comprende opcionalmente un origen de replicación asociado a mamífero, humano, insectos, de virus, bacterias, plásmido bacteriano, levadura o gen tal como un gen o gen retrovírico o LTR, TAR, RRE, PE, SLIP, CRS lentivírico y segmento de nucleótido INS o gen seleccionado entre tat, rev, nef, vif, vpr, vpu y vpx o genes estructurales seleccionados entre gag, pol y env.
En ciertas realizaciones, el vector recombinante comprende opcionalmente un elemento de vector génico (ácido nucleico) como una región marcadora seleccionable, operón lac, un promotor de CMV, un promotor híbrido de B-actina de pollo/potenciador de CMV (CAG), promotor tac, promotor de ARN polimerasa de T7, promotor de ARN polimerasa de SP6, promotor de SV40, secuencia del sitio de entrada al ribosoma interno (IRES), elemento regulador post­ regulador de marmota de acción en cis (WPRE), región de unión al armazón (SAR), repeticiones terminales invertidas (ITR), codificación de etiqueta FLAG, región de codificación de etiqueta c-myc, región de codificación de etiqueta de afinidad metálica, región de codificación de etiqueta de péptido de unión a estreptavidina, región de codificación de etiqueta poliHis, región de codificación de etiqueta HA, región de codificación de etiqueta MBP, región de codificación de etiqueta GST, región de codificación de poliadenilación, una señal de poliA beta globina, una señal de poliadenilación de SV40, origen de replicación de SV40, origen de replicación de Col E1, origen de f1, origen de pBR322 u origen de pUC, sitio de reconocimiento de proteasa TEV, sitio loxP, región de codificación de recombinasa Cre o un sitio de clonación múltiple que tiene 5, 6 o 7 o más sitios de restricción dentro de un segmento continuo de menos de 50 o 60 nucleótidos o que tiene 3 o 4 o más sitios de restricción con un segmento continuo de menos de 20 o 30 nucleótidos.
Un "marcador seleccionable" es un ácido nucleico introducido en un vector recombinante que codifica un polipéptido que confiere un rasgo adecuado para la selección o identificación artificial (gen indicador), p. ej., beta-lactamasa confiere resistencia a antibióticos, lo que permite que un organismo exprese beta-lactamasa para sobrevivir en presencia de antibiótico en un medio de cultivo. Otro ejemplo es la timidina quinasa, que hace que el huésped sea sensible a la selección de ganciclovir. Puede ser un marcador detectable que permite distinguir entre células deseadas y no deseadas en función de la presencia o ausencia de un color esperado. Por ejemplo, el gen lac-z produce una enzima beta-galactosidasa que confiere un color azul en presencia de X-gal (5-bromo-4-cloro-3-indolil-p-D-galactósido). Si la inserción recombinante inactiva el gen lac-z, entonces las colonias resultantes son incoloras. Puede haber uno o más marcadores seleccionables, p. ej., una enzima que puede complementar la incapacidad de un organismo de expresión para sintetizar un compuesto particular requerido para su crecimiento (auxotrófico) y uno capaz de convertir un compuesto en otro que sea tóxico para el crecimiento. URA3, una orotidina-5' fosfato descarboxilasa, es necesaria para la biosíntesis de uracilo y puede complementar a los mutantes de ura3 que son auxotróficos para uracilo. URA3 también convierte el ácido 5-fluoroorótico en el compuesto tóxico 5-fluorouracilo.
Los marcadores seleccionables adicionales contemplados incluyen cualquier gen que imparta resistencia antibacteriana o exprese una proteína fluorescente. Los ejemplos incluyen, pero no se limitan a, los siguientes genes: ampr, camr, tetr, blasticidinr, neor, hygr, abxr, gen de neomicina fosfotransferasa tipo II (nptll), p-glucuronidasa (gus), proteína verde fluorescente (gtf), egfp, yfp, mCherry, p-galactosidasa (lacZ), lacZa, lacZAM15, cloranfenicol acetiltransferasa (cat), fosfatasa alcalina (phoA), luciferasa bacteriana (luxAB), gen de resistencia a bialafos (bar), fosfomanosa isomerasa (pmi), xilosa isomerasa (xylA), arabitol deshidrogenasa (atlD), UDP-glucosa: galactosa-1-fosfato uridiltransferasa (galT), subunidad a de la antranilato sintasa insensible a la retroalimentación (OASA1D), 2-desoxiglucosa (2-DOGR), benciladenina-N-3-glucurónido, treonina desaminasa de E. coli, glutamato 1-semialdehído aminotransferasa (GSA-AT), D-amino acidoxidasa (DAAO), gen de tolerancia a la sal (rstB), proteína similar a la ferredoxina (pflp), gen de trehalosa-6-P sintasa (AtTPS1), lisina racemasa (lyr), dihidrodipicolinato sintasa (dapA), triptófano sintasa beta 1 (AtTSB1), deshalogenasa (dhlA), gen manosa-6-fosfato reductasa (M6PR), higromicina fosfotransferasa (HPT) y D-serina amonialasa (dsdA).
Una "etiqueta" se refiere a un compuesto o composición detectable que se conjuga directa o indirectamente con otra molécula, tal como un anticuerpo o una proteína, para facilitar la detección de esa molécula. Los ejemplos específicos, no limitantes, de etiquetas incluyen etiquetas fluorescentes, enlaces enzimáticos e isótopos radiactivos. En un ejemplo, un "receptor de etiqueta" se refiere a la incorporación de un polipéptido heterólogo en el receptor. Una etiqueta incluye la incorporación de un aminoácido radiomarcado o la unión covalente a un polipéptido de restos biotinilo que pueden detectarse mediante avidina marcada (por ejemplo, estreptavidina que contiene un marcador fluorescente o actividad enzimática que puede detectarse mediante métodos ópticos o colorimétricos). Se conocen en la técnica y pueden usarse diversos métodos de etiquetado de polipéptidos y glucoproteínas. Los ejemplos de etiquetas para polipéptidos incluyen, pero no se limitan a, los siguientes: radioisótopos o radionucleótidos (tales como 35S o 131I), etiquetas fluorescentes (tales como isotiocianato de fluoresceína (FITC), rodamina, fósforos de lantánidos), etiquetas enzimáticas (tales como la peroxidasa de rábano picante, beta-galactosidasa, luciferasa, fosfatasa alcalina), marcadores quimioluminiscentes, grupos biotinilo, epítopos de polipéptidos predeterminados reconocidos por un indicador secundario (tales como secuencias de pares de cremalleras de leucina, sitios de unión para anticuerpos secundarios, dominios de unión a metales, etiquetas de epítopo) o agentes magnéticos, tales como quelatos de gadolinio. En algunas realizaciones, las etiquetas se unen mediante brazos espaciadores de diversas longitudes para reducir el posible impedimento estérico.
En ciertas realizaciones, los ácidos nucleicos divulgados en el presente documento pueden ser parte de cualquier elemento genético (vector) que se pueda suministrar a una célula huésped, p. ej., ADN desnudo, un plásmido, fago, transposón, cósmido, episoma, una proteína en un vehículo de suministro no vírico (p. ej., un transportador basado en lípidos), virus, etc. que transfieren las secuencias portadas sobre los mismos. En ciertas realizaciones, un vector puede ser un vector de virus adenoasociado o virus adenoasociado humano (que contiene genes o secuencias de AAV), p. ej., que tiene secuencias de ácido nucleico derivadas de serotipos o combinaciones de AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9. En ciertas realizaciones, las secuencias de ácido nucleico derivadas de serotipos de AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 pueden ser al menos uno o dos o más genes o fragmentos de genes de más de 1000, 500, 400, 300, 200, 100, 50 o 25 nucleótidos continuos o secuencias de nucleótidos con más de 50, 60, 70, 80, 90, 95 o 99 % de identidad con el gen o fragmento. En ciertas realizaciones, un vector puede ser un vector basado en lentivirus (que contiene genes o secuencias lentivíricos), p. ej., que tiene secuencias de los ácidos nucleicos derivadas de pseudotipos VSVG o GP64 o de ambos. En ciertas realizaciones, las secuencias de los ácidos nucleicos derivadas de los pseudotipos VSVG o GP64 pueden ser al menos uno o dos o más genes o fragmentos de genes de más de 1000, 500, 400, 300, 200, 100, 50 o 25 nucleótidos continuos o secuencias de nucleótidos con más de 50, 60, 70, 80, 90, 95 o 99 % de identidad con el gen o fragmento.
El vector seleccionado puede suministrarse por cualquier método adecuado, incluyendo inyección intravenosa, transducción ex vivo, transfección, electroporación, suministro en liposomas, técnicas de fusión de membranas, microgránulos recubiertos con ADN de alta velocidad, infección vírica y fusión de protoplastos. Se eliminan normalmente los motivos de ADN de CpG porque pueden conducir a la metilación y silenciamiento de genes. Véase Bird, DNA methylation and the frequency of CpG in animal DNA, 1980, Nucleic Acids Res, 8: 1499-1504. La eliminación de CpG también ayuda al vector a evadir la detección inmunitaria, potenciando la seguridad y la eficacia del vector. Véase J Clin Invest. 2013, 123(7):2994-3001, titulado "CpG-depleted adeno-associated virus vectors evade immune detection".
Factores de coagulación de la sangre
El sistema de coagulación de la sangre es una cascada proteolítica. Los factores de coagulación de la sangre están presentes en el plasma como un zimógeno, en otras palabras, en forma inactiva, que al activarse sufre una escisión proteolítica para liberar el factor activo de la molécula precursora. El objetivo final es producir trombina. La trombina convierte el fibrinógeno en fibrina, que forma un coágulo.
El factor X es la primera molécula de la vía común y se activa mediante un complejo de moléculas que contienen el factor IX activado (FIXa), factor VIII, calcio y fosfolípidos que se encuentran sobre la superficie de las plaquetas. El factor VIII es activado por la trombina, y facilita la activación del factor X por FlXa. El factor VIII (FVIII), contiene múltiples dominios (A1-A2-B-ap-A3-C1-C2) y circula en la sangre en forma inactiva unido al factor von Willebrand (VWF). El dominio C2 está implicado en la unión de FVIII a VWF. La trombina escinde el FVIII causando disociación con el VWF, conduciendo, finalmente a la formación de fibrina a través del factor IX (FIX). La hemofilia A congénita está asociada con mutaciones genéticas en el gen FVIII y da como resultado una coagulación alterada debido a niveles de FVIII circulantes inferiores a lo normal. La hemofilia B se asocia de manera similar con mutaciones genéticas en el gen FIX.
Una opción de tratamiento para un paciente diagnosticado con hemofilia A es la administración exógena de FVIII recombinante, a veces denominada terapia de reemplazo de FVIII. En algunos pacientes, esta terapia puede conducir al desarrollo de anticuerpos que se unen a la proteína FVIII administrada. Posteriormente, los conjugados unidos FVIII-anticuerpo, generalmente conocidos como inhibidores, interfieren o retrasan la capacidad de FVIII para causar la coagulación de la sangre. Los autoanticuerpos inhibitorios también se producen a veces espontáneamente en un sujeto que no está genéticamente en riesgo de tener hemofilia, denominada hemofilia adquirida. Los ensayos de anticuerpos inhibitorios se realizan generalmente antes del tratamiento exógeno con FVIII para determinar si la terapia anticoagulante será eficaz.
Históricamente, se ha usado un "ensayo Bethesda" para cuantificar la dosificación inhibitoria de la concentración de anticuerpos de unión a factor VIII. En el ensayo, se preparan diluciones en serie de plasma de un paciente, p. ej., antes de someterse a cirugía, y cada dilución se mezcla con un volumen igual de plasma normal como fuente de FVIII. Después de incubar durante un par de horas, se miden las actividades del factor VIII en cada una de las mezclas diluidas. Tener concentraciones de inhibidor de anticuerpos que evitan la actividad de coagulación de factor VIII después de múltiples diluciones repetidas indica un mayor riesgo de sangrado incontrolado. Se cree que es poco probable que los pacientes con títulos de inhibidores después de aproximadamente diez diluciones respondan a infusiones exógenas de FVIII para detener el sangrado. Un título Bethesda se define como el valor recíproco de la dilución que da como resultado una inhibición del 50 % de la actividad de FVIII presente en el plasma humano normal. Un título Bethesda superior a 10 se considera el umbral de respuesta a la terapia de reemplazo de FVIII.
En ciertas realizaciones, la divulgación se refiere a métodos de inducción de la coagulación de la sangre que comprenden administrar una cantidad eficaz de una proteína recombinante o quimérica divulgada en el presente documento o una partícula vírica o cápside que comprende un vector que comprende un ácido nucleico que codifica un factor de coagulación de la sangre como se divulga en el presente documento a un sujeto que lo necesite.
En ciertas realizaciones, el sujeto es diagnosticado con hemofilia A o hemofilia adquirida o es poco probable que responda a infusiones exógenas de FVIII.
En ciertas realizaciones, la proteína, cápside o vector se administra en combinación con un agente inmunosupresor, p. ej., ciclosporina, tacrolimus, sirolimus, ciclofosfamida, metotrexato, azatioprina, mercaptopurina, fluorouracilo, ácido micofenólico, dactinomicina, fingolimod, anticuerpo o proteína de unión a receptores de linfocitos T, muromonab-CD3, anticuerpo o proteína de unión al receptor de IL-2, basiliximab, daclizumab, IFN-beta recombinante, anticuerpo o proteína de unión a TNF-alfa, infliximab, etanorcept, adalimumab o combinaciones de los mismos.
En ciertas realizaciones, las células modificadas se vuelven a administrar en combinación con irradiación, busulfán y/o globulina anti-timocitos, p. ej., cuando se usa terapia génica lentivírica dirigida a células madre hematopoyéticas.
El tratamiento de pacientes con inhibidores de FVIII también se ha logrado mediante métodos de inducción de tolerancia inmunitaria (ITI) que generalmente implican la infusión diaria de FVIII hasta que disminuyen los niveles de inhibidor/anticuerpo circulante. Sin embargo, un 20-30 % de los pacientes no se vuelven tolerantes después de una terapia de inducción de tolerancia inmunitaria (ITI). La persistencia de los inhibidores de FVIII se asocia con riesgos de morbilidad y mortalidad aumentados. En ciertas realizaciones, la divulgación se refiere a métodos de inducción de tolerancia inmunitaria que comprenden administrar una cantidad eficaz de una proteína recombinante o quimérica divulgada en el presente documento o un vector o una cápside como se divulga en el presente documento a un sujeto que lo necesite.
Transferencia de genes mediada por vectores
En ciertas realizaciones, la divulgación se refiere a métodos para tratar a un sujeto diagnosticado con un rasgo genético que da como resultado la expresión de una proteína no funcional mutada o truncada mediante la administración de una cantidad eficaz de un vector divulgado en el presente documento. En ciertas realizaciones, el vector está configurado para expresar una proteína funcional del hígado. En ciertas realizaciones, el vector está configurado para expresar una proteína en cualquier célula, tal como células madre hematopoyéticas u otros hematocitos in vivo o mediante transducción ex vivo.
Como se usa en el presente documento, el promotor específico de hígado se refiere a las secuencias en la dirección 5' del sitio de inicio de la transcripción de la proteína a producir. Mcintosh et al. notifican un vector rAAV que codifica una variante del factor VIII humano usando un promotor híbrido específico del hígado (PHH). Blood. 2013, 121(17):3335-44. Brown et al. notifican el suministro de un vector vírico adenoasociado dirigido al hígado de un FVIII modificado por bioingeniería. Molecular Therapy, Methods & Clinical Development (2014) 1, 14036.
En ciertas realizaciones, el vector comprende una secuencia de un ácido nucleico vírico de más de 10, 20, 30, 40, 50, 100 o 200 nucleótidos. En ciertas realizaciones, la secuencia de un ácido nucleico vírico es un segmento del virus adenoasociado humano (hAAV) de los serotipos 1, 2, 3B, 4, 5, 6, 7, 8, 9 o combinaciones o variantes de los mismos, que generalmente comprende una repetición terminal invertida de AAV.
El virus adenoasociado (AAV), familia de los parvovirus, es un virus icosaédrico con genomas de ADN lineal monocatenario. El ciclo de vida de AAV incluye una fase latente en la que los genomas de AAV, después de la infección, se integran específicamente en el sitio en los cromosomas del huésped y una fase infecciosa en la que, después de la infección por adenovirus o por virus del herpes simple, los genomas integrados se rescatan, replican y empaquetan posteriormente en virus infecciosos. Las propiedades de no patogenicidad, el amplio intervalo de infectividad del huésped, incluyendo las células que no se dividen, y la posible integración cromosómica específica en el sitio hacen que el AAV sea una herramienta atractiva para la transferencia de genes.
Las secuencias de los ácidos nucleicos y promotores divulgadas en el presente documento son útiles en la producción de vectores rAAV y también son útiles como vectores de suministro antisentido, vectores de terapia génica o vectores de vacuna. En ciertas realizaciones, la divulgación proporciona vectores de suministro de genes y células huésped que contienen las secuencias de los ácidos nucleicos que se divulgan en el presente documento.
En ciertas realizaciones, la divulgación se refiere a partículas de virus, p. ej., cápsides, que contienen las secuencias de los ácidos nucleicos que codifican los promotores y las proteínas divulgados en el presente documento. Las partículas víricas, las cápsides y los vectores recombinantes son útiles en el suministro de un gen heterólogo u otras secuencias de los ácidos nucleicos a una célula diana. Los ácidos nucleicos se pueden utilizar fácilmente en una variedad de sistemas de vectores, cápsides y células huésped. En ciertas realizaciones, los ácidos nucleicos están en vectores contenidos dentro de una cápside que comprende proteínas de protección terminal, incluyendo las proteínas de la cápside de AAV vp1, vp2, vp3 y las regiones hipervariables.
El virus adenoasociado (AAV) tiene un ciclo de vida bifásico que consta de una fase productiva y una latente. En presencia de un virus auxiliar, adenovirus (Ad) o herpesvirus (HSV), el AAV sufre una infección productiva. Al carecer de un virus auxiliar, el AAV infecta de forma latente por integración en el genoma del huésped. El AAV es capaz de experimentar una integración específica de sitio en el genoma humano. La capacidad de integrarse en el sitio específicamente es una de las características atractivas para usar este virus como vector para la terapia génica humana.
Las repeticiones terminales invertidas (ITR) en los AAV son elementos cis usados para la integración dirigida. La integración específica de sitio mediada por AAV tradicional usa las proteínas Rep78/68 de AAV y las ITR que contienen el sitio de unión a Rep (RBS) y AAVS1, que es una secuencia presente en el sitio de integración. Véase Linden et al. (1996) titulado "The recombination signals for adeno-associated virus site-specific integration". Proc Natl Acad Sci USA 93(15):7966-7972.
Los vectores AAV generalmente contienen un casete de expresión transgénica entre las ITR que reemplaza los genes rep y cap. Las partículas del vector se producen por la cotransfección de células con un plásmido que contiene el genoma del vector y una construcción de empaquetamiento/auxiliar que expresa las proteínas rep y cap en trans. Durante la infección, los genomas de los vectores AAV ingresan al núcleo celular y pueden persistir en múltiples estados moleculares. Un resultado común es la conversión del genoma de AAV a un episoma circular de doble cadena mediante síntesis de la segunda cadena o apareamiento con la cadena complementaria.
Las ITR de AAV, y otros componentes de AAV seleccionados descritos en el presente documento, pueden seleccionarse fácilmente entre cualquier serotipo de AAV, incluyendo, sin limitación, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9 y variantes de función de los mismos. Estas ITR u otros componentes de AAV pueden aislarse fácilmente utilizando técnicas disponibles para los expertos en la materia a partir de un serotipo de a Av . Tal AAV puede aislarse u obtenerse de fuentes académicas, comerciales o públicas (p. ej., la Asociación Americana de Cultivo Tipo, Manassas, Va.). Como alternativa, las secuencias de a Av pueden obtenerse a través de medios sintéticos u otros adecuados por referencia a secuencias publicadas tales como las disponibles en la bibliografía o en bases de datos tales como, p. ej., GenBank, PubMed o similares.
En ciertas realizaciones, la presente divulgación proporciona ácidos nucleicos divulgados en el presente documento como proteínas codificadas o en donde los ácidos nucleicos son parte de un casete de expresión o transgén. Véase, p. ej., la publicación de solicitud de patente de EE. UU. 20150139953. En ciertas realizaciones, el casete de expresión se compone de un transgén y secuencias reguladoras, p. ej., un promotor y repeticiones terminales invertidas (ITR) del AVV 5' y 3'. En una realización deseable, se utilizan las ITR del serotipo 2 u 8 del AAV. Sin embargo, se pueden seleccionar ITR de otros serotipos adecuados. Un casete de expresión se empaqueta generalmente en una proteína de la cápside y se suministra a una célula huésped seleccionada.
En ciertas realizaciones, la divulgación proporciona un método para generar un virus adenoasociado (AAV) recombinante que tiene una cápside de serotipo del AAV, o una porción de la misma. Tal método implica el cultivo de una célula huésped que contiene una secuencia del ácido nucleico que codifica una proteína de la cápside del serotipo de virus adenoasociados (AAV); un gen rep funcional; un casete de expresión compuesto por repeticiones terminales invertidas (ITR) de AAV y un transgén; y suficientes funciones auxiliares para permitir el empaquetamiento del casete de expresión en la proteína de la cápside del AAV. Véase, p. ej., la publicación de solicitud de patente de EE. UU.
20150139953.
Los componentes para el cultivo en la célula huésped para empaquetar un casete de expresión de AAV en una cápside de AAV pueden proporcionarse a la célula huésped en trans. Como alternativa, uno cualquiera o más de los componentes (p. ej., casete de expresión, secuencias rep, secuencias cap y/o funciones auxiliares) pueden proporcionarse mediante una célula huésped estable que se ha modificado por ingeniería para contener uno o más de los componentes requeridos utilizando métodos conocidos por los expertos en la materia. Lo más adecuadamente, dicha célula huésped estable contendrá el(los) componente(s) bajo el control de un promotor inducible. Sin embargo, el componente o componentes requeridos pueden estar bajo el control de un promotor constitutivo. En otra alternativa más, una célula huésped estable seleccionada puede contener componente o componentes seleccionados bajo el control de un promotor constitutivo y otros componente o componentes seleccionados bajo el control de uno o más promotores inducibles. Por ejemplo, puede generarse una célula huésped estable que se deriva de células 293 (que contienen funciones E1 auxiliares bajo el control de un promotor constitutivo), pero que contiene las proteínas rep y/o cap bajo el control de promotores inducibles. Un experto en la materia puede generar incluso otras células huésped estables.
La introducción en la célula huésped del vector se puede lograr por cualquier medio conocido en la técnica o como se ha divulgado anteriormente, incluyendo transfección, infección, electroporación, suministro en liposomas, técnicas de fusión de membranas, microgránulos recubiertos con ADN de alta velocidad, infección vírica o fusión de protoplastos, entre otros. Uno o más de los genes adenovíricos pueden integrarse de manera estable en el genoma de la célula huésped, expresarse de manera estable como episomas o expresarse de manera transitoria. Todos los productos génicos pueden expresarse de manera transitoria, en un episoma o integrarse de manera estable, o algunos de los productos génicos pueden expresarse de manera estable mientras que otros se expresan de manera transitoria. Es más, los promotores para cada uno de los genes adenovíricos pueden seleccionarse independientemente de un promotor constitutivo, un promotor inducible o un promotor adenovírico nativo. Los promotores pueden estar regulados por un estado fisiológico específico del organismo o la célula (es decir, por el estado de diferenciación o en células en replicación o quiescentes) o por factores añadidos exógenamente, por ejemplo.
La introducción de las moléculas (como plásmidos o virus) en la célula huésped se puede lograr utilizando técnicas conocidas por el experto en la materia. En una realización preferente, se usan técnicas de transfección convencionales, p. ej., transfección o electroporación con CaPO4, y/o infección por vectores híbridos de adenovirus/AAV en líneas celulares tales como la línea celular de riñón embrionario humano HEK 293 (una línea celular de riñón humano que contiene genes E1 de adenovirus funcionales que proporcionan proteínas E1 de acción en trans).
Un experto en la materia comprenderá fácilmente que las técnicas de AAV pueden adaptarse para su uso en estos y otros sistemas de vectores víricos para el suministro de genes in vitro, ex vivo o in vivo. En ciertas realizaciones, la divulgación contempla el uso de ácidos nucleicos y vectores divulgados en el presente documento en una variedad de sistemas de vectores rAAV y no rAAV. Tales sistemas de vectores pueden incluir, p. ej., lentivirus, retrovirus, poxvirus, virus vaccinia y sistemas adenovíricos, entre otros.
Por ejemplo, en ciertas realizaciones, la divulgación contempla la expresión de FVIII por vectores lentivíricos mediante administración in vivo o transducción ex vivo. Las células CD34+ alogénicas o autólogas pueden aislarse y mezclarse ex vivo con un vector lentivírico que tenga ácidos nucleicos que codifiquen una proteína FVIII divulgada en el presente documento en condiciones tales que el vector lentivírico se integre en los ácidos nucleicos de las células, p. ej., ADN, lo suficiente para producir o permitir la producción de la proteína FVIII codificada. Las células se infunden o se vuelven a infundir en un sujeto, en donde el sujeto recibió opcionalmente un tratamiento mieloablativo, en condiciones tales que las células madre hematopoyéticas o las células o hematocitos resultantes expresan la proteína. Véase Cartier et al. Science. 2009, 326(5954):818-23. Sanber et al. notifican la construcción de líneas celulares de empaquetamiento estables para la producción de vectores lentivíricos clínicos. Sci Rep. 2015, 5:9021. Hu et al. notifican la producción de partículas de vector de virus de inmunodeficiencia humana tipo 1 con replicación defectuosa usando vectores de adenovirus dependientes de auxiliares. Véase Mol Ther Methods Clin Dev. 2015, 2:15004.
Productos terapéuticos
Las proteínas recombinantes o quiméricas y las partículas de los virus, cápsides o vectores que codifican las proteínas que se divulgan en el presente documento pueden suministrarse, p. ej., al hígado a través de la arteria hepática, la vena porta o intravenosamente para producir niveles terapéuticos de proteínas terapéuticas o de factores de coagulación en la sangre. Las proteínas recombinantes o quiméricas y la cápside o el vector se suspende preferentemente en un transportador fisiológicamente compatible, pueden administrarse a un paciente. Un experto en la materia puede seleccionar fácilmente transportadores adecuados a la vista de la indicación. Por ejemplo, un transportador adecuado incluye una solución salina, que puede formularse con una variedad de soluciones tamponantes (p. ej., solución salina tamponada con fosfato). Otros transportadores a modo de ejemplo incluyen solución salina estéril, lactosa, sacarosa, fosfato cálcico, gelatina, dextrano, agar, pectina, aceite de sésamo y agua.
Opcionalmente, las composiciones de la divulgación pueden contener otros excipientes farmacéuticamente aceptables, tales como conservantes o estabilizantes químicos. Conservantes a modo de ejemplo adecuados incluyen clorobutanol, sorbato de potasio, ácido sórbico, dióxido de azufre, galato de propilo, los parabenos, etil vainillina, glicerina, fenol y paraclorofenol. Estabilizantes químicos adecuados incluyen gelatina y albúmina.
Las partículas, cápsides o vectores de virus recombinantes se administran en cantidades suficientes para transfectar las células y proporcionar niveles suficientes de transferencia y expresión génica para proporcionar un beneficio terapéutico sin efectos adversos indebidos, o con efectos fisiológicos médicamente aceptables, que se pueden determinar por los expertos en las materias médicas. Las vías de administración convencional y farmacéuticamente aceptables incluyen, pero no se limitan a, suministro directo a un órgano deseado (p. ej., el hígado (opcionalmente a través de la arteria hepática) o el pulmón), oral, inhalación, intranasal, intratraqueal, intraarterial, intraocular, intravenosa, intramuscular, subcutánea, intradérmica y otras vías de administración parenteral. Las vías de administración pueden combinarse, si se desea.
Las dosificaciones de las proteínas recombinantes o quiméricas y de las partículas, cápsides o vectores víricos dependerán principalmente de factores tales como la afección a tratar, la edad, el peso y la salud del paciente y, por lo tanto, pueden variar entre los pacientes. Por ejemplo, una dosificación de un ser humano terapéuticamente eficaz de la proteína está generalmente en el intervalo de aproximadamente 0,1 ml a aproximadamente 100 ml de solución que contiene concentraciones de aproximadamente 1x109 a 1x1016 genomas, vectores víricos o células modificadas por genes producidas por transducción ex vivo.
Las proteínas terapéuticas codificadas por los ácidos nucleicos (p. ej., operativamente en combinación con los promotores) notificadas en el presente documento incluyen las utilizadas para el tratamiento de la hemofilia, incluida la hemofilia A (incluyendo el factor VIII y sus variantes, tal como la cadena ligera y cadena pesada del heterodímero y con el dominio B eliminado; patente de EE. UU. N.° 6.200.560 y patente de EE. Uu . N.° 6.221.349). El gen del factor VIII codifica 2351 aminoácidos y la proteína tiene seis dominios, designados desde el extremo amino al carboxilo terminal como A1-A2-B-A3-C1-C2 [Wood et al, Nature, 312:330 (1984); Vehar et al., Nature 312:337 (1984); y Toole et al, Nature, 342:337 (1984)]. El factor VIII humano se procesa dentro de la célula para producir un heterodímero que comprende principalmente una cadena pesada que contiene los dominios A1, A2 y B y una cadena ligera que contiene los dominios A3, C1 y C2. Tanto el polipéptido de cadena única como el heterodímero circulan en el plasma como precursores inactivos, hasta que se activan mediante la escisión por trombina entre los dominios A2 y B, que libera el dominio B y da como resultado una cadena pesada que consiste en los dominios A1 y A2. El dominio B se elimina en la forma procoagulante activada de la proteína. Adicionalmente, en la proteína nativa, dos cadenas polipeptídicas ("a" y "b"), que flanquean el dominio B, están unidas a un catión de calcio divalente.
La administración de solamente la cadena defectuosa se contempla en pacientes porque la mayoría de las personas con hemofilia contienen una mutación o eliminación en una sola de las cadenas (p. ej., cadena pesada o ligera). Por tanto, en ciertas realizaciones, la divulgación se refiere a proteínas recombinantes o quiméricas de una cadena ligera que contiene los dominios A3, C1 y C2 o una cadena pesada que consiste en los dominios A1 y A2. En algunas realizaciones, la proteína terapéutica o codificada por los ácidos nucleicos (p. ej., operativamente en combinación con promotores) notificadas en el presente documento comprende la cadena pesada del factor VIII que codifica la secuencia señal de 19 aminoácidos, así como la secuencia de poliadenilación de beta globina humana o la secuencia de poliadenilación de la hormona de crecimiento (hGH). En realizaciones alternativas, los dominios A1 y A2, así como 5 aminoácidos del extremo N-terminal del dominio B y/u 8 aminoácidos del extremo C-terminal del dominio B, así como los dominios A3, C1 y C2. Todavía en otras realizaciones, la proteína o los ácidos nucleicos que codifican el factor VIII es una cadena pesada y una cadena ligera que se proporcionan en una proteína o ácido nucleico único separado por 42 ácidos nucleicos /14 aminoácidos del dominio B. Véase la patente de EE.UU. N.° 6.200.560.
Como se usa en el presente documento, una cantidad terapéuticamente eficaz es una cantidad de proteína o vector que produce cantidades suficientes de factor VIII para disminuir el tiempo que tarda la sangre de un sujeto en coagularse. Por lo general, los hemofílicos graves que tienen menos del 1 % de los niveles normales del factor VIII tienen un tiempo de coagulación de la sangre total de más de 60 minutos en comparación con aproximadamente 10 minutos para los no hemofílicos.
Las proteínas recombinantes o quiméricas o vectores pueden contener una secuencia de aminoácidos o ácido nucleico que codifica fragmentos del factor VIII que en sí mismo no es biológicamente activo, sin embargo, cuando se administra al sujeto mejora o restaura el tiempo de coagulación de la sangre. Por ejemplo, la proteína del factor VIII comprende dos cadenas polipeptídicas: una cadena pesada y una cadena ligera separadas por un dominio B que se escinde durante el procesamiento. La transducción conjunta de células receptoras con las cadenas pesada y ligera del factor VIII conducen a la expresión de factor VIII biológicamente activo. La administración de solamente la cadena defectuosa se contempla en pacientes porque la mayoría de los hemofílicos contienen una mutación o eliminación en una sola de las cadenas (p. ej., cadena pesada o ligera).
Por tanto, en ciertas realizaciones, la divulgación se refiere a vectores divulgados en el presente documento que tienen ácidos nucleicos que codifican una cadena ligera que contiene los dominios A3, C1 y C2 o una cadena pesada que consiste en los dominios A1 y A2.
Factor VIII de coagulación de bioingeniería a través de la reconstrucción de proteínas ancestrales
El desarrollo de terapias transformadoras para la hemofilia A se ha visto obstaculizado por el tamaño, la inestabilidad, la inmunogenicidad y la ineficacia biosintética del factor VIII (FVIII) de coagulación. Mediante el estudio de ortólogos de FVIII de especies de vertebrados existentes, se descubrieron propiedades moleculares, celulares y bioquímicas únicas que pueden superar las limitaciones del FVIII humano. Este enfoque facilitó el desarrollo de FVIII porcino recombinante para la hemofilia A adquirida y ha permitido el mapeo de baja resolución y la bioingeniería de determinantes de secuencia funcional en FVIII humano.
Se construyó un árbol filogenético de FVIII de mamífero con las correspondientes secuencias de nodos ancestrales (An) mediante inferencia bayesiana usando modelos basados tanto en ADN como en aminoácidos en PAML Versión 4.1 (Figura 1). Inicialmente, se seleccionaron 14 secuencias de An de FVIII para su reconstrucción y posterior caracterización molecular, celular, bioquímica e inmunológica. Cada An de FVIII mostró actividad en ensayos de coagulación usando plasma de hemofilia A humano como sustrato, demostrando así la compatibilidad evolutiva de mamíferos. La infusión de preparaciones altamente purificadas de varios An de FVIII en ratones con hemofilia A también corrigió el fenotipo de sangrado después de una prueba de sangrado por sección de la cola que confirma la funcionalidad in vivo.
Para estudiar la eficacia biosintética, se analizaron la actividad del FVIII secretada y los niveles de transcrito de ARNm tras la transfección de plásmidos de An de FVIII en líneas celulares HEK293 y Bh K-M. An-53, ancestro común de roedores y primates, y An-68, ancestro de un subconjunto de roedores actuales, mostraron las eficiencias biosintéticas de FVIII más altas que fueron 12 y 15 veces mayores que las del FVIII humano, respectivamente. Estas dos secuencias de An de FVIII comparten una identidad de aminoácidos del 95 y 87 % con el FVIII humano, respectivamente. Por el contrario, los ancestros intermedios entre An-53 y FVIII humano, designados como An-55, -56 y -57, no muestran una mayor eficiencia biosintética, lo que sugiere que la secuencia funcional determinante de alta expresión se perdió durante la evolución de los primates.
Al probar si los FVIII ancestrales de alta expresión permitirían enfoques de terapia génica, se colocaron ADNc de An-53, An-68 y FVIII humano en un casete de expresión de AAV bajo el control de un promotor dirigido al hígado y el ADN plasmídico resultante se infundió hidrodinámicamente en ratones con hemofilia A. An-53 y An-68, pero no los animales tratados con el vector FVIII humano, alcanzaron niveles de actividad plasmática terapéutica sostenida de FVIII durante 4 semanas (0,1-0,6 UI/ml frente a <0,01 UI/ml, respectivamente). Los An de FVIII recombinantes se expresaron, purificaron y caracterizaron bioquímicamente por SDS-PAGE, actividad específica, descomposición después de la activación de trombina y reconocimiento del inhibidor. El An de FVIII(a) activado por trombina de los primeros mamíferos y todos los linajes de primates mostró semividas de entre 1,5-2,2 min que no se distinguían del FVIII humano.
El FVIIIa murino, porcino y ovino moderno presenta semividas significativamente más largas. An-68 y An-78 muestran semividas prolongadas de 16 y 7 min, respectivamente. Finalmente, se examinó el reconocimiento inmunitario de los An de FVIII mediante un panel de anticuerpos monoclonales murinos inhibidores dirigidos a los dominios A2 y C2, así como plasmas de pacientes con inhibidores de hemofilia A, y se revelaron muchos ejemplos de reactividad reducida, que pueden permitir el desarrollo de productos de FVIII menos inmunogénicos.
Los límites del dominio del factor VIII se refieren a la numeración de la secuencia de aminoácidos de FVIII humano como sigue; residuos 1-19 (secuencia señal), 20-391 (A1), 392-759 (A2), 760-1667 (B), 1668-1708 (ap), 1709-2038 (A3), 2039-2191 (CI) y 2192-2351 (C2). Gitschier et al., Nature, 1984, 312, 326-330. (SEQ ID NO: 1):
1 MQIELSTCFF FCFFRFCFSA TRRYYFGAVE FSWDYMQSDF GEFPVDARFP PRVPKSFPFN
61 TSVVYKKTFF VEFTDHFFNT AKPRPPWMGF FGPTTQAEVY DTVVTTFKNM ASHPVSFHAV
GVSYW KASEG AEYDDQTSQR EKEDDKVFPG GSHTYVWQVF KENGPMASDP FCFTYSYFSH VDLVKDLNSG LIGALLVCRE GSLAKEKTQT LHKFILLFAV FDEGKSWHSE TKNSLMQDRD AASARAWPKM HTVNGYVNRS LPGLIGCHRK SVYWHVIGMG TTPEVHSIFL EGHTFLVRNH
301 RQASLEISPI TFLTAQTLLM DLGQFLLFCH ISSHQHDGME AYVKVDSCPE EPQLRMKNNE EAEDYDDDLT DSEMDVVRFD DDNSPSFIQI RSVAKKHPKT WVHYIAAEEE DWDYAPLVLA
421 PDDRSYKSQY LNNGPQRIGR KYKKVRFMAY TDETFKTREA IQHESGILGP LLYGEVGDTL LIIFKNQASR PYNIYPHGIT DVRPLYSRRL PKGVKHLKDF PILPGEIFKY KWTVTVEDGP TKSDPRCLTR YYS SFVNMER DLASGLIGPL LICYKESVDQ RGNQIMSDKR NVILFSVFDE NRSWYLTENI QRFLPNPAGV QLEDPEFQAS NIMHSINGYV FDSLQLSVCL HEVAYWYILS IGAQTDFLSV FFSGYTFKHK MVYEDTLTLF PFSGETVFMS MENPGLWILG CHNSDFRNRG MTALLKVSSC DKNTGDYYED SYEDISAYLL SKNNAIEPRS FSQNSRHPST RQKQFNATTI
781 PENDIEKTDP WFAHRTPMPK IQNVSSSDLL MLLRQSPTPH GLSLSDLQEA KYETFSDDPS PGAIDSNNSL SEMTHFRPQL HHSGDMVFTP ESGLQLRLNE KLGTTAATEL KKLDFKVSST SNNLISTIPS DNLAAGTDNT SSLGPPSMPV HYDSQLDTTL FGKKSSPLTE SGGPLSLSEE NNDSKLLESG LMNSQESSWG KNVSSTESGR LFKGKRAHGP ALLTKDNALF KVSISLLKTN
1021 KTSNNSATNR KTHIDGPSLL IENSPSVWQN ILESDTEFKK VTPL1HDRML MDKNATALRL NHMSNKTTSS KNMEMVQQKK EGPIPPDAQN PDMSFFKMLF LPESARWIQR THGKNSLNSG QGPSPKQLVS LGPEKSVEGQ NFLSEKNKVV VGKGEFTKDV GLKEMVFPSS RNLFLTNLDN
1201 LHENNTHNQE KKIQEEIEKK ETLIQENVVL PQ1HTVTGTK NFMKNLFLLS TRQNVEGSYD GAYAPVLQDF RSLNDSTNRT KKHTAHFSKK GEEENLEGLG NQTKQIVEKY ACTTRISPNT SQQNFVTQRS KRALKQFRLP LEETELEKRIIVDDTSTQWS KNMKHLTPST LTQIDYNEKE 1381 KGAITQSPLS DCLTRSHSIP QANRSPLPIA KVSSFPSIRPIYLTRVLFQD NSSHLPAASY RKKDSGVQES SHFLQGAKKN NLSLAILTLE MTGDQREVGS LGTSATNSVT YKKVENTVLP
1501 KPDLPKTSGK VELLPKVHIY QKDLFPTETS NGSPGHLDLV EGSLLQGTEG AIKWNEANRP GKVPFLRVAT ESSAKTPSKL LDPLAWDNHY GTQIPKEEWK SQEKSPEKTA FKKKDTILSL
1621 NACESNHAIA AINEGQNKPE IEVTWAKQGR TERLCSQNPP VLKRHQREIT RTTLQSDQEE IDYDDTISVE MKKEDFDIYD EDENQSPRSF QKKTRHYFIA AVERLWDYGM SSSPHVLRNR
1741 AQSGSVPQFK KVVFQEFTDG SFTQPLYRGE LNEHLGLLGP YIRAEVEDNI MVTFRNQASR PYSFYSSLIS YEEDQRQGAE PRKNFVKPNE TKTYFWKVQH HMAPTKDEFD CKAWAYFSDV
1861 DLEKDVHSGLIGPLLVCHTN TLNPAHGRQY TVQEFALFFTIFDETKSWYF TENMERNCRA PCNIQMEDPT FKENYRFHAINGYIMDTLPG LVMAQDQRIR WYLLSMGSNE NIHSIHFSGH VFTVRKKEEY KMALYNLYPG VFETVEMLPS KAGIWRVECL IGEHLHAGMS TLFLVYSNKC QTPLGMASGH IRDFQITASG QYGQWAPKLA RLHYSGSINA WSTKEPFSWI KVDLLAPMII HGIKTQGARQ KFSSLYISQF IIMYSLDGKK WQTYRGNSTG TLMYFFGNYD SSGIKHNIFN
2161 PPIIARYIRL HPTHYSIRST LRMELMGCDL NSCSMPLGME SKAISDAQIT ASSYFTNMFA
TWSPSKARLH LQGRSNAWRP QVNNPKEWLQ VDFQKTMKVT GVTTQGVKSL LTSMYVKEFL ISSSQDGHQW TLFFQNGKVK VFQGNQDSFT PVVNSLDPPL LTRYLR1HPQ SWVHQIALRM 2341 EVLGCEAQDL Y
HSQ es un factor VIII humano con el dominio B eliminado. ET3 es un FVIII híbrido con el dominio B eliminado que contiene dominios humanos y porcinos, es decir, secuencia (A1 y A3 porcino) con un enlazador en el dominio B eliminado. ET3 utiliza una secuencia enlazadora OL derivada de una secuencia porcina de 24 aminoácidos, es decir, la secuencia SFAQNSRPPSASAPKPPVLRRHQR (SEQ ID NO: 246) derivada de la porcina. Tanto HSQ como ET3 contienen la secuencia de reconocimiento RHQR (SEQ ID NO: 245) para la secuencia de procesamiento PACE/furina para el dominio B.
En ciertas realizaciones, la proteína FVIII recombinante o quimérica comprende además una secuencia de aminoácidos enlazadora de entre dos y cincuenta, o dos y veinticinco, o dos y quince aminoácidos entre el dominio A2 y el un dominio de péptido de activación (ap). En ciertas realizaciones, el enlazador comprende RHQR (SEQ ID NO: 245), SRPPSASAPK (SEQ ID NO: 41), o SFAQNSRPPSASAPKPPVLRRHQR (SEQ ID NO: 246).
En ciertas realizaciones, la divulgación se refiere a proteínas FVIII que comprenden una, dos, más, o combinaciones de mutación o mutaciones ancestrales. En ciertas realizaciones, la divulgación se refiere a una proteína FVIII recombinante o quimérica que comprende una o más mutaciones ancestrales en donde opcionalmente se eliminan uno o más aminoácidos en el dominio B y en donde la secuencia no se produce de forma natural.
La secuencia para el nodo número 68 es: SEQ ID NO: 2
MQIALFTCFFLSLFNFCSSATRRYYLGAVELSWNYMQSDLLSVLHTDTRFLPRMPTSFPFNTSIMY
KKTVFYEYMDHLFNIAKPRPPWMGLLGPTIWTEVHDTVVITLKNMASHPVSLHAYGVSYWKAS
EGAEYEDQTSQREKEDDKVFPGESHTYYWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLI
GALLVCKEGSLSKERTQMLHQFYLLFAVFDEGKSWHSETKDSFTQAMDSASTRAWPKMHTYN
GYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLID
LGQFLLF CHIS SHKHDGMEA Y VKVD S CPEEPQW QKKNNEEMEDYDDDLD SEMDMFTLDDDN S
PFIQIRSVAKKYPKTW1HYISAEEEDWDYAPSYLTSDDGSYKSQYLSNGPHRIGRKYKKVRFIAYT
DETFKTRETIQHESGILGPLLY GEYGDTLLIIFKNQASRPYNIYPHGITDV SPLHSRRLPRGIKHVKD
LPIRPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINPERDLASGLIGPLLICYKESVDQRGNQM
MSDKRNVILFSVFDENQSWYITENMQRFLPNAADTQPQDPEFQASNIMHSINGYVFDSLQLTVCL
HEVAYWYILSVGAQTDFLSIFFSGYTFKHKMVYEDTLTLFPFSGETYFMSMENPGLWVLGCHNS
DFRKRGMT ALLKV S S CDKSTSD YYEEIYEDIPTQLVNDNNVIEPRSFF QN SNHPNTRKKKFKATTI
PENDIEKIEPQFGETAEMLKVQSVSSSDLLMLLGQSPTPHGLSLSDNQEAIYEAIPDDHSPDAIDSN
EGPSKVTQLRPELHHSGKIVFTPEPGLQLRSNKNLETTIEVKWKKLDLQVSSLPNNLMTTTILSDN
LTATSEKTDSSGSPDMPVHFSSKLSTTAFGKKSYPLIGSHVPLNISERNSDSNLLDATLMNNQESS
LGDNISSMENDRLLKEKRFHGIALLTKDNTLFKDNISLMKTNKTYNHSTTNGKAHIDSPTSIENST
AVLQDTILKINSEIQEVTSL1HDGTLSGKNTTYLRLNHMLNRTTSSKNKEIFHQKDEDPVPQDTEN
\ ' ■ 'V T"V TnT [ 7T7\ T /\1k r r 'T /“I T
i l i v i r r r IS.1VILY L F t ^ A l N W 1V1KK i 1NU1N INISL1N V Y L l V I L t K S V I M \ r L J > £ M N K V I V
EFTKDTGLKDMVFPSNMSIFLTTLANVQENDMHNQEKNIQEEIEKEALIEEKVVLPQVHIATGSK
NFLKDIFFLGTRQNVSLDEDIYVPVLQDISSINNSTNTVEIHMAHFFKRREDEETNSEGLVNKTRE
MVKNYPSQKNIITQRSKRALGQFRLPLASTQWPQTMNYLTQSIITQIDHSKEGEKSITQSSLSDSS
MIKSTTQTNSSGLHIVKTSAFPPTDLKRIPFQDKFFHVLASSYTYDFKTKSSRIQESSHFLKETKINN
SSLAILPWEMIINQGKFASPGTSNTNSVTYKKLENIVLLKPVLPEESGKVELLPQVS1HEEELLPTE
T ^ n rx p r iH i n i m f f v f t n f t o f ,p i k w k if a f r yac, f ^ f i f t .t t f 'í ^ f f t p ^ f i t n w i a w p n h y a a
QIPKDKWKSKEKSPEITSIKREDTILSLNPHENNHSIVANEKQNWPQREATWVKQGQTQRLCSQN
PPVLKRHQRELSALQSEQEATDYDDSITIETNEDFDIYGEDIKQGPRSFQQKTRHYFIAAVERLWD
YGMSTSPHVLRNRDQSGNAPQFKKVVFQEFTDGSFSQPLYRGELNEHLGLLGPYIRAEVEDNIM
VTFKNQASRPYSFYSSLISYKEDQRQGEEPRRNFVKPNETKIYFWKVQHHMAPTEDEFDCKAWA
YFSDVDLERDMHSGLIGPLLICHTNTLNPAHGRQVAVQEFALFFTIFDETKSWYFTENVERNCKT
PCNIQMEDPTLKENYRFHAINGYVMDTLPGLVMAQDQRIRWYLLSMGSNENIQS1HFSGHVFTV
RKKEEYKMAVYNLYPGVFETVEMLPSRAGIWRVECLIGEHLQAGMSTLFLVYSKQCQIPLGMAS
GSIRDFQITASGHYGQWAPNLARLHHSGSINAWSTKEPFSWIKVDLLTPMI1HGIKTQGARQKFSS
LYISQFIIMYSLDGKKWLSYRGNSTGTLMVFFGNVDSSGIKHNSFNPPIIARYIRLHPTHSSIRSTLR
MELMGCDLNSCSIPLGMENKVISDTQITASSYFTNMFATWSPSQARLHLQGRTNAWRPQYNDPK
EWLQVDLQKTMKVTGIITQGVKSLFTSMFVKEFLISSSQDGHHWTHILHNGKVKVFQGNQDSST
PMVNSLDPPLLTRYLRIHPQIWEHQIALRLEILGCEAQQLY
Por consiguiente, las secuencias para sp-A1-A2-B-aq-A3-C1-C2: (péptido señal, dominio sp, SEQ ID NO: 3) MQIALFTCFFLSLFNFCSS
dominio A1 SEQ ID NO: 4) ATRRYYLGAVELSWNYMQSDLLSVLHTDTRFLPRMPTSFPFNTSIMYKKTVFVEYMDHLFNIAK PRPPWMGLLGPTIWTEVHDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYEDQTSQREKEDD KVFPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLIGALLVCKEGSLSKERTQ
MLHQFVLLFAVFDEGKSWHSETKDSFTQAMDSASTRAWPKMHTVNGYVNRSLPGLIGCHRKSV
YWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLIDLGQFLLFCHISSHKHDGM
EAYVKVDSCPEEPQWQKKNNEEMEDYDDDLDSEMDMFTLDDDNSPFIQIRS
dominio A2 SEQ ID NO: 5)
VAKKYPKTW1HYISAEEEDWDY APS YLTSDDGS Y KS QYLSN GPHRIGRKYKKVRFIAYTDETFK TRETIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVSPLHSRRLPRGIKHVKDLPIRP GEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINPERDLASGLIGPLLICYKESVDQRGNQMMSDK RNVILFSVFDENQSWYITENMQRFLPNAADTQPQDPEFQASNIMHSrNGYVFDSLQLTVCLHEVA YWYILSVGAQTDFLSIFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWYLGCHNSDFRK RGMTALLKVSSCDKSTSDYYEEIYEDIPTQLVNDNNVIEPR
dominio B SEQ ID NO: 6)
SFFQNSNHPNTRKKKFKATTIPENDIEKIEPQFGETAEMLKVQSVSSSDLLMLLGQSPTPHGLSLS DNQEAIYEAIPDDHSPDAIDSNEGPSKVTQLRPELHHSGKIVFTPEPGLQLRSNKNLETTIEVKWK KLDLQYSSLPNNLMTTTILSDNLTATSEKTDSSGSPDMPVHFSSKLSTTAFGKKSYPLIGSHVPLNI SERNSDSNLLDATLMNNQESSLGDNISSMENDRLLKEKRFHGIALLTKDNTLFKDNISLMKTNKT YNHSTTNGKAHIDSPTSIENSTAVLQDTILKINSEIQEVTSLIHDGTLSGKNTTYLRLNHMLNRTTS SKNKEIFHQKDEDPVPQDTENTIMPFFKMLFLPESANWMKRTNGNNSLNSEQGPSPKQLVYLML EKSVKNQNFLSEKNKVIVEQDEFTKDTGLKDMVFPSNMSIFLTTLANVQENDMHNQEKNIQEEIE KEALIEEKVVLPQVHIATGSKNFLKDIFFLGTRQNVSLDEDIYYPVLQDISSINNSTNTVEIHMAHF FKRREDEETNSEGLVNKTREMVKNYPSQKNIITQRSKRALGQFRLPLASTQWPQTMNYLTQSIIT QIDHSKEGEKSITQSSLSDSSMIKSTTQTNSSGLHIVKTSAFPPTDLKRIPFQDKFFHVLASSYTYDF KTKSSRIQESSHFLKETKINNSSLAILPWEMIINQGKFASPGTSNTNSVTYKKLENIVLLKPVLPEES GKVELLPQVS1HEEELLPTETSHGSPGHLDLMKEVFLQKTQGPIKWNKAKRHGESELKGTTESSE KTPSKLLDHLAWDNHYAAQIPKDKWKSKEKSPEITSIKREDTILSLNPHENNHSIVANEKQNWPQ REATWVKQGQTQRLCSQNPPVLKRHQR
dominio de ap SEQ ID NO: 7)
ELSALQSEQEATDYDDSITIETNEDFDIYGEDIKQGPR
dominio A3 SEQ ID NO: 8) SFQQKTRHYFIAAVERLWDYGMSTSPHVLRNRDQSGNAPQFKKVVFQEFTDGSFSQPLYRGELN EHLGLLGPYIRAEVEDNIMVTFKNQ ASRPY SFY SSLISYKEDQRQGEEPRRNFVKPNETKIYFWK
VQHHMAPTEDEFDCKAWAYFSDVDLERDMHSGLIGPLLICHTNTLNPAHGRQVAVQEFALFFTI FDETKSWYFTENVERNCKTPCNIQMEDPTLKENYRFHAINGYVMDTLPGLVMAQDQRIRWYLL SMGSNENIQS1HFSGHVFTVRKKEEYKMAVYNLYPGVFETVEMLPSRAGIWRVECLIGEHLQAG MSTLFLVY SK
dominio C1 SEQ ID NO: 9) QCQIPLGMASGSIRDFQITASGHYGQWAPNLARLHHSGSINAWSTKEPFSWIKVDLLTPMI1HGIK TQGARQKFSSLYISQFIIMYSLDGKKWLSYRGNSTGTLMVFFGNVDSSGIKHNSFNPPIIARYIRLH PTHSSIRSTLRMELMGCDLN
dominio C2 SEQ ID NO: 10)
SCSIPLGMENKVISDTQITASSYFTNMFATWSPSQARLHLQGRTNAWRPQVNDPKEWLQVDLQK
TMKVTGIIT QGVKSFFTSMFVKEFFIS S SQDGHHWTHIFHN GKVKVF QGN QD S STPMVN SFDPPF
LTRYLR1HPQIWEHQIALRLEILGCEAQQLY
La secuencia para el nodo número 54 es: SEQ ID NO: 11
MQIELSTCFFLCLLQFSFSATRRYYLGAVELSWDYMQSDLLSELHVDTRFPPRVPRSFPFNTSVM
YKKTVFVEFTDHLFNIAKPRPPWMGLLGPTIQAEYYDTVVITLKNMASHPV SLHAVGV SYWKAS
EGAEYDDQTSQREKEDDKVFPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGL
IGALLVCREGSLAKERTQTLHKFVLLFAVFDEGKSWHSETKDSLMQDMDSASARAWPKMHTVN
GYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLM
DLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLADSEMDVVRFDDDN
SPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSYLTPDDRSYKSQYLNNGPQRIGRKYKKVRF
MAYTDETFKTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLHSGRLPKG
VKHLKDLPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQ
RGNQMMSDKRNVILFSVFDENRSWYLTENMQRFLPNAAGVQPQDPEFQASNIMHSINGYVFDSL
QLSVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMYYEDTLTLFPFSGETVFMSMENPGLWV
LGCHNSDFRNRGMTALLKVSSCDRNTGDYYEDTYEDISTYLLSENNVIEPRSFSQNSRHPSTRQK
QFKATTIPENDIEKIDPQFGERTQMLKVQSVSSSDLLMLLGQSPTPHGLSLSDLQEATYEAIPDDH
SPGAIDSNEGPSEVAHLRPELHHSGDMVFTPEPGLQLRLNENLGTTIAVELKKLDLKVSSSSNNL
MTSPTIPSDNLAAGTEKTGSLGPPNMPVHFDSQLDTTVFGKKSSPLIGSGVPLSLSERNNDSKLLE
AALMNSQESSLGKNVSSMESDRLFKEKRAHGPALLTKDNALFKYNISLVKTNKTSNNSTTNRKT
HIDGPTLLIEN STSVW QDILESDTEFQEVTSLIHDKMLMDKNTTALRLNHV SNKTTS SKNMEMVFI
QKKEGPVPPDAENPDMSFFKMLFLPESANWIKRTHGKNSLNSGQGPSPKQLISLGSEKSVKDQNF
LSEKNKVVVGEDEFTKDTGLKEMIFPSSRNIFLTNLANVHENDTHNQEKKIQEEIERKETLIQENV
VLPQYYTVTGTKNFMKNLFLLSTRQNVEGLDEGAYAPVLQDTRSLNDSTNRTE1HMAHFSKKRE
EENLEGLGNQTKQMVEKYPSTTRMSPNPSQQNVITQRGKRALKQFRLPLEETELEKGLIVDDTST
QWSKNMKYLTQSTLTQIDYNEKEKKAITQSPLSDCLMRNHSITQTNSSALPIAKVSAFPSIRPTDL
TRVPSQDNSSHLLASAYRKKSSGVQESSHFLQGAKRNNLSLAILTLEMIGNQRKVGSLGTSATNS
VMYKKLENTVLLKPGLPEASGKVELLPKVH1HQKDLFPTETSNGSPGHLDLMEEILLQKTQGAIK
WNKTNRPGKVPFLKGATESSEKTPSKLLGPLAWDNQYATQIPKEEWKSQEKSPENTAFKTKDTI
LSLNPCESNHAIAAINEGQDRPQREATWAKQGGTGRLCSQNPPVLKRHQREITLTTLQSDQEEID
YDDTISIETKREDFDIYGEDENQSPRSFQKKTRHYFIAAVERLWDYGMSRSPHVLRNRAQSGSVP
QFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEE
DQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDMHSGLIGPLLI
CHTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAIN
GYVMDTLPGLVMAQDQRIR^WYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYPGVFET
VEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSKQCQTPLGMASGHIRDFQITASGQYGQWAPK
LARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTY
RGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGME
SKAISDAQITASSYFTNMFATWSPSQARLHLQGRTNAWRPQVNNPKEWLQVDFQKTMKVTGIT
TQGVKSLLTSMYVKEFLISSSQDGHHWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLR1H
PQSWVHQIALRLEVLGCEAQQLY
Por consiguiente, las secuencias para sp-A1-A2-B-aq-A3-C1-C2:
(sp, péptido señal, SEQ ID NO: l2)
MQIELSTCFFLCLLQFSFS
(A l SEQ ID NO: 13)
ATRRYYLGAVELSWDYMQSDLLSELHVDTRFPPRVPRSFPFNTSVMYKKTVFVEFTDHLFNIAK
PRPPWMGLLGPTIQ AEYYDTVVITLKNMA SHP V SLHA V GV SYWKA SEGAEYDD QTS QREKEDD
KVFPGESFITYVWQVLKENGPMASDPPCLTY SYLSHVDLVKDLNSGLIGALLV CREGSLAKERTQ
TLHKFVLLFAVFDEGKSWHSETKDSLMQDMDSASARAWPKMHTVNGYYNRSLPGLIGCHRKS
VYWHVIGMGITPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHD
GMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLADSEMDYVRFDDDNSPSFIQIRS
Figure imgf000019_0001
VAKKHPKTWVF1YIAAEEEDWDYAPSVLTPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETF
KTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLHSGRLPKGVKHLKDLPI
LPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQRGNQMMS
DKRNVILFSVFDENRSWYLTENMQRFLPNAAGVQPQDPEFQASNIMHSINGYVFDSLQLSVCLH
EVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWVLGCHNSD
FRNRGMTALLKVSSCDRNTGDYYEDTYEDISTYLLSENNVIEPR
(B SEQ ID NO: 15) SFSQNSRHPSTRQKQFKATTIPENDIEKIDPQFGERTQMLKVQSVSSSDLLMLLGQSPTPHGLSLS DLQEATYEAIPDDHSPGAIDSNEGPSEVAHLRPELHHSGDMVFTPEPGLQLRLNENLGTTIAVELK KLDLKVSSSSNNLMTSPTIPSDNLAAGTEKTGSLGPPNMPVHFDSQLDTTVFGKKSSPLIGSGVPL SLSERNNDSKLLEAALMNSQESSLGKNVSSMESDRLFKEKRAHGPALLTKDNALFKVNISLVKT
JNR1ISJNJNM I J N K K i m U U J ^ l L L I J i J N i l i V W Q U I L Ü M J l l l ^ Q ü V 1 Í>L1J-LUMVILMURN I 1 A L K L N H V i NKTTSSKNMEMVHQKKEGPVPPDAENPDMSFFKMLFLPESANWIKRTHGKNSLNSGQGPSPKQ LISLGSEKSVKDQNFLSEKNKVVVGEDEFTKDTGLKEMIFPSSRNIFLTNLANVHENDTHNQEKKI QEEIERKETLIQENVVLPQVYTVTGTKNFMKNLFLLSTRQNVEGLDEGAYAPVLQDTRSLNDST NRTE1HMAHFSKKREEENLEGLGNQTKQMVEKYPSTTRMSPNPSQQNV1TQRGKRALKQFRLPL EETELEKGLIVDDTSTQWSKNMKYLTQSTLTQIDYNEKEKKAITQSPLSDCLMRNHSITQTNSSA LPIAKVSAFPSIRPTDLTRVPSQDNSSHLLASAYRKKSSGVQESSHFLQGAKRNNLSLAILTLEMIG NQRKVGSLGTSATNSVMYKKLENTVLLKPGLPEASGKVELLPKVH1HQKDLFPTETSNGSPGHL DLMEEILLQKTQGAIKWNKTNRPGKVPFLKGATESSEKTPSKLLGPLAWDNQYATQIPKEEWKS QEKSPENTAFKTKDTILSLNPCESNHAIAAINEGQDRPQREATWAKQGGTGRLCSQNPPVLKRHQ
R
(ap SEQ ID NO: 16)
EITLTTLQSDQEEIDYDDTISIETKREDFDIYGEDENQSPR
(A3 SEQ ID NO: 17) SFQKKTRHYFIAAVERLWDYGMSRSPHVLRNRAQSGSVPQFKKVVFQEFTDGSFTQPLYRGELN EHLGLLGPYIRAEVEDNIMVTFKNQASRPY SFYSSLISYEEDQRQGAEPRKNFVKPNETKTYFWK
\v/n i4 x x H M » x i a x x P x T i r \ n i y p x~/x c x- n ^ \v rx ia fj a x v w v a x v x x c u c x m -^ v / x m y u u P x v k x ' y n i i i x u x j- x i u c vr ju u x \ v r j . x m ■ / i i j i t v p ^ x h x t x n i t i t x i t _ / i m ax p i a x x u xv r j . x d v m y » r x r v » n x- p /x p l a x t u x f x ft x t x FDETKSWYFTENMERNCRAPCNTQMEDPTFKENYRFHATNGYVMDTLPGLVMAQDQRTRWYLL SMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYPGVFETVEMLPSKAGIWRVECLIGEHLHAG MSTLFLVY SK
(C1 SEQ ID NO: 18) QCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGI KTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRL HPTHY SIRSTLRMELMGCDLN
(C 2 SEQ ID NO: 19)
SC SMPLGMESKAISD AQITAS SYFTNMFATWSP SQ ARLHLQGRTNAWRPQ VNNPKEWLQVDFQ KTMKVTGITTQ GVKSLLTSMYVKEFLIS S S QDGHHWTLFF QNGKVKVF QGN QD SFTPVVNSLDP PLLTRYLR1HPQSWVHQIALRLEVLGCEAQQLY
La secuencia para el nodo número 53 es: SEQ ID NO: 20
MQIELSTCFFLCLLQFSFSATRRYYLGAVELSWDYMQSDLLSELHVDTRFPPRVPRSFPFNTSVM
YKKTVFVEFTDHLFNIAKPRPPWMGLLGPTIRAEYYDTVVITLKNMASHPYSLHAVGVSYWKAS
EGAEYDDQTSQREKEDDKYFPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGL
IGALLVCREGSLAKERTQTLHQFVLLFAVFDEGKSWHSETKDSLTQAMDSASARAWPKMHTVN
GYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLM
DLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLYDSEMDVVRFDDDN
SPPFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSVLTPDDRSYKSQYLNNGPQRIGRKYKKVRF
MAYTDETFKTREAIQYESGILGPLLYGEYGDTLLIIFKNQASRPYNIYPHGITDYSPLHSGRLPKGV
KHLKDLPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQR
GNQMMSDKRNVILFSVFDENRSWYLTENMQRFLPNAAGVQPQDPEFQASNIMHSINGYVFDSL
QLSVCLHEVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWV
LGCHNSDFRNRGMTALLKVSSCDRNTGDYYEDTYEDIPTYLLSENNVIEPRSFSQNSRHPSTRQK
QFKATTIPENDIEKIDPQFGERTQMLKVQSVSSSDLLMLLGQSPTPHGLSLSDLQEATYEAIPDDH
SPGAIDSNEGPSEVAHLRPELFHSGDMVFTPEPGLQLRLNENLGTTIAVELKKLDLKVSSSSNNL
MTSPTIPSDNLAAGTEKTGSLGPPNMPVHFSSQLGTTVFGKKSSPLIGSGVPLNLSERNNDSKLLE
AALMNSQESSLGKNVSSMESDRLFKEKRVHGPALLTKDNALFKVNISLVKTNKTSNNSTTNRKT
HIDGPTLLIEN STSVW QDIILESDTEF QEVTSLIHDEMLMDKNTTALRLNHV SNKTTSSKNMEMV
HQKKEGPVPPDAENPDMSFFKMLFLPESANWIKRTHGKNSLNSGQGPSPKQLISLGSEKSVKDQ
NFLSEKNKVVVGEDEFTKDTGLKEMIFPNSRSIFLTNLANVQENDTHNQEKKFQEEIERKETLIQE
NVVLPQVYTVTGTKNFLKNLFLLSTRQNVEGLDEGTYAPVLQDTRSLNDSTNRAE1HMAHFSKR
REEENLEGLGNQTKQMVEKYPSTTRMSPNPSQQNVITQRGKRALKQFRLPLEETELEKGLIVDDT
STQWSKNMKYLTQSTLTQIDYNEKEKKAITQSPLSDCSMRNHSITQTNSSALPIAKVSAFPSIRPT
DLTKIPSQDNSSHLLASAYSYTFREKSSGVQESSHFLQGAKRNNLSLAILTLEMIRNQEKVGSLGT
SATNSVMYKKLENTVLLKPGLPEASGKVELLPKVHIHQEDLFPTETSNGSPGHLDLMEEILLQKT
QGAIKWNKTNRPGKVPFLKGATESSEKTPSKLLGPLAWDNQYATQIPKEEWKSQEKSPKNTAFK
TKDTILSLNPCENNHAIAAINEGQDRPQREATWAKQGGTGRLCSQNPPYLKRHQREITLTTLQSE
QEEIDYDDTISIETKREDFDrYGEDENQGPRSFQKRTRHYFIAAVERLWDYGMSRSPHVLRNRAQ
SGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSL
ISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDMHSGLI
GPLLICHTNTLNPAHGRQVTYQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYR
FHAINGYYMDTLPGLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYP
GVFETVEMLPSKAGIWRVECLIGEHLHAGMSTLFLVYSKQCQTPLGMASGHIRDFQITASGQYG
QWAPKLARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGK
KWQTYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHY SIRSTLRMELMGCDLNSCSM
PLGMESKAISDAQITASSYFTNMFATWSPSQARLHLQGRTNAWRPQVNNPKEWLQVDFQKTMK
YTGITTQGVKSLLTSMYVKEFLISSSQDGHHWTLFLQNGKVKVFQGNQDSFTPYVNSLDPPLLTR
YLR1HPQSWVHQIALRLEVLGCEAQQLY
Por consiguiente, las secuencias para sp-A1-A2-B-aq-A3-C1-C2:
(sp, péptido señal, SEQ ID NO: 21)
MQIELSTCFFLCLLQFSFS
(A l SEQ ID NO: 22)
ATRRYYLGAVELSWDYMQSDLLSELHVDTRFPPRVPRSFPFNTSVMYKKTVFVEFTDHLFNIAK
PRPPWMGLLGPTIRAEVYDTVVITLKNMASHPVSLHAVGVSYWKASEGAEYDDQTSQREKEDD
KVFPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLIGALLVCREGSLAKEP^TQ
TLHQFVLLFAVFDEGKSWHSETKDSLTQAMDSASARAWPKMHTVNGYVNRSLPGLIGCHRKSV
YWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLGQFLLFCHISSHQHDG
MEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLYDSEMDVVRFDDDNSPPFIQIRS
(A 2 SEQ ID NO: 23)
VAKKHPKTWYHYIAAEEEDWDYAPSVLTPDDRSYKSQYLNNGPQRIGRKYKKVRFMAYTDETF
KTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVSPLHSGRLPKGVKHLKDLPI
LPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQRGNQMMS
DKRNVILF S VFDENRSWYLTENMQRFLPNA AG V QPQDPEF Q ASNIMHSING YVFD S LQLS V CLFI
EVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWVLGCHNS
DFRNRGMTALLKVSSCDRNTGDYYEDTYEDIPTYLLSENNVIEPR
(B SEQ ID NO: 24)
SF SQNSRHP STRQKQFKATTIPENDIEKIDPQFGERTQMLKV Q S VS S SDLLMLLGQSPTPHGLSLS
DLQEATYEAIPDDHSPGAIDSNEGPSEVAHLRPELHHSGDMVFTPEPGLQLRLNENLGTTIAVELK
KLDLKV S S S SNNLMTSPTIPSDNLAAGTEKTGSLGPPNMPVHFS SQLGTTVF GKKS SPLIGSGYPL
NLSERNNDSKLLEAALMNSQESSLGKNVSSMESDRLFKEKRVHGPALLTKDNALFKVNISLVKT
NKTSNNSTTNRKTHIDGPTLLIENSTSVWQDIILESDTEFQEVTSL1HDEMLMDKNTTALRLNHVS
NKTTSSKNMEMVHQKKEGPVPPDAENPDMSFFKMLFLPESANWIKRTHGKNSLNSGQGPSPKQ
LISLGSEKSVKDQNFLSEKNKVVVGEDEFTKDTGLKEMIFPNSRSIFLTNLANVQENDTHNQEKK
FQEEIERKETLIQENVVLPQVYTVTGTKNFLKNLFLLSTRQNVEGLDEGTYAPVLQDTRSLNDST
NRAE1HMAHFSKRREEENLEGLGNQTKQMVEKYPSTTRMSPNPSQQNYITQRGKRALKQFRLPL
EETELEKGLIVDDTSTQWSKNMKYLTQSTLTQIDYNEKEKKAITQSPLSDCSMRNHSITQTNSSA
LPIAKVSAFPSIRPTDLTKIPSQDNSSHLLASAYSYTFREKSSGVQESSHFLQGAKRNNLSLAILTLE
MIRNQEKVGSLGTSATNSVMYKKLENTVLLKPGLPEASGKVELLPKVH1HQEDLFPTETSNGSPG
HLDLMEEILLQKTQGAIKWNKTNRPGKVPFLKGATESSEKTPSKLLGPLAWDNQYATQIPKEEW
KSQEKSPKNTAFKTKDTILSLNPCENNHAIAAINEGQDRPQREATWAKQGGTGRLCSQNPPVLK
RHQR
(ap SEQ ID NO: 25)
EITLTTLQSEQEEIDYDDTISIETKREDFDIYGEDENQGPR
(A 3 SEQ ID N O : 26)
SFQ KR TR H YFIAAVER LW D YG M SR SPHVLR N R AQ SG SVPQ FKKVVFQ EFTD G SFTQ PLYRG ELN
E H LG LLG P Y IR A E V E D N IM V T F K N Q ASRPY SFY S SLISYEEDQ RQ G AEPR KN FVKPN ETKTYFW K
V Q H H M A P TK D E F D C K A W A Y F S D Y D LE K D M H S G LIG P LLIC H T N T LN P A H G R Q Y T V Q E FA LF F T I
F D E T K S W Y FTE N M E R N C R A P C N IQ M E D P TFK E N Y R FH A IN G Y V M D TLP G LV M A Q D Q R IR W Y LL
S M G S N E N IH S IH F S G H Y FTV R K K E E Y K M A V Y N LY P G Y FE TY E M LP S K A G IW R Y E C LIG E H LH A G
M S T LF L V Y SK
(C1 SEQ ID N O : 27)
QCQTPLGMASGHIRDF QITASGQ Y G Q W A P K LA R LH Y SG SIN AW STKEPFSW IKVD LLAPM IIHG I
KTQ G AR Q KFSSLYISQ FIIM YSLD G KKW Q TYR G N STG TLM VFFG N VDSSG IKH NIFNPPIIAR YIR L
HPTH YSIR STLR M ELM G C D LN
(C 2 SEQ ID N O : 28)
SC SM PLG M ESKAISD AQ ITASSYFTN M FATW SPSQ ARLH LQ G RTN AW R PQ VNN PKEW LQ VD FQ
K T M K V T G IT T Q G V K S LLT S M Y V K E F LIS S S Q D G H H W T LFLQ N G K V K V F QGN QD SFTP V V N SLDP
PLLTR YLR IH PQ S W V H Q IA LR LE V LG C E A Q Q LY
La secuencia para el nodo número 50 es: SEQ ID NO: 29. La secuencia para el nodo número 52 es: SEQ ID NO: 30 La secuencia para el nodo número 57 es: SEQ ID NO: 31. La secuencia para el nodo número 59 es: SEQ ID NO: 32 La secuencia para el nodo número 65 es: SEQ ID NO: 33. La secuencia para el nodo número 76 es: SEQ ID NO: 34 La secuencia para el nodo número 78 es: SEQ ID NO: 35. La secuencia para el nodo número 87 es: SEQ ID NO: 36 La secuencia para el nodo número 90 es: SEQ ID NO: 37. La secuencia para el nodo número 95 es: SEQ ID NO: 38.
SEQ ID NO: 29 MRIELPCCFFLCLLPFSFGATRRYYLGAVELSWDYVHSDLLSVLHVPTGFPGRVGRKFPFSTSVR YKKTVFVEFTDHLFTIAKPRPPWMGLLGPTIRAEVYDTVVVTLKNLASHPFSLHAVGVTYWKAS EGAGYDDETSQREKEDDKVDPGKTHTYVWEVLKDNGPTASDPPCLTYSYLSYVDLVKDLNSGL IGALLVCRPGALAKDGTQTLHEFVLLFAVFDEGKSWYPEPNESLTQALDTGTPRPWPKLHTVNG YVNGSLPGLIGCHKRPVYWHVIGLGTTPEVHSIFLEGHTFLYRNHRHATLEISPITFLTAQTLLTDL GRFLLFCHIPAHQHDGMEAYYKVDVCPEEPKLRMRAD APEED YYDDLYDLDMDVIRFDDDDSP PFIGVRAFAKKHPKTW1HYIAAEEVDWDYAPIVPTYLDRSYKSQYLEAGPQRIGRKYKKVRFVA YTDGTFKTRKVIQYDTGILGPLLYGEVGDTLLIVFKNLASRPYNIYPHGLTSVSPLHPGRLPKGVK HLKDLPILPGEIFKYKWTYTYEDGPTGSDPRCLTRYYY SFINPVRDLA SGLIGPLLICYKES VDQR GNQMMSDKRRFILFSVFDENRSWYLTENIQRFCPDAAGVQPQDPEFYASNVMHSINGYVFDNLH LKLCLHEVAYWYVLSVGAQTDFLSVFFSGYTFKHKMVFEDTLTLFPFSGETVFMSMEKPGLWV LGCLNPDFRDRGMWALLKVSSCDRDPGLYYGDDYDLIPTYLLNENNVLEPRGFPKNKRWPRLC LRKFKAVTSPEKDIEKLDPQFGERTQCLRAQPLKFSDLLMLLGQNPDPHGLSLSDLTEATYEPIPY DSFPGPVGNSTGPSEVVHLRPELHHAGDAGFYPEGGLLLFGKERLGPTVAVELKKLDLKLHKSV DNVMFSPTAPLDNLEKGLKGTGTLGPLKEPVRFSGHLGPTVFGKKETGLIGSGVPLQLSDRDHDS RLLERYLLNDEESPLGLNVTSLKPDRPFKDKRVHGPASLTKDNALFKGNITLVKLDKTPDNTTTN RKTYVDGPALLKENGTPVWLDILENDTRFQEVASLGFYETFQDGKLTAPGLDHVLNKTTSSKNG
EVFFEKKVEPVPLDAERPPAPFFKDLFLPRTANWLLDTHGKADLRAGQGPSPKQLISLGSDKSGD GEHFLSAKSKVRLGPDKFTKGTGLLEMIFPGRKDIFLTSLVTYQENDTLILGKKFQEAIERKETLIQ ENVDLPKLYVVAGTRNFLKDLFLLHTRTNLTLDGPDEGDYAPLLQDTRYLNGKVPPAGVHLVH GSKLLEAADLEGLLHKTKRMVLDYPSTTRTAPKPCDQNCITHRGKRALKQFGLPLEETELERGL VDKDRALKGRKNMGYLTGGTLTKIDYNDRAKRLVARPPLVDCTARDHGVTGTDGPAGPIRGVS AFPPIRPTDLTKLPSHDNSSHLPAAACGYTFREKSSGYRGGSHFLQGAKRTSLTSAYLTLKTIRGE EKV S SLGTS ADTPPTYKKLENTVLLKPGLPEVVGKVEGLPKPHYWEADLFPTPTGN GTPGHLDL KEEWLLQKLQGAIKLSKVKRPGDFPFLKGATEILEKRPSKLLGPLPWDGQYLTQILRDEWKLKH KSPKNTVFKTKDAILPLSGCENVHGVDGINEGRDRLQKAATWAKQGGTERLCSREPPVLKNHKR EITLTTLQPEKEKIDYDDYLKPETDRDDFDIYGEDENQGPRTFTGRTRHYFIAAVERLWDYGMSR PPHFLRNRARGGRVPFFKKVVFRGFLDGSFTQPLYRGELDEHLGLLGPYIRAEVDDVIMVTFKNL ASRPYSFYSSEFPYEGGFGQGSEPRKEVVKPGEFRTYFWKVFPHMAPTVDEFDCKAWAYFSDV DLEKDLHSGLVGPFLICRPGTESPAFGRQFTVQEFAFLFTIFDETKSWYFTENMERNCPPPCQIQP DDPDFRRSYRFHAINGYVMDTFPGFVMAQDQRVRWYFFSVGGTED1HSVYFHGHVFTVRKKHE YRMGVYNFYPGVF GTVEMEP SKPGIWRVECEV GEHEQ AGMSTEFEVYDPKCQTPEGEA SGHIR DAQITASGQYGQWAPREAREHYSGSVNAWSTKDPFSWIKVDFFRPMIEHGIKTQGARQKFSSFY ISQFIIFYGLDGKRWKRYRGNATGTLMVFFGNVDATGVKHNRFNPPIIARYIRLHPTHYSIRTTLR MEEIGCDFNSCSMPFGMENKAISDAQITASSYFTNMFATWAPSQAREHFQGRTNAWRPKVNSPK EWFQYDFEKTMRVTGIVTQGAKSEETSMYVKEFEVSSSQDGHRWTPFEQDGKVKVFKGNQDHF TPYYNSFDPPEFTRYFR1HPRRWVHHIAFREEFFGCDAQQFY
SEQ ID NO: 30 MQIELSTCFFLCLLPFSFSATRRYYLGAVELSWDYMQSDLLSELHVDTRFPPRVPRSFPFNTSVMY KKTVFVEFTDHFFNIAKPRPPWMGFFGPTIRAEVYDTVVITFKNMASHPVSFHAVGVSYWKASE GAEYDDQTSQREKEDDKVIPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLIG ALLVCREGSLAKERTQTLHEFVLLFAVFDEGKSWHSETNESLTQAMDSASARAWPKMHTVNGY VNRSLPGLIGCHRKSYYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDL GQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLYDSDMDVVRFDDDNSP PFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSVLTPNDRSYKSQYLNNGPQRIGRKYKKVRFMA YTDETFKTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVSPLHSGRLPKGVKH LKDLPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQRGN QMMSDKRNVILFSYFDENRSWYLTENMQRFLPNAAGVQPQDPEFQASNIMHSINGYVFDSLQLS VCLHEVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWVLG CHNSDFRNRGMTALLKVSSCDRNTGDYYEDTYEDIPTYLLNENNVIEPRSFSQNSRHPSTRQKQF
KATTTPENDIEKIDPQFGERTQLLKVQSVSSSDLLMLLGQSPTPHGLSLSDLQEATYEAIPDDHSP GAIESNEGPSEVAHLRPELHHSGDMVFTPEPGLQLRLNENLGTTITVELKKLDLKVSS SSNNLMTS PTIPSDNLAAGTEKTGSLGPPNMPVHFSSQLGTIVFGKKSSPLIGSGVPLNLSERDNDSKLLEAAL MNSQESSLGKNVSSMESDRLFKEKRVHGPASLTKDNALFKYNISLVKTNKTPNNSTTNRKTHID GPTLLIENSTSVWQDILENDTEFQEVTSL1HDEMFMDKNTTALGLNHVSNKTTSSKNMEMVHQK KEGPVPLDAENPDMSFFKMLFLPDSANWIKRTHGKNSLSSGQGPSPKQLISLGSEKSVKDQNFLS
r'T/\TT/T rí ti 7/ ^ r ' T M ^ r ,'TT7 r \ rm T T/r'n í T r ,m T P T 7 f'TFT t 'x t t a \ ti 7A r ' \ m rr T T \ T A r ' T / T 7 r ' A r ir |T r ' n T 7 r''TT t A r \ t i n . y n i \ v v r c j s j n j s v v v v j m j n r i j v u i v j i ^ j v c i v i i r r i \ 1 i\ v ^ e i \ u í m \ y n j s j v r y i L i LPQVYTVTGTKNFLKNLFLLSTRQNYTVEGLDEGTYAPVLQDTRSLNDSANRAG1HMAHFSKRR EEAETNLEGLGNQTKQMVEKYPSTTRMSPNPSQQNVITQRGKRALKQFRLPLEEIELERGLIVND TSTQWSKNMKYLTQGTLTQIDYNEKEKRAITQSPLSDCSMRNHSITQTNGSALPIAKVSAFPSIRP TDLTKIPSQDNSSHLLASACSYTFREKSSGYQESSHFLQGAKRNNLSLAILTLEMIRGQEKVSSLG TSATNPLMYKKLENTVLLKPGLPEASGKVELLPKYHVHQEDLFPTETSNGSPGHLDLMEEILLQK TQGAIKLNKVNRPGKVPFLKGATESSEKTPSKLLGPLAWDNQYATQIPREEWKSQEKSPKNTAF KTKDTILPLNPCENNHAIAAINEGQDRPQREATWAKQGGTGRLCSQNPPVLKRHQREITLTTLQP EQEKIDYDDTISIETKREDFDIYGEDENQGPRSFQKRTRHYFIAAVERLWDYGMSRSPHALRNRA QSGSVPQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMYTFKNQASRPYSFYS SLISYEEDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDMHS GLIGPLLICRTNTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKEN YRFHAINGYVMDTLPGLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNL YPGVFETVEMLPSKAGIWRVECLIGEHLQAGMSTLFLVYSKQCQTPLGMASGRIRDFQITASGQY GQWAPKLARLHYSGSINAWSTKDPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDG KKWQSYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCS MPLGMESKAISDAQITASSYFTNMFATWSPSQARLHLQGRTNAWRPQVNNPKEWLQVDFQKTM KVTGITTQGVKSLLTSMYVKEFLISSSQDGHHWTLFLQNGKVKYFQGNQDSFTPVVNSLDPPLLT RYLR1HPQSWVHQIALRLEVLGCEAQQLY
SEQ ID NO: 31 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDTRFPPRVPRSFPFNTSVVY KKTVFVEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPVSLHAVGV SYWKASE GAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLI GALLVCREGSLAKEKTQTLHKFVLLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVN GYVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLM DLGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDN SPSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSVLAPDDRSYKSQYLNNGPQRIGRKYKKVRF
MAYTDETFKTREAIQHESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVRPLYSRRLPKGV KHLKDFPILPGEIFKYKWTVTYEDGPTKSDPRCLTRYY S SFINMERDLASGLIGPLLICYKES VDQ RGNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQL SVCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGC HNSDFRNRGMTALLKV S SCDKNTGDYYEDSYEDISTYLLSKNNAIEPRSFSQN SRHPSTRQKQFN ATTIPENDIEKTDPWFAHRTPMPKVQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPG AIDSNNSLSEMTHFRPQLHHSGDMVFTPEPGLQLRLNEKLGTTAATELKKLDFKVSSTSNNLISTI PSDNLAAGTDNTSSLGPPNMPVHYDSQLDTTLFGKKSSPLIESGGPLSLSEENNDSKLLESGLMNS QESSWGKNV SSTESGRLFKEKRAHGPALLTKDNALFKV SISLLKTNKTSNNSATNRKTHIDGPSL LIENSPSVWQNILESDTEFQKVTPL1HDRMLMDKNATALRLNHMSNKTTSSKNMEMVQQKKEG PIPPDAENPDMSFFKMLFLPESANWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQNFLSEKN KVVVGKGEFTKDVGLKEMVFPSSRNLFLTNLDNLHENNTHNQEKKIQEEIERKETLIQENVVLPQ
1HTVTGTKNFMKNLFLLSTRQNVEGSYEGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENL EGLGNQTKQIVEKYPRTTRISPNPSQQNFVTQRGKRALKQFRLPLEETELEKRIIVDDTSTQWSKN MKHLTPSTLTQIDYNEKEKGAITQSPLSDCLTRSHSITQANRSPLPIAKVSSFPSIRPIDLTRVLFQD NSSHLPAPSYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKV ENTVLLKPGLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQETEGAIKWNEANR PGKIPFLRVATESSAKTPSKLLGPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACES NHAIAAINEGQNKPEIEVTWAKQGGTERLCSQNPPVLKRHQREITLTTLQSDQEEIDYDDTISVEM KKEDFDIYDEDENQSPRSFQKKTRHYFIAAVERLWDYGMSSSPHVLRNRAQSGSVPQFKKVVFQ EFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEEDQRQGAEP RKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLYCHTNTLNP AHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLP GLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYPGVFETYEMLPSKA GIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSG SINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTL MVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQI TASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGITTQGVKSLLT SMYVKEFLISSSQDGHHWTLFFQNGKVKYFQGNQDSFTPVVNSLDPPLLTRYLRIHPQSWVHQIA LRMEVLGCEAQELY
SEQ ID NO: 32 MQIELSTCFFLCLLRFCFSATRRYYLGAVELSWDYMQSDLGELPVDARFPPRVPKSFPFNTSVVY KKTVFYEFTDHLFNIAKPRPPWMGLLGPTIQAEVYDTVVITLKNMASHPV SLFIAVGV SYWKASE
GAEYDDQTSQREKEDDKVFPGGSHTYVWQVLKENGPMASDPLCLTYSYLSHVDLVKDLNSGLI GALLVCREGSLAKEKTQTLHKFILLFAVFDEGKSWHSETKNSLMQDRDAASARAWPKMHTVNG YVNRSLPGLIGCHRKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMD LGQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEAEDYDDDLTDSEMDVVRFDDDNS PSFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPLYLAPDDRSYKSQYLNNGPQRIGRKYKKVRFM AYTDETFKTREAIQHESGILGPLLY GEVGDTLLIIFKNQASRPYNIYPHGITDVRPLY SRRLPKGVK HLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINMERDLASGLIGPLLICYKESYDQR GNQIMSDKRNVILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYYFDSLQLS VCLHEVAYWYILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWILGCH NSDFRNRGMTALLKVSSCDKNTGDYYEDSYEDISAYLLSKNNAIEPRSFSQNSRHPSTRQKQFNA TTIPENDIEKTDPWFAHRTPMPKVQNVSSSDLLMLLRQSPTPHGLSLSDLQEAKYETFSDDPSPGA IDSNNSLSEMTHFRPQLHHSGDMVFTPESGLQLRLNEKLGTTAATELKKLDFKYSSTSNNLISTIP SDNLAAGTDNTSSLGPPSMPVHYDSQLDTTLFGKKSSPLTESGGPLSLSEENNDSKLLESGLMNS QESSWGKNVSSTESGRLFKGKRAHGPALLTKDNALFKVSISLLKTNKTSNNSATNRKTHIDGPSL LIENSPSVWQNILESDTEFQKVTPL1HDRMLMDKNATALRLNHMSNKTTSSKNMEMVQQKKEG PIPPDAENPDMSFFKMLFLPESASWIQRTHGKNSLNSGQGPSPKQLVSLGPEKSVEGQNFLSEKN KVVYGKGEFTKDVGLKEMYFPSSRNLFLTNLDNLHENNTHNQEKKIQEEIERKETLIQENYVLPQ
1HTVTGTKNFMKNLFLLSTRQNVEGSYEGAYAPVLQDFRSLNDSTNRTKKHTAHFSKKGEEENL EGLGNQTKQIVEKYACTTRISPNTSQQNFVTQRSKRALKQFRLPLEETELEKRIIVDDTSTQWSKN MKHLTPSTLTQIDYNEKEKGAITQSPLSDCLTRSHSIPQANRSPLPIAKVSSFPSIRPIYLTRVLFQD NSSHLPAASYRKKDSGVQESSHFLQGAKKNNLSLAILTLEMTGDQREVGSLGTSATNSVTYKKV ENTVLPKPGLPKTSGKVELLPKVHIYQKDLFPTETSNGSPGHLDLVEGSLLQETEGAIKWNEANR PGKIPFLRVATESSAKTPSKLLGPLAWDNHYGTQIPKEEWKSQEKSPEKTAFKKKDTILSLNACES NHAIAAINEGQNKPEIEVTWAKQGRTERLCSQNPPVLKRHQREITRTTLQSDQEEIDYDDTISVEM KKEDFDIYDEDEN Q S PRSF QKKTRHYFIA A VERLWDY GM S S SPHVLRNRAQ SGS VPQFKKVVF Q EFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEEDQRQGAEP
T 1 V > 1 i Vs 1 'K > \ X T : v \ n 1 s \ T 1 i 'K 1 > \1 T1_ :/ rr 1 i X s V rr 1 \ r 1 T 17 w \ \ n I V s \ V 7 r Y \ ^ i - l n XX j A x i A v i r \ v x D X T 1 i V/ X n 7 L c X c L n / r V î / , i v r \ v w V t V -T \ V v X r X c n J i ^ / ^ V T X M -/X j X C_,X FVX m-# / V u X X c J r V , JT L X t V^ J X d t l _ t ( i j \ v r r Y * X u X rr X \ 1 > j r Xr í L 1 \ N í Xd AHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGYIMDTLP GLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMALYNLYPGVFETVEMLPSKA GIWRVECLIGEHLHAGMSTLFLVYSNKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYSG SINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQTYRGNSTGTL MVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMESKAISDAQI TASSYFTNMFATWSPSKARLHLQGRSNAWRPQVNNPKEWLQVDFQKTMKVTGITTQGVKSLLT
SMYVKEFLISSSQDGHHWTLFFQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLR1HPQSWVHQIA LRMEVLGCEAQDLY
SEQ ID NO: 33 MQIELSTCFFLCLLQFSFSATRRYYLGAVELSWDYMQSDLLSELHVDTRFPPRMPRSFPFNTSVM YKKTVFVEFTDEILFNIAKPRPPWMGLLGPTIWAEVYDTVVITLKNMASHPV SLHAVGV SYWKA SEGAEYDDQTSQREKEDDKVFPGESHTYYWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSG LIGALLVCREGSLAKERTQMLHQFVLLFAVFDEGKSWHSETKGSLTQAMDSASARAWPKMHTV NGYVNRSLPGLIGCHRKSYYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLL MDLGQFLLF CHIS SHQHDGMEA YVKVD S CPEEPQLRMKNNEEEEDYDDDLLD SEMD VFRFDDD NSPPFIQIRSVAKKHPKTW1HYIAAEEEDWDYAPSVLTSDDRSYKSQYLNNGPQRIGRKYKKVRF MAYTDETFKTRETIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVSPLHSGRLPKGV KHLKDLPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQR GNQMMSDKRNVILFSVFDENRSWYLTENMQRFLPNAAGVQPQDPEFQASNIMHSINGYVFDSL QLSVCLHEVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWV LGCHNSDFRNRGMTALLKVSSCDRNTGDYYEDTYEDIPTYLLSENNVIEPRSFSQNSRHPSTRQK QFKATTIPENDIEKIDPQFGERTQMLKVQSVSSSDLLMLLGQSPTPHGLSLSDLQEATYEAIPDDH SPGAIDSNEGPSEVAFILRPELFFHSGDIVFTPEPGLQLRLNENLGTTIAVELKKLDLKVSSSPNNLM TSPTIPSDNLAAGTEKTGSLGPPNMPVHFSSQLSTTVFGKKSSPLIGSGVPLNLSERNNDSKLLEAA LMNSQESSLGKNVSSMESDRLFKEKRVHGPALLTKDNALFKVNISLIKTNKTSNNSTTNRKTHID GPTLLIENSTSVWQDTILESDTEF QEVTSL1HDEMLMDKNTTALRLNHV SNKTTS SKNMEMVHQ KKEGPVPPDAENPDMSFFKMLFLPESANWIKRTHGKNSLNSGQGPSPKQLISLGSEKSVKDQNFL SEKNKVVVGEDEFTKDTGLKEMIFPNNRSIFLTNLANVQENDTFFNQEKKFQEEIERKEALIQENV VLPQVYTVTGTKNFLKNLFLLSTRQNIGLDEGTYAPVLQDTRSLNDSTNRAE1HMAHFSKRREEE ETNLEGLGNQTKQMVEKYPSTTRMSPNPSQQNVITQRGKRALKQFRLPLEETELEKGLIVDDTST QWSKNMKYLTQSTLTQIDYNEKEKKAITQSPLSDSPMRNHSITQMNSSALPIAKISAFPSIRPTDLT KIPSQDNSSHFLASAYNYTFREKSSGVQESSHFLQGAKRNNLSLAILPLEMIRNQEKYGSLGTSAT NSVMYKKLENTVLLKPGLPEASGKVELLPKVP1HQEDLFPTETSHGSPGHLDLMEEILLQKTQGA IKWNKTNRPGKVPFLKGATESSEKTPSKLLGPLAWDNQYATQIPKEEWKSQEKSPKNTAFKTKD TILSLNPCENNHAIAAINEGQDRPQREATWAKQGGTGRLCSQNPPVLKRHQREITLTTLQSEQEEI DYDDTISIETKREDFDIYGEDENQGPRSFQKRTRHYFIAAVERLWDYGMSRSPHVLRNRDQSGSV PQFKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYK EDQRQGAEPRKNFVKPNETKTYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDMHSGLIGPL LICHTNTLNPAFIGRQVTV QEFALFFTIFDETKSWYFTENMERN CRAPCNIQMEDPTFKENYRFFFA
INGYVMDTLPGLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYPGVF ETVEMLPSKAGIWRVECLIGEHLFFAGMSTLFLVYSKQCQIPLGMASGHIRDFQITASGQYGQWA PKLARLHYSGSINAWSTKEPFSWIKVDLLAPMI1HGIKTQGARQKFSSLYISQFIIMYSLDGKKWQ TYRGNSTGTLMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLG MESKAISDAQITAS S YFTN MFATW SPSQARLHLQGRTN A WRPQ VNN PKEWLQ V DFQKTMKVTG TTTQGVKSLLTSMFVKEFLTSSSQDGHHWTLFLQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRT HPQSWVHQIALRLEVLGCEAQQLY
SEQ ID NO: 34 MQIELSTCFFLCLLPFSFSATRRYYLGAVELSWDYMQSELLSELHVDTRFPPRVPRSFPFNTSVMY KKTVFVEFTDHLFNIAKPRPPWMGLLGPTIRAEVYDTVVITLKNMASHPVSLHAVGVSYWKASE GAEYEDQTSQREKEDDKVIPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLIG ALLVCREGSLAKERTQTLHEFVLLFAVFDEGKSWHSETNESLTQAMDPASARAQPEMHTVNGY VNRSLPGLIGCHKKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDL GQFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLYDSDMDVVRFDDDNSP PFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSVLTPNDRSYKSLYLNNGPQRIGRKYKKVRFMA YTDETFKTREAIQYESGILGPLLYGEYGDTLLIIFKNQASRPYNIYPHGITDVSPLHSGRLPKGYKH LKDMPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNLERDLASGLIGPLLICYKESVDQRG NQMMSDKRNVILFSVFDENRSWYLTENMQRFLPNADGVQPQDPEFQVSNIMHSINGYVFDSLQL SVCLHEVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWVLG CHNSDFRNRGMTALLKVSSCDRNTGDYYEDTYEDIPTSLLNENNVIEPRSFSQNSRHPSTRQKQF KATTTPENDIEKIDPQSGERTQLLKVQSVSSSDLLMLLGQNPTPHGLSLSDLQEATYEADDHLPG AIERNKGPSEVAHLRPELHHSGDRVFTPEPELQLRLNENLGTTITVELKKLDLKISSSSNNLMTSPT IPSDKLAAGTEKTGSLGPPNMPVHFSSQLGTIVFGKNSSHLIGSGVPLGLSEGDNDSKLLEAALMN SQESSLGENVLSMESDRLFKEERVHGPASLTKDNALFKVNISLVKTNKAPINSTTNRKTHIDGPTL LIENSTSVW QDIILESNTEFQEVTSLIHDETFMDKNTTALGLNHV SNKTTS SKNMEMVEIQKKEGP VPLGAENPDTSFFKMLFLPDSANWIKRTHGKNSLSSGQRPSPKQLTSLGSEKSVKDQNFLSEKNK VVVGEDEFTKDTGLKEMIFPNSKSIFLTNLANVQENDTHNQEKKSQEEIERKEKLIQENVVLPQV YTVTGTKNFLKNLFLLSTKQNVEGLDEGTYTPILQDTRSLNDSANRAGIHMAHFSKIREEANLEG LGNQTKQMVEKYPSTTRMSPNPSQQNVITQRGKRALKQFRLPLEEIKLERGVILNDTSTQWSKN MKYLTQGTLTQIEYNEKEKRAITQSLLSDCSMRSHGIIQTNGSALPIAKVSAFPSIRPTDLTKIPSQ DN S SHLLAS ACSYTFRERS SGV QESSHFLQGAKRNNLSLAFLTLEMIRGQEKIS SLGKS ATNPLMY KKLENTVLLKPGLSEASGKVELLPKVHVHQEDSFPTKTSNGSPGHLDLMEEIFLQKTQGPVKLNK VNRPGKVPFLKWATES SEKTP SKLLGPL AWDN QY AT QIPREEWKS QEKSQKNT AFKTKDTILPL DPCENNHSIAAINEGQDKPQREATWAKQGGTGRLC S QNPPVLKRHQREITLTTLQPEEDKIDYDD TFSIETKREDFDIYGEDENQGPRSFQKRTRHYFIAAVERLWDYGMSRSPHALRNRAQSGSVPQFK KVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEEDQR QGAEPRKKFVKPNETKIYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDMHSGLIGPLLICRT NTLNPAHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQMEDPTFKENYRFHAINGY YMDTLPGLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYPGVFETVE MLPSKAGIWRIECLIGEHLQAGMSTLFLVYSKKCQTPLGMASGRIRDFQITASGQYGQWAPKLA RLHYSGSINAWSTKDPFSWIKVDLLAPMI1HSIMTQGARQKFSSLYISQFIIMYSLDGKKWQSYRG N STGTLMVFFGNVD S SGIKHNIFNPPIIARYIRLHPTHY SIRS TLRMELMGCDLN S CS MPLGMENK AISDAQITASSYLNNMFATWSPSQARLHLQGRTNAWRPQVNNPKEWLQVDFQKTMKVTGITTQ GVKSLLTSMYYKEFLISSSQDGHNWTLFLQNGKVKVFQGNQDSFTPYVNSLDPPLLTRYLR1HPQ SW AHQIALRLEVLGCE AQQ LY
SEQ ID NO: 35 MQIELSTCFFLCLLPFSFSAIRRYYLGAVELSWDYMQSELLSELHVDTRFPPRVPRSFPFNTSVMY KKTVFVEFTDQLFNIAKPRPPWMGLLGPTIQAEVYDTYVITLKNMASHPV SLHAVGV SYWKSSE GAEYEDQTSQREKEDDKVIPGKSHTYVWQYLKENGPTASDPPCLTYSYLSHVDLVKDLNSGLIG ALLYCREGSLTKERTQTLHEFVLLFAVFDEGKSWHSGKNESLTQAMDPASARAQPAMHTINGYI NRSLPGLIGCHKKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLMDLG QFLLFCHISSHQHDGMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLYDSDMDVVRFDGDNAPP FIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSVLTSNDRSYKSLYLNNGPQRIGRKYKKVRFIAYT DETFKTREAIQYESGILGPLLY GEV GDTLLIIFKNQASRPYNIYPHGITDY SPLHSGRFPKGVKHLK DMPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNLEKDLASGLIGPLLICYKESVDQRGN QMMSDKRNVILFSVFDENQSWYLTENIQRFLPNADGVQPQDPEFQVSNIMHSINGYVFDSLQLSV CLHEVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLWVLGC HNSDFRNRGMTALLKVYSCDRNTGDYYEDTYEDIPTFLLNENNVIEPRSFSQNSRHPSTRQKQFK ATTTPENDIEKIDPQSGERTQLLKEQSVSSSDLLMLLGQNPTPHGLSLSDLQEARNEADDHLPGAI ERNKGPSEVAHLRPELHHSGERVFTPEPELPLRLNENLGTTITVELKKLDFKISSSSNNLMTSPTIPS DKLSAGTEKTGSLGPPNMPVNFSSQLGTIVFGKNSSHFIGSGVPLGLSEEDNDSKLLEAALMNSQ ESSLGENVLSMESDRLFKEERVHGPASLTKDDALFKVNISLVKTNKAPVNSTTNRKTHIDDPTLLI ENSTSYWQDIILESNTEFQEVTSL1HDETFMDKNTTALGLNHYSNKTTSSKNMEMVHQKKEGPV PLDAEYPDTSFFKTLFLPDSTNWIKRTHGKNSLSSGQRPSPKQLTSSGSEKSVKDQNFLSEKNKVV VGEDEFSKDTGLKEMIFPNSKSIFLTNLANVQENDTHNQEKKSQEEIERKEKLIQENVVLPQVYT VTGTKNFLKNLFLLSTKQNVEGLDEGTYTPVLQDTRSLNDSAKRAG1HMAHFSKIREEANLEGL GNQTKQMVEKYPSTTRMSPNPSQQNVIPQRGKRDLKQFRLPLEEIKLERGVILNDTSTQWSKNM KYLTQGTFTQIEYNKKEKRAITQSFLSDCSMRSHGIIQTNGSALPIAKVSAFPSIRPTDLTKIPSQDN SSHLPASACSYTFGERSSGVQESSHFLQGAKRNNLSLAFLTLEMIRGQGKISTLGKSATNPLMYK KLENTVLLKPGLSEASGKVEFLPKVHVHQEDFFPTKTSNGSPAHLDLREEIFLQKTQGLVKLNKV NRPGKVPFLKWATESSEKTPSKLLGPLAWDNQYATLIPREEWKSLEKSQKNTAFKTKDTILPLDP CENNHSIAAINEGQDKPQREATWVKQGGTGRLCSQNPPVLKRHQREITLTTFQPEEDKIDYDDTF SIETKREDFDIY GEDEN QGPRSFQKRTRHYFIAA VERLWDY GMSRSPHALRNRAQN GD VPQFKK VVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEEDQRQ GAEPRKKFVKPNETKIYFWKYQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLICRTNT LNAAHGRQVTV QEFALFFTIFDETKSWYFTENMERN CRAPCNIQMEDPTFKENYRFHAINGYVM DTLPGLVMAQDQRIRWYLLSMGSNEN1HS1HFSGHVFTVRKKEEYKMAVYNLYPGYFETVEML PSKVGIWRIECLIGEHLQAGMSTLFLVYSKKCQTPLGMASGRIRDFQITASGQYGQWAPKLARLH YSGSrNAWSTKDPFSWIKVDLLAPMI1HSIMTQGARQKFSSLYISQFIIMYSLDGKKWQSYRGNST GTLMVFFGNVDS SGIKHNIFNPPIIARYIRLHPTHY SIRSTLRMELMGCDLNSCSMPLGMENKAIS DAQITASSHLSNMFATWSPSQARLHLQGRTNAWRPQVNNPKEWLQVDFQKTMKVTGITTQGV KSLLTSMYVKEFLISSSQDGHNWTLFLQNGKVKVFQGNQDSFTPVVNALDPPLFTRYLR1HPQS WAHHIALRLEVLGCEAQQLY
SEQ ID NO: 36 MQIELSTCFFLCLLPFSFSATRRYYLGAYELSWDYMQSELLSELHVDTRFSPRVPRSLPFNTSVMY KKTVFVEFTDHLFNIAKPRPPWMGLLGPTIRAEVYDTVVITLKNMASHPVSLHAVGVSYWKASE GAEYEDQTSQKEKEDDKVIPGESHTYVWQVLKENGPMASDPPCLTYSYFSHVDLYKDLNSGLIG ALLVCKEGSLAKERTQTLHEFVLLFAVFDEGKSWHSETNESLTQSAQAQHEMHTVNGYVNRSL PGLTGCHKKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTFLMDLGQFLL F CHIS SHQHDGMEAYVKVDSCPEEPQLRMKNNEEEEDYDDDLYDSDMDV YRFDGDN S SPFIQIR SVAKKHPKTWVHYIAAEEEDWDYAPSAPTPNDRSYKNLYLNNGPQRIGRKYKKYRFMAYTDET FKTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVSPLHSGRLPKGVKHLKDMP ILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQRGNQMMS TIVWIVPA'VVIT 1V T 1TJ_/1 F u Í V T m J. L F/ ■ M J I 1 B 1V CÜ W H V X I J T XF J_M < L 1 N H /X iynXBV X F I I J P I M i 1X A í x n y j A X V T n \^ PJ. H X li n-/ P X F ■ ■ m- I y V Í M LJ1 T 1 M XX» H XX C XU IX M1 1 r \ .J V X U V F X n X-X M X 1 I OT 5 \ V / V n-.J_í TX-T X EVAYWYILSVGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETYFMSMENPGLWVLGCHNS DFRNRGMTALLKVSSCNRNTGDYYEDTYEDIPTSLLNENNVIEPRSFSQNSRHPSTRQKQFKATT TPENDIEKIDPQSGERTQLLKVQSVSSSDLLMLLGQNPTPHGLFLSDLQEATHEADDHLLGAIERN KGPSEYASLRPELHHSGDRVFTPEPELQLRLNENLGTTVTVELKKLDLKISSSSDNLMTSPTIPSDK LAAGTEKTGSLGPPNMSVHFNSHLGTIVFGKNSSHLIESGYPLGLSEGDNDSKLLEAALMNSQES SLGENVLSMESNRLFKEERVHGPASLIKDNALFKVNISLVKTNKAPINSTTNRKTHVDVPTLLIEN STS VW QDIILESNTEFQEVTSLIHNETFMDRNTTALGLNHV SNKTTS SKNVEMVHQKKEGPVPLG AENPDLSFFKILFLPDSANWIKRTHGKNSLSSGQRPSPKQLTSLGSEKSVKDQNFLSEKKVVVGE DEFTKDTGLKEMIFPNSKSIFFTNLANVQENDTYNQEKKSQEEIERKEKLTQENVVLPQVYTYTG TKNFLKNLFLTKQNVTVEGLDEGPYTPILQDTRSLNDSAHRAGIHMAHFSKIREEANLEGLGNQT KQMVERFPSTTRMSPNPSQHNVITQRGKRALKQPRLSLEEIKFERGVILNDTSTQWSKNMNYLTQ GTLTQIEYNEKEKRAITQSLLSDCSMRNHGTIQMNDSALPIAKVSAFPSIRHTDLTKIPSQDNSSHL PASACSYTFRERSSGVQESSHFLQGAKRNNLSLAFLTLEMIRGQGKFSSLGKSATNQPMYKKLEN TVLLKPGLSEASGKYELLPKVHVHQEDSFPTKTSNDSPGHLDLMEKIFLQKTQGPVKLNKVNRP GKVPFLKWATESSEKIPSKLLGPLAWDNHYATQIPREEWKSQKKSQKNTAFKTKDTILPLGPCEN NHSIAAINEGQDKPQREATWAKQGETGRLCSQNPPVSKRHQREITLTTLQPEEDKIEYDDTFSIEM KREDFDIYGEDENQGLRSFQKRTRHYFIAAVERLWDYGMSRSPHALRNRAQSGDVPQFKKVVF QEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEEDQRQGAE PRKKFVNPNETKIYFWKVQHHMAPTKDEFDCKAWAYFSDVDLEKDVHSGLIGPLLICRSNTLNP AHGRQVTVQEFALFFTIFDETKSWYFTENMERNCRAPCNIQKEDPTFKENYRFELA.INGYVMDTL PGLVMAQDQKIRWYLLSMGSNEN1HSIHFSGHVFTVRKKEEYKMAVYNLYPGVFETVEMLPSK VGIWRIECLIGEHLQAGMSTLFLVYSKKCQTPLGMASGHIRDFQITASGQYGQWAPKLARLHYS GSINAWSTKDPFSWIKVDLLAPMIIHSIMTQGARQKFSSLYISQFIIMYSLDGKKWQSYRGNSTGT LMVFFGNVDSSGIKHNIFNPPIIARYIRLHPTHYSIRSTLRMELMGCDLNSCSMPLGMENKAISDA QITASSYLNSMFATWSPSQARLHLQGRTNAWRPQANNPKEWLQVDFQKTMKVTGITTQGVKSL LTSMYVKEFLISSSQDGHNWTLFLQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLR1HPQSWAH QIALRLEVLGCEAQQLY
SEQ ID NO: 37 MQIELSTCFFLCLLPFSFSATRRYYLGTVELSWDYMQSELLSELHVDTRFPPRVPRSFPFNPSVMY KKTVFVEFTDHLFNIAKPRPPWMGLLGPTIRAEVYDTVVITLKNMASHPVSLHAVGVSYWKASE GAEYEDQTSQREKEDDKVIPGESYTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLIG ALLVCREGSLAKERTQTLHEFVLLFAVFDEGKSWHSETNESLTQAMDPASARAQPEMHTVNGY VNRSLPGLIGCHKKSVYWHVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPISFLTAQTLLMDL GQFLLFCHISSHQHDGMEAYYKVDSCPEEPQLRMKNNEEEEDYDDDLYDSDMDVVRFDGDNSP PFIQIRSVAKKHPKTWVHYIAAEEEDWDYAPSVLTPNDRSYKSLYLNNGPQQIGRKYKKARFMA YTDETFKTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITDVSPLHSGRLPKGVKH LKDMPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNLERDLASGLIGPLLICYKESVDQRG NQMMSDKRNVILFSVFDENRSWYLTENMQRFLPNADGVQPQDPEFQVSNIMHSINGYVFDSLQL SY C L H E V A Y W Y IL S V G A Q TD FLS V FFS G Y TFK H K M V Y E D TLTLFP FS G E TV FM S M E N P G LW V LG CHNSDFR N R G M TALLKVSSC N R NTG D YYED TYED IPTSLLNENN VIEPRSFSQ N SR H PSTRQ KQ F K A T TT P E N D V E K ID LR S G E R TQ LLK V Q S V S S S D LLM LLG Q N P TP H A LS LS D LQ E V TY E A D D H LP G TIER N KG PSE VA H LR PELH H SG D R VFTPE PELQ LR LN EN LG TTITV ELKKLD LK ISS SS N N LM IS PTI PSD KLA AG TE KTG S LG P PN M PVH FSS Q LG TIVFG K N S SH LIESA VP LG LSE G D N D S KLIEA ALM N S Q E S S LE E N V LS M E S D R LFK E E R V H G P V S LTK D N A LFK V N FS LV K TN K A P IN S TTN R K TH ID G P TLL IENSTS V W Q D IILESN SGF Q E V T S L IH D E T F M D K N T T A L G L N H V S N K TTS S K N M E M V H Q K K E D P A PLG A EN PD ISFFKM LFLPD SAN W IKR TH C KN SLSSG Q R PSPKQ LTSLG SEKSVKD Q N FLSEKN KV V V G E D E FT K D T G LK E M IFP N S K S IF LT N LA N V Q E N D T H N Q E K N S Q E E IE R K E K LIQ K N V V LP Q V Y T V T G T K N F LK N LF LLS T K Q N V E G LD E G T Y T P ILQ D T R S LN E S A N R A R IH M A H F S K IR E E A N LE G L G N Q TKQ M V EKY PS TTR M S P N P R Q Q N V ITH H G K R A LK Q FR LP Q E E IK LE R G V ILN D TS TQ W S K N M KY LTQ G TLTQ IE Y N E K E K R A ITQ S LLS D C S V R S H G IIQ TN G S A LP IA K V S A FP S IR P TD LTK IP S Q D N SSH LLASAC SYTFR EK SSG IQ ES SH FLQ G AK R N N LS LA FLTLEM IR G Q G K ISS LG K LS EA SG K VELL P K V H V H Q E D S FPTKTS N G SPG H LD LM EE IFLQ K TQ G P VKLN KVN R PG KIP FLKW AA ESS EK TP SK LLG P LA TQ IPR EE W N SQ E K S Q K N K A FK TK D TIS P LD P C E N N H S IA A IN K G Q D K P Q R E A TW A K Q E E TGRLC S QNPP V L K R H Q R Q IT L T T V Q PEED K ID YD D TF STE TKR ED FD IY GEDEN QDPRSFQKRTRH Y F IA A V E R LW D YG M SR SP H A LR N R AQ S G D VP Q FKKV VFQ E FTD G S FTQ PLYR G ELN EH LG LLG P Y IR A E V E D N IM V TFK N Q A S R P Y S FY S S LIS Y E D D Q R Q G A E P R K K FV K P N E TE V Y FW K V Q H H M A P T K D E F D C K A W A Y F S D V D LD K D V H S G LV G P LLIC R A N T LN P A H G R Q V T V Q E F A LF FT IF D E T K S W Y F T E N M E R N C R A P C N IQ M E D P T F K E N Y R FH A IN G Y Y M D T LP G LV M A Q D Q R IR W Y LLS M G S N E N IH S IH F S G H V F T V R K K E E Y K M A V Y N LY P G V F E T V E M LP S K V G IW R IE C LIG E H LQ A G M S T LF LV Y S K K C Q TP LG M A S G H IR D F Q ITA S G Q Y G Q W A P K LA R LH Y S G S IN A W S T K D P F S W IK V D LLA P M IIH SIM TQ G A R Q K FS S LY IS Q FIIM Y S LD G K K W Q S Y R G N S TG TLM V FFG N V D S S G IK H N IFN P P IIA R Y I R LH P T H Y S IR S T LR M E LM G C D LN S C S M P LG M E N K A IA D A Q ITA S S Y LN N M FA TW S P S Q A R LH LQ G R TN A W R P R V N N P K E W LQ V D F Q K T M K Y TG IT T Q G V K S LLT S M Y V K E F LIS S S Q D G H N W T LF LQ N G K V K V F QGN QD SFTP Y V N SLDPPLLTRYLRIFIP Q SW G H Q IA LR LE V LG C E A Q Q LY
SEQ ID NO: 38
M Q IE LS V C FFLC LLPFSFSA TR R Y YLG AV ELSW D Y M Q S D LLSELH VD TR LLPR VP R S FPFN TS VM F K K T V F V E F T D H LF N IA K P R P P W M G L LG P T IR A E V Y D T V IIT LK N M A S H P V SLH A V G V SYW KASE G A E Y D D K T S Q R E K E D D K V IP G E S H TY IW Q V LK E N G P M A S D P P C LTY S Y LS H V D LV K D LN SGLIG A LLV C R E G S LA K E R TQ TLH E FV LLFA V FD E G K S W H S E A N E S LA Q G V D S A S TR P W P K M Y TV N G Y V N R S LP G LIG C H R K S V Y W H V IG M G T T P E V H S IFLE G H T F LV R N H R Q A S LE IS P IT F LT A Q T LLM D L G Q FLLF CHIP SHQ HDG M E A Y V K V D S C PE EPQ LR KKN N EEEED YED D LYD SDM D VLRFDDDNSPP FIQIRSVAKKHPKTW IHYIAAEEEDW DYAPAVLPSTDRSYKSQ YLNNG TQ RIG RKYKKVRFIAYT DETFQTREAIQYESGILGPLLYGEVGDTLLIIFKNQASRPYNIYPHGITNVSPLHSGRLPKGVKHLK DLQIMPGEIFKYKW TVTVEDGPTKSDPRCLTRYYSSFINLERDLASGLIGPLLICYKESVDQRGNQ MMSDKRNVILFSVFDENRSW YLTENMQRFLPNAAGVQPQDPEFQASNMMYSINGYVFDNLQLS VCLHEYAYW YILSVGAQTDFLSVFFSGYTFKHKMVFEDTLTLFPFSGETVFMSMENPGLW VLGC HNSDFRNRGMTALLKVSSCDRNTDDYYEDTYEDIPTYLLNENSYIEPRSFSQNSRHPSPRQKQFK ATTAPENDIEKMDPRFGERTQLLKAQSVSSSDLLMLLGQSPTPHGLSLSDLQEAKYEAIPDDPSPG AIENKEGPSEVAHLRPELHHSEDMVFTPEPGLQLRLNENLETTITEDLKKLDLKVSSSSNNVMTSP ISSSDNLPADTEKTDSLGPLNTPVHFSSQLGTILFGKKSSPLIGSGVPLNLSERDNDSTLLEAALMS SQESSLGKKVSSMESDRLFKEKKVHGPASLTKDNALFKVNISLVKTNKTPNNSTTNRKTHIDGPT LLNENSTSGW Q DILKNDTEFQEVTSLIHNEM FM DKNTTALGLNHVSNKTTSSKDM EM VHQ KKE DPVSLDAENPDMSFFKMLFLPDSANWIKRTHGKNSLSSEQGPSPKQLISLGSENSVKDQNFLSEK NKVAVGEDEFTKDTGFKEMIFPNSKSIFLTNLANVQENDTQNQEKKFQEEIERKETLIQENVGLP QVFPVTGTKNFLKTLFLLSTRQNVTVEGLDEGTYAPVLQDTRSLNDSANRLGLHMAHFSKRREE ANLEGLRNQTKQMVEKYPSPTRMSPNPSQQNAITQRSKRALKQFGPPLEEIELERGLIVNDTSTL QSRNMKYLTQGTLTQIDYNEKEKRAITQSPLSDCSMRNHVITQTNGSALPIAKTSAFPSIRPTDLT KIPSQDNSSHLLSSACNYTFREKSSGVQESSHFLQGAKRNNLSSAILTLDMIRGQEKVISLSATDPL M YKKLENTVLLKPGLPEASGKVELLPKIHVHQ EDPFPTETSNGSPGHLDLM EEILLQKTQGAIKL NKVNRPGKVPFLKGATESSEKTLPKLLGPLAWDNQYATQISREEW QSQEKSPKNTAFNTKDTISP LNPCENNHAIAAINEGQDRLQKEATW AKQGETERLCSENPPVLKHHPREITLTALQQEQEKIDYD DALSIETKREDFDIYGEDENQGPRSFQKKTRHYFIAAVERLW DYGMSKSPHALRNRAQSGSVPQ FKKVVFQEFTDGSFTQPLYRGELNEHLGLLGPYIRAEVEDNIMVTFKNQASRPYSFYSSLISYEED QRQGTEPRKNLVKPNETKTYFW KVQ HHM APTKDEFDCKAW AYFSDVDLEKDLHSG LIG PLLIC RTNTLNPAHGRQLTVQEFALFFTIFDETKSW YFTENMERNCKAPCNIQMEDPTFKKNYRFHAING YVMDTLPG LVM AQ DQ RIRW YLLSM G SNENIHSIHFSG HVFTVRKKEEYKM AVYNLYPG VFETV EMLPSKAGIW RVECLIGEHLQAGMSTLFLVYSKECQTPLGMASGRIRDSQITASGHYGQW APKL ARLHYTGSrNAW STKDPFSW IKVDLLAPMIIFIGIKTQGARQKLS SLYISQFIIM Y SLDGKKWQSYR GNSTGTLMVFFGNVDSSGIKHNIFNPPIIAQYIRLHPTHHSIRSTLRMELMGCDLNSCSMPLGMES KAISDAQITASSYFTNMFATW SPSQARLHLQGRTNAW RPQVNNPKEW LQVDFQKTM KVTGITT QGAKSLLTSMYVKEFLISSSQDGHHW TLFLQNGKVKVFQGNQDSFTPVVNSLDPPLLTRYLRIYP QSWVHQIALRLEVLGCQSQQHY
M QIALFTCFFLSLFNFCSSATRRYYLGAVELSW NYM Q SDLLSVLHTDTRFLPRM PTSFPFNTSIM Y K K T V F V E Y M D H LFN IAKP R PPW M G LLG PTIW TEV H D TVV ITLK N M A SHP V SLHA V GV SYW KA S EG AEYEDQ TSQ REKEDDKVFPG ESHTYVW Q VLKENG PM ASDPPCLTYSYLSHVDLVKDLNSG LI G ALLVC KEG SLSKERTQ M LHQ FVLLFAVFDEG KSW HSETKDSFTQ AM DSASTRAW PKM HTVN G YVN R SLPG LIG CHRKSYYW HVIG M G TTPEVHSIFLEG HTFLVRNHRQ ASLEISPITFLTAQ TLLID LG Q FLLF CHIS SHKHDGM EA Y V K V D S C PEEPQW Q KKN N EEM ED YD D D LD SEM DM FTLDDDN S PFIQ IRSVAKKYPKTW IHYISAEEEDW DYAPSVLTSDDG SYKSQ YLSNG PHRIG RKYKKVRFIAYT DVTFKTRETIQ HESG ILG PLLYG EVG DTLLIIFKNQ ASRPYNIYPHG ITDVSPLHSRRLPRG IKHVK DLPIRPGEIFKYKW TVTVEDGPTKSDPRCLTRYYSSFINPERDLASGLIGPLLICYKESVDQRGNQ M MSDKRNVILFSVFDENQ SW YITENM Q RFLPNAADTQ PQ DPEFQ ASNIM HSING YVFDSLQ LTV CLHEVAYW YILSVG AQ TDFLSIFFSG YTFKHKM VYEDTLTLFPFSG ETVFM SM ENPG LW VLG CH N SD FR KR G M TA LLKV S SCDKSTSDYYEEIYEDIPTQLVNDNNVIEPRSFF QNPPVLKRHQRELSAL Q SEQEATDYDDSITIETNEDFDIYGEDIKQGPRSFQ QKTRHYFIAAVERLW DYGM STSPHVLRNR DQSG NAPQFKKVVFQEFTDGSFSQPLYRGELNEHLGLLGPYIRAEVEDNIM VTFKNQASRPYSFY SSLISYKEDQRQGEEPRRNFVKPNETKIYFW KVQHHMAPTEDEFDCKAW AYFSDVDLERDM HS G LIG PLLICHTNTLNPAHG RQ VAVQ EFALFFTIFDETKSW YFTENVERNCKTPCNIQ M EDPTLKEN YR FH AIN G Y VM D TLPG LVM AQ D Q R IR W YLLSM G SN EN IQ SIH FSG H VFTVR KKEEYKM AVYN L YPG VFETVEM LPSRAG IW RVECLIG EHLQ AG M STLFLVYSKQ CQ IPLG M ASG SIRDFQ ITASG HY G Q W APNLARLHHSG SINAW STKEPFSW IKVDLLTPM IIHG IKTQ G ARQ KFSSLYISQ FIIM YSLDG KKW LSYRG NSTGTLM VFFGNVDSSGIKHNSFNPPIIARYIRLHPTHSSIRSTLRMELM GCDLNSCSI PLG M EN KYISDTQ ITASSYFTNM FATW SPSQ ARLHLQ G RTNAW RPQ VNDPKEW LQ VDLQ KTM K VTG IITQ G YKSLFTSM FVKEFLISSSQ DG HHW THILHNG KVKVFQ G NQ DSSTPM VNSLDPPLLTR YLR IH PQ IW EH Q IALRLEILG C EAQ Q LY
SEQ ID NO: 40
M QIELSTCFFLCLLQFSFSATRRYYLGAVELSW DYM Q SDLLSELHVDTRFPPRVPRSFPFNTSVM YK KTVFV EFTD H LFN IA K P R P P W M G LLG P TIR A E V Y D TV V ITLK N M A S H P Y S LH A V G V S Y W K A S EG AEYDDQ TSQ REKEDDKYFPG ESHTYVW Q YLKENG PM ASDPPCLTYSYLSHVDLVKDLNSG L IG A LLVC R EG SLAKER TQ TLH Q FVLLFAVFD EG KSW H SETKD SLTQ AM D SASAR AW PKM H TVN G YVN R SLPG LIG C H RKSVYW H VIG M G TTPEVH SIFLEG H TFLVRN H R Q ASLEISPITFLTAQ TLLM DLG Q FLLFCH ISSH Q H D G M EAYVKVD SC PEEPQ LR M KN NEEEED YD D DLYD SEM D VVR FDD D N SPPFIQ IRSVAKKH PKTW VHYIAAEEED W D YAPSVLTPDD R SYKSQ YLNN G PQ R IG R KYKKVR F M AYTD VTFKTR EAIQ YESG ILG PLLYG EVG D TLLIIFKN Q ASR PYN IYPH G ITD VSPLH SG R LPKG VKH LKD LPILPG EIFKYKW TVTVED G PTKSD PR C LTR YYSSFIN LER D LASG LIG PLLIC YKESVD Q
R G N Q M M SDKRNVILFSVFDENRSW YLTENM Q RFLPNAAG VQ PQ DPEFQ ASNIM HSING YVFDSL
Q LSVCLH EVAYW YILSVG AQ TD FLSVFFSG YTFKH KM VYED TLTLFPFSG ETVFM SM ENPG LW V
LGCHNSDFRNRG M TALLKVSSCDRNTG DYYEDTYEDIPTYLLSENNVIEPRSFSQ NPPVLKRHQ R
EITLTTLQSEQEEIDYDDTISIETKREDFDIYGEDENQG PRSFQKRTRFIYFIAAVERLW DYGM SRSP
HVLRN R AQ SG SVPQ FKKVVFQ EFTD G SFTQ PLYR G ELN EH LG LLG PYIR AEVED N IM VTFKN Q A
SRPY SFYSSLISYEEDQ RQ G AEPRKNFVKPNETKTYFW KVQ HHM APTKDEFDCKAW AYFSDVD
LEKDM HSG LIG PLLIC HTN TLN PAH G R Q VTVQ EFALFFTIFDETKSW YFTEN M ER N CR APC NIQ M
ED PTFKEN YR FH AIN G YVM D TLPG LVM AQ D Q R IR W YLLSM G SN EN IH SIH FSG H VFTVR KKEEY
KM AVYN LYPG VFETVEM LPSKAG IW R VEC LIG EH LFIAG M STLFLVYSKQ C Q TPLG M ASG H IR D F
Q ITASG Q YG Q W APKLAR LFIYSG SIN AW STKEPFSW IKVDLLAPM IIH G IKTQ G ARQ KFSSLYISQ F
IIM YS LD G KKW Q TYR G N STG TLM VFFG N VD SSG IKH N IFN PPIIAR YIR LH PTH YSIR STLR M ELM
GCDLNSCSM PLG M ESKAISDAQ ITASSYFTNM FATW SPSQ ARLHLQ G RTNAW RPQ VNNPKEW L
Q V D FQ KTM KVTG ITTQ G VKSLLTSM YVKEFLISSSQ D G H H W TLFLQ N G KVKVFQ G N Q D SFTPV
V N S LD PPLLTRYLRIHP Q SW VH Q IALR LE VLG C E AQ QL Y
SEQ ID NO: 42:
MQIALFTCFFLSLFNFCSSATRRYYLGAVELSWNYMQSDLLSVLHTDTRFLPRMPTSFPFNTSIMY
KKTVFVEYM DHLFNIAKPRPPW M G LLGPTIW TEVHDTVVITLKNM ASHPVSLHAVGVSYW KAS
EGAEYEDQTSQREKEDDKVFPGESHTYVWQVLKENGPMASDPPCLTYSYLSHVDLVKDLNSGLI
GALLVCKEGSLSKERTQMLHQFVLLFAVFDEGKSW HSETKDSFTQAMDSASTRAW PKMHTVN
GYVNRSLPGLIGCHRKSYYW HVIGMGTTPEVHSIFLEGHTFLVRNHRQASLEISPITFLTAQTLLID
LGQFLLFCHISSHKHDGMEAYVKVDSCPEEPQWQKKNNEEMEDYDDDLDSEMDMFTLDDDNS
PFIQIRSVAKKHPKTW VHYIAAEEEDW DYAPLVLAPDDRSYKSQYLNNGPQRIGRKYKKVRFM
AYTDVTFKTREAIQHESGILGPLLY GEV G D TLLIIFKN QASRPYNIYPHGITDVRPLYSRRLPKGVK
HLKDFPILPGEIFKYKWTVTVEDGPTKSDPRCLTRYYSSFVNMERDLASGLIGPLLICYKESVDQR
GNQIMSDKRNYILFSVFDENRSWYLTENIQRFLPNPAGVQLEDPEFQASNIMHSINGYVFDSLQLS
VCLHEVAYW YILSIGAQTDFLSVFFSGYTFKHKMVYEDTLTLFPFSGETVFMSMENPGLW ILGCH
NSDFRNRGMTALLKVSSCDKNTGDYYEDSYED1SAYLLSKNNAIEPRSFAQNSRPPSASAPKPPV
LKRHQRELSALQSEQEATDYDDSITIETNEDFDIYGEDIKQGPRSFQQKTRHYFIAAVERLWDYG
MSTSPHVLRNRDQSGNAPQFKKVYFQEFTDGSFSQPLYRGELNEHLGLLGPYIRAEVEDNIMVTF
KNQASRPYSFYSSLISYKEDQRQGEEPRRNFVKPNETKIYFWKVQHHMAPTEDEFDCKAWAYFS
DYDLERDMHSGLIGPLLICHTNTLNPAHGRQVAVQEFALFFTIFDETKSW YFTENVERNCKTPCN
IQMEDPTLKENYRFHAINGYVMDTLPGLVMAQDQRIRW YLLSMGSNENIQSIHFSGHVFTVRKK
EEYKMAVYNLYPGVFETVEMLPSRAGIW RVECLIGEHLQAGMSTLFLVYSKKCQTPLGMASGHI
R D FQ ITASG Q YG Q W A PKLAR LH Y SG S IN AW STKE PFSW IKY D LLAPM IIH G IKTQ G A R Q KFSS LY I
SQ FTIM YSLDG KKW Q TYRG NSTG TLM VFFG NVDSSG IKHNIFNPPITARYTRLHPTFIYSIRSTLRM E
LM G C D LN SCSM PLG M ESKAISD AQ ITASSYFTN M FATW SPSKAR LH LQ G R SN AW R PQ VNN PKE
W LQ V D FQ K TM K VTG V TTQ G V K S LLTS M Y V K E FLIS S S Q D G H Q W TLFFQ N G K V K V FQ G N Q D S FT
PV VN SLD P P LLTR Y LR IH P Q S W V H Q IA LR M E V LG C E A Q D LY
En ciertas realizaciones, la divulgación contempla secuencias recombinantes, quiméricas, de origen no natural que comprenden una o más de las secuencias de cuatro o más aminoácidos continuos que se encuentran en los nodos ancestrales divulgados en el presente documento, p. ej., 68 o 53.
En ciertas realizaciones, el dominio de sp comprende una o más secuencias seleccionadas entre; IALF (SEQ ID NO: 44), FFLS (SEQ ID NO: 45), FLSL (SEQ ID NO: 46), LSLF (SEQ ID NO: 47), SLFN (SEQ ID NO: 48), LFNF (SEQ ID NO: 49), FNFC (SEQ ID NO: 50), NFCS (SEQ ID NO: 51), FCSS (SEQ ID NO: 52), CSSA (SEQ ID NO: 53), SSAT (SEQ ID NO: 54).
En ciertas realizaciones, el dominio A1 comprende una o más secuencias seleccionadas entre; LSWN (SEQ ID NO: 55), WNYM (SEQ ID NO: 56), NYMQ (SEQ ID NO: 57), DLLS (SEQ ID NO: 58), LLSV (SEQ ID NO: 59), LSVL (SEQ ID NO: 60), SVLH (SEQ ID NO: 61), VLHT (SEQ ID NO: 62), LHTD (SEQ ID NO: 63), HTDT (SEQ ID NO: 64), TDTR (SEQ ID NO: 65), TRFL (SEQ ID NO: 66), RFLP (SEQ ID NO: 67), FLPR (SEQ ID NO: 68), LPRM (SEQ ID NO: 69), PRMP (SEQ ID NO: 70), RMPT (SEQ ID NO: 71), PTSF (SEQ ID NO: 72), TSFP (SEQ ID NO: 73), NTSI (SEQ ID NO: 74), TSIM (SEQ ID NO: 75), SIMY (SEQ ID NO: 76), IMYK (SEQ ID NO: 77), MYKK (SEQ ID NO: 78), FVEY (SEQ ID NO: 79), VEYM (SEQ ID NO: 80), EYMD (SEQ ID NO: 81), YMDH (SEQ ID NO: 82), MDHL (SEQ ID NO: 83), DHLF (SEQ ID NO: 84), PTIW (SEQ ID NO: 85), TIWT (SEQ ID NO: 86), IWTE (SEQ ID NO: 87), WTEV (SEQ ID NO: 88), TEVH (SEQ ID NO: 89), EVHD (SEQ ID NO: 90), VHDT (SEQ ID NO: 91), HDTV (SEQ ID NO: 92), FPGE (SEQ ID NO: 93), PGES (SEQ ID NO: 94), GESH (SEQ ID NO: 95), ESHT (SEQ ID NO: 96), LVCK (SEQ ID NO: 97), VCKE (SEQ ID NO: 98), CKEG (SEQ ID NO: 99), GSLS (SEQ ID NO: 100), SLSK (SEQ ID NO: 101), LSKE (SEQ ID NO: 102), SKER (SEQ ID NO: 103), RTQM (SEQ ID NO: 104), TQML (SEQ ID NO: 105), QMLH (SEQ ID NO: 106), MLHQ (SEQ ID NO: 107), LHQF (SEQ ID NO: 108), HQFV (SEQ ID NO: 109), QFVL (SEQ ID NO: 110), KDSF (SEQ ID NO: 111), DSFT (SEQ ID NO: 112), SFTQ (SEQ ID NO: 113), FTQA (SEQ ID NO: 114), TQAM (SEQ ID NO: 115), QAMD (SEQ ID NO: 116), AMDS (SEQ ID NO: 117), MDSA (SEQ ID NO: 118), DSAS (SEQ ID NO: 119), SAST (SEQ ID NO: 120), ASTR (SEQ ID NO: 121), STRA (SEQ ID NO: 122), TRAW (SEQ ID NO: 123), LLID (SEQ ID NO: 124), LIDL (SEQ ID NO: 125), IDLG (SEQ ID NO: 126), SSHK (SEQ ID NO: 127), SHKH (SEQ ID NO: 128), HKHD (SEQ ID NO: 129), KHDG (SEQ ID NO: 130), EPQW (SEQ ID NO: 131), PQWQ (SEQ ID NO: 132), QWQK (SEQ ID NO: 133), WQKK (SEQ ID NO: 134), QKKN (SEQ ID NO: 135), KKNN (SEQ ID NO: 136), NEEM (SEQ ID NO: 137), EEME (SEQ ID NO: 138), EMED (SEQ ID NO: 139), MEDY (SEQ ID NO: 140), DDLD (SEQ ID NO: 141), DLDS (SEQ ID NO: 142), LDSE (SEQ ID NO: 143), EMDM (SEQ ID NO: 144), MDMF (SEQ ID NO: 145), DMFT (SEQ ID NO: 146), MFTL (SEQ ID NO: 147), FTLD (SEQ ID NO: 148), TLDD (SEQ ID NO: 149), LDDD (SEQ ID NO: 150).
En ciertas realizaciones, el dominio de ap comprende una o más secuencias seleccionadas entre; LSAL (SEQ ID NO: 151), SALQ (SEQ ID NO: 152), ALQS (SEQ ID NO: 153), LQSE (SEQ ID NO: 154), QSEQ (SEQ ID NO: 155), SEQE (SEQ ID NO: 156), EQEA (SEQ ID NO: 157), QEAT (SEQ ID NO: 158), EATD (SEQ ID NO: 159), ATDY (SEQ ID NO: 160), TDYD (SEQ ID NO: 161), YDDS (SEQ ID NO: 162), DDSI (SEQ ID NO: 163), DSIT (SEQ ID NO: 164), SITI (SEQ ID NO: 165), ITIE (SEQ ID NO: 166), TIET (SEQ ID NO: 167), IETN (SEQ ID NO: 168), ETNE (SEQ ID NO: 169), TNED (SEQ ID NO: 170), NEDF (SEQ ID NO: 171), DIYG (SEQ ID NO: 172), IYGE (SEQ ID NO: 173), YGED (SEQ ID NO: 174), GEDI (SEQ ID NO: 175), EDIK (SEQ ID NO: 176), DIKQ (SEQ ID NO: 177), IKQG (SEQ ID NO: 178), KQGP (SEQ ID NO: 179), QGPR (SEQ ID NO: 180).
En ciertas realizaciones, el dominio A3 comprende una o más secuencias seleccionadas entre; MSTS (SEQ ID NO: 181), STSP (SEQ ID NO: 182), TSPH (SEQ ID NO: 183), RNRD (SEQ ID NO: 184), NRDQ (SEQ ID NO: 185), RDQS (SEQ ID NO: 186), DQSG (SEQ ID NO: 187), QSGN (SEQ ID NO: 188), SGNA (SEQ ID NO: 189), GNAP (SEQ ID NO: 190), NAPQ (SEQ ID NO: 191), APQF (SEQ ID NO: 192), GSFS (SEQ ID NO: 193), SFSQ (SEQ ID NO: 194), FSQP (SEQ ID NO: 195), SQPL (SEQ ID NO: 196), ISYK (SEQ ID NO: 197), SYKE (SEQ ID NO: 198), YKED (SEQ ID NO: 199), KEDQ (SEQ ID NO: 200), RQGE (SEQ ID NO: 201), QGEE (SEQ ID NO: 202), GEEP (SEQ ID NO: 203), EEPR (SEQ ID NO: 204), EPRR (SEQ ID NO: 205), PRRN (SEQ ID NO: 206), RRNF (SEQ ID NO: 207), RNFV (SEQ ID NO: 208), ETKI (SEQ ID NO: 209), TKIY (SEQ ID NO: 210), KIYF (SEQ ID NO: 211), IYFW (SEQ ID NO: 212), DLER (SEQ ID NO: 213), LERD (SEQ ID NO: 214), ERDM (SEQ ID NO: 215), RDMH (SEQ ID NO: 216), DMHS (SEQ ID NO: 217), MHSG (SEQ ID NO: 218), LICH (SEQ ID NO: 219), ICHT (SEQ ID NO: 220), CHTN (SEQ ID NO: 221), HTNT (SEQ ID NO: 222), TNTL (SEQ ID NO: 223), TLNP (SEQ ID NO: 224), LNPA (SEQ ID NO: 225), NPAH (SEQ ID NO: 226), PAHG (SEQ ID NO: 227), RQVA (SEQ ID NO: 228), QVAV (SEQ ID NO: 229), AVQ (SEQ ID NO: 230), AVQE (SEQ ID NO: 231), RNCK (SEQ ID NO: 232), NCKT (SEQ ID NO: 233), CKTP (SEQ ID NO: 234), KTPC (SEQ ID NO: 235), TPCN (SEQ ID NO: 236), ENIQ (SEQ ID NO: 237), NIQS (SEQ ID NO: 238), IQSI (SEQ ID NO: 239), QSIH (SEQ ID NO: 240), LPSR (SEQ ID NO: 241), PSRA (SEQ ID NO: 242), SRAG (SEQ ID NO: 243), RAGI (SEQ ID NO: 244).
En ciertas realizaciones, la proteína recombinante o quimérica comprende una o más de las secuencias que se encuentran que son únicas en los nodos ancestrales 53 seleccionados entre el dominio de sp, CLLQ (SEQ ID NO: 247), LLQF (SEQ ID NO: 248), LQFS (SEQ ID NO: 249), QFSF (SEQ ID NO: 250). En el dominio A1 LLSE (SEQ ID NO: 251), LSEL (SEQ ID NO: 252), ELHV (SEQ ID NO: 253), RVPR (SEQ ID NO: 254), VPRS (SEQ ID NO: 255), PTIR (SEQ ID NO: 256), TIRA (SEQ ID NO: 257), IRAE (SEQ ID NO: 258), NEEE (SEQ ID NO: 259), EEED (SEQ ID NO: 260), CDRN (SEQ ID NO: 261), EDTY (SEQ ID NO: 262), PTYL (SEQ ID NO: 263), LSEN (SEQ ID NO: 264). En el dominio de péptido de activación, ITLT (SEQ ID NO: 265), SIET (SEQ ID NO: 266), IETK (SEQ ID NO: 267), ETKR (SEQ ID NO: 268), TKRE (SEQ ID NO: 269), KRED (SEQ ID NO: 270), REDF (SEQ ID NO: 271), QKRT (SEQ ID NO: 272). En el dominio A3, VEQL (SEQ ID NO: 273), EGLW (SEQ ID NO: 274), GMSR (SEQ ID NO: 275), MSRS (SEQ ID NO: 276), SRSP (SEQ ID NO: 277).
Reconstrucción de proteínas ancestrales
La FDA aprobó el FVIII porcino recombinante para el tratamiento de pacientes con hemofilia A que han desarrollado una respuesta autoinmunitaria al FVIII endógeno. El FVIII porcino muestra una reducción de la reactividad cruzada hacia los inhibidores de anticuerpos desarrollados contra el FVIII humano. Es deseable encontrar secuencias de FVIII que tengan una actividad mejorada ya que es posible que la frecuencia de la infusión se reduzca mientras se logra una profilaxis completa. El FVIII murino (mFVIII) ha mostrado la semivida más larga observada después de la activación.
Se construyó un árbol filogenético basado en secuencias de FVIII ortólogas conocidas. Las secuencias ancestrales de FVIII se reconstruyeron y expresaron en múltiples líneas celulares. Las secuencias ancestrales de FVIII produjeron proteínas funcionales que formaron complejos con factores de coagulación humanos. Una secuencia para el ancestro común de primates y roedores demuestra una mayor biosíntesis/secreción que los primates más evolucionados. Varias secuencias ancestrales de FVIII se expresan a niveles mayores que las de FVIII humano en sistemas de expresión transitorios y recombinantes.
Se produjeron proteínas recombinantes con el dominio B eliminado.
La secuencia con el dominio B eliminado para el nodo número 68 que tiene la mutación E434V es: SEQ ID NO: 39
M Q IALFTCFFLSLFN FC SS ATR R Y YLG AV ELSW N Y M Q SD LLSV LH TD TR FLP R M P TS FPFN TSIM Y
K K T V F V E Y M D H LF N IA K P R P P W M G LLG P T IW T E Y H D T V Y IT LK N M A S H P V S LH A V G V SYW KAS
EG AEY ED Q TSQ R E KE D D KV FPG E SH TYV W Q V LK EN G PM AS D P PC LTY SY LSH V D LVK D LN SG LI
G A LLVC KE G SLSK ER TQ M LH Q FV LLFA V FD E G K S W H S E TK D S FTQ A M D S A S TR A W P K M H TV N
G Y VN R SLP G LIG C H R K SV Y W H V IG M G TTP E V H S IFLE G H TFLY R N H R Q A S LE IS P ITFLTA Q TLLID
LG Q FLLFC H IS S H K H D G M EA YVK VD SC P EEP Q W Q KKN N EE M E D Y D D D LD S EM D M FTLD D D N S
P F IQ IR S V A K K Y P K T W IH Y IS A E E E D W D Y A P S V LT S D D G S Y K S Q Y LS N G P H R IG R K Y K K V R F IA Y T
DV [mutación E434V]
T F K T R E T IQ H E S G ILG P LLY G E V G D T LL IIF K N Q A S R P Y N IY P H G IT D V S P LH S R R LP R G IK H V K D LP
IR P G E IFK Y K W TV TV E D G P T K S D P R C LT R Y Y S S F IN P E R D LA S G LIG P LLIC Y K E S V D Q R G N Q M M S
D K R N V ILF S V F D E N Q S W Y IT E N M Q R FLP N A A D TQ P Q D P E F Q A S N IM H S IN G Y V FD S LQ LT V C LH E
V A Y W Y ILS V G A Q T D F LS IF F S G Y T F K H K M V Y E D T LT LF P F S G E T Y F M S M E N P G LW V LG C H N S D F
RKRGMTALLKVSSCDKSTSDYYEEIYEDIPTQ ^ LVNDNNVIEPRSFFQ ^ N [ r el .. imi . naci . ó , n d . el . d . omi . ni . o D B 1 ]
PP VLKR H Q R ELSALQ SEQ EATD YD D SITIETN ED FD IYG ED IKQ G PR SFQ Q KTR H YFIAAVER LW D
YG M STSPH VLR NR D Q SG N APQ FKKVVFQ EFTD G SFSQ PLYR G ELN EH LG LLG PYIR AEVEDN IM
VTFKN Q ASR PY SFY SS LISYKED Q R Q G EEPR R N FVKPN ETKIYFW KVQ H H M APTED EFD C KAW A
YFS D V D LER D M H S G LIG P LLIC H TN TLN P A H G R Q V A V Q E FA LFFTIFD E TK S W Y FTE N V E R N C K T
PC N IQ M ED PTLKEN YR FELAIN G YYM D TLPG LVM AQ D Q R IR W YLLSM G SN EN IQ SIH FSG H YFTY
R K K E E Y K M A V Y N LY P G V FE TV E M LP S R A G IW R V E C LIG E H LQ A G M S TLFLV Y S K Q C Q IP LG M A S
G S IR D FQ ITASG H YG Q W APN LAR LH H SG SIN AW STKEPFSW IKVD LLTPM IIH G IKTQ G AR Q KFSS
LYISQ FIIM YSLD G KK W LSY R G N S TG TLM VFFG N VD SS G IK H N S FN P PIIA R YIR LH P TH S SIR STLR
M ELM G C D LN S C SIPLG M EN KVISD TQ ITASSYFTN M FATW SPSQ AR LH LQ G R TN AW R PQ VN D PK
EW LQ V D LQ K TM K V TG IITQ G V K S LFTS M FV K E FLIS S S Q D G H H W TH ILH N G K V K V FQ G N Q D S S T
PM V N S LDP P LLTR Y LR IH P Q IW E H Q IA LR LE ILG C E AQ Q L Y
La secuencia con el dominio B eliminado para el nodo número 53 que tiene la mutación E434V es: SEQ ID NO: 40 M Q IE LS TC FFLC LLQ FS FS ATR R YYLG A VELSW D Y M Q SD LLSE LH VD TR FPPR V PR SFPFN TSV M Y K K T Y F V E F T D H L F N IA K P R P P W M G L L G P T IR A E V Y D T V V IT L K N M A SHP V S LH A V G V S Y W K A S E G A E Y D D Q TS Q R E K E D D K V F P G E S H T Y V W Q V LK E N G P M A S D P P C LT Y S Y LS H V D LV K D LN S G L IG A F F V C R E G S F A K E R T Q T F H Q F V F F F A V FD E G K S W H S E TK D S F T Q A M D S A S A R A W P K M H T V N G Y V N R S F P G LIG C H R K S V Y W H V IG M G T T P E V H S IF LE G H T F LY R N H R Q A S LE IS P IT F LT A Q T LF M D LG Q FFE FC H IS S H Q H D G M E A Y V K V D S C P E E P Q FR M K N N E E E E D Y D D D LY D S E M D V V R FD D D N S P P FIQ IR S V A K K H P K T W V H Y IA A E E E D W D Y A P S V LT P D D R S Y K S Q Y LN N G P Q R IG R K Y K K V R F M A Y T D V [mutación E434V]
TFKTR EAIQ YESG IEG PFEYG EVG DTEEIIFKNQ ASRPYNIYPHG ITDVSPEHSG RFPKG VKHEKDF
PIFPG EIFKYKW TVTVEDG PTKSDPRCFTRYYSSFrNFERDFASG EIG PEFICYKESVDQ RG NQ M M
SDKRNVIFFSVFDENRSW YFTENM Q RFFPNAAG VQ PQ DPEFQ ASNIM HSING YVFDSFQ FSVCFH
EV AY W YILS VG A Q TD FLSVFFSG YTFKH KM VYED TLTLFPFSG ETVFM SM EN PG LW VLG C H N S
D F R N R G M T A L LK Y S S C D R N T G D Y Y E D T Y E D IP T Y LL S E N N V IE P R S F S Q N [eliminación del dominio
B]
PPVLKR H Q R EITLTTLQ SEQ EEID YD D TIS IETKR ED FD IYG ED EN Q G PRSFQ KR TR HYFIAAVER L
W DYG M SR SPH VLR N RAQ SG SVPQ FKKVVFQ EFTDG SFTQ PLYR G ELN EH LG LLG PYIR AEVEDN
IM VTFKN Q A SR PYSFYSSLISYEED Q R Q G AEPR KN FVKPN ETKTYFW KVQ H H M APTKD EFD C KA
W A Y FS D V D LE K D M H SG LIG P LLIC H TN TLN PAH G R Q V TVQ E FA LFFTIFD ETKS W Y FTE N M ER N
C R APC N IQ M ED PTFK EN YR FH A IN G YV M D TLPG LVM AQ D Q R IR W YLLS M G S N EN IH SIH FSG H V
F T V R K K E E Y K M A V Y N LY P G Y FE TV E M LP S K A G IW R V E C LIG E H LH A G M S TLFLV Y S K Q C Q TP L
G M A S G H IR D FQ ITASG Q YG Q W AP KLAR LH Y SG S IN AW STKE PFSW IKV D LLA PM IIH G IKTQ G A R
QKF S S LY IS Q FIIM Y S LD G K K W QTYRG N STG TLM VFFG N VD S SG IKH N IFN PPIIAR YIR LH PTH Y SI
RSTLRM ELM G CD LN SC SM PLG M ESKAISDAQ ITASSYFTN M FATW SPSQ AR LH LQ G R TN AW R P
Q V N N P KEW LQ VD FQ K TM K V TG ITTQ G V K S LLTS M Y V K E FLIS S S Q D G H H W TLFLQ N G K V K V FQ
GN QD S FTP V V N SLDPPLLTRYLRIHPQ S W V H Q IA LR LE V LG C E A Q Q LY
Tasas biosintéticas de moléculas ancestrales de FVIII
Las construcciones dentro de los órdenes ancestrales de mamíferos - Primates, Rodentia y Perissodactyla fueron reconstruidas a través de la transferencia de genes y expresión en líneas celulares de mamíferos de riñón embrionario humano (HEK) 293 y riñón de hámster bebé (BHK). Cada construcción mostró actividad de FVIII detectable según se determina mediante un ensayo de coagulación de una fase. Este ensayo utiliza plasma deficiente en FVIII humano en combinación con una sustancia de prueba para generar un coágulo macroscópico capaz de atrapar físicamente una bola de metal tirada por fuerzas magnéticas. Este ensayo también confirmó la compatibilidad de cada An de FVIII con el factor IXa de coagulación humano, para el cual el FVIII sirve como cofactor, así como el factor X, el sustrato del factor IXa. Después de la transfección transitoria de células HEK293T-17 con ADN plasmídico que codifica las variantes de An de FVIII, se observó actividad de FVIII aumentada 11,9 y 4 veces a partir de las células que expresan los ancestros de primates inferidos An-54, -53 y -52, respectivamente, en relación con el FVIII humano existente. Sin embargo, el An-57 inferido más cercano comparte una identidad del 99 % con hFVIII y no mostró una diferencia significativa en la actividad. Dentro de los grupos de no primates, An-68 demostró la mayor actividad a 14 veces en relación con hFVIII mientras que An-65, -78 y -76 no mostraron diferentes concentraciones de actividad secretada. Cabe destacar que, el FVIII porcino (pFVIII) y el híbrido porcino humano ET3 demostraron una actividad aumentada de 8 y 7 veces, respectivamente.
Determinación in vivo de DE50 de An de FVIII recombinante
Para estudiar la eficacia in vivo de la DE50 de dos secuencias de An de FVIII, An-53 y An-68, se purificó la proteína secretada hasta homogeneidad usando FPLC de intercambio iónico de dos etapas. La pureza de la proteína se confirmó usando SDS-PAGE, y las actividades específicas de An-53 y An-68 se midieron como 18.500 y 8770 U/mg, respectivamente. A ratones E16 con hemofilia A de 8-12 semanas se les administró una dosis única de FVIII y se les estimuló mediante la transección de la cola 15 minutos después de la inyección. Para el método arriba y abajo de Dixon, las dosis se determinaron a priori basándose en una investigación previa de DE50 de FVIII humano. Un evento de sangrado se definió como la pérdida de sangre que excedía la media más la desviación típica de los ratones C57BL/6 de tipo salvaje después de la misma estimulación. La finalización de este estudio reveló que An-53 y An-68 produjeron valores de DE50 de 88,6 y 47,2 U/kg, respectivamente. Las eficacias resultantes reflejan las diferencias en actividades específicas.
Tabla 1: Determinación de DE50 de An-53 y An-68 mediante el método arriba y abajo de Dixon a través de la r n r r r n i n l m rin
Figure imgf000040_0001
Antigenicidad del FVIII ancestral
Un obstáculo en el tratamiento de pacientes con hemofilia A con reemplazo de proteínas es el desarrollo de inhibidores. En poblaciones con hemofilia A sin tratamiento previo, las infusiones de concentraciones picomolares de FVIII exógeno son suficientes para generar una respuesta inmunitaria adaptativa robusta. Los esfuerzos para identificar y eliminar epítopos inmunogénicos dentro del FVIII humano han utilizado en gran medida un panel de anticuerpos monoclonales (MAb) anti-ratón humanos bien caracterizados.
Usando un subconjunto de MAb con títulos de inhibidores superiores a 1000 BU/mg y especificidad dirigida a los dominios A2 y C2, se probó el FVIII ancestral como sustrato antigénico mediante ELISA. A pesar de compartir una identidad del 95 % con el ser humano moderno, An-53 muestra una reactividad cruzada marcadamente reducida dentro de los dominios A2 y C2. Se sabe que todos los MAb del grupo A se unen a un epítopo principal en el bucle 484-508 altamente inmunogénico del FVIII humano, sin embargo, solo los MAb 4A4 y G32 demuestran reactividad cruzada con An-53 (Figura 5). Estos MAb se exploraron en busca de títulos de inhibidores contra An-53 y muestran que G32 tiene un título de inhibidor 45 veces menor en comparación con el FVIII humano, mientras que 4A4 tiene un título equivalente tanto contra el humano como contra An-53. An-53 tiene 4 sustituciones de residuos dentro del bucle 484-508 que pueden explicar la ausencia de reactividad cruzada y/o inhibición por estos potentes inhibidores del dominio A2. Además del epítopo 484-508, la mutagénesis de exploración de homólogos de FVIII humano con FVIII porcino ha mostrado previamente que un epítopo principal de 4A4 se encuentra dentro de los residuos 403-444, pero no se ha definido. El alineamiento de varias secuencias del dominio A2 de FVIII que poseen o carecen del epítopo 4A4 permite la identificación de 4 residuos que pueden ser responsables de la afinidad de unión alterada. Tres de estos residuos, Asp403, Gln410 y Asn414 están distales al bucle de superficie 484-508 y, por lo tanto, es poco probable que contribuyan con una energía de unión significativa. Sin embargo, Glu434 está muy cerca de Ile508. La mutación de E434 en valina observada en FVIII porcino dio como resultado una reducción > 4000 veces en la inhibición de 4A4 a niveles indetectables según se midió mediante el ensayo de Bethesda modificado (Figura 6).
Adm inistración hidrodinámica de dos ADN plasmídicos de An-53 (que codifican AN-53 y AN-56) en un casete de expresión de AAV
El uso de AAV como una aplicación de terapia génica para la hemofilia A ha sido explorado ampliamente por muchos laboratorios académicos y comerciales y recientemente ha avanzado en pruebas clínicas. Un producto basado en AAV para la hemofilia A ha avanzado más allá de la investigación preclínica. La principal limitación de todos los protocolos de terapia génica para la hemofilia A, tanto AAV como lentivírica, ha continuado siendo la biosíntesis de bajo nivel de FVIII en dosis de vector clínicamente alcanzables o predeciblemente seguras. Dada la biosíntesis mejorada observada para An-53 y An-56, a pesar de la alta identidad con el FVIII humano, en sistemas de líneas celulares recombinantes, se investigó su utilidad in vivo después de la administración de ácido nucleico al hígado de ratones con hemofilia A como un sustituto preclínico para la terapia génica de AAV dirigida al hígado.
Los ADNc de An-53, An-56 y ET3 se subclonaron en un casete de expresión de AAV bajo el promotor HLP específico del hígado (Figura 7). A los ratones E16 con hemofilia A se les administraron 3 ^g de ADN plasmídico (ADNp) linealizado diluido en solución de administración TransIT®-EE. Se inyectó un volumen total equivalente al 10 % del peso corporal del ratón a través de la vena de la cola en 4-7 segundos. La inyección hidrodinámica da como resultado la captación de ADN predominantemente en los hepatocitos con otros órganos mínimamente afectados. Al colocar el control transcripcional bajo el promotor HLP, se incrementó la especificidad del hígado para imitar mejor el tropismo de varios serotipos de AAV en pruebas clínicas (p. ej. AAV8).
Los niveles plasmáticos de FVIII se controlaron durante dos semanas después de la inyección. Se observaron niveles máximos de FVIII en el día 3 para todas las construcciones ensayadas. En comparación con el híbrido ET3 humano/porcino de alta expresión, An-53 demostró niveles máximos superfisiológicos de FVIII significativamente aumentados de 2,37 unidades/ml. Curiosamente, los niveles de An-56 fueron detectables, pero no excedieron de 0,06 unidades/ml durante todo el experimento, lo que sugiere que las especificidades de secuencia que permiten una biosíntesis mejorada en células BHK-M no aportan una ventaja en los hepatocitos de ratón. Usando este sistema, el FVIII humano optimizado por codones de hígado a 3 ^g por ratón fue insuficiente para producir niveles detectables de FVIII en estudios empíricos. La actividad específica de An-53 generada in vivo se analizó mediante un ELISA usando MAb antihumanos de reacción cruzada en comparación con una curva convencional de An-53 recombinante. El FVIII producido de novo demostró una actividad específica de 13.000 ± 5100 U/mg.
El alto requerimiento de ADN en un entorno hidrodinámico puede compararse con el título vírico requerido para alcanzar niveles terapéuticos de FVIII. Por lo tanto, se llevaron a cabo inyecciones hidrodinámicas usando dos dosis, una repetición de 3 ^g y una dosis de ADN 4 veces menor a 0,75 ^g por ratón. Después de la inyección hidrodinámica, se observó que el ADN de ET3 mostraba la respuesta a la dosis prevista. El ADN de An-53 produjo niveles de actividad de FVIII similares a una dosis de ADN 4 veces menor. Véase la Figura 8.
Secuencias quiméricas humanas y ancestrales
Se contempla que se pueden producir proteínas quiméricas ancestrales y humanas. En ciertas realizaciones, la divulgación contempla que las secuencias con el dominio B eliminado del FVIII humano pueden reemplazarse con secuencias A1 y A3 ancestrales, p. ej., sp-A1 (nodo 68)-A2 (mutación de E434V humano)-(humano eliminado parcialmente en B)-enlazador-ap-A3 (nodo 68)-C1-C2 (humano) Se Q ID NO: 42:
M Q IALFTC FFLSLFN FC SSATR R YYLG AVELSW N YM Q SD LLSVLH TD TR FLPR M PTSFPFN TSIM Y
K K T V F Y E Y M D H LF N IA K P R P P W M G LLG P T IW T E V H D T V Y IT LK N M A S H P V SLFLAV G V SYW KAS
EG AEY ED Q TSQ R EKED D KVFPG ESH TYVW Q VLKEN G PM ASD PPC LTYSYLSH VD LVKD LN SG LI
G A LLVC KE G SLSK ER TQ M LH Q FVLLFA VFD EG K SW H S ETKD SFTQ A M D SA STR AW PKM H TVN
G YVN R SLP G LIG C H R K SV YW H V IG M G TTPEV H SIFLEG H TFLV R N H R Q AS LE ISP ITFLTAQ TLLID
LG Q FLLF CHIS SH KHD G M E A Y V K V D S CPEEPQW Q K K N N E E M E D Y D D D LD SEM D M FTLD D D N S
P F IQ IR S V A K K H P K TW V H Y IA A E E E D W D Y A P LV LA P D D R S Y K S Q Y LN N G P Q R IG R K Y K K V R FM
A Y T D V r . ..
[mutación E434V]
TFKTR EAIQ H ESG ILG PLLY G EV G D TLLIIFKN Q A SR PY N IYPH G ITD V R P LY SR R LP KG V KH LK D F
PILPG EIFKYKW TVTVEDG PTKSDPR CLTR YYSSFVN M ER D LASG LIG PLLIC YKESVDQ RG NQ IM
SDKRNVILFSVFDEN RSW YLTEN IQ RFLPN PAG VQ LEDPEFQ ASN IM HSIN G YVFDSLQ LSVC LH E
VAYW YILSIG AQ TD FLS VFFSG Y TFK H KM VYE D TLTLFP FS G ETV FM SM EN P G LW ILG C H N S D FR
N R G M T A LLK Y S S C D K N T G D Y Y E D S Y E D IS A Y LLS K N N A IE P R S F A Q N [e|¡m¡nación del dominio B]
SRPPSASAPK [enlazador]

Claims (15)

REIVINDICACIONES
1. Una proteína FVIII recombinante o quimérica que comprende una o más mutaciones ancestrales y una eliminación del dominio B, y en donde la secuencia de la proteína no se produce de forma natural; y en donde la proteína tiene:
un dominio A1 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 22, 4, o 13;
un dominio A2 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 23, 5, o 14;
un dominio de ap que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 25, 7, o 16;
un dominio A3 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 26, 8, o 17;
un dominio C1 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 27, 9, o 18; y
un dominio C2 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 28, 10, o 19.
2. La proteína de la reivindicación 1, que tiene:
un dominio A1 ancestral que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 22;
un dominio A2 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 23; un dominio de ap que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 25;
un dominio A3 ancestral que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 26;
un dominio C1 ancestral que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 27; y
un dominio C2 ancestral que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 28.
3. La proteína de la reivindicación 2, que tiene:
un dominio A1 ancestral que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 22;
un dominio A2 que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 23; un dominio de ap que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 25;
un dominio A3 ancestral que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 26;
un dominio C1 ancestral que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 27; y
un dominio C2 ancestral que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 28.
4. La proteína de las reivindicaciones 1-3, en donde la proteína tiene:
un dominio A2 que tiene SEQ ID NO: 23, 5 o 14;
un dominio A1 ancestral que tiene SEQ ID NO: 22, 4, o 13;
un dominio de ap que tiene SEQ ID NO: 25, 7 o 16;
un dominio A3 ancestral que tiene SEQ ID NO: 26, 8, o 17;
un dominio C1 ancestral que tiene SEQ ID NO: 27, 9, o 18; y/o
un dominio C2 ancestral que tiene SEQ ID NO: 28, 10 o 19.
5. La proteína de una cualquiera de las reivindicaciones 1-4 que comprende una secuencia de aminoácidos enlazadora entre el dominio A2 y el dominio de péptido de activación (ap) que comprende RHQR (SEQ ID NO: 245).
6. La proteína de una cualquiera de las reivindicaciones 1-5, en donde la proteína tiene:
un dominio A1 que tiene SEQ ID NO: 22;
un dominio A2 que tiene SEQ ID NO: 23;
un dominio A2 enlazado al dominio de ap ancestral por un enlazador peptídico de RHQR;
un dominio de ap que tiene SEQ ID NO: 25;
un dominio A3 que tiene SEQ ID NO: 26;
un dominio C1 que tiene SEQ ID NO: 27 y
un dominio C2 que tiene SEQ ID NO: 28.
7. La proteína de la reivindicación 1 o 2, que tiene una secuencia de aminoácidos establecida como SEQ ID NO: 20 que no incluye el péptido señal y que comprende además la eliminación del dominio B y en donde el dominio A2 está enlazado al péptido de activación por un enlazador de RHQR.
8. La proteína de la reivindicación 1 que tiene una secuencia de aminoácidos que tiene más de 96 % de identidad con SEQ ID NO: 40, 39, o 42 pero en donde la proteína no incluye el péptido señal.
9. La proteína de la reivindicación 1 que tiene una secuencia de aminoácidos que tiene más de 99 % de identidad con SEQ ID NO: 40.
10. Un ácido nucleico que codifica una proteína de las reivindicaciones 1-9.
11. Un vector que comprende una secuencia de ácido nucleico promotora en combinación operable con una secuencia de ácido nucleico heterólogo que codifica una proteína de las reivindicaciones 1-9.
12. El vector de la reivindicación 11, que comprende:
(a) un promotor específico del hígado y repeticiones terminales invertidas (ITRs) del AAV 5' y 3'; o
(b) una secuencia de ácido nucleico lentivírico.
13. Un sistema de expresión que comprende un vector de la reivindicación 11 o 12.
14. Una composición farmacéutica que comprende una proteína de las reivindicaciones 1-9 o un vector de la reivindicación 11 o 12.
15. La composición farmacéutica de la reivindicación 14, para su uso en un método de inducción de la coagulación de la sangre, comprendiendo dicho método administrar una cantidad eficaz de la composición farmacéutica a un sujeto que lo necesite.
ES16744021T 2015-01-30 2016-01-27 Proteínas del factor VIII que tienen secuencias ancestrales, vectores de expresión, y usos relacionados con ellos Active ES2819123T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562109964P 2015-01-30 2015-01-30
PCT/US2016/015092 WO2016123200A1 (en) 2015-01-30 2016-01-27 Factor viii proteins having ancestral sequences, expression vectors, and uses related thereto

Publications (1)

Publication Number Publication Date
ES2819123T3 true ES2819123T3 (es) 2021-04-15

Family

ID=56544270

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16744021T Active ES2819123T3 (es) 2015-01-30 2016-01-27 Proteínas del factor VIII que tienen secuencias ancestrales, vectores de expresión, y usos relacionados con ellos

Country Status (5)

Country Link
US (3) US10654910B2 (es)
EP (1) EP3250226B1 (es)
ES (1) ES2819123T3 (es)
HK (1) HK1246657A1 (es)
WO (1) WO2016123200A1 (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3250226B1 (en) 2015-01-30 2020-07-15 Emory University Factor viii proteins having ancestral sequences, expression vectors, and uses related thereto
US10894960B2 (en) 2016-08-30 2021-01-19 Children's Hospital Medical Center Compositions and methods for nucleic acid transfer
US11633504B2 (en) 2017-05-09 2023-04-25 Emory University Nucleic acids encoding clotting factor variants and their use
US20200347116A1 (en) * 2017-11-01 2020-11-05 Queen's University At Kingston Von willebrand factor proteins for treating bleeding disorders
US20240010707A1 (en) 2018-04-12 2024-01-11 Biotest Ag De-immunized Factor VIII Molecule and Pharmaceutical Compositions Comprising the Same
US20210154282A1 (en) * 2018-04-13 2021-05-27 Inserm *Institut National De La Santé Et De La Recherche Médicale) New vaccinal strategy
US10842885B2 (en) 2018-08-20 2020-11-24 Ucl Business Ltd Factor IX encoding nucleotides
SG11202108357PA (en) 2019-02-15 2021-08-30 Crispr Therapeutics Ag Gene editing for hemophilia a with improved factor viii expression
WO2020223302A1 (en) * 2019-04-29 2020-11-05 Children's Hospital Medical Center Compositions comprising a tweak ligand and methods of using same
CN114391024A (zh) 2019-09-02 2022-04-22 生物测试股份公司 具有增加的半衰期的因子viii蛋白
CN116710554A (zh) * 2021-11-25 2023-09-05 四川至善唯新生物科技有限公司 基因工程改造获得的分泌能力和凝血活性增强的人类八因子

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003241599A1 (en) * 2002-05-22 2003-12-12 The Children's Hospital Of Philadelphia Compositions and methods for the treatment of hemophilia a
EP1424344A1 (en) 2002-11-29 2004-06-02 Aventis Behring Gesellschaft mit beschränkter Haftung Modified cDNA factor VIII and its derivates
US8637448B2 (en) 2010-09-14 2014-01-28 University Of Rochester Recombinant factor VIII having enhanced stability following mutation at the A1-C2 domain interface
SG190136A1 (en) * 2010-11-05 2013-07-31 Baxter Int A new variant of antihemophilic factor viii having increased specific activity
KR20190094480A (ko) * 2012-02-15 2019-08-13 바이오버라티브 테라퓨틱스 인크. 재조합 인자 viii 단백질
EP3250226B1 (en) 2015-01-30 2020-07-15 Emory University Factor viii proteins having ancestral sequences, expression vectors, and uses related thereto

Also Published As

Publication number Publication date
US10654910B2 (en) 2020-05-19
WO2016123200A1 (en) 2016-08-04
HK1246657A1 (zh) 2018-09-14
EP3250226A4 (en) 2018-10-03
EP3250226B1 (en) 2020-07-15
US20180009873A1 (en) 2018-01-11
US11897938B2 (en) 2024-02-13
US20200277356A1 (en) 2020-09-03
US11046750B2 (en) 2021-06-29
EP3250226A1 (en) 2017-12-06
US20210388055A1 (en) 2021-12-16

Similar Documents

Publication Publication Date Title
ES2819123T3 (es) Proteínas del factor VIII que tienen secuencias ancestrales, vectores de expresión, y usos relacionados con ellos
JP7217630B2 (ja) 最適化第viii因子遺伝子
US20200069817A1 (en) Nucleic acid molecules and uses thereof for non-viral gene therapy
CN111247251A (zh) 核酸分子及其用途
KR20180043373A (ko) 색소성망막염의 치료
US11851671B2 (en) Programmable assembly of virus composites for receptor-targeted gene delivery
TW202039855A (zh) 表現因子ix之慢病毒載體的用途
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CA3099958A1 (en) Compositions and methods for treating duchenne muscular dystrophy
RU2816873C2 (ru) Применение лентивирусных векторов, экспрессрующих фактор ix
US20210381002A1 (en) Gene therapy for oxidative stress
TW202346327A (zh) 編碼具有降低免疫原性的因子viii多肽之核酸
CN118019758A (en) Nucleic acids encoding reduced immunogenicity factor VIII polypeptides