MXPA99005320A

MXPA99005320A - Cepas de vih-1 que no son del grupo m, ni son del grupo o, fragmentos y uso

Info

Publication number: MXPA99005320A
Application number: MXPA/A/1999/005320A
Authority: MX
Inventors: Mauclere Philippe; Loussertajaka Ibtissam; Simon Francois; Saragosti Sentob; Barresinoussi Francoise
Original assignee: Institut National De La Sante Et De La Recherche Medicale Inserm
Priority date: 1996-12-09
Filing date: 1999-06-08
Publication date: 2000-05-01

Abstract

La presente invención se refiere a cepas retrovirales del grupo de VIH-1 que no es del grupo M, ni del O, en particular una cepa designada YBF30, sus fragmentos y también sus usos como un reactivo de diagnóstico y un agente inmunogénico. Los virus de VIH-1 que difieren tanto del grupo M y del grupo O, exhiben las siguientes características:*poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a las proteínas que se derivan de la cepa YBF30 de acuerdo con la invención o la cepa VIS de CPZGAB;*ausencia de la amplificación genómica cuando se usan iniciadores en las regiones env y gag y los grupos de VIH-1 de M y O;*amplificación genómica en presencia de los iniciadores que se derivan de la cepa YBF30, de acuerdo con la invención;homología de los productos del gen de cubierta que es mayor al 70%con respecto a la de la cepa YBF30.

Description

CEPAS DE VIH-1 QUE NO SON DEL GRUPO M, NI SON DEL GRUPO O, FRAGMENTOS Y USO La presente invención se refiere a cepas retrovirales del grupo de VIH- 1 que no son del grupo M, ni son del grupo O, en particular una cepa designada YBF30, a sus fragmentos y a sus usos como un reactivo de diagnóstico y como un agente inmunogénico. El virus de inmunodeficiencia adquirido humano VIH-1 y VIH-2 son retrolentivirus, dichos virus se encuentran en un gran número de primates Africanos. Estos virus parecen tener un antecesor común ; sin embargo, es un difícil prejuzgar el período en el cual estos diferentes virus se separan de su precursor. Otros virus que son más distantes, pero que no pertenecen al mismo grupo, se encuentran en otros mamíferos (ungulados y felinos) . Todos estos virus están asociados con infecciones larga; una ausencia de síntomas es la regla en monos que se infectan de manera natural. Mientras que el origen de VIH-2 parece ser claro tomando en cuenta esta fuerte homología con el virus de Sooty Mangabey (África Occidental), no se ha encontrado ningún virus estrechamente relacionado con VI H-1 en monos. Los virus más estrechamente relacionados son los virus encontrados en dos chimpancés (VIS de CPZGAB, VIS de ANT). Se ha encontrado que todos los lentivirus exhiben variabilidad genética substancial y el estudio filogenético de estas variantes, obtenido de un número de diferentes lugares geográficos, ha permitido que se distingan 8 subtipos diferentes (ciados) de VI H-1 , todos lo cuales son equidistantes uno del otro. Los ciados únicamente son una representación matemática de la expresión de la variabilidad: análisis fenéticos, que se basa en ios aminoácidos en lugar de en los ácidos nucleicos, da diferentes resultados (Korber y otros, 1994) . La demostración de subtipos es de acuerdo con un análisis filogenético el cual hasta la fecha no ha tenido ninguna correlación patofisiológica pero, en su lugar, si ha tenido una correspondencia geográfica. Esto se debe a que cada subtipo principalmente se encuentra en un área geográfica particular. El subtipo B es predominante en Europa y en los Estados Unidos mientras que dos subtipos, es decir E y B, se encuentran en Tailandia y hay una fuerte correlación entre el modo de transmisión el cual, de hecho, corresponde a una población particular y al subtipo encontrado. Todos los ciados se han encontrado en África y su distribución a través del resto del mundo refleja una probabilidad de encontrarse entre personas indulgentes con comportamiento de alto riesgo. El ciado principal, el cual es principal debido a que está presente en proporciones substanciales en África, es el ciado A. Un grado bastante mayor de variabilidad se ha encontrado en algunos países Africanos (G. Myers, 1994; P. M. Sharp y otros, 1994). Se han caracterizado varios subtipos en los países del África Occidental Central tal como en la República Africana Central (Murphy y otros, 1993) y Camerún (Nkengasong y otros, 1994). Finalmente, se han caracterizado pacientes quienes son portadores de variantes virales de VIH-1 , cuyos sueros han tenido problemas de detección por equipos particulares que se encuentran en el mercado Francés y cuyos grupos confirmatorios en el Occidente han sido atípicos (Loussert-Ajaka y otros, 1994; Simón y otros, 1994; Solicitud Internacional de PCT WO 96/27013). El análisis de estas variantes ha confirmado el hecho de que los virus de VI H tipo 1 deben subdividirse en dos grupos, es decir, el grupo M (principal) y un grupo O (aislado), el cual incluye estos aislados, como lo ha propuesto Charneau y otros, 1994. El análisis de la relación de mutaciones sinónimas/mutaciones no sinónimas llevado a cabo en las secuencias de los virus del grupo O conocido indica que este grupo nuevo también es antiguo, aún si no es más antiguo que el grupo M (Loussert-Ajaka y otros, 1995). Su baja prevalencia hasta la fecha, es decir 8% de pacientes infectados con VI H-1 en Camerún (Zekeng y otros, 1994) y 18 casos caracterizados en Francia, se piensa que se debe a factores que son puramente epidemiológicos. Estos grupos de VI H-1 forman un árbol el cual tiene la forma de una estrella doble (Figuras 9 a 19). Dos aislados, es decir, VIS de GPZGAB, caracterizado de un chimpancé de Gabón (Huet y otros, 1990) y VIS de CPZANT, caracterizado de un chimpancé en el Zoológico de Antwerp, tiene secuencias de organizaciones genéticas que están relacionadas muy estrechamente con VI H- 1 pero que no caen en cualquiera de estos dos grupos y forman dos nuevas ramas en el árbol filogenético. La demostración de nuevas variantes es importante para desarrollar reactivos suficientemente sensibles y específicos para detectar infecciones por VI H , es decir reactivos que no conducen a resultados falsos-negativos o falsos-positivos o para desarrollar composiciones que protegen con respecto a los subtipos que no pertenecen al grupo M o al grupo O . Consecuentemente, el solicitante por sí mismo tiene el objetivo de proveer una cepa que no pertenece al grupo M o al grupo O, así como secuencias derivadas de esta cepa, que son adecuadas para detectar variantes de VH I- 1 que no pertenecen al grupo M o al grupo O y que no conducen obtener resultados que son falsos-negativos o falsos-positivos. Con el fin de hacer esto los inventores, en particular han establecido un algoritmo para diferenciarse entre ellos y confirmar las infecciones de VI H- 1 del grupo M y g rupo O , permitiendo así seleccionar las variantes que no pertenecen al grupo M o al grupo O. La presente invención se refiere a una cepa de VI H- 1 que no pertenece al grupo M o al grupo O que exhibe características morfológicas e inmunológicas de los retrovirus que se depositaron el 2 de Julio 1 996 bajo el número 1- 1753 (designado YB F30) en la Colección Nacional de Cultivos de Microorganismos , comprendida en el Instituto Pasteur.

Se entiende que la variante que no es M, ni es O es un VIH tipo 1 que no puede ser reconocido serológica y molecularmente por pertenecer a cualquiera de estos grupos. La presente invención también se refiere a la secuencia completa de nucleótidos de la cepa como se definió antes (SEQ ID No. 1) así como a fragmentos de ácidos nucleicos que por lo menos son de 10 nucleótidos de tamaño y que se derivan de dicha cepa. Los fragmentos de este tipo que se pueden mencionar son: -YBF 30 LTR (SEQ ID No.2), -YBF 30 GAG (SEQ ID No. 3) (gen gag), -YBF 30 POL (SEQ ID No. 5) (gen pol), -YBF 30 VIF (SEQ ID No. 7) (gen vif), -YBF 30 VPR (SEQ ID No. 9) (gen vpr) -YBF 30 VPU (SEQ ID No. 11) (gen vpu), -YBF 30 TAT (SEQ ID No. 13) (gen tat), -YBF 30 REV (SEQ ID No. 15) (gen rev), -YBF 30 ENV gp160 (SEQ ID No. 17) (gen env), -YBF 30 NEF (SEQ ID No. 19) (gen nef) -las SEQ ID Nos. 21-57, también designadas, respectivamente, YLG, LPBS.1, GAG Y AS1.1, GAG Y AS1, GAG 6, GAG Y S1, GAG Y S1.1, GAG Y S1.2, YRT AS1.3, YRT AS1.2, YRT AS1.1, YRT 2, YRT AS1, YRT 2.1, YRT 2.2, YRT 2.3, YRT 2.4, 4481-1, 4481-2, 4235.1, 4235.2, 4235.3, 4235.4, SK69.6, SK69.5, SK69.4, SK69.3, SK69.2, SK69.1, SK68.1, SK68.2, SK68.3, LSI, AS1.3, LSI AS1.2, LSI AS1.1, LSI A1, YLPA, así como cualquier secuencia que no es idéntica a una de las secuencias de nucleótidos anteriores o no es complementaria a una de estas secuencias pero sin embargo es capaz de hibridizarse específicamente con una secuencia de ácidos nucleicos derivada de un virus VI H-1 que no es del grupo M, ni del grupo O. Dichas secuencias se pueden usar en la identificación específica de un VIH-1 que no es M, ni es O, y como reactivos de diagnósticos, ya sean solos o combinados con otros reactivos, para la identificación diferencial de cualquier VI H-1 . Estas secuencias, en particular, se pueden emplear en pruebas de diagnóstico que comprenden una hibridización directa con la secuencia viral que será detectada o una amplificación de dicha secuencia viral, con estas pruebas usando, como iniciadores o como sondas, un oligonucleótido que comprende por lo menos 10 nucleótidos y que se incluye en cualquiera de las secuencias anteriores, en particular una de las secuencias mencionadas antes, SEQ I D Nos. 21 -57. La presente invención también se refiere a virus de VIH-1 que se caracterizan porque difieren del grupo M y del grupo O y exhiben las siguientes características: poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a proteínas que se derivan de la cepa YBF30 o la cepa VIS de CPZGAB; ausencia de amplificación genómica cuando se usan iniciadores en las regiones env y gag de virus VIH-1 y de los grupos M y O; amplificación genómica en presencia de iniciadores que se derivan de la cepa YBF30, como se definió antes; y homología de los productos del gen de cubierta que es >70% con respecto a la cepa YBF30. La invención también se refiere al uso de las secuencias descritas antes para implementar un método de hibridización y/o amplificación de genes de las secuencias de ácidos nucleicos del tipo de VIH-1 , estos métodos siendo aplicables en el diagnóstico in-vitro de la infección potencial de un individuo con un virus del tipo de VI H-1 que no es M, ni es O. Este método de diagnóstico in-vitro se llevó a cabo usando una muestra biológica (suero o linfocito circulantes) y comprende. . un paso de extraer el ácido nucleico el cual será detectado y que pertenece al genoma del virus, dicho virus posiblemente puede estar presente en la muestra biológica, y, en donde es apropiado, un paso para tratar el ácido nucleico usando una transcriptasa inversa, si este ácido nucleico está en forma de ARN. . por lo menos un ciclo que comprende los pasos de desnaturalizar el ácido nucleico, de hibridizarlo con por lo menos una secuencia de acuerdo con la invención y en donde es apropiado, extender el híbrido, el cual se ha formado en presencia de reactivos adecuados (agente de polimerización, tal como ADN polimerasa y d NTP) , y . u n paso para detectar la presencia posible del ácido nucleico que pertenece al genoma de un virus del tipo de VI H- 1 que no es M , ni es O. Las siguientes condiciones se emplean para la RCP usando los i niciadores derivados de la cepa YBF30: - extraer el AD N linfocítico por medio de la técnica de fenol/cloroformo y cuantificarla por espectrofotometría a una longitud de onda de 260 nm . Todas las amplificaciones se llevaron a cabo usando un termociclizador de Perkin Elmer 2400. - la RCP de 9kb de largo se llevó a cabo usando un equipo de RCP XL (Perkin El mer) de acuerdo con las condiciones del fabricante y usando el d NTP, las soluciones reguladoras provistas y el "iniciador en caliente" de Perkin Elmer; los ciclos de amplificación de este RCP de largo son : . 1 ciclo de desnaturalización durante 2 minutos a 94°C. . después 16 ciclos; 1 5 segundos a 94°C, 1 5 segundos a 55°C, 8 minutos a 68°C, . después 24 ciclos: 1 5 segundos a 94°C, 1 5 segundos a 55°C, 8 minutos a 68°C, agregando 1 5 minutos adicionales (incrementación) a cada ciclo. - las RCP anidadas se llevaron a cabo en los productos de amplificación de los RCP largas. Las condiciones para llevar a cabo las RCP anidadas son la siguientes.

. "Sistema de RCP de Alta Fidelidad Expandido" Solución reguladora de Taq polimerasa y enzima de Boehringer Mannheim de acuerdo con las instrucciones del fabricante, dNTP y "inicio en caliente" de Perkin Elmer, . 200 µmoles de cada dNTP, 20 pmoles de cada iniciador de acuerdo con la invención, 5 µl de ADN, 10 µl de 10 x solución reguladora de RCP y 2.6 unidades de Taq polimerasa en un volumen de 100 µl. . amplificación: un ciclo de 2 minutos a 94°C seguido por 38 ciclos: 15 segundos a 94°C, 15 segundos a 55°C, un tiempo de elongación a 72°C que varía de acuerdo con el tamaño del producto de RCP que será amplificado (de 30 segundos a 2 minutos) y un ciclo de elongación final de 10 minutos a 72°C. El producto amplificado preferiblemente se detecta por secuenciación directa. La invención también se refiere a un péptido o un fragmento del péptido que se caracteriza por que se puede expresar una cepa de VI H-1 que no es del grupo M, ni del O usando una secuencia de nucleótidos como se definió antes, y porque es capaz de: (1 ) reconocerse por anticuerpos que se inducen por un virus de VI H- 1 que no es del grupo M, ni del O, como se definió antes, en particular la cepa YBF30 o una variante de esta cepa, y que está presente en una muestra biológica que se obtiene después de una infección con una cepa de VI H-1 que no es M, ni es O, y/o (2) de inducir la producción de anticuerpos de VI H-1 anti-grupos que no son M ni O.

Los péptidos de este tipo que se pueden mencionar son, en particular, aquellos que se derivan de la cepa YBF30, en particular: aquella se expresa por el gen gag (SEQ ID No. 4), aquellos que se expresan por el gen pol (SEQ ID No. 6), aquellos que se expresan por el gen vif (SEQ ID No. 8), aquellos que se expresan por el gen vpr (SEQ ID No. 12), aquellos que se expresan por el gen tat (SEQ ID No. 14), aquellos que se expresan por el gen rev (SEQ ID No. 16), aquellos que se expresan por el gen env (SEQ ID No. 18), o uno de sus fragmentos tales como un fragmento de la región del bucle V3, es decir, CTRPGNNTGGQVQIGPAMTFYNIEKIVGDIRQAYC (SEQ ID No. 58), y que se expresan por el gen nef (SEQ ID No. 20), o un fragmento de estos péptidos que son capaces de reconocer los anticuerpos que se producen durante una infección con un VIH-1 que no es del grupo M, ni del O como se definió antes. La invención también se refiere a composiciones inmunogénicas que comprenden uno o más productos de traslación de las secuencias de nucleótidos de acuerdo con la invención y/o uno de los péptidos como se definió antes, obtenido, en particular, por medios sintéticos. La invención también se refiere a los anticuerpos que se dirigen contra uno o más de los péptidos descritos antes y a su uso para implementar métodos para el diagnóstico diferencial, en particular in-vitro, de la infección de un individuo con un virus del tipo de VIH-1 que usa métodos que son conocidos por los expertos.

La presente invención abarca todos los péptidos que son capaces de reconocerse por anticuerpos que se aislan de suero infeccioso, el cual se obtiene después de una infección con una cepa de VI H-1 que no es del grupo M, ni del O y los péptidos que son capaces de reconocerse por un anticuerpo de acuerdo con la invención. La invención además se refiere a un método para el diagnóstico in-vitro de un virus de VIH-1 que no es del grupo M, ni del O, cuyo método se caracteriza por que comprende hacer que una muestra biológica, la cual se ha tomado de un paciente, se ponga en contacto con anticuerpos de acuerdo con la Reivindicación 10, que posiblemente se puede combinar con anticuerpos de anti-VIS de CPZGAB y detectar los complejos inmunológicos que se forman entre los antígenos de VIH-1 , que posiblemente estén presentes en la muestra biológica, y dichos anticuerpos. La invención también se refiere a un equipo para diagnosticar VI H-1 , cuyo equipo se caracteriza por que incluye por lo menos un reactivo de acuerdo con la invención . Aparte de las provisiones que se han descrito antes, la invención también comprende otras provisiones que serán evidentes a partir de la siguiente descripción y que se refiere a ejemplos para implementar el método que es el tema de la presente invención y también los dibujos anexos, en los cuales: -Las Figuras 1 a 7, ilustran la ubicación de los diferentes iniciadores en el genoma de la cepa YBF30; -La Figura 8, ilustra la organización genómica de la cepa YBF30; -Las Figuras 9 a 16, describen el análisis filogenético de diferentes genes de la cepa YBF30 comparado con el grupo de VIH- 1 M y el grupo de VIH-1 O (Figura 9: gen Itr, Figura 10, gen gag, Figura 1 1 : gen tat, Figura 12: gen rev, Figura 13: gen vif, Figura 14: gen env gp120, Figura 15: gen env gp41 , Figura 16: gen net, Figura 17: gen pol, Figura 18: gen vpr, Figura 19: gen vpu); -La Figura 20, ilustra la distancia genética porcentual entre YBF30 y VI H-1 /VIS de VIS DE CPZGAB. Desde luego, se deberá entender, sin embargo, que estos ejemplos se dan únicamente a manera de ilustrar el tema principal de la invención, lo cual no constituye ninguna limitación de ninguna manera. EJEMPLO: Obtener una variante de VIH-1 que no es M, ni es O de acuerdo con la invención (YBF30) y sus usos. En particular, esto fue posible en relación con el estudio de epidemiología de infección con virus de inmunodeficiencia adquirido en humanos (VIH) en Camerún, lo cual epidemiológicamente es especialmente paradójico. En este país, la diversidad de las cepas es notoria dado que se han reportado la mayoría de los subtipos del grupo M (principal) de virus de VI H-1 conocidos hasta la fecha. Los casos de infección con virus de VIH-1 altamente divergentes del grupo O (O para aislado) se han reportado, casi exclusivamente en pacientes de origen Cameroniano. También se han reportado casos de infección con los subtipos de VI H-2, HTLV-1 y HTLV-2 A y B. Tomando como una base los resultados de las valoraciones serológicas y genotípicas, los inventores establecieron un algoritmo para diferenciar y confirmar infecciones con virus de VI H-1 de los grupos M y O con el fin de seleccionar variantes que no son del grupo M ni del O. Estos métodos se aplicaron a muestras que se enviaron al Laboratorio de Referencia Nacional para infecciones de VIH en Yaoundé y se hizo posible caracterizar un aislado de VI H altamente divergente y definir las herramientas para caracterizar un nuevo grupo de VI H-1 , tomando en cuenta las homologías que se observaron entre esta cepa humana YBF30 y la cepa de simios de VIS de CPZGAB. I- Manera de caracterizar serológicamente la variante de YBF30 durante el estudio epidemiológico. 1 ) Recopilación de muestras: Se estudiaron todos los sueros de pacientes adultos que se enviaron al laboratorio de referencia de Yaoundé en 1994 y 1995 para detectar o confirmar una infección de VI H (n = 8831 ). 2) Diferenciación serológica entre VI H-1 del grupo M y del grupo O, y selección de variantes: Si hubo detección positiva de anticuerpos anti-VI H (mezcla de EIA de VIH-1 y VIH-2 mezclados indirectamente Génélavia, Sanofi-Pasteur, París, Francia), esto se combinó con una prueba de EIA basada en el principio de competencia con un antígeno específico del grupo M (Wellcozyme Rec H IV-1 , Murex, Dartford, U K) . Si la prueba de VI H-1 de Rec de Wellcozyme competitiva es positiva, con una relación para la reactividad en densidad óptica (DO) con el valor de umbral o de corte (CO) es mayor que 5 (CO/DO > 5), el suero se consideró por ser VI H-1 positivo, un resultado que deberá confirmarse en una nueva muestra. La elección de una relación de reactividad que es mayor a 5 para considerar la prueba competitiva por ser una prueba para confirmar la infección con VI H-1 está basada en la experiencia adquirida por el laboratorio de virología del hospital de Bichat: las 7200 muestras que reaccionaron con una relación > 5 dieron un análisis de Western de VI H-1 fuertemente positivos (WB, New Lav Blot 1 , SDP, Mames la Coquette). Aparte de los casos de seroconversión con VIH-1 , las muestras que se confirmaron por ser VIH-positivas y que dieron una relación de Wellcozyma de < 5 corresponden a infecciones con VI H-2 o infecciones con VI H-1 del grupo O u otras variantes de VI H-1 . Con el fin de eliminar las reacciones falsas-positivas cuando se llevó a cabo una detección de EIA mezclada, las muestras que dieron una relación de CO/DO < 5 se probaron sistémicamente con una tercera generación de EIA VIH-1 /VI H-2 mezclados (Enzygnost Plus, Marburg, Germany) que incluye antígenos de los grupos de VI H-1 M y O (gp41 recombinante de la cepa MVP5180). Si fue positiva esta prueba, se llevó a cabo entonces una prueba rápida que discrimina el VIH-1 y VIH-2 (Multispot, SDP, Mames la Coquette) y un análisis de Western (WB, New Lav Blot 1 ó 2, SDP). 3) Confirmación serológica de infecciones con variantes de VI H-1 y del grupo O y VIH- 1 Todas las muestras que dieron una relación de CO/DO menor a , y que se han diferenciado por ser positivas por AW (criterio positivo: 2 ENV +/- POL +/- GAG o 1 ENV + POL +/- GAG) y VI H-1 , se probaron con una prueba de manchas de puntos usando antígenos de péptidos de las regiones V3 y transmembrana (InnoLia, Innogenetics, Ghent, Belgium) . 4) Aislamiento retrovíral de las cepas del grupo O y variantes. Las células mononucleares de sangre periférica (CMSP) de los pacientes seropositivos se aislaron por gradiente de Ficoll-Hypaque en Camerún y se almacenaron y transportaron a París en nitrógeno líquido. Después de congelación, los CMSP de los pacientes se cocultivaron junto con linfocitos de donadores Caucásicos seronegativos. La replicación viral en los sobrenadantes del cultivo se demostró detectando actividad de transcriptasa inversa y llevando a cabo pruebas para detectar el antígeno p24 (p24 policlonal Elavia, SDP) durante un período de un mes. 5) Secuencias: Los productos de RCP se visualizaron en geles de agarosa de una concentración de 1 a 1 .4%, dependiendo del tamaño de los fragmentos, precipitados en 3M de acetato de sodio (1 : 10) y 3 volúmenes de etanol absoluto, se incubaron a -80°C durante 30 minutos y después se centrifugaron a 13, 000 rpm durante 20 minutos. La pella se secó y después se absorbió en 10 µl de agua destilada (Sigma). La purificación se llevó a cabo en un "equipo de Extracción de Gel Qiaquick" (Qiagen) de acuerdo con las instrucciones del fabricante; los productos se secuenciaron en un secuenciador de ADN automático (Applied Biosystems, Inc. , Foster City, CA) usando un equipo Terminador de Colorante de Applied Biosystem, como se describió previamente (Loussert-Ajaka y otros 1995); las secuencias de nucleótidos se analizaron en un software Navegador de Secuencias (Applied Biosystems) y se alinearon usando software GeneWorks. 6) Análisis filogenétícos: Las secuencias se alinearon usando software CLUSTAL para alineaciones múltiples y absorción, como la matriz de referencia, las alineaciones de la recopilación de las secuencias de VI H contenidas por Laboratory of Biology y Theoretical Biophysics, Los Alamos, New México, 87545 USA. Los análisis filogenéticos se llevaron a cabo usando software PHYLI P; las distancias se calcularon en primer lugar usando DNADIST, después de lo cual se llevaron a cabo análisis filogenéticos usando NEIGBOR JOIN I NG o FITCH ; finalmente, los árboles se extrajeron usando DRAWTREE (Figuras 9 a 19). Los porcentajes de distancias genéticas también se muestran en la Figura 20.

SEQBOOT primero que todo se uso para los análisis de "autoarrastre", seguido por DNADIST y N EIGBOR JOI N ING o FITCH . Finalmente, el autoarrastre se obtuvo usando CONSENS. I I - Resultados de la investigación para detectar virus de VI H del grupo O y variantes: Se encontraron que 174 muestras, de 3193 muestras fueron positivas en el tamizado, se consideraron por ser del grupo O o grupo M con reactividad serológica anormal o como variantes. I I I - Detección de una muestra aue no pertenece al grupo O ni al grupo M exhibiendo reactividad serológica 174 sueros que fueron VI H- 1 positivos por AW (Análisis Western) , pero reactivo con una relación de CO/DO de < 5 en el EIA competitivo, se probaron por análisis de puntos LIA diferencial en los péptidos V3 del grupo M, grupo O y VIS de CPZGAB: - 7 no reaccionaron con ninguno de los péptidos representados (M, O o VIS de CPZGAB). La ausencia de cualquiera activación de células no permite que llegue a ninguna conclusión. - 82 dieron una reactividad con respecto a por lo menos uno de los péptidos que corresponde al bucle V3 o a las cepas del grupo O. La frecuencia de las reacciones cruzadas es baja y restringida a los epítopes que correspondieron a las regiones V3 consensúales (1 1 %) y a las regiones V3 de VIS de CPZGAB (43%). - 84 sueros no reaccionaron con las epítopes del grupo O. La mayoría de estas muestras se obtuvieron de pacientes que exhiben síndrome de SIDA (75/84). - un suero, que se tomo de un paciente Cameroniano (NJ) reacciona exclusivamente con el péptido de VIS de CPZGAB. Esta reactividad aislada con respecto a un antígeno de VIS de CPZGAB nunca se describió previamente. Dado que los linfocitos se recopilaron del paciente, es posible continuar con la caracterización virológica de esta cepa, que se llamo YBF30. IV - Resultados de los exámenes serológicos y virológicos llevados a cabo en las primeras muestras formadas de este paciente (Mavo 1995) (suero No.: 95-6295). 1) Pruebas de ELISA Comerciales (valor de densidad óptica/umbral) Criterio de positividad: DO/CO > 1 Génélavia = > 15 Wellcozyme CO/DO = 1.55 Abbott Plus = >15 Behring Plus = 4.2 2) Análisis Western AW nuevo de Lav 1 Pasteur: 160+ + , 120 + + , 68 + + , 55 + , 41 + , 40+/-, 34 + + , 24 + + , 18 + 3) Análisis de puntos LIA Intergenéticos Negativo para todas las bandas del grupo O y el grupo M aparte de V3 de VIS de CPZGAB 4) Resultados de los exámenes serológicos de investigación llevados a cabo en péptidos gue son específicos para los grupos de M v O La técnica desarrollada por Profesor Francis Barin de! Virology Laboratory de Tours CH U fue modificada (Barin F. y otros 1996); se usaron péptidos de la región de transmembrana sintetizados (BioMérieux) para desarrollar una prueba de diferenciación entre los grupos de M y O. Esta técnica se basa en competencia de anticuerpo-unión entre los péptidos gp41 de transmembrana de los grupos O y M, que se depositaron en la fase sólida, y péptidos de transmembrana de gp41 ya sea del grupo O o del grupo M a una concentración superior en una fase de reacción de líquidos hiperosmolar. Los resultados se muestran en la siguiente Tabla I , en la cual CP corresponde bien al control de inhibición del 100% y CSP corresponde de inhibición al 0%. Tabla I Resultados de las diferenciaciones entre el grupo O y el grupo M para el suero 6295 Estos resultados demuestran que hay una fuerte unión con respecto a los péptidos de la fase sólida (CSP) y una inhibición notoria debido a la adición combinada de los péptidos de M y O (CP) , pero no hay diferenciación clara por el péptido M o el péptido O. Por lo tanto, es una evidencia serológica que las cepas de infección no pertenecen ni al grupo M ni al grupo O.

En vista de una reactividad aislada en el análisis de puntos InnoLia con respecto a los antígenos V3 de VIS de CPZGAB, sobre las mismas bases de competencia entre los péptidos, se estudio el suero poniendo en competencia a los péptidos de gp41 M gp41 O y VIS de CPZGAB de gp41 . El uso de suero del chimpancé llamado "Amandine" (donado por M. Peeters, quien aisló la cepa de VIS de CPZGAB, SI DA 1992) permitió inicialmente que se validará esta técnica. En la Tabla I I , los valores inferiores (DO) indican el valor más alto de unión a los antígenos. Tabla II Resultados de las diferenciaciones entre el grupo O o grupo M y VIS de CPZGAB usando suero de Chimpancé de Amandine y el suero 6295 La reactividad del suero de "Amandine" confirma y valida la prueba de acuerdo con la invención y muestra que, mientras el suero del paciente reaccione idénticamente con respecto a los péptidos de M y VIS de CPZGAB, no exhibe una reacción cruzada con el péptido O.

Estos resultados demuestran que los grupos del péptido M gp41 y gp41 de VI S de CPZGAB ejercen una inhibición similar del suero en el suero del paciente. Los antígenos de la cepa infectante dieron origen así a anticuerpos que reconocen a péptidos del grupo M y gp41 de VI S de CPZGA B en una forma similar. 4) Resultados obtenidos del aislamiento de li nfocitos (muestreo de Mavo de 1995) Se aisló un retrovirus usando técnicas normales de linfocitos que se emplearon el 22 de Mayo de 1 995. El cultivo cuando la línea celular MT2 muestra que la cepa YBF30 no forma ningún espacio in icial (NSI) . V - Resultados de los exámenes serológicos llevados a cabo en la segunda muestra de sangre (Noviembre de 1 995) (suero No . 95-3371 ) 1 ) Análisis de puntos LIA de I nnogenética Negativa para todas las bandas , aparte de V3 de VIS de CPZGAB. 2) Resu ltados de los exámenes serológicos de investigación llevados a cabo en los péptidos específicos para los g rupos M y O . La Tabla I I muestra los resultados de diferenciaciones entre el grupo O y el grupo M y gp41 de VIS de CPZGAB usando el suero 3371 . Tabla lll Resultados de las diferenciaciones entre el grupo O o grupo M y VIS de CPZGAB usando el suero 3371 Estos resultados confirman, en esta nueva muestra de sangre (tomado del mismo paciente en la etapa terminal de la enfermedad), que el péptido gp41 de VIS de CPZGAB inhibe notoriamente el suero del paciente. Los antígenos de la cepa de infección, por lo tanto, inducen al anticuerpo que reconoce preferencialmente el péptido gp41 de VIS de CPZGAB. 3) Resultados del aislamiento de linfocitos (el muestreo de sangre de Noviembre de 1995 (95-3371 -YBF31 )). Se aisló un retrovirus, usando técnicas normales de los linfocitos que se muestrearon en Noviembre de 1995 y se llamaron YBF31 ; los elementos de secuencias fueron idénticos a los de YBF30. VI - Amplificación genómica y secuencias de YBF30 El ADN para todas las manipulaciones de RCP, se extrajo de las células obtenidas al final de cultivo positivo. La RCP llevada a cabo usando iniciadores de VI H-1 del grupo O es negativa en las diferentes regiones probadas (faf, pol, env). Similarmente, las llevadas a cabo son de los iniciadores que son específicos para VIH- 1 del grupo M también son negativos.

Las condiciones de amplificación e hibridización para los RCP del grupo O son aquellos descritos en Lossert-Ajaka, 1995. Las condiciones de amplificación e hibridización para las RCP del grupo M son aquellos descritos por los autores citados más adelante. Estos iniciadores del grupo M se localizaron de acuerdo con la secuencia HXBW de VIH-1 como sigue: -en env gp120. ED3/ED12 (posición 5956-5985; 7822-7792), ES5/ED14 (6556-6581; 7690-7931); ED5/ED12; ED3/ED14; ES7/ES8 (7001-7020; 7667-7647) (Delwart y otros, Science 1993; 262: 1257-1261). -En env gp41: primero RCP, ED3/M29, seguido por un RCP anidado, M28/M29 (7785-7808; 8099-8124); M28/M29 tiene las siguientes secuencias: M28: CGGTTCTT(AG)GGAGCAGC(ACT)GGAAGCA, M29: T(CT)T(ACGT)TCCCA(CT)T(AT)(CT)A(AGT)CCA(AGT)GTCAT; SK68/SK69 (Ou y otros, Science, 1988; 239: 295-297). -en gag: Sistemas de Amplicor Roche Diagnostics; iniciadores gag anidados (Loussert-Ajaka y otros, Lancet 1995; 346: 912-913); SK38/SK39 (Ou y otros, Science, 1988; 239: 295-297). -en pol: A/NE1 (Boucher y otros, Lancet, 1990; 336: 585-590); Pol3/Pol4 (Lauré y otros, Lancet, 1988, ii, 538-541). Solamente las RCP llevadas a cabo usando los iniciadores H Pol (4235/4538) son positivas, siendo seguido por un RCP anidada usando los iniciadores 4237/4481 (Fransen y otros, Molecular and Cellular Probes 1994; 8: 317-322). Se secuenció este fragmento de H Pol, que se localizó en la integrasa (260 pb) . La amplificación utilizando los iniciadores de H POL y se hizo posible debido al exceso de virus. Esto se debe a que el ADN que se uso se extrajo de células al final del cultivo fuertemente positivo (transcriptasa inversa > 100,000 cpm). No es posible amplificar el ADN que se extrajo de células frescas sin el cocultivo debido al gran número de desigualdades entre los iniciadores de HPOL (especialmente en la región 3') y la secuencia del aislado de YBF30. La conservación de este extremo 3' es muy importante para la actividad de extensión de la polimerasa Taq. 1 - Secuencia del gen pol: con el uso de iniciadores muy degenerados para amplificación, por RT-RCP, el ARN extraído del sobrenadante de cultivo positivo dio una amplificación positiva. Estos son iniciadores que son comunes para todos los retrovirus (Donehower y otros, J . Virol Methods 1990; 28: 33-46) y se localizaron en la región de transcriptasa del gen pol. Los análisis del fragmento después de la secuenciación hicieron posible generar un iniciador específico, es decir, YRT2 (SEQ I D No. 32) , del aislado de YBF30 y para amplificar el gen de pol usando el iniciador Hpol 4481 (Fransen y otros, 1994; loe. cit.) como el iniciador de contrasentido. El fragmento se secuenció sintetizando iniciadores específicos como se requirió para cada fragmento generado (Figura 1 ). 2 - Secuencia del gen de env: el segundo enfoque fue llevar a cabo un RCPIargo (XL-RCP, Perkin Elmer), amplificando así todos los virus (9000 pb) usando los iniciadores situados en LTR: LPBS 1 (SEQ ID NO. 22); LSiGi, seguido por una RCP anidada de 6000 pb usando YRT2 (SEQ I D No. 32)/SK69 y secuenciar toda la cubierta siguiendo el mismo procedimiento. La región de gp41 se secuenció usando una RCP anidada y ampliando los iniciadores SK68/LSiGi . 3 - Secuencia del gen de gag: uso de una RCP anidada, logrado por medio de una RCP larga (LPBS 1 /LSiGi), empleando los iniciadores Gag 5 y Gag 1 1 i y generación a partir de estos iniciadores específicos, según se requiera, con el fin de ir a lo largo del genoma viral. Vi l - Resultados de las secuenciaciones La cepa YBF30 se secuenció completamente (ver lista de secuencias). La cepa YBF31 de Noviembre de 1995 se secuenció en parte, y la ausencia de variación significativa confirma la validez de secuencias de YBF30. VI H - Péptidos de sintetización de la región del bucle V3 de la cepa YBF30. El estudio de las secuencias de la región del bucle V3 hizo posible sintetizar el péptido correspondiente y comparar los aminoácidos de esta región de la cepa YBF30 con aquellas de los subtipos M y cepas O. Las secuencias de los péptidos son: YBF30: SEQ I D No. 58 VIS de CPZGAB: CH RPG N NTRGEVQIGPGMTFYN l ENVYG DTRSAYC (SEQ I D No. 59) GRU PO O: CI RPGN RTYRN LQIGPGMTFYNVEIATGDI RKAFC (SEQ ID No. 60) GRUPO M: CTRPNNNTRKSVRIGPGQAFYATGDIIGDIRQAHC (SS-TIPO A) (SEQ ID No. 61). El péptido se sintetizó, partiendo con dos asparaginas de la región 5' del bucle, y se uso de acuerdo con el mismo principio de acuerdo como se describió previamente (ver IV 4), a saber en competencia en relación con los péptidos del grupo M, el grupo O y VIS de CPZGAB. Los resultados mostrados en la Tabla IV confirman la naturaleza original de esta cepa y la distribución posible de estas cepas, dado que los resultados serológicos favorecen la infección del tipo YBF30 en Camerún. Además, un estudio de 200 sueros VIH-1 positivo seleccionados de Camerún proveen diferencia de un nuevo caso que exhibe un perfil similar al de YBF30. Tabla IV Estudio de la reactividad dei suero 200 suero de VIS DE CPZ ANT La reactividad de los sueros 953371 y 956295, correspondiente al paciente del cual se aisló la cepa YBF30, con el péptido de VIS de CPZ, se confirmó en esta nueva prueba. La reactividad inferior con respecto a su antígeno V3 es usual durante las últimas etapas de la enfermedad. Sin embargo, esta reactividad sigue siendo mayor que la surgida con respecto al péptido M . Otro paciente Cameroniano (suero 967321 ) exhibe el mismo perfil de la reactividad de péptidos.

Referencias: * Barin F. y otros, Aids Research and Human Retroviruses, 1996, 12, 13, 1279-1289, Diversity of Antibody Binding to V3 Peptides Representing Consensus Sequences of HIV Type 1 Genotypes A to E: An Approach for HIV Type 1 Serological Subtyping. * Chameau P., Borman AM., Quillent C, Guétard D., Chamaret S., Cohén J., Rémy G., Montagnier L., and F. Clavel, Virology, 1994, 205, 247-253, Isolation and envelope sequence of a highly divergent HIV-1 isolate: definition of a new HIV-1 group. * Descamps D., Collin G., Loussert-Ajaka I., Saragosti S., Simón F. And F. Brun-Vezinet. AIDS, 1995, 9, 977-978, HIV-1 group O sensitivity to antiretroviral drugs. * Huet, T., Cheynier R., Meyerhans A., Roelants G., and S. Wain- Hobson, Nature, 1990, 345, 356-359, Genetic organization of a chimpanzee lentivirus related to HIV-1. * Korber BTM., Maclnnes K., Smith R. and G. Myers, J. Virol., 1994, 68, 6730-6744, Mutational trends in V3 loop protein sequences observed in different genetic lineages of HIV-1. * Loussert-Ajaka I., Ly TD., Chaix ML, Ingrand D., Saragosti S., Couroucé AM., Brun-Vezinet F. and F. Simón, Lancet, 1994, 343, 1393-1394, HIV-1/HIV-2 seronegativity in HIV-1 subtype O infected patients. * Loussert-Ajaka I., Chaix ML., Korber B., Letourneur F., Gomas E., Alien E., Ly TD., Brun-Vezinet F., Simón F. and Saragosti, J.

Virol., 1995, 69, 5640-5649, Variability of HIV type 1 group O strains isolated from Cameroonian patients living in FRANCE.

Murphy, E., B. Korber, Georges-Courbot, MC, You B., Pinter A., Cook D., Kienky MP., Georges A., Mathiot C, Barré-Sinoussi F., and M. Girard, AIDS Res. Hum. Retroviruses, 1993, 9, 997-1006, Diversity of V3 región sequences of human immunodeficiency viruses type 1 from the Central African Republic. G. Myers, Aids Res. Hum. Retrovir., 1994, 10, 11, 1317-1324, Tenth Anniversary Perspectives on AIDS. Nkengasong, J.N., Janssens W., Heyndrickx L., Fransen K., Ndumbe PM., Motte J., Leonaers A., Ngolle M., Ayuk J., Piot P., and G. Van der Groen, AIDS, 1994, 8, 1405-1412, Genotypic subtypes of HIV-1 in Cameroon. Sharp P.M. y otros., AIDS, 1994, 8, suppl. 1, S27-S42, Origins and diversity of human immunodeficiency viruses. Simón, F., T.D. Ly, A. Baillou-Beaufils, V. Schneider-Fauveau, J.

De Saint-Martin, I. Loussert-Ajaka, M.L. Chaix, S. Saragosti, A.M. Couroucé, D. Ingrand, C. Janot, and F. Brun-Vezinet. AIDS, 1994, 8, 1628-1629. Sensitivity of screening kits for anti-HIV-1 subtype O antibodies. Zekeng, L., L. Gurtler, E. Afane Ze, A. Sam-Abbenyi, G. Mbouni, Essomba, E. Mpoudi-Ngolle, M. Monny-Lobbe, J.B. Tapko, and L.

Kaptue, AIDS, 1994, 8, 1626-1628, Prevalence of HIV-1 subtype O infection in Cameroon: preliminary results.

Como es evidente a partir de lo anterior, la invención no se limita de ninguna manera por estas modalidades que se han descrito más explícitamente. Al contrario, abarca todas las variantes que puedan surgir para la persona experta sin alejarse del contexto o alcance de la presente invención .

LISTA DE SECUENCIAS (1) INFORMACIÓN GENERAL: (i) SOLICITANTE (A) NOMBRE: INSTITUT NATIONAL DE LA SANTE Y OTROS DE LA RECHERCHE MEDÍCALE - INSERM (B) CALLE: 101 rué DE TOLBIAC (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75654 CEDEX 13 (A) NOMBRE: PUBLIQUE-HOSPITAUX DE PARÍS (B) CALLE: 3 avenue Victoria (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75100 RP (A) NOMBRE: INSTITUT PASTEUR (B) CALLE: 28 rué du Docteur Roux (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75724 Cédex 15 (A) NOMBRE: MAUCLERE Phillippe (B) CALLE: 2 rué Buhan (C) ESTADO: BODEAUX (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 33000 (A) NOMBRE: LOUSSERT-AJAKA Iblissam (B) CALLE: 26 avenue de la République (C) ESTADO: SARTROUVILLE (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 78500 (A) NOMBRE: SIMÓN Francois (B) CALLE: 8 rué Germain Pilón (C) ESTADO: PARÍS (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 75018 (A) NOMBRE: SARAQOSTI Sentob (B) CALLE: 69 bis rué de Billancourt (C) ESTADO: BOULOGNE BILLANCOURT (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 92100 (A) NOMBRE: BARRE-SINOUSSI Francoise (B) CALLE: 104 Le Carpicorne, 50 rué d'Erevan (C) ESTADO: ISSY LES MOULINEAUX (E) PAÍS: FRANCIA (F) CÓDIGO POSTAL: 92130 (ii) TITULO DE LA INVENCIÓN: CEPAS DE VIH-1 QUE NO SON DEL GRUPO M, Ni SON DEL GRUPO O, FRAGMENTOS Y USO (iii) NÚMERO DE SECUENCIAS: 61 (iv) FORMA LEÍBLE POR COMPUTADORA (A) TIPO DE MEDIO: Disco Flexible (B) COMPUTADORA: PC compatible con IBM (C) SISTEMA DE OPERACIÓN: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Reléase #1.0, Versión #1.30 (OEB) (2) INFORMACIÓN PARA SEQ ID NO: 1: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 9183 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 1: CTTCTCGCTT GTACTGGGTC TCTCTTGCTG GACCAGATTA GAGCCTGGGA GCTCTCTGGC 60 TAGCAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTA AAGTGGTGTG 120 TGCCCATCC TTCGGTAACT CTGGTACCTA GAGATCCCTC AGACCATCTA GACTGAGTGA 180 AAAATCTCTA GCAGTGGCGC CCGAACAGGG ACTTGAAAAC GAAAGTAGAA CCGGAGGCTG 240 AATCTCTCGA CGCAGGACTC GGCTCGTTGG TGCACACAGC GAGAGGCGAG GCGGCGGAAG 300 TGTGAGTACG C_AATTTTGAC TGGCGGTGGC CAGAAAGTAG GAGAGAGGAT GGGTGCGAGA 360 GCGTCAGTGT TAACAGGGGG AAAATTAGAT CAATGGGAAT CAATTTATTT GAGACCAGGG 420 GGAAAGAAAA AATACAGAAT GAAACATTTA GTATGGGCAA GCAGGGAGCT GGAAAGATTC 480 GCTTGTAACC CAGGTCTCAT GGACACAGCG GACGGCTGTG CCAAGTTACT AAATCAATTA 540 GAACCAGCTC TCAAGACAGG GTCAGAAGAA CTGCGCTCTT TATATAACGC TCTAGCAGTT 600 CTTTATTGTG TCCATAGTAG GATACAGATA CACAACACAC AGGAAGCTTT GGACAAGATA 660 AAAGAGAAAC AGGAACAGCA CAAGCCCGAG CCAAAAAACC CAGAAGCAGG GGCAGCGGCA 720 GCAACTGATA GCAATATCAG TAGGAATTAT CCTCTAGTCC AGACTGCTCA AGGACAAATG 780 GTACATCAGC CGCTGACACC CAGAACCTTA AATGCTTGGG TGAAAGTGAT AGAGGAGAAG 840 GCCTTTAGTC CAGAAGTAAT ACCAATGTTT ATGGCCTTGT CAGAAGGGGC AACGCCCTCA 900 GATCTAAATA CTATGTTAAA TACAGTAGGG GGACATCAGG CAGCAATGCA GATGCTGAAG 960 GAAGTCATCA ATGAGGAAGC AGCAGACTGG GATAGGACAC ATCCAGTCCC TGTGGGACCA 1020 CTACCCCCAG GGCAACTGAG AGACCCTAGA GGAAGTGATA TAGCAGGAAC AACTAGCACC 1080 CTGGCAGAAC AGGTGGCTTG GATGACTGCT AATCCTCCTG TTCCAGTAGG AGATATTTAT 1140 AGAAGATGGA TAGTCCTGGG GTTAAACAGA ATTGTGAGAA TGTATAGTCC TGTCAGCATT 1200 CTAGAGATCA AACAAGGACC AAAAGAACCC TTCAGAGACT ATGTAGACAG GTTCTACAAA 1260 ACTCTAAGAG CAGAGCAGGC AACACAGGAA GTAAAGAATT GGATGACAGA AACACTCTTA 1320 GTACAAAATG CAAACCCAGA TTGTAAACAG CTCCTAAAAG CATTAGGGCC AGGAGCTACC 1380 TTAGAAGAGA TGATGACGGC CTGCCAGGGA GTGGGGGGAC CAGCACATAA GGCAAGAGTG 1440 CTAGCAGAGG CTATGTCACA GGTGCAGCAG CCAACAACTA GTGTCTTTGC ACAAAGGGGA 1500 AACTTTAAAG GCATAAGGAA ACCCATTAAA TGTTTCAATT GTGGCAAAGA GGGCCATTTG 1560 GCAAGAAACT GTAAGGCCCC TAGAAGAGGA GGCTGTTGGA AGTGTGGGCA AGAAGGACAT 1620 CAAATGAAAG ATTGTAAAAA TGAAGGAAGA CAGGCTAATT TTTTAGGGAA GAGCTGGTCT 1680 CCCTTCAAAG GGAGACCAGG AAACTTCCCC CAGACAACAA CAAGGAAAGA GCCCACAGCC 1740 CCGCCACTAG AGAGTTATGG GTTTCAC-GAG GAGAAGAGCA CACAGGGGAA GGAGATGCAG 1800 GAGAACCAGG AGAGGACAGA GAACTCTCTG TACCCACCTT TAACTTCCCT CAGATCACTC 1860 TTTGGCAACG ACCCGTCATC ACAGTAAAAA TAGGGAAAGA AGTAAGAGAA GCTCTTTTAG 1920 ATACAGGAGC TGATGATACA GTAATAGAAG AGCTACAATT AGAGGGAAAA TGGAAACCAA 1980 AAATGATAGG AGGAATTGGA GGATTTATCA AAGTGAGACA ATATGATAAT ATAACAGTAG 2040 ACATACAGGG AAGAAAAGCA GTTGGTACAG TATTAGTAGG ACCAACACCT GTTAATATTA 2100 TAGGAAGAAA TCTTTTAACC CAGATTGGCT GTACTTTAAA TTTTCCAATA AGTCCTATTG 2160 AAACTGTACC AGTAAAATTA AAACCAGGAA TGGATGGCCC AAAGGTAAAA CAATGGCCTT 2220 TGACAACAGA AAAAATAGAG GCATTAAGAG AAATTTGTAC AGAAATGGAA AAGGAAGGAA 2280 AAATTTCTAG AATAGGGCCT GAGAATCCAT ATAACACTCC AATTTTTGCT ATAAAAAAGA 2340 AAGATAGCAC TAAATGGAGA AAATTAGTAG ATTTCAGGGA ATTAAATAAA AGGACCCAAG 2400 ATTTTTGGGA AGTGCAGCTA GGAATTCCAC ATCCAGCAGG ATTAAAGCAG AAAAAATCAG 2460 TGACAGTTTT GGATGTAGGA GATGCTTATT TTTCATGTCC CTTGGACAAA GATTTTAGAA 2520 AGTATACAGC TTTTACCATA CCTAGTATAA ACAATGAGAC ACCTGGTATT AGATACCAGT 2580 ATAATGTGCT GCCACAAGGC TGGAAAGGGT CACCAGCAAT TTTTCAGAGT ACAATGACAA 2640 AAATTCTAGA ACCATTCAGA GAGAAACATC CAGAGATAAT CATTTACCAG TACATGGATG 2700 ACCTCTATGT GGGATCTGAC TTAGAAGTAG CACAACATAG AGAGGCAGTA GAAGACCTTA 2760 GAGATCATCT TTTGAAGTGG GGCTTTACGA CCCCTGACAA AAAACATCAG AAGGAACCCC 2820 CGTTCCTCTG GATGGGATAT GAACTCCATC CAGACAAATG GACAGTCCAG CCAATAAAGT 2880 TACCAGAAAA GGATGTATGG ACTGTCAATG ATATACAGAA ATTAGTAGGA AAGTTAAATT 2940 GGGCAAGTCA GATCTATCCA GGAATCAGAG TAAAACAGCT CTGTAAATTA ATCAGAGGAA 3000 CCAAAGCTT GACAGAAGTA GTCAACTTTA CAGAAGAAGC AGAATTAGAA CTAGCAGAAA 3060 ACAGGGAGAT ATTAAAAGAA CCCCTGCATG GAGTC ATTA TGACCCAGGA AAAGAATTAG 3120 TAGCAGAAAT TCAAAAGCAA GGACAAGGTC AGTGGACATA TCAGATTTAT CAGGAGTTAC 3180 ATAAAAATTT AAAAACAGGA AAGTATGCAA AAATGAGATC TGCCCATACT AATGATATAA 32 0 AACAGTTAGT TGAAGTGGTA AGGAAAGTGG CAACAGAAAG TATAGTAATT TGGGGAAAGA 3300 CTCCTAAATT TAGATTACCA GTACAAAAGG AAGTGTGGGA GGCATGGTGG ACCGATCATT 3360 GGCAAGCAAC TTGGATTCCT GAGTGGGAAT TTGTCAACAC TCCTCCCCTT GTAAAATTAT 3420 GGTATCAGTT AGAAACAGAG CCAATCAGTG GGGCAGAAAC TTTCTATGTA GATGGAGCAG 3480 CTAATAGGGA AACAAAATTG GGAAAAGCAG GTTTTGTGAC AGATAGGGGA AGACAOAAAG 3540 TGGTCTCTAT TGCAGACACC ACCAATCAAA AGGCTGAGTT ACAAGCTATC CT ATGGCCT 3600 TACAAGAGTC AGGACGGGAT GTAAACATAG TCACTGACTC TCAGTATGCT ATGGGAATAA 3660 TTCATTCACA GCCAGATAAA AGTGAATCAG AATTGGTGAG CCAAATAATA GAAGAGCTCA 3720 TAAAAAAGGA AAGAGTTTAT CTCTCTTGGG TACCTGCACA TAAAGGTATT GGAGGAAATG 3780 AGCAGGTAGA CAAATTAGTT AGCTCAGGAA TTAGAAAAAT ATTATTCCTA GATGGTATAG 3840 AAAAAGCCCA AGAAGATCAT GACAGATATC ACAGCAATTG GAAAGCAATG GCCAGTGATT 3900 TTAACTTACC CCCCATAGTG GCAAAAGAAA TAGTAGCCAG CTGTGACAAA TGCCAGCTAA 3960 AAGGGGAAGC CATGCATGGA CAGGTCAATT GTAGTCCAGG AGTGTGGCAA TTAGATTGTA 4020 CACACTTAGA GGGAAAAATC ATCCTTGTGG CGGTCCATGT GGCCAGTGGC TACTTAGAAG 4080 CAGAAGTTAT TCCTGCAGAG ACAGGACAGG AAACAGCATA TTTTATTTTA AAGTTAGCTG 4140 GAAGATGGCC AGTAAAAGTT ATACACACTG ATAATGGATC CAATTTCACT AGTGCCACTG 4200 TAAAAGCAGC CTGTTGGTGG GCAAATATCA AACAGGAATT TGGGATACCC TACAATCCTC 4260 AAAGTCAGGG AGCAGTAGAG TCCATGAATA AAGAATTAAA GAAAATTATA GGACAAATCA 4320 GAGATCAAGC AGAACATCTA AAGACAGCAG TGCAAATGGC GG TTTCATT CACAATTTTA 4380 AAAGAAAAGG GGGGATTGGG GGGTACACTG CAGGGGAAAG AATAATAGAC ATAATAGCAA 4440 CAGACATACA GAC-VACAAAT TTACAAACAC AAATTTTAAA AGTTCAAAAT TTTCGGGTTT 4500 ATTACAGAGA CAGCAGAGAT CCCATTTGGA AAGGACCAGC CAAACTTCTG TGGAAAGGAG 4560 AAGGGGCAGT GGTAATTCAA GATAACGGGG ATATAAAAGT AGTCCCACGT AGGAAAGCAA 4620 AAATAATTAG GGATTATGGA AAACAGATGG CAGGTGATGG TTGTGTGGCA AGTGGACAGG 4680 ATGAAAATCA GGAAATGGAA TAGCTTAGTA AAACATCATA TGTATGTGTC AAAAAAGGCA 4740 AAAGGATGGT ATTATAGACA TCATTATGAA ACACATCACC CAAAAATAAG TTCAGAAGTA 4800 CATATCCCAG TAGGTCAGGC AAGATTAGTG ACAGTCACTT ATTGGGGGCT AACAACAGGA 4860 GAACAGTCTT GGCATCTAGG ACATGGAGTA TCCATAGAAT GGAGACTAAG AAAATACAAG 4920 ACACAAGTTG ATCCTGAAAT GGCAGACAAG CTAATACATC TTCATTATTT TGATTGTTTT 4980 ACAGCCTCTG CCATAAGGCA AGCGGTCTTA GGGAGACCAG TATTACCTAG GTGTGAATAT 5040 CCAGCAGGGC ACAAACAGGT AGGCACCCTA CAATATCTAG CACTAACAGC CTGGGTGGGA 5100 GCAAAGAAGA GAAAGCCACC CTTACCTAGT GTGACTAAGC TAACAGAAGA TAGATGGAAC 5160 GAGCACCAGA AGATGCAGGG CCACAGAGGG AACCCTATAA TGAATGGGCA CTAGAATTAT 5220 TAGAAGAATT AAAAAATGAA GCTGTGCGCC ATTTTCCAAG GATTTGGCTA CATGGGTTAG 5280 GACAACACAT CTATAACACA TATGGAGACA CCTGGGAGGG GGTAGAGGCA ATTATCAGGA 5340 TACTACAACA ATTACTGTTT ATCCATTATA GGATTGGCTG CCAGCACAGC AGAATAGGGA 5400 TCACTCCTCA AAGGAGAAGG AATGGAACCA GTAGATCCTA GATTAGAGCC CTGGAATCAT 5460 CCAGGAAGCC AACCTAAAAC AGCTTGCAAT AATTGCTATT GTAAAAGATG TTGCTATCAC 5520 TGCTTATATT GCTTCACAAA GAAAGGCTTA GGCATCTCAT ATGGCAGGAA GAAGCGGAGT 5580 CAACGACGAA GAACTCCTCA GAGCAGTAAG AGTCATCAAG ATCTTATACC AGAGCAGTAA 5640 GTAAAACCTG TATATATGCT GTCATTGGGA TTCATAGCGT TAGGAGCAGC AGTTAGCATA 5700 GCAGTAATAG TCTGGGCATT ACTATATAGA GAATATAAGA AAATAAAATT GCAGGAAAAA 5760 ATAAAACACA TAAGACAGAG AATAAGAGAA AGAGAAGAAG ATAGTGGCAA TGAAAGTGAT 5820 GGGGATGCAG AGTGGTTGGA TGGGGATGAA GAGTGGTTGG TTACTCTTCT ATCTTCTAGT 5880 AAGCTTGATC AAGGTAATTG GGTCTGAACA ACATTGGGTA ACAGTGTACT ATGGGGTACC 5940 ' AGTATGGAGA GAAGCAGAGA CAACTCTTTT CTGTGCTTCA GATGCTAAAG CCCATAGTAC 6000 AGAGGCTCAC AACATCTGGG CCACACAAGC ATGTGTTCCT ACTGATCCCA ATCCACAAGA 6060 AGTGCTATTA CCCAATGTAA CTGAAAAATT TAATATGTGG GAAAATAAAA TGGCAGACCA 6120 AATGCAAGAG GATATTATCA GTCTGTGGGA ACAGAGCTTA AAGCCCTGTG TTAAATTAAC 6180 CCCATTATGT GTAACTATGC TTTGTAACGA TAGCTATGGG GAGGAAAGGA ACAATACAAA 6240 TATGACAÁCA AGAGAACCAG ACATAGGATA CAAACAAATG AAAAATTGCT CATTCAATGC 6300 AACCACTGAG CTAACAGATA AAAAGAAGCA AGTTTACTCT CTGTTTTATG TAGAAGATGT 6360 AGTACCAATC AATGCCTATA ATAAAACATA TAGGCTAATA AATTGTAATA CCACAGCTGT 6420 GACACAAGCT TGTCCTAAGA CTTCCTTTGA GCCAATTCCA ATACATTACT GTGCACCACC 6480 AGGCTTTGCC ATTATGAAAT GTAATGAAGG AAACTTTAGT GGAAATGGAA GCTGTACAAA 6540 TGTGAGTACT GTACAATGCA CACATGGAAT AAAGCCAGTG ATATCCACTC AGTTAATCCT 6600 AAATGGAAGC TTAAATACAG ATGGAATTGT TATTAGAAAT GATAGTCACA GTAATCTGTT 6660 GGTGCAATGG AATGAGACAG TGCCAATAAA TTGTACAAGG CCAGGAAATA ATACAGGAGG 6720 ACAGGTGCAG ATAGGACCTG CTATGACATT TTATAACATA GAAAAAATAG TAGGAGACAT 6780 TAGACAAGCA TACTGTAATG TCTCTAAAGA ACTATGGGAA CCAATGTGGA ATAGAACAAG 6840 AGAGGAAATA AAGAAAATCC TGGGGAAAAA CAACATAACC TTCAGGGCTC GAGAGAGGAA 6900 TGAAGGAGAC CTAGAAGTGA CACACTTAAT GTTCAATTGT AGAGGAGAGT TTTTCTATTG 6960 TAACACTTCC AAATTATTTA ATGAGGAATT ACTTAACGAG ACAGGTGAGC CTATTACTCT 7020 GCCTTGTAGA ATAAGACAGA TTGTAAATTT GTGGACAAGG GTAGGAAAAG GAATTTATGC 7080 ACCACCAATT CGGGGAGTTC TTAACTGTAC CTCCAATATT ACTGGACTGG TTCTAGAATA 7140 TAGTGGTGGG CCTGACACCA AGGAAACAAT AGTATATCCC TCAGGAGGAA ACATGGTTAA 7200 TCTCTGGAGA CAAGAGTTGT ATAAGTACAA AGTAGTTAGC ATAGAACCCA TAGGAGTAGC 7260 ACCAGGTAAA GCTAAAAGAC GCACAGTGAG TAGAGAAAAA AGAGCAGCCT TTGGACTAGG 7320 TGCGCTGTTT CTTGGGTTTC TTGGAGCAGC AGGGAGCACT ATGGGCGCAG CGTCAATAAC 7380 GCTGACGGTA CAGGCCCGGA CATTATTATC TGGGATAGTG CAACAGCAGA ATATTCTGTT 7 40 GAGAGCAATA GAGGCGCAAC AACATTTGTT GCAACTCTCA ATCTGGGGC TTAAACAGCT 7500 CCAGGCAAAA GTCCTTGCTA TAGAAAGATA CCTTAGGGAT CAGCAAATCC TAAGTCTATG 7560 GGGCTGCTCA GGAAAAACAA TATGCTATAC CACTGTGCCT TGGAATGAGA CTTGGAGCAA 7620 CAATACCTCT TATGATACAA TCTGGAATAA TTTAACCTGG CAACAATGGG ATGAGAAAGT 7680 AAGAAACTAT TCAGGTGTCA TTTTTGGACT TATAGAACAG GCACAAGAAC AACAGAACAC 7740 AAATGAGAAA TCACTCTTGG AATTGGATCA ATGGGACAGT CTGTGGAGCT GGTTTGGTAT 7800 TACAAAATGG CTGTGGTATA TAAAAATAGC TATAATGATA GTAGCAGGCA TTGTAGGCAT 7860 AAGAATCATA AGTATAGTAA TAACTATAAT AGCAAGAGTT AGGCAGGGAT ATTCTCCCCT 7920 TTCGTTGCAG ACCCTTATCC CAACAGCAAG GGGACCAGAC AGGCCAGAAG AAACAGAAGG 7980 AGGCGTTGGA GAGCAAGACA GAGGCAGATC CGTGCGATTA GTGAGCGGAT TCTCAGCTCT 8040 TGTCTGGGAG GACCTCCGGA ACCTGTTGAT CTTCCTCTAC CACCGCTTGA CAGACTCACT 8100 CTTOATACTG AGGAGGACTC TGGAACTCCT GGGACAGAGT CTCAGCAGGG GACTGCAACT 8160 ACTGAATGAA CTCAGAACAC ACTTGTGGGG AATACTTGCA TATTGGGGAA AAGAGTTAAG 8220 GGATAGTGCT ATCAGCTTGC TTAATACAAC AGCTATTGTA GTAGCAGAAG GAACAGATAG 8280 GATTATAGAA TTAGCACAAA GAATAGGAAG GGGAATAT A CACATACCTA GAAGAATCAG 8 40 ACAAGGCCTA GAAAGAGCAC TGATATAAGA TGGGAAAGAT TTGGTCAAAG AGCAGCCTAG 8400 TAGGATGGCC AGAAATCAGA GAAAGAATGA GAAGACAAAC GCAAGAACCA GCAGTAGAGC 8460 CAGCAGTAGG AGCAGGAGCA GCTTCTCAAG ATCTAGCTAA TCGAGGGGCC ATCACCATAA 8520 GAAATACTAG AGACAATAAT GAAAGTATAG CTTGGCTAGA AGCACAAGAA GAAGAAGAGG 8580 AAGTAGGCTT TCCAGTACGC CCTCAGGTAC CATTAAGGCC AATAACCTAT AAACAGGCTT 8640 TTGATCTTTC CTOCTTTTTA AAAGATAAGG GGGGACTGGA AGGGCTAGTT TGGTCCAGAA 8700 AAAGGCAAGA TATTCTAGAC CTCTGGATGT ATCACACACA AGGCATCCTC CCTGACTGGC 8760 ATAACTACAC ACCAGGGCCA GGAATTAGAT ACCCCGTAAC CTTTGGATGG TGCTTCAAAC 8820 TAGTACCATT GTCAGCTGAA GAAGTAGAAG AGGCTAATGA AGGAGACAAC AATGCCCTCT 8880 TACACCCCAT ATGTCAACAT GGAGCAGATG ATGATCATAA AGAAGTGTTG GTGTGGCGAT 8940 TTGACAGCTC CCTAGCAAGA AGACATGTAG CAAGAGAGCT GCATCCGGAG TTTTACAAGA 9000 ACTGCTGACA AGGGACTTTA CTGCTGACAA GGGACTTTAT ACTTGGGGAC TTTCCGCCAG 9060 GGACTTTCCA GGGAGGTGTG GTTGGGGGAG TGGCTTGCCC TCAGAGC GC ATAAAAGCAG 9120 CCGCTTCTCG CTTGTACTGG GTCTCTCTTG CTGGACCAGA TTAGAGTCTG GGAGCATATT 9180 GGG 9183 (2) INFORMACIÓN PARA SEQ ID NO: 2: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 813 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 2: TTGGAAGGGC TAGTTTGGTC CAGAAAAAGG CAAGATATTC TAGACCTCTG GATGTATCAC 60 ACACAAGGCA TCCTCCCTGA CTGGCATAAC TACACACCAG GGCCAGGAAT TAGATACCCC 120 GTAACCTTTG GATGGTGCTT CAAACTAGTA CCATTGTCAG CTGAAGAAGT AGAAGAGGCT 180 AATGAAGGAG ACAACAATGC CCTCTTACAC CCCATATGTC AACATGGAGC AGATGATGAT 240 CATAAAGAAG TGTTGGTGTG GCGATTTGAC AGCTCCCTAG CAAGAAGACA TGTAGCAAGA 300 GAGCTGCATC CGGAGTTTTA CAAGAACTGC TGACAAGGGA CTTTACTGCT GACAAGGGAC 360 TTTATACTTG GGGACTTTCC GCCAGGGACT TTCCAGGGAG GTGTGGTTGG GGGAGTGGCT 420 TGCCCTCAGA GCTGCATAAA AGCAGCCGCT TCTCGCTTGT ACTGGGTCTC TCTTGCTGGA 480 CTATACAGAT TAGAGCCTGG GAGCTCTCTG GCTAGCAGGG AACCCACTGC TTAAGCCTCA 540 ATAAATACAG CTTGCCTTGA GTGCTAAAGT GGTGTGTGCC CATCCATTCG GTAACTCTGG 600 TACCTAGAGA ATCCCTCAGA CCATCTAGAC TGAGTGAAAA ATCTCTAGCA GTGGCGCCCG 660 AACAGGGACT TAGTTGAAAA CGAAAGTAGA ACCGGAGGCT GAATCTCTCG ACGCAGGACT 720 CGGCTCGTTG GTGCACACAG CGAGAGGCGA GGCGGCGGAA GTGTGAGTAC GCAATTTTGA 780 CTGGCGGTGG CCAGAAAGTA GGAGAGAGGG AGG 813 (2) INFORMACIÓN PARA SEQ ID NO: 3: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 1539 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (¡x) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..1536 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 3: ATG GGT GCG AGA GCG TCA GTG TTA ACÁ GGG GGA AAA TTA GAT CAÁ TGG 48 Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp 1 5 10 15 GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 96 Glu Ser He Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 20 25 30 CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 35 40 45 GGT CTC ATG GAC ACÁ GCG GAC GGC TGT GCC AAG TTA CTA AAT CAÁ TTA 192 Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu 50 55 60 GAA CCA GCT CTC AAG ACÁ GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80 GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288 Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gln He His Asn 85 90 95 ACÁ CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336 Thr Gln Glu Ala Leu Asp Lys He Lys Glu Lys Gln Glu Gln His Lys 100 105 110 CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384 Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 115 120 125 AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAÁ GGA CAÁ ATG 432 Asn He Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met 130 135 140 (C) FORMA DE H ILO: sencillo (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: ADN (genómico) (ix) CARACTE RÍSTICA (A) NOMBRE/CLAVE: CDS (B) U B ICACIÓN : 1 ..1536 (xi) DESCR I PCIÓ N DE LA SECU ENCIA: SEQ I D NO: 3: ATG GGT GCG AGA GCG TCA GTG TTA ACÁ GGG GGA AAA TTA GAT CAÁ TGG 48 Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp 1 5 10 15 GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA 96 Glu Ser He Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 20 25 30 CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144 His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 35 40 45 GGT CTC ATG GAC ACÁ GCG GAC GGC TGT GCC AAG TTA CTA AAT CAÁ TTA 192 Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu 50 55 60 GAA CCA GCT CTC AAG ACÁ GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240 Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80 GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288 Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gln He His Asn 85 90 95 ACÁ CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336 Thr Gln Glu Ala Leu Asp Lys He Lys Glu Lys Gln Glu Gln His Lys 100 105 110 CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384 Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 115 120 125 AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAÁ GGA CAÁ ATG 432 Asn He Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met 130 135 140 GAA ACÁ CTC TTA GTA CAÁ AAT GCA AAC CCA GAT TGT AAA CAG CTC CTA 1008 Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Gln Leu Leu 325 330 335 AAA GCA TTA GGG CCA GGA GCT ACC TTA GAA GAG ATG ATG ACG GCC TGC 1056 Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 340 345 350 CAG GGA GTG GGG GGA CCA GCA CAT AAG GCA AGA GTG CTA GCA GAG GCT 1104 Gln Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 355 360 365 ATG TCA CAG GTG CAG CAG CCA ACÁ ACT AGT GTC TTT GCA CAÁ AGG GGA 1152 Met Ser Gln Val Gln Gln Pro Thr Thr Ser Val Phe Ala Gln Arg Gly 370 375 380 AAC TTT AAA GGC ATA AGG AAA CCC ATT AAA TGT TTC AAT TGT GGC AAA 1200 Asn Phe Lys Gly He Arg Lys Pro He Lys Cys Phe Asn Cys Gly Lys 385 390 395 400 GAG GGC CAT TTG GCA AGA AAC TGT AAG GCC CCT AGA AGA GGA GGC TGT 1248 Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 405 410 415 TGG AAG TGT GGG CA GAA GGA CAT CAÁ ATG AAA GAT TGT AAA AAT GAA 1296 Trp Lys Cys Gly Gln Glu Gly His Gln Met Lys Asp Cys Lys Asn Glu 420 425 430 GGA AGA CAG GCT AAT TTT TTA GGG AAG AGC TGG TCT CCC TTC AAA GGG 1344 Gly Arg Gln Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 435 440 445 AGA CCA GGA AAC TTC CCC CAG ACÁ ACÁ ACÁ AGG AAA GAG CCC ACÁ GCC 1392 Arg Pro Gly Asn Phe Pro Gln Thr Thr Thr Arg Lys Glu Pro Thr Ala 450 455 460 CCG CCA CTA GAG AGT TAT GGG TTT CAG GAG GAG AAG AGC ACÁ CAG GGG 1440 Pro Pro Leu Glu Ser Tyr Gly Phe Gln Glu Glu Lys Ser Thr Gln Gly 465 470 475 480 AAG GAG ATG CAG GAG AAC CAG GAG AGG ACÁ GAG AAC TCT CTG TAC CCA 1488 Lys Glu Met Gln Glu Asn Gln Glu Arg Thr Glu Asn Ser Leu Tyr Pro 485 490 495 CCT TTA ACT TCC CTC AGA TCA CTC TTT GGC AAC GAC CCG TCA TCA CAG 1536 Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gln 500 505 510 TAA 1539 (2) I N FORMAC IÓN PARA SEQ I D NO: 4: (i) CARACTERÍSTICAS DE LA SECUEN CIA (A) LONG ITU D: 512 aminoácidos (B) TI PO: aminoácido (C) FORMA DE H I LO : sencillo (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉC U LA : prote ína (xi) DESCRI PC IÓ N DE LA SECU ENC IA: S EQ I D NO : 4 : Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp 1 5 10 15 Glu Ser He Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys 20 25 30 His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro 35 40 45 Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu 50 55 60 Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn 65 70 75 80- Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg He Gln He His Asn 85 90 95 Thr Gln Glu Ala Leu Asp Lys He Lys Glu Lys Gln Glu Gln His Lys 100 105 110 Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser 115 120 125 Asn He Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met 130 135 140 Val His Gln Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val 145 150 155 160 He Glu Glu Lys Ala Phe Ser Pro Glu Val He Pro Met Phe Met Ala 165 170 175 Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr 180 185 190 Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Val He Asn 195 200 205 Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro 210 215 220 Leu Pro Pro Gly Gln Leu Arg Asp Pro Arg Gly Ser Asp He Ala Gly 225 230 235 240 Thr Thr Ser Thr Leu Ala Glu Gln Val Ala Trp Met Thr Ala Asn Pro 245 250 255 Pro Val Pro Val Gly Asp He Tyr Arg Arg Trp He Val Leu Gly Leu 260 265 270 Asn Arg He Val Arg Met Tyr Ser Pro Val Ser lie Leu Glu He Lys 275 280 285 Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys 290 295 300 Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr 305 310 315 320 Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Gln Leu Leu 325 330 335 Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys 340 345 350 Gln Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala 355 360 365 Met Ser Gln Val Gln Gln Pro Thr Thr Ser Val Phe Ala Gln Arg Gly 370 375 380 Asn Phe Lys Gly He Arg Lys Pro He Lys Cys Phe Asn Cys Gly Lys 385 390 395 400 Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys 405 410 415 Trp Lys Cys Gly Gln Glu Gly His Gln Met Lys Asp Cys Lys Asn Glu 420 425 430 Gly Arg Gln Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly 435 440 445 Arg Pro Gly Asn Phe Pro Gln Thr Thr Thr Arg Lys Glu Pro Thr Ala 450 455 460 Pro Pro Leu Glu Ser Tyr Gly Phe Gln Glu Glu Lys Ser Thr Gln Gly 465 470 475 480 Lys Glu Met Gln Glu Asn Gln Glu Arg Thr Glu Asn Ser Leu Tyr Pro 485 490 495 Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gln 500 505 510 (2) INFORMACIÓN PARA SEQ ID NO: 5: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 3045 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: ADN (genómico) (ix) CARACTE RÍSTICA (A) NOMBRE/CLAVE: CDS (B) U BICACIÓN : 1 ..3042 (xi) DESCRI PCIÓ N DE LA SECU ENCIA: SEQ I D NO: 5: TTT TTT AGG GAA GAG CTG GTC TCC CTT CA AGG GAG ACC AGG AAA CTT 48 Phe Phe Arg Glu Glu Leu Val Ser Leu Gln Arg Glu Thr Arg Lys Leu 515 520 525 CCC CCA GAC AAC AAC AAG GAA AGA GCC CAC AGC CCC GCC ACT AGA GAG 96 Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 530 535 540 TTA TGG GTT TCA GGA GGA GAA GAG CAC ACÁ GGG GAA GGA GAT GCA GGA 144 Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 545 550 555 560 GAA CCA GGA GAG GAC AGA GAA CTC TCT GTA CCC ACC TTT AAC TTC CCT 192 Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 565 570 575 CAG ATC ACT CTT TGG CAÁ CGA CCC GTC ATC ACÁ GTA AAA ATA GGG AAA 240 Gln He Thr Leu Trp Gln Arg Pro Val He Thr Val Lys He Gly Lys 580 585 590 GAA GTA AGA GAA GCT CTT TTA GAT ACÁ GGA GCT GAT GAT ACÁ GTA ATA 288 Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val He 595 600 605 GAA GAG CTA CAÁ TTA GAG GGA AAA TGG AAA CCA AAA ATG ATA GGA GGA 336 Glu Glu Leu Gln Leu Glu Gly Lys Trp Lys Pro Lys Met He Gly Gly 610 615 620 ATT GGA GGA TTT ATC AAA GTG AGA CAÁ TAT GAT AAT ATA ACÁ GTA GAC 384 He Gly Gly Phe He Lys Val Arg Gln Tyr Asp Asn He Thr Val Asp 625 630 635 640 ATA CAG GGA AGA AAA GCA GTT GGT ACÁ GTA TTA GTA GGA CCA ACÁ CCT 432 He Gln Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 645 650 655 GTT AAT ATT ATA GGA AGA AAT CTT TTA ACC CAG ATT GGC TGT ACT TTA 480 Val Asn He He Gly Arg Asn Leu Leu Thr Gln He Gly Cys Thr Leu 660 665 670 AAT TTT CCA ATA AGT CCT ATT GAA ACT GTA CCA GTA AAA TTA AAA CCA 528 Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 675 680 685 GGA ATG GAT GGC CCA AAG GTA AAA CAÁ TGG CCT TTG ACÁ ACÁ GAA AAA 576 Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Thr Glu Lys 690 695 700 ATA GAG GCA TTA AGA GAA ATT TGT AC GAA ATG GAA AAG GAA GGA AAA 624 He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 705 710 715 720 ATT TCT AGA ATA GGG CCT GAG AAT CCA TAT AAC ACT CCA ATT TTT GCT 672 He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 725 730 735 ATA AAA AAG AAA GAT AGC ACT AAA TGG AGA AAA TTA GTA GAT TTC AGG 720 He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 740 745 750 GAA TTA AAT AAA AGG ACC CAÁ GAT TTT TGG GAA GTG CAG CTA GGA ATT 768 Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly He 755 760 765 CCA CAT CCA GCA GGA TTA AAG CAG AAA AAA TCA GTG ACÁ GTT TTG GAT 816 Pro His Pro Ala Gly Leu Lys Gln Lys Lys Ser Val Thr Val Leu Asp 770 775 780 GTA GGA GAT GCT TAT TTT TCA TGT CCC TTG GAC AAA GAT TTT AGA AAG 864 Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 785 790 795 800 TAT ACÁ GCT TTT ACC ATA CCT AGT ATA AAC AAT GAG ACÁ CCT GGT ATT 912 Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 805 810 815 AGA TAC CAG TAT AAT GTG CTG CCA CAÁ GGC TGG AAA GGG TCA CCA GCA 960 Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala 820 825 830 ATT TTT CAG AGT ACÁ ATG ACÁ AAA ATT CTA GAA CCA TTC AGA GAG AAA 1008 He Phe Gln Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 835 840 845 CAT CCA GAG ATA ATC ATT TAC CAG TAC ATG GAT GAC CTC TAT GTG GGA 1056 His Pro Glu He He He Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly 850 855 860 TCT GAC TTA GAA CTA GCA CAÁ CAT AGA GAG GCA GTA GAA GAC CTC AGA 1104 Ser Asp Leu Glu Leu Ala Gln His Arg Glu Ala Val Glu Asp Leu Arg 865 870 875 880 GAT CAT CTT TTG AAG TGG GGC TTT ACG ACC CCT GAC AAA AAA CAT CAG 1152 Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Aso Lys Lys His Gln 885 890 * 895 AAG GAG CCC CCG TTC CTC TGG ATG GGA TAT GAA CTC CAT CCA GAC AAA 1200 Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 900 905 910 TGG ACÁ GTC CAG CCA ATA AAG TTA CCA GAA AAG GAT GTA TGG ACT GTC 1248 Trp Thr Val Gln Pro He Lys Leu Pro Glu Lys ASD Val Trp Thr Val 915 920 925 AAT GAT ATA CAG AAA TTA GTA GGA AAG TTA AAT TGG GCA AGT CAG ATC 1296 Asn Asp He Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln He 930 935 940 TAT CCA GGA ATC AGA GTA AAA CAG CTC TGT AAA TTA ATC AGA GGA GCC 1344 Tyr Pro Gly He Arg Val Lys Gln Leu Cys Lys Leu He Arg Gly Ala 945 950 955 960 AGA GCT TTG ACÁ GAA GTA GTC AAC TTT ACÁ GAA GAA GCA GAA TTA GAA 1392 Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 965 970 975 CTA GCA GAA AAC AGG GAG ATA TTA AAA GAA CCC CTG CAT GGA GTC TAT 1440 Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 980 985 990 TAT GAC CCA GGA AAA GAA TTA GTA GCA GAA ATT CAÁ AAG CAÁ GGA CAÁ 1488 Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gln Lys Gln Gly Gln 995 1000 1005 GGT CAG TGG ACÁ TAT CAG ATT TAT CAG GAG TTA CAT AAA AAT TTA AAA 1536 Gly Gln Trp Thr Tyr Gln He Tyr Gln Glu Leu His Lys Asn Leu Lys 1010 1015 1020 ACÁ GGA AAG TAT GCA AAA ATG AGA TCT GCC CAT ACT AAT GAT ATA AAA 1584 Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 1025 1030 1035 1040 CAG TTA GTT GAA GTG GTA AGG AAA GTG GCA ACÁ GAA AGT ATA GTA ATT 1632 Gln Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He 1045 1050 1055 TGG GGA AAG ACT CCT AAA TTT AGA TTA CCA GTA CAÁ AAG GAA GTG TGG 1680 Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gln Lys Glu Val Trp 1060 1065 1070 GAG GCA TGG TGG ACC GAT CAT TGG CAÁ GCA ACT TGG ATT CCT GAG TGG 1728 Glu Ala Trp Trp Thr Asp His Trp Gln Ala Thr Trp He Pro Glu Trp 1075 1080 1085 GAA TTT GTC AAC ACT CCT CCC CTT GTA AAA TTA TGG TAT CAG TTA GAA 1776 Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu 1090 1095 1100 ACÁ GAG CCA ATC AGT GGG GCA GAA ACT TTC TAT GTA GAT GGA GCA GCT 1824 Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 1105 1110 1115 1120 AAT AGG GAA ACÁ AAA TTG GGA AAA GCA GGT TTT GTG ACÁ GAT AGG GGA 1872 Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 1125 1130 1135 AGA CAG AAA GTG GTC TCT ATT GCA GAC ACC ACC AAT CAÁ AAG GCT GAG 1920 Arg Gln Lys Val Val Ser He Ala Asp Thr Thr Asn Gln Lys Ala Glu 1140 1145 1150 TTA CAÁ GCT ATC CTT ATG GCC TTA CAÁ GAG TCA GGA CGG GAT GTA AAC 1968 Leu Gln Ala He Leu Met Ala Leu Gln Glu Ser Gly Arg Asp Val Asn 1155 1160 1165 ATA GTC ACT GAC TCT CAG TAT GCT ATG GGA ATA ATT CAT TCA CAG CCA 2016 He Val Thr Asp Ser Gln Tyr Ala Met Gly He He His Ser Gln Pro 1170 1175 1180 GAT AAA AGT GAA TCA GAA TTG GTG AGC CAÁ ATA ATA GAA GAG CTC ATA 2064 Asp Lys Ser Glu Ser Glu Leu Val Ser Gln He He Glu Glu Leu He 1185 1190 1195 1200 AAA AAG GAA AGA GTT TAT CTC TCT TGG GTA CCT GCA CAT AAA GGT ATT 2112 Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 1205 1210 1215 GGA GGA AAT GAG CAG GTA GAC AAA TTA GTT AGC TCA GGA ATT AGA AAA 2160 Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 1220 1225 1230 ATA TTA TTC CTA GAT GGT ATA GAA AAA GCC CAÁ GAA GAT CAT GAC AGA 2208 He Leu Phe Leu Asp Gly He Glu Lys Ala Gln Glu Asp His Asp Arg 1235 1240 1245 TAT CAC AGC AAT TGG AAA GCA ATG GCC AGT GAT TTT AAC TTA CCC CCC 2256 Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 1250 1255 1260 ATA GTG GCA AAA GAA ATA GTA GCC AGC TGT GAC AAA TGC CAG CTA AAA 2304 He Val Ala Lys Glu He Val Ala Ser Cys Asp Lys Cys Gln Leu Lys 1265 1270 1275 1280 GGG GAA GCC ATG CAT GGA CAG GTC AAT TGT AGT CCA GGA GTG TGG CAÁ 2352 Gly Glu Ala Met His Gly Gln Val Asn Cys Ser Pro Gly Val Trp Gln 1285 1290 1295 TTA GAT TGT ACÁ CAC TTA GAG GGA AAA ATC ATC CTT GTG GCG GTC CAT 2400 Leu Asp Cys Thr His Leu Glu Gly Lys He He Leu Val Ala Val His 1300 1305 1310 GTG GCC AGT GGC TAC TTA GAA GCA GAA GTT ATT CCT GCA GAG ACÁ GGA 2448 Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 1315 1320 1325 CAG GAA ACÁ GCA TAT TTT ATT TTA AAG TTA GCT GGA AGA TGG CCA GTA 2496 Gln Glu Thr Ala Tyr Phe lie Leu Lys Leu Ala Gly Arg Trp Pro Val 1330 1335 1340 AAA GTT ATA CAC ACT GAT AAT GGA TCC AAT TTC ACT AGT GCC ACT GTA 2544 Lys Val He His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 1345 1350 1355 1360 AAA GCA GCC TGT TGG TGG GCA AAT ATC AAA CAG GAA TTT GGG ATA CCC 2592 Lys Ala Ala Cys Trp Trp Ala Asn He Lys Gln Glu Phe Gly He Pro 1365 1370 1375 TAC AAT CCT CAÁ AGT CAG GGA GCA GTA GAG TCC ATG AAT AAA GAA TTA 2640 Tyr Asn Pro Gln Ser Gln Gly Ala Val Glu Ser Met Asn Lys Glu Leu 1380 1385 1390 AAG AAA ATT ATA GGA CAÁ ATC AGA GAT CA GCA GAA CAT CTA AAG ACÁ 2688 Lys Lys He He Gly Gln He Arg Asp Gln Ala Glu His Leu Lys Thr 1395 1400 1405 GCA GTG CAÁ ATG GCG GTT TTC ATT CAC AAT TTT AAA AGA AAA GGG GGG 2736 Ala Val Gln Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 1410 1415 1420 ATT GGG GGG TAC ACT GCA GGG GAA AGA ATA ATA GAC ATA ATA GCA ACÁ 2 84 He Gly Gly Tyr Thr Ala Gly Glu Arg He He Asp He He Ala Thr 1425 1430 1435 1440 GAC ATA CAG ACÁ ACÁ AAT TTA CAÁ ACÁ CA ATT TTA AAA GTT CAÁ AAT 2832 Asp He Gln Thr Thr Asn Leu Gln Thr Gln He Leu Lys Val Gln Asn 1445 1450 1455 TTT CGG GTT TAT TAC AGA GAC AGC AGA GAT CCC ATT TGG AAA GGA CCA 2880 Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 1460 1465 1470 GCC AAA CTT CTG TGG AAA GGA GAA GGG GCA GTG GTA ATT CAÁ GAT AAC 2928 Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gln Asp Asn 1475 1480 1485- GGG GAT ATA AAA GTA GTC CCA CGT AGG AAA GCA AAA ATA ATT AGG GAT 2976 Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 1490 1495 1500 TAT GGA AAA CAG ATG GCA GGT GAT GGT TGT GTG GCA AGT GGA CAG GAT 3024 Tyr Gly Lys Gln Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gln Asp 1505 1510 1515 1520 GAA AAT CAG GAA ATG GAA TAG 3045 Glu Asn Gln Glu Met Glu 1525 (2) I N FO RMACIÓN PARA SEQ I D NO: 6: (i) CARACTERÍSTICAS DE LA SECU ENCIA (A) LONG ITU D: 1014 aminoácidos (B) TI PO: aminoácido (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: porteína (xi) DESCR I PC IÓ N DE LA SECU ENCIA: SEQ I D NO: 6: Phe Phe Arg Glu Glu Leu Val Ser Leu Gln Arg Glu Thr Arg Lys Leu 1 5 10 15 Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu 20 25 30 Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly 35 40 45 Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro 50 55 60 Gln He Thr Leu Trp Gln Arg Pro Val He Thr Val Lys He Gly Lys 65 70 75 80 Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val He 85 90 95 Glu Glu Leu Gln Leu Glu Gly Lys Trp Lys Pro Lys Met He Gly Gly 100 105 110 He Gly Gly Phe He Lys Val Arg Gln Tyr Asp Asn He Thr Val Asp 115 120 125 He Gln Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro 130 135 140 Val Asn He He Gly Arg Asn Leu Leu Thr Gln He Gly Cys Thr Leu 145 150 155 160 Asn Phe Pro He Ser Pro He Glu Thr Val Pro Val Lys Leu Lys Pro 165 170 175 Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Thr Glu Lys 180 185 190 He Glu Ala Leu Arg Glu He Cys Thr Glu Met Glu Lys Glu Gly Lys 195 200 205 He Ser Arg He Gly Pro Glu Asn Pro Tyr Asn Thr Pro He Phe Ala 210 215 220 He Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg 225 230 235 240 Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly He 245 250 255 Pro His Pro Ala Gly Leu Lys Gln Lys Lys Ser Val Thr Val Leu Asp 260 265 270 Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys 275 280 285 Tyr Thr Ala Phe Thr He Pro Ser He Asn Asn Glu Thr Pro Gly He 290 295 300 Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala 305 310 315 320 He Phe Gln Ser Thr Met Thr Lys He Leu Glu Pro Phe Arg Glu Lys 325 330 335 His Pro Glu He He He Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly 340 345 350 Ser Asp Leu Glu Leu Ala Gln His Arg Glu Ala Val Glu Asp Leu Arg 355 360 365 Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gln 370 375 380 Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys 385 390 395 400 Trp Thr Val Gln Pro He Lys Leu Pro Glu Lys Asp Val Trp Thr Val 405 410 415 Asn Asp He Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln He 420 425 430 Tyr Pro Gly He Arg Val Lys Gln Leu Cys Lys Leu He Arg Gly Ala 435 440 445 Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu 450 455 460. Leu Ala Glu Asn Arg Glu He Leu Lys Glu Pro Leu His Gly Val Tyr 465 470 475 480 Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu He Gln Lys Gln Gly Gln 485 490 495 Gly Gln Trp Thr Tyr Gln He Tyr Gln Glu Leu His Lys Asn Leu Lys 500 505 510 Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp He Lys 515 520 525 Gln Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser He Val He 530 535 540 Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gln Lys Glu Val Trp 545 550 555 560 Glu Ala Trp Trp Thr A=p His Trp Gln Ala Thr Trp He Pro Glu Trp 565 570 575 Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu 580 585 590 Thr Glu Pro He Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala 595 600 605 Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly 610 615 620 Arg Gln Lys Val Val Ser He Ala Asp Thr Thr Asn Gln Lys Ala Glu 625 630 635 640 Leu Gln Ala He Leu Met Ala Leu Gln Glu Ser Gly Arg Asp Val Asn 645 650 655 He Val Thr Asp Ser Gln Tyr Ala Met Gly He He His Ser Gln Pro 660 665 '670 Asp Lys Ser Glu Ser Glu Leu Val Ser Gln He He Glu Glu Leu He 675 680 685 Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly He 690 695 700 Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly He Arg Lys 705 710 715 720 He Leu Phe Leu Asp Gly He Glu Lys Ala Gln Glu Asp His Asp Arg 725 730 735 Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro 740 745 750 He Val Ala Lys Glu He Val Ala Ser Cys Asp Lys Cys Gln Leu Lys 755 760 765 Gly Glu Ala Met His Gly Gln Val Asn Cys Ser Pro Gly Val Trp Gln 770 775 780 Leu Asp Cys Thr His Leu Glu Gly Lys He He Leu Val Ala Val His 785 790 795 800 Val Ala Ser Gly Tyr Leu Glu Ala Glu Val He Pro Ala Glu Thr Gly 805 810 815 Gln Glu Thr Ala Tyr Phe He Leu Lys Leu Ala Gly Arg Trp Pro Val 820 825 830 Lys Val He His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val 835 840 845 Lys Ala Ala Cys Trp Trp Ala Asn He Lys Gln Glu Phe Gly He Pro 850 855 860 Tyr Asn Pro Gln Ser Gln Gly Ala Val Glu Ser Met Asn Lys Glu Leu 8S5 870 875 880 Lys Lys He He Gly Gln He Arg Asp Gln Ala Glu His Leu Lys Thr 885 890 895 Ala Val Gln Met Ala Val Phe He His Asn Phe Lys Arg Lys Gly Gly 9Q0 905 910 He Gly Gly Tyr Thr Ala Gly Glu Arg He He Asp He He Ala Thr 915 920 925 Asp He Gln Thr Thr Asn Leu Gln Thr Gln He Leu Lys Val Gln Asn 930 935 940 Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro He Trp Lys Gly Pro 945 950 955 960 Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val He Gln Asp Asn 965 970 975 Gly Asp He Lys Val Val Pro Arg Arg Lys Ala Lys He He Arg Asp 980 985 990 Tyr Gly Lys Gln Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gln Asp 995 1000 1005 Glu Asn Gln Glu Met Glu 1010 (2) INFORMACIÓN PARA SEQ ID NO: 7: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 579 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..576 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 7: ATG GAA AAC AGA TGG CAG GTG ATG GTT GTG TGG CAÁ GTG GAC AGG ATG 48 Met Glu Asn Arg Trp Gln Val Met Val Val Trp Gln Val Asp Arg Met 1015 1020 1025 1030 AAA ATC AGG AAA TGG AAT AGC TTA GTA AAA CAT CAT ATG TAT GTG TCA 96 Lys He Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 1035 1040 1045 AAA AAG GCA AAA GGA TGG TAT TAT AGA CAT CAT TAT GAA ACÁ CAT CAC 1 4 Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 1050 1055 1060 CCA AAA ATA AGT TCA GAA GTA CAT ATC CCA GTA GGT CAG GCA AGA TTA 192 Pro Lys He Ser Ser Glu Val His He Pro Val Gly Gln Ala Arg Leu 1065 1070 1075 GTG ACÁ GTC ACT TAT TGG GGG CTA ACÁ ACÁ GGA GAA CAG TCT TGG CAT 240 Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gln Ser Trp His 1080 1085 1090 CTA GGA CAT GGA GTA TCC ATA GAA TGG AGA CTA AGA AAA TAC AAG ACÁ 288 Leu Gly His Gly Val Ser He Glu Trp Arg Leu Arg Lys Tyr Lys Thr 1095 1100 1105 1110 CAÁ GTT GAT CCT GAA ATG GCA GAC AAG CTA ATA CAT CTT CAT TAT TTT 336 Gln Val Asp Pro Glu Met Ala Asp Lys Leu He His Leu His Tyr Phe 1115 1120 1125 GAT TGT TTT ACÁ GCC TCT GCC ATA AGG CAÁ GCG GTC TTA GGG AGA CCA 384 Asp Cys Phe Thr Ala Ser Ala He Arg Gln Ala Val Leu Gly Arg Pro 1130 1135 1140 GTA TTA CCT AGG TGT GAA TAT CCA GCA GGG CAC AAA CAG GTA GGC ACC 432 Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gln Val Gly Thr 1145 1150 1155 CTA CAÁ TAT CTA GCA CTA ACÁ GCC TGG GTG GGA GCA AAG AAG AGA AAG 480 Leu Gln Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 1160 1165 1170 CCA CCC TTA CCT AGT GTG ACT AAG CTA ACÁ GAA GAT AGA TGG AAC GAG 528 Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 1175 1180 1185 1190 CAC CAG AAG ATG CAG GGC CAC AGA GGG AAC CCT ATA ATG AAT GGG CAC 576 His Gln Lys Met Gln Gly His Arg Gly Asn Pro He Met Asn Gly His 1195 1200 1205 TAG 579 (2) I N FORMACIÓN PARA SEQ I D NO: 8: (i) CARACTER ÍSTICAS DE LA SECU EN C IA (A) LONG ITU D: 192 aminoácidos (B) TI PO: aminoácidos (D) TOPOLOGÍA: lineal (ii) TI PO DE MOLÉCU LA: proteína (xi) DESCRI PCIÓ N DE LA SECU ENCIA: SEQ I D NO: 8: Met Glu Asn Arg Trp Gln Val Met Val Val Trp Gln Val Asp Arg Met 1 5 10 15 Lys He Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser 20 25 30 Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His 35 40 45 Pro Lys He Ser Ser Glu Val His He Pro Val Gly Gln Ala Arg Leu 50 55 60 Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gln Ser Trp His 65 70 75 80 Leu Gly His Gly Val Ser He Glu Trp Arg Leu Arg Lys Tyr Lys Thr 85 90 95 Gln Val Asp Pro Glu Met Ala Asp Lys Leu He His Leu His Tyr Phe 100 105 110 Asp Cys Phe Thr Ala Ser Ala He Arg Gln Ala Val Leu Gly Arg Pro 115 120 125 Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gln Val Gly Thr 130 135 140 Leu Gln Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys 145 150 155 160 Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu 165 170 175 His Gln Lys Met Gln Gly His Arg Gly Asn Pro He Met Asn Gly His 180 185 190 (2) INFORMACIÓN PARA SEQ ID NO: 9: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 288 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..285 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 9: ATG GAA CGA GCA CCA GAA GAT GCA GGG CCA CAG AGG GAA CCC TAT AAT 48 Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gln Arg Glu Pro Tyr Asn 195 200 205 GAA TGG GCA CTA GAA TTA TTA GAA GAA TTA AAA AAT GAA GCT GTG CGC 96 Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 210 215. 220 CAT TTT CCA AGG ATT TGG CTA CAT GGG TTA GGA CAÁ CAC ATC TAT AAC 144 His Phe Pro Arg He Trp Leu His Gly Leu Gly Gln His He Tyr Asn 225 230 235 240 ACÁ TAT GGA GAC ACC TGG GAG GGG GTA GAG GCA ATT ATC AGG ATA CTA 192 Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu 245 250 255 CAÁ CAÁ TTA CTG TTT ATC CAT TAT AGG ATT GGC TGC CAG CAC AGC AGA 240 Gln Gln Leu Leu Phe He His Tyr Arg He Gly Cys Gln His Ser Arg 260 265 270 ATA GGG ATC ACT CCT CAÁ AGG AGA AGG AAT GGA ACC AGT AGA TCC 285 He Gly He Thr Pro Gln Arg Arg Arg Asn Gly Thr Ser Arg Ser 275 280 285 TAG 288 (2) INFORMACIÓN PARA SEQ ID NO: 10: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 95 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 10: Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gln Arg Glu Pro Tyr Asn 1 5 10 15 Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg 20 25 30 His Phe Pro Arg He Trp Leu His Gly Leu Gly Gln His He Tyr Asn 35 40 45 Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala He He Arg He Leu '50 55 60 Gln Gln Leu Leu Phe He His Tyr Arg He Gly Cys Gln His Ser Arg 65 70 75 80 He Gly He Thr Pro Gln Arg Arg Arg Asn Gly Thr Ser Arg Ser 85 90 95 (2) INFORMACIÓN PARA SEQ ID NO: 11: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 252 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..249 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 11: ATG CTG TCA TTG GGA TTC ATA GCG TTA GGA GCA GCA GTT AGC ATA GCA 48 Met Leu Ser Leu Gly Phe He Ala Leu Gly Ala Ala Val Ser He Ala 100 105 110 GTA ATA GTC TGG GCA TTA CTA TAT AGA GAA TAT AAG AAA ATA AAA TTG 96 Val He Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys He Lys Leu 115 120 125 CAG GAA AAA ATA AAA CAC ATA AGA CAG AGA ATA AGA GAA AGA GAA GAA 14 Gln Glu Lys He Lys His He Arg Gln Arg He Arg Glu Arg Glu Glu 130 135 140 GAT AGT GGC AAT GAA AGT GAT GGG GAT GCA GAG TGG TTG GAT GGG GAT 192 Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 145 150 155 GAA GAG TGG TTG GTT ACT CTT CTA TCT TCT AGT AAG CTT GAT CAÁ GGT 2 0 Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gln Gly 160 165 170 175 AAT TGG GTC TGA 252 Asn Trp Val (2) INFORMACIÓN PARA SEQ ID NO: 12: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 83 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 12: Met Leu Ser Leu Gly Phe He Ala Leu Gly Ala Ala Val Ser He Ala 1 5 10 15 Val He Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys He Lys Leu 20 25 30 Gln Glu Lys He Lys His He Arg Gln Arg He Arg Glu Arg Glu Glu 35 40 45 Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp 50 55 60 Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gln Gly 65 70 75 80 Asn Trp Val (2) INFORMACIÓN PARA SEQ ID NO: 13: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 306 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..303 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 13: ATG GAA CCA GTA GAT CCT AGA TTA GAG CCC TGG AAT CAT CCA GGA AGC 48 Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 85 90 95 CAÁ CCT AAA ACÁ GCT TGC AAT AAT TGC TAT TGT AAA AGA TGT TGC TAT 96 Gln Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 100 105 110 115 CAC TGC TTA TAT TGC TTC ACÁ AAG AAA GGC TTA GGC ATC TCA TAT GGC 144 His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly He Ser Tyr Gly 120 125 130 AGG AAG AAG CGG AGT CAÁ CGA CGA AGA ACT CCT CAG AGC AGT AAG AGT 192 Arg Lys Lys Arg Ser Gln Arg Arg Arg Thr Pro Gln Ser Ser Lys Ser 135 140 145 CAT CAÁ GAT CTT ATA CCA GAG CAG CCC TTA TCC CAÁ CAG CAÁ GGG GAC 240 His Gln Asp Leu He Pro Glu Gln Pro Leu Ser Gln Gln Gln Gly Asp 150 155 160 CAG ACÁ GGC CAG AAG AAA CAG AAG GAG GCG TTG GAG AGC AAG ACÁ GAG 288 Gln Thr Gly Gln Lys Lys Gln Lys Glu Ala Leu Glu Ser Lys Thr Glu 165 170 175 GCA GAT CCG TGC GAT TAG 306 (2) INFORMACIÓN PARA SEQ ID NO: 14: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 101 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 14: Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser 1 5 10 15 Gln Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr 20 25 30 His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly He Ser Tyr Gly 35 40 45 Arg Lys Lys Arg Ser Gln Arg Arg Arg Thr Pro Gln Ser Ser Lys Ser 50 55 60 His Gln Asp Leu He Pro Glu Gln Pro Leu Ser Gln Gln Gln Gly Asp 65 70 75 80 Gln Thr Gly Gln Lys Lys Gln Lys Glu Ala Leu Glu Ser Lys Thr Glu 85 90 95 Ala Asp Pro Cys Asp 100 (2) INFORMACIÓN PARA SEQ ID NO: 15: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 369 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..366 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 15: ATG GCA GGA AGA AGC GGA GTC AAC GAC GAA GAA CTC CTC AGA GCA GTA 48 Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 105 110 115 AGA GTC ATC AAG ATC TTA TAC CAG AGC AGT TAT CCC AAC AGC AAG GGG 96 Arg Val He Lys He Leu Tyr Gln Ser Ser Tyr Pro Asn Ser Lys Gly 120 125 130 ACC AGA CAG GCC AGA AGA AAC AGA AGG AGG CGT TGG AGA GCA AGA CAG 144 Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gln 135 140 145 AGG CAG ATC CGT GCG ATT AGT GAG CGG ATT CTC AGC TCT TGT CTG GGA 192 Arg Gln He Arg Ala He Ser Glu Arg He Leu Ser Ser Cys Leu Gly 150 155 160 165 GGA CCT CCG GAA CCT GTT GAT CTT CCT CTA CCA CCG CTT GAC AGA CTC 240 Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 170 -175 180 ACT CTT GAT ACT GAG GAG GAC TCT GGA ACT CCT GGG ACÁ GAG TCT CAG 288 Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gln 185 190 195 CAG GGG ACT GCA ACT ACT GAA TGA ACT CAG AAC ACÁ CTT GTG GGG AAT 336 Gln Gly Thr Ala Thr Thr Glu * Thr Gln Asn Thr Leu Val Gly Asn 200 205 210 ACT TGC ATA TTG GGG AAA AGA GTT AAG GGA TAG 369 Thr Cys He Leu Gly Lys Arg Val Lys Gly 215 220 (2) INFORMACIÓN PARA SEQ ID NO: 16: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 122 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 16: Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val 1 5 10 15 Arg Val He Lys He Leu Tyr Gln Ser Ser Tyr Pro Asn Ser Lys Gly 20 25 30 Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gln 35 40 45 Arg Gln He Arg Ala He Ser Glu Arg He Leu Ser Ser Cys Leu Gly 50 55 60 Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu 65 70 75 80 Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gln 85 90 95 Gln Gly Thr Ala Thr Thr Glu * Thr Gln Asn Thr Leu Val Gly Asn 100 105 110 Thr Cys He Leu Gly Lys Arg Val Lys Gly 115 120 (2) INFORMACIÓN PARA SEQ ID NO: 17: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 2550 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) UBICACIÓN: 1..2556 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 17: ATG AAA GTG ATG GGG ATG CAG AGT GGT TGG ATG GGG ATG AAG AGT GGT 48 Met Lys Val Met Gly Met Gin Ser Gly Trp Met Gly Met Lys Ser Gly 125 130 135 TGG TTA CTC TTC TAT CTT CTA GTA AGC TTG ATC AAG GTA ATT GGG TCT 96 Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu He Lys Val He Gly Ser 140 145 150 GAA CAÁ CAT TGG GTA ACÁ GTG TAC TAT GGG GTA CCA GTA TGG AGA GAA 144 Glu Gln His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 155 160 165 170 GCA GAG ACÁ ACT CTT TTC TGT GCT TCA GAT GCT AAA GCC CAT AGT ACÁ 192 Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 175 180 185 GAG GCT CAC AAC ATC TGG GCC ACÁ CAÁ GCA TGT GTT CCT ACT GAT CCC 240 Glu Ala His Asn He Trp Ala Thr Gln Ala Cys Val Pro Thr Asp Pro 190 195 200 AAT CCA CAÁ GAA GTG CTA TTA CCC AAT GTA ACT GAA AAA TTT AAT ATG 288 Asn Pro Gln Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met 205 210 215 TGG GAA AAT AAA ATG GCA GAC CA ATG CAÁ GAG GAT ATT ATC AGT CTG 336 Trp Glu Asn Lys Met Ala Asp Gln Met Gln Glu Asp He He Ser Leu 220 225 230 TGG GAA CAG AGC TTA AAG CCC TGT GTT AAA TTA ACC CCA TTA TGT GTA 384 Trp Glu Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 235 240 245 250 ACT ATG CTT TGT AAC GAT AGC TAT GGG GAG GAA AGG AAC AAT ACÁ AAT 432 Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 255 260 265 ATG ACÁ ACÁ AGA GAA CCA GAC ATA GGA TAC AAA CAÁ ATG AAA AAT TGC 480 Met Thr Thr Arg Glu Pro Asp He Gly Tyr Lys Gln Met Lys Asn Cys 270 275 280 TCA TTC AAT GCA ACC ACT GAG CTA ACÁ GAT AAA AAG AAG CAÁ GTT TAC 528 Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gln Val Tyr 285 290 295 TCT CTG TTT TAT GTA GAA GAT GTA GTA CCA ATC AAT GCC TAT AAT AAA 576 Ser Leu Phe Tyr Val Glu Asp Val Val Pro He Asn Ala Tyr Asn Lys 300 305 310 ACÁ TAT AGG CTA ATA AAT TGT AAT ACC ACÁ GCT GTG ACÁ CAÁ GCT TGT 624 Thr Tyr Arg Leu He Asn Cys Asn Thr Thr Ala Val Thr Gln Ala Cys 315 320 325 330 CCT AAG ACT TCC TTT GAG CCA ATT CCA ATA CAT TAC TGT GCA CCA CCA 672 Pro Lys Thr Ser Phe Glu Pro He Pro He His Tyr Cys Ala Pro Pro 335 340 345 GGC TTT GCC ATT ATG AAA TGT AAT GAA GGA AAC TTT AGT GGA AAT GGA 720 Gly Phe Ala He Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 350 355 360 AGC TGT ACÁ AAT GTG AGT ACT GTA CAÁ TGC ACÁ CAT GGA ATA AAG CCA 768 Ser Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly He Lys Pro 365 370 375 GTG ATA TCC ACT CAG TTA ATC CTA AAT GGA AGC TTA AAT ACÁ GAT GGA 816 Val He Ser Thr Gln Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 380 385 390 ATT GTT ATT AGA AAT GAT AGT CAC AGT AAT CTG TTG GTG CAÁ TGG AAT 864 He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gln Trp Asn 395 400 405 410 GAG ACÁ GTG CCA ATA AAT TGT ACÁ AGG CCA GGA AAT AAT ACÁ GGA GGA 912 Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 415 420 425 CAG GTG CAG ATA GGA CCT GCT ATG ACÁ TTT TAT AAC ATA GAA AAA ATA 960 Gln Val Gln He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 430 435 440 GTA GGA GAC ATT AGA CAÁ GCA TAC TGT AAT GTC TCT AAA GAA CTA TGG 1008 Val Gly Asp He Arg Gln Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 445 450 455 GAA CCA ATG TGG AAT AGA ACÁ AGA GAG GAA ATA AAG AAA ATC CTG GGG 1056 Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 460 465 470 AAA AAC AAC ATA ACC TTC AGG GCT CGA GAG AGG AAT GAA GGA GAC CTA 1104 Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 475 480 485 490 GAA GTG ACÁ CAC TTA ATG TTC AAT TGT AGA GGA GAG TTT TTC TAT TGT 1152 Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 495 500 505 AAC ACT TCC AAA TTA TTT AAT GAG GAA TTA CTT AAC GAG ACÁ GGT GAG 1200 Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 510 515 520 CCT ATT ACT CTG CCT TGT AGA ATA AGA CAG ATT GTA AAT TTG TGG ACÁ 1248 Pro He Thr Leu Pro Cys Arg He Arg Gln He Val Asn Leu Trp Thr 525 530 535 AGG GTA GGA AAA GGA ATT TAT GCA CCA CCA ATT CGG GGA GTT CTT AAC 1296 Arg Val Gly Lys Gly He Tyr Ala Pro Pro He Arg Gly Val Leu Asn 540 545 550 TGT ACC TCC AAT ATT ACT GGA CTG GTT CTA GAA TAT AGT GGT GGG CCT 1344 Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 555 560 565 570 GAC ACC AAG GAA ACÁ ATA GTA TAT CCC TCA GGA GGA AAC ATG GTT AAT 1392 Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 575 580 585 CTC TGG AGA CAÁ GAG TTG TAT AAG TAC AAA GTA GTT AGC ATA GAA CCC 1440 Leu Trp Arg Gln Glu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 590 595 600 ATA GGA GTA GCA CCA GGT AAA GCT AAA AGA CGC ACÁ GTG AGT AGA GAA 1488 He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 605 610 615 AAA AGA GCA GCC TTT GGA CTA GGT GCG CTG TTT CTT GGG TTT CTT GGA 1536 Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 620 625 630 GCA GCA GGG AGC ACT ATG GGC GCA GCG TCA ATA ACG CTG ACG GTA CAG 1584 Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gln 635 640 645 650 GCC CGG ACÁ TTA TTA TCT GGG ATA GTG CAÁ CAG CAG AAT ATT CTG TTG 1632 Ala Arg Thr Leu Leu Ser Gly He Val Gln Gln Gln Asn He Leu Leu 655 660 665 AGA GCA ATA GAG GCG CAÁ CAÁ CAT TTG TTG CAÁ CTC TCA ATC TGG GGC 1680 Arg Ala He Glu Ala Gln Gln His Leu Leu Gln Leu Ser He Trp Gly 670 675 680 ATT AAA CAG CTC CAG GCA AAA GTC CTT GCT ATA GAA AGA TAC CTT AGG 1728 He Lys Gln Leu Gln Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 685 690 695 GAT CAG CAÁ ATC CTA AGT CTA TGG GGC TGC TCA GGA AAA ACÁ ATA TGC 1776 Asp Gln Gln He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 700 705 710 TAT ACC ACT GTG CCT TGG AAT GAG ACT TGG AGC AAC AAT ACC TCT TAT 1824 Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 715 720 725 730 GAT ACÁ ATC TGG AAT AAT TTA ACC TGG CAÁ CAÁ TGG GAT GAG AAA GTA 1872 Asp Thr He Trp Asn Asn Leu Thr Trp Gln Gln Trp Asp Glu Lys Val 735 740 745 AGA AAC TAT TCA GGT GTC ATT TT GGA CTT ATA GAA CAG GCA CAÁ GAA 1920 Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gln Ala Gln Glu 750 755 760 CAÁ CAG AAC AC AAT GAG AAA TCA CTC TTG GAA TTG GAT CAÁ TGG GAC 1968 Gln Gln Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gln Trp Asp 765 770 775 AGT CTG TGG AGC TGG TTT GGT ATT ACÁ AAA TGG CTG TGG TAT ATA AAA 2016 Ser Leu Trp Ser Trp Phe Gly He Thr Lys Trp Leu Trp Tyr He Lys 780 785 790 ATA GCT ATA ATG ATA GTA GCA GGC ATT GTA GGC ATA AGA ATC ATA AGT 2064 He Ala He Met He Val Ala Gly He Val Gly He Arg He He Ser 795 800 805 810 ATA GTA ATA ACT ATA ATA GCA AGA GTT AGG CAG GGA TAT TCT CCC CTT 2112 He Val He Thr He He Ala Arg Val Arg Gln Gly Tyr Ser Pro Leu 815 820 825 TCG TTG CAG ACC CTT ATC CCA ACÁ GCA AGG GGA CCA GAC AGG CCA GAA 2160 Ser Leu Gln Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 830 835 840 GAA ACÁ GAA GGA GGC GTT GGA GAG CA GAC AGA GGC AGA TCC GTG CGA 2208 Glu Thr Glu Gly Gly Val Gly Glu Gln Asp Arg Gly Arg Ser Val Arg 845 850 855 TTA GTG AGC GGA TTC TCA GCT CTT GTC TGG GAG GAC CTC CGG AAC CTG 2256 Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 860 865 870 TTG ATC TTC CTC TAC CAC CGC TTG ACÁ GAC TCA CTC TTG ATA CTG AGG 2304 Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 875 880 885 890 AGG ACT CTG GAA CTC CTG GGA CAG AGT CTC AGC AGG GGA CTG CAÁ CTA 2352 Arg Thr Leu Glu Leu Leu Gly Gln Ser Leu Ser Arg Gly Leu Gln Leu 895 900 905 CTG AAT GAA CTC AGA ACÁ CAC TTG TGG GGA ATA CTT GCA TAT TGG GGA 2400 Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 910 915 920 AAA GAG TTA AGG GAT AGT GCT ATC AGC TTG CTT AAT ACÁ ACÁ GCT ATT 2448 Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 925 930 935 GTA GTA GCA GAA GGA ACÁ GAT AGG ATT ATA GAA TTA GCA CAÁ AGA ATA 2496 Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gln Arg He 940 945 950 GGA AGG GGA ATA TTA CAC ATA CCT AGA AGA ATC AGA CAÁ GGC CTA GAA 2544 Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gln Gly Leu Olu 955 960 965 970 AGA GCA CTG ATA TAA 2559 Arg Ala Leu He (2) I N FORMACIÓN PARA SEQ I D NO: 18: (i) CARACTER ÍSTICAS DE LA SECU EN C IA (A) LONG ITU D: 852 aminoácidos (B) TI PO: aminoácidos (D) TOPOLOGÍA: lineal (¡i) TI PO DE MOLÉCU LA: proteína (xi) DESCRI PCIÓN DE LA SECU ENCIA: SEQ I D NO: 18: Met Lys Val Met Gly Met Gln Ser Gly Trp Met Gly Met Lys Ser Gly 1 5 10 15 Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu He Lys Val He Gly Ser 20 25 30 Glu Gln His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu 35 40 45 Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr 50 55 60 Glu Ala His Asn He Trp Ala Thr Gln Ala Cys Val Pro Thr Asp Pro 65 70 75 80 Asn Pro Gln Glu Val Leu Leu Pro Asn Val Thr Olu Lys Phe Asn Met 85 90 95 Trp Glu Asn Lys Met Ala Asp Gln Met Gln Glu Asp He He Ser Leu 100 105 110 Trp Glu Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val 115 120 125 Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn 130 135 * 140 Met Thr Thr Arg Glu Pro Asp He Gly Tyr Lys Gln Met Lys Asn Cys 145 150 155 160 Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gln Val Tyr 165 170 175 Ser Leu Phe Tyr Val Glu Asp Val Val Pro He Asn Ala Tyr Asn Lys 180 185 190 Thr Tyr Arg Leu He Asn Cys Asn Thr Thr Ala Val Thr Gln Ala Cys 195 200 205 Pro Lys Thr Ser Phe Glu Pro He Pro He His Tyr Cys Ala Pro Pro 210 215 220 Gly Phe Ala He Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly 225 230 235 240 Ser Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly He Lys Pro 245 250 255 Val He Ser Thr Gln Leu He Leu Asn Gly Ser Leu Asn Thr Asp Gly 260 265 270 He Val He Arg Asn Asp Ser His Ser Asn Leu Leu Val Gln Trp Asn 275 280 285 Glu Thr Val Pro He Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly 290 295 300 Gln Val Gln He Gly Pro Ala Met Thr Phe Tyr Asn He Glu Lys He 305 310 315 320 Val Gly Asp He Arg Gln Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp 325 330 335 Glu Pro Met Trp Asn Arg Thr Arg Glu Glu He Lys Lys He Leu Gly 340 345 350 Lys Asn Asn He Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu 355 360 365 Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys 370 375 380 Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu 385 390 395 400 Pro He Thr Leu Pro Cys Arg He Arg Gln He Val Asn Leu Trp Thr 405 410 415 Arg Val Gly Lys Gly He Tyr Ala Pro Pro He Arg Gly Val Leu Asn 420 425 430 Cys Thr Ser Asn He Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro 435 440 445 Asp Thr Lys Glu Thr He Val Tyr Pro Ser Gly Gly Asn Met Val Asn 450 455 460 Leu Trp Arg Gln Giu Leu Tyr Lys Tyr Lys Val Val Ser He Glu Pro 465 470 475 «80 He Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu 485 - 490 495 Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly 500 505 510 Ala Ala Gly Ser Thr Met Gly Ala Ala Ser He Thr Leu Thr Val Gln 515 520 525 Ala Arg Thr Leu Leu Ser Gly He Val Gln Gln Gln Asn He Leu Leu 530 535 540 Arg Ala He Glu Ala Gln Gln His Leu Leu Gln Leu Ser He Trp Gly 545 550 555 560 He Lys Gln Leu Gln Ala Lys Val Leu Ala He Glu Arg Tyr Leu Arg 565 570 575 Asp Gln Gln He Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr He Cys 580 585 590 Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr 595 600 605 Asp Thr He Trp Asn Asn Leu Thr Trp Gln Gln Trp Asp Glu Lys Val 610 615 620 Arg Asn Tyr Ser Gly Val He Phe Gly Leu He Glu Gln Ala Gln Glu 625 630 635 640 Gln Gln Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gln Trp Asp 645 650 655 Ser Leu Trp Ser Trp Phe Gly He Thr Lys Trp Leu Trp Tyr He Lys 660 665 670 He Ala He Met He Val Ala Gly He Val Gly He Arg He He Ser 675 680 685 He Val He Thr lie He Ala Arg Val Arg Gln Gly Tyr ser Pro Leu 690 695 700 Ser Leu Gln Thr Leu He Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu 705 710 715 720 Glu Thr Glu Gly Gly Val Gly Glu Gln Asp Arg Gly Arg Ser Val Arg 725 730 735 Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu 740 745 750 Leu He Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu He Leu Arg 755 760 765 Arg Thr Leu Glu Leu Leu Gly Gln Ser Leu Ser Arg Gly Leu Gln Leu 770 775 780 Leu Asn Glu Leu Arg Thr His Leu Trp Gly He Leu Ala Tyr Trp Gly 785 790 795 800 Lys Glu Leu Arg Asp Ser Ala He Ser Leu Leu Asn Thr Thr Ala He 805 810 815 Val Val Ala Glu Gly Thr Asp Arg He He Glu Leu Ala Gln Arg He 820 825 830 Gly Arg Gly He Leu His He Pro Arg Arg He Arg Gln Gly Leu Glu 835 840 845 Arg Ala Leu He 850 (2) INFORMACIÓN PARA SEQ ID NO: 19: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 639 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) CARACTERÍSTICA (A) NOMBRE/CLAVE: CDS (B) U BICACIÓ N : 1 ..636 (xi) DESCRI PCIÓN DE LA SECU ENC IA: SEQ I D NO: 19: ATG GGA AAG ATT TGG TCA AAG AGC AGC CTA GTA GGA TGG CCA GAA ATC 48 Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 855 860 865 AGA GAA AGA ATG AGA AGA CAÁ ACG CAÁ GAA CCA GCA GTA GAG CCA GCA 96 Arg Glu Arg Met Arg Arg Gln Thr Gln Glu Pro Ala Val Glu Pro Ala 870 875 880 GTA GGA GCA GGA GCA GCT TCT CAÁ GAT CTA GCT AAT CGA GGG GCC ATC 144 Val Gly Ala Gly Ala Ala Ser Gln Asp Leu Ala Asn Arg Gly Ala He 885 890 895 900 ACC ATA AGA AAT ACT AGA GAC AAT AAT GAA AGT ATA GCT TGG CTA GAA 192 Thr He Arg Asn Thr Arg Asp Asn Asn Glu Ser He Ala Trp Leu Glu 905 910 915 GCA CAÁ GAA GAA GAA GAG GAA GTA GGC TTT CCA GTA CGC CCT CAG GTA 240 Ala Gln Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val 920 925 930 CCA TTA AGG CCA ATA ACC TAT AAA CAG GCT TTT GAT CTT TCC TTC TTT 288 Pro Leu Arg Pro He Thr Tyr Lys Gln Ala Phe Asp Leu Ser Phe Phe 935 940 945 TTA AAA GAT AAG GGG GGA CTG GAA GGG CTA GTT TGG TCC AGA AAA AGG 336 Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 950 955 960 CAÁ GAT ATT CTA GAC CTC TGG ATG TAT CAC ACÁ CAÁ GGC ATC CTC CCT 384 Gln Asp He Leu Asp Leu Trp Met Tyr His Thr Gln Gly He Leu Pro 965 970 975 980 GAC TGG CAT AAC TAC ACÁ CCA GGG CCA GGA ATT AGA TAC CCC GTA ACC 432 Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 985 990 995 TTT GGA TGG TGC TTC AAA CTA GTA CCA TTG TCA GCT GAA GAA GTA GAA 480 Phe Gly Tro Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 1000 1005 1010 GAG GCT AAT GAA GGA GAC AAC AAT GCC CTC TTA CAC CCC ATA TGT CAÁ 528 Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gln 1015 1020 1025 CAT GGA GCA GAT GAT GAT CAT AAA GAA GTG TTG GTG TGG CGA TTT GAC 576 His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 1030 1035 1040 AGC TCC CTA GCA AGA AGA CAT GTA GCA AGA GAG CTG CAT CCG GAG TTT 624 Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 1045 1050 1055 1060 TAC AAG AAC TGC TGA 639 Tyr Lys Asn Cys (2) INFORMACIÓN PARA SEQ ID NO: 20: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 212 aminoácidos (B) TIPO: ácido nucleico (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 20: Met Gly Lys He Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu He 1 5 10 15 Arg Glu Arg Met Arg Arg Gln Thr Gln Glu Pro Ala Val Glu Pro Ala 20 25 30 Val Gly Ala Gly Ala Ala Ser Gln Asp Leu Ala Asn Arg Gly Ala He 35 40 45 Thr He Arg Asn Thr Arg Asp Asn Asn Glu Ser He Ala Trp Leu Glu 50 55 60 Ala Gln Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val 65 70 75 80 Pro Leu Arg Pro He Thr Tyr Lys Gln Ala Phe Asp Leu Ser Phe Phe 85 90 95 Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg 100 105 110 Gln Asp He Leu Asp Leu Trp Met Tyr His Thr Gln Gly He Leu Pro 115 120 125 Asp Trp His Asn Tyr Thr Pro Gly Pro Gly He Arg Tyr Pro Val Thr 130 135 140 Phe Gly Trp Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu 145 150 155 160 Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro He Cys Gln 165 170 175 His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp 180 185 190 Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe 195 200 205 Tyr Lys Asn Cys 210 (2) INFORMACIÓN PARA SEQ ID NO: 21: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 20 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 21 ATTGCGTACT CACACTTCCG 20 (2) INFORMACIÓN PARA SEQ ID NO: 22: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 17 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 22: GGCAAGCAGG GAGCTGG 17 (2) INFORMACIÓN PARA SEQ ID NO: 23: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 23: TCCTTGAGCA GTCTGGAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 24: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<iniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 24: GAACACCACC ATTAGCAG 18 (2) INFORMACIÓN PARA SEQ ID NO: 25: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 19 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 25: ACCAGAGGCT ATGTCACA 18 (2) INFORMACIÓN PARA SEQ ID NO: 26: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 19 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 26: TGTAAGGCC CTAGAAGA 19 (2) INFORMACIÓN PARA SEQ ID NO: 27: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 27: ACAGAGAACT CTCTGTAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 28: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 28: AAGAAAAGCA GTTGGTAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 29: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 17 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 29: TTTCTTCCCT GTATGTC 17 (2) INFORMACIÓN PARA SEQ ID NO: 30: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 30: GTTATATGGA TTCTCAGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 31: (i) CARACTERÍSTICAS DE LA SECUENCIA • (A) LONGITUD: 19 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 31 TGGCAGCA TTATACTGG 19 (2) INFORMACIÓN PARA SEQ ID NO: 32: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 23 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 32: ATCATTACC AGTACATCCA CGA 23 (2) INFORMACIÓN PARA SEQ ID NO: 33: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 33: TGTCAGGGGT CGTAAAGC 18 (2) INFORMACIÓN PARA SEQ ID NO: 34: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 34: TCCTCTGGAT GGGATATG 18 (2) INFORMACIÓN PARA SEQ ID NO: 35: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 35: TCTATCCAGG AATCAGAG 18 (2) INFORMACIÓN PARA SEQ ID NO: 36: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 36: AATGAGATCT GCCCATAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 37: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 37: TGACAGATAC GGGAAGAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 38: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 38: AACCGCCATT TGCACTCC 10 (2) INFORMACIÓN PARA SEQ ID NO: 39: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 39: ACATGGACCG CCACAAGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 40: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 40: AGCAACAGAC ATACAGAC 18 (2) INFORMACIÓN PARA SEQ ID NO: 41: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 41 AAAGTAGTCC CACGTAGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 42: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 42: ATATCCCAGT AGGTCAGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 43: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 43: TCTAGCACTA ACAGCCTG 18 (2) INFORMACIÓN PARA SEQ ID NO: 44: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 44: ACTCTTACTG CTCTGAGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 45: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 45: CCATACTACA CTGTTACC 18 (2) INFORMACIÓN PARA SEQ ID NO: 46: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 20 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 46: CATAGCTATC GTTACAAAGC 20 (2) INFORMACIÓN PARA SEQ ID NO: 47 : (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 47: TCATAATGGC AAGCCTG 18 (2) INFORMACIÓN PARA SEQ ID NO: 48: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 48: CTATTCCACA TTGGTTCC 18 (2) INFORMACIÓN PARA SEQ ID NO: 49: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 49: ATTCTAGAAC CAGTCCAG 18 (2) INFORMACIÓN PARA SEQ ID NO: 50: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 10 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 50: CCTTAGGGAT CAGCAAATCC 20 (2) INFORMACIÓN PARA SEQ ID NO: 51: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 51 TGGGACAGTC TGTGGAGC 18 (2) INFORMACIÓN PARA SEQ ID NO: 52: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 52: TTCTCAGCTC TTGTCTGG 18 (2) INFORMACIÓN PARA SEQ ID NO: 53: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 43: ATTAAGCAAG CTGATAGC 18 (2) INFORMACIÓN PARA SEQ ID NO: 54: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 16 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 54: TGTGCTTCTA GCCAAG 16 (2) INFORMACIÓN PARA SEQ ID NO: 55: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 18 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 55: GCTCCATGTT GACATATG 18 (2) INFORMACIÓN PARA SEQ ID NO: 56: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 17 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 56: AGAGAGACCC AGTACAAG 17 (2) INFORMACIÓN PARA SEQ ID NO: 57: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 20 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: otro ácido nucleico (A) DESCRIPCIÓN: /desc = <<lniciador>> (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 57: ATAAAAGCAG CCGCTTCTCG 20 (2) INFORMACIÓN PARA SEQ ID NO: 58: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly Gln Val Gln He Gly Pro 1 5 10 15 Ala Met Thr Phe Tyr Asn He Glu Lys He Val Gly Asp He Arg Gln 20 25 30 Ala Tyr Cys 35 (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 58: (2) INFORMACIÓN PARA SEQ ID NO: 59: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 59: Cys His Arg Pro Gly Asn Asn Thr Arg Gly Glu Val Gln He Gly Pro 1 5 10 15 Gly Met Thr Phe Tyr Asn He Glu Asn Val Tyr Gly Asp Thr Arg Ser 20 25 30 Ala Tyr Cys 35 (2) INFORMACIÓN PARA SEQ ID NO: 60: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 60: Cys He Arg Pro Gly Asn Arg Thr Tyr Arg Asn Leu Gln He Gly Pro 1 5 10 15 Gly Met Thr Phe Tyr Asn Val Glu He Ala Thr Gly Asp He Arg Lys 20 25 30 Ala Phe Cys 35 (2) INFORMACIÓN PARA SEQ ID NO: 61: (i) CARACTERÍSTICAS DE LA SECUENCIA (A) LONGITUD: 35 aminoácidos (B) TIPO: aminoácido (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: péptido (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 61 Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Val Arg He Gly Pro 1 5 10 15 Gly Gln Ala Phe Tyr Ala Thr Gly Asp He He Gly Asp He Arg Gln 20 25 30 Ala His Cys 35

Claims

REIVIN DICACION ES 1 . Cepa de V1 H-1 que no es del grupo M, ni del O, la cual exhibe las características morfológicas e inmunológicas del retrovirus que se depositó el 2 de Julio de 1996 bajo el número I-1753 (designado YBF30) en el equipo de la Colección Nacional de Cultivos de Microorganismos contenida por el Instituto Pasteur.
2. Secuencias de ácidos nucleicos, caracterizadas porque se derivan de la cepa de acuerdo con la reivindicación 1 .
3. Secuencias de ácidos nucleicos de acuerdo con la reivindicación 2, caracterizadas porque que se seleccionan del grupo que consiste de las siguientes secuencias: la secuencia de nucleótidos completa de la cepa de acuerdo con la reivindicación 1 (SEQ I D No. 1 ) así como los fragmentos de ácidos nucleicos que se derivan de dicha cepa: (SEQ I D No. 2), (SEQ I D No. 3), (SEQ I D No. 5), (SEQ I D No. 7), (SEQ I D NO.9) , (SEQ I D No. 1 1 ), (SEQ I D No. 13) , (SEQ I D No. 15) , (SEQ I D No. 17), (SEQ I D No. 19) y las secuencias SEQ I D No. 21 -57, y también cualquier secuencia que no es idéntica a una de las secuencias de nucleótidos anteriores, o que no es complementaria a una de estas secuencias, pero que sin embargo es capaz de hibridrizarse con una secuencia de ácidos nucleicos que se derivan de un virus de VI H-1 que no es del grupo M ni del O.
4. Oligonucleótido, caracterizado porque se selecciona de las secuencias SEQ I D No. 21 a 57, y porque es capaz de usarse como un iniciador o como una sonda para detectar VIH-1 de acuerdo con la reivindicación 1 ó reivindicación 5.
5. Virus de VI H-1 , caracterizados porque difieren del grupo M y del grupo O y exhiben las siguientes características: poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a proteínas que se derivan de la cepa YBF30 de acuerdo con la reivindicación 1 o la cepa VIS de CPZGAB; ausencia de amplificación genómica cuando se usan iniciadores en las regiones env y gag de virus VI H- 1 y de los grupos M y O; amplificación genómica en presencia de iniciadores que se derivan de la cepa YBF30, de acuerdo con la reivindicación 4; y homología de los productos del gen de cubierta que es >70% con respecto a la cepa YBF30.
6. Método para diagnosticar in vitro un virus de V1 H-1 del grupo que no es del grupo M, ni del O por medio de hibridización y/o amplificación de genes, cuyo método se llevó a cabo usando una muestra biológica (suero o linfocito en circulación) y se caracteriza porque comprende: . un paso de extraer el ácido nucleico el cual será detectado y que pertenece al genoma del virus, cuyo virus posiblemente puede estar presente en la muestra biológica, y, en donde es apropiado, un paso de tratar el ácido nucleico usando una transcriptasa inversa, si este ácido nucleico está en forma de ARN . . por lo menos un ciclo que comprende los pasos de desnaturalizar el ácido nucleico, de hibridizarse con por lo menos una secuencia de acuerdo reivindicación 3 o reivindicación 4 y cuando es apropiado, extender el híbrido, el cual se ha formado en presencia de reactivos adecuados (agente de polimerización, tal como ADN polimerasa y dNTP), y . un paso para detectar la presencia posible del ácido nucleico que pertenece al genoma de un virus del tipo de VI H-1 que no es del grupo M, ni del O.
7. Péptido, caracterizado porque se expresa por una cepa de VIH- 1 que no es del grupo M, ni del O de acuerdo con la reivindicación 1 o reivindicación 3 o usando una secuencia de nucleótidos de acuerdo con la reivindicación 3 y porque es capaz de (1 ) reconocerse por anticuerpos que se inducen por un virus de VIH-1 que no es del grupo M, ni del O de acuerdo con la reivindicación 1 o reivindicación 5, o una variante de este virus, y que está presente en una muestra biológica que se obtiene después de una infección con una cepa que no es del grupo M, ni del O, y/o (2) inducir la producción de anticuerpos de VI H- 1 anti-grupo que no es del grupo M, ni del O.
8. Péptido de acuerdo con la reivindicación 7, caracterizado porque se selecciona del que se expresa por el gen gag (SEQ I D No. 4), aquellas que se expresa por el gen pol (SEQ I D No. 6) , aquel que se expresa por el gen vif (SEQ I D No. 8) , aquel que se expresa por el gen vpr (SEQ I D No. 12), aquel que se expresa por el gen raí (SEQ I D No. 14) , aquel que se expresa por el gen rev (SEQ I D No. 16), aquel que se expresa por el gen env (SEQ I D No. 18) , o uno de sus fragmentos tal como un fragmento de la región del bucle V3 (SEQ I D No. 58), y del que se expresa por el gen nef (SEQ I D No. 20), o un fragmento de estos péptidos que son capaces de reconocer los anticuerpos que se producen durante una infección con un virus de VI H-1 de acuerdo con la reivindicación 1 ó reivindicación 5.
9. Composiciones inmunogénicas que comprenden uno o más productos de translación de secuencias de nucleótidos de acuerdo con la reivindicación 3 y/o uno de los péptidos de acuerdo con la reivindicación 7 o reivindicación 8.
10. Anticuerpos que se dirigen contra uno o más de los péptidos de acuerdo con la reivindicación 7 o reivindicación 8.
1 1. Método para el diagnóstico in-vitro de un virus de VI H-1 que no es del grupo M, ni del O, caracterizado porque comprende poner en contacto una muestra biológica que se ha retirado de un paciente, con anticuerpos de acuerdo con la reivindicación 10, que posiblemente se pueden combinar con anticuerpos de VIS anti-CPZGAB y detectar los complejos inmunológicos que se formaron entre los antígenos de VI H-1 , los cuales posiblemente estar presentes en la muestra biológica, y los anticuerpos.
12. Reactivo para diagnosticar un virus de VI H-1 que no es M, que no es O, caracterizado porque comprende una secuencia de acuerdo con cualquiera de las reivindicaciones 3, 4, 7 ó 8.
13. Método para tamizar y tipificar un virus de VI H-1 que no es del grupo M, ni del O, caracterizado porque comprende poner en contacto uno de los fragmentos de acuerdo con la reivindicación 3 ó reivindicación 4 con el ácido nucleico del virus que será tipificado y detectando el híbrido que se formó.
14. Equipo para diagnosticar un virus de VI H-1 que no es del grupo M, ni del O, caracterizado porque incluye por lo menos un reactivo de acuerdo con la reivindicación 12. RESU MEN Cepas retrovirales del grupo de VI H-1 que no es del grupo M, ni del O, en particular una cepa designada YBF30, sus fragmentos y también sus usos como un reactivo de diagnóstico y un agente inmunogénico. Los virus de VI H-1 que difieren tanto del grupo M y del grupo O, exhiben las siguientes características: poca o ninguna reactividad serológica con respecto a las proteínas de los grupos M y O y fuerte reactividad serológica con respecto a las proteínas que se derivan de la cepa YBF30 de acuerdo con la invención o la cepa VIS de CPZGAB; ausencia de la amplificación genomica cuando se usan iniciadores en las regiones env y gag y los grupos de VI H-1 de M y O; amplificación genomica en presencia de los iniciadores que se derivan de la cepa YBF30, de acuerdo con la invención; homología de los productos del gen de cubierta que es mayor al 70% con respecto a la de la cepa YBF30.