MXPA02004297A

MXPA02004297A - Clonacion, expresion y caracterizacion de un gen que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria.

Info

Publication number: MXPA02004297A
Application number: MXPA02004297A
Authority: MX
Inventors: Jeannin Pascale
Original assignee: Pf Medicament
Priority date: 1999-10-29
Filing date: 2000-10-30
Publication date: 2002-10-31
Also published as: ZA200203340B; WO2001031003A1; AU1284801A; WO2001031003B1; CN1391608A; FR2800388A1; EP1226248A1; JP2003516126A; CA2389522A1; BR0015161A

Abstract

La invencion se relaciona con la identificacion y caracterizacion de un gen novedoso que se expresa en celulas tumorales y que esta relacionado con la regulacion de la respuesta inmunitaria,. la clonacion y la caracterizacion de su ADNc y los polipeptidos correspondientes. La invencion tambien se relaciona con vectores que contienen un acido nucleico que codifica para tal gen,. celulas transformadas por los vectores y metodos de diagnostico y metodos de seleccion de un compuesto quimico o biologico capaz de interactuar, directa o in' directamente, con un acido nucleico o un polipeptido de la invencion. La invencion se relaciona ademas con compuestos para tratar patologias inmunitarias, en particular enfermedades autoinmunes y cancer.

Description

CLONACIÓN. EXPRESIÓN Y CARACTERIZACIÓN DE UN GEN QUE SE EXPRESA EN CÉLULAS TUMORALES Y QUE ESTA RELACIONADO CON LA REGULACIÓN DE LA RESPUESTA INMUNITARIA DESCRIPCIÓN DE LA INVENCIÓN La invención se relaciona con la identificación y caracterización de un gen novedoso que se expresa en células tumorales y que está relacionado con la regulación de la respuesta inmunitaria,. la clonación y la caracterización de su ADNc y los polipéptidos correspondientes. La invención también se relaciona con vectores que contienen un ácido nucleico que codifica para tal gen, células transformadas con los vectores y métodos de diagnóstico y métodos de selección de un compuesto químico o bioquímico capaz de interactuar, directa o indirectamente, con un ácido nucleico o un polipéptido de acuerdo con la ¡nvención. La invención también se relaciona con compuestos para tratar condiciones patológicos inmunitarias, en particular enfermedades autoinmunes y cáncer. Muchos mecanismos celulares, normales y patológicos, involucran expresión diferencial de genes, y algunos genes se expresan en tejidos específicos en momentos determinados o con resistencia particular. Entre estos genes, aquellos que codifican proteínas que se encuentran en compartimientos subcelulares o que se secretan fuera de la célula durante o después del procedimiento de traducción, son de gran valor.

Se puede hacer mención, en particular, de los genes que codifican para proteínas denominadas factores, tales como citocinas o genes que codifican para receptores unidos a membrana los cuales constituyen objetivos terapéuticos de elección. La mayor parte de estas proteínas, tales como las proteínas unidas a membrana tienen un dominio N terminal que corresponde a un péptido señal, un dominio extracelular y un dominio transmembranal. Por lo tanto, actualmente permanece una gran necesidad por identificar y caracterizar tales genes, cuya expresión es específica para ciertos tejidos o células, en particular para células involucradas en la regulación de la respuesta inmunitaria o células tumorales. Este es precisamente el objetivo de la presente invención. Un objetivo de la ¡nvención por lo tanto es la identificación y caracterización de un gen novedoso que se expresa preferencialmente en humanos en los tejidos linfoides, en particular en linfocitos T periféricos no estimulados y en células tumorales, el producto de traducción de cuyo gene es el tipo unido a membrana. En un primer aspecto, el objetivo de la presente ¡nvención es un ácido nucleico purificado o aislado, caracterizado porque comprende una secuencia de ácido nucleico que se elige del grupo de las siguientes secuencias: a) la secuencia SEC ID NO. 1 ; b) la secuencia de un fragmento de por lo menos 18 nucleótidos consecutivos, preferiblemente 20, 25, 30, 50, 100 ó 200 nucleótidos consecutivos, de la secuencia SEC ID NO.: 1 suprimida de su fragmento poliA terminal, preferiblemente del fragmento de la secuencia SEC ID No. 3, SEC ID NO.: 5, SEC ID NO.: 7 o SEC ID NO.: 9; c) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, de manera preferible 90%, 95% o 99%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); d) la secuencia complementaria, o la secuencia del ARN que corresponde a una secuencia como se define en los incisos a), b) o c). Preferiblemente, la presente invención se relaciona con un ácido nucleico purificado o aislado, caracterizado porque comprende una secuencia de ácido nucleico que se elige del grupo de las siguientes secuencias: a) la secuencia SEC ID NO.: 1 ; b) la secuencia de un fragmento de por lo menos 18 nucleótidos consecutivos, de la secuencia SEC ID NO.: 1 suprimida de su fragmento poliA terminal; c) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); d) la secuencia complementaria a, o la secuencia del ARN que corresponde a una secuencia como se define en los incisos a), b) o c). con la excepción de que la secuencia SEC ID NO. 11 del documento WO 99/54461 o la secuencia SEC ID NO. 51 del documento WO 99/06548 , y de las tres secuencias descritas en los documentos del banco de datos EMBL bajo los números de identificación Al 672868, AA 890726 y Al 301140. El documento WO 99/54461 es un documento de patente el cual se relaciona con secuencias de ácido nucleico expresadas por tejido de tumor de endometrio. Este documento describe en particular entre 635 secuencias, una secuencia de ácido nucleico SEC ID NO. 11 y su secuencia peptídica correspondiente SEC ID NO. 173, que tiene una identidad cercana a 100% con, respectivamente, un fragmento de la secuencia SEC ID NO. 1 (nt 1597-3313) y de la secuencia SEC ID NO. 2 (aa 519-1013) de la presente ¡nvención. Ese documento indica, en la página 153, que la secuencia del péptido SEC ID NO. 173 no corresponde a ninguna secuencia para la cual se conozca función. El documento WO 99/06548 es un documento que se relaciona con secuencias EST que codifican para proteínas secretadas que no son específicas de tejido. Ese documento describe en particular, entre las 545 secuencias descritas en la lista de secuencias dei mismo, la secuencia de ácido nucleico y la secuencia peptídica SEC ID No. 51 y la secuencia de aa37-113 (150 aminoácidos) de la cual muestra una homología muy fuerte con el fragmento de aa1-150 de la secuencia SEC ID No. 2, de acuerdo con la invención (aproximadamente 85% de identidad para el fragmento de 150 aminoácidos; ~ 94% para los primeros 135 aminoácidos). Ese documento también indica que el ADN que corresponde a esta secuencia EST 5' SEC ID No. 51 se origina de un tejido de tumor de próstata humano (véase página 40 de la lista de secuencias "fuente original"). El documento de "EMBL" Al 672868 describe una secuencia de ARNm la cual se origina de una biblioteca de tejidos de colon humanos afectados por la enfermedad de Crohn, y tiene un grado de identidad considerable con ia secuencia complementaria al fragmento de ADNc nt 441- 971 de la secuencia SEC ID No. 1 , de acuerdo con la invención. El documento de "EMBL" AA 890726 describe una secuencia de ARNm la cual se origina de una biblioteca de tejidos paratiroideos humanos con adenoma esporádico y tiene un grado de identidad considerable con la secuencia complementaria al fragmento de ADNc nt 2779-3309 de la secuencia SEC ID No. 1 , de acuerdo con la presente invención. Finalmente, el documento de "EMBL" Al 301140 describe una secuencia de ARNm la cual se origina de una biblioteca carcinoide pulmonar humana de tipo neuroendórino descrita, y tiene un grado considerable de identidad con la secuencia complementaria al fragmento de ADNc en la posición nt 2736-3299 de la secuencia SEC ID No. 1 , de acuerdo con la invención. Los términos "ácido nucleico", "secuencia de ácido nucleico", "polinucleótido", "oligonucleótido", "secuencia polinucleotídica" y "secuencia nucieotídica", términos los cuales se utilizarán de intercambiablemente en la presente invención se pretende que indiquen una cadena precisa de nucleótidos, la cual puede o no estar modificada, lo que posibilita definir un fragmento o una región de un ácido nucleico, que puede o no incluir nucleótidos no naturales y los cuales pueden corresponder a un ADN de cadena doble o a un ADN de cadena sencilla y a productos para la transcripción de tales ADN. Debe entenderse que la presente ¡nvención no se relaciona con secuencias nucleotídicas en su ambiente cromosómico natural, es decir, en su estado natural. Son secuencias las cuales se han aislado y/o purificado, es decir, se han eliminado directa o indirectamente, por ejemplo por copiado, y su ambiente ha sido modificado por lo menos parcialmente. Preferiblemente, la longitud de la secuencia de ácido nucleico de acuerdo con la presente ¡nvención será menor de 150 kb, incluso de manera más preferible menor de 100 kb, 50 kb, 25 kb, 10 kb o 5 kb. Para los propósitos de la presente ¡nvención, el término "porcentaje de identidad" entre dos secuencias de ácido nucleico o de aminoácidos se pretende que indique un porcentaje de nucleótidos o de residuos aminoácidos los cuales son idénticos entre las dos secuencias que se van a comparar, que se obtienen después de la mejor alineación, este porcentaje es solo estadístico y las diferencias entre las dos secuencias se distribuyen aleatoriamente y sobre toda la longitud. El término "mejor alineación" o "alineación óptima" se pretende que indique la alineación para la cual el porcentaje de identidad determinado como se indica en lo siguiente, sea el más alto. Las comparaciones de secuencia entre dos secuencias de ácido nucleico o de aminoácidos se llevan a cabo convencionalmente al comparar estas secuencias después de haberlas alineado de manera óptima, la comparación se lleva a cabo por segmento o por "intervalo de comparación" para identificar y comparar regiones locales de similitud de secuencia. La alineación óptima de las secuencias para comparación se puede llevar a cabo, además de manualmente, por medio de un algoritmo de homología local de Smith y Waterman (1981 ) [Ad. App. Math., 2:482], por medio del algoritmo de homología local de Neddleman y Wunsch (1970) [J. Mol. Biol., 48:443], por medio del método de búsqueda de similitud de Pearson y Lipman (1988) [Proc. Nati. Acad. Sci., USA, 85:2444], por medio de programa de computadora los cuales utilizan estos algoritmos (GAP, BESTFIT, BLAST P, BLAST N. FASTA and TFASTA en el Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wl). El porcentaje de identidad entre dos secuencias de ácido nucleico o de aminoácidos se determina al comparar éstas dos secuencias alineadas de manera óptima, en las cuales el ácido nucleico o la secuencia de aminoácidos que se van a comparar pueden comprender adiciones o supresiones en comparación con la secuencia de referencia para alineación óptima entre estas dos secuencias. Se calcula el porcentaje de identidad al determinar la cantidad de posiciones idénticas para las cuales el nucleótido o el residuo aminoácido es idéntico entre las dos secuencias, y al dividir este número de posiciones idénticas entre el número total de posiciones comparadas, y multiplicar el resultado que se obtenga por 100, de manera que se obtenga el porcentaje de identidad entre éstas dos secuencias. La expresión "secuencias de ácido nucleico que tienen un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%, después de alineación óptima, con una secuencia de referencia" se considerará que indica que las secuencias de ácido nucleico las cuales tienen, en comparación con la secuencia de ácido nucleico de referencia, ciertas modificaciones, por ejemplo en particular una supresión, una parte truncada, extensión, fusión quimérica y/o sustitución, en particular una sustitución puntual y la secuencia de ácido nucleico de la cual tiene por lo menos 80%, preferiblemente 90%, 95% o 99% de identidad, después de alineación óptima, con la secuencia de ácido nucleico de referencia. Preferiblemente son secuencias, las secuencias complementarias a las cuales son capaces de hibridizar específicamente con la secuencia de la SEC ID No. 1 de la invención. Preferiblemente, las condiciones específicas de hibridación de alta rigurosidad serán tales que aseguren que por lo menos 80%, preferiblemente 90%, 95% o 99%, después de alineación óptima, entre una de las dos secuencias y la secuencia complementaria a la otra. Una hibridación bajo condiciones de alta rigurosidad significa que las condiciones de temperatura y fuerza iónica se eligen de manera que se mantenga la hibridación entre dos fragmentos complementarios de ADN. A modo de ilustración, las condiciones de alta rigurosidad para la etapa de hibridación con el propósito de definir los fragmentos polinucleotídicos descritos en lo anterior son, ventajosamente, como sigue: La hibridación ADÑ-ADN o ADN-ARN se lleva a cabo en dos etapas: (1) prehibridación a 42°C durante 3 horas en regulador de pH de fosfato (20 mM, pH 7.5) que contiene 5 X SSC (1 x SSC corresponde a NaCl 0.15 M + solución de citrato de sodio 0.015 M), 50% de formamida, 7% de dodecilsulfato de sodio (SDS), 10 x Denhardt, 5% de sulfato de dextrano y 1 % de ADN de esperma de salmón; (2) hibridación en si misma, durante 20 horas a una temperatura que depende del tamaño de la sonda (es decir 42° C para una sonda con un tamaño de > 100 nucleótidos), seguido por dos lavados de 20 minutos a 2Ó°C en 2 x SSC + 2% de SDS y un lavado de 20 minutos a 20°C en 0.1 x SSC + 0.1% de SDS. El lavado final se lleva a cabo en 0.1 x SSC + 0.1% de SDS durante 30 minutos a 60°C para una sonda con un tamaño de > 100 nucleótidos. Las condiciones de hibridación de alta rigurosidad descritas antes para un polinucleótido de tamaño definido se ajustarán por aquellos expertos en la técnica para oligonucleótidos los cuales tengan un tamaño más grande o más pequeño, de acuerdo con las enseñanzas de Sambrook et al. (Molecular cloning: a laboratory manual, Sec. Ed., Cold Spring Harbor Lab., Cold Spring Harbor, New York, 1989). Entre las secuencias de ácido nucleico que tienen un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99% después de alineación óptima, con la secuencia de acuerdo con la invención, también se proporciona preferencia a las secuencias de ácido nucleico las cuales son variantes de la secuencia de ácido nucleico SEC ID No. 1 o un fragmento de la misma, es decir, la totalidad de las secuencias de ácido nucleico que corresponden a las variantes aléíicas, es decir, variaciones individuales de la secuencia de ácido nucleico SEC ID No. 1. Estas secuencias mutadas naturales corresponden a polimorfismo presente en mamíferos, en particular humanos y especialmente a polimorfismo que llevan a la presentación de un trastorno patológico. La presente invención preferiblemente se relaciona con las secuencias de ácido nucleico variantes en las cuales las mutaciones llevan a una modificación de la secuencia de aminoácidos del polipéptido, o de fragmentos del mismo, codificados por la secuencia normal de la secuencia SEC ID No. 1. También se entenderá que la expresión "secuencias variantes de ácido nucleico" indicarán cualquier ARN o ADNc que resulte de una mutación de un sitio de empalme de la secuencia genómica de ácido nucleico,, cuyo ADNc tenga la secuencia de la SEC ID No. 1. La ¡nvención preferiblemente se relaciona con un ácido nucleico purificado o aislado, de acuerdo con la presente ¡nvención, caracterizado porque consiste de la secuencia SEC ID No. 1 , de la secuencia complementaria a, o de la secuencia del ARN que corresponde a la secuencia SEC ID No. 1 , preferiblemente el fragmento de la misma que codifica para el péptido de la secuencia SEC ID No. 2 o de la secuencia SEC ID No. 2 suprimida del péptido señal aa 1 -41. La invención preferiblemente se relaciona con un ácido nucleico purificado o aislado, de acuerdo con la invención, caracterizado porque comprende las secuencias que se eligen de las siguientes secuencias: a) las secuencias SEC ID No. 5, SEC ID No. 7, SEC ID No. 15, SEC ID No. 17 y SEC ID No. 19; b) la secuencia de un fragmento de por lo menos 18 nucleótidos de la secuencia SEC ID No. 19; c una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); y d) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a), b) o c). La invención preferiblemente se relaciona con un ácido nucleico purificado o aislado, de acuerdo con la invención, caracterizado porque la secuencia del mismo se elige de las siguientes secuencias: a) SEC ID No. 1 , SEC ID No. 3, SEC ID No. 5, SEC ID No. 7, SEC ID No. 9, SEC ID No. 15, SEC ID No. 17, SEC ID No. 19 y SEC ID No. 21 ; b) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%>, después de alineación óptima, con una secuencia como se define en el inciso a); y c) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a) o b). Los iniciadores o sondas, caracterizados porque comprenden una secuencia de un ácido nucleico de acuerdo con la ¡nvención, también son parte de la invención. La presente ¡nvención preferiblemente por lo tanto se relaciona a los iniciadores o a las sondas de acuerdo con la invención los cuales en particular posibilitan revelar o diferenciar entre las secuencias variantes de ácido nucleico, o identificar la secuencia genómica del gen, el ADNc del cual está representado por la secuencia SEC ID No. 1 , utilizando en particular un método de amplificación tal como el método de PCR, o un método relacionado. La invención también se relaciona con el uso de una secuencia de ácido nucleico de acuerdo con la invención como una sonda o iniciador, para detectar, identificar, titular o amplificar secuencias de ácido nucleico. De acuerdo con la invención, los polinucleótidos los cuales se pueden utilizar como una sonda o como un iniciador en los métodos para detección, identificación, titulación o amplificación, la secuencia de ácido nucleico será de un mínimo de 15 bases, preferiblemente de 20 bases, o aún mejor de 25 a 30 bases en cuanto a tamaño. La totalidad de las sondas e iniciadores de acuerdo con la invención se pueden marcar directa o indirectamente con un compuesto radioactivo o no radioactivo, utilizando métodos bien conocidos por los expertos en la técnica para obtener una señal detectable y/o cuantificable. Las secuencias polinucleotídicas no marcadas, de acuerdo con la invención, se pueden utilizar directamente como una sonda o iniciador. Las secuencias generalmente se marcan con el fin de obtener secuencias las cuales se pueden utilizar para muchas aplicaciones. Los iniciadores o las sondas de acuerdo con la invención se marcan con elementos radiactivos o con moléculas no radiactivas. Entre los núclidos radiactivos utilizados, se puede hacer mención de ^P, 33P> 2BS, 3H o 125l. Las entidades no radiactivas se seleccionan de ligandos, tales como biotina, avidina, estreptavidina o digoxigenina, haptenos, colorantes y agentes luminiscentes, tales como agente radioluminiscentes, quimioluminiscentes, bioluminiscentes, fluorescentes o fosforescentes. Los polinucleótidos de acuerdo con la invención de esta manera se pueden utilizar como un iniciador y/o una sonda en métodos los cuales utilizan en particular la técnica de PCR (reacción en cadena de polimerasa) (H.A. Eriich, New York: Stockton Press, 1989; M.A. Innis et al., Academic Press, 1990; and A. Rolfs et al., Berlin: Springer-Verlag, 1991). Esta técnica requiere elegir pares de iniciadores oiigonucleotídicos los cuales finalizan el fragmento el cual debe ser amplificado. Se puede hacer referencia, por ejemplo, a la técnica descrita en ta patente de E.U.A. número 4,683,202. Los fragmentos amplificados se pueden identificar, por ejemplo después de electroforesis en gel de agarosa o de poliacrilamida, o después de una técnica cromatográfica tal como filtración en gel o cromatografía de intercambio iónico, y posteriormente se pueden secuenciar. Se puede controlar la especificidad de la amplificación mediante la utilización, como un iniciador, de secuencias nucleotídicas de polinucleótidos de la invención y, como una matriz, plásmidos que contengan estas secuendas o los productos de amplificación derivados. Los fragmentos nucleotídicos amplificados se pueden utilizar como reactivos en reacciones de hibridación para demostrar la presencia, en una muestra biológica, del ácido nucleico objetivo o de una secuencia complementaria a la de los fragmentos nucleotídicos amplificados. La invención también se relaciona con ácidos nucleicos los cuales se pueden obtener por amplificación utilizando iniciadores de acuerdo con la ¡nvención. Ventajosamente se pueden utilizar otras técnicas para amplificar el ácido nucleico objetivo, como una alternativa a PCR (similares a PCR) utilizando pares de iniciadores de secuencias nucleotídicas de acuerdo con la invención. El término "similar a PCR" se indicará que indica que la totalidad de los métodos los cuales utilizan reproducción directa o indirecta de secuencias de ácido nucleico, o en los cuales se han amplificado sistemas de etiquetado; por supuesto estas técnicas son conocidas; en general, requieren de amplificación del ADN por una polimerasa; cuando la muestra de origen es un ARN, se debe llevar a cabo de antemano transcripción inversa. Actualmente hay una gran cantidad de métodos para esta amplificación tales como, por ejemplo, la técnica SDA (amplificación por desplazamiento de cadena) (G.T. Walker et al., Nucleic Acids Res., 20:1691-1696, 1992), la técnica TAS (sistema de amplificación basado en transcripción) descrita por D.Y. Kwoh et al. en 1989 (Proc. Nati. Acad. Sci., USA, 86:1173-1177), la técnica 3SR (replicación de secuencias autosostenidas) por J.C. Guatelli et al., en 1990 (Proc. Nati. Acad. Sci., USA, 87:1874-1878, and Cell, 85:281-290, 1996), la técnica NASBA (amplificación basada en secuencia de ácido nucleico) descrita por T. Kievitis et al. en 1991 (J. Viral., Methods, 35:273-286), la técnica TMA (amplificación mediada por transcripción), la técnica LCR (reacción en cadena de ligasa) descrita por U. Landegren et al. en 1988 (Science, 241:1077-1080) y mejorada por F. Barany en 1991 (Proc. Nati. Acad. Sci. USA, 88:189-193), la cual utiliza una ligasa termoestable, la técnica de RCR (reacción en cadena con reparación) descrita por D. Segev en 1992 (Kessler C. Springer Verlag, Berlin, New York, 197-205), la técnica CPR (reacción de sonda ciclada) descrita por P. Duck et al. en 1990 (Biotechniques, 9:142-147), y la técnica de amplificación de Q-beta-replicasa descrita por E.A. Miele et al. en 1983 (J. Mol. Biol., 171 :281-295) y mejorada en particular por B.C.F. Chu et al. en 1986 (Nucleic Acids Res., 14:5591 -5603) y P.M. Lizardi et al. en 1988 (Biotechnology, 6:1197-1202), y después por J.L. Burg et al. (Mol. and Cell. Probes, 10:257-271) y también por B.B. Stone et al. (Mol. and Cel!. Probes, 10:359-370) en 1996. Cuando el polinucleótido objetivo que se va a detectar es un ARNm, se utilizará ventajosamente una enzima del tipo de transcriptasa inversa, antes de llevar a cabo una reacción de amplificación utilizando los iniciadores de acuerdo con la invención, o para llevar a cabo un método de detección utilizando las sondas de la invención, con el fin de obtener un ADNc a partir del ARNm contenido en la muestra biológica. El ADNc que se obtiene después se utilizará como el objetivo para los iniciadores o las sondas utilizadas en el método de amplificación o detección, de acuerdo con la invención.

La técnica de hibridación por sonda se puede llevar a cabo de diversas maneras (J.A. Matthews et al., Anal. Biochem., 169:1-25, 1988). El método más general consiste en inmovilizar el ácido nucleico extraído de las células de diversos tejidos, o de células en cultivo, sobre un soporte (tal como nitrocelulosa, nylon o poliestireno) y en la incubación dei ácido nucleico objetivo inmovilizado con la sonda, bajo condiciones bien definidas. Después de la hibridación, se elimina el exceso de sonda y se detectan las moléculas híbridas formadas utilizando un método apropiado (medición de radioactividad, fluorescencia o actividad enzimática relacionada con la sonda). De acuerdo con otra modalidad de las sondas de ácido nucleico de acuerdo con la invención, estas últimas se pueden utilizar como una sonda de retención. En este caso, una sonda, denominada "sonda de retención" se inmoviliza sobre un soporte y se utiliza para retener, por hibridación específica, el ácido nucleico objetivo que se obtiene de la muestra biológica que se va a probar, y el ácido nucleico objetivo después se detecta utilizando una segunda sonda, denominada "sonda de detección" marcada con un elemento detectable fácilmente. Entre los fragmentos ventajosos de ácido nucleico, se debe hacer mención, en particular de oligonucleótidos antisentido, es decir, oligonucleótidos cuya estructura proporciona, por hibridación con la secuencia objetivo, ¡nhibición de la expresión del producto correspondiente. También se puede hacer mención de los oügonucleótidos directos (con sentido) los cuales, por interacción con las proteínas involucradas en la regulación de la expresión del producto correspondiente, inducirán inhibición o activación de esta expresión. En otro aspecto, la invención comprende un método para la detección sistemática de genotecas de ADN o de ADNc, o para clonación de material genómico aislado o ADNc, caracterizado porque utiliza una secuencia de ácido nucleico de acuerdo con la invención. Entre estos métodos, se puede hacer mención en particular de: detección sistemática de genotecas de ADNc y ADNc aislados clonados (Sambrook, J., et al., 1989; Suggs, S.V., et al., PNAS 78:6613-6617, 1981; Woo, S.L.C., Methods Enzymol., 68:389, 1979), utilizando las secuencias de ácido nucleico de acuerdo con la invención; detección sistemática de genotecas, por ejemplo BACs (Chumakov, I.M., et al., 1992; Chumakov, I.M., et al., Nature, 377:175-183, 1995) y, opcionalmente, análisis genético por FISH (Cherif, D., et al., Proc. Nati. Acad. Sci., USA, 87:6639-6643, 1990) utilizando secuencias de acuerdo con la invención, lo que permite el aislamiento y ubicación cromosómica, y después el secuenciado completo del gen para el cual la secuencia del ADNc es la secuencia de SEC ID No. 1. En particular, estos métodos de acuerdo con la invención se pueden utilizar aquí para identificar y por lo tanto obtener ADNc de variantes de áddo nudeico. Estos métodos de detección sistemática y/o clonación comprenderán en particular una etapa para hibridizar el ácido nucleico de acuerdo con la invención con un ácido nucleico contenido en una biblioteca genómica o de ADNc. La invención también comprende un método para identificar las secuencias de ácido nucleico las cuales promueven y/o regulan la expresión del gen, cuyo ADN tiene la secuencia SEC ID No. 1 , caracterizada porque utiliza un ácido nucleico de acuerdo con la invención. Las herramientas de computadora disponibles para aquellos expertos en la técnica les permiten identificar con facilidad, a partir de las secuencias genómicas de ácido nucleico de acuerdo con la invención, las secuencias reguladoras promotoras necesarias y suficientes para controlar la expresión del gen, en particular las secuencias TATA, CCAAT y GC, y también las secuencias reguladoras estimuladoras ("mejoradoras") o las secuencias reguladoras inhibidoras ("inhibidoras") las cuales controlan, en CIS, la expresión de los genes de acuerdo con la invención; entre estas secuencias reguladoras se pueden mencionar IRÉ, MRE y CRE. La ¡nvención también se relaciona con métodos para identificar mutaciones presentadas por el gen que codifica para el polipéptido de la secuencia SEC ID No. 2, en particular mutaciones responsables [lacuna], caracterizadas porque utilizan una secuencia de ácido nucleico de acuerdo con la ¡nvención. La invención se relaciona particularmente con un método para identificar un ácido nucleico de por lo menos 18 nucleótidos consecutivos de la secuencia del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, el ácido nucleico comprende por lo menos una mutación, preferiblemente responsable de la expresión anormal del gen, caracterizada porque utiliza una secuencia de ácido nucleico de acuerdo con la ¡nvención. Estos métodos para identificar estas mutaciones comprenderán, en particular, las siguientes etapas: (i) aislamiento del ADN de la muestra biológica que se va a analizar, o producción de ADNc a partir del ARNm de la muestra biológica; (ii) amplificación específica del ADN objetivo que es probable que tenga una mutación, utilizando iniciadores de acuerdo con la invención; (i¡¡) análisis de los productos de amplificación, en particular el tamaño y/o la secuencia de los productos de amplificación, en relación a una secuencia de referencia. Las secuencias promotora y/o reguladora para el gen de acuerdo con la invención las cuales tengan mutaciones capaces de modificar la expresión de la proteína correspondiente también son parte de la ¡nvención. Los ácidos nucleicos caracterizados porque se pueden obtener utilizando uno de los métodos anteriores de acuerdo con la invención, o los ácidos nucleicos capaces de hibridación, bajo condiciones de alta rigurosidad (porcentaje de identidad de por lo menos 80% entre una de las dos secuencias y la secuencia complementaria a la otra), con las secuencias de ácido nucleico, son parte de la invención, en particular los ácidos nucleicos de variantes alélicas del gen, cuyo ADNc tiene la secuencia SEC ID No. 1 , y también las secuencias genómicas de los genes homólogos de otros mamíferos, tales como ratones.

El uso de una secuencia de ácido nucleico de acuerdo con la invención, como una sonda o iniciador para una detección sistemática de una biblioteca genómica o de ADNc, por supuesto, es parte del objetivo de la presente invención. En otro aspecto, la invención comprende un polipéptido purificado o aislado codificado por un ácido nucleico de acuerdo con la ¡nvención. En la presente descripción, el término "polipéptido" se utilizará para indicar por igual una proteína o un péptido. Preferiblemente, la presente ¡nvención se relaciona con un polipéptido purificado o aislado, caracterizado porque comprende una secuencia de aminoácidos que se elige del siguiente grupo: a) la secuencia SEC ID No. 2; b) la secuencia o un fragmento de por lo menos 6, 10, 15, 30 ó 50 aminoácidos consecutivos de la secuencia SEC ID No. 2, preferiblemente de tal fragmento de la secuencia SEC ID No. 4, SEC ID No. 6, SEC ID No. 8 o SEC ID No. 10; c) una secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%, después de alineación óptima, con una secuencia como se define en los incisos a) o b). También de manera preferible, el objetivo de la ¡nvención es un polipéptido o secuencia de aminoácidos SEC ID No. 2, la secuencia SEC ID No. 2 suprimida del fragmento aa 1-41 , o una secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95%o o 99%, después de alineación óptima, con la secuencia SEC ID No. 2. El análisis de la secuencia de proteínas predice que el polipéptido de la secuencia SEC ID No. 2 tiene un péptido señal, cuya secuencia está entre las posiciones aa 1-41 , un dominio extracelular, cuya secuencia está entre las posiciones aa 42-911 , un dominio transmembranal cuya secuencia está entre las posiciones aa912-930 y un dominio intraceluiar cuya secuencia está entre las posiciones aa931-1013, en la secuencia SEC ID No. 2. Entre los polipéptidos de acuerdo con la invención, también se proporciona preferencia al polipéptido cuya secuencia está entre las posiciones aa 42-911 de la secuencia SEC ID No. 2, que corresponde al dominio extramembranal, o cualquier fragmento de por lo menos 6, 10, 15, 30 ó 50 aminoácidos consecutivos de la secuencia aa 42-911 , preferiblemente los aminoácidos consecutivos de la secuencia SEC ID No. 4, SEC ID No. 6, SEC ID No. 8 o SEC ID No. 10. La ¡nvención preferiblemente se relaciona con un péptido purificado o aislado, caracterizado porque comprende una secuencia de aminoácidos que se elige del siguiente grupo: a) la secuencia SEC ID No. 2; b) la secuencia de un fragmento de por lo menos 6 aminoácidos de la secuencia SEC ID No. 22, preferiblemente de la secuencia SEC ID No. 20; y c) una secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b). La invención preferiblemente se relaciona con un poüpéptido de acuerdo con la ¡nvención, caracterizado porque la secuencia del mismo se elige de las secuencias SEC ID No. 2, SEC ID No. 4, SEC ID No. 6, SEC ID No. 8, SEC ID No. 10, SEC ID No. 16, SEC ID No. 18, SEC ID No. 20 y SEC ID No. 22, o una secuencia que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con estas secuencias. Se debe entender que la invención no se relaciona con polipéptidos en la forma natural, es decir, no se toman en su ambiente. Específicamente, la invención se relaciona con los péptidos que se obtienen por purificación de fuentes naturales, o que se obtienen por recombinación genética o por síntesis química y que posiblemente comprenden después aminoácidos no naturales. La producción de un polipéptido recombinante, la cual puede ser llevada a cabo utilizando una de las secuencias nucleotídicas de acuerdo con la invención, es particularmente provechosa dado que posibilita obtener un nivel aumentado de pureza del polipéptido deseado. La expresión "polipéptido cuya secuencia de aminoácidos tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%o, después de alineación óptima, con una secuencia de referencia" se pretende que indique que los polipéptidos tienen ciertas modificaciones en relación al polipéptido de referencia, por ejemplo en particular una o más supresiones, cortes, una extensión, una fusión quimérica y/o uno o más sustituciones. Entre los polipéptidos, la secuencia de aminoácidos la cual tiene un porcentaje de identidad de por lo menos 80%, preferiblemente 90%, 95% o 99%> después de la alineación opcional con la secuencia SEC ID No. 2, o con un fragmento de la misma de acuerdo con la invención, se da preferencia a las variantes polipeptídicas codificadas por las secuencias de áddo nucleico variantes como se definen en lo anterior, en particular los polipéptidos cuya secuencia de aminoácidos tiene por lo menos una mutación que corresponde en particular a un corte, supresión, sustitución y/o adhesión de por lo menos un residuo aminoácido en relación a la secuenda SEC ID No. 2 o con un fragmento de la misma, de manera más preferible los polipéptidos variantes tienen una mutación unida a una condición patológica. La invención también comprende la clonación y/o vectores de expresión que contienen una secuencia de ácido nucleico de acuerdo con la invención. Los vectores de acuerdo con la invención, caracterizados porque comprenden los elementos que permiten la expresión y/o secreción de las secuencias en una célula huésped, o una secuencia para direccionamiento celular, también son parte de la invención. Los vectores caraderizados porque comprenden una secuencia promotora y/o reguladora de acuerdo con la invención, también son parte de la invención.

Tales vectores preferiblemente comprenden un promotor, un inicio de traducción y señales de terminación, y regiones adecuadas para regular la transcripción. Es posible que se mantengan establemente en la célula y de manera óptima pueden tener señales particulares las cuales especifican secreción de la proteína traducida. Estas señales diversas de control se eligen como una función del huésped celular utilizado. Para este fin, las secuencias de ácido nucleico de acuerdo con la invención se pueden insertar en vectores los cuales se replican de manera autónoma en el huésped elegido, o vectores los cuales se integran en el huésped elegido. Entre los sistemas los cuales se replican de manera autónoma se hará uso preferiblemente, dependiendo de la célula huésped, de los sistemas del plásmido o tipo viral, ios vectores virales posiblemente sean, en particular, adenovirus (Perricaudet, M., et al., La Recherche [Research], 23:471-473, 1992), retrovirus, lentivirus, poxvirus o virus de herpes (Epstein, A., Médecine/Sciences, 8:902-911 , 1992). Los expertos en la técnica la cual se puede utilizar para cada uno de estos sistemas. Cuando se desea la integración de la secuencia en los cromosoma de la célula huésped, se puede hacer uso, por ejemplo, de los sistemas del tipo plasmídico o viral; tales virus, por ejemplo, serán retrovirus (Temin, H.M., Retrovirus vectors for gene transfer, ¡n Kucherlapati R., ed. Gene Transfer, New York, Plenum Press, 149-187, 1986) o AAVs (Cárter, B.J., Curr. Op. Biotechnology, 3:533-539, 1993).

Entre los vectores no virales, se proporciona preferencia a los polinucleótidos desnudos, tales como ADN desnudo o ARN desnudo, de acuerdo con la técnica desarrollada por la compañía VICAL, cromosomas artificiales de levadura (YAC) para expresión en levadura, cromosomas artificiales de ratón (MAC) para expresión en células murinas y, preferiblemente, cromosomas artificiales humanos (HAC) para expresión en células humanas. Tales vectores se preparan de acuerdo con los métodos utilizados habitualmente por los expertos en la técnica y los clones resultantes de los mismos se pueden introducir en un huésped adecuado utilizando métodos convencionales tales, por ejemplo, lipofección, electroporación o choque térmico. La invención también comprende las células huéspedes, en particular células eucarióticas y procarióticas transformadas con los vectores de acuerdo con la ¡nvención y también los animales transgénicos, excepto humanos, que comprenden una de las células transformadas, de acuerdo con la invención. Entre las células que se pueden utilizar para estos propósitos, se pueden mencionar, por supuesto, células bacterianas (Olins, P.O., et al., Curr. Op. Biotechnology, 4:520-525, 1993), pero también células de levadura (Buckholz, R.G., Curr. Op., Biotechnology, 4:538-542, 1993), así como células animales, en particular cultivos de células de mamífero (Edwards, C.P., et al., Curr. Op. Biotechnology, 4:558-563, 1993), y en particular células de ovario de hámster chino (CHO), pero también células de insectos en las cuales es posible utilizar métodos que utilicen baculovirus, por ejemplo (Luckow, V.A., Curr. Op. Biotechnology, 4:564-572, 1993). Las células COS constituyen un huésped celular preferido para expresar proteínas de la ¡nvención. Entre los mamíferos de acuerdo con la ¡nvención, los animales tales como ratones, ratas o conejos, que expresan un polipéptido de acuerdo con la invención serán los preferidos. Entre los mamíferos de acuerdo con la invención, también se proporcionará preferencia a los animales tales como ratones, ratas o conejos, caracterizados porque el gen que codifica para la secuencia de la proteína SEC ID No. 2 o la secuencia de la cual es codificada por el gen homólogo de estos animales, no es funcional, ha sido suprimida del cromosoma o tiene por lo menos una mutación. Estos animales transgénicos se obtienen, por ejemplo, por recombinación homologa de embriocitos, transferencia de estos embriocltos a embriones, selección de las quimeras alteradas en las líneas de reproducción y crecimiento de las quimeras. Estos animales transgénicos (preferiblemente ratones) pueden sobreexpresar el gen que codifica para la proteína de acuerdo con la ¡nvención, o su gen homólogo, o expresar el gen en el cual se puede introducir una mutación. Estos animales transgénicos, en particular ratones se obtienen, por ejemplo por transfección de una copia de este gen bajo el control de un promotor fuerte el cual es naturaleza ubicua, o un promotor selectivo para un tipo de tejido o después de transcripción viral. Estos animales transgénicos (preferiblemente ratones) se pueden volver deficientes para el gen que codifica para el polipéptido de la secuencia SEC ID No. 2 o su gen homólogo, por inactivación utilizando el sistema de recombinasa LOXP/CRE (Rohlmann, A., et al., Nature Biotech., 14:1562-1565, 1996) o cualquier otro sistema para inactivar la expresión de este gen. Las células y mamíferos de acuerdo con la invención se pueden utilizar en un método para producir un polipéptido de acuerdo con la invención, como se describe en lo anterior, y también se pueden utilizar como un modelo analítico. Las células transformadas o los mamíferos como se describen en lo anterior de esta manera se pueden utilizar como modelos para estudiar las interacciones entre los polipéptidos de acuerdo con la invención y los compuestos químicos o de proteínas involucrados directa o indirectamente en las actividades de los polipéptidos de acuerdo con la invención, esto se realiza con el fin de estudiar los diversos mecanismos e interacciones involucradas. Se pueden utilizar especialmente para seleccionar productos que ¡nteractúan con los polipéptidos de acuerdo con la ¡nvención, en particular la proteína de la secuencia SEC ID No. 2 o variantes de la misma, de acuerdo con la ¡nvención, como un cofactor o como un inhibidor, en particular, un inhibidor competitivo, del cual se tiene una actividad la cual es agonista o antagonista para la actividad de los polipéptidos de acuerdo con la ¡nvención.

Preferiblemente, las células transformadas o los animales transgénicos se utilizarán como un modelo, en particular para seleccionar productos para conbatir condiciones patológicas relacionadas con expresión anormal de este gen, La ¡nvención también se relaciona con el uso de una célula, un mamífero o un polipéptido de acuerdo con la ¡nvención, para detección sistemática de un compuesto químico o bioquímico el cual puede ¡nteractuar directa o indirectamente con los polipéptidos de acuerdo con la invención y/o capaz de modular la expresión o actividad de estos polipéptidos. La ¡nvención también se relaciona con el uso de una secuencia de ácido nucleico de acuerdo con ia invención para sintetizar polipéptidos recombinantes. El método para elaborar un polipéptido de la invención en forma recombinante está incluido, en si mismo, en la presente invención y se caracteriza porque las células transformadas, en particular las células o mamíferos de la presente ¡nvención, se hacen crecer bajo condiciones las cuales permiten la expresión de un polipéptido recombinante codificado por una secuencia de ácido nucleico de acuerdo con la invención y en donde se recupera el polipéptido recombinante. Los polipéptidos recombinantes, caracterizados porque se pueden obtener utilizando tal método de producción, también son parte de la invención. Los polipéptidos recombinantes que se obtienen como se indica en lo anterior pueden estar en forma glicosilada y no glicosilada, y pueden o no tener una estructura terciaria natural. También se pueden modificar las secuencias de los poiipéptidos recombinantes para mejorar su solubilidad, en particular en solventes acuosos. Tales modificaciones se conocen por aquellos expertos en la técnica tales como, por ejemplo, la supresión de dominios hidrofóbicos o la sustitución de aminoácidos hidrofóbicos por aminoácidos hidrofílicos. Estos polipéptidos se pueden elaborar a partir de secuencias de ácido nucleico definidas antes, de acuerdo con las técnicas para elaborar polipéptidos recombinantes conocidos por los expertos en la técnica. En este caso, la secuencia de ácido nucleico utilizada se coloca bajo el control de señales las cuales permiten su expresión en un huésped celular. Un sistema eficaz para producir un polipéptldo recombinante requiere tener un vector y una célula huésped de acuerdo con la invención. Estas células se pueden obtener al introducir, en las células huéspedes una secuencia nucleotídica insertada en un vector como se define en lo anterior, y después cultivar las células bajo condiciones que permiten la repllcación y/o expresión de la secuencia nucleotídica transfectada. Los métodos para purificar un polipéptido recombinante los cuales se utilizan se reconocen por los expertos en la técnica. El polipéptido recombinante se puede purificar de los usados celulares y extractos, y del sobrenadante de medio de cultivo, utilizando métodos utilizados individualmente o en combinación, tales como fraccionamiento, métodos cromatográficos, técnicas de ¡nmunoafinidad utilizando anticuerpos monoclonales o policlonales específicos, etc. Los polipéptidos de acuerdo con la presente invención se pueden obtener por síntesis química utilizando una de las muchas síntesis peptídicas conocidas, por ejemplo las técnicas que utilizan fases sólidas o técnicas que utilizan fases sólidas, parciales, por condensación de fragmentos o por síntesis convencional en solución. La técnica de síntesis en fase sólida es bien conocida por los expertos en la técnica; véase, en particular J.M. Stewart, et al., (Solid phase peptide synthesis, Pierce Chem., Chem., Company, Rockford, 111 , 2nd ed., 1984) y M. Bodanski (Principies of peptide synthesis, 1984). Los polipéptidos correspondientes que se obtienen por síntesis química y que posiblemente comprenden aminoácidos no naturales también se incluyen en la invención. Los anticuerpos monoclonales o policlonales o fragmentos de los mismos, anticuerpos quiméricos o inmunoconjugados, caracterizados porque son capaces de reconocer específicamente un poiipéptido de acuerdo con la invención, también son parte de la invención pues son tales anticuerpos o fragmentos de los mismos capaces de reconocer las secuencias de polipéptidos de la secuencia SEC ID No. 173 del documento WO 99/54461 o de la secuencia SEC ID No. 51 del documento WO 99/06548. Se pueden obtener anticuerpos policlonales específicos a partir del suero de un animal inmunizado contra el polipéptido de acuerdo con la invención, en particular elaborado por recombinación genética o por síntesis peptídica, de acuerdo con los procedimientos habituales. La ventaja de los anticuerpos los cuales reconocen específicamente ciertas variantes polipeptídlcas, o fragmentos inmunogénicos de los mismos, de acuerdo con la ¡nvención, se notarán en particular. Los anticuerpos monoclonales o policlonales, o fragmentos de los mismos, anticuerpos quiméricos o inmunoconjugados, caracterizados porque son capaces de reconocer específicamente el dominio extramembranal del polipéptido de la secuencia SEC ID No. 2, se prefieren particularmente. Los anticuerpos monoclonales específicos se pueden obtener de acuerdo con el método convencional de cultivo de hibridomas, descrito por Kóhler y Milstein (Nature, 256:495-497, 1975). Los anticuerpos de acuerdo con la invención son, por ejemplo, anticuerpos quiméricos, anticuerpos humanos o fragmentos Fab o F(ab')2. También pueden estar en forma de inmunoconjugados o de anticuerpos los cuales se marcan con el fin de obtener una señal detectable y/o cuantificable. La invención también se relaciona con métodos para detectar y/o purificar un polipéptido de acuerdo con la invención, caracterizado porque se utiliza un anticuerpo de acuerdo con la ¡nvención. La invención también comprende polipéptidos purificados, caracterizados porque se obtienen utilizando un método de acuerdo con la invención. Además, de manera adicional a su uso para purificar los polipéptidos, los anticuerpos de la invención, en particular los anticuerpos monoclonales, también se pueden utilizar para detectar estos polipéptidos en una muestra biológica. Por lo tanto, ellos constituyen un medio para analizar inmunocitoquímicamente o inmunohistoquímicamente la expresión de los polipéptidos de acuerdo con la invención, en particular el polipéptido de la secuencia SEC ID No. 2, o una variante de la misma, sobre cortes de tejido específico, por ejemplo por inmunofluorescencia o marcado con oro, o con inmunoconjugados enzimáticos. Ellos pueden, en particular, hacer posible demostrar la expresión anormal de estos polipéptidos en muestras de tejido o biológicas. De manera más general, los anticuerpos de la ¡nvención se pueden utilizar ventajosamente en cualquier situación en la cual se pueda observar una expresión de un polipéptido normal o mutado, de acuerdo con la invención. Los métodos para determinar variabilidad alélica, una mutación, una supresión, pérdida de la condición heterocigota o cualquier anomalía genética del gen de acuerdo con la invención, caracterizado porque se utiliza una secuencia de ácido nucleico o un anticuerpo de acuerdo con la invención, también son parte de la invención. Preferiblemente la invención se relaciona con un método para diagnosticar una enfermedad asociada con la presencia de por lo menos una mutación sobre una secuencia del gen de acuerdo con la invención, utilizando una muestra biológica de un paciente, caracterizado porque comprende las siguientes etapas: a) cuando sea apropiado, aislar el ADN genómico de la muestra biológica que se va a analizar, u obtener ADNc a partir de ARN de la muestra biológica; b) amplificar específicamente la secuencia de ADN del gen que probablemente contenga una mutación, utilizando iniciadores de acuerdo con la invención; c) analizar los productos de amplificación que se obtienen al comparar su secuencia con la secuencia normal. La ¡nvención también comprende un método para diagnosticar una enfermedad relacionada con la expresión anormal de un polipéptido de acuerdo con la invención, en particular el polipéptido de la secuencia SEC ID No. 2 o una variante del mismo, caracterizado porque uno o más anticuerpos de acuerdo con la invención se ponen en contacto con el material biológico que se va a probar bajo condiciones que permiten la posible formación de complejos inmunológicos específicos entre el polipéptido y el o los anticuerpos y en donde los complejos inmunológicos que se forman posiblemente se pueden detectar y/o cuantificar. Estos métodos de diagnóstico se dirigen, por ejemplo, a métodos para el diagnóstico de enfermedades relacionadas con la expresión anormal del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, tales como la sobreexpresión o supresión, al determinar, utilizando una muestra biológica del paciente, la presencia de una secuencia de acuerdo con la invención en una cantidad anormal. Las secuencias de ácido nucleico analizadas pueden ser por igual ADN genómico, ADNc o ARNm. Por supuesto, existen una gran cantidad de métodos para demostrar una mutación en un gen en relación al gen de tipo silvestre. Se pueden dividir esencialmente en dos categorías principales. El primer tipo o método es aquel en el cual se detecta la presencia de una mutación al comparar la secuencia mutada con la secuencia correspondiente de tipo silvestre, y el segundo tipo es aquel en el cual se detecta la presencia de la mutación indirectamente, por ejemplo mediante la evidencia de malos pareamientos debidos a la presencia de la mutación. Estos métodos pueden utilizar las sondas y iniciadores de la presente ¡nvención. Generalmente son secuencias de hibridación de ácido nucleico purificadas, que comprenden por lo menos 15 nucleótidos, preferiblemente 20, 25 ó 30 a 200 nucleótidos, caracterizados porque pueden hibridizar específicamente con una secuencia de ácido nucleico de acuerdo con la invención. Las condiciones de hibridación específicas preferiblemente son las definidas en lo anterior o en los ejemplos. Entre los métodos para determinar una variabilidad alélica, una mutación, una supresión o una anomalía genética, se da preferencia a los métodos que comprenden por lo menos una etapa de amplificación "PCR" (reacción en cadena de polimerasa) o "similar a PCR" para amplificar la secuencia objetivo de acuerdo con la invención que probablemente tenga una anomalía, utilizando un par de iniciadores de secuencias nucleotídlcas de acuerdo con la invención. Los productos amplificados se pueden tratar con una enzima de restricción adecuada antes de proceder con la detección o con la titulación del producto objetivo. Las mutaciones del gen de acuerdo con la ¡nvención pueden ser responsables de las diversas modificaciones de sus productos de traducción, y estas son modificaciones las cuales se pueden utilizar para un enfoque de diagnóstico. Específicamente, modificaciones de antigenicidad relacionadas con estas mutaciones pueden permitir el desarrollo de anticuerpos específicos. Es posible diferenciar el producto del gen mutado por estos métodos. Todas estas modificaciones se pueden utilizar en un enfoque de diagnóstico utilizando varios métodos bien conocidos basados en el uso de anticuerpos monoclonales o policlonales los cuales reconocen al polipéptido normal o las variantes mutadas tales como, por ejemplo, por RÍA o por ELISA. En otro aspecto, la invención comprende un método para seleccionar compuestos químicos o bioquímicos capaces de ¡nteractuar directa o indirectamente con los polipéptidos de acuerdo con la ¡nvención, en particular el polipéptido de la secuencia SEC ID No. 2 o con los ácidos nucleicos de acuerdo con la invención, o posibilitar modular la expresión o actividad de los polipéptidos de acuerdo con la invención.

Por lo tanto, la ¡nvención comprende un método para seleccionar compuestos químicos o bioquímicos capaces de interactuar, in vitro o ¡n vivo con una secuencia de ácido nucleico de acuerdo con la ¡nvención, caracterizado porque comprende colocar una célula que expresa, normal o 5 anormalmente, el gen que codifica para el polipéptido de la secuencia SEC ID No. 2, en contacto con un compuesto candidato, y detectar directa o indirectamente una modificación de la expresión o de la actividad del polipéptido de la secuencia SEC ID No. 2. s La detección sistemática se puede utilizar para probar 10 compuestos capaces de modificar el nivel y/o la especificidad de expresión de los polipéptidos de acuerdo con la ¡nvención, en particular el polipéptido de la secuencia SEC ID No. 2, ya sea por unión competitiva a los sitios de unión de factor de transcripción que se localizan en el promotor del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, o al unirlo directamente a 15 factores de transcripción. Se puede analizar el nivel de expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 y su posición, por hibridación en solución con sondas grandes, como se indica en la patente PCT WO 97/05277. 20 Un análisis cuantitativo de la expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 también se puede realizar utilizando matrices de ADN, que posiblemente incluyan la totalidad o parte de la secuencia del ADNc de la secuencia SEC ID No. 1 de la presente invención y que tengan una longitud suficiente para permitir la detección específica de la expresión de los ARNm capaces de hibridizar con el mismo. Los fragmentos preferiblemente comprenden por lo menos 15, 25, 50, 100 ó 500 nucleótidos consecutivos de secuencias de ácido nucleico de las cuales se derivan, como se describe en Schena et al. (Science, 270:467-470, 1995). También se puede llevar a cabo un análisis cuantitativo de la expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención, con los ADN de acuerdo con la invención sobre matrices de ADN de acuerdo con la descripción por Pletu et al. (1996). Los ADN de acuerdo con la invención o fragmentos de los mismos se amplifican por PCR y se unen sobre membranas. Los ARNm que se originan de diversos tejidos o células se etiquetan con nucleótidos radioactivos. Después de hibridación y lavado bajo condiciones controladas, se detectan los ARNm hlbrldizados con equipo Phosphor Imager o por autorradiografía. Los experimentos se llevan a cabo por duplicado y se puede realizar un análisis cuantitativo de ARNm que se expresan diferencialmente. Las técnicas mencionadas antes permiten el análisis de los niveles de expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención, en la misma célula o el mismo tejido, en base en las diferentes condiciones, por ejemplo de inducción o de no inducción, y también el análisis de la especificidad de tejido de esta expresión, bajo condiciones las cuales también pueden variar. Otro aspecto de la presente invención se relaciona con métodos para identificar moléculas capaces de unirse con los polipéptidos de acuerdo con la invención, en particular el polipéptido de la secuencia SEC ID No. 2. Tales moléculas se pueden utilizar para modular la actividad biológica de estos polipéptidos. Por ejemplo, tales moléculas se pueden utilizar para estimular o disminuir la actividad de estos polipéptidos. Por lo tanto, la invención comprende un método para seleccionar compuestos químicos o bioquímicos capaces de modular la actividad del polipéptido de la secuencia SEC ID No. 2, caracterizados porque comprenden poner al polipéptido de acuerdo con la invención o una célula de acuerdo con la ¡nvención en contacto con un compuesto candidato, y detectar una modificación de la actividad del polipéptido de la secuencia SEC ID No. 2 Un objetivo de la invención también es un método para seleccionar compuestos químicos o bioquímicos, ¡n vivo o in vitro, capaces de unirse con el polipéptldo de la secuencia SEC ID No. 2 caracterizados porque comprenden colocar al polipéptido de acuerdo con lá invención o una célula de acuerdo con la invención en contacto con un compuesto candidato y detectar la formación de un complejo entre el compuesto candidato y el polipéptido. Existen muchos métodos para identificar ligandos para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención. Por ejemplo, sin que se limite a estos, se puede hacer mención de un método para" identificar moléculas capaces de ¡nteractuar con el polipéptido de la secuencia SEC ID No. 2 utilizando un sistema de dos híbridos bacterianos o de levadura tales como el Matchmaker Two Hybrid System 2, de acuerdo con las instrucciones del manual que acompaña a Matchmaker Two Hybrid System 2 (catálogo No. K1604-1 , Clontech). Para estudiar la interacción del polipéptido de la secuencia SEC ID No. 2 con moléculas pequeñas, tales como las generadas por química combinacional, es posible utilizar microdiáiisis acoplada a CLAP como se describe en Wang et al. (Chromatographia, 44:205-208, 1997), o electroforesis de capilaridad de afinidad como se describe en Busch et al. (J. Chromatogr., 777:311-328, 1997). En otros métodos, los péptidos o moléculas pequeñas de interactuar con el polipéptido o la secuencia SEC ID No. 2 de acuerdo con la invención se pueden unir a marcas detectables, tales como marcas radioactivas, fluorescentes o enzimáticas. Estas moléculas marcadas se ponen en contacto con el polipéptido inmovilizado de acuerdo con la invención, bajo condiciones las cuales permiten interacción específica. Después de la eliminación de las moléculas que no están unidas específicamente, se detectan por medios adecuados a las moléculas unidas. También se puede utilizar la tecnología BIACORE para llevar a cabo una detección sistemática de los compuestos capaz de ¡nteractuar con el polipéptido de la secuencia SEC ID No. 2. Esta tecnología, descrita en A. Szabo et al. (Curr. Opin. Struct. Biol., 5:699-705, 1995), posibilita detectar interacciones entre moléculas en tiempo real, sin utilizar marcado. Se basa en el fenómeno de SPR (resonancia de plasmón de superficie). Una de las ventajas principales de este método es que posibilita determinar las constantes de asociación para el polipéptido de la secuencia SEC ID No. 2 y las moléculas que interactúan. Por lo tanto, es posible seleccionar específicamente las moléculas que ¡nteractúan con constantes de asociación altas o bajas. Las proteínas u otras moléculas las cuales ¡nteractúan con el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención se pueden identificar utilizando columnas de afinidad las cuales contienen al polipéptido, o un fragmento del mismo, de acuerdo con la invención. El polipéptido de la secuencia SEC ID No. 2 o un fragmento del mismo se puede unir a la columna utilizando técnicas convencionales las cuales incluyen acoplamiento químico a una matriz de columna adecuada tal como agarosa, Affi Ge! u otras matrices conocidas por los expertos en la técnica. En otro aspecto de la invención, la columna de afinidad puede contener proteínas quiméricas en las cuales se puede fusionar el polipéptido de la secuencia SEC ID No. 2 o un fragmento de la misma, por ejemplo con glutation S-transferasa. Las moléculas que se van a probar descritas en lo anterior después se cargan en la columna. Las moléculas que ¡nteractúan con el polipéptido de la secuencia SEC ID No. 2 se retienen por la columna y se pueden aislar por elusión. La invención también se relaciona con un método para la detección sistemática y/o la selección de compuestos que interactúan con las secuencias promotoras y/o reguladoras de los genes que codifican para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención. Los ácidos nucleicos que codifican para proteínas que interactúan con las secuencias promotoras y/o reguladoras del gen que codifica para el polipéptldo de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención, se pueden someter a detección sistemática y/o se pueden seleccionar utilizando un sistema de un híbrido, tal como el descrito en el manual que acompaña al equipo Matchmaker One-Hybrid System de Clontech (catálogo No. K1603). Los compuestos capaces de modificar la expresión del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención, al unirlo a sus secuencias reguladoras y/o promotoras también se pueden seleccionar utilizando genes "indicadores", tales como fosfatasa alcalina, -galactosldasa o GFP (proteína fluorescente verde). De esta manera se puede evaluar el efecto de los compuestos candidatos sobre la expresión derivada de las secuencia reguladora y/o promotora del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención. En otro aspecto, la ¡nvención comprende el uso de un ácido nucleico o polipéptido de acuerdo con la invención, de una célula de acuerdo con la invención o de un mamífero de acuerdo con la ¡nvención, para estudiar la expresión o actividad del polipéptido de la secuencia SEC ID No. 2 de acuerdo con la ¡nvención, y/o las interacciones directas o indirectas entre el polipéptido de la secuencia SEC ID No. 2 y los compuestos químicos o bioquímicos los cuales puedan estar involucrados en su actividad. Los compuestos químicos o bioquímicos caracterizados porque se seleccionan utilizando los métodos definidos en lo anterior también son parte de la ¡nvención. Entre estos compuestos, los compuestos químicos o bioquímicos los que posibilitan modular la expresión o actividad del polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención son los que se prefieren. Se pretende que la expresión "compuestos los cuales posibilitan modular la expresión o actividad del polipéptido de la secuencia SEC ID No. 2 de acuerdo con la invención" indica los compuestos los cuales, en particular, posibilitan disminuir, estabilizar o aumentar la cantidad o la especificidad del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención, o promover o inhibir la actividad total o la actividad de uno de los dominios específicos del polipéptldo, o reestablecer la expresión normal del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención cuando, por ejemplo, se observa una anomalía genética. Estos compuestos pueden interaduar, por ejemplo, como ligandos específicos para el polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención, o para un dominio del mismo, como un cofactor o como un inhibidor, en particular un inhibidor competitivo, o que tengan una actividad la cual es agonista o antagonista para la actividad dei polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención. Estos compuestos también pueden interactuar ya sea al neutralizar los ligandos específicos naturales para el polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención y por io tanto inhiben la actividad del polipéptido, inducido por estos ligandos o al neutralizar el sitio de unión de estos ligandos naturales. La invención comprende los compuestos de acuerdo con la invención, caracterizados porque son agonistas o antagonistas de la actividad del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención. La ¡nvención también comprende compuestos de acuerdo con la invención, caracterizados porque son capaces de unirse a un polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención. En particular, entre estos compuestos de acuerdo con la invención, se da preferencia a los compuestos caracterizados porque se eligen de: un anticuerpo de acuerdo con la invención, un polipéptido de acuerdo con la invención, que incluye los polipéptidos de las secuencias SEC ID No. 173 y SEC ID No. 51 , respectivamente, descritos en los documentos WO 99/54461 y WO 99/06458, un polipéptido de acuerdo con la invención, caracterizado porque corresponde a un fragmento o a la fracción soluble del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la ¡nvención, - un ácido nucleido de acuerdo con la ¡nvención, que incluye el ácido nucleico de la secuencia SEC ID No. 11 del documento WO 99/54461 , de la secuencia SEC ID No. 51 del documento WO 99/06548 y de la secuencia Al 672868, AA 890726 o Al 30140 de los documentos EMBL de los números de identificación correspondientes, los cuales pueden ser directos o antisentido, y un vector de acuerdo con la ¡nvención. _ En otro aspecto, la ¡nvención comprende compuestos de acuerdo con la invención, como un producto medicinal para evitar y/o tratar trastornos patológicos relacionados con una anomalía de la expresión y/o de la actividad del polipéptido de la secuencia SEC ID No. 2, de acuerdo con la invención. En particular, la invención comprende compuestos de acuerdo con la ¡nvención, como un producto medicinal para evitar y/o tratar condiciones patológicas inmunes, en particular para evitar y/o tratar enfermedades autoinmunes o cánceres. Finalmente, la invención comprende compuestos de acuerdo con la invención, como un producto medicinal para evitar y/o tratar infecciones de tipo viral, micótlco, bacterial o parasitario. Los compuestos de la invención, como principios activos de un producto medicinal, preferiblemente estarán en forma soluble, combinados con un vehículo farmacéuticamente aceptable. Preferiblemente, estos compuestos se administrarán de manera sistémica, en particular por vía intravenosa, intramuscular, intradérmica u oral. Sus formas farmacéuticas, dosis y métodos de administración óptimos se pueden determinar de acuerdo con los criterios que se consideran en general al establecer un tratamiento adecuado para un paciente, tal como por ejemplo la edad o peso corporal del paciente, lo grave de su estado general, la tolerancia al tratamiento y los efectos colaterales que se observan, etc. Otras características y ventajas de la invención aparecen en el resto de la descripción con los ejemplos y figuras, cuyas leyendas se representan a continuación.

LEYENDAS DE LAS FIGURAS Figuras 1A y 1B: La expresión del ARN que codifica para el péptido de la secuencia SEC ID No. 2 se analiza por transferenda Northern utilizando membranas disponibles comercialmente (Múltiple Tissue Northern; Clontech, Palo Alto, CA). Se presentan los resultados representativos que se obtienen con dos membranas diferentes. 1. hígado fetal, 2. médula ósea, 3. células mononucleares, 4. timo, 5. nodulos linfáticos periféricos, 6. bazo, 7. células mononucleares, 8. pulmón, 9. placenta, 10. intestino delgado, 11. hígado, 12. riñon, 13. bazo, 14. timo, 15. colon, 16. músculo esquelético, 17. corazón, 18. cerebro. El ARNm que codifica para el polipéptido en la secuencia SEC ID No. 2 se expresa en células mononucleares, bazo, pulmón e intestino delgado. Figura 2: Se evalúa por PCR la expresión del ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 en las diversas subpoblaciones de células mononucleares no estimuladas, linfocitos T (carril 1), linfocitos B (carril 2), células NK (carril 3) y monocitos (carril 4), y también en células dendríticas generadas in vitro (carril 5). Se evalúan la integridad del ARN y también la calidad del ADNc sintetizado por amplificación del ADNc que codifica para la molécula GAPDH. El ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa en células mononucleares, bazo, pulmón e intestino delgado. Figura 3: Se analiza por PCR el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 en líneas tumorales humanas. Las líneas de células analizadas son carril 1: A549, carril 2: THP1, carril 3: HTB10, carril 4: T24, carril 5: Daudi, carril 6: A427, carril 7: U373, carril 8: HEP2, carril 9: HT29, carril 10: BT20. El ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa constitutivamente en diversas líneas de tumores humanos. Figura 4: Se transfectan células COS con ei vector pCDNA3.1 que contiene el ADNc completo que codifica para el polipéptido de la secuencia SEC ID No. 2. Se obtienen las fracciones citoplásmica y no citoplásmica de las células después de tres días de transfección mediante congelado/descongelado. Los extractos proteínicos se separan por electroforesis en SDS-PAGE; se evalúa la expresión de la proteína recombinante por análisis de transferencia de Westemblot utilizando un anticuerpo contra c-myc. Carril 1: fracción no citoplásmica, carril 2: fracción citoplásmica. El polipéptido de la secuencia SEC ID No. 2 se expresa en la fracdón no citoplásmica de las células transfectadas.

EJEMPL0 1 Clonación del ADNc que codifica para el polipéptido de la secuencia SEC D No. 2 Con el objetivo de identificar moléculas novedosas expresadas selectivamente en la superficie de células humanas, se lleva a cabo una búsqueda de secuencias que posiblemente contengan un motivo transmembranal en bancos de datos EST (etiqueta de secuencia expresada) en humanos. Metodología Se identifican las secuencias EST humanas que codifican para motivos transmembranales potenciales utilizando el programa TopPred 2 (programa para predecir proteínas unidas a membrana) el cual está disponible en la red (http://www.biokemi.su.se/TopPred2). Entre las muchas secuencias obtenidas, se seleccionan EST #AI301140 en base en el hecho de que el producto de traducción tiene un motivo transmembranal (posición 14-34 con una calificación de predicción de 1,868) y en que la secuencia nucleotídica no es homologa a alguna otra secuencia conocida. La secuencia nucleotídica disponible (http://www.ncbi.nih.nlm.gov) tiene un marco de lectura abierta de 116 aminoácidos con un codón de detención. Cuando se realiza una investigación para determinar homólogos de la secuencia #AI301140 en el banco de datos EST humano. De esta manera se seleccionan 18 de secuencia nucleotídicas novedosas en base en la homología con la secuencia #AI301 40. Los clones se obtienen de Research Genetics (New York, NY). Los clones bacterianos se seleccionan utilizando el antibiótico apropiado. Se purifica el ADN plasmídico utilizando un equipo disponible comercialmente (equipo de extracción de ADN Midiprep, Qiagen, Alemania), y se secuencia utilizando el equipo ABI Prism BigDye Termitator DNA (Perkin Elmer Applied Biosystems, Warrington, Reino Unido), de acuerdo con las instrucciones del proveedor. Se analiza la secuencia con un secuenciador automático ABI Prism 377 (Perkin Elmer Applied Biosystems). Se analizan las secuencias utilizando el programa de análisis de secuencia Sequencher (Genecodes, Ann Arbor, MI). Después de alineación de las diversas secuencias, se define un fragmento de ADN de 1100 pares de bases que tiene un marco de lectura abierta que contiene el codón de detención y la cola poli-A. Este fragmento se amplifica por PCR utilizando iniciadores específicos que corresponden a los extremos 5' y 3' de la secuencia alineada. Se obtiene la secuencia completa de ADNc por una serie de ciclos de aplicación por PCR del extremo 5' (5'RACE) (Frohman, M.A., et al., Proc. Nati. Acad. Sci. EUA, 85:8998-9002, 1988) utilizando equipos disponibles comercialmente. El ADN de matrices se prepara por ADN a partir de cerebro humano y médula ósea (Marathon-Ready cDNA; Clontech). Se define la predicción de un péptido señal utilizando un programa disponible en la red (http://www.cbs.dtu.dk/services/SignalP). La molécula tiene un peso molecular predicho de 113 kDa, un pl de 6.5 y 3 posibles sitios de glicosilación (residuos de treonina y serina). Resultados Se selecciona una clona de ADNc (#AI301140) que codifica para una molécula que tiene un motivo transmembranal, por análisis de los bancos de datos EST humanos disponibles. La secuencia de ADNc SEC ID No. 1 obtenida tiene una longitud de 3331 pares de bases y no muestra homología con moléculas que se encuentren en bases de datos. Tiene un marco de lectura abierta 3042 pares de bases que codifica para una proteína putativa de 1013 aminoácidos. Ei codón de inicio se localiza en la posición nt 45-47 y el codón de detención se localiza en la posición nt 3084-3086 de la secuencia SEC ID No. 1. El análisis de la secuencia de proteínas predice que esta proteína de secuencia SEC ID No. 2 tiene un péptido señal de secuencia aa 1-41 , un dominio extracelular de secuencia aa 42-911 , un dominio transmembranal de secuencia aa 912-930 y un dominio intracelular de secuencia aa 931-1013. Las secuencias SEC ID No. 3, SEC ID No. 5, SEC ID No. 7, y SEC ID No. 9 corresponden a fragmentos de secuencia SEC ID No. 1 los cuales no son homólogos a las secuencias EST seleccionadas en el ejemplo 1.

EJEMPLO 2 Expresión en tejido del ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 Metodología La expresión de tejido del polipéptido de la secuencia SEC ID No. 2 se analiza por transferencia Northern utilizando membranas disponibles comercialmente las cuales posibilitan evaluar la expresión de un ARNm en diversos tejidos (Múltiple Tissue Northern or MTN, Clontech). Se genera por PCR un fragmento de ADNc que corresponde al fragmento nt 385-nt 1137, utilizando iniciadores específicos, cuya secuencia se deduce de la secuencia SEC ID No. 1. Después de purificación, se marcan radioactivamente 25 µg de este fragmento utilizando un equipo disponible comercialmente (equipo de etiquetado de ADN Multiprime, Amersham, Amersham, Reino Unido) y el nucleótido radioactivo (a-32P]-dATP. La sonda marcada se purifica por cromatografía. Las membranas se preincuban en una solución 2 X SSC (citrato de sodio 300 mM, pH 7 - NaCI 3 M - dodecilsulfato de sodio 0.1 %) durante 2 horas a 50°C, con agitación. Posteriormente, la membrana se incuba durante la noche a 50°C, con agitación, con la sonda radiomarcada la cual ha sido desnaturalizada por calor 10 minutos a 95°C). Después de tres lavados (15 minutos a 55°C con agitación) en solución 2 x SSC-SDS 0.1 %, las membranas se exponen a una película autorradiográfica (Kodak, Rochester, NY) durante 24 horas.

Resultados Las membranas de transferencia de análisis de Northernblot, que se presentan en las figuras 1A y 1B, muestran una fuerte señal de hibridación en las células mononucleares sanguíneas periféricas y en intestino delgado, el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 también se expresa en el timo, bazo, cerebro y pulmón. Por lo tanto, el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa de manera preferencial en tejidos linfoides humanos.

EJEMPLO 3 Expresión de ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 en las diversas poblaciones de sangre circulante Metodología Aislamiento de las diversas subpoblaciones celulares de sangre periférica Se extrae sangre de un individuo voluntario sano por leucoféresis (en presencia de un anticoagulante tal como, por ejemplo, heparinato de litio). Se aislan tas células mononucleares (MNC) (que contiene linfocitos T, linfocitos B y monocitos) por centrifugación en un gradiente Ficoll-Hypaque (densidad = 1.077) (Pharmacia, Uppsala, Suecia). Brevemente, las células sanguíneas se centrifugan a 1500 rpm durante 30 minutos a temperatura ambiente. Los MNC que se localizan en la interfase de Ficoll-plasma se recuperan y se lavan dos veces en presencia de medio RMPI 1640 (Life technologies). Los linfocitos T se purifican por la técnica de formación de "roseta". Brevemente, los MNC se resuspenden a una concentración de 200 x 106 células/ml y se mezclan con 1 ml de una solución que contiene 50% de eritrocitos de borrego (BioMérieux, Marcy PEtoile Francia). La suspensión celular se incuba a 4°C durante la noche. Después de resuspensión suave, se aislan los linfocitos T por centrifugación en un gradiente Ficoll-Hypaque (1500 rpm durante 30 minutos a temperatura ambiente). Se recolectan los complejos de eritrocitos de borrego-linfocito T en el fondo del tubo. Los eritrocitos se lisan por dos choques hipotónicos sucesivos. Se evalúa la pureza de los linfocitos T aislados de esta manera por marcado con anticuerpo contra CD3 FITC, la cual es de >95%. Brevemente, las células se lavan en regulador de pH FACS (regulador de pH de fosfato 10 mM, pH 7.4, que contiene albúmina sérica bovina 1% y azida de sodio 0.01%), antes de distribuirse en pozos de una placa de cultivo con fondo de cono de 96 pozos (Nunc, Roskitde, Dinamarca) a 2 x 105 células, en un volumen de 50 µl de regulador de pH FACS. A cada pozo se agrega anticuerpo marcado con FITC contra CD3 humano (Bedon Dickinson) o anticuerpo isotípico control marcado con FITC (Bedon Dickinson). Después de incubación durante 20 minutos a 4°C, las células se lavan dos veces con 200 µl de regulador de pH FACS y después se resuspenden en 200 µl de este mismo regulador de pH. La expresión de CD3 en la superficie de los linfocitos T se analiza por FACS.

Se purifican los monocitos por una técnica de selección positiva utilizando esferas magnéticas recubiertas con anticuerpo contra CD14 humano (sistema MACSMR; Miltenyi Biotex, Bergish Gladbach, Alemania). Brevemente, se incuban células mononucleares (300 x 106/ml) con 60 ml de una suspensión de esferas (Miltenyi) a 4°C durante 15 minutos en regulador de pH PBS/EDTA 2 mM/albúmina sérica bovina 0.5% (PBS/EDTA/BSA). Después del lavado, las células se cargan en una columna la cual se somete a un campo magnético. Después de tres lavados con la solución PBS/EDTA BSA, se separa la colonia del campo magnético y los monocitos se recolectan por gravedad. La pureza de los monocitos, evaluada por citometría en base en parámetros de tamaño/granulocidad, es mayor de 95%. Se generan in vitro células dendríticas humanas inmaduras a partir de monocitos purificados como se describe antes. Se cultivan los monocitos a una concentración de 106 células/ml en el siguiente medio (denominado subsecuentemente como medio de cultivo completo): medio RPMl 1640 suplementado con suero bovino fetal 10% (calentado a 56°C durante 30 minutos), 2 mM de L-glutamina, 50 U/ml de penicilina y 50 Dm/ml de estreptomicina (Life technologies) en placas de cultivo de 6 pozos (Nunc, Roskilde, Dinamarca) a 5 ml de medio por pozo. Las células se activan con 20 ng/ml de IL-4 humana recombinante y 20 ng/ml de GM-CSF humana recombinante (R&D Systems, Abingdon, Reino Unido). Después de cultivar durante 6 días (37°C, CO2 5% en una atmósfera húmeda), se define el fenotipo de las células por dtometría de flujo, mediante análisis de la expresión de moléculas CD a y CD83 utilizando un anticuerpo marcado con fluoresceína contra CD1a humano, o un anticuerpo contra CD83 humano (Becton Dickinson) el cual se detecta con un anticuerpo marcado con fluoresceína contra inmunoglobulina de ratón (Silenus, Hauworth, Australia). Las células dendríticas inmaduras se caracterizan por expresión de la molécula CD1a (intensidad de fluorescencia media (MFI)>100) y ausencia de expresión de la molécula CD83. Se aislan células NK (CD56+/CD3-) a partir de los MNC por citometría de flujo (selección positiva) después de marcado con anticuerpo, marcado con fluoresceína contra CD56 (Becton Dickinson) y un anticuerpo, marcado con ficoeritrina, contra CD3. Las células se marcan con el anticuerpo como se describe en lo anterior. Las células se clasifican en un equipo FACS Vantage (Becton Dickinson); la pureza es >98%. Se aislan linfodtos B de amígdalas recolectadas después de exéresis quirúrgica. Brevemente, se muelen mecánicamente las amígdalas y después se hacen pasar sobre un tamiz con una porosidad de 50 Dm. Se aislan por centrifugación células mononucleares, sobre un gradiente Ficoll-Hypaque como se describe antes. Se separan los linfocitos T de la suspensión de MNC utilizando la técnica de formación de rosetas, como se describe en lo anterior. Se evalúa la pureza de la población de linfocitos B por citometría de flujo utilizando un anticuerpo marcado con FITC contra CD20; la pureza es de >95%.

Técnica de PCR Se analiza por PCR la expresión del ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 en varias subpoblaciones de MNC. Brevemente, las células se lavan dos veces en PBS y después se lisan en un medio de extracción de ácido nucleico Trizol (Life technologies). Se separan las proteínas por dos extracciones sucesivas con fenol/cloroformo/ácido isoamílico (25 : 24 : 1) (Life technologies). Se agrega un volumen equivalente de alcohol isopropílico a la fase acuosa o para precipitar los ácidos nucleicos (durante la noche a -20°C). Los ácidos nucleicos se recolectan por centrifugación (12,000 rpm, 30 minutos a 4°C). El sedimento se lava una vez con una solución de etanol a 70°C. El sedimento se resuspende en agua y los ARNs se cuantifican por espedrometría (? = 260 nm). Después de la desnaturalización (65°C, 10 min), se someten a transcripción inversa 2 Og de ARN total utilizando un iniciador oligo-dT, con la ayuda de un equipo disponible comercialmente (Promega, Madison, Ml), de acuerdo con las recomendaciones del fabricante. El ADNc que codifica para el polipéptido de la secuencia SEC ID No. 2 se amplifica por PCR utilizando los siguientes iniciadores: 5'-TGACTCGGAATCACCTCCCAGCT-3' (SEC ID No. 11) y 5'-CAAGACGGTGAGCAGGATGGCAGTACAG-3' (SEC ID No. 12). Se utiliza la integridad del ARN para preparar los ADNc que se analizan al evaluar la expresión de ADNc que codifica para la molécula GAPDH utilizando los siguientes iniciadores. 5'-TCCACCACCCCTGTTGCTGTA-3' (SEC ID No. 13) y 5'-ACCACAGTCCATGCCATCAC-3' (SEC ID No. 14). La mezcla de reacción es como sigue: 1 DI de ADNc (que corresponde a 25 ng de ARN total), 25 pmol de iniciador, dNTP 200 DM, MgCI2 1.5 mM, Tris-HCl 10 mM, pH = 8.3, KCl 50 mM y 0.4 unidades de polimerasa Taq (Perkin Elmer). Las condiciones de PCR son: 5 min a 95°C, 30 ciclos: 1 min a 94°C, 1 min a 55°C y 1 min a 72°C, y una extensión final de 5 min a 72°C. Las muestras se captan en el regulador de pH de muestra (azul de bromofenol 0.25%, sacarosa 40%). Las muestras se analizan por electroforesis en un gel de agarosa 1% el cual contiene bromuro de etilo. Después de la migración, las muestras se visualizan por iluminación UV del gel.

Resultados El ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se detecta por PCR únicamente en los linfocitos T periféricos no estimulados. No se encuentra en otras poblaciones de células mononucleares probadas (células NK, linfocitos B, monocitos). El ARNm también se detecta en células dendríticas humanas generadas in vitro. Los resultados se proporcionan en la figura 2. De esta manera, el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa selectivamente por los linfodtos T de sangre circulante.

EJEMPLO 4 El ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa en diversas líneas de células tumorales Metodología Evaluamos la expresión del ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2 en varias líneas de células tumorales. Estas líneas de células se obtienen de ATCC y se cultivan de acuerdo con las instrucciones que se proporcionan. La extracción de ARN total y la síntesis de ADNc se lleva a cabo como se describe antes. La expresión de ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 y la molécula GAPDH se analiza por PCR como se describe antes.

Resultados Los experimentos de PCR (figura 3) muestran que las siguientes líneas de células humanas expresan constitutivamente el ARNm que codifica para el polipéptido de la secuencia SEC ID No. 2: adenocarcinoma de pulmón (línea A549), leucemia monocítica (línea THP1), neuroblastoma (línea HTB10), carcinoma de vejiga (T24), linforma de Burkitt (línea Daudi), carcinoma de pulmón (línea A427), glioblastoma (línea U373), carcinoma de la laringe (línea HEP2), carcinoma del colon (línea HT29) y carcinoma de mama (línea BT20). Por lo tanto, el ARN que codifica para el polipéptido de la secuencia SEC ID No. 2 se expresa por cierta cantidad de líneas tumorales.

EJEMPLO 5 El polipéptido recombinante de la secuencia SEC ID No. 2 se expresa principalmente en la fracción de membrana de células COS transfectadas Metodología Se transfectan células COS con el vector pCDNA3.1 (Invitrogen) que contiene un fragmento de inserción que codifica para el polipéptido de la secuencia SEC ID No. 2. Este sistema posibilita agregar un epítope c-myc a la molécula recombinante. La transfección se lleva a cabo por la técnica de lipofección (Fugene; Boehringer Mannheim, Alemania). Tres días después de la transfección las células se recolectan y se lavan tres veces con PBS. Posteriormente las células se someten a tres series de ciclos rápidos de congelamiento/recalentamiento y se centrifugan posteriormente a 12,000 rpm durante .10 min a 4°C. El sobrenadante corresponde a la fracción citoplásmica y el sedimento corresponde al componente de membrana más el núcleo más los organelos. El sedimento se resuspende en un regulador de pH de fosfato 10 mM, pH 7.4 que contiene 0.5% de Nonidet P40 y una mezcla de inhibidores de proteasa (Boehringer Mannheim, Alemania) durante 20 minutos a 4°C. Los usados celulares después se centrifugan a 12,000 rpm durante 10 minutos a 4°C para eliminar los núcleos. Los sobrenadantes que corresponden a las fracciones de membrana y citoplasma se captan en un volumen equivalente de regulador de pH de fosfato 10 mM que contiene 0.1 % de azul de bromofenol, 5% de glicerol y 0.1% de ß-mercaptoetanol. Las proteínas después se separan de acuerdo con su peso molecular por electroforesis en gel de poliacrilamida (gel de apilamiento 5%-gel de separación 10%>). Se carga en cada carril una cantidad de proteína que corresponde a 5 x 106células. Después de la migración, las proteínas se transfieren mediante Westernblot a una membrana de nitrocelulosa. Después de saturación en una solución de fosfato que contiene 10% de leche desnatada, las membranas se incuban durante la noche a 4°C, con agitación, con un anticuerpo contra c-myc (clona 9E10; ATCC, Manassas, VA) a la concentración de 10 µg/ml. Después del lavado con un regulador de pH de fosfato que contiene 10% de leche desnatada, las membranas se incuban con anticuerpo contra inmunoglobulina de ratón, marcada con peroxidasa (Amersham) durante 2 horas a temperatura ambiente, con agitación. Las membranas se lavan con regulador de pH de fosfato. Se detedan los anticuerpos unidos por quimioluminiscencia utilizando el sistema ELC de Amersham. Resultados La transferencia Western que se muestra en la figura 4 indica que la proteína recombinante se expresa principalmente en la fracción insoluble de los extractos celulares (membrana citoplásmica más órganelos intracitoplásmicos). Este resultado, y también la predicción de un dominio transmebranal potencial, sugieren que el polipéptido recombinante se expresa en la superficie de las células transfectadas. De esta manera, el polipéptido recombinante de la secuencia SEC ID No. 2 se expresa en la fracción de membrana (no citoplásmlca) de las células COS transfectadas.

EJEMPLO 6 El gen que codifica para el polipéptido de la SEC ID No. 2 se localiza en el cromosoma 11q33-11 q34 Metodología Se determina la posición cromosómica del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 mediante una detección sistemática del banco de datos Unigene utilizando la secuencia EST #AI3011410.

Resultados Se encontró una secuencia de ADN genómico que muestra 98%> de homología con EST #AI301140, en un fragmento de cromosoma 11q en el grupo 33-34. Muchos genes de susceptibilidad a tumor se han localizado en la región genómica 11q23-40 (Koreth, J., et al. J. Pathol., 187:28-38, 1999). El gen que codifica para el polipéptido de la secuencia SEC ID No. 2 se localiza en el cromosoma 11 , región q133-q34. Este resultado permite confirmar que el polipéptido de la secuencia SEC ID No. 2 puede estar relacionado en la regulación de la respuesta ¡nmunitaria y que una modificación de su expresión se puede relacionar con trastornos ¡nmunológicos que probablemente induzca a las células a mostrar expresión anormal del gen que codifica para el polipéptido de la secuencia SEC ID No. 2 para que se vuelvan de naturaleza tumoral.

LISTADO DE SECUENCIAS <110> PIERRE FABRE MÉDICAM?NT <120> CLONACIÓN, EXPRESIÓN Y CARACTERIZACIÓN DE UN GEN QUE SE EXPRESA EN CÉLULAS TUMORALES Y QUE ESTÁ RELACIONADO CON LA REGULACIÓN DE LA RESPUESTA INMUNITARIA <130> D18391 <150> PCT/FROO/03032 <151> 2000-10-30 <150> FR 99 13629 <151> 1999-10-29 <160> 22 <170> Patentln Ver. 2.1 <210> 1 <211> 3331 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (45) .. (3083) <400> 1 gtgattactc actatagggc tcgagcggcc gcccgggcag gtct atg gct gag ect 56 Met Ala Glu Pro 1 ggg cae age cae cat ctc tcc gcc aga gtc agg gga aga act gag agg 104 Gly His Ser His His Leu Ser Ala Arg Val Arg Gly Arg Thr Glu Arg 5 10 15 20 cgc ata ecc cgg ctg tgg cgg ctg ctg ctc tgg gct ggg acc gcc ttc 152 Arg lie Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala Gly Thr Ala Phe 25 30 35 cag gtg acc cag gga acg gga ceg gag ctt cat gcc tgc aaa gag tet 200 Gln Val Thr Gln Gly Thr Gly Pro Glu Leu His Ala Cys Lys Glu Ser 40 45 50 gag tac cae tat gag tac acg gcg tgt gac age acg ggt tcc agg tgg 248 Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr Gly Ser Arg Trp 55 60 65 agg gtc gcc gtg ceg cat acc ceg ggc ctg tgc acc age ctg ect gac 296 Arg Val Ala Val Pro His Thr Pro Gly Leu Cys Thr Ser Leu Pro Asp 70 75 80 ecc gtc aag ggc acc gag tgc tcc ttc tcc tgc aac gcc ggg gag ttt 344 Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn Ala Gly Glu Phe 85 90 95 100 ctg gat atg aag gac cag tea tgt aag cea tgc gct gag ggc cgc tac 392 Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala Glu Gly Arg Tyr 105 110 115 tcc ctc ggc acá ggc att cgg ttt gat gag tgg gat gag ctg ecc cat 440 Ser Leu Gly Thr Gly lie Arg Phe Asp Glu Trp Asp Glu Leu Pro His 120 125 130 ggc ttt gcc age ctc tea gcc aac atg gag ctg gat gac agt gct gct 488 Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala 135 140 145 gag tcc acc ggg aac tgt act teg tcc aag tgg gtt ecc cgg ggc gac 536 Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp 150 155 160 tac ate gcc tcc aac acg gac gaa tgc acá gcc acá ctg atg tac gcc 584 Tyr lie Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala 165 170 175 180 gtc aac ctg aag caá tet ggc acc gtt aac ttc gaa tac tac tat cea 632 Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro 185 190 195 gac tcc age ate ate ttt gag ttt ttc gtt cag aat gac cag tgc cag 680 Asp Ser Ser lie lie Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln 200 205 210 ecc aat gca gat gac tcc agg tgg atg aag acc acá gag aaa gga tgg 728 Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp 215 220 225 gaa ttc cae agt gtg gag cta aat cga ggc aat aat gtc ctc tat tgg 776 Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp 230 235 240 aga acc acá gcc ttc tea gta tgg acc aaa gta ecc aag ect gtg ctg 824 Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu 245 250 255 260 gtg aga aac att gcc ata acá ggg gtg gcc tac act tea gaa tgc ttc 872 Val Arg Asn lie Ala lie Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe 265 270 275 ecc tgc aaa ect ggc acg tat gca gac aag cag ggc tcc tet ttc tgc 920 ro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys 280 285 290 aaa ctt tgc cea gcc aac tet tat tea aat aaa gga gaa act tet tgc 968 Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys 295 300 305 cae cag tgt gac ect gac aaa tac tea gag aaa gga tet tet tcc tgt 1016 His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys 310 315 320 aac gtg cgc cea gct tgc acá gac aaa gat tat ttc tac acá cae acg 1064 Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr 325 330 335 340 gcc tgc gat gcc aac gga gag acá caá ctc atg tac aaa tgg gcc aag 1112 Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys 345 350 355 ceg aaa ate tgt age gag gac ctt gag ggg gca gtg aag ctg ect gcc 1160 Pro Lys lie Cys Ser Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala 360 365 370 tet ggt gtg aag acc cae tgc cea ecc tgc aac cea ggc ttc ttc aaa 1208 Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys 375 380 385 acc aac aac age acc tgc cag ecc tgc cea tat ggt ecc tac tcc aat 1256 hr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn 390 395 400 ggc tea gac tgt acc cgc tgc ect gca ggg act gaa ect gct gtg gga 1304 Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly 405 410 415 420 ttt gaa tac aaa tgg tgg aac acg ctg ecc acá aac atg gaa acg acc 1352 Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr 425 430 435 gtt ctc agt ggg ate aac ttc gag tac aag ggc atg acá ggc tgg gag 1400 Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu 440 445 450 gtg gct ggt gat cae att tac acá gct gct gga gcc tea gac aat gac 1448 Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp 455 460 465 ttc atg att ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg 1496 Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser 470 475 480 gtg atg gca gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc 1544 Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val 485 490 495 500 ttt gag acc ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt 1592 phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly 505 510 515 gtg aat tet agg acc aac act ect gtg gag acg tgg aaa ggt tcc aaa 1640 Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp Lys Gly Ser Lys 520 525 530 ggc aaa cag tcc tat acc tac ate att gag gag aac act acc acg age 1688 Gly Lys Gln Ser Tyr Thr Tyr He He Glu Glu Asn Thr Thr Thr Ser 535 540 545 ttc acc tgg gcc ttc cag agg acc act ttt cat gag gca age agg aag 1736 Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu Ala Ser Arg Lys 550 555 560 tac acc aat gac gtt gcc aag ate tac tcc ate aat gtc acc aat gtt 1784 Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn Val Thr Asn Val 565 570 575 580 atg aat ggc gtg gcc tcc tac tgc cgt ecc tgt gcc cta gaa gcc tet 1832 Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala Leu Glu Ala Ser 585 590 595 gat gtg ggc tcc tcc tgc acc tet tgt ect gct ggt tac tat att gac 1880 Asp Val Gly Ser Ser Cys Thr Ser Cys Pro Ala Gly Tyr Tyr He Asp 600 605 610 cga gat tea gga acc tgc cae tcc tgc ecc ect aac acá att ctg aaa 1928 Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn Thr He Leu Lys 615 620 625 gcc cae cag ect tat ggt gtc cag gcc tgt gtg ecc tgt ggt cea ggg 1976 Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro Cys Gly Pro Gly 630 635 640 acc aag aac aac aag ate cae tet ctg tgc tac aat gat tgc acc ttc 2024 Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn Asp Cys Thr Phe 645 650 655 660 tea cgc aac act cea acc agg act ttc aac tac aac ttc tcc gct ttg 2072 Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn Phe Ser Ala Leu 665 670 675 gca aac acc gtc act ctt gct gga ggg cea age ttc act tcc aaa ggg 2120 Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe Thr Ser Lys Gly 680 685 690 ttg aaa tac ttc cat cae ttt acc ctc agt ctc tgt gga aac cag ggt 2168 Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys Gly Asn Gln Gly 695 700 . 705 agg aaa atg tet gtg tgc acc gac aat gtc act gac ctc cgg att ect 2216 Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp Leu Arg He Pro 710 715 720 gag ggt gag tea ggg ttc tcc aaa tet ate acá gcc tac gtc tgc cag 2264 , Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala Tyr Val Cys Gln 725 730 735 740 gca gtc ate ate ecc cea gag gtg acá ggc tac aag gcc ggg gtt tcc 2312 Ala Val He He Pro Pro Glu Val Thr Gly Tyr Lys Ala Gly Val Ser 745 750 755 tea cag ect gtc age ctt gct gat cga ctt att ggg gtg acá acá gat 2360 Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly Val Thr Thr Asp 760 765 770 atg act ctg gat gga ate acc tcc cea gct gaa ctt ttc cae ctg gag 2408 Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu Phe His Leu Glu 775 780 785 tcc ttg gga ata ceg gac gtg ate ttc ttt tat agg tcc aat gat gtg 2456 Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg Ser Asn Asp Val 790 795 800 acc cag tcc tgc agt tet ggg aga tea acc acc ate cgc gtc agg tgc 2504 Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He Arg Val Arg Cys 805 810 815 820 agt cea cag aaa act gtc ect gga agt ttg ctg ctg cea gga acg tgc 2552 Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu Pro Gly Thr Cys 825 830 835 tea gat ggg acc tgt gat ggc tgc aac ttc cae ttc ctg tgg gag age 2600 ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe Leu Trp Glu Ser 840 845 850 gcg gct gct tgc ceg ctc tgc tea gtg gct gac tac cgt gct ate gtc 2648 Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr Arg Ala He Val 855 860 865 age age tgt gtg gct ggg ate cag aag act act tac gtg tgg cga gaa 2696 Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr Val Trp Arg Glu 870 875 880 ecc aag cta tgc tet ggt ggc att tet ctg ect gag cag aga gtc acc 2744 Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu Gln Arg Val Thr 885 890 895 900 ate tgc aaa acc ata gat ttc tgg ctg aaa gtg ggc ate tet gca ggc 2792 He Cys Lyß Thr He Asp Phe Trp Leu Lys Val Gly He Ser Ala Gly 905 910 915 acc tgt act gcc ate ctg ctc acc gtc ttg acc tgc tac ttt tgg aaa 2840 Thr Cys Thr Ala He Leu Leu Thr Val Leu Thr Cys Tyr Phe Trp Lys 920 925 930 aag aat caá aaa cta gag tac aag tac tcc aag ctg gtg atg aat gct 2888 Lys Asn Gln Lys Leu Glu Tyr Lys Tyr Ser Lys Leu Val Met Asn Ala 935 940 945 act ctc aag gac tgt gac ctg cea gca gct gac age tgc gcc ate atg 2936 th.r Leu Lys Asp Cys Asp Leu Pro Ala Ala Asp Ser Cys Ala He Met 950 955 960 gaa ggc gag gat gta gag gac gac ctc ate ttt acc age aag aag tea 2984 Glu Gly Glu Asp Val Glu Asp Asp Leu He Phe Thr Ser Lys Lys Ser 965 970 975 980 ctc ttt ggg aag ate aaa tea ttt acc tcc aag agg act ect gat gga 3032 Leu Phe Gly Lys He Lys Ser Phe Thr Ser Lys Arg Thr Pro Asp Gly 985 990 995 ttt gac tea gtg ceg ctg aag acá tcc tea gga ggc ecc gac atg gac 3080 Phe Asp Ser Val Pro Leu Lys Thr Ser Ser Gly Gly Pro Asp Met Asp 1000 1005 1010 ctg tgagaggcac tgcctgcctc acctgcctcc tcaccttgca tageacettt 3133 Leu gcaagcctgc ggcgatttgg gtgccagcat cctgcaacac ccactgctgg aaatetette 3193 attgtggect tatcagatgt ttgaatttca gatctttttt tatagagtac ccaaaccctc 3253 ctttctgctt gcctcaaacc tgccaaatat acccacactt tgtttgtaaa aaaaaaaaaa 3313 aaaaaaaaaa aaaaaaaa 3331 <210> 2 <211> 1013 <212> PRT <213> Homo sapiens <400> 2 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15 Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30 Gly Thr Ala Phe Gln Val Thr Gln Gly Thr Gly Pro Glu Leu His Ala 35 40 45 Cys Lys Glu Ser Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr 50 55 60 Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Pro Gly Leu Cys Thr 65 70 75 80 Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn 85 90 95 Ala Gly Glu Phe Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala 100 105 110 Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe Asp Glu Trp Asp 115 120 125 Glu Leu Pro His Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp 130 135 140 Asp Ser Ala Ala Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val 145 150 155 160 Pro Arg Gly Asp Tyr He Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr 165 170 175 Leu Met Tyr Ala Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu 180 185 190 Tyr Tyr Tyr Pro Asp Ser Ser He He Phe Glu Phe Phe Val Gln Asn 195 200 205 Asp Gln Cys Gln Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr 210 215 220 Glu Lys Gly Trp Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn 225 230 235 240 Val Leu Tyr Trp Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro 245 250 255 Lys Pro Val Leu Val Arg Asn He Ala He Thr Gly Val Ala Tyr Thr 260 265 270 Ser Glu Cys Phe Pro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly 275 280 285 Ser Ser Phe Cys Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly 290 295 300 Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly 305 310 315 320 Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe 325 330 335 Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr 340 345 350 Lys Trp Ala Lys Pro Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val 355 360 365 Lys Leu Pro Ala Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro 370 375 380 Gly Phe Phe Lys Thr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly 385 390 395 400 Pro Tyr Ser Asn Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu 405 410 415 Pro Ala Val Gly Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn 420 425 430 Met Glu Thr Thr Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met 435 440 445 Thr Gly Trp Glu Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala 450 455 460 Ser Asp Asn Asp Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg 465 470 475 480 Pro Pro Gln Ser Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg 485 490 495 He Thr Phe Val Phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr 500 505 510 Phe Met Val Gly Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp 515 520 525 Lys Gly Ser Lys Gly Lys Gln Ser Tyr Thr Tyr He He Glu Glu Asn 530 535 540 Thr Thr Thr Ser Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu 545 550 555 560 Ala Ser Arg Lys Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn 565 570 575 Val Thr Asn Val Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala 580 585 590 Leu Glu Ala Ser Asp Val Gly Ser Ser Cys Thr Ser Cys Pro Ala Gly 595 600 605 Tyr Tyr He Asp Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn 610 615 620 T r He Leu Lys Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro 625 630 635 640 Cys Gly Pro Gly Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn 645 650 655 Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn 660 665 670 Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe 675 680 685 Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys 690 695 700 Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp 705 710 715 720 Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala 725 730 735 Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr Gly Tyr Lys 740 745 750 Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly 755 760 765 Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu 770 775 780 Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg 785 790 795 800 Ser Asn Asp Val Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He 805 810 815 Arg Val Arg Cys Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu 820 825 830 Pro Gly Thr Cys Ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe 835 840 845 Leu Trp Glu Ser Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr 850 855 860 Arg Ala He Val Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr 865 870 875 880 Val Trp Arg Glu Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu 885 890 895 Gln Arg Val Thr He Cys Lys Thr He Asp Phe Trp Leu Lye Val Gly 900 905 910 He Ser Ala Gly Thr Cys Thr Ala He Leu Leu Thr Val Leu Thr Cys 915 920 925 Tyr Phe Trp Lys Lys Asn Gln Lys Leu Glu Tyr Lys Tyr Ser Lys Leu 930 935 940 Val Met Asn Ala Thr Leu Lys Asp Cys Asp Leu Pro Ala Ala Asp Ser 945 950 955 960 Cys Ala He Met Glu Gly Glu Asp Val Glu Asp Asp Leu He Phe Thr 965 970 975 Ser Lys Lys Ser Leu Phe Gly Lys He Lys Ser Phe Thr Ser Lys Arg 980 985 990 Thr Pro Asp Gly Phe Asp Ser Val Pro Leu Lys Thr Ser Ser Gly Gly 995 1000 1005 Pro Asp Met Asp Leu 1010 <210> 3 <211> 181 <213> Homo sapiens <220> <221> CDS <222> (45) .. (179) <400> 3 gtgattactc actatagggc tcgagcggcc gcccgggcag gtct atg gct gag ect 56 Met Ala Glu Pro 1 ggg cae age cae cat ctc tcc gcc aga gtc agg gga aga act gag agg 104 Gly His Ser His His Leu Ser Ala Arg Val Arg Gly Arg Thr Glu Arg 5 10 15 20 cgc ata ecc cgg ctg tgg cgg ctg ctg ctc tgg gct ggg acc gcc ttc 152 Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala Gly Thr Ala Phe 25 30 35 cag gtg acc cag gga acg gga ceg gag ct 181 Gln Val Thr Gln Gly Thr Gly Pro Glu 40 45 <210> 4 <211> 45 <212> PRT <213 > Homo sapiens <400> 4 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15 Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30 Gly Thr Ala Phe Gln Val Thr Gln Gly Thr Gly Pro Glu 35 40 45 <210> 5 <211> 171 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (2) .. (169) <400> 5 a gga gaa act tet tgc cae cag tgt gac ect gac aaa tac tea gag aaa 49 Gly Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys 1 5 10 15 gga tet tet tcc tgt aac gtg cgc cea gct tgc acá gac aaa gat tat 97 Gly Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr 20 25 30 ttc tac acá cae acg gcc tgc gat gcc aac gga gag acá caá ctc atg 145 Phe Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met 35 40 45 tac aaa tgg gcc aag ceg aaa ate tg 171 Tyr Lys Trp Ala Lys Pro Lys He 50 55 <210> 6 <211> 56 <212> PRT <213> Ho o sapiens <400> 6 Gly Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys 10 15 Gly Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr 20 25 30 Phe Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met 35 40 45 Tyr Lys Trp Ala Lys Pro Lys He 50 55 <210> 7 <211> 158 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (3) .. (158) <400> 7 tt ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg atg 47 Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met 1 5 10 15 gca gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt gag 95 Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu 20 25 30 acc ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg aat 143 Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn 35 40 45 tet agg acc aac act 158 Ser Arg Thr Asn Thr 50 <210> 8 <211> 52 <212> PRT <213> Homo sapiens <400> 8 Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala 1 5 10 15 Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr 20 25 30 Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn Ser 35 40 45 Arg Thr Asn Thr 50 <210> 9 <211> 443 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (1) .. (441) <400> 9 tgc tac aat gat tgc acc ttc tea cgc aac act cea acc agg act ttc 48 Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe 1 5 10 15 aac tac aac ttc tcc gct ttg gca aac acc gtc act ctt gct gga ggg 96 Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly 20 25 30 cea age ttc act tcc aaa ggg ttg aaa tac ttc cat cae ttt acc ctc 144 Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu 35 40 45 agt ctc tgt gga aac cag ggt agg aaa atg tet gtg tgc acc gac aat 192 Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn 50 55 60 gtc act gac ctc cgg att ect gag ggt gag tea ggg ttc tcc aaa tet 240 Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser 65 70 75 80 ate acá gcc tac gtc tgc cag gca gtc ate ate ecc cea gag gtg acá 288 He Thr Ala Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr 85 90 95 ggc tac aag gcc ggg gtt tcc tea cag ect gtc age ctt gct gat cga 336 Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg 100 105 110 ctt att ggg gtg acá acá gat atg act ctg gat gga ate acc tcc cea 384 Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro 115 120 125 gct gaa ctt ttc cae ctg gag tcc ttg gga ata ceg gac gtg ate ttc 432 Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe 130 135 140 ttt tat agg te 443 Phe Tyr Arg 145 <210> 10 <211> 147 <212> PRT <213> Ho o sapiens <400> 10 Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe 1 5 10 15 Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly 20 25 30 Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu 35 40 45 Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn 50 55 60 Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser 65 70 75 80 He Thr Ala Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr 85 90 95 Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg 100 105 110 Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro 115 120 125 Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe 130 135 140 Phe Tyr Arg 145 <210> 11 <211> 23 <212> ADN <213> Secuencia artificial <220> <223> Iniciador derivado de la S?C ID No. 1 de origen de Homo sapiens <400> 11 tgactcggaa tcacctccca gct 23 <210> 12 <211> 28 <212> ADN <213> Secuencia artificial <220> <223> Iniciador derivado de la SEC ID No. 1 de origen de Homo sapiens <400> 12 caagacggtg agcaggatgg cagtacag 28 <210> 13 <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Iniciador derivado de la secuencia de GAPDH, de origen de Homo sapiens <400> 13 tccaccaccc tgttgctgta 20 <210> 14 <211> 20 <212> ADN <213> Secuencia artificial <220> <223> Iniciador derivado de la secuencia de GAPDH, de origen de Homo sapiens <400> 14 accacagtcc atgccatcac 20 <210> 15 <211> 2733 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (1) .. (2733) <400> 15 atg gct gag ect ggg cae age cae cat ctc tcc gcc aga gtc agg gga 48 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15 aga act gag agg cgc ata ecc cgg ctg tgg cgg ctg ctg ctc tgg gct 96 Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30 ggg acc gcc ttc cag gtg acc cag gga acg gga ceg gag ctt cat gcc 144 Gly Thr Ala Phe Gln Val Thr Gln Gly Thr Gly Pro Glu Leu His Ala 35 40 45 tgc aaa gag tet gag tac cae tat gag tac acg gcg tgt gac age acg 192 Cys Lys Glu Ser Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr 50 55 60 ggt tcc agg tgg agg gtc gcc gtg ceg cat acc ceg ggc ctg tgc acc 240 Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Pro Gly Leu Cys Thr 65 70 75 80 age ctg ect gac ecc gtc aag ggc acc gag tgc tcc ttc tcc tgc aac 288 Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn 85 90 95 gcc ggg gag ttt ctg gat atg aag gac cag tea tgt aag cea tgc gct 336 Ala Gly Glu Phe Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala 100 105 110 gag ggc cgc tac tcc ctc ggc acá ggc att cgg ttt gat gag tgg gat 384 Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe Asp Glu Trp Asp 115 120 125 gag ctg ecc cat ggc ttt gcc age ctc tea gcc aac atg gag ctg gat 432 Glu Leu Pro His Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp 130 135 140 gac agt gct gct gag tcc acc ggg aac tgt act teg tcc aag tgg gtt 480 Asp Ser Ala Ala Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val 145 150 155 160 ecc cgg ggc gac tac ate gcc tcc aac acg gac gaa tgc acá gcc acá 528 Pro Arg Gly Asp Tyr ?le Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr 165 170 175 ctg atg tac gcc gtc aac ctg aag caá tet ggc acc gtt aac ttc gaa 576 Leu Met Tyr Ala Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu 180 185 190 tac tac tat cea gac tcc age ate ate ttt gag ttt ttc gtt cag aat 624 Tyr Tyr Tyr Pro Asp Ser Ser He He Phe Glu Phe Phe Val Gln Asn 195 200 205 gac cag tgc cag ecc aat gca gat gac tcc agg tgg atg aag acc acá 672 Asp Gln Cys Gln Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr 210 215 220 gag aaa gga tgg gaa ttc cae agt gtg gag cta aat cga ggc aat aat 720 Glu Lys Gly Trp Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn 225 230 235 240 gtc ctc tat tgg aga acc acá gcc ttc tea gta tgg acc aaa gta ecc 768 Val Leu Tyr Trp Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro 245 250 255 aag ect gtg ctg gtg aga aac att gcc ata acá ggg gtg gcc tac act 816 Lys Pro Val Leu Val Arg Asn He Ala He Thr Gly Val Ala Tyr Thr 260 265 270 tea gaa tgc ttc ecc tgc aaa ect ggc acg tat gca gac aag cag ggc 864 Ser Glu Cys Phe Pro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly 275 280 285 5 tcc tet ttc tgc aaa ctt tgc cea gcc aac tet tat tea aat aaa gga 912 Ser Ser Phe Cys Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly 290 295 300 gaa act tet tgc cae cag tgt gac ect gac aaa tac tea gag aaa gga 960 * 10 Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly 305 310 315 320 e tet tet tcc tgt aac gtg cgc cea gct tgc acá gac aaa gat tat ttc 1008 15 Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe 325 330 335 tac acá cae acg gcc tgc gat gcc aac gga gag acá caá ctc atg tac 1056 Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr 20 340 345 350 aaa tgg gcc aag ceg aaa ate tgt age gag gac ctt gag ggg gca gtg 1104 Lys Trp Ala Lys Pro Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val 25 355 360 365 aag ctg ect gcc tet ggt gtg aag acc cae tgc cea ecc tgc aac cea 1152 Lys Leu Pro Ala Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro 370 375 380 ggc ttc ttc aaa acc aac aac age acc tgc cag ecc tgc cea tat ggt 1200 Gly Phe Phe Lys Thr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly 385 390 395 400 ecc tac tcc aat ggc tea gac tgt acc cgc tgc ect gca ggg act gaa 1248 Pro Tyr Ser Asn Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu 405 410 415 ect gct gtg gga ttt gaa tac aaa tgg tgg aac acg ctg ecc acá aac 1296 Pro Ala Val Gly Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn 420 425 430 atg gaa acg acc gtt ctc agt ggg ate aac ttc gag tac aag ggc atg 1344 Met Glu Thr Thr Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met 435 440 445 acá ggc tgg gag gtg gct ggt gat cae att tac acá gct gct gga gcc 1392 Thr Gly Trp Glu Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala 450 455 460 tea gac aat gac ttc atg att ctc act ctg gtt gtg cea gga ttt aga 1440 Ser Asp Asn Asp Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg 465 470 475 480 ect ceg cag teg gtg atg gca gac acá gag aat aaa gag gtg gcc aga 1488 Pro Pro Gln Ser Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg 485 490 495 ate acá ttt gtc ttt gag acc ctc tgt tet gtg aac tgt gag ctc tac 1536 He Thr Phe Val Phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr 500 505 510 ttc atg gtg ggt gtg aat tet agg acc aac act ect gtg gag acg tgg 1584 Phe Met Val Gly Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp 515 520 525 aaa ggt tcc aaa ggc aaa cag tcc tat acc tac ate att gag gag aac 1632 Lys Gly Ser Lys Gly Lys Gln Ser Tyr Thr Tyr He He Glu Glu Asn 530 535 540 act acc acg age ttc acc tgg gcc ttc cag agg acc act ttt cat gag 1680 Thr Thr Thr Ser Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu 545 550 555 560 gca age agg aag tac acc aat gac gtt gcc aag ate tac tcc ate aat 1728 Ala Ser Arg Lys Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn 565 570 575 gtc acc aat gtt atg aat ggc gtg gcc tcc tac tgc cgt ecc tgt gcc 1776 Val Thr Asn Val Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala 580 585 590 cta gaa gcc tet gat gtg ggc tcc tcc tgc acc tet tgt ect gct ggt 1824 Leu Glu Ala Ser Asp Val Gly Ser Ser Cys Thr Ser Cys Pro Ala Gly 595 600 605 tac tat att gac cga gat tea gga acc tgc cae tcc tgc ecc ect aac 1872 Tyr Tyr He Asp Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn 610 615 620 acá att ctg aaa gcc cae cag ect tat ggt gtc cag gcc tgt gtg ecc 1920 Thr He Leu Lys Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro 625 630 635 640 tgt ggt cea ggg acc aag aac aac aag ate cae tet ctg tgc tac aat 1968 Cys Gly Pro Gly Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn 645 650 655 gat tgc acc ttc tea cgc aac act cea acc agg act ttc aac tac aac 2016 Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn 660 665 670 ttc tcc gct ttg gca aac acc gtc act ctt gct gga ggg cea age ttc 2064 Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe 675 680 685 act tcc aaa ggg ttg aaa tac ttc cat cae ttt acc ctc agt ctc tgt 2112 Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys 690 695 700 gga aac cag ggt agg aaa atg tet gtg tgc acc gac aat gtc act gac 2160 Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp 705 710 715 720 ctc cgg att ect gag ggt gag tea ggg ttc tcc aaa tet ate acá gcc 2208 Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala 725 730 735 tac gtc tgc cag gca gtc ate ate ecc cea gag gtg acá ggc tac aag 2256 Tyr Val Cys Gln Ala Val He He Pro Pro Glu Val Thr Gly Tyr Lys 740 745 750 gcc ggg gtt tcc tea cag ect gtc age ctt gct gat cga ctt att ggg 2304 Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly 755 760 765 gtg acá acá gat atg act ctg gat gga ate acc tcc cea gct gaa ctt 2352 Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu 770 775 780 ttc cae ctg gag tcc ttg gga ata ceg gac gtg ate ttc ttt tat agg 2400 Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg 785 790 795 800 tcc aat gat gtg acc cag tcc tgc agt tet ggg aga tea acc acc ate 2448 Ser Asn Asp Val Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He 805 810 815 cgc gtc agg tgc agt cea cag aaa act gtc ect gga agt ttg ctg ctg 2496 Arg Val Arg Cys Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu 820 825 830 cea gga acg tgc tea gat ggg acc tgt gat ggc tgc aac ttc cae ttc 2544 Pro Gly Thr Cys Ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe 835 840 845 ctg tgg gag age gcg gct gct tgc ceg ctc tgc tea gtg gct gac tac 2592 Leu Trp Glu Ser Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr 850 855 860 cgt gct ate gtc age age tgt gtg gct ggg ate cag aag act act tac 2640 Arg Ala He Val Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr 865 870 875 880 gtg tgg cga gaa ecc aag cta tgc tet ggt ggc att tet ctg ect gag 2688 Val Trp Arg Glu Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu 885 890 895 cag aga gtc acc ate tgc aaa acc ata gat ttc tgg ctg aaa gtg 2733 Gln Arg Val Thr He Cys Lys Thr He Asp Phe Trp Leu Lys Val 900 905 910 <210> 16 <211> 911 <212> PRT <213> Homo sapiens <400> 16 Met Ala Glu Pro Gly His Ser His His Leu Ser Ala Arg Val Arg Gly 1 5 10 15 Arg Thr Glu Arg Arg He Pro Arg Leu Trp Arg Leu Leu Leu Trp Ala 20 25 30 Qly Thr Ala Phe Gln Val Thr Glp Gly Thr Gly Pro Glu Leu His Ala 35 40 45 Cys Lys Glu Ser Glu Tyr His Tyr Glu Tyr Thr Ala Cys Asp Ser Thr 50 55 60 Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Pro 31y Leu Cys Thr 65 70 75 80 Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Ser Phe Ser Cys Asn 85 90 95 Ala Gly Glu Phe Leu Asp Met Lys Asp Gln Ser Cys Lys Pro Cys Ala 100 105 lio Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe Asp Glu Trp Asp 115 120 125 Glu Leu Pro His Gly Phe Ala Ser Leu Ser Ala Asn Met Glu Leu Asp 130 135 140 Asp Ser Ala Ala Glu Ser Thr Gly Asn Cys Thr Ser Ser Lys Trp Val 145 150 155 160 Pro Arg Gly Asp Tyr He Ala Ser Asn Thr Asp Glu Cys Thr Ala Thr 165 170 175 Leu Met Tyr Ala Val Asn Leu Lys Gln Ser Gly Thr Val Asn Phe Glu 180 185 190 Tyr Tyr Tyr Pro Asp Ser Ser He He Phe Glu Phe Phe Val Gln Asn 195 200 205 Asp Gln Cys Gln Pro Asn Ala Asp Asp Ser Arg Trp Met Lys Thr Thr 210 215 220 Glu Lys Gly Trp Glu Phe His Ser Val Glu Leu Asn Arg Gly Asn Asn 225 230 235 240 Val Leu Tyr Trp Arg Thr Thr Ala Phe Ser Val Trp Thr Lys Val Pro 245 250 255 Lys Pro Val Leu Val Arg Asn He Ala He Thr Gly Val Ala Tyr Thr 260 265 270 Ser Glu Cys Phe Pro Cys Lys Pro Gly Thr Tyr Ala Asp Lys Gln Gly 275 280 285 Ser Ser Phe Cys Lys Leu Cys Pro Ala Asn Ser Tyr Ser Asn Lys Gly 290 295 300 Glu Thr Ser Cys His Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly 305 310 315 320 Ser Ser Ser Cys Asn Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe 325 330 335 Tyr Thr His Thr Ala Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr 340 345 350 Lys Trp Ala Lys Pro Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val 355 360 365 Lys Leu Pro Ala Ser Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro 370 375 380 Gly Phe Phe Lys Thr Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly 385 390 395 400 Pro Tyr Ser Asn Gly Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu 405 410 415 Pro Ala Val Gly Phe Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn 420 425 430 Met Glu Thr Thr Val Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met 435 440 445 T r Gly Trp Glu Val Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala 450 455 460 Ser Asp Asn Asp Phe Met He Leu Thr Leu Val Val Pro Gly Phe Arg 465 470 475 480 Pro Pro Gln Ser Val Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg 485 490 495 He Thr Phe Val Phe Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr 500 505 510 Phe Met Val Gly Val Asn Ser Arg Thr Asn Thr Pro Val Glu Thr Trp 515 520 525 Lys Gly Ser Lys Gly Lys Gln Ser Tyr Thr Tyr He lie Glu Glu Asn 530 535 540 Thr Thr Thr Ser Phe Thr Trp Ala Phe Gln Arg Thr Thr Phe His Glu 545 550 555 560 Ala Ser Arg Lys Tyr Thr Asn Asp Val Ala Lys He Tyr Ser He Asn 565 570 575 Val Thr Asn Val Met Asn Gly Val Ala Ser Tyr Cys Arg Pro Cys Ala 580 585 590 Leu Glu Ala Ser Asp Val GÍy Ser Ser Cys Thr Ser Cys Pro Ala Gly 595 600 605 Tyr Tyr He Asp Arg Asp Ser Gly Thr Cys His Ser Cys Pro Pro Asn 610 615 620 Thr He Leu Lys Ala His Gln Pro Tyr Gly Val Gln Ala Cys Val Pro 625 630 635 640 Cys Gly Pro Gly Thr Lys Asn Asn Lys He His Ser Leu Cys Tyr Asn 645 650 655 Asp Cys Thr Phe Ser Arg Asn Thr Pro Thr Arg Thr Phe Asn Tyr Asn 660 665 670 Phe Ser Ala Leu Ala Asn Thr Val Thr Leu Ala Gly Gly Pro Ser Phe 675 680 685 Thr Ser Lys Gly Leu Lys Tyr Phe His His Phe Thr Leu Ser Leu Cys 690 695 700 Gly Asn Gln Gly Arg Lys Met Ser Val Cys Thr Asp Asn Val Thr Asp 705 710 715 720 Leu Arg He Pro Glu Gly Glu Ser Gly Phe Ser Lys Ser He Thr Ala 725 730 735 Tyr Val Cys Gln Ala Val íle lie Pro Pro Glu Val Thr Gly Tyr Lys 740 745 750 Ala Gly Val Ser Ser Gln Pro Val Ser Leu Ala Asp Arg Leu He Gly 755 760 765 Val Thr Thr Asp Met Thr Leu Asp Gly He Thr Ser Pro Ala Glu Leu 770 775 780 Phe His Leu Glu Ser Leu Gly He Pro Asp Val He Phe Phe Tyr Arg 785 790 795 800 Ser Asn Asp Val Thr Gln Ser Cys Ser Ser Gly Arg Ser Thr Thr He 805 810 815 Arg Val Arg Cys Ser Pro Gln Lys Thr Val Pro Gly Ser Leu Leu Leu 820 825 830 Pro Gly Thr Cys Ser Asp Gly Thr Cys Asp Gly Cys Asn Phe His Phe 835 840 845 Leu Trp Glu Ser Ala Ala Ala Cys Pro Leu Cys Ser Val Ala Asp Tyr 850 855 860 Arg Ala He Val Ser Ser Cys Val Ala Gly He Gln Lys Thr Thr Tyr 865 870 875 880 Val Trp Arg Glu Pro Lys Leu Cys Ser Gly Gly He Ser Leu Pro Glu 885 890 895 Gln Arg Val Thr He Cys Lys Thr He Asp Phe Trp Leu Lys Val 900 905 910 <210> 17 <211> 2610 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (1) .. (2610) <400> 17 acg gga ceg gag ctt cat gcc tgc aaa gag tet gag tac cae tat gag 48 Thr Gly Pro Glu Leu His Ala Cys Lys Glu Ser Glu Tyr His Tyr Glu 1 5 10 15 tac acg gcg tgt gac age acg ggt tcc agg tgg agg gtc gcc gtg ceg 96 Tyr Thr Ala Cys Asp Ser Thr Gly Ser Arg Trp Arg Val Ala Val Pro 20 25 30 cat acc ceg ggc ctg tgc acc age ctg ect gac ecc gtc aag ggc acc 144 His Thr Pro Gly Leu Cys Thr Ser Leu Pro Asp Pro Val Lys Gly Thr 35 40 45 gag tgc tcc ttc tcc tgc aac gcc ggg gag ttt ctg gat atg aag gac 192 Glu Cys Ser Phe Ser Cys Asn Ala Gly Glu Phe Leu Asp Met Lys Asp 50 55 60 cag tea tgt aag cea tgc gct gág ggc cgc tac tcc ctc ggc ac ggc 240 Gln Ser Cys Lys Pro Cys Ala Glu Gly Arg Tyr Ser Leu Gly Thr Gly 65 70 75 80 att cgg ttt gat gag tgg gat gag ctg ecc cat ggc ttt gcc age ctc 288 He Arg Phe Asp Glu Trp Asp Glu Leu Pro His Gly Phe Ala Ser Leu 85 90 95 tea gcc aac atg gag ctg gat gac agt gct gct gag tcc acc ggg aac 336 Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr Gly Asn 100 105 110 tgt act teg tcc aag tgg gtt ecc cgg ggc gac tac ate gcc tcc aac 384 Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp Tyr He Ala Ser Asn 115 120 125 acg gac gaa tgc acá gcc acá ctg atg tac gcc gtc aac ctg aag caá 432 Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu Lys Gln 130 135 140 tet ggc acc gtt aac ttc gaa tac tac tat cea gac tcc age ate ate 480 Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser He He 145 150 155 160 ttt gag ttt ttc gtt cag aat gac cag tgc cag ecc aat gca gat gac 528 Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln Pro Asn Ala Asp Asp 165 170 175 tcc agg tgg atg aag acc acá gag aaa gga tgg gaa ttc cae agt gtg 576 Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His Ser Val 180 185 190 gag cta aat cga ggc aat aat gtc ctc tat tgg aga acc acá gcc ttc 624 Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr Ala Phe 195 200 205 tea gta tgg acc aaa gta ecc aag ect gtg ctg gtg aga aac att gcc 672 Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn He Ala 210 215 220 ata acá ggg gtg gcc tac act tea gaa tgc ttc ecc tgc aaa ect ggc 720 He Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe Pro Cye Lys Pro Gly 225 230 235 240 acg tat gca gac aag cag ggc tcc tet ttc tgc aaa ctt tgc cea gcc 768 Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cys Pro Ala 245 250 255 aac tet tat tea aat aaa gga gaa act tet tgc cae cag tgt gac ect 816 Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys Asp Pro 260 265 270 gac aaa tac tea gag aaa gga tet tet tcc tgt aac gtg cgc cea gct 864 Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg Pro Ala 275 280 285 tgc acá gac aaa gat tat ttc tac acá cae acg gcc tgc gat gcc aac 912 Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp Ala Asn 290 295 300 gga gag acá caá ctc atg tac aaa tgg gcc aag ceg aaa ate tgt age 960 Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He Cys Ser 305 310 315 320 gag gac ctt gag ggg gca gtg aag ctg ect gcc tet ggt gtg aag acc 1008 Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser Gly Val Lys Thr 325 330 335 cae tgc cea ecc tgc aac cea ggc ttc ttc aaa acc aac aac age acc 1056 His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr Asn Asn Ser Thr 340 345 350 tgc cag ecc tgc cea tat ggt ecc tac tcc aat ggc tea gac tgt acc 1104 Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp Cys Thr 355 360 365 cgc tgc ect gca ggg act gaa ect gct gtg gga ttt gaa tac aaa tgg 1152 Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr Lys Trp 370 375 380 tgg aac acg ctg ecc acá aac atg gaa acg acc gtt ctc agt ggg ate 1200 Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser Gly He 385 390 395 400 aac ttc gag tac aag ggc atg acá ggc tgg gag gtg gct ggt gat cae 1248 Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly Asp His 405 410 415 att tac acá gct gct gga gcc tea gac aat gac ttc atg att ctc act 1296 He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe Met He Leu Thr 420 425 430 ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg atg gca gac acá 1344 Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala Asp Thr 435 440 445 gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt gag acc ctc tgt 1392 Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr Leu Cys 450 455 460 tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg aat tet agg acc 1440 Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn Ser Arg Thr 465 470 475 480 aac act ect gtg gag acg tgg aaa ggt tcc aaa ggc aaa cag tcc tat 1488 Asn Thr Pro Val Glu Thr Trp Lys Gly Ser Lys Gly Lys Gln Ser Tyr 485 490 495 acc tac ate att gag gag aac act acc acg age ttc acc tgg gcc ttc 1536 Thr Tyr He He Glu Glu Asn Thr Thr Thr Ser Phe Thr Trp Ala Phe 500 505 510 cag agg acc act ttt cat gag gca age agg aag tac acc aat gac gtt 1584 Gln Arg Thr Thr Phe His Glu Ala Ser Arg Lys Tyr Thr Asn Asp Val 515 520 525 gcc aag ate tac tcc ate aat gtc acc aat gtt atg aat ggc gtg gcc 1632 Ala Lys He Tyr Ser He Asn Val Thr Asn Val Met Asn Gly Val Ala 530 535 540 tcc tac tgc cgt ecc tgt gcc cta gaa gcc tet gat gtg ggc tcc tcc 1680 Ser Tyr Cys Arg Pro Cys Ala Leu Glu Ala Ser Asp Val Gly Ser Ser 545 550 555 560 tgc acc tet tgt ect gct ggt tac tat att 'gac cga gat tea gga acc 1728 Cys Thr Ser Cys Pro Ala Gly Tyr Tyr He Asp Arg Asp Ser Gly Thr 565 570 575 tgc cae tcc tgc ecc ect aac acá att ctg aaa gcc cae cag ect tat 1776 Cys His Ser Cys Pro Pro Asn Thr He Leu Lys Ala His Gln Pro Tyr 580 585 590 ggt gtc cag gcc tgt gtg ecc tgt ggt cea ggg acc aag aac aac aag 1824 Gly Val Gln Ala Cys Val Pro Cys Gly Pro Gly Thr Lys Asn Asn Lys 595 600 605 ate cae tet ctg tgc tac aat gat tgc acc ttc tea cgc aac act cea 1872 He His Ser Leu Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro 610 615 620 acc agg act ttc aac tac aac ttc tcc gct ttg gca aac acc gtc act 1920 Thr Arg Thr Phe Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr 625 630 635 640 5 ctt gct gga ggg cea age ttc act tcc aaa ggg ttg aaa tac ttc cat 1968 Leu Ala Gly Gly Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His 645 650 655 cae ttt ace etc agt etc tgt gga aac cag ggt agg aaa atg tet gtg 2016 * 10 His Phe Thr Leu Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val 660 665 670 tgc acc gac aat gtc act gac ctc cgg att ect gag ggt gag tea ggg 2064 Cys Thr Asp Asn Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly 15 675 680 685 ttc tcc aaa tet ate acá gcc tac gtc tgc cag gca gtc ate ate ecc 2112 Phe Ser Lys Ser He Thr Ala Tyr Val Cys Gln Ala Val He He Pro 690 695 700 20 cea gag gtg acá ggc tac aag gcc ggg gtt tcc tea cag ect gtc age 2160 Pro Glu Val Thr Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser 705 710 715 720 25 ctt gct gat cga ctt att ggg gtg acá acá gat atg act ctg gat gga 2208 Leu Ala Asp Arg Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly 725 730 735 ate acc tcc cea gct gaa ctt ttc cae ctg gag tcc ttg gga ata ceg 2256 He Thr Ser Pro Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro 740 745 750 gac gtg ate ttc ttt tat agg tcc aat gat gtg acc cag tcc tgc agt 2304 Asp Val He Phe Phe Tyr Arg Ser Asn Asp Val Thr Gln Ser Cys Ser 755 760 765 tet ggg aga tea acc acc ate cgc gtc agg tgc agt cea cag aaa act 2352 Ser Gly Arg Ser Thr Thr He Arg Val Arg Cys Ser Pro Gln Lys Thr 770 775 780 gtc ect gga agt ttg ctg ctg cea gga acg tgc tea gat ggg acc tgt 2400, Val Pro Gly Ser Leu Leu Leu Pro Gly Thr Cys Ser Asp Gly Thr Cys 785 790 795 800 gat ggc tgc aac ttc cae ttc ctg tgg gag age gcg gct gct tgc ceg 2448 Asp Gly Cys Asn Phe His Phe Leu Trp Glu Ser Ala Ala Ala Cys Pro 805 810 815 ctc tgc tea gtg gct gac tac cgt gct ate gtc age age tgt gtg gct 2496 Leu Cys Ser Val Ala Asp Tyr Arg Ala He Val Ser Ser Cys Val Ala 820 825 830 ggg ate cag aag act act tac gtg tgg cga gaa ecc aag cta tgc tet 2544 Gly He Gln Lys Thr Thr Tyr Val Trp Arg Glu Pro Lys Leu Cys Ser 835 840 845 ggt ggc att tet ctg ect gag cag aga gtc acc ate tgc aaa acc ata 592 Gly Gly He Ser Leu Pro Glu Gln Arg Val Thr He Cys Lys Thr He 850 855 860 gat ttc tgg ctg aaa gtg 2610 Asp Phe Trp Leu Lys Val 865 870 <210> 18 <211> 870 <212> PRT <213> Homo sapiens <400> 18 Thr Gly Pro Glu Leu His Ala Cys Lys Glu Ser Glu Tyr His Tyr Glu 1 5 10 15 Tyr Thr Ala Cys Asp Ser Thr Gly Ser Arg Trp Arg Val Ala Val Pro 20 25 30 His Thr Pro Gly Leu Cys Thr Ser Leu Pro Asp Pro Val Lys Gly Thr 35 40 45 Glu Cys Ser Phe Ser Cys Asn Ala Gly Glu Phe Leu Asp Met Lys Asp 50 55 60 Gln Ser Cys Lys Pro Cys Ala Glu Gly Arg Tyr Ser Leu Gly Thr Gly 65 70 75 80 He Arg Phe Asp Glu Trp Asp Glu Leu Pro His Gly Phe Ala Ser Leu 85 90 95 Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr Gly Asn 100 105 110 Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp Tyr He Ala Ser Asn 115 120 125 Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu Lys Gln 130 135 140 Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser He He 145 150 155 160 Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln Pro Asn Ala Asp Asp 165 170 175 Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His Ser Val 180 185 190 Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr Ala Phe 195 200 205 Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn He Ala 210 215 220 He Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe Pro Cys Lys Pro Gly 225 230 235 240 Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cys Pro Ala 245 250 255 Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys Asp Pro 260 265 270 Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg Pro Ala 275 280 285 Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp Ala Asn 290 295 300 Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He Cys Ser 305 310 315 320 Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser Gly Val Lys Thr 325 330 335 His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr Asn Asn Ser Thr 340 345 350 Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp Cys Thr 355 360 365 Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr Lys Trp 370 375 380 Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser Gly He 385 390 395 400 Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly Asp His 405 410 415 He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe Met He Leu Thr 420 425 430 Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala Asp Thr 435 440 445 Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr Leu Cys 450 455 460 Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn Ser Arg Thr 465 470 475 480 Asn Thr Pro Val Glu Thr Trp Lys Gly Ser Lys Gly Lys Gln Ser Tyr 485 490 495 Thr Tyr He lie Glu Glu Asn Thr Thr Thr Ser Phe Thr Trp Ala Phe 500 505 510 Gln Arg Thr Thr Phe His Glu Ala Ser Arg Lys Tyr Thr Asn Asp Val 515 520 525 Ala Lys He Tyr Ser He Asn Val Thr Asn Val Met Asn Gly Val Ala 530 535 540 Ser Tyr Cys Arg Pro Cys Ala Leu Glu Ala Ser Asp Val Gly Ser Ser 545 550 555 560 Cys Thr Ser Cys Pro Ala Gly Tyr Tyr He Asp Arg Asp Ser Gly Thr 565 570 575 Cys His Ser Cys Pro Pro Asn Thr He Leu Lys Ala His GLn Pro Tyr 580 585 590 Gly Val Gln Ala Cys Val Pro Cys Gly Pro Gly Thr Lys Asn Asn Lys 595 600 605 He His Ser Leu Cys Tyr Asn Asp Cys Thr Phe Ser Arg Asn Thr Pro 610 615 620 Thr Arg Thr Phe Asn Tyr Asn Phe Ser Ala Leu Ala Asn Thr Val Thr 625 630 635 640 Leu Ala Gly Gly Pro Ser Phe Thr Ser Lys Gly Leu Lys Tyr Phe His 645 650 655 His Phe Thr Leu Ser Leu Cys Gly Asn Gln Gly Arg Lys Met Ser Val 660 665 670 Cys Thr Asp Asn Val Thr Asp Leu Arg He Pro Glu Gly Glu Ser Gly 675 680 685 Phe Ser Lys Ser He Thr Ala Tyr Val Cys Gln Ala Val He He Pro 690 695 700 Pro Glu Val Thr Gly Tyr Lys Ala Gly Val Ser Ser Gln Pro Val Ser 705 710 715 720 Leu Ala Asp Arg Leu He Gly Val Thr Thr Asp Met Thr Leu Asp Gly 725 730 735 He Thr Ser Pro Ala Glu Leu Phe His Leu Glu Ser Leu Gly He Pro 740 745 750 Asp Val He Phe Phe Tyr Arg Ser Asn Asp Val Thr Gln Ser Cys Ser 755 760 765 Ser Gly Arg Ser Thr Thr He Arg Val Arg Cys Ser Pro Gln Lys Thr 770 775 780 Val Pro Gly Ser Leu Leu Leu Pro Gly Thr Cys Ser Asp Gly Thr Cys 785 790 795 800 Asp Gly Cys Asn Phe His Phe Leu Trp Glu Ser Ala Ala Ala Cys Pro 805 810 815 Leu Cys Ser Val Ala Asp Tyr Arg Ala He Val Ser Ser Cys Val Ala 820 825 830 Gly He Gln Lys Thr Thr Tyr Val Trp Arg Glu Pro Lys Leu Cys Ser 835 840 845 Gly Gly He Ser Leu Pro Glu Gln Arg Val Thr He Cys Lys Thr He 850 855 860 Asp Phe Trp Leu Lys Val 865 870 <210> 19 <211> 627 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (1) .. (627) <400> 19 cag tgt gac ect gac aaa tac tea gag aaa gga tet tet tcc tgt aac 48 Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn 1 5 10 15 gtg cgc cea gct tgc acá gac aáá gat tát ttc tac acá cae acg gcc 96 Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala 20 25 30 tgc gat gcc aac gga gag acá caá ctc atg tac aaa tgg gcc aag ceg 144 Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro 35 40 45 aaa ate tgt age gag gac ctt gag ggg gca gtg aag ctg ect gcc tet 192 Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser 50 55 60 ggt gtg aag acc cae tgc cea ecc tgc aac cea ggc ttc ttc aaa acc 240 Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr 65 70 75 80 aac aac age acc tgc cag ecc tgc cea tat ggt ecc tac tcc aat ggc 288 Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly 85 90 95 tea gac tgt acc cgc tgc ect gca ggg act gaa ect gct gtg gga ttt 336 Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe 100 105 110 gaa tac aaa tgg tgg aac acg ctg ecc acá aac atg gaa acg acc gtt 384 Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val 115 120 125 ctc agt ggg ate aac ttc gag tac aag ggc atg acá ggc tgg gag gtg 432 Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val 130 135 140 gct ggt gat cae att tac acá gct gct gga gcc tea gac aat gac ttc 480 Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe 145 150 155 160 atg att ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg 528 Met He Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val 165 170 175 atg gca gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt 576 Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe 180 185 190 gag acc ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg 624 Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val 195 200 205 aat 627 Asn <210> 20 <211> 209 <212> PRT <213> Homo sapiens <400> 20 Gln Cys Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn 1 5 10 15 Val Arg Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala 20 25 30 Cys Asp Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro 35 40 45 Lys He Cys Ser Glu Asp Leu Glu Gly Ala Val Lys Leu Pro Ala Ser 50 55 60 Gly Val Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr 65 70 75 80 Asn Asn Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly 85 90 95 Ser Asp Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe 100 105 110 Glu Tyr Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val 115 120 125 Leu Ser Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val 130 135 140 Ala Gly Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe 145 150 155 160 Met He Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val 165 170 175 Met Ala Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe 180 185 190 Glu Thr Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val 195 200 205 Asn <210> 21 <211> 1149 <212> ADN <213> Homo sapiens <220> <221> CDS <222> (1) .. (1149) <400> 21 age ctc tea gcc aac atg gag ctg gat gac agt gct gct gag tcc acc 48 Ser Leu Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr 1 5 10 15 ggg aac tgt act teg tcc aag tgg gtt ecc cgg ggc gac tac ate gcc 96 Gly Asn Cys Thr Ser Ser Lys Trp Val Pro Arg Gly Asp Tyr He Ala 20 25 30 tcc aac acg gac gaa tgc acá gcc acá ctg atg tac gcc gtc aac ctg 144 Ser Asn Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu 35 40 45 aag caá tet ggc acc gtt aac ttc gaa tac tac tat cea gac tcc age 192 Lys Gln Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser 50 55 60 ate ate ttt gag ttt ttc gtt cag aat gac cag tgc cag ecc aat gca 240 He He Phe Glu Phe Phe Val Gln Asn Asp Gln Cys Gln Pro Asn Ala 65 70 75 80 gat gac tcc agg tgg atg aag acc acá gag aaa gga tgg gaa ttc cae 288 Asp Asp Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His 85 90 95 agt gtg gag cta aat cga ggc aat aat gtc ctc tat tgg aga acc acá 336 Ser Val Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr 100 105 110 gcc ttc tea gta tgg acc aaa gta ecc aag ect gtg ctg gtg aga aac 384 Ala Phe Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn 115 120 125 att gcc ata acá ggg gtg gcc tac act tea gaa tgc ttc ecc tgc aaa 432 He Ala He Thr Gly Val Ala Tyr Thr S r Glu Cys Phe Pro Cys Lys 130 135 140 5 ect ggc acg tat gca gac aag cag ggc tcc tet ttc tgc aaa ctt tgc 480 Pro Gly Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cye 145 150 155 160 cea gcc aac tet tat tea aat aaa gga gaa act tet tgc cae cag tgt 528 * 10 Pro Ala Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys 165 170 175 gac ect gac aaa tac tea gag aaa gga tet tet tcc tgt aac gtg cgc 576 Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg 15 180 185 190 cea gct tgc acá gac aaa gat tat ttc tac acá cae acg gcc tgc gat 624 Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp 195 200 205 20 gcc aac gga gag acá caá ctc atg tac aaa tgg gcc aag ceg aaa ate 672 Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He 210 215 220 25 tgt age gag gac ctt gag ggg gca gtg aag ctg ect gcc tet ggt gtg 720 Cys Ser Glu Asp Leu Glu Gly Ala Val Lye Leu Pro Ala Ser Gly Val 225 230 235 240 aag acc cae tgc cea ecc tgc aac cea ggc ttc ttc aaa acc aac aac 768 Lys Thr His Cys Pro Pro Cys ASii Pro Gly Phe Phe Lys Thr Asn Aen 245 250 255 age acc tgc cag ecc tgc cea tat ggt ecc tac tcc aat ggc tea gac 816 Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp 260 265 270 tgt acc cgc tgc ect gca ggg act gaa ect gct gtg gga ttt gaa tac 864 Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr 275 280 285 aaa tgg tgg aac acg ctg ecc acá aac atg gaa acg acc gtt ctc agt 912 Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser 290 295 300 ggg ate aac ttc gag tac aag ggc atg acá ggc tgg gag gtg gct ggt 960 Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly 305 310 315 320 gat cae att tac acá gct gct gga gcc tea gac aat gac ttc atg att 1008 Asp His He Tyr Thr Ala Ala Gly Ala Ser Asp Asn Asp Phe Met He 325 330 335 ctc act ctg gtt gtg cea gga ttt aga ect ceg cag teg gtg atg gca 1056 Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala 340 345 350 gac acá gag aat aaa gag gtg gcc aga ate acá ttt gtc ttt gag acc 1104 Asp Thr Glu Asn Lys Glu Val Ala Arg He Thr Phe Val Phe Glu Thr 355 360 365 ctc tgt tet gtg aac tgt gag ctc tac ttc atg gtg ggt gtg aat 1149 Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn 370 375 380 <210> 22 <211> 383 < 12> PRT <213> Homo sapiens <400> 22 Ser Leu Ser Ala Asn Met Glu Leu Asp Asp Ser Ala Ala Glu Ser Thr 1 5 10 15 Gly Aen Cye Thr Ser Ser Lye Trp Val Pro Arg Gly Asp Tyr He Ala 20 25 30 Ser Asn Thr Asp Glu Cys Thr Ala Thr Leu Met Tyr Ala Val Asn Leu 35 40 45 Lye Gln Ser Gly Thr Val Asn Phe Glu Tyr Tyr Tyr Pro Asp Ser Ser 50 55 60 He He Phe Glu Phe Phe Val Gln Asn Asp Gln Cye Gln Pro Aen Ala 65 70 75 80 Asp Asp Ser Arg Trp Met Lys Thr Thr Glu Lys Gly Trp Glu Phe His 85 90 95 Ser Val Glu Leu Asn Arg Gly Asn Asn Val Leu Tyr Trp Arg Thr Thr 5 100 105 110 Ala Phe Ser Val Trp Thr Lys Val Pro Lys Pro Val Leu Val Arg Asn 115 120 125 * 10 He Ala He Thr Gly Val Ala Tyr Thr Ser Glu Cys Phe Pro Cys Lys 130 135 140 Pro Gly Thr Tyr Ala Asp Lys Gln Gly Ser Ser Phe Cys Lys Leu Cys 145 150 155 160 • 15 * Pro Ala Asn Ser Tyr Ser Asn Lys Gly Glu Thr Ser Cys His Gln Cys 165 170 175 Asp Pro Asp Lys Tyr Ser Glu Lys Gly Ser Ser Ser Cys Asn Val Arg 20 180 185 190 Pro Ala Cys Thr Asp Lys Asp Tyr Phe Tyr Thr His Thr Ala Cys Asp • 195 200 205 25 Ala Asn Gly Glu Thr Gln Leu Met Tyr Lys Trp Ala Lys Pro Lys He 210 215 220 Cys Ser Glu Asp Leu Glu Gly Alá Val Lys Leu Pro Ala Ser Gly Val 225 230 235 240 Lys Thr His Cys Pro Pro Cys Asn Pro Gly Phe Phe Lys Thr Asn Asn 5 245 250 255 Ser Thr Cys Gln Pro Cys Pro Tyr Gly Pro Tyr Ser Asn Gly Ser Asp 260 265 270 s" 10 Cys Thr Arg Cys Pro Ala Gly Thr Glu Pro Ala Val Gly Phe Glu Tyr 275 280 285 Lys Trp Trp Asn Thr Leu Pro Thr Asn Met Glu Thr Thr Val Leu Ser 290 295 300 15 " Gly He Asn Phe Glu Tyr Lys Gly Met Thr Gly Trp Glu Val Ala Gly 305 310 315 320 Asp His He Tyr Thr Ala Ala Gly Ala Ser Aep Asn Asp Phe Met He 20 325 330 335 Leu Thr Leu Val Val Pro Gly Phe Arg Pro Pro Gln Ser Val Met Ala 340 345 350 25 Asp Thr Glu Asn Lye Glu Val Ala Arg He Thr Phe Val Phe Glu Thr 355 360 365 Leu Cys Ser Val Asn Cys Glu Leu Tyr Phe Met Val Gly Val Asn 370 375 380

Claims

NOVEDAD PE LA ÍNVENCION REIVINDICACIONES

1.- Un ácido nucleico purificado o aislado, caracterizado porque comprende una secuencia de ácido nucleico que se elige del grupo de las siguientes secuencias: a) ia secuencia SEC ID NO.: 1 ; b) la secuencia de un fragmento de por lo menos 18 nucleótidos consecutivos, de la secuencia SEC ID NO.: 1 suprimida de su fragmento poliA terminal; c) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); d) la secuencia complementaria a, o la secuencia del ARN que corresponde a una secuencia como se define en los incisos a), b) o c), con la excepción de que la secuencia SEC ID NO. 11 del documento WO 99/54461 de la secuencia SEC ID NO. 51 del documento WO 99/06548 de la secuencia SEC ID No. 254 del documentro WO 99/06550 y de las tres secuencias descritas en los documentos del banco de datos EMBL bajo los números de identificación Al 672868, AA 890726 y Al 301140.

2.- El ácido nucleico purificado o aislado, de conformidad con la reivindicación 1 , caracterizado además porque comprende las secuencias que se eligen de las siguientes secuencias: a) las secuencias SEC ID No. 5, SEC ID No. 7, SEC ID No. 15, SEC ID No. 17 y SEC ID No. 19; b) la secuencia de un fragmento de por lo menos 18 nucleótidos de la secuencia SEC ID No. 19; c) una secuenda de ácido nucleico que fiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en los incisos a) o b); y d) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a), b) o c).

3.- El ácido nucleico purificado o aislado de conformidad con la i reivindicación 1 ó 2, caracterizado además porque las secuencias del mismo se eligen de las siguientes secuencias: a) SEC ID No. 1, SEC ID No. 3, SEC ID No. 5, SEC ID No. 7, SEC ID No. 9, SEC ID No. 15, SEC ID No. 17, SEC ID No. 19 y SEC ID No. 21 ; b) una secuencia de ácido nucleico que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en el inciso a); y c) la secuencia complementaria a, o la secuencia de ARN que corresponde a una secuencia como se define en los incisos a) o b).

4.- Un método para detección sistemática de genotecas de ADNc o ADN o para clonación de material genómico aislado o ADNc, caracterizado porque utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3.

5.- Un método para identificar un ácido nucleico de por lo menos 18 nucleótidos consecutivos de la secuencia del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, el ácido nucleico comprende por lo menos una mutación responsable de la expresión anormal del gen, caracterizado porque utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3.

6.- Un método para identificar la secuencia genómica del gen que codifica para el polipéptido de la secuencia SEC ID No. 2, preferiblemente las secuencias de ácido nucleico que promueven y/o regulan la expresión, el método está caracterizado porque utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3.

7.- Un ácido nucleico caracterizado porque se identifica utilizando un método como se reclama en cualquiera de las reivindicaciones 5 y 6.

8.- Un polipéptido aislado o purificado, caracterizado porque está codificado por un ácido nucleico como se reclama en una de las reivindicaciones 1 a 3, y 7.

9.- Un polipéptido purificado o aislado, caracterizado porque comprende una secuencia de aminoácidos que se elige del siguiente grupo: a) la secuencia SEC ID No. 2; b) la secuencia de un fragmento de por lo menos 6 aminoácidos de la secuencia SEC ID No. 22, preferiblemente de la secuencia SEC ID No. 20; y c) la secuencia de aminoácidos que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima, con una secuencia como se define en el inciso a) o b).

10.- El polipéptido de conformidad con la reivindicación 8, caracterizado además porque la secuencia del mismo se elige de la secuencia SEC ID No. 2, SEC ID No. 4, SEC ID No. 6, SEC ID No. 8, SEC ID No. 10, SEC ID No. 16, SEC ID No. 18, SEC ID No. 20 o SEC ID No. 22, o una secuencia que tiene un porcentaje de identidad de por lo menos 80%, después de alineación óptima con estas secuencias.

11.- Un vector de clonación y/o de expresión caracterizado porque contiene una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7.

12.- El vector de conformidad con la reivindicación 11, caracterizado además porque comprende los elementos necesarios para su expresión en una célula huésped.

13.- Una célula huésped caracterizada porque se transforma con un vector como se reclama en la reivindicación 11 6 12.

14.- Un mamífero, excepto un humano, caracterizado porque comprende una célula, de conformidad con la reivindicación 13.

15.- El uso de una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, como una sonda o iniciador para detectar y/o amplificar secuencias de ácido nucleico.

16.- El uso de un ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, como un oligonucleótido directo o antisentido.

17.- El uso de una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, para elaborar un polipéptido recombinante.

18.- Un método para producir un polipéptido recombinante, caracterizado porque una célula transformada, como se reclama en la reivindicación 13, se cultiva bajo condiciones que permiten la expresión del polipéptido recombinante, y en doríde se recupera el polipéptido recombinante.

19.- Un polipéptido, caracterizado porque se obtiene utilizando un método como se reclama en la reivindicación 18.

20.- Un anticuerpo monoclonal o policlonal, o un fragmento del mismo, anticuerpo quimérico o inmunoconjugado, caracterizado porque es capaz de reconocer específicamente un polipéptido como se reclama en una de las reivindicaciones 8 a 10 y 19, o el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461, SEC ID No. 254 del documento WO 99/06550 o la SEC ID No. 51 del documento WO 99/06548.

21.- Un método para detectar y/o purificar un polipéptido, caracterizado porque utiliza un anticuerpo como se reclama en la reivindicación 20.

22.- Un método para diagnosticar una condición patológica asociada con la expresión anormal del gen que codifica para el polipéptido de la SEC ID No. 2, caracterizado porque se utiliza una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7.

23.- Un método para diagnosticar una condición patológica relacionada con la presencia de por lo menos una mutación del gen que codifica para el polipéptido de la SEC ID No. 2 utilizando una muestra biológica de un paciente, caracterizado porque comprende las siguientes etapas: a) cuando sea apropiado, aislar el ADN genómico de la muestra biológica que se va a analizar, u obtener ADNc a partir de ARN de la muestra biológica; b) amplificar específicamente la secuencia de ADN del gen que probablemente contenga una mutación, utilizando iniciadores elegidos de los ácidos nucleicos como se reivindican en una de las reivindicaciones 1 a 3 y 7; c) analizar los productos de amplificación que se obtienen al comparar su secuencia con la secuencia normal correspondiente del gen.

24.- Un método para diagnosticar una condición patológica asociada con la expresión anormal del polipéptido de la secuencia SEC ID No. 2, caracterizado porque uno o más anticuerpos como se reclaman en la reivindicación 20 se ponen en contacto con el material biológico que se va a probar, bajo condiciones que permiten la posible formación de complejos inmunológicos específicos entre el polipéptido y el anticuerpo o los anticuerpos, y en donde los complejos inmunológicos que posiblemente se formen se detectan y/o cuantifican.

25.- Un método para seleccionar compuestos químicos o bioquímicos capaces de modular la actividad del polipéptido de la secuencia SEC ID No. 2, in vitro o in vivo, caracterizado porque comprende poner en contacto un polipéptido como se reclama en una de las reivindicaciones 8 a 10 y 19, el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461, la SEC ID No. 254 del documento WO 99/06550 o la SEC ID No. 51 del documento WO 99/06548 o una célula como se reclama en la reivindicación 13 en contacto con un compuesto candidato, y detectar una modificación de la actividad del poiipéptido de la secuencia SEC ID No. 2.

26.- Un método para seleccionar compuestos químicos o bioquímicos capaces de unirse al polipéptido de la secuencia SEC ID No. 2, caracterizado porque comprende poner en contacto un polipéptido de conformidad con una de las reivindicaciones 8 a 10 y 19, el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461 , SEC ID No. 254 del documento WO 99/06550 o SEC ID No. 51 del documento WO 99/06538 o una célula como se reclama en la reivindicación 13 en contacto con un compuesto candidato, y detectar la formación de un complejo entre el compuesto candidato y el polipéptido.

27.- Un método para seleccionar compuestos químicos o bioquímicos capaces de interactuar, in vitro o in vivo, con una secuencia de ácido nucleico como se reclama en una de las reivindicaciones 1 a 3 y 7, caracterizado porque comprende poner en contacto una célula que expresa, normal o anormalmente, el gen que codifica para el polipéptido de la secuencia SEC ID No. 2, en contacto con un compuesto candidato, y detectar, directa o indirectamente, una modificación de la expresión de la actividad del polipéptido de la secuencia SEC ID No. 2.

28.- El uso de un polipéptido, como se reclama en una de las reivindicaciones 8 a 10 y 19, el polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461 , la SEC ID No. 254 del documento WO 99/06550 o la SEC ID No. 51 del documento WO 99/06548 o una célula como se reclama en la reivindicación 13 para estudiar la expresión o actividad del polipéptido de la secuencia SEC ID No. 2, y/o las interacciones directas o indirectas entre el polipéptido de la secuencia SEC ID No. 2 y los compuestos químicos o bioquímicos posiblemente involucrados en la actividad del polipéptido de la secuencia SÉC ID No. 2.

29.- Un compuesto caracterizado porque se selecciona utilizando un método como se reclama en una de las reivindicaciones 25 a 27.

30.- Un compuesto caracterizado porque se elige de: un anticuerpo, como se reclama en la reivindicación 20, un polipéptido, como se reclama en una de las reivindicaciones 8 a 10 y 19, un polipéptido, como se reclama en una de las reivindicaciones 8 a 10 y 19, caracterizado porque corresponde a un fragmento soluble del polipéptido de la secuencia SEC ID No. 2, un vector, como se reclama en la reivindicación 11 ó 12, un ácido nucleico, como se reclama en una de las reivindicaciones 1 a 3 y 7, el cual puede ser directo o antisentido.

31.- El compuesto de conformidad con cualquiera de las reivindicaciones 29 y 30, un polipéptido de la secuencia SEC ID No. 173 del documento WO 99/54461, la SEC ID No. 254 del documento WO 99/06550 o SEC ID No. 51 del documento WO 99/06548, o un ácido nucleico de la SEC ID No. 11 del documento WO 99/54461 , de la secuencia SEC ID No. 51 del documento WO 99/06548, de la secuencia SEC ID No. 254 del documento WO 99/06550 y de las tres secuencias descritas en los documentos del banco de datos EMBL bajo los números de identificación Al 672868, AA 890726 y Al 301140, los cuales pueden ser directos o antisentidos, como un producto medicinal.

32.- El compuesto de conformidad con la reivindicación 31 , para evitar y/o tratar condiciones patológicas relacionadas con una anormalidad de la expresión y/o actividad del polipéptido de la SEC ID No. 2.

33.- El compuesto de conformidad con cualquiera de las reivindicaciones 31 y 32, para evitar y/o tratar condiciones patológicas inmunitarias, en particular para evitar y/o tratar enfermedades autoinmunitarias o cánceres.

34.- El compuesto de conformidad con cualquiera de las reivindicaciones 31 y 32, para evitar y/o tratar infecciones de tipo viral, : micótico, bacteriano o parasitario. • RESUMEN DE LA INVENCIÓN La invención se relaciona con la identificación y caracterización de un gen novedoso que se expresa en células tumorales y que está relacionado con la regulación de la respuesta inmunitaria,. la clonación y la caracterización de su ADNc y los polipéptidos correspondientes. La ¡nvención también se relaciona con vectores que contienen un ácido nucleico que codifica para tal gen, células transformadas por los vectores y métodos de diagnóstico y métodos de selección de un compuesto químico o biológico capaz de interactuar, directa o indirectamente, con un ácido nucleico o un polipéptido de la invención. La invención se relaciona además con compuestos para tratar patologías inmunitarias, en particular enfermedades autoinmunes y cáncer. °2/ 2 ANEXÓ 1 (2) INFORMACIÓN SOBRE LA SEQ ID NO: 11 : (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 1717 pares de base (B) TIPO: Acido nucleico (C) CADENA: individual (D) TOPOLOGÍA: Lineal (ii) TIPO DE MOLÉCULA: ADNc parcial producido a partir de EST individuales por ensamble y edición (iii) HIPOTÉTICO: NO (¡ii) ANTISENTIDO: NO (vi) ORIGEN: (A) ORGANISMO: SER HUMANO (C) ÓRGANO: (vii) OTRO ORIGEN: (A) GENOTECA: Genoteca de ADNc (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 11 «ttctaggac caacac cct tggagacgt ggaaaggttc caaaggcaaa cagtcotata 60 cctacateat tgaggagaac actaceacga gcttcacctg ggccttccßg aggaccactt 120 t cat?tag?íC aagcaggaag taaaccaatg acgttgcoaa gststastsd atcaatgtca 180 ccaatgtfcat gaatggcugtg gcctcctact gccgtccctg tgccctagaa gcctctgatg 240 tgggatcstc ctgcacctcfc tgtcctgctg gttastatat tgaocgagat tcaggaacct 3O0 yccaetcct coce ot ac acaattctga aagcccacca gcettatggt gtccaggcct 360 gtg gcccfcg tggtccaggg aecAagaaea aeaá atcca cfcctctgtgc tacaatf&tt 420 g?acettctc aogcaacact ccaaccagga ctttcaacta caaottctcc gct tggcaa 480 acaccgtcac tcttgctgga gggcaaagct teaettooaa agggttgaaa tacttscatc 540 fcatttaccct eagtctctgt ggaaaccagg gtaggaaaat gtctftgtgc acogacaatg 600 tcactgacct ccgg&ttcct gagggtgagt cagggttcts caaattítat? ac<*g-ect*c 660 tctgccaggc agt-catcatc cccocagagg tgacaggcta caaggccggg gttfccctcac 720 agcctgfccag QCttgctgat cyacttattg gggtgacaac agatatgact ctggatggaa 780 tScßcctccsé agetgaaett ttccacctgg agtccttggg aataccggac gtg&tcttct 840 trt'fcmts gtc caatgatgtg acccagtcct gcagttctg gagat?aacc accátccgc? 900 taag tgcag tccacagaaa act técctg gaagtttg?t getgscagga acgtgctsag 960 atgggacctg tgatggctgc aacttccact tcctgtggga gagcgcggct gcttgcccgcl,020 tctgctcßgt ggctgác ac cat ctatcg tcagcagct tgtggctggg atscagaßgalOSO cfcacfctasgt gtggcgagaa cccaagctat gctctggtg catttctctg cctgagcagall40 g&gt'accát cfcgc&aaa.cc atagatttct ggetgáaagt gggcatctct goaggcacct!200 gfeactgccat cctgctcacc gtcttgacct gctacttttg gaaaaagaat caaaaactagl260 if caa?fia ctocaa.gc.tg gtgatgaatg ctactctcaa ggactgtgac ctgccageagl320 e 5a.eagd g cgccatcatg gaaggcgagg atgtagagga cgacctcatc tttaccagcaI380 a aágfccác€ ctfetgggaa atcaaatcat ttaaetccaa gaggactcct gatggatttgl 0 ac cagtgcc gctgáa$aca tcctcaggag gcccagacat ggacctgtga gaggcactgciSOO ctíjcctcacc tgcstcctca ccttgpatag cacctttgca agcctgsgge gatttgggtglS€O ccáge'tftect gcaacaccca ctgctgg&aa tctcttcatt gtggccttat cagatgtttgl620 aatttcagat cttttt'ttat agagtaccca aaccctcct.t tctgcttgcc tcaaacctgc!680 casatatácc cftcactttgt ttgtasatta aaaaaaa 1717 (2) INFORMACIÓN SOBRE LA SEQ ID NO: 173: (A) LONGITUD: 495 aminoácidos 0 (B) TIPO: Proteína (C) CADENA: Individual (D) TOPOLOGÍA: Lineal (¡i) TIPO DE MOLÉCULA: ORF (¡ii) HIPOTÉTICO: Sí 15 (vi) ORIGEN: (A) ORGANISMO: SER HUMANO (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 173 20 SRTNTBVE?W KGSKGKQSYT YIIEEísm'TS FTW&FQRTTF HE?SRKYTND VftKIYSINVT 60 Nyfß3i3v?¡,s¥£ GSéCTSCÍAG r??fíROSÍGÍC A8QE?GV fi.C?20 VPCGPGTKÑN KIHSLCVNDC FNYNF5R A VTLAGGPSF TSKG KIFÜH180 Ri?áSVCTDNV. TPtR?g&GES GFSKSÍISÍ? COWÍ?PPEV TG?KAGVSSQ2 0 eVSt&DjRLXG VT?Dj .DGZ TSPñEL Sí?e SÍ.GIP0YIFF XjRSNDVTQSC SSGRST?XRV300 SC^QKT?PG SÍ& PGTCSD GTCDGCNFHF LWÉS ACFX, CSWU3?HAIV sscvÁ ÍQí íáeo ?Y WREP?OiC! SGG?SL?'fidR. rcfór?DFW LKVGISAG C YFWKKNQKI,B 2Q XKYS?O VWNA f KócoLPm DSCÁ?'HSGÜD VEDDLXFTSK KS FG I SF TSKR?PÜGFD480 ÓVPtKfSSGS 495 1 ANEXO 2 (2) INFORMACIÓN SOBRE SEQ ID NO: 51 (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 466 pares de base (B) TIPO: ACIDO NUCLEICO (C) CADENA: DOBLE (D) TOPOLOGÍA: LINEAL (ii) TIPO DE MOLÉCULA: ADNc (vi) FUENTE ORIGINAL: (A) ORGANISMO: Homo Sapiens (F) TIPO DE TEJIDO: Próstata cancerosa (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: sig_péptido (B) UBICACIÓN: 17..127 (C) MÉTODO DE IDENTIFICACIÓN: Matriz de Von Heijne (D) OTRA INFORMACIÓN: puntuación 7.4 seq LWRLLLWAGTAFQ? X (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 51 : ftACTCAGGAC AACGCT ATG GCT GAG CCT GGG CAC AGC CAC QAT CTC TCC GCC 52 tíet Ala Glu Pro Gly His Ser HAS Kis Leu Ser Ala -3$ -30 AGA GTC ÁGG GGA AGA ACT GAG AGG CGC ATA CCC CGG CTG TGG CGG CTG 100 Arg Val ftrg Gly ATg Thr Glu Arg Arg lie' Pro Arg Leu Trp Arg Leu -25 -20 -15 -10 CTG CTC TGd GCT GGG ACC GCC TTC CAG GTG RMC CAG GGA MSG GRA CCG 148 leu Leu Trp Ala Gly Thr Ala Phß Gln Val Xaa Gln G?y Xaa Xaa Pro • -S 1 5 GAG CT? CAS GCC TGC ?RA GAG TCT GAG TAC CAC TAT GAG TAC ACG GCG 196 Glu I?U Xaa Ala Cys Lys Giu Ser Glu Tyr His Tyr Glu Tyr Thr Ala 10 15 20 TGT GAC AGC ACG GGT TCC AGG TGG AGG GTC GCC GTG CCG CAT ACH YCG 244 Cys Asp Ser Thr Gly Ser Arg Trp Arg Val Ala Val Pro His Thr Xaa 25 30 35 GGC CTG TGC. ACC AGC CTG CCT GAC CCC GTC AAG GGC ACC GAG TGC TSN 292 Gly Leu Cys Thr Ser Leu Pro Asp Pro Val Lys Gly Thr Glu Cys Xaa 40 45 50 55 NTC TCC TGC AAC GCC GGG GAG TTT CTG GAT ATG AAG GAC CAG TCA TGT 340 Xaa Sar Cys Asn Ala Gly Glu Phe Leu Asp Mst Lys Asp Gln Ser Cys 60 S5 70 NNG CCA TGC GCT GAG GGC CGC TAC TCC CTC GGC ACÁ GGC ATT CGG TTT 388 Xaa Pro Cys Ala Glu Gly Arg Tyr Ser Leu Gly Thr Gly He Arg Phe 75 80 85 GAT GAG TGG GAT GAG CTG CCC CAT GGC TTT GCA GCC TCT CAG CCA ACÁ 436 Asp Glu Trp Asp Glu t,eu Pro fiis Gly Ph-s Ala Ala Ser Gln Pro Thr 90 95 100 TGG AGC TGG ATG ACÁ GTG CTG CTG AGT CAC 4S6 Trp Ser Trp Mßt Thr Val Lau Leu Ser His 105 110 ANEXO 3 (2) INFORMACIÓN SOBRE SEQ ID NO: 254: (i) CARACTERÍSTICAS DE LA SECUENCIA: (A) LONGITUD: 477 pares de base (B) TIPO: ACIDO NUCLEICO (C) CADENA: DOBLE (D) TOPOLOGÍA: LINEAL (ii) TIPO DE MOLÉCULA: ADNc (vi) FUENTE ORIGINAL: (A) ORGANISMO: Homo Sapiens (F) TIPO DE TEJIDO: Próstata normal (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: Otro (B) UBICACIÓN: Complemento (43..130) (C) MÉTODO DE IDENTIFICACIÓN: blastn (D) OTRA INFORMACIÓN: identidad 97 región 176..263 id C01485 (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: Otro (B) UBICACIÓN: Complemento (137..219) (C) MÉTODO DE IDENTIFICACIÓN: blastn (D) OTRA INFORMACIÓN: identidad 100 región 88..170 id C01485 est (ix) CARACTERÍSTICA: (A) NOMBRE/CLAVE: sig_péptido (B) UBICACIÓN: 421..459 (C) MÉTODO DE IDENTIFICACIÓN: Matriz de Von Heijne (D) OTRA INFORMACIÓN: puntuación 5.6 seq MSLTSGFLRVSQG/SP (xi) DESCRIPCIÓN DE LA SECUENCIA: SEQ ID NO: 254: CACCAATGTT ATGAATGGCG TGGCCTCCTA CTGCCGTCCC TGTGCCCTAG AAGCCTCTGA 60 TGTGGGCTCC TCCTGCACCT CTTGTCCTGC TGGTTACTAT ATTOACCGAG ATTCAGGAAC 120 CTGCCAMTCC BTGCCCCCCT AACACAATTC TGAAAGCCCA CCAGCCTTAT GGTGTCCAGG 180 CCTGTGTGCC CTGTGGTCCA GGGACCAAGA ACAACAAGAT CCACTCTCTG TGCTACAATG 240 ATTGCACCTT CTCACGCAAC ACTCCA^CCA GGACTTTCAA CTACAACTTC TCCGCTTTGG 300 CAAACACCGT CACTCTTGCT GGAGGGCCAA GCTTCACTTC CAAAGGGTTG AAATACTTCC 360 ATCACTTTAC CCTCAGTCTC TGTGGAAACC AGGGTAGGAA AATGTCTGTG TGCACCGACA 420 ATG TCA CTG ACC TCC GGA TTC CTG AGG GTG AGT CAG GGT TCT CCA AAT 468 Met Ser Leu Thr Ser Gly Phe Leu Arg Val Ser Gln Gly Ser Pro Asn -10 -5 1 CTA TCA CAG 477 Leu Ser Gln 5 ANEXO 4 1: AA890726 IDENTIFICADORES dbEST Id: 1618753 Nombre EST: ak13d08.s1 Número de cuenta: AA890726 GenBank gi: 3017605 * 10 INFORMACIÓN DE LOS CLONES ld de los clones: IMAGE: 1405839 (3') Fuente: IMAGE Consortium, LLNL Longitud de inserto: 1325 15 Tipo de ADN: ADNc INICIADORES Secuenciación: -40m13 fwd. ET de Amersham Cola de PoliA: Desconocido SECUENCIA tfT^TTTTTTJUSAAACAAAGTGTGGGT^^ GTWGSGTAC?HOTATAW?AA^ AGA ?TCC& ASTGGGTG?TGCM TGCTA?GCAA G^GAG AG CAGGTGAGGC^^ CAGGT yy^ ACG TGAG AGGATGGC C^G TGCCTG yiGAGATG Calidad: La secuencia de alta calidad se detiene en la base: 497 Entrada creada 2 de abril de 1998 Ultima actualización 4 de enero de 1999 COMENTARIOS Preparación de la genoteca de ADNc: M. Bento Soares, Ph. D., M. Fatima Bonaldo, Ph. D. Genoteca del ADNc arreglada por: Greg Lennon, Ph. D. Secuenciación del ADN por: Washington University Genome Sequencing Center Distribución de los clones: La información sobre la distribución del clon NCI-CGAP puede hallarse a través de I.M.A.G.E. Consortium/LLNL en: www-bio.llnl.gov/bbrp/image/image.html GENOTECA Nombre de genoteca: Soares_parathyroid_tumor_NbHPA Organismo: Homo sapiens Órgano: glándula paratiroides Tipo de tejido: tumor en paratiroides Etapa de desarrollo: Adulto Cepa hospedera: DH10B (resistente a ampicilina) Vector: pT7T3D (Pharmacia) con un polienlazador modificado Sitio R. 1 : Not l Sitio R. 2: Eco Rl Descripción: La primera cadena de ADNc se inició con un iniciador oligo (dT) - Not I [5'- TGTTACCAATCTGAAGTGGGAGCGGCCGCACCAAI I I I I I I I I I M I I I I I i i i i i i i ? -3'], el ADNc de doble cadena se seleccionó por el tamaño, se ligó a adaptadores Eco Rl (Pharmacia), fue digerida con Not I y fue clonada en los sitios Not I y Eco Rl de un vector pT7T3 modificado (Pharmacia). La genoteca pasó por un ciclo de normalización a un Cot = 5. Genoteca construida por Bento Soares y M. Fatima Bonaldo. El Dr. Stephen Marx del Instituto de Diabetes y Enfermedades Digestivas y Hepáticas, NIH por sus siglas en inglés, tuvo la gentileza de proveer el ARN de adenomas de paratiroides esporádicos. DEPOSITANTE Nombre: Robert Strausberg, Ph. D. Correo-e: cgapbs-r@mail.nih.gov CITAS Título: Instituto Nacional Contra ei Cáncer, Proyecto de Anatomía del Genoma del Cáncer (CGAP), índice Génico en Tumores Autores: NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap Año: 1997 Condición: Sin publicar 1: AI672868 IDENTIFICADORES dbEST Id: 2553046 Nombre EST: we72g04.xl Número de cuenta: AI672868 GenBank gi: 4852599 INFORMACIÓN DE LOS CLONES Id de los clones: IMAGE: 2346678(3') Fuente: NCI Longitud de inserto: 706 Tipo de ADN: ADNc INICIADORES Secuenciación: -40UP de Gibco Cola de PoliA: Desconocido SECUENCIA GAGCCCTGCTTGTCTGCATACGTGCi^GGTTTGI^GGGGA^ ÁCCCCTGTTAT GCAAT TTCTC-ACC^ ^ GGC2G!?GGTTCTC( TAGAGGAC&TO TTG8^ FCCCATCCT?TCFCTGTGGTCTTCATCCACCTG^GT ^TCTGAACGAA?AACTCAAAGA GATGCTGGAGTCTGGATAGTAGTATTCGAAffiFTA ACGGTGCCA^SWTGCTTC?8TTGACGGCGTAC^TC^GTGTGGCTGTGCATICGTCCGTG TTGGAGGCGATGTAGTCGCCCCGGGGAACCCAC GGACGAAGTACAGTTCCCGGTGGA.C iC^GCAGCACTGTCATC ^CTCCATGTTGGCTGAGAGGCTGGCTJíAGCC Calidad: La secuencia de alta calidad se detiene en la base: 473 Entrada creada 18 de mayo de 1999 Última actualización 18 de diciembre de 1999 COMENTARIOS Este clon está disponible sin cargos por derecho a través de LLNL; comunicarse con IMAGE Consortium (inof@image.llnl.gov) para mayor información. GENOTECA Nombre de genoteca: Soares_Dieckgraefe_colon_NHCD Organismo: Homo sapiens Órgano: colon Tipo de tejido: mucosa de colon de 3 pacientes con enfermedad de Crohn Cepa hospedera: DH10B (resistente a fagos) Vector: pT7T3D-Pac (Pharmacia) con un polienlazador modificado Sitio R. 1 : Not l Sitio R. 2: Eco Rl Descripción: La primera cadena de ADNc se inició con un iniciador oligo (dT) - Not I [5'-TGTTACCAATCTGAAGTGGGAGCGGCCGCCGTC I I I I I I I I I I I I I I I I I I -3'], el ADNc de doble cadena se ligó a adaptadores Eco Rl (Pharmacia), fue digerida con Not I y fue clonada en los sitios Not I y Eco Rl del vector pT7T3 modificado. La genoteca pasó por una vuelta de normalización. Muestras de tejido proporcionadas por el Dr.Brian Dieckgraefe (Washington Universtity, dieck(5>im.wustl.edu): la mucosa del colon representa una escala de implicación de enfermedad de Crohn de moderada a grave; las muestras incluyen muestras de perforación (fístulas) y de no perforación. Genoteca construida por Bento Soares y M. Fatima Bonaldo. DEPOSITANTE Nombre: Robert Strausberg, Ph. D. Correo-e: cgapbs-r@mail.nih.gov CITAS Título: Instituto Nacional Contra el Cáncer, Proyecto de Anatomía del Genoma del Cáncer (CGAP), índice Génico en Tumores Autores: NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap Año: 1997 Condición: Sin publicar 1: AI301140 IDENTIFICADORES dbEST Id: 2074937 Nombre EST: qo16g05.x1 Número de cuenta: AI301140 GenBank gi: 3960486 INFORMACIÓN DE LOS CLONES Id de los clones: IMAGE: 1908728(3') Fuente: NCI Longitud de inserto: 1305 Tipo de ADN: ADNc INICIADORES Secuenciación: -40UP de Gibco Cola de PoliA: Desconocido SECUENCIA CAA?G?AAGTGTGGGTATATTTG?C&GGTTT^ TC!^ ?AiWAAAaTCTG^ C?GTGGGTGTTGCa^GA?GCTßGC&CCCAAA C A TG G CA G G G CA C GT CCTCTC^^ TGTCTOC G^e&CT GTO'iAATC^ GA CTTCCCAAASí^rG?CTrCTTGC GGTAAAGATGAGGTC^TCCTCTACATCCTCGCC FTCC TGAT GCGC^CT C&GCT CTG C^^ GACG T<-& CA O^AC GTGCCT C GA^^ TA?GtíFT'WGCAGATGG?'GACTCT Calidad: La secuencia de alta calidad se detiene en la base: 10 460 Entrada creada 3 de diciembre de 1998 Última actualización 1 de febrero de 1999 15 COMENTARIOS Tejido proporcionado por: Christopher Moskaluk, M.D., Ph. D, Michael R. Emmert-Buck, M.D., Ph. D. Preparación de la genoteca de ADNc: M. Bento Soares, Ph. D. 20 Genoteca del ADNc arreglada por: Greg Lennon, Ph. D. Secuenciación del ADN por: Washington University Genome Sequencing Center Distribución de los clones: La información sobre ia distribución del clon NCI-CGAP puede hallarse a través de I.M.A.G.E. Consortium/LLNL en: www-bio.llnl.gov/bbrp/image/image.html GENOTECA Nombre de genoteca: NCI_CGAP_Lu5 Organismo: Homo sapiens Órgano: pulmón Tipo de tejido: carcinoide Cepa hospedera: DH 10B Vector: pT7T3D (Pharmacia) con un polienlazador modificado Descripción: La primera cadena de ADNc se preparó a partir de carcinoide de pulmón neuroendócrino, y entonces se inició con un iniciador oligo (dT) - Not I. El ADNc de doble cadena se ligó a adaptadores Eco Rl (Pharmacia), fue digerida con Not I y fue clonada en los sitios Not l y Eco Rl de un vector pT7T3 modificado. La genoteca se normalizó. La genoteca fue construida por Bento Soares y M. Fatima Bonaldo. DEPOSITANTE Nombre: Robert Strausberg, Ph. D. Cofreo-e: cgapbs-r@mail.nih.gov CITAS Título: Instituto Nacional Contra el Cáncer, Proyecto de Anatomía del Genoma del Cáncer (CGAP), índice Génico en Tumores Autores: NCI-CGAP http://www.ncbi.nlm.nih.gov/ncicgap Año: 1997 Condición: Sin publicar P02/666F