MXPA01011882A - Productos de expresion de genes implicados en enfermedades relacionadas con el metabolismo del colesterol. - Google Patents
Productos de expresion de genes implicados en enfermedades relacionadas con el metabolismo del colesterol.Info
- Publication number
- MXPA01011882A MXPA01011882A MXPA01011882A MXPA01011882A MXPA01011882A MX PA01011882 A MXPA01011882 A MX PA01011882A MX PA01011882 A MXPA01011882 A MX PA01011882A MX PA01011882 A MXPA01011882 A MX PA01011882A MX PA01011882 A MXPA01011882 A MX PA01011882A
- Authority
- MX
- Mexico
- Prior art keywords
- sequence
- sequence seq
- nucleic acid
- seq
- nucleotide
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
La presente invencion se relaciona con acido nucleicos expresados a partir de genes localizados en el genoma humano en la region 9q31-34 del cromosoma 9, susceptibles de estar implicados en las enfermedades geneticamente ligadas a este sitio cromosomico, especialmente las afecciones del metabolismo de las lipoproteina plasmaticas, mas particularmente, el transporte inverso de colesterol. La invencion se relaciona igualmente con los polipeptidos codificados por ciertos de los acidos nucleicos, asi como los anticuerpos dirigidos especificamente contra tales polipeptidos, utiles como reactivos de diagnostico. La invencion es relativa, finalmente, a los vectores y las celulas huesped recombinantes, que comprenden estos acidos nucleicos o fragmentos de estos.
Description
PRODUCTOS DE EXPRESIÓN DE GENES IMPLICADOS EN ENFERMEDADES RELACIONADAS CON EL METABOLISMO DEL COLESTEROL
CAMPO DE LA INVENCIÓN La presente invención se relaciona con los ácidos nucleicos expresados a partir de genes localizados en el genoma humano, en la región 9q31-34 del cromosoma 9, susceptibles de estar implicados en las enfermedades genéticamente ligadas a este sitio cromosómico, especialmente las afecciones del metabolismo de las lipoproteínas plasmáticas, más particularmente, el transporte inverso del colesterol . La invención se relaciona igualmente con los polipéptidos codificados por ciertos de estos ácidos nucleicos, así como los anticuerpos dirigidos específicamente contra tales polipéptidos, útiles como reactivos de diagnóstico. La invención es finalmente, relativa a los vectores y las células huésped recombinantes, que comprenden estos ácidos nucleicos o fragmentos de éstos.
ANTECEDENTES DE LA INVENCIÓN Las lipoproteínas, complejos proteicos que incorporan los lípidos que permiten el transporte de éstos
REF. 133523 últimos en la circulación sanguínea, normalmente presentes en el plasma sanguíneo, varían en tamaño y en composición, pero aparecen todos bajo la forma de microemulsión. Las partículas de lipoproteínas son esféricas y contienen un núcleo central de lípidos no polares (en su mayoría, triglicéridos y esteres de colesterol) y una monocapa superficial de lípidos polares (colesterol y mayoritariamente fosfolípidos) y proteínas denominadas apolipoproteínas (apo) . La mayor parte de los compuestos proteicos de la monocapa superficial, todos como los fosfolípidos, tienen propiedades anfipáticas. La asociación de lípidos polares y de proteínas con las lipoproteínas es así realizada, vía fuerzas hidrófobas, gracias a las cuales, las cadenas de ácidos grasos y las cadenas laterales de aminoácidos no polares son excluidas del medio acuoso. La mayor parte de las apolipoproteínas poseen regiones anfipáticas en hélice (apolipoproteína A-I, A-II, A-IV, C-I, C-II, C-III y E) . La densidad de las partículas de lipoproteína es inversamente proporcional a su tamaño, su densidad refleja las cantidades relativas de lípidos no polares de baja densidad, contenidos en el núcleo y de proteínas superficiales de alta densidad, presentes.
Entre las lipoproteínas de gran tamaño, conocemos los quilomicrones, secretados por los enterocitos, en los cuales la apo B-48 es mayoritaria, et los VLDL, secretados por los hepatocitos, que contienen la proteína apo B-100. Las clases de lipoproteínas más pequeñas, LDL y
HDL, contienen mayoritariamente esteres de colesterol en su núcleo. Las formas maduras de estas partículas no son secretadas directamente a partir de las células, pero son más particularmente producidas por vías metabólicas en el seno del plasma sanguíneo. Las partículas LDL representan los productos finales del metabolismo de las partículas VLDL. Ciertos compuestos de partículas HDL son derivados a partir de los quilomicrones. Así, las lipoproteínas de alta densidad (HDL) son una de las cuatro clases principales de lipoproteínas que circulan en el plasma sanguíneo. Estas lipoproteínas están implicadas en diferentes vías metabólicas, tales como el transporte lipídico, la formación de ácidos biliares, la esteroidogenasa, la proliferación celular y además, interfiere con los sistemas de la proteinasa plasmática. Las HDL son los receptores perfectos del colesterol libre y, en combinación con las proteínas de transferencia del éster de colesterol (CETP) , la lipoproteína lipasa (LPL) , la lipasa hepática (HL) y la lecitina: colesterol aciltransferasa (LCAT) , juegan un papel principal en el transporte inverso del colesterol, es decir, el transporte del colesterol en exceso en las células periféricas hacia el hígado, para su eliminación del organismo bajo la forma de ácido biliar. Las HDL no transportan únicamente el colesterol de las células periféricas hacia el hígado, sino que lo distribuyen igualmente a las células productoras de esteroides o a las células periféricas pobres en colesterol. Los precursores de las HDL son secretados bajo forma discoidal a partir del intestino y del hígado, a partir de los cuales, las partículas esféricas son formadas gracias a la formación de esteres de colesterol, que migran al centro de la partícula lipoproteica. Las partículas nacientes de HDL contienen las apo A-I y apo A-IV, mientras que las partículas de HDL hepáticas nacientes son ricas en apo A-I, apo E y apo A-II. La parte lipídica de estas partículas consiste de fosfolípidos y de pequeñas cantidades de colesterol libre y de triglicérido.
. XÍ??LL, ,.
Se ha demostrado que las HDL juegan un papel central en el transporte del colesterol de los tejidos periféricos hacia el hígado. El exceso de colesterol no esterificado de las células periféricas ricas en colesterol es captado por las HDL y sufre una esterificación por la acción de la LCAT. Estas HDL enriquecidas en esteres de colesterol son captadas por las proteínas de unión o receptores de las HDL en la superficie de los hepatocitos y ahí liberan sus esteres de colesterol. El papel protector de las HDL en el transporte inverso del colesterol es confirmado por los estudios epidemiológicos, que demuestran una relación inversa entre las concentraciones de colesterol en estas HDL y el riesgo de aparición de enfermedades coronarias, o incluso por las observaciones de acuerdo a las cuales, las HDL aceptan eficazmente los excesos de colesterol intracelular a partir de tipos celulares variados. Las lipoproteínas aterógenas son ingeridas por los macrófagos o las células periféricas y degradadas en los lisosomas. El colesterol es ensanchado en los lisosomas y es reesterificado en el compartimiento citoplásmico. Se ha demostrado en particular que las HDL ricas en apo A-I estimulan los flujos de colesterol a partir de los
ifa*A--í--l---L ja-leá---. *» ,%-»&*>..<,?„.. ... »?.At-,j-n, macrófagos o de las células periféricas hacia el compartimiento 'extracelular, seguido de una interacción con las proteínas de unión de las HDL presentes en la superficie de las células. Diversas enfermedades ligadas a una deficiencia en
HDL han sido descritas; comprenden la enfermedad de Tangier, la deficiencia en HDL y la deficiencia en LCAT. La deficiencia implicada en la enfermedad de Tangier está unida a un déficit celular en la translocación del colesterol celular, en el cual los precursores de HDL son degradados en los lisosomas. Sin embargo, para la enfermedad de Tangier, la naturaleza exacta del déficit no ha sido aún, definido precisamente. En la enfermedad de Tangier, este déficit celular conduce a una perturbación del metabolismo lipoproteico. Las HDL que no incorporan el colesterol a partir de las células periféricas y no pueden ser metabolizadas correctamente, son eliminadas rápidamente del organismo. La concentración plasmática de HDL de estos pacientes es, por lo tanto, extremadamente reducida y las HDL no aseguran más el retorno del colesterol hacia el hígado. Este colesterol se acumula en estas células periféricas y provoca manifestaciones clínicas características, tales como la formación de amígdalas anaranjadas. Además, otras perturbaciones lipoproteicas como
ÍX I -i Jrm -a»-.4 una sobreproducción de triglicéridos, así como una síntesis y un catabolismo intracelular acrecentado de fosfolípidos son observadas. La enfermedad de Tangier, cuyos síntomas han sido descritos aquí anteriormente, está clasificada entre las afecciones familiares ligadas al metabolismo de las HDL, que son las más comúnmente detectadas en los pacientes afectados de enfermedades coronarias. Numerosos estudios han demostrado que un nivel reducido de colesterol HDL es un factor excelente de riesgo, que permite descubrir una afección coronaria. En este contexto, los síndromes ligados a las deficiencias en HDL han presentado un interés aumentado durante el decenio pasado, por el hecho de que permiten aumentar la comprensión del papel de las HDL en la aterogénesis . Se han caracterizado varias mutaciones en el gen apo A-I. Estas mutaciones son raras y pueden conducir a una ausencia de producción de apo A-I. Estas mutaciones en los genes que codifican para la lipoproteína lipasa (LPL) o su activador apoC-II están asociadas con las hipertrigliceridemias severas y niveles de HDL-c fuertemente reducidos.
Las mutaciones en el gen que codifica para la enzima lecitina: colesterol, aciltransferasa (LCAT) están igualmente asociadas a una deficiencia severa en HDL. Existe, por lo tanto, una necesidad creciente en el estado de la técnica, de identificar los genes implicados en el metabolismo del colesterol y/o de las lipoproteínas, y en particular, de los genes asociados a las disfunciones del transporte inverso del colesterol de las células periféricas hacia el hígado. Recientemente, se ha realizado un estudio de la secreción de diferentes formas alélicas de 343 marcadores microsatélites repartidos sobre el conjunto del genoma y distantes entre ellos en promedio 10.3 cM. El estudio de unión (enlace) fue realizado sobre una familia bien caracterizada sobre once generaciones, cuyos numerosos miembros son afectados por la enfermedad de Tangier, la familia comprende cinco líneas de consanguinidad. Este estudio ha permitido identificar una región localizada en el sitio 9q31 del cromosoma 9 humano, asociado estadísticamente con la afección (Rust S. et al., Nature Genetics, vol. 20, Septiembre 1998, páginas 96-98) . Sin embargo, el estudio de RUST et al. Define solamente una gran región del genoma, cuyas alteraciones son susceptibles de estar asociadas con la enfermedad de Tangier.
^¿^¿^^^¿^¿^¿¿^^^^^^ m¿^^im Simplemente se precisa que la región del sitio 9q31-34 relacionada, contiene EST, pero ningún gen conocido. Se ha demostrado en lo sucesivo, que una región de aproximadamente 15cM situada en el sitio 9q31-34 en el hombre, está asociada, de manera general, con las deficiencias familiares de HDL. Más particularmente, se ha demostrado de acuerdo con la invención, que las moléculas de ARN mensajero son expresadas a partir de secuencias localizadas en el genoma en una región de aproximadamente 15 cM centrada en el marcador microsatélite D9S1784, identificado como el marcador microsatélite que da la unión genética más fuerte con la deficiencia familiar de HDL y la enfermedad de Tangier. Además, se considera que la región 9q31-34 contiene potencialmente genes susceptibles de jugar un papel en el inicio o el desarrollo de diversas enfermedades, tales como: - las enfermedades óseas como los condrosarcomas mixoides, los retrasos mentales ligados a las anomalías del cromosoma 9 (MRD) ; - las enfermedades renales como las nefroftisis infantiles (NPH2) ; - las enfermedades musculares, como la distrofia muscular de la cintura (LGMD2H) ;
aá^ fc-Ag«i^g¡ las enfermedades psiquiátricas como la esquizofrenia; - las enfermedades digestivas como la enfermedad de Hirschprung, ligada a RET (SHSCR2) . Debido al hecho de la ubicación de los genes candidatos colocados en este intervalo cromosómico, los ARN mensajeros y los polipéptidos correspondientes, tales como los aislados y caracterizados de acuerdo con la invención, están potencialmente implicados en ciertas patologías humanas descritas anteriormente, incluso en otras patologías igualmente ligadas genéticamente a esta región del cromosoma 9. Para ciertas secuencias comprendidas en estos ARN mensajeros aisladas y caracterizadas por la solicitante, una fase de lectura abierta putativa ha sido determinada, y la secuencia de la proteína correspondiente ha sido deducida. Los polipéptidos correspondientes están implicados potencialmente en una afección ligada al metabolismo de las lipoproteínas, más particularmente ligada a un déficit del transporte inverso del colesterol.
DESCRIPCIÓN DETALLADA DE LA INVENCIÓN La presente invención describe así, los polinucleótidos y los polipéptidos, donde una alteración de
ffli Aj m- - I la secuencia o de la expresión, está asociada potencialmente a un déficit en el metabolismo de las lipoproteínas plasmáticas, más particularmente, a un déficit en el transporte inverso de las HDL. La presente invención describe también los polinucleótidos y los polipéptidos, donde una alteración de la secuencia o de la expresión está asociada potencialmente a las enfermedades genéticamente ligadas al sitio 9q31-34 del cromosoma 9.
DEFINICIONES GENERALES El término 'aislado", en el sentido de la presente invención, designa un material biológico (ácido nucleico o proteína) que ha sido sustraído de su medio original (el medio en el cual se localiza naturalmente) . Por ejemplo, un polinucleótido presente en el estado natural en una planta o en un animal no está aislado. El mismo polinucleótido separado de los ácidos nucleicos adyacentes, en el seno de los cuales está naturalmente insertado en el genoma de la planta o animal, es considerado como 'aislado". Un polinucleótido tal puede estar incluido en un vector y/o un polinucleótido tal puede estar incluido en una composición y permanecer sin embargo, en el estado aislado,
*«.&«-£ -n o&&*id ' por el hecho de que el vector o la composición no constituye su medio natural. El término 'purificado" no necesita más que el material esté presente bajo una forma de pureza absoluta, exclusiva de la presencia de otros compuestos. Se trata, más bien, de una definición relativa. Un polinucleótido está en el estado 'purificado" después de la purificación del material de partida o del material natural de al menos un orden de magnitud, de preferencia 2 ó 3 y de preferencia 4 ó 5 órdenes de magnitud. Para los fines de la presente descripción, la expresión 'secuencia nucleotídica" puede ser empleada para designar de manera indiferente un polinucleótido o un ácido nucleico. La expresión 'secuencia nucleotídica" engloba el material genético mismo y no está restringido, por lo tanto, a la información que se relaciona con su secuencia. Los términos 'ácido nucleico", 'polinucleótido", Oligonucleótido" o incluso 'secuencia nucleotídica", engloban las secuencias de ARN, de ADN, de ADNc o incluso las secuencias híbridas de ARN/ADN de más de un nucleótido, indiferentemente bajo la forma de una cadena simple o bajo la forma de dúplex. El término 'nucleótido" designa a la vez, los nucleótidos naturales (A, T, G, C) , así como los nucleótidos
modificados que comprenden al menos una modificación tal como
(1) un análogo de una purina, (2) un análogo de una pirimidina, o (3) un azúcar análogo, los ejemplos de tales nucleótidos modificados se describen por ejemplo, en la solicitud PCT N° WO95/04064. Para los fines de la presente invención, un primer polinucleótido es considerado como en el estado 'complementario" de un segundo polinucleótido, cuando cada base del primer nucleótido está apareada a la base complementaria del segundo polinucleótido, cuya orientación está invertida. Las bases complementarias son A y T (o a y U) , o C y G. Por 'variante" de un ácido nucleico de acuerdo con la invención, se entiende un ácido nucleico que difiere de una o varias bases con respecto al polinucleótido de referencia. Un ácido nucleico variante puede ser de origen natural, tal como una variante alélica encontrada naturalmente, o puede ser también una variante no natural obtenida por ejemplo, por técnicas de mutagénesis. En general, las diferencias entre el ácido nucleico de referencia y el ácido nucleico variante, son reducidas, de tal suerte que las secuencias nucleotídicas del ácido nucleico de referencia y el ácido nucleico variante son muy próximas, y en numerosas regiones, idénticas. Las
modificaciones de nucleótidos presentes en un ácido nucleico pueden ser silenciosas, lo que significa que no alteran las secuencias de aminoácidos codificados por dicho ácido nucleico variante. Sin embargo, los cambios de nucleótidos en un ácido nucleico variante pueden también resultar en sustituciones, adiciones, supresiones en el polipéptido codificado por el ácido nucleico variante, con respecto a los péptidos codificados por el ácido nucleico de referencia. Además, las modificaciones de los nucleótidos en las regiones codificantes pueden producir sustituciones, conservativas o no conservativas en la secuencia de aminoácidos. De preferencia, los ácidos nucleicos variantes de acuerdo con la invención que codifican para los polipéptidos conservan sensiblemente la misma función o actividad biológica que el polipéptido del ácido nucleico de referencia o incluso la capacidad de ser reconocido por los anticuerpos dirigidos contra los polipéptidos codificados por el ácido nucleico inicial. Ciertos ácidos nucleicos variantes codificarán así para las formas mutadas de los polipéptidos, cuyo estudio sistemático permitirá deducir las relaciones de estructura-actividad de las proteínas en cuestión. El conocimiento de estas mutaciones con respecto a la enfermedad estudiada, es
-»k í-i fundamental, puesto que permite comprender la causa molecular de la patología. Se entiende por 'fragmento", un ácido nucleico de referencia de acuerdo con la invención, una secuencia nucleotídica de longitud reducida con respecto al ácido nucleico de referencia y que comprende, en la parte común, una secuencia de nucleótidos idéntica al ácido nucleico de referencia. Un 'fragmento" tal de ácido nucleico de acuerdo con la invención puede estar, dado el caso, comprendido en un polinucleótido más grande de aquél que es constitutivo. Tales fragmentos comprenden, o consisten alternativamente de, oligonucleótidos de longitud que va de
8, 10, 12, 15, 18, 20 a 25, 30, 40, 50, 70, 80, 100, 200, 500, 1000 ó 1500 nucleótidos consecutivos de un ácido nucleico de acuerdo con la invención. Por 'variante" de un polipéptido de acuerdo con la invención, se entenderá principalmente un polipéptido cuya secuencia de aminoácidos contiene una o varias sustituciones, adiciones o supresiones de la menos un residuo de aminoácido, con respecto a la secuencia de aminoácidos del polipéptido de referencia, entendiéndose que las substituciones de aminoácidos pueden ser de manera indiferente conservativas o no conservativas.
i árií .„ . i .. - -ÍMaA Por 'fragmento" de un polipéptido de acuerdo con la invención, se entiende un polipéptido cuya secuencia de aminoácidos es más corta que aquélla del polipéptido de referencia y que comprende sobre toda la parte común con estos polipéptidos de referencia, una secuencia de aminoácidos idéntica. Tales fragmentos pueden, dado el caso, estar comprendidos en el seno de un polipéptido más grande que aquél del cual forman parte. Tales fragmentos de un polipéptido de acuerdo con la invención, pueden tener una longitud de 10, 15, 20, 30 a 40, 50, 100 ó 300 aminoácidos. El 'porcentaje de identidad" entre dos secuencias de nucleótidos o de aminoácidos, en el sentido de la presente invención, puede ser determinado comparando dos secuencias alineadas de manera óptima, a través de una ventana de comparación. La parte de la secuencia nucleotídica o polipéptido en la ventana de comparación puede así, comprender adiciones o supresiones (por ejemplo, 'huecos"), con respecto a la secuencia de referencia (que no comprende estas adiciones o estas supresiones) de manera que se obtiene una alineación óptima de las dos secuencias.
a4AAj jt¿-t M.AJ>fe . -,.«.-. JA» «&te. ?*. — .» *. . .... ..... A...^» . .. . ... , „ * t > ¡ ¡ . ¿fe¿»^ El porcentaje es calculado determinando el número de posiciones en el cual una base nucleica o un residuo de aminoácido idéntico es observado para las dos secuencias (nucleica o peptídica) comparadas, después dividiendo el número de posiciones en el que hay identidad entre las dos bases o residuos de aminoácidos por el número total de posiciones en la ventana de comparación, después multiplicando el resultado por 100 con el fin de obtener el porcentaje de identidad de la secuencia. La alineación óptima de las secuencias para la comparación puede realizarse de manera informática con la ayuda de algoritmos conocidos contenidos en el paquete de la Sociedad WISCONSIN GENETICS SOFTWARE PACKAGE, GENETICS COMPUTER GROUP (GCG), 575 Science Doctor, Maison, WISCONSIN. A título de ilustración, el porcentaje de identidad de secuencia podrá ser efectuado con la ayuda del lógico BLAST (versiones BLAST 1.4.9 de marzo de 1996, BLAST 2.0.4 de febrero de 1998 y BLAST 2.0.6 de septiembre de 1998), utilizando exclusivamente los parámetros por defecto (S. F Altschul et al, J. Mol. Biol. 1990 215:403-410, S. F Altschul et al, Nucleic Acids Res. 1997 25:3389-3402). Blast busca las secuencias similares/homologas a una secuencia 'propuesta" de referencia, con la ayuda del algoritmo de Altschul et al. La secuencia propuesta y las bases de datos utilizadas pueden ser peptídicas o nucleicas, siendo posible cualquier combinación. Por 'condiciones de hibridación de fuerte astringencia" en el sentido de la presente invención, se entenderán las condiciones siguientes:
1 - Competición de las membranas y PREHIBRIDACIÓN: Mezclar: 40µl de ADN de esperma de salmón (lOmg/ml) + 40µl de ADN de placenta humana (lOmg/ml) - Desnaturalizar 5 mn a 96°C, después sumergir en hielo la mezcla. - Sacar el SSC 2X y verter 4 ml de mezcla de formamida en el tubo de hibridación que contiene las membranas . - Agregar a la mezcla los dos ADN desnaturalizados. Incubación a 42 °C durante 5 a 6 horas con rotación.
2 - Competición de la sonda marcada: - Agregar a la sonda marcada y purificada, 10 a 50 µl de ADN Cot I, de acuerdo a la cantidad de repeticiones.
t A iM i. . j. -J---. v ? t*e?r , . _ ^t»-H M **:*.. , -. _ , ** «—* „ . .-- -„ „ -. 1,-u ui^ási - Desnaturalizar 7 a 10 mn a 95°C. - Incubar a 65°C durante 2 a 5 horas.
3 - HIBRIDACIÓN: - Sacar la mezcla de prehibridación. - Mezclar 40 µl de AND de esperma de salmón + 40 µl de ADN de placenta humana; desnaturalizar 5 mn a 96°C, después, sumergir en hielo. - Agregar en el tubo de hibridación 4 ml de mezcla de formamida, la mezcla de los dos ADN y la sonda marcada/ADN
Cot I desnaturalizada. - Incubar 15 a 20 horas a 42°C, con rotación.
4 - Lavados : - Un lavado a temperatura ambiente en SSC 2X, para enjuagar. - 2 veces 5 minutos a temperatura ambiente SSC 2X y SDS 0.1% a 65°C. - 2 veces 15 minutos a 65 C SSC IX y SDS 0.1% a 65°C.
Envolver las membranas en un Sarán y exponer. Las condiciones de hibridación descritas más arriba están adaptadas a la hibridación en condiciones de fuerte
^^^tg^^^fe^4 astringencia, de una molécula de ácido nucleico de una longitud variable de 20 nucleótidos a varias centenas de nucleótidos . No necesita decirse que las condiciones de hibridación descritas anteriormente pueden ser adaptadas en función de la longitud del ácido nucleico cuya hibridación es buscada, o del tipo de marcado elegido, de acuerdo a las técnicas conocidas por el experto en la materia. Las condiciones convenientes de hibridación pueden, por ejemplo, ser adaptadas de acuerdo a las enseñanzas contenidas en la obra de HAMES et HIGGINS (1985) o incluso en la obra de F. AUSUBEL et al (1999) .
DETALLES DE LOS ÁCIDOS NUCLEICOS Y DE LOS POLIPEPTIDOS DE ACUERDO CON LA INVENCIÓN Una breve descripción de las secuencias de ácidos nucleicos y de las secuencias de aminoácidos de acuerdo con la invención, es representada en la Tabla I, a continuación de los ejemplos.
Gen GS9002S31
mtA?SÉ»JÜML, --a-------», fr .. I ^¿i-fe.-. «^ -.. -, fc^*. .
Ácidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente el no° GS9002S31. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 1. La secuencia SEQ ID N° 1 tiene una longitud de 552 nucleótidos . Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 1 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS9002S31 era expresado en el cerebro fetal, el hígado y la placenta.
Gen GS910331. Ácidos nucleicos Se han aislado, de acuerdo con la invención, dos secuencias de ARN mensajero, gue corresponde a un transcrito del gen designado aguí posteriormente como el n° GS910331.
i.---*. a-3* » La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 2. La secuencia SEQ ID N° 2 tiene una longitud de 1246 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 3. La secuencia SEQ ID N° 3 tiene una longitud de 3035 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110 y Versión 115) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 2 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS310331 era expresado en el cerebro fetal. Además, un análisis de la expresión del transcrito por manchado Northern, con la ayuda respectivamente, de las sondas de las secuencias SEQ ID N° 82 et 83, ha revelado la presencia de transcritos en el manchado comercializado por la
Sociedad Clontech (Ref. N° 7759-1) .
El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 82 es respectivamente de 1,65 kb en el hígado y el corazón y de 1,4 kb en el cerebro. El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 83 es respectivamente de 1,65 kb y 2,4 kb en el corazón y de 1,65 kb en el hígado. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS914554 Ácidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS94554. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 4. La secuencia SEQ ID N° 4 tiene una longitud de 1479 nucleótidos . Ninguna identidad de secuencia ha sido encontrada
I í ?- r ,1. c fc al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 4 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS94554 era expresado en el cerebro fetal, la placenta y el hígado. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda respectivamente, de la sonda de la secuencia SEQ ID N° 58, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 84 es respectivamente de: 1.0, 1.3, 1.7 y 2.8 kb en el páncreas y la placenta; 1.0, 1.3 y 1,7 kb en el riñon, el músculo esguelético, el corazón y el hígado; 1.7 kb en el cerebro y el pulmón. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la
enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS914739. Ácidos nucleicos Se ha aislado, de acuerdo con la invención dos secuencias de ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS14739. La primera secuencia nucleica del ADNc que corresponde a este transcrito constituye la secuencia SEQ ID N° 5. La secuencia SEQ ID N° 5 tiene una longitud de 5169 nucleótidos . Ninguna homología de secuencia con la secuencia SEQ
ID N° 5 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica de ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 6. La secuencia SEQ ID N° 6 tiene una longitud de 7723 nucleótidos. Esta secuencia comprende un marco abierto de lectura (ORF) que va del nucleótido en la posición 121 al nucleótido en la posición 1517 de la secuencia SEQ ID N° 6.
El codón de inicio de la traducción inicia en el nucleótido en la posición 132 de la secuencia SEQ ID N' La secuencia codificante inicia en el nucleótido en la posición 132 y se termina en el nucleótido en la posición 1517 de la secuencia SEQ ID N° 6. La secuencia SEQ ID N° 6 comprende una señal de poliadenilación de secuencia 'ATA" que inicia en el nucleótido en la posición 7686 de la secuencia SEQ ID N° 6. El motivo de Kozak de secuencia 'CCA CTC GCC ATG" inicia en el nucleótido en la posición 123 de la secuencia SEQ ID N° 6. Dos homologías de secuencia del 100% han sido encontradas al momento de una búsqueda en la base de datos GenBank (Versión 115, N° de acceso AF088031), respectivamente: del nucleótido en la posición 1 al nucleótido en la posición 146 de la secuencia SEQ ID N° 6; y del nucleótido en posición 243 al nucleótido en la posición 573 de la secuencia SEQ ID N° 6. Los análisis de expresión del transcrito de la secuencia SEQ ID N° 5 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos
i¿i?¿ ??¿i¿^^*i_ ti te -J^/tJh&í análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS914739 era expresado en el cerebro fetal. Además, un análisis de la expresión de un transcrito por manchado Northern, con la ayuda de la sonda de la SEQ ID N° 85, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 85 es de 1 kb en el corazón, el hígado, el músculo esquelético y el riñon . Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 6 El marco abierto de lectura de la secuencia nucleotídica SEQ ID N° 6 codifica potencialmente para
un polipéptido de 461 aminoácidos de longitud que constituye la secuencia SEQ ID N° 129. Sobre las regiones nucleotídicas 240-1481 y 1511-1675 de la secuencia SEQ ID N° 129, se ha encontrado una identidad de secuencia de aproximadamente 30%, con las bases Genpeptll5, Swissprot38, trEMBL y PIR con los números de acceso siguientes: AF035360 (homo), AF186461 (rattus), AF186460 (musspretus ) ; AF196481 (homo sapiens), AF196480 (musmusc) y con los T09482 (hombre) y T09013 (ratón) (anillo Fxy) . Algunas homologías de secuencia han sido encontradas igualmente con los números de acceso siguientes: DA191 P20.2, A49656 y 149642. El polipéptido de la secuencia SEQ ID N° 129 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen S915574. cidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS915574. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 7. La secuencia SEQ ID N° 7 tiene una longitud de 1046 nucleótidos . Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 7 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS915574 era expresado en el cerebro fetal, el útero, el cerebro, el corazón, la próstata, el hígado fetal, el hígado, la placenta, el testículo y el riñon. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de
^ ^^^Mga^ HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS930321 cidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS930321. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 8. La secuencia SEQ ID N° 8 tiene una longitud de 280 nucleótidos . Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 8 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS930321 era expresado en el cerebro fetal, el hígado y el corazón. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la
l.-l-Ü enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen S931311. Ácidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS931311. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 9. La secuencia SEQ ID N° 9 tiene una longitud de 479 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 98 de la secuencia SEQ ID NO 9. Ninguna identidad de secuencia ha sido encontrada al momento de una búsgueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 9 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que
ta¿ .
el gen GS931311 era expresado en el cerebro fetal, el hígado, el corazón, la placenta, el testículo y el riñon. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID NO 9 El marco abierto de lectura parcial de la secuencia de ácidos nucleica SEQ ID N° 9 codifica potencialmente para un polipéptido de 32 aminoácidos de longitud constituye la secuencia SEQ ID N° 130. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos
Swissprot (versión 36, última puesta al día del 3 de mayo de
1999) y PRODOM: (dominios homólogos obtenidos en Swissprot, versión 34.2, noviembre 1997). El polipéptido de la secuencia SEQ ID N° 130 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen S93 660. cidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS934660. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 10. La secuencia SEQ ID N° 10 tiene una longitud de 2599 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 10 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS934660 era expresado en el cerebro fetal. Además, un análisis de la expresión del transcrito por manchado Northern, con la ayuda de la sonda de la secuencia SEQ ID N° 86, de acuerdo al protocolo descrito en el Ejemplo 1, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 86 es respectivamente de: - 1 kb, 2 kb, 3 kb y 7,5 kb en la placenta; - 2, 3 y 7.5 kb en el corazón; - 7,5 kb en el riñon, el páncreas, el músculo esquelético, el pulmón y el cerebro. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS938315. Ácidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aguí posteriormente como el n° GS938315. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 11.
tii.tt.
La secuencia SEQ ID N° 11 tiene una longitud de 222 nucleótidos . Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 11 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS938315 era expresado en el cerebro fetal, el hígado, el corazón y el riñon. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9g31-34 del cromosoma 9.
Gen GS93953 Ácidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aguí posteriormente como el n° GS93953.
La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 12. La secuencia SEQ ID N° 12 tiene una longitud de 3422 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 13. La secuencia SEQ ID N° 13 tiene una longitud de 5791 nucleótidos. Comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 554 de la secuencia SEQ ID N° 13. Algunas homologías de secuencia han sido encontradas entre la secuencia SEQ ID N° 13 y los números de acceso siguientes de la base de datos GenBank (Versión 116) : AC013740.2, AC013783.2 y AF086175. 1. Los análisis de expresión del transcrito de la secuencia SEQ ID N° 12 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS93953 era expresado en el cerebro fetal.
|||^y||^|¿ga^ >j,|^^gU^te|g^,|&. .,rr ...,J.*.J . .- , . .- .. -.«AtlmtM-J. j-fe t. y.. ~«. - .» . .J * * *-.i .aBfeja-É=á Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el
Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID N° 87, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 87 es de 8 kb en el corazón, el cerebro, la placenta, el pulmón, el hígado, el músculo esquelético, el riñon y el páncreas. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 13. El marco de lectura abierta parcial de la secuencia del ácido nucleico SEQ ID N° 13 que codifica potencialmente para un polipéptido de 183 aminoácidos de longitud constituye la secuencia SEQ ID N° 131.
ri f f ., . I.XtX^áa* .
Se ha observado una homología de 45% entre la región 6-162 de la secuencia SEQ ID N° 131 y la secuencia n° g3878571 (Z46381) de la base de datos Gen Bank (Versión 115) y la secuencia n<° EM:Q21453 M01F1.4 PROTEIN de la base de datos trEMBL (Versión de Agosto 1999) . El polipéptido de la secuencia SEQ ID N° 131 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS939874. Ácidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aguí posteriormente como el n° GS939874. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 14. La secuencia SEQ ID N° 14 tiene una longitud de 2615 nucleótidos.
i:á.n,.'rr? h* Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 15. La secuencia SEQ ID N° 15 tiene una longitud de 2551 nucleótidos. Comprende un cuadro abierto de lectura que va del nucleótido en la posición 50 al nucleótido en la posición 958 y una secuencia codificante que va del nucleótido en la posición 67 al nucleótido en la posición 958. Una homología del 99% de identidad sobre 2044 nucleótidos de la secuencia SEQ ID N° 15 ha sido observada con la secuencia de la base de datos GenBank (Versión 116) gue tiene el número de acceso AK001355. Los análisis de expresión del transcrito de la secuencia SEQ ID N° 14 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS939874 era expresado en el cerebro fetal, el útero, el cerebro, el corazón, la próstata, el hígado fetal, el hígado, la placenta, el testículo y el riñon.
Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 15. El marco abierto de lectura del ácido nucleico de la secuencia SEQ ID N° 15 que codifica potencialmente para un polipéptido de 291 aminoácidos de longitud constituye la secuencia SEQ ID N° 132. Una homología del 35% sobre 233 aminoácidos (14-246 de SEQ ID N° 132) ha sido encontrada con la secuencia referida en la base de datos GenPept (Versión 115) bajo el n° g5832945 (AL117195) . Una homología del 32% sobre 245 aminoácidos (30-274 de SEQ ID N° 132) ha sido encontrada con la secuencia referida en la base de datos GenPept (Versión 115) bajo el n° g5832942 (AL117195) . El polipéptido de la secuencia SEQ ID N° 132 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de
Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS911370 cidos nucleicos Se ha aislado de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS911370. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 16. La secuencia SEQ ID N° 16 tiene una longitud de 775 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura parcial (ORF) que va del nucleótido en la posición 1 al nucleótido en la posición 144 de la secuencia SEQ ID N° 16. Una homología en nucleótidos ha sido encontrada con las secuencias siguientes: • 96% de homología sobre 229 pb (posición 52-280 pb) con la secuencia GenBank: gil 10222241- Fragmento Msel de ADN genómico de Homo sapiens, que contiene un islote CpG (clona 92el0, lectura inversa de cpg92el0.rtla) • 100% de homología sobre 145 pb (posición 1-144 pb) con la secuencia GenBank: gi | 459833 | del ARNm humano de la subunidad beta del complejo Sec61. Los análisis de expresión del transcrito de la secuencia SEQ ID N° 16 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS911370 era expresado en el cerebro fetal. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda, respectivamente, de las sondas de la secuencia SEQ ID N° 88 et 89, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 88, así como con la sonda de la secuencia SEQ ID N° 89 es de 7,4 kb en el páncreas. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
a.-.i-, * ? m * ?,r .,..„*., .„.. —_ , ,, .^-,,,. .,.., . , , , .i.t ...A ^UHS Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 16 El marco abierto de lectura parcial de la secuencia de ácidos nucleicos SEQ ID N° 16 codifica potencialmente para un polipéptido de 48 aminoácidos de longitud constituye la secuencia SEQ ID N° 133. Homologías observadas al nivel de la secuencia proteica : Este ORF potencial (48 aa) posee una identidad sobre 33 aa (posición 16-48 aa) con la proteína de transporte subunidad beta del complejo Sec61 humano donde las secuencias son sp|P38391|, gb|AAA19639.11 , PIR: (Secuencias PIR no redundantes, versión 57)|S|S42410 y 18652 p34.2 (1) respectivamente en las bases de datos Swissprot (versión 36, última puesta al día del 3 de mayo 1999)) Genpept:
(traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999), PIR: (SECUENCIAS PIR NO REDUNDANTES, VERSIÓN
57) no redundante y PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997). Esta identidad es encontrada en las diferentes bases de datos proteicas (PIR: (SECUENCIAS PIR NO REDUNDANTES, VERSIÓN 57), PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997)) y las traduciones de Genbank y EMBL {TrEMBL (SP-TrEMBL, versión 7, noviembre 1998), Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) ) .
Función Putativa: El complejo de proteínas sec61 es un componente central de la maquinaria celular de translocación de las proteínas nacientes en el retículo endoplásmico. El gen GS911370 podría por lo tanto ser, por parte de su homología con la subunidad beta del complejo sec61, un gen que codifica para un nuevo compuesto de esta maquinaria. Por consiguiente, su posible papel en la translocación de las proteínas y por consiguiente, del tráfico de las proteínas implicadas en el mecanismo del flujo del colesterol con respecto a un gen de interés en el estudio del déficit observado en los pacientes con Tangier/FHD. El polipéptido de la secuencia SEQ ID N° 133 es así, susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL. El polipéptido de la secuencia SEQ ID N°133 es por lo tanto, susceptible de intervenir en una etapa importante implicada en el transporte inverso del colesterol por las HDL.
Ja?tL.??A, . -,f Xfftitf*.
El polipéptido de la secuencia SEQ ID N° 133 es igualmente susceptible de intervenir en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS913920. Ácidos nucleicos Se ha aislado, de acuerdo con la invención, un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS913920. Una primera secuencia ha sido aislada y caracterizada; se trata de la secuencia nucleica del ADNc que constituye la secuencia SEQ ID N° 17. La secuencia SEQ ID N° 17 tiene una longitud de 491 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 17 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS913920 era expresado en el hígado y el corazón. A partir de la secuencia SEQ ID N° 17, dos cebadores nucleotídicos respectivamente de las secuencias SEQ ID N° 102 y SEQ ID N° 103 han sido sintetizados. Estos cebadores nucleotídicos permiten amplificar un ADNc del gen GS913920 que constituye la secuencia SEQ ID N° 18. Les reacciones de amplificación son realizadas en las condiciones siguientes, aplicables al conjunto de genes candidatos de acuerdo con la invención para los cuales los cebadores específicos son descritos y aplicados para aislar las secuencias del transcrito de interés: Cada reacción de PCR es efectuada con 400 µM de cada dNTP, 0.5 µM de cada cebador, 2.5 mM de MgCl2, 50 ng de ADN o aproximadamente 25 ng de ADNc y 2 unidades de ADN polimerasa de Thermus aquaticus (Taq) (Ampli Taq Gold; Perkin Elmer) en presencia de su amortiguador. Las reacciones son realizadas en microplacas de 96 pozos, en termoclicladores 9700 (Perkin Elmer) . Después de une primera desnaturalización a 94°C durante 10 min, un programa de 30 ciclos es aplicado: desnaturalización de 30 s. A 94°C, hibridación de 30 s. A 64°C (2 ciclos), 61°C (2 ciclos), 58°C (2 ciclos) y 55°C (28 ciclos), alargamiento de 1 min/kb a 72°C. El programa se termina por un alargamiento de 7 min a 12 ° Z . La secuencia nucleica SEQ ID N° 18 tiene una longitud de 293 nucleótidos. Comprende un marco de lectura
l'?r í ? abierta (ORF) parcial que va del nucleótido en la posición 227 al nucleótido en la posición 293. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente, de la enfermedad de Tangier o incluso las deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID NO 18 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 18 codifica potencialmente para un polipéptido de 22 aminoácidos de longitud constituye la secuencia SEQ ID N° 134. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos
Genpept: (traducción de Genbank vll5) , TrEMBL (SP-TrEMBL,
Versión de Agosto 1999), Swissprot (Versión 38) y PIR: (SECUENCIAS PIR NO REDUNDANTES, Versión 62-septiembre 1999) . El polipéptido de la secuencia SEQ ID N° 134 es susceptible de intervenir en la regulación del flujo de colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL.
-,¿s a¿-?r *>* « El polipéptido de la secuencia SEQ ID N° 134 es por lo tanto, susceptible de intervenir en una etapa importante implicada en el transporte inverso del colesterol por las HDL. El polipéptido de la secuencia SEQ ID N° 134 es igualmente susceptible de intervenir en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS91437. cidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aquí posteriormente como el n° GS91437. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 19. La secuencia SEQ ID N° 19 tiene una longitud de 2442 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 2 al nucleótido en la posición 286 de la secuencia SEQ ID N° 19. Ninguna identidad de secuencia ha sido encontrada
al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 20. La secuencia SEQ ID N° 20 tiene una longitud de 4608 nucleótidos. Comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 327. Se han encontrado las homologías de secuencia siguientes en la base de datos GenBank (Versión 116) con la secuencia SEQ ID N° 20: • 100% de homología sobre 213 pdb (posiciones [85-297]) con las posiciones [2807-2595] de la secuencia g7020279
(AK000294) Homo sapiens ADNc FLJ20287 fis, clona HEP04390 Longitud = 3043; depositada el 22-02-2000 en Genbank. • 88% sobre 219 pdb (posiciones [82-300]) con la secuencia g3850048 (AJ 004828) Mus musculus clona XX-BAC394, Longitud = 170351***SECUENCIAMIENTO EN PROGRESO***, en piezas no ordenadas . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 19 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS91437 era expresado en el cerebro fetal, el hígado, el corazón, la próstata, la placenta, el útero, el testículo, el riñon, el músculo esquelético. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 19 El marco abierto de lectura parcial de la secuencia de ácidos nucleicos SEQ ID N° 19 codifica potencialmente para un polipéptido de 95 aminoácidos de longitud constituye la secuencia SEQ ID N° 135. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos Swissprot (versión 36, última puesta al día del 3 de mayo 1999) , PRODOM: (dominios homólogos detectados en Swissprot, versiones 34.2 y 38,) Genpept: (traducción de Genbank vllO y 111, así como 115), PIR: (SECUENCIAS PIR NO REDUNDANTES,
VERSIÓN 57), PDB: (PROTEIN DATA BANK, FEBRERO 1999) y TrEMBL (SP-TrEMBL, versión 7, noviembre 1998) . El polipéptido de la secuencia SEQ ID N° 135 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 20 El marco abierto de lectura (ORF) contenido en el ácido nucleico de la secuencia SEQ ID N° 20 codifica potencialmente para un polipéptido de 108 aminoácidos que constituye la secuencia SEQ ID N° 136. Ninguna homología de secuencia ha sido encontrada con las bases de datos Swissprot (Versión 38), Genpept (Versión 115), PIR (Versión 62, Septiembre 1999) y trEMBL (Versión de Agosto 1999) . El polipéptido de la secuencia SEQ ID N° 136 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en
»i • r ?? -^gg^^-^-^jÉ^^^^^-l^^gl^^ una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS91507. Ácidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aquí posteriormente como el n° GS91507. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 21. La secuencia SEQ ID N° 21 tiene una longitud de 1627 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 640 de la secuencia SEQ ID N° 21. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 22.
La secuencia SEQ ID N° 22 tiene una longitud de 2333 nucleótidos. Comprende un cuadro abierto de lectura (ORF) completo que va del nucleótido en la posición 368 al nucleótido en la posición 1348. El inicio del codón de inicio de la traducción está localizado sobre el nucleótido en la posición 371 de la secuencia SEQ ID N° 22. La secuencia codificante inicia en el nucleótido en la posición 371 y se termina en el nucleótido en la posición 1348. La secuencia SEQ ID N° 22 posee una homología con la secuencia siguiente referida en la base de datos GenBank (Versión 116) siguiente: Identidad nucleica del 99% sobre 2316 pb (posición 115 a 2420 pb) con Homo sapiens ADNc FLJ20300 fis, clona HEP06465 (2331 pb) . Acceso AK000307. Los análisis de expresión del transcrito de la secuencia SEQ ID N° 21 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS91507 era expresado en el cerebro fetal. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID N° 90, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) .
El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 90 es respectivamente de: -2 kb y 7.5 kb en el páncreas, el riñon, el músculo esquelético, el pulmón, la placenta y el cerebro. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID NO 21 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 21 codifica potencialmente para un polipéptido de 213 aminoácidos de longitud que constituye la secuencia SEQ ID N° 137. Homologías observadas al nivel de la secuencia proteica: Este ORF potencial de 213 aa posee un dominio que va de las homologías del tipo motivo con diferentes proteínas tales como: • 29% de homología sobre 155 aa (posición 4-158 aa) con las secuencias de Swissprot (versión 36, última puesta al día del 3 mayo 1999) sp|Q10022| y con las secuencias de PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997) 28705 p34. 2 (1) YSX3_CAEEL-dominio de la proteína hipotética (39KD) T28D9.3 localizada sobre el cromosoma 11. • 25% de homología sobre 127 aa (posición 6-132 aa) con las secuencias de PIR: (SECUENCIAS PIR NO REDUNDANTES, VERSIÓN 57) no redundantes: PIR: (Secuencias PIR no redundantes, versión 57) |S|S66668 - proteína inducida por el peróxido de hidrógeno - (fragmento de una secuencia de ratón) . Además, las homologías con las secuencias codificantes traducidas de Genbank y EMBL (TrEMBL (SP-TrEMBL, versión 7, noviembre 1998), Genpept: (traducción de Genbank vllO y 111, última puesta al día el 7 de mayo de 1999) ) mostrarían las anotaciones con las proteínas potenciales del tipo 'ácido fosfatídico fosfatasa" . • 34% de homología sobre 200 aa (posición 6-205 aa) con las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998) :sp|P97544 | P97544 - proteína , transmembranal del retículo endoplásmico. • 33% de homología sobre 204 aa (posición 6-209 aa) con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día el 7 de mayo de 1999) :
fc**..-.,£Ifcí .
gi| 4105139 | - ácido fosfatídico fosfatasa-beta, tipo2; fosfatidato fosfohidrolasa; fosfolípido fosfatasa en el hombre; y con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día el 7 de mayo de 1999): gi 130471731 homólogo del ácido fosfatídico fosfohidrolasa del hombre, y con gi 124673001| - ácido fosfatídico fosfatasa 2b. • 31% de homología sobre 203 aa (posición 6-208 aa) con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día el 7 de mayo de 1999) : gi| 1487873 | | - ácido fosfatídico fosfatasa de ratón • 31% de homología sobre 203 aa (posición 6-208 aa) con las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998): sp | Q61469 IQ61469 | - ácido fosfatídico fosfatasa 2A.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 22. El marco abierto de lectura de la secuencia de ácido nucleico SEQ ID N° 22 codifica potencialmente para un polipéptido de 325 aminoácidos de longitud que constituye la secuencia SEQ ID N° 138. Homologías observadas al nivel de la secuencia proteica
Las homologías con las secuencias codificantes traducidas de Genbank (Versión 116) y EMBL (TrEMBL (Versión de Agosto 1999), Genpept [Versión 115]) mostrarían las anotaciones con las proteínas potenciales del tipo *"ácido fosfatídico fosfatasa" . • 30% de homología sobre 316 aa (posición 2-317 aa) con SP-trEMBL:sp|P97544|P97544 ER PROTEINA TRANSMEMBRANAL • 30% de homología sobre 320 aa (posición 2-321aa) con Genpeptlld gi | 105139 IAF043329 ácido fosfatasa-beta del tipo 2; fosfatidato fosfohidrolasa; fosfolípido fosfatasa [Homo sapiens] y con Genpeptll6: gi | 3047173 IAF01786 homólogo de ácido fosfatídico fosfohidrolasa [Homo sapiens] y con gi | 2467300 IAB000889 ácido fosfatídico fosfatasa 2b • 30% de homología sobre 316 aa (2-317 aa) con Genpeptll6 gi 1684745 Y07783 proteína transmembranal [Rattus norvegicus] Longitud = 312 aa • 30% de homología sobre 320 aa (posición 2-317 aa) con SP-trEMBL EM: 014495 ACIDO FOSFATIDICO FOSFATASA 2B. Longitud = 311 aa
Función putativa de los polipéptidos de la secuencia SEQ ID N° 137 y 138:
ü¿¿aJ,-.» -^> .te «_- . --.. _ ,.„., ..,---.-..-. -..<tt fc>, Mh-,J.J.
El gen GS91507 presenta un interés para el estudio funcional de la enfermedad de Tangier y del FHD, en este sentido, se trata a la vez de un candidato posicional y de un gen que codifica para una nueva proteína, cuyas funciones putativas (ácido fosfatídico fosfatasa) podrían jugar un papel en la cascada de señalización intracelular ligada al flujo del colesterol intracelular mediado por las partículas HDL, implicado en la enfermedad de Tangier y la deficiencia familiar de HDL (FHD) . Los polipéptidos de la secuencia SEQ ID N° 137 y
138 son susceptibles de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS915231. cidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aquí posteriormente como el n° GS915231. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 23.
fe.iá- » *x* Jk ^^¿ü&^¡ X t í La secuencia SEQ ID N° 23 tiene una longitud de 2764 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 1220 de la secuencia SEQ ID N° 23. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank
(Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID
N° 24. La secuencia SEQ ID N° 24 tiene una longitud de 3228 nucleótidos. Comprende un cuadro abierto de lectura (ORF) que va del nucleótido en la posición 37 al nucleótido en la posición 1304. La secuencia codificante inicia en el nucleótido en la posición 49 y se termina en el nucleótido en la posición 1304 de la secuencia SEQ ID N° 24. El inicio del codón de inicio de la traducción está localizado sobre el nucleótido en la posición 49. Existe una señal de poliadenilación que inicia sobre el nucleótido en la posición 3142 de la secuencia SEQ ID N° 24.
Han sido observadas homologías de secuencia entre la secuencia SEQ ID N° 24 y las secuencias siguientes referidas en la base de datos GenBank (Versión 116) : • 100% de homología sobre 217 pdb (posiciones [2704-2920]) que coinciden con las posiciones [1-217] de la secuencia g4884337 (AL050130) Homo sapiens ARNm; ADNc DKFZp586H051 (de la clona DKFZp586H051) . Longitud = 1795 ; depositado el 18-FEB-2000; Presentación Directa; Presentada (15-MAYO-1999) MIPS, Am Klopferspitz 18a, D-82152, Martinsried, ALEMANIA, • 4 fragmentos de homología: 100% sobre 393 pdb [2773-3165]; 100% sobre 153 pdb [913-1065]; 100% sobre 111 pdb [1083-1193]; 84% sur 84 pdb [2341-2424] con la secuencia g6539402 (AC016904) Homo sapiens clona RP11-307P9, ***SECUENCIAMIENTO EN PROGRESO***, 36 piezas no ordenadas. Longitud = 203456; • Diferentes fragmentos de homología: 83% sobre 258 pdb [529-786] ; 89% sobre 66pdb [1195-1260]; 80% sobre 185pdb [91-275] con la secuencia g5305227 (AF029260) Gallus gallus factor de transcripción RelB (relb) ARNm, cds. completos. Longitud = 2851 Los análisis de expresión del transcrito de la secuencia SEQ ID N° 23 han sido realizados por RT PCR, como
*A*Al riiM se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS915231 era expresado en el cerebro fetal . Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID N° 91, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 91 es respectivamente de: - 1.3 kb, 2 kb, 4 kb, 4.4 kb y 7.5 kb en el corazón, y el músculo esquelético; - 1.3 kb, 2 kb, 4 kb y . kb en el hígado y el riñon; - 1.3 kb, 2 kb, 4.4 kb y 7.5 kb en el cerebro; - 1.3 kb, 2 kb y 4.4 kb en el páncreas. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9g31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID NO 23 El marco abierto de lectura parcial de la secuencia de ácidos nucleicos SEQ ID N° 23 codifica potencialmente para un polipéptido de 406 aminoácidos de longitud constituye la secuencia SEQ ID N° 139. Homologías observadas al nivel de la secuencia proteica : • 51% de homología con las secuencias de Genpept: (traducción de Genbank vllO et 111, última puesta al día jour el 7 de mayo de 1999): gi: 2731377 es la traducción proteica de la secuencia gb IAAB93456.1 | (U28739) similar al alcohol deshidrogenasa/ribitol deshidrogenasa de C. elegans y de las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998) : Q09979 sobre 401 aa (posición 1-401 aa) . • 30% de homología sobre 164 aa (posición 47-205 aa) con las secuencias de Protein Data Bank:: gi 11827713 | que corresponde a la proteína 1AH|A Cadena A, 7 Alfa-Hidroxiesteroide Deshidrogenasa Complejada Con Nadh
Y Acido 7-Oxo Glicoquenodeoxicólico y con gi | 1827714 | que corresponde a la proteína 1AHI|B Cadena B, 7 Alfa-Hidroxiesteroide Deshidrogenasa Complejada con Nadh
Y Acido 7-Oxo Glicoquenodeoxicólico y con gi | 18277151 que
,4 É.,« _ -t wltt, . ^. Hu. , «,-- - . . . ,-,„.,-, . . .jjt. ---» „„ « «-J a . t- corresponde a la proteína 1AH|A Cadena A, 7 Alfa - Hidroxiesteroide Deshidrogenasa Complejada Con Nad+ y con gi| 1827716 | que corresponde a la proteína 1AHH | B Cadena B, 7 Alfa- Hidroxiesteroide Deshidrogenasa Complejada Con Na??- y con gi 119435331 que corresponde a la proteína 1FMC|A Cadena A, 7 Alfa-Hidroxiesteroide Deshidrogenasa
Compl ejada Con Nad- Y Acido 7-Oxo Glicoquenodeoxicólico y con gi | 19435341 que corresponde a la proteína 1FMC|B Cadena B, 7 Alfa- Hidroxiesteroide Deshidrogenasa Complejada con Nadh
Y Acido 7~Oxo Gliccquenodeoxicóllco • 29% de homología sobre 131 aa (posición 53-183 aa) con las secuencias de Protein Data Bank: gil 26244971 que corresponde a la proteína Cis-Bifen?l-2, 3-Dihidrodiol-2, 3- Deshidrogenasa de Pseudomonas Sp. Lb400. • 27% de homología sobre 194 aa (posición 3-196 aa) con las secuencias de la base PIR : (SECUENCIAS PIR NO REDUNDANTES, VERSIÓN 57) : PIR: (Secuencias PIR no redundantes, versión 57) |D69930| que corresponde a la proteína 3-oxoacil- acil-proteína portadora reductasa homologa yoxD de - Bacillus subtilis y con las secuencias de Swissprot (versión 36, última puesta al día del 3 de mayo de 1999): sp|P14802| que corresponde a la proteína YOXD_BACSU-oxidorreductasa hipotética presente en la región RTP-PELB (ORF238) .
tÉ*i?Í l* *-X?J* i **-* **. ¿r ir l l . . . . r.. r,^ r , ^ . „,, . ...-. „-.{.-...^¿^^ .. ^M.. JUl-l A ¡ • 52% de homología sobre 44 aa (posición 353-396 aa) con las secuencias de PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997) (dominios homólogos detectados en Swissprot (versión 36, última puesta al día del 3 de mayo de 1999)): 2675 p34.2 (11) NLTP(5) DHB4(3) PX18(2) que corresponde a la proteína 17-BETA-HIDROXIESTEROIDE DE LA ESTRADIOL BETA-DESHIDROGENASA, PRECURSOR NO ESPECIFICO DEL PORTADOR DEL ESTEROL SCP-2 DE TRANSFERENCIA DE LIPIDOS • 27% de homología sobre 167 aa (posición 233-399 aa) con las secuencias de Swissprot (versión 36, última puesta al día del 3 de mayo de 1999): sp|P51659| que corresponde a la proteína ESTRADIOL 17 BETA-DESHIDROGENASA DHB4_HUMANA 4 (EC 1.1.1.62) (17-BETA-HSD 4) (17-BETA-HIDROXIESTEROIDE DESHIDROGENASA 4)
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID N° 24 El marco abierto de lectura (ORF) de la secuenciad del ácido nucleico SEQ ID N° 24 codifica potencialmente para un pollpéptido de 422 aminoácidos de longitud que constituye la secuencia SEQ ID N° 140. Las homologías de las secuencias siguientes han sido encontradas:
*JLii ñrr - - »*""«*"** -*>* »^"<».*^ - ~*** *.**+.
Homologías obser^das al nivel de la secuencia proteica: • 51% de homología con Genpept: gi: 2731377 y SP- trEMBL:Q09979 sobre 416 aa (posición 11-417 aa) . Genpept:gi: 2731377 es la traducción proteica de la secuencia gb IAAB93456.11 (U28739) similar al alcohol deshidrogenasa/ribitol deshidrogenasa de C. elegans • 30% de homología sobre 164 aa (posición 47-205 aa) con Protein Data Bank : gi 118277131 que corresponde a la I proteína 1AHI|A Cadena A, 7 Alfa- Hidroxiesteroide Deshidrogenasa Complejada Con Nadh I ^ ^ Y Acido 7-Oxo Glicoquenodeoxicólico y con gi | 1827714 | que corresponde a la proteína 1AHI|B Cadena B, 7 Alfa- Hidroxiesteroide Deshidrogenasa Complejada Con Nadh Y Acido 7-Oxo Glicoquenodeoxicólico y con gi | 18277151 que corresponde a la proteína 1AHH|A Cadena A, 7 Alfa- Hidroxiesteroide Deshidrogenasa Complejada Con Nad- y con gi| 1827716 | que corresponde a la proteína 1AHH | B
Cadena B, 7 Alfa- Hidroxiesteroide Deshidrogenasa Complejada Con Nad+ y con gil 19435331 que corresponde a la proteína 1FMC|A Cadena A, 7 Alfa-Hidroxiesteroide Deshidrogenasa Complejada Con Nad+ Y Acido 7-Oxo Glicoquenodeoxicólico y con gi| 1943534 | que corresponde a la proteína 1FMC|B Cadena
B, 7 Alfa-Hidroxiesteroide Deshidrogenasa Acomplejada Con Nadh Y Acido 7-Oxo Glicoquenodeoxicólico • 29% de homología sobre 131 aa (posición 53-183 aa) con Protein Data Bank : gi | 2624497] que corresponde a la proteína Cis-Bifenil-2, 3-Dihidrodiol-2, 3 Deshidrogenasa de Pseudomonas Sp. Lb400 • 27% de homología sobre 202 aa (posición 6-212 aa) con PIR No redundante: pir|D69930| que corresponde a la proteína 3-oxoacil-acil-portador del homólogo de la proteína reductasa yoxD - Bacillus subtilis y con Swissprot: sp|P14802| que corresponde a la proteína OXIDORREDUCTAS HIPOTÉTICA YOXD_BACSU EN LA REGIÓN INTERGENICA RTP-PELB (EC 1. -.-.-) (ORF238) • 52% de homología sobre 44 aa (posición 353-396 aa) con Prodom (dominios homólogos detectados en Swissprot) :
2675 p34.2 (11) NLTP(5) DHB4(3) PX18(2) que corresponde a la proteína BETA-HIDROXIESTEROIDE DE LA ESTRADIOL BETA-DESHIDROGENASA, PRECURSOR NO ESPECIFICO DEL PORTADOR DEL ESTEROL SCP-2 DE TRANSFERENCIA DE LIPIDOS • 27% de homología sobre 183 aa (posición 249-415 aa) con Swissprot: sp|P51659| que corresponde a la proteína ESTRADIOL 17 BETA-DESHIDROGENASA DHB4_HUMANA 4 (EC 1.1.1.62) (17-BETA-HSD 4) ( 17-BETA-HYDROXIESTEROIDE DESHIDROGENASA 4) • 44% de homología sobre 272 AA (posiciones 12-280 A?) con la secuencia g2072661 (Z95120) proteína hipotética Rv3224 [Mycobacterium tuberculosis] Longitud = 282 • Homología con el PRECURSOR NO ESPECIFICO DE LA PROTEINA DE TRANSFERENCIA DE LIPIDOS (NSL-TP) : 35% SOBRE 106 AA ([318-417]) con la secuencia SP: NLTP_ PROTEINA DE TRANSFERENCIA DE LIPIDOS NO ESPECIFICA DE BOVINOS (PROTEINA 2 PORTADORA DEL ESTEROL) (SCP-2) . Longitud = 121 y 30% sobre 133 AA [294-417] con la secuencia
SP:NLTP_ PROTEINA DE TRANSFERENCIA DE LIPIDOS NO ESPECIFICA DE RATA (NSL-TP) (PROTEINA 2 PORTADORA DEL ESTEROL) (SCP-2) (PROTEINA X PORTADORA DEL ESTEROL) (SCP-X) (SCPX) . Longitud = 547
Función putativa: El ORF de 422 aminoácidos posee homologías con diferentes proteínas enzimáticas putativas, implicadas en los mecanismos de deshidrogenación de los esteróles de varios organismos: hombre, ratón, E. coli, S. cerevisiae, C. elegans. Además, hemos puesto en evidencia una homología con una secuencia de la proteína SCP-2 implicada en el transporte intracelular de los lípidos. Por este hecho, el gen GS15231 codifica para una proteína de interés por su función posible en la deficiencia del tráfico intracelular del colesterol en los pacientes con Tangier/FHD, lo que refuerza el interés del estudio del gen GS15231. Además, el gen GS15231 es, por su localización, un gen candidato posicional para el estudio y la caracterización del defecto genético observado en la enfermedad de Tangier o el defecto familiar de HDL. Les polipéptidos de las secuencias SEQ ID N° 139 y 140 son susceptibles de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gene GS915528. Ácidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aquí posteriormente como el n° GS915528. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 25. La secuencia SEQ ID N° 25 tiene una longitud de 3106 nucleótidos.
Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 1272 de la secuencia SEQ ID N° 25. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito constituye la secuencia SEQ ID N° 26. La secuencia SEQ ID N° 26 tiene una longitud de 3313 nucleótidos. Comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 1370, que corresponde también a la secuencia codificante. Una señal de poliadenilación inicia en el nucleótido en la posición 3280 de la secuencia SEQ ID N° 26. Las homologías de secuencia de la SEQ ID N° 26 se han observado con las secuencias referidas en la base de datos GenBank (Versión 116) : - 99% de identidad nucleica sobre 2755pb (posición 119-2873) con g7020444 AK000388 Homo sapiens ADNc FLJ20381 fis, clona KAIA2329 Longitud = 2970 pb
íl t» ----- f*^¿ m,.
- 99% de identidad nucleica con un BAC en curso de secuenciamiento g6514007 AC013568 Homo sapiens clona RP11- 1B9, WORKING DRAFT SEQUENCE 10 fragmentos no ordenados Los análisis de expresión del transcrito de la 5 secuencia SEQ ID N° 25 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS915528 era expresado en el cerebro fetal, el hígado, la próstata, el corazón, la placenta, el 10 útero, el testículo y el cerebro. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el
Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID
N° 92, ha revelado la presencia de transcritos en el manchado
15 comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 92 es respectivamente de: - 1.9 kb, 3.2 kb y 3.8 kb en el páncreas; - 1 kb, 1.9 y 3.8 kb en el corazón; 20 - 1 kb, 1.9 kb y 3.2 kb en el hígado; - 1 kb y 1.9 kb en el riñon; - 1.9 kb en el músculo esquelético y el cerebro. Este gen constituye un candidato posicional causante de una enfermedad debida a una disfunción del flujo
inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL.
Polipéptido codificado por el ácido nucleico de la secuencia SEQ ID NO 25 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 25 que codifica potencialmente para un polipéptido de 424 aminoácidos de longitud constituye la secuencia SEQ ID N° 141.
Homologías observadas al nivel de la secuencia proteica: Este ORF de 424 aa posee homologías del tipo motivo con los dominios conservados de diferentes proteínas tirosina fosfatasa en diferentes bases de datos proteicas tales como: • 49% de homología sobre 364 aa (posición 3-366 aa) con las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998): sp | P91433 | P91433 codificado por el ADNc YK65E9.3 de C. Elegans y con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999): gi | 17087671 gue contiene un dominio encontrado en la banda 4.1, ezrina, moesina, radixina y talina en C. elegans
j^g^^^^^^^^^ j^ Jigfe^^^^^. . - ^lA,. -i---- - „ S.-rrt3LrH- . ^- -, - . -fc - t i.. ^*g^gSm • 44% de homología sobre 322 aa (posición 1-322 aa) sobre las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998): sp | 043491 | 043491 PROTEIN 4. 1-G • 43% de homología sobre 227 aa (posición 7-233 aa) con las secuencias de PRODOM: (dominios homólogos detectados en Swissprot, versión 34. 2, noviembre 1997): 894 p3 . 2 (29) M0ES(4) RADI(3) EZRI(3) que corresponde al dominio de la proteína tirosina fosfatas de las proteínas MOESINA BANDA P81 VILLINA-2 EZRINA RADIXINA implicadas en la organización membranal. • 42% de homología sobre 313 aa (posición 9-321 aa) sobre las secuencias de Swissprot (versión 36, última puesta al día del 3 de mayo de 1999): sp I P290 41 PTN4_HUMANA - proteína tirosina fosfatasa humana MEG1 (EC 3.1.3.48). • 41% de homología sobre 320 aa (posición 7-326 aa) con las secuencias de PIR: (SECUENCIAS PIR NO REDUNDANTES, VERSIÓN 57) no redundante: PIR: (Secuencias PIR no redundantes, versión 57) |S|JU0188 - proteína banda 4.1 que pertenece a la superfamilia de las proteínas tirosina fosfatasas del ratón y de las secuencias de Swissprot (versión 36, última puesta al día del 3 de mayo de 1999) : sp| P52963 |NBL4_ratón-proteína NBL4 y las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998) : sp 1057457 | proteína similar a la proteína banda 4.1 y las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999): gi 14665481 - proteína NBL4 de mus musculus • 41% de homología sobre 314 aa (posición 9-322 aa) sobre las secuencias de Swissprot (versión 36, última puesta al día del 3 de mayo de 1999): sp | P11171141_PROTEINA HUMANA 4.1 (BANDA 4.1) (P4.1)
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID N° 26 El marco abierto de lectura de la secuencia del ácido nucleico SEQ ID N° 26 codifica potencialmente para un polipéptido de 455 aminoácidos de longitud constituye la secuencia SEQ ID N° 142.
Homologías observadas al nivel de la secuencia proteica: Este ORF de 455 aa posee homología del tipo motivo con los dominios conservados de diferentes proteínas tirosina fosfatasas en diferentes bases de datos proteicas tales como: • 50% de homología sobre 374 aa (posición 24-397 aa) con SP-trEMBL: sp | P91433 | P91433 CODIFICADO POR C. ELEGANS ADNc YK65E9.3 y con Genpeptll5: gi | 17087671 U80955 que contiene un dominio encontrado en la banda 4.1, ezrina, moesina, radixina y talina en C. elegans • 45% de homología sobre 333 aa (posición 21-353 aa) sobre SP-trEMBL: sp | 043491 | 043491 PROTEINA 4.1-G. • 43% de homología sobre 227 aa (posición 7-233 aa) con Prodom: 894 p34.2 (29) M0ES(4) RADIO) EZRIO) que corresponde a la PROTEINA FOSFATASA PROTEINA TIROSINA MOESINA BANDA P81 VILLINA-2 EZRINA RADIXINA QUE ORGANIZA LA MEMBRANA • 42% de homología sobre 329 aa (posición 24-352 aa) sobre Swissprot38: PROTEINA TIROSINA FOSFATASA MEG1 (EC 3.1.3.48) (PTPASE-MEG1) (MEG). • 42% de homología sobre 335 aa (posición 23-357aa) con PIR no redundante: pir|S|JU0188 banda 4.1 proteína miembro de la superfamilia de la proteína tirosina-fosfatasa de ratón y Swissprot: sp | P52963 |NBL4_ratón proteína NBL4 y SP-trEMBL: sp | 0574571 banda 4.1 - como la proteína 4 y Genpept: gil 4665481 NBL4 proteína de mus musculus • 41% de homología sobre 332 aa (posición 22-353 aa) sobre Swissprot: sp| P11171 | 41_PR0TEINA HUMANA 4.1 (BANDA
4.1) (P4.1) .
Función putativa: El gen GS915528 presenta un interés para el estudio de la enfermedad de Tangier y del FHD en el sentido de que se trata a la vez, de un candidato posicional y de un gen que codifica para una nueva proteína, cuyas funciones putativas (tirosina fosfatasa) podrían jugar un papel en la cascada intracelular ligada al flujo de colesterol intracelular, mediado por las partículas HDL, implicado en la enfermedad de Tangier y la deficiencia familiar de HDL (FHD) . Los polipéptidos de las secuencias SEQ ID N° 141 y
142 son susceptibles de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS99817 Ácidos nucleicos Se ha aislado de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aquí posteriormente como el n° GS99817. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 27.
La secuencia SEQ ID N° 27 tiene una longitud de 1539 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 698 de la secuencia SEQ ID N° 27. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank
(Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito constituye la secuencia SEQ ID
N° 28. La secuencia SEQ ID N° 28 tiene una longitud de
3404 nucleótidos. Comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 792 de la secuencia
SEQ ID N° 28. Las homologías de secuencia de la SEQ ID N° 28 han sido encontradas con las secuencias referidas en la base de datos GenBank (Versión 116) : - Identidad del 97% sobre 380 pb con un BAC END CIT-HSP-2166G6. TR CIT-HSP Homo sapiens, clona genómica 2166G6, inspección de la secuencia genómica Longitud = 380gi|2975337|gb|B93000.1|B93000[2975337]
i*****,**^*****..^. -.,- ,,,-.^ *.^* i , ^. „ y „„ „ ^.,.^-^.^itfaaa.
- Identidad del 100% sobre 315 pb con un BAC END HS_2166_A2D03_MR CIT Biblioteca de Esperma Genómico Humano Aprobada D de Homo sapiens clona genómica Placa=2166 Col=6 Hilera=G, inspección de la secuencia genómica Longitud = 316 gi| 3480271 | gb | Q104915.1 |AQ104915 [3480271] Los análisis de expresión del transcrito de la secuencia SEQ ID N° 27 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS99817 era expresado en el cerebro fetal. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el
Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID
N° 93, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 93 es respectivamente de: - 1-55 kb, 2 kb y 4.44 kb en el corazón y el cerebro; - .2 kb y 4.44 kb en el páncreas; - 1.55 kb y 4.44 kb en el riñon y el músculo esguelético. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso
del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 27 El marco abierto de lectura de la secuencia del ácido nucleico SEQ ID N° 27 codifica potencialmente para un polipéptido de 232 aminoácidos de longitud que constituye la secuencia SEQ ID N° 143. Homologías observadas al nivel de la secuencia proteica: 27% de homología sobre 211 aa (posición 11-221 aa) con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999): gil 38767301 y las secuencias de TrEMBL (SP-TrEMBL, versión 7, noviembre 1998): sp|Q2002| que corresponden a la traducción de la secuencia de un cósmido de nemátodo F35C11.4 (Caenorhabditis elegans) .
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID N° 28
'??* *.? .*«¿ El marco abierto de lectura de la secuencia del ácido nucleico SEQ ID N° 28 codifica potencialmente para un polipéptido de 263 aminoácidos de longitud que constituye la secuencia SEQ ID N° 144. 5 Se han observado homologías entre la secuencia SEQ
ID N° 144 y las secuencias siguientes: Homologías observadas al nivel de la secuencia proteica: 28% de homología sobre 255 aa (posición 1-255 aa) 10 con Genpept: gil 38767301 y trEMBL: sp|Q20021| que corresponde a la traducción de la secuencia de un cósmido de nemátodo F35C11.4 (Caenorhabditis elegans).
Función putativa: 15 Este gen es un candidato para el estudio de la enfermedad de Tangier/FHD por el hecho de la localización cromosómica. Los polipéptidos de las secuencias SEQ ID N° 143 y
144 son susceptibles de intervenir en la regulación del flujo 20 del colesterol, y más particularmente de la enfermedad de
Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS916229. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS916229. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 29. La secuencia SEQ ID N° 29 tiene una longitud de 792 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) que va del nucleótido en la posición 1 al nucleótido en la posición 203 de la secuencia SEQ ID N° 29. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 29 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS916229 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta, el hígado fetal, el útero, el testículo y el riñon.
B?j^4M^^«^^í«>iß¡^^^^^^^i^^ífc Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 29 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 29 codifica potencialmente para un polipéptido de 68 aminoácidos de longitud que constituye la secuencia SEQ ID N° 145. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos Swissprot (versión 36, última puesta al día del 3 de mayo de 1999) y PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997). El polipéptido de secuencia SEQ ID N° 145 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
^^ sÉ^^^^^^^ j^^^^^^ .
Gen GS92544 Ácidos nucleicos Se ha aislado, de acuerdo con la invención tres ARN mensajeros que corresponden respectivamente a un transcrito largo y dos transcritos cortos del gen designado aquí posteriormente como el n° GS92544. La secuencia nucleica del ADNc que corresponde al transcrito largo constituye la secuencia SEQ ID N° 30. La secuencia SEQ ID N° 30 tiene una longitud de 2733 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 2160 de la secuencia SEQ ID N° 30. La primera secuencia nucleica del ADNc que corresponde al transcrito corgo constituye la secuencia SEQ ID N° 31. La secuencia SEQ ID N° 31 tiene una longitud de 2694 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 2121 de la secuencia SEQ ID N° 31. Ninguna identidad de secuencia ha sido encontrada
^?^te^^fa^^^^^ul^?^ al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde al segundo transcrito corto, constituye la secuencia SEQ ID N° 32. La secuencia SEQ ID N° 32 tiene una longitud de 2765 nucleótidos. Comprende un cuadro abierto de lectura completo que va del nucleótido en la posición 56 al nucleótido en la posición 2287 de la secuencia SEQ ID N° 32. La secuencia codificante inicia en el nucleótido en la posición 410 y se termina en el nucleótido en la posición 2160 de la secuencia SEQ ID N° 32. El codón de inicio de la traducción inicia en el nucleótido en Ia posición 410 de la secuencia SEQ ID N° 32. La secuencia SEQ ID N° 32 posee homologías con las secuencias referidas en la base de datos GenBank (Versión 116) siguientes: • 100% de homología sobre 2419 pdb (posiciones [485-2903]) que coinciden con las posiciones [1-2419] de la secuencia g6807990 (AL137432) Homo sapiens ARNm; ADNc DKFZp761 E1824 (de la clona DKFZp761E1824 ) ; cds parcial, longitud=2438 pdb, depositada el 18-FEB-2000, sobre el Cromosoma 9, e indicado como 'similar al receptor CR2" .
iií-.i. li, ^¡H¡ • 97% de homología sobre 157 pdb (posiciones [1271-1427]) con las posiciones [431-277] de g3590696 (AQ192074) HS_3228_B2H11T7 CIT Biblioteca de Esperma Genómico Humano Aprobada D de Homo sapiens clona genómica Placa=3228 Col=22 Hilera=P, inspección de la secuencia genómica. Longitud = 513
• Varios fragmentos de 99% a 100% de identidad con la secuencia gi | 6982613 IAL138756: Homo sapiens cromosoma 9 clona RP11 401 mapa q31.3-33.1, ***SECUENCIAMIENTO EN PROGRESO***, 41 piezas no ordenadas • Varios fragmentos de 100% de identidad con la secuencia g7230026 (AC010824) Homo sapiens clona RP11-5A23, ***SECUENCIAMIENTO EN PROGRESO***, 32 piezas no ordenadas. Longitud = 162010 Los análisis de expresión del transcrito largo y del transcrito corto han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS92544 era expresado en el cerebro fetal. Además, un análisis de la expresión de estos transcritos por manchado Northern, con la ayuda, respectivamente de las sondas de la secuencia SEQ ID N° 94, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) .
i , »Ui . . -U ¿ * t i El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 94 es respectivamente de 4 kb y de 6 kb en la placenta. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptidos codificados por los ácidos nucleicos de secuencias SEQ ID NO 30 y 31 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 30 (transcrito largo) codifica potencialmente para un polipéptido de 720 aminoácidos de longitud que constituye la secuencia SEQ ID N° 146. El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 31 (transcrito corto) codifica potencialmente para un polipéptido de 707 aminoácidos de longitud gue constituye la secuencia SEQ ID N° 147. Homologías observadas al nivel de la secuencia proteica : Esta secuencia posee homologías significativas de las posiciones 139-194 aa/199-254 aa con los dominios
tV-iüi-t? • ' t conservados sushi.HMM de la base de datos Pfam (HMMER 2.0 (Junio 1998) . Este ORF posee una anotación en Genpept: (traducción de Genbank vllO y 111, última puesta al día el 7 de mayo de 1999) y TrEMBL (SP-TrEMBL, versión 7, noviembre
1998) con la traducción BlastX de numerosas secuencias tales como: • 42% de homología sobre 115 aa (posición 2-116 aa) con las secuencias de gil 3401641 precursor humano de la uromodulina y gi | 3401661 uromodulina [Homo sapiens] sobre Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) • 37% de homología sobre 141 a (posición 2-142 aa) con las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7, noviembre 1998): spi P87363 | P87363 un fragmento de la FIBRILINA-1. • 30% de homología sobre 234 aa (posición 7-240 aa) con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) : gi| 306746 | y gi | 13350641 fibrilina humana. • 30% de homología sobre 194 aa (posición 8-201 aa) con las secuencias de SP-TrEMBL (SP-TrEMBL, versión 7,
noviembre 1998): sp | 035806 IO35806 PROTEINA SIMILAR A LA PROTEINA-2 DE UNION DEL TGF-BETA LATENTE
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID N° 32 El marco abierto de lectura de la secuencia del ácido nucleico SEQ ID N° 32 codifica potencialmente para un polipéptido de 713 aminoácidos de longitud que constituye la secuencia SEQ ID N° 148. Las homologías de la secuencia SEQ ID N° 148 se han observado con las secuencias referidas en las bases de datos. Las homologías son las siguientes: • homología con Genpept: gi | 3401641 precursor de la uromodulina [Homo sapiens] y Genpept: gi | 3401661 uromodulina [Homo sapiens] • homología con SP-trEMBL: sp I P87363 | P87363 FIBRILINA-1 (FRAGMENTO) . • homología con Genpept: gil 3067461 y gil 13350641 fibrilina [Homo sapiens] • homología con SP-trEMBL: sp | 035806 | 035806
PROTEINA SIMILAR A LA PROTEINA-2 DE UNION DEL TGF-BETA LATENTE
• homología con g784994 (X81479) EMR1 [Homo sapiens] Longitud = 886 • homología con g4379069 (X94630) proteína transmembranal de siete extensiones [Homo sapiens] • Otras homologías con las proteínas tales como: EMR1, CD97, fibulinas, receptor complementario... La secuencia SEQ ID N° 148 posee motivos característicos, tales como 3 dominios EGF con 2 uniones de calcio, un sitio de tirosina fosfatasa, un dominio hidrófobo N-terminal; Numerosos sitios de glicosilación; 2 sitios camp de fosforilación; 2 sitios Asp de hidroxilación.
Función putativa : Por su homología con la uromodulina, el producto del gen GS92544 es putativamente una proteína asociada a la membrana como la uromodulina que es una proteína anclada al medio de un glicosilfosfatidilinositol (GPl) . Estos resultados, basados sobre los estudios de homología de secuencia parciales en aminoácidos, sugieren que el producto del gen GS92544 podría estar asociado a la membrana por un enlace en los lípidos ' y P°r lo tanto, podría estar asociado al déficit el flujo del colesterol celular observado en los pacientes con FHD o Tangier.
"ik* Los polipéptidos de las secuencias SEQ ID N° 146, 147 y 148 son susceptibles de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS930824 cidos nucleicos Se ha aislado de acuerdo con la invención dos ARN mensajeros que corresponden a un transcrito del gen designado aquí posteriormente como el n° GS930824. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 33. La secuencia SEQ ID N° 33 tiene una longitud de 4745 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 2 al nucleótido en la posición 514 de la secuencia SEQ ID N° 33. Homologías observadas al nivel de la secuencia nucleotídica: 90% de homología con Genbank: AF115435, sintaxina 17 de rata sobre 510 pb (posición 22-531 pb) .
La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 34. La secuencia SEQ ID N° 34 tiene una longitud de 5241 nucleótidos. Comprende un cuadro abierto de lectura
(ORF) completo que va del nucleótido en la posición 57 al nucleótido en la posición 1013 de la secuencia SEQ ID N° 34.
La secuencia codificante inicia en el nucleótido en la posición 105 y se termina en el nucleótido en la posición 1013 de la secuencia SEQ ID N° 34. El codón de inicio de la traducción inicia en el nucleótido en la posición 105 de la secuencia SEQ ID N° 34. La secuencia SEQ ID N° 34 posee homologías con las secuencias referidas en la base de datos GenBank (Versión 116). Se trata de las homologías siguientes: • 90% de homología con Genbank: AF115435, sintaxina 17 de rata sobre 510 pb (posición 22-531 pb) . • 92% de homología sobre 475 pdb (posiciones [540-1036]) y 84% sobre 406 pdb (posiciones [102-507]) con la secuencia g4206160. (AF115435) ARNm de sintaxina de Rattus norvegicus, cds. completa. Longitud = 1678; • 98% de homología sobre 431 pdb (posiciones [1899-2329]) y 91% sur 62 pdb (posiciones [1819-1880]) con la
- -t---*¿ á---*----» .. ....aBafc-----» >. . ¿astean---- 1¿.¡¡ J* * ^ -*..-!.». .,,-.».*.«.-«. * *? L *j secuencia g4652677 (AQ474416) CITBI-E1-258819.TF CITBI-E1 clona genómica de Homo sapiens 258819, inspección de la secuencia genómica. Longitud = 525; • 99% de homología sobre 331 pdb (posiciones [6394- 6724]) con la secuencia g2929043 (B87911) RPCI11-30N20.TP
RPCI-11 clona genómica de Homo sapiens RPCI-11-30N20, inspección genómica de la secuencia. Longitud = 425; • 99% de homología sobre 2662 pdb (posiciones [20- 2681]) con la secuencia g7020892 (AK000658) Homo sapiens ADNc FLJ20651 fis, clona KAT01814. Longitud = 2678; Presentada (15-FEB-2000) a las bases de datos del DDBJ/EMBL/GenBank, proyecto NEDO. Los análisis de expresión del transcrito de la secuencia SEQ ID N° 33 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS930824 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta, el hígado fetal, el útero, el testículo, el riñon y el músculo esquelético. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda, respectivamente, de las sondas de la secuencia SEQ ID N° 95 y 96, ha revelado la presencia de
transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 95 es respectivamente de: - 1.11 kb, 1.6 kb, 2.6 kb, 4.9 kb. y 7 kb en el páncreas, el riñon, el músculo esquelético, el hígado, el cerebro y el corazón; - 1.6 kb, 2.6 kb, 4.9 kb. y 7 kb en el pulmón y la placenta. El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 96 es respectivamente de: - 1.35 kb, 2.4 kb, 3.5 kb y 10 kb en la placenta; - 1.35 kb y 2.4 kb en el páncreas, el riñon y el hígado; - 1.35 kb en el pulmón; - 2.4 kb en el músculo esquelético, el cerebro y el corazón. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente, de la enfermedad de Tangier o incluso de deficiencias familiares de HDL.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 33 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 33 codifica potencialmente para un polipéptido de 170 aminoácidos de longitud que constituye la secuencia SEQ ID N° 149. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos
Swissprot (versión 36, última puesta al día del 3 de mayo de 1999) y PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997). Homologías observadas al nivel de la secuencia proteica: 72% de homología con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) : gi4206161 sobre 170 aminoácidos (posición 1-170 aa) gi4206161 es la traducción proteica del gen que codifica para la sintaxina 17 de rata. Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) .
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID N° 34 El marco abierto de lectura de la secuencia SEQ ID N° 34 codifica potencialmente para un polipéptido de 318 aminoácidos constituye la secuencia SEQ ID N° 150.
Las homologías siguientes se han observado: - 72% de homología con Genpept: gi4206161 sobre 170 aminoácidos (posición 1-170 aa) . Genpept: gi4206161 es la traducción proteica del gen que codifica para la sintaxina 17 de rata. Homología proteica sobre Genpeptll5, Trembl y PIR: - 75% de homología sobre 302 AA (posiciones [105- 1010] ) con toda la longitud de la secuencia traducida g4206161 (AF115435) sintaxina 17 [Rattus norvegicus] Longitud = 301; de la g4206161 El polipéptido de la secuencia SEQ ID N° 150 posee un motivo característico de una sintaxina entre los nucleótidos en las posiciones 1 y 243 del marco de lectura abierto.
Función putativa: Los polipéptidos de las secuencias SEQ ID N° 149 y 150 se parecen, por lo tanto, a una proteína de la familia de las sintaxinas implicadas en el transporte vesicular intracelular. Este mecanismo subtendido por un direccionamiento específico mediado por estas proteínas es de interés con respecto a la enfermedad de Tangier/FHD que es descrita por un estudio del mecanismo del transporte y de translocación de los depósitos de colesterol intracelular
hacia las partículas HDL receptoras. Los polipéptidos de la secuencia SEQ ID N° 149 y 150 son, por lo tanto susceptibles de intervenir en una etapa importante implicada en el transporte inverso del colesterol por las HDL. Los polipéptidos de las secuencias SEQ ID N° 149 y
150 son igualmente susceptibles de intervenir en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS93382. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS93382. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 35. La secuencia SEQ ID N° 35 tiene una longitud de 3014 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 371 de la secuencia SEQ ID N° 35.
'- »» Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 35 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS93382 era expresado en el cerebro fetal. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el
Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID N°
97, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 97 es respectivamente de: - 2 kb y 7.5 kb en el cerebro; 2 kb en el páncreas, el riñon, el músculo esquelético, el hígado y el corazón. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31- 34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico dß secuencia SEQ ID NO 35 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 35 codifica potencialmente para un polipéptido de 123 aminoácidos de longitud que constituye la secuencia SEQ ID N° 151. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos Swissprot (versión 36, última puesta al día del 3 de mayo de 1999) , PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997), Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) , Swissprot (versión 36, última puesta al día del 3 de mayo de 1999), TrEMBL (SP-TrEMBL, versión 7, noviembre 1998), PIR: (SECUENCIAS PIR NO REDUNDANTES, VERSIÓN 57) y PDB: (PROTEIN DATA BANK, FEBRERO 1999) . El polipéptido de la secuencia SEQ ID N° 151 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS946300. cidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS946300. La secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 36. La secuencia SEQ ID N° 36 tiene una longitud de 1575 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 176 de la secuencia SEQ ID N° 36. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 36 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS946300 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta, el hígado fetal, el útero, el testículo y el riñon.
Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 36 El marco abierto de lectura de la secuencia de ácidos nucleicos SEQ ID N° 36 codifica potencialmente para un polipéptido de 58 aminoácidos de longitud que constituye la secuencia SEQ ID N° 152. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos Swissprot (versión 36, última puesta al día del 3 de mayo de 1999) y PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997). El polipéptido de secuencia SEQ ID N° 152 es susceptible de intervenir en la regulación del flujo de colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL. El polipéptido de secuencia SEQ ID N° 152 es por lo tanto, susceptible de intervenir en una etapa importante
it??-?éc?. Lá** ., X , _-,„.„* , , , implicada en el transporte inverso del colesterol por las HDL.
Gen GS937345. 5 Ácidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros que corresponden respectivamente a un transcrito largo y un transcrito corto del gen designado aquí posteriormente como el n° GS937345. 10 Una primera secuencia nucleica del ADNc que corresponde al transcrito largo se ha aislado, y constituye la secuencia SEQ ID N° 37. La secuencia SEQ ID N° 37 tiene una longitud de 1607 nucleótidos. 15 Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 2 al nucleótido en la posición 109 de la secuencia SEQ ID N° 37. A partir de la secuencia SEQ ID N° 37, dos
20 cebadores de secuencias respectivas SEQ ID N° 104 y 105 han sido sintetizados y han permitido amplificar un ADNc a partir de un banco de ARNm poliA+ de diferentes tejidos humanos comercializado por la sociedad Clontech.
• -rrñtTr?kil? '!ri^Li^-? * La secuencia del ADNc amplificada con la ayuda de los cebadores de la secuencia SEQ ID N° 104 y 105 constituyen la secuencia SEQ ID N° 38. La secuencia SEQ ID N° 38 tiene una longitud de 1161 nucleótidos. Han sido encontradas homologías entre la secuencia
SEQ ID N° 38 y las secuencias referidas en la base de datos GenBank (Versión 116). Las homologías son las siguientes: • 99% de homología sobre 1096 pdb (posiciones [1- 1093] ) que coinciden con las posiciones [8-1102] de la secuencia gi | 6841231 |gb|AF161409.1 IAF161409 [6841231] ARNm HSPC291 de Homo sapiens, cds. parcial cds. Longitud = 1102; no publicada; • 99% sobre 1025 pdb (posiciones [119-1148]) que coinciden con las posiciones [8-1030] de la secuencia gi|6841235|gb|AF161411.1|AF161411[6841235] ARNm HSPC293 de Homo sapiens, cds. parcial. Longitud = 1045; no publicada; • 99% sobre 1161 pdb (posiciones [1-1161]) que coinciden con las posiciones [43-1202] de la secuencia gil 70208611 dbj IAK000637.1 IAK000637 [7020861] ADNc FLJ20630 fis de Homo sapiens, clona KAT03874. Longitud = 1538; depositada el 22-FEB-2000, proyecto NEDO; no publicada • 92% sobre 1003 pdb (posiciones [1-1043]) y 94% sobre 38 pdb (posiciones [1048-1085]) con la secuencia
gb|AC021286.2|AC021286[6899766] Homo sapiens clona RP11-21H22, WORKING DRAFT SEQUENCE, 19 piezas no ordenadas. Longitud = 175143; La secuencia nucleica del ADNc que corresponde al transcrito corto constituye la secuencia SEQ ID N° 39. La secuencia SEQ ID N° 39 tiene una longitud de 1332 nucleótidos. Ninguna identidad de secuencia ha sido encontrada para las secuencias respectivas del transcrito largo y del transcrito corto, al momento de una búsqueda en la base de datos GenBank (Versión 110) . Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 37 El marco abierto de lectura parcial del transcrito largo de secuencia de ácidos nucleicos SEQ ID N° 37 codifica potencialmente para un polipéptido de 36 aminoácidos de longitud que constituye la secuencia SEQ ID N° 153.
?^?d.?i -Á . ^A^^¿£^* M^^^¿^^_ Homologías observadas al nivel de la secuencia nucleotídica: 41% de identidad sobre 22 aa (posición 6 a 29 aa) con las secuencias de Swissprot (versión 36, última puesta al día del 3 de mayo de 1999): sp|P23596| Proteína PRTD de unión de ATP de Secreción de Proteasas PRTD_ERWCH. Este gen es un candidato para el estudio de la enfermedad de Tangier/FHD por el hecho de la localización cromosomica.
Gen GS99556 cidos nucleicos Se ha aislado, de acuerdo con la invención dos ARN mensajeros, que corresponden respectivamente a un transcrito largo y a un transcrito corto del gen designado aquí posteriormente como el n° GS99556. La secuencia nucleica del ADNc que corresponde al transcrito largo constituye la secuencia SEQ ID N° 40. La secuencia SEQ ID N° 40 tiene una longitud de 10419 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 2 al nucleótido en la posición 1954 de la secuencia SEQ ID N° 40.
El codón de inicio (ATG) inicia en el nucleótido en la posición 29 del transcrito largo de secuencia SEQ ID N° 40. La secuencia nucleica del ADNc que corresponde al transcrito corto constituye la secuencia SEQ ID N° 41. La secuencia SEQ ID N° 41 tiene una longitud de 1813 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 40 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS99556 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta y el hígado fetal. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda respectivamente de las sondas de la secuencia SEQ ID N° 98 et SEQ ID N° 99, a revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) .
El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 98 es respectivamente de: - 2.6 kb, 4.2 kb, 5 kb y 10 kb en el cerebro; 2.6 kb y 5 kb en el hígado, el pulmón, la placenta y el corazón; - 2.6 kb y 5 kb en el riñon; - 2.6 kb en el músculo esquelético; - 5 kb en el páncreas . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 99 es respectivamente de: - 2.2 kb en el hígado; - 2.4 kb y 4,4 kb en el corazón; - 9 kb en el cerebro, la placenta, el riñon, el páncreas y el pulmón. El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 100 es respectivamente de: - 5 kb y 7 kb en la placenta y el corazón; - 5 kb en el cerebro, el riñon y el páncreas. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31- 34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 40 El marco abierto de lectura parcial de la secuencia de ácidos nucleicos SEQ ID N° 40 codifica potencialmente para un polipéptido de 651 aminoácidos de longitud que constituye la secuencia SEQ ID N° 154. Homologías observadas al nivel de la secuencia proteica: Este ORF posee homologías con las secuencias de Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) y de TrEMBL (SP-TrEMBL, versión 7, noviembre 1998) (traducción BlastX las secuencias siguientes) : • 32% de homología sobre 403 aa en Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) con gi | 45298901 NG22 [Homo sapiens] • 25% de homología sobre 693 aa en Genpept: (traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) con gi | 39867701 NG22 [Mus musculus] • 24% de homología sobre 683 aa en Genpept:
(traducción de Genbank vllO y 111, última puesta al día del 7 de mayo de 1999) con gi 110721871 que corresponde al ADNc CEESB82F de C elegans • 24% de homología sobre 683 aa con TrEMBL (SP TrEMBL, versión 7, noviembre 1998) sp|Q20026| codificado por el ADNc CEESB82F de C elegans
Función putativa : Este gen es un candidato para el estudio de la enfermedad de Tangier/FHD por el hecho de la localización cromosómica. El polipéptido de secuencia SEQ ID N° 154 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS96663. cidos nucleicos Se ha aislado de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS96663. Seis secuencias nucleicas representativas de este transcrito se han determinado :
i. i te í *íA **_«... . aa sim... . . , «.* . _ . , _ _, .. . _. ___ ... -. J,t ij La primera secuencia nucleica parcial del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 42. La secuencia SEQ ID N° 42 tiene una longitud de 1377 nucleótidos. La segunda secuencia nucleica parcial del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 43. La secuencia SEQ ID N° 43 tiene una longitud de 452 nucleótidos. La tercera secuencia nucleica parcial del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 44. La secuencia SEQ ID N° 44 tiene una longitud de 562 nucleótidos. La cuarta secuencia nucleica parcial del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 45. La secuencia SEQ ID N° 45 tiene una longitud de 1766 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) .
A partir de la secuencia SEQ ID N° 42, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 106 y 107. A partir de la secuencia SEQ ID N° 43, se ha sintetizado un cebador nucleotídico de secuencia SEQ ID N° 108. A partir de la secuencia SEQ ID N° 45, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 109 y 110. Estos cebadores han permitido amplificar una quinta y una sexta secuencias nucleotídicas representativas del transcrito del gen GS96663. La quinta secuencia nucleica que corresponde al transcrito del gen GS96663 constituye la secuencia SEQ ID N° 46. La secuencia nucleica SEQ ID N° 46 tiene una longitud de 601 nucleótidos. La sexta secuencia nucleica que corresponde al transcrito del gen GS96663 constituye la secuencia SEQ ID N° 47. La secuencia SEQ ID N° 47 tiene una longitud de 3706 nucleótidos. Comprende un cuadro abierto de lectura parcial que va del nucleótido en la posición 1 al nucleótido en la posición 3202 de la secuencia SEQ ID N° 47.
Se han observado homologías entre la secuencia SEQ ID N° 47 y las secuencias referidas en la base de datos GenBank (Versión 116). Estas homologías son las siguientes: • 99 % de homología sobre 2423 pdb (posiciones [1030-3451]) que coinciden con las posiciones [1-2419] de la secuencia gi | 5102585 | emb|AL079279.1 IHST000009 [5102585] inserto de longitud completa de ARNm de Homo sapiens clona ADNc EUROIMAGE 248114. Longitud = 2450/cromosoma=" 9" /mapa='D9S176-D9S279"; depositado el 14-JUN-1999; no publicado. • 98% sobre 1623 pdb (posiciones [1946-3559]) que coinciden con las posiciones [16-1638] de la secuencia g3012351 (176197) Secuencia 1 de la patente US 5691147. Longitud = 1638 pdb; depositada el 03-ABRIL-1998; AUTORES: Draetta, G. Y Gyuris, J. TITULO: Ensayo de unión CDK4 JOURNAL: Patente: US 5691147-A 1 25-NOV-1997; • Diferentes fragmentos de homología de 99% al 100% sobre 2372 pdb (posiciones [1-2372]) y del 97% al 100% sobre 1160 pdb (posiciones [2547-3706]) con la secuencia gi|7228016|emb|AL158158.3|AL158158[7228016]; cromosoma 9 de Homo sapiens clona RP11-427L11 mapa q31.2-32, ***SECUENCIAMIENTO EN PROGRESO***, 37 unidades no ordenadas, depositada el 08-MAR-2000;
Los análisis de expresión del transcrito de las secuencias SEQ ID N° 42 a 47 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GSS96663 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta, el hígado fetal, el útero, el testículo, el riñon y el músculo esquelético. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL.
Polipéptido codificado por el ácido nucleico dß secuencia SEQ ID N' 47 El marco abierto de lectura parcial de la secuencia del ácido nucleico SEQ ID N° 47 codifica potencialmente para un polipéptido de 1066 aminoácidos de longitud que constituye la secuencia SEQ ID N° 155. Las homologías entre la secuencia SEQ ID N° 155 y las secuencias listadas en las bases de datos. Estas homologías son las siguientes:
• 27% de homología sobre 1068 AA con las secuencias del tipo 'receptor complementario" CR1 (g30186; g809019; 9451303; g306680) y CR2 (gl8192; 9181940; g599776) • Homología del 24% sobre aproximadamente 1000 AA con las secuencias 'factor H complementario"; secuencias gi|31965|emb|CAA68704.1| [31965] (Y00716) factor H [Homo sapiens], PIR-.NBHUH y PIR:NBMSH; EM:Q14006 y EM:Q61408. • Homología del 25% sobre 900 AA con las secuencias de P-selectina y E-selectina: secuencias sp|pl6581 | lem2_precursor de la e-selectina humana (molécula de adhesión del leucocito endotelial 1) (elam-1) (molécula de adhesión del leucocito-célula endotelial 2) (lecam2) (cd62e) y sp|pl6109 | lem3_precursor de la p-selectina humana (proteína de granulo membranal 140) (gmp-140) (padgem) (cd62p) (molécula de adhesión del leucocito-célula endotelial 3) (lecam3) y con pir no redundante: pir|s|a30359 precursor de la p-selectina humana. • 24% de homología sobre 637 AA con la secuencia gl83391 (M25322) proteína de granulo membranal-140 (GMP-140) precursor [Homo sapiens], Longitud = 830 • Homología con la 'molécula de adhesión de la célula" trEMBL: sp | Q28290 | Q28290 PRECURSOR DE LA MOLÉCULA DE ADHESIÓN DE LA CÉLULA (FRAGMENTO) .
• Diferentes fragmentos de homología de 25% a 29% sobre la secuencia 'precursor H de la apolipoproteína - PIR:NBHU humana Longitud = 345; precursor H de la apolipoproteína - humano con una homología del 29% sobre 256 AA. • Homología con las secuencias 'cofactor de la membrana cofactor de la proteína" (PIR:S01896, PIR: 154479, PIR:A57278 y EM:P79138, EM:Q9ZOM4, EM-019121) y EM:062837: proteína del cofactor de membrana CD46. • Diferentes fragmentos (de 400 a 500 AA) de homología de 25% a 27% con la secuencia PIR:T16833 proteína hipotética T07H6.5 - Caenorhabditis elegans encontrada en genpept (gl255889 (U53344) .
Función putativa: El producto del gen GS96663, por su homología en aminoácidos con los precursores de la P-selectina y de la E- selectina humanas, se parece a esta clase de proteínas membranales. Su papel en el flujo del colesterol intracelular, mediado por las proteínas membranales, no está excluido puesto que el gen está localizado en el intervalo genético definido por la clonación posicional.
El polipéptido de secuencia SEQ ID N° 155 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS941675. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS941675. Dos secuencias nucleicas son representativas de este transcrito: La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 48. La secuencia SEQ ID N° 48 tiene una longitud de 373 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 49. La secuencia SEQ ID N° 49 tiene una longitud de 459 nucleótidos . Ninguna identidad de secuencia ha sido encontrada
al momento de una búsqueda en la base de datos GenBank (Versión 110) . La tercer secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 50. La secuencia SEQ ID N° 50 tiene una longitud de 2575 nucleótidos. Se han observado homologías entre la secuencia SEQ ID N° 50 y las secuencias referidas en la base de datos GenBank (Versión 116). Estas homologías son las siguientes: - 98% de identidad, sobre 720 pb con un BAC END g6348761 AQ892571 HS_3143_A1_G01_T7C CIT Biblioteca de Esperma Genómico Humano Aprobada, longitud 848pb. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS929341. cidos nucleicos Se ha aislado de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS929341. Se han determinado dos secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 51. La secuencia SEQ ID N° 51 tiene una longitud de 231 nucleótidos . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 52. La secuencia SEQ ID N° 52 tiene una longitud de 344 nucleótidos . Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 131 de la secuencia SEQ ID N° 52. Ninguna identidad con las secuencias SEQ ID N° 51 y 52 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La tercer secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 53. La secuencia SEQ ID N° 53 tiene una longitud de 402 nucleótidos.
» -i .¡t.Jt ti?*.**»*?a. «ak nu--.. > S .. . , _ .,-. . - - í*?||lÍ|i|Kafll)'llll--Í|Íl? Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 188 de la secuencia SEQ ID N° 53. Ninguna identidad con las secuencias SEQ ID N° 51 a
53 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 116) . Los análisis de expresión del transcrito de las secuencias SEQ ID N° 51 y 52 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS929341 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta, el hígado fetal, el útero, el testículo, el riñon, el músculo esquelético y el pulmón. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31- 34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 52 El marco abierto de lectura de la secuencia del ácido nucleico SEQ ID N° 52 codifica potencialmente para un polipéptido de 43 aminoácidos de longitud que constituye la secuencia SEQ ID N° 156. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos
Swissprot (versión 36, última puesta al día del 3 de mayo de 1999) y PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997).
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID N° 53 El marco abierto de lectura de la secuencia del ácido nucleico SEQ ID N° 53 codifica potencialmente para un polipéptido de 61 aminoácidos de longitud que constituye la secuencia SEQ ID N° 157. Ninguna homología significativa con BLAST ha sido encontrada con las secuencias referidas en las bases de datos Swissprot (versión 38), PIR (Versión 62, Septiembre 1999), trEMBL (Versión de Agosto 1999) y Gen Pept (Versión 115) . Los polipéptidos de las secuencias SEQ ID N° 156 y 157 son susceptibles de intervenir en la regulación del flujo
del colesterol, y más particularmente de la enfermedad de
Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS915742. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS915742. Se han determinado tres secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 54. La secuencia SEQ ID N° 54 tiene una longitud de 228 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 55. La secuencia SEQ ID N° 55 tiene una longitud de 270 nucleótidos . La tercer secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 56.
&- •» & £.* La secuencia SEQ ID N° 56 tiene una longitud de 1130 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versiones 110 y 116) . Los análisis de expresión del transcrito las secuencias SEQ ID N° 54 y 55 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS915742 era expresado en el cerebro fetal, el hígado, la placenta y el riñon. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS913018. Ácidos nucleicos Se ha aislado de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS913018. Dos secuencias representativas de este transcrito son representadas a continuación.
¿M3ei*á* La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 57. La secuencia SEQ ID N° 57 tiene una longitud de 463 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 58. La secuencia SEQ ID N° 58 tiene una longitud de 289 nucleótidos. Ninguna identidad de secuencia con las secuencias SEQ ID N° 57 y 58 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . A partir de la secuencia SEQ ID N° 57, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 111 y 112. A partir de la secuencia SEQ ID N° 58, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 113 y 114. Los cebadores de las secuencias SEQ ID N° 111 a 114 han permitido amplificar un ADNc, a partir de un banco de ARNm poliA+ de diferentes tejidos humanos, comercializado por
i J?*u *má**?i.« la Sociedad Clontech, una tercer secuencia nucleica del ADNc que corresponde al transcrito del gen GS913018. La tercer secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 59. La secuencia SEQ ID N° 59 tiene una longitud de 1542 nucleótidos. Han sido encontradas homologías sobre la secuencia SEQ ID N° 59, en particular diferentes fragmentos de identidad sobre les posiciones [7351268] [1-357] [559-710] y [373-501] de la secuencia SEQ ID N° 59 con la secuencia g6563616 (AC013740) Homo sapiens clona RP11-115J22, WORKING DRAFT SEQUENCE, 15 piezas no ordenadas. Longitud = 180711, listadas en GenBank (Versión 116) . Los análisis de expresión del transcrito las secuencias SEQ ID N° 57 y 58 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS913018 era expresado en el cerebro fetal, el hígado, el cerebro, el corazón, la próstata, la placenta, el hígado fetal, el útero, el testículo y el riñon. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS911742. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS911742. Se han determinado tres secuencias representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 60. La secuencia SEQ ID N° 60 tiene una longitud de 1417 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 61. La secuencia SEQ ID N° 61 tiene una longitud de 696 nucleótidos. Ninguna identidad de secuencia con las secuencias SEQ ID N° 60 y 61 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) .
i diA¿¿-t-a -> . ,.-..... . -, ? T. . _. ¿. . . ._. --- -. , ,. „»-. +» . I ÍJ La tercer secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 62. La secuencia SEQ ID N° 62 tiene una longitud de 2702 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura (ORF) parcial que va del nucleótido en la posición 1 al nucleótido en la posición 792 de la secuencia SEQ ID N° 62. La secuencia codificante potencial inicia en el nucleótido en la posición 49 y se termina en el nucleótido en la posición 792 de la secuencia SEQ ID N° 62. El codón de inicio de la traducción inicia en el nucleótido en la posición 49 de la secuencia SEQ ID N° 62. Esta secuencia comprende un motivo de Kozak de secuencia 'GC CGC GCC ATG C" que inicia en el nucleótido en la posición 41 de la secuencia SEQ ID N° 62. Se han observado homologías con la secuencia SEQ ID N° 62 con las secuencias listadas en la base de datos GenBank (Versión 116). Estas homologías son las siguientes: • 98 % de homología sobre 1410 pdb (posiciones [4- 1413]) con la secuencia gi 159120951 emb I
AL117557.1 | HSM801083 [5912095] Homo sapiens ARNm; ADNc DKFZp564D177 (de la clona DKFZp564D177) ; cds. parcial Longitud = 1431; depositada el 18-FEB-2000; Presentada (15- SEP-1999) MIPS, Am Klopferspitz 18a, D-82152 Martinsried, ALEMANIA, Bloecker, H., Boecher, M., Brandt, P., Wiemann, S. • 97 % de homología sobre 10139 pdb [1-1039] y 97% sobre 380 pdb [1082-1458] y 90% sobre 51 pdb [1506-1556] con la secuencia gi | 6841247 | gb IAF161417.1 IAF161417 [6841247] Homo sapiens HSPC299 ARNm, cds. parcial Longitud = 1659; depositado el 01-FEB-2000; Presentación Directa; Presentada (14-MAY-1999) Instituto de Hematología de Shanghai, Segunda Universidad Médica de Shanghai, Hospital Rui-Jin, 197 Rui-Jin Road II, • 98% de homología sobre 1410 pdb [4-1413] con la secuencia g5912095 (AL117557) Homo sapiens ARNm; ADNc DKFZp564D177 (de la clona DKFZp564D177) ; cds. parcial Longitud = 1431; depositada el 18-FEB-2000; Presentación Directa; Presentada (15-SEP-1999) MIPS, Am Klopferspitz 18a, D-82152; Martinsried, ALEMANIA, Bloecker, H., Boecher, M., Brandt, P., Mewes, H. W., Gassenhuber, J. Y Wiemann, S. • 93% sobre 911 pdb (posiciones [1-911]) y 93% sobre 179 pdb (posiciones [1395-1573]) y 81% sobre 131 pdb (posiciones [992-1122]) con la secuencia gi | 7023832 | dbj |AK002137.1 |AK002137 [7023832] Homo sapiens ADNc FLJ11275 fis, clona PLACE1009375. Longitud = 1564; depositada
el 22-FEB-2000; proyecto de secuenciamiento de ADNc humano NEDO; No publicado • Diferentes fragmentos de homología (de 90% a 100%) con la secuencia g5932616 (AC009594) cromosoma 4 de Homo sapiens clona 363_G_01 mapa 4, ***SECUENCIAMIENTO EN PROGRESO***, 9 piezas no ordenadas. Longitud = 150108; Los análisis de expresión del transcrito las secuencias SEQ ID N° 60 y 61 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS911742 era expresado en el cerebro fetal, el hígado, el corazón y la placenta. Además, un análisis de la expresión del transcrito por manchado Northern, de acuerdo al protocolo descrito en el Ejemplo 1, con la ayuda de la sonda de la secuencia SEQ ID NO 101, ha revelado la presencia de transcritos en el manchado comercializado por la Sociedad Clontech (Ref. N° 7759-1) . El tamaño de los transcritos detectados con la sonda de la secuencia SEQ ID N° 101 es de 1,9 kb en el páncreas, el riñon, el músculo esquelético, el pulmón y la placenta. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso
j^^^j^^^^^^^^-^^^íjí del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 62 El marco abierto de lectura parcial de la secuencia del ácido nucleico SEQ ID N° 62 codifica potencialmente para un polipéptido de 263 aminoácidos de longitud que constituye la secuencia SEQ ID N° 158. Las homologías observadas al nivel de la secuencia proteica se traducen en seis fases: • 99% de homología sobre 262 AA (posición [4-789]) con la secuencia g5912096 (AL117557) proteína hipotética [Homo sapiens] Longitud = 263 ; nota= 'similitud a NIPSNAP1"; depositada el 18-FEB-2000; Presentación Directa; Presentada (15-SEP-1999) MIPS, Am Klopferspitz 18a, D-82152, Martinsried, ALEMANIA, Bloecker, H., Boecher, M., Brandt, P., Mewes, H. W., Gassenhuber, J. and Wiemann, S. • Homologías con las secuencias NISNAP2 y NISNAP2: 27% de homología sobre 179 AA con la secuencia g2769254 (AJ001259) proteína NIPSNAP2 [Homo sapiens] Longitud = 285 y 24% de homología sobre 211 AA con la secuencia g2769649 (AJ001258) proteína NIPSNAP1 [Homo sapiens] Longitud = 284 • 27% de homología sobre 179 AA con la secuencia g3403167 (AF029786) GBAS [Homo sapiens] Longitud = 286. GBAS: proteína de unión del nucleótido guanina, subunidad alfa (proteína alfa G que estimula la adenilato ciclasa) . Esta proteína es descrita con un sitio de fosforilación y una región transmembranal. Las 'proteínas de unión del nucleótido guanina" tienen un papel de moduladores o transductores en diferentes sistemas de señalización transmembranales. 21% de identidad con la proteína YMQ1_CAEEL (Base de datos Prodom, VERSIÓN ?) que tiene una similitud con la proteína SNAP25 y la 4-nitrofenilfosfatasa. El polipéptido de secuencia SEQ ID N° 158 comprende sitios de glicosilación, sitios de fosforilación, tales como los sitios de fosforilación cAMP- y cGMP - dependientes de la proteína cinasa y de la caseína cinasa del tipo II.
Función putativa : El polipéptido de secuencia SEQ ID N° 158 se parece, por lo tanto, por su motivo encontrado en el dominio PD013981 de PRODOM: (dominios homólogos detectados en Swissprot, versión 34.2, noviembre 1997) a una proteína putativamente implicada en el transporte vesicular
j^^^^^g&^^i t , i.
intracelular. Este mecanismo subtendido por un direccionamiento específico mediado por estas proteínas de interés, con respecto a la enfermedad de Tangier/FHD que es descrita por un defecto del mecanismo de transporte y de translocación de los depósitos de colesterol intracelular hacia las partículas HDL receptoras. El polipéptido de la secuencia SEQ ID N° 158 es, por lo tanto, susceptible de intervenir en una etapa importante implicada en el transporte inverso del colesterol por las HDL. El polipéptido de secuencia SEQ ID N° 158 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS98601. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS98601. Se han determinado tres secuencias nucleicas representativas de este transcrito.
La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 63. La secuencia SEQ ID N° 63 tiene una longitud de 335 nucleótidos. Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 64. La secuencia SEQ ID N° 64 tiene una longitud de 447 nucleótidos . Ninguna identidad de secuencia ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . La tercer secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 65. La secuencia SEQ ID N° 65 tiene una longitud de
2324 nucleótidos. Esta secuencia comprende un cuadro abierto de lectura
(ORF) parcial que va del nucleótido en la posición 3 al nucleótido en la posición 611 de la secuencia SEQ ID N° 65.
Homologías observadas al nivel de la secuencia nucleotídica: (307) • 99% de homología sobre 514 pb (posición 1508-2021 pb) con las secuencias de GenBank: gi | 34835201 que corresponde a la clona ZB95F02 de ADNc (Homo sapiens) cuya secuencia está completa. • 98% de homología sobre 170 pb (posición 862-1031 pb) con las secuencias de GenBank: gi | 1184671 | (región 3' UTR parcial del ARNm, gue codifica para la proteína inducible del virus de la enfermedad de newcastle) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 45 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de" diferentes tejidos han permitido mostrar que el gen GS98601 era expresado en el cerebro, la placenta y el útero. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID NO 65 El marco abierto de lectura de la tercer secuencia de ácidos nucleicos SEQ ID N° 65 codifica potencialmente para un polipéptido de 203 aminoácidos de longitud que constituye la secuencia SEQ ID N° 159. Homologías observadas al nivel de la secuencia proteica (307) : 34% de homología sobre 180 aa (posición 3-182 aa) con las secuencias de Genpept: (traducción de Genbank vllO y
111, última puesta al día del 7 de mayo de 1999) : gi|3878571|gnl|PID|el348103 (Z46381) - escasa similitud con la proteína de levadura Ysy6- (PIR: (SECUENCIAS PIR NO
REDUNDANTES, VERSIÓN 57) número de acceso JQ0912) ; EST de ADNc EMBL: D32318 que proviene de este gen; EST de ADNc EMBL:
D33688 que proviene de este gen; EST de ADNc EMBL: D34664 que proviene de este gen; EST de ADNc EMBL: D36574 que proviene de este gen y las secuencias de SP-TrEMBL (SP-TrEMBL, versión
7, noviembre 1998): sp|Q21453| que corresponde a la proteína M01 F1.4 de C elegans. El polipéptido de secuencia SEQ ID N° 159 es susceptible de intervenir en la regulación del flujo del colesterol, y más particularmente de la enfermedad de Tangier, en las deficiencias familiares de HDL, o incluso en una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Función Putativa: Este gen es un candidato por su localización cromosómica para las patologías Tangier/FHD.
Gen GS9 852. Ácidos Nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, gue corresponde a un transcrito del gen designado aquí posteriormente como el n° GS94852. Se han determinado tres secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 66. La secuencia SEQ ID N° 66 tiene una longitud de 447 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 67. La secuencia SEQ ID N° 67 tiene una longitud de 564 nucleótidos . A partir de la secuencia SEQ ID N° 66, se han
Í -,- . ?j¿^L^^ jrf^i^^^^ s _^^^^^£¡^^^^^^^^»^ sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 115 y 116. A partir de la secuencia SEQ ID N° 67, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 117 y 118. Los cebadores de las secuencias SEQ ID N° 115 a 118 permiten amplificar un ADNc, a partir de un banco de ARNm poliA+ de diferentes tejidos humanos comercializado por la
Sociedad Clontech, una tercer secuencia nucleica de ADNc que corresponde al transcrito del gen GS94852. La tercer secuencia nucleica que corresponde al transcrito del gen GS94852 constituye la secuencia SEQ ID N° 68. La secuencia SEQ ID N° 68 tiene una longitud de 604 nucleótidos. Ninguna identidad de secuencia con las secuencias SEQ ID N° 66 a 68 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versiones 110 y 116) . Los análisis de expresión del transcrito de la secuencia SEQ ID N° 67 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos permiten demostrar que el gen GS94852 era expresado en el hígado y el corazón.
Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen S935135. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aguí posteriormente como el n° GS935135. Se han determinado tres secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 69. La secuencia SEQ ID N°69 tiene una longitud de 482 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 70. La secuencia SEQ ID N° 70 tiene una longitud de 402 nucleótidos . Ninguna identidad de secuencia ha sido encontrada
^^ ^^^^s^&&k¿s?^^^W¡*&?^ con las secuencias SEQ ID N° 69 y 70 al momento de una búsqueda en la base de datos GenBank (Versión 110) . Se ha sintetizado un primer cebador nucleotídico de secuencia SEQ ID N° 119 a partir de la secuencia SEQ ID N° 69 y un segundo cebador nucleotídico de secuencia SEQ ID N° 120 a partir de la secuencia SEQ ID N° 70. Estos cebadores permiten amplificar una tercer secuencia nucleica representativa del transcrito del gen GS935135 que constituye la secuencia SEQ ID N° 71. La secuencia nucleica SEQ ID N° 71 tiene una longitud de 758 nucleótidos. Han sido encontradas homologías con las secuencias listadas en la base de datos GenBank (Versión 116) . Estas homologías son las siguientes: • 80 a 85% de homología sobre 3 fragmentos
(156+197+93 pdb) con la secuencia g2168141
(gi|2168141|emb|Z93019.1|HS49C23[2168141) secuencia de ADN
Humano de PAC 49C23 en el cromosoma X que contiene malato deshidrogenasa seudógena y STS. Longitud = 153078 • 81% a 90% de homología sobre 4 fragmentos
(144+86+197+137 pdb) con la secuencia g2828782 (gÍ|2828782|gb|AC002319.1|AC002319[2828782] ) cromosoma 9q34 de Homo sapiens, clona 70C11, secuencia completa. Longitud = 46305.
»*.« L. i * . . i 4L L * ? »U¡.
Los análisis de expresión del transcrito de la secuencia SEQ ID N° 69 ó 70 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS935135 era expresado en el cerebro fetal, el hígado, el cerebro, la próstata, la placenta, el hígado fetal, el útero, el testículo y el riñon. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS914669. Ácidos nucleicos Se ha aislado de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS914669. Se han determinado tres secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 72.
_skÜd-át-fc--l--taí«i ., JsL ^^^i?i¿*£mÉ =£¿—^^^a^^ ^^^^^=^ ..-í.. ?**^" »y -^ *-* * s ti í La secuencia SEQ ID N° 72 tiene una longitud de 673 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 73. La secuencia SEQID N 73 tiene una longitud de 554 nucleótidos. Ninguna identidad de secuencia con las secuencias SEQ ID N° 72 y 73 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . A partir de la secuencia SEQ ID N° 72, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 121 y 122. A partir de la secuencia SEQ ID N° 73, se han sintetizado dos cebadores nucleotídicos, respectivamente los cebadores de las secuencias SEQ ID N° 123 y 124. Los cebadores de las secuencias SEQ ID N° 121 a 124 permiten amplificar un ADNc, a partir de un banco de ARNm poliA+ de diferentes tejidos humanos comercializado por la Sociedad Clontech une tercer secuencia nucleica del ADNc que corresponde al transcrito del gen GS914669. Esta secuencia constituye la secuencia SEQ ID N° 74. La secuencia SEQ ID N° 74 tiene una longitud de 1794 nucleótidos. Comprende un cuadro abierto de lectura que va del nucleótido en la posición 1 al nucleótido en la posición 258 de la secuencia SEQ ID N° 74, así como una secuencia codificante localizada de manera idéntica. Esta secuencia comprende un sitio de poliadenilación que inicia en el nucleótido en la posición 1751 de la SEQ ID N° 74. Han sido encontradas homologías con la secuencia SEQ ID N° 74 en las secuencias listadas en la base de datos GenBank (Versión 116). Estas homologías son las siguientes: 99% de identidad sobre lOOOpb (792 a 1793pb) g6807977 AL137422 Homo sapiens ARNm; ADNc DKFZp761A1623 (de la clona DKFZp761A1623) ; cds parcial Longitud = 1000 • Identidad con un BAC en curso de secuenciamiento AL137023 g6982086 cromosoma 9 de Homo sapiens clona RP11-403A22 mapa q34.13-34.3, ***SECUENCIAMIENTO EN PROGRESO***, 19 piezas no ordenadas. Longitud = 184814 Los análisis de expresión del transcrito de la secuencia SEQ ID N° 72 ó 73 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS914669 era expresado en el cerebro fetal y el corazón. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de
j»> *. * .. J ?*La¡k^ . <t ¡.fc- _-Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Polipéptido codificado por el ácido nucleico de secuencia SEQ ID N° 74 El marco de lectura abierta de la secuencia del ácido nucleico SEQ ID N° 74 codifica potencialmente para el polipéptido de secuencia SEQ ID N° 160 de una longitud de 85 aminoácidos. Ninguna homología de secuencia ha sido observada con las secuencias listadas en las bases de datos Genpept (Versión 115) , Swissprot (Versión 38) , trEMBL (Versión de Agosto 1999) y PIR (Versión 62 de Septiembre 1999) .
Gen GS913839. Ácidos nucleicos Se ha aislado de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS913839. Se han determinado tres secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 75.
_y¿ _;___> „ £ a &=ÜÉ¡te.
La secuencia SEQ ID N° 75 tiene una longitud de 507 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 76. La secuencia SEQ ID N° 76 tiene una longitud de 415 nucleótidos. Ninguna identidad de secuencia con las secuencias SEQ ID N° 75 y 76 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . A partir de la secuencia SEQ ID N° 75, se ha sintetizado un cebador nucleotídico de secuencia SEQ ID N° 125. A partir de la secuencia SEQ ID N° 76, se ha sintetizado un cebador nucleotídico de secuencia SEQ ID N° 1126. Los cebadores de las secuencias SEQ ID N° 125 y 126 permiten amplificar un ADNc, a partir de un banco de ARNm poliA+ de diferentes tejidos humanos comercializado por la Sociedad Clontech, una tercer secuencia nucleica del ADNc que corresponde al transcrito del gen GS94852. Esta secuencia constituye la secuencia SEQ ID N° 77. La secuencia SEQ ID N° 77 tiene una longitud de 1318 nucleótidos.
-ri--8ü--->-sa---j --» ^*- ' < Se han observado homologías de la secuencia SEQ ID N° 77 con las secuencias listadas en la base de datos GenBank (Versión 116). Estas homologías son las siguientes: • 99% de homología sobre 1320 pdb (posiciones [1-1318]) con la secuencia g6006243 (AC011096) Homo sapiens clona 2_D_21, *** SECUENCIAMIENTO EN PROGRESO***, 15 piezas no ordenadas. Longitud = 135130; • 99% de homología sobre 1320 pdb (posiciones [1-1318]) con la secuencia g7263520 (AL161631) cromosoma 9 de Homo sapiens clona RP11-70K10, ***SECUENCIAMIENTO EN PROGRESO***, 45 piezas no ordenadas. Longitud = 100562; Los análisis de expresión del transcrito de la secuencia SEQ ID N° 75 ó 76 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS913839 era expresado en el cerebro fetal y el hígado. Este gen constituye un candidato posicional causal de una enfermedad debido a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
Gen GS912639. Ácidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aquí posteriormente como el n° GS912639. Se han determinado tres secuencias nucleicas representativas de este transcrito. La primera secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 78. La secuencia SEQ ID N° 78 tiene una longitud de 530 nucleótidos. La segunda secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 79. La secuencia SEQ ID N° 79 tiene una longitud de 495 nucleótidos. Ninguna identidad de secuencia con las secuencias SEQ ID N° 78 y 79 ha sido encontrada al momento de una búsqueda en la base de datos GenBank (Versión 110) . A partir de la secuencia SEQ ID N° 78, se ha sintetizado un cebador nucleotídico de secuencia SEQ ID N° 127.
¿^^^^^j¡A^?^»¿_ »¡tó»»a»- A partir de la secuencia SEQ ID N° 79, se ha sintetizado un cebador nucleotídico de secuencia SEQ ID N° 128. Los cebadores de las secuencias SEQ ID N° 127 y 128 permiten amplificar un ADNc, a partir de un banco de ARNm poliA+ de diferentes tejidos humanos comercializado por la Sociedad Clontech, una tercer secuencia nucleica del ADNc que corresponde al transcrito del gen GS912639. Esta secuencia constituye la secuencia SEQ ID N° 80. La secuencia SEQ ID N° 80 tiene una longitud de 594 nucleótidos. Han sido encontradas homologías de secuencia de la SEQ ID N° 80 con las secuencias referidas en la base de datos GenBank (Versión 116). Estas homologías son las siguientes: • 99% de homología sobre 522 pdb (posiciones [204- 725]) con la secuencia g2603415 (gi | 2603415 | gb I B51178.1 IB51178 [2603415] ) CIT978SK-95K15. TV clona genómica 95K15 de Homo sapiens, inspección de la secuencia genómica. Longitud = 524; • 99% de homología sobre 501 pdb (posiciones [204- 704]) con la secuencia g2866378 (gi | 2866378 | gb IB79355.1
|B79355[2866378] ) CIT978SK-95K15. TV.l CIT978SK clona genómica de Homo sapiens 95K15, inspección de la secuencia genómica. Longitud = 529;
** i - • 94% de homología sobre 309 pdb (posiciones [205- 513]) con la secuencia g2602442 (i 126024421 gb IB50205.11
B50205[2602442] ) CIT978SK-96F5. TV CIT978SK clona genómica
96F5 de Homo sapiens, inspección de la secuencia genómica. Longitud = 309; Los análisis de expresión del transcrito de la secuencia SEQ ID N° 78 ó 79 han sido realizados por RT PCR, como se describe en el Ejemplo 1. Estos análisis, efectuados a partir de ARN poliA+ de diferentes tejidos han permitido mostrar que el gen GS912639 era expresado en el hígado. Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31- 34 del cromosoma 9.
Gen GS933630. cidos nucleicos Se ha aislado, de acuerdo con la invención un ARN mensajero, que corresponde a un transcrito del gen designado aguí posteriormente como el n° GS933630. Una secuencia nucleica representativa de este transcrito ha sido determinada.
Esta secuencia nucleica del ADNc que corresponde a este transcrito, constituye la secuencia SEQ ID N° 81. La secuencia SEQ ID N° 81 tiene una longitud de 582 nucleótidos . Ninguna homología ha sido observada con las secuencias referidas en la base de datos GenBank (Versión 116) . Este gen constituye un candidato posicional causal de una enfermedad debida a una disfunción del flujo inverso del colesterol, y más particularmente de la enfermedad de Tangier o incluso de deficiencias familiares de HDL, o incluso a una enfermedad genéticamente ligada al sitio 9q31-34 del cromosoma 9.
CARACTERÍSTICAS DE LA INVENCIÓN La invención se relaciona así, con un ácido nucleico que codifica para una proteína que tiene una secuencia de aminoácidos elegida en el grupo de secuencias de aminoácidos SEQ ID N° 129 a SEQ ID N° 160 o un fragmento peptídico o una variante de este último o un ácido nucleico de secuencia complementaria. De manera general, los ácidos nucleicos de acuerdo con la invención se presentan bajo una forma aislada o purificada.
B*Mfc*i - Í.1LÍ; - .
La invención se relaciona igualmente con un ácido nucleico que comprende al menos ocho nucleótidos consecutivos de un polinucleótido elegido en el grupo constituido de las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81 y SEQ ID N°82 a SEQ ID N°101, o un ácido nucleico de secuencia complementaria. La invención también es relativa a un ácido nucleico que comprende al menos 20, 30, 40, 50, 100 o 150 nucleótidos consecutivos de un polinucleótido elegido en el grupo constituido por las SEQ ID N°l a SEQ ID N°81 y SEQ ID N°82 a SEQ ID N°101, o un ácido nucleico de secuencia complementaria. De acuerdo con otro aspecto, la invención se relaciona también con un ácido nucleico que tiene al menos 90% de identidad en nucleótidos con un ácido nucleico elegido en el grupo constituido por las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81 y SEQ ID N°82 a SEQ ID N°101, ventajosamente 80%, de preferencia 95, 99%, 99.5% y de manera más preferida 99.8% de identidad de nucleótidos con un ácido nucleico elegido en el grupo constituido por las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81 y SEQ ID N°82 a SEQ ID N°101, o un ácido nucleico de secuencia complementaria. De acuerdo con incluso otro aspecto, la invención es relativa a un ácido nucleico híbrido, en las condiciones de hibridación de fuerte astringencia, con un ácido nucleico
. -*- &*á< &§^S3u-a_ ..i -^^- ^i^ tal como el definido anteriormente, y más particularmente, un ácido nucleico elegido en el grupo constituido por las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81 y SEQ ID N°82 a SEQ ID N°101, o un ácido nucleico de secuencia complementaria. Como se ha descrito en detalle más arriba, cada una de las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81, constituyen los ADNc cuya secuencia nucleotídica es encontrada en los transcritos de genes potencialmente implicados en las afecciones ligadas a una disfunción del metabolismo de las lipoproteínas, en particular en transporte inverso del colesterol. Para ciertos de estos ácidos nucleicos, se ha determinado una fase de lectura abierta, que codifica para un polipéptido donde una alteración en la secuencia de aminoácidos o en la expresión es potencialmente asociada a una de estas afecciones, lo que indica que las secuencias nucleotídicas comprenden las fases de lectura abiertas que constituyen los ácidos nucleicos de interés potencialmente terapéutico. En consecuencia, la invención tiene por objeto además, un ácido nucleico que tenga al menos 80% de identidad en nucleótidos en un polinucleótido que comprende, o está constituido alternativamente de, un marco de lectura abierta completo o parcial, tal como el definido anteriormente en la presente descripción. Los ácidos nucleicos anteriores que comprenden, total o parcialmente, la región codificante de los productos de transcripción de las secuencias SEQ ID N°l a SEQ ID N°81, pueden ser expresados en una célula huésped deseada, cuando estos ácidos nucleicos son colocados bajo el control de las señales de expresión convenientes. Tales señales de expresión pueden ser indiferentemente, las señales de expresión contenidas en las regiones reguladoras de cada uno de los genes correspondientes o por el contrario, constituidas por las secuencias nucleicas reguladoras exógenas . Tal ácido nucleico colocado bajo el control de una secuencia reguladora funcional en la célula huésped deseada, puede ser también insertado en un vector en vista de su expresión.
SONDAS Y CEBADORES NUCLEOTIDICOS Los fragmentos de ácidos nucleicos derivados de una cualquiera secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81 son útiles para la detección de la presencia de al menos una copia de una secuencia nucleotídica elegida entre las secuencias SEQ ID N°l a SEQ ID N°81, o incluso de un
fragmento o una variante de éste último en una variante de una muestra. Las sondas o los cebadores nucleotídicos de acuerdo con la invención comprenden al menos ocho nucleótidos consecutivos de un ácido nucleico elegido en el grupo constituido elegido por las secuencias SEQ ID N°l a SEQ ID
N°81, o de un ácido nucleico de secuencia complementaria. De preferencia las sondas o cebadores nucleotídicos de acuerdo con la invención tendrán una longitud de 10, 12, 15, 18 ó 20 a 25, 35, 40, 50, 70, 80, 100, 200, 500, 1000, 1500 nucleótidos consecutivos de un ácido nucleico de acuerdo con la invención, en particular un ácido nucleico de secuencia nucleotídica elegida entre las secuencias SEQ ID N°l a SEQ ID N°81, o de un ácido nucleico de secuencia complementaria. Alternativamente, una sonda o un cebador nucleotídico de acuerdo con la invención consistirá y/o comprenderá los fragmentos de una longitud de 12, 15, 18, 20, 25, 35, 40, 50, 100, 200, 500, 1000, 1500 nucleótidos consecutivos de un ácido nucleico de acuerdo con la invención, más particularmente de un ácido nucleico elegido entre las secuencias SEQ ID N°l a SEQ ID N°81 o de un ácido nucleico de secuencia complementaria. La definición de una sonda o de un cebador nucleotídico de acuerdo con la invención engloba por lo tanto los oligonucleótidos que se hibridan, en las condiciones de hibridación de fuerte astringencia definidas anteriormente, con un ácido nucleico elegido entre las secuencias SEQ ID N°l a SEQ ID N°81 o con una secuencia complementaria de estos últimos. Las sondas y cebadores preferidos de acuerdo con la invención comprenden todo o en parte de un nucleótido elegido entre las secuencias nucleotídicas SEQ ID N°82 a SEQ ID N°101, o de los ácidos nucleicos de secuencia complementaria, o incluso ante las secuencias nucleotídicas SEQ ID N°102 a SEQ ID N°128, o los ácidos nucleicos de secuencia complementaria . Un cebador o una sonda nucleotídica de acuerdo con la invención puede estar preparado por cualquier método adaptado bien conocido por el experto en la materia, que comprenda clonación y acción de las enzimas de restricción o incluso por síntesis química directa de acuerdo con las técnicas tales como el método de fosfodiéster de NARANG ßt al. (1979) o de BROWN et al. (1979), el método con dietilfosfora iditas de BEAUCAGE et al. (1980) o incluso la técnica sobre un soporte sólido descrita en la patente EU N°EP 0 707 592. Cada uno de los ácidos nucleicos de acuerdo con la invención, que comprende las sondas y cebadores oligonucleotídicos descritos anteriormente, pueden ser marcado, si se desea, incorporando un marcador detectable por los medios espectroscópicos fotoquímicos, bioquímicos, inmunoquímicos o incluso químicos . Por ejemplo, tales marcadores pueden consistir de isótopos radioactivos (32P, 33P, 3H, 35S) , de moléculas fluorescentes (5-bromodesoxiuridina, - fluoresceína, acetilaminofluoreno, digoxigenina) o incluso ligandos tales como la biotina. El marcado de las sondas se hace de preferencia por la incorporación de moléculas marcadas en el seno de los polinucleótidos por extensión de cebadores, o bien por añadido sobre los extremos 5' o 3' . Los ejemplos de marcado no radiactivo de fragmentos de ácidos nucleicos son descritos particularmente en la patente francesa n° FR 78 109 75 o incluso en los artículos de URDEA et al. (1988) o SÁNCHEZ-PESCADOR et al. (1988). De manera ventajosa, las sondas de acuerdo con la invención pueden tener características estructurales de naturaleza que permita una amplificación de la señal, tales como las sondas descritas por URDEA et al. (1991) o incluso en la patente europea n° EP-0 225 807 (CHIRON) . Las sondas oligonucleotídicas de acuerdo con la invención pueden ser utilizadas particularmente en las hibridaciones del tipo Southern con ADN genómico incluso en las hibridaciones de ARN mensajero correspondiente cuando la
iá¿A expresión del transcrito correspondiente es buscada en una muestra. Las sondas de acuerdo con la invención pueden también ser utilizadas para la detección de productos de amplificación PCR o incluso para la detección de desapareamientos . En las sondas o cebadores nucleotídicos de acuerdo con al invención pueden ser inmovilizados sobre un soporte sólido. Tales soportes sólidos son bien conocidos por el experto en la materia y comprenden superficies de pozos de placas de microtitulación, lechos de poliestireno, lechos magnéticos, bandas de nitrocelulosa, incluso micropartículas tales como partículas de látex. En consecuencia, la presente invención se relaciona igualmente con un procedimiento de detección de la presencia de un ácido nucleico tal como el descrito anteriormente en una muestra, dicho método comprende las etapas de: 1) poner en contacto una o varias sondas nucleotídicas de acuerdo con la invención con la muestra a probarse; 2) detectar el complejo eventualmente formado entre la o las sondas y el ácido nucleico presente en la muestra. De acuerdo con una modalidad particular del procedimiento de detección de acuerdo con la invención, la o
las sondas oligonucleotídicas son inmovilizadas sobre un soporte. De acuerdo con otro aspecto de, las sondas oligonucleotídicas comprenden un marcador detectable. La invención se relaciona además con un estuche o equipo para la detección de la presencia de un ácido nucleico de acuerdo con la invención en una muestra, dicho estuche comprende : a) una o varias sondas nucleotídicas tales como las descritas anteriormente; b) dado el caso, los reactivos necesarios para la reacción de hibridación. De acuerdo con un primer aspecto, el estuche o equipo de detección está caracterizado en que la o las sondas son inmovilizadas sobre un soporte. De acuerdo con un segundo aspecto, el estuche o equipo de detección está caracterizado en que las sondas oligonucleotídicas comprenden un marcador detectable. De acuerdo con una modalidad particular del equipo de detección descrito anteriormente, tal equipo comprenderá una pluralidad de sondas oligonucleotídicas de acuerdo con la invención, que podrán ser utilizadas para detectar las secuencias blanco de interés o alternativamente detectar las mutaciones en las regiones codificantes o las regiones no codificantes de los ácidos nucleicos de acuerdo con la invención, más particularmente, los ácidos nucleicos de las secuencias SEQ ID N°l a SEQ ID N°81, o los ácidos nucleicos de secuencia complementaria. Las sondas preferidas comprenderán todo o parte de los polinucleótidos de las secuencias SEQ ID N°82 a SEQ ID N°101. Así, las sondas de acuerdo con la invención inmovilizadas sobre un soporte pueden estar ordenadas en matrices tales como las 'pulgas de ADN" . Tales matrices ordenadas han sido particularmente descritas en la patente US N° 5,143,854, en las solicitudes PCT N° WO 90/150 70 y 92/10092. Las matrices de soporte sobre las cuales se han inmovilizado las sondas oligonucleotídicas a una alta densidad, son descritas por ejemplo en las patentes US N° 5,412,087 y en la solicitud PCT N° WO 95/11995. Los cebadores nucleotídicos de acuerdo con la invención pueden ser utilizados para amplificar uno de cualquiera de los ácidos nucleicos» de acuerdo con la invención, y más particularmente todo o parte de un ácido nucleico de la secuencia SEQ ID N°l a SEQ ID N°81, o incluso una variante del mismo. Otro objeto de la invención se relaciona con un procedimiento para la amplificación de un ácido nucleico de acuerdo con la invención, y más particularmente, un ácido
?? ?. i t.ri..¿i^ ^^^^ -*^¿ nucleico de la secuencia SEQ ID N°l a SEQ ID N°81, o un fragmento o una variante del mismo contenido en una muestra, el procedimiento comprende las etapas de: a) poner en contacto la muestra en la cual la presencia del ácido nucleico blanco se sospecha, con un par de cebadores nucleotídicos donde la posición de hibridación está localizada respectivamente del lado 5' y del lado 3' de la región del ácido nucleico blanco, cuya amplificación se busca, en presencia de los reactivos necesarios para la reacción de amplificación; y b) detección de los ácidos nucleicos amplificados. Para aplicar el procedimiento de amplificación tal como el definido anteriormente, se recurrirá ventajosamente a una cualquiera de los cebadores nucleotídicos descritos anteriormente. La invención tiene por objeto además un estuche de equipo para la amplificación de un ácido nucleico de acuerdo con la invención, y más particularmente, todo o parte de un ácido nucleico de las secuencias SEQ ID N°l a SEQ ID N°81, dicho estuche o equipo comprende: a) un par de cebadores nucleotídicos de acuerdo con al invención, en donde la posición de hibridación está localizada respectivamente del lado 5' y del lado 3' del ácido nucleico blanco cuya amplificación es buscada;
k* J.
b) dado el caso, los reactivos necesarios para la reacción de amplificación. Un estuche o equipo de amplificación tal comprenderá ventajosamente al menos un par de cebadores nucleotídicos tales como los descritos anteriormente.
Vectores recombinantes La invención es igualmente relativa a un vector recombinante que comprende un ácido nucleico de acuerdo con la invención. Ventajosamente, tal vector recombinante comprenderá un ácido nucleico elegido entre los ácidos nucleicos siguientes : a) un ácido nucleico que codifica para una proteína que tiene una secuencia de aminoácidos elegida en el grupo de la secuencia SEQ ID N°129 a SEQ ID N°160, o un fragmento peptídico o una variante de este último; b) un ácido nucleico que comprende un polinucleótido elegido en el grupo constituido de las secuencias SEQ ID N°l a SEQ ID N°81, o un fragmento una variante de este último; c) un ácido nucleico que tenga al menos 80% de identidad de nucleótidos con un ácido nucleico elegido en el grupo constituido por las secuencias SEQ ID N°l a SEQ ID N°81, o un fragmento o una variante de este último;
«*^^^^ rl?.-- d) un ácido nucleico que se hibride, en las condiciones de hibridación de fuerte astringencia, con un ácido nucleico de la secuencia SEQ ID N°l a SEQ ID N°81, o un fragmento o una variante de este último. Por 'vector" en el sentido de la presente invención se entenderá una molécula de ADN o de ARN circular o linear que está indiferentemente bajo la forma de hebra simple o hebra doble. De acuerdo con una primera modalidad, un vector recombinante de acuerdo con la invención es utilizado con el fin de amplificar el ácido nucleico que está insertado después de la transformación o transfección de la célula huésped deseada. De acuerdo con una segunda modalidad, se trata de vectores de expresión que comprenden, además un ácido nucleico de acuerdo con la invención, secuencias reguladoras que permiten dirigir la transcripción y/o la traducción. De acuerdo con una modalidad ventajosa, un vector recombinante de acuerdo con la invención comprenderá particularmente los elementos siguientes: 1) elementos de regulación de expresión del ácido nucleico a insertarse, tales como los promotores y los amplificadores/ 2) la secuencia codificante comprendida en el ácido nucleico de acuerdo con la invención a insertarse en un
vector tal, dicha secuencia codificante está colocada en fase con las señales de regulación descritas en (1); y 3) secuencias de iniciación y de detención de la transcripción apropiadas. Además, los vectores recombinantes de acuerdo con la invención podrán incluir uno o varios orígenes de duplicación en las células huésped en las cuales su amplificación o su expresión es buscada, marcadores o marcadores de selección. A modo de ejemplos, los promotores bacterianos podrán ser los promotores Lacl, LacZ, los promotores de ARN polimerasa del bacteriófago T3 o T7, los promotores PR, o PL del fago lambda. Los promotores para las células eucariotes comprenderán el promotor de la timidina cinasa del virus HSV o incluso el promotor de la metalotioneína-L de ratón. De manera general, para la elección de un promotor adaptado, el experto en la materia podrá referirse ventajosamente a la obra de SAMBROOK et al. (1989), citada anteriormente o incluso a las técnicas descritas por FULLER et al. (1996) . Los vectores bacterianos preferidos de acuerdo con la invención son por ejemplo pBR322 (ATCC371017) , o incluso los vectores tales como pAA-223-3 (Pharmacia, Uppsala, Suéde), et pGEMl (Priomega Biotech, Madison, Wl, ESTADOS UNIDOS) . Se pueden citar incluso otros vectores comercializados tales como los vectores pQE70, pQE60, pQE9 (Qiagen) , psiX174, pBluescript SA, pNH8A, pNH16A, pNH18A, PNH46A, pWLNEO, pSV2CAT, pOG44, PXTI, pSG (Stratagene) . Se puede tratar igualmente vectores del tipo baculovirus tal como el vector pV11392/1393 (Pharmingen) utilizado para transfectar las células de la línea Sf9 (ATCC N°CRL 1711) derivados de Spodoptera frugiperda . Se puede tratar incluso de vectores adenovirales tales como el adenovirus humano del tipo 2 ó 5. Un vector recombinante de acuerdo con la invención puede también ser un vector retroviral o incluso un vector adenoasociado (AAV) . Tales vectores adenoasociados son por ejemplo descritos por FLOTTE et al. (1992), SAMULSKI et al.
(1989), o incluso McLAUGHLIN BA et al . (1996).
Células huésped recombinantes La invención se relaciona también con una célula huésped recombinante que comprende un ácido nucleico de acuerdo con la invención, y más particularmente un ácido nucleico de la secuencias SEQ ID N°l a SEQ ID N°81, o incluso un ácido nucleico que comprende todo o parte de la región codificante de estos últimos.
De acuerdo con otro aspecto, la invención es igualmente relativa a una célula huésped recombinante que comprende un vector recombinante tal como el descrito anteriormente . Las células huésped preferidas de acuerdo con la invención son por ejemplo las siguientes: a) células huésped procariotas: cepas de
Escherichia coli (cepa DH5-a) , de Bacillus subtilis, de
Salmonella typhimuri um, o incluso de cepas de especies tales como Pseudomonas, Streptomyces y Staphylococus; b) células huésped eucariotes: células HeLa (ATCC N°XXL2), células Cv 1 (ATCC N°CCL70) , células COS (ATCC N°CRL 1650), células Sf-9 (ATCC N°CRL 1711), células CHO (ATCC N°CCL-61) o incluso células 3T3 (ATCC N°CRL-6361) . De acuerdo con otro aspecto, la invención se relaciona con un polipéptido que comprende una secuencia de aminoácidos elegida en el grupo constituido por los péptidos de secuencia SEQ ID N°129 a SEQ ID N°160, o un fragmento peptídico o una variante de este último. La invención se relaciona también con un polipéptido que comprende al menos quince aminoácidos consecutivos de una secuencia de aminoácidos elegida en el grupo constituido de los péptidos de las secuencias SEQ ID N°129 a SEQ ID N°160, o un fragmento peptídico o una variante de este último.
d) separar y purificar a partir de dicho medio de cultivo o incluso a partir de los lisadds celulares obtenido en la etapa c) , dicho polipéptido; e) dado el caso, caracteriz:ar el polipéptido recombinante producido.
Son igualmente parte de la invención los polipéptidos llamados 'homólogos" a uno cualquiera de los polipéptidos de las secuencias de aminoácidos SEQ ID N°129 a SEQ ID N°160, o de sus fragmentos o variantes. Tales polipéptidos homólogos tiene secuencias de aminoácidos que poseen una o varias sustituciones de un aminoácidos por un aminoácidos equivalente, con respecto a los polipéptidos de referencia. Se entenderá por aminoácido equivalente de acuerdo con la presente invención, por ejemplo el reemplazo de un residuo bajo la forma L por un residuo bajo la forma D, o incluso el reemplazo de un ácido glutámico (E) por un ácido piro-glutámico de acuerdo con las técnicas bien conocidas por el experto en la materia. A titulo ilustrativo, la síntesis de péptido que contiene al menos un residuo bajo la forma de se describe por KOCH (1977) . De acuerdo con otro aspecto, son igualmente consideradas como aminoácidos equivalentes dos aminoácidos que pertenecen a la misma clase, es decir, dos aminoácidos ácidos, básicos, no polares o incluso polares no cargados. Son igualmente parte de la invención los polipéptidos que comprenden al menos un enlace no peptídico tal como un enlace retroinverso (NHCO) , un enlace carba (CH2CH2) o incluso un enlace cetometileno (CO-CH2) .
De preferencia, los polipéptidos de acuerdo con la invención comprenden una o varias adiciones, supresiones, sustituciones de al menos un aminoácido que conservará su capacidad de ser reconocido por los anticuerpos dirigidos contra los polipéptidos no modificados.
Anticuerpos Los polipéptidos de acuerdo con la invención, en particular los polipéptidos de las secuencias de aminoácidos SEQ ID N°129 a SEQ ID N°160 o los fragmentos y las variantes de estos últimos, así como los péptidos homólogos pueden ser utilizados para la preparación de anticuerpos. Por 'anticuerpos" en el sentido de la presente invención, se entenderá particularmente los anticuerpos policlonales o monoclonales o los fragmentos (por ejemplo los fragmentos F(ab)'2, Fab), o incluso cualquier polipéptido que comprenda un dominio del anticuerpo inicial que reconozca el polipéptido o el fragmento del polipéptido blanco de acuerdo con la invención. Los anticuerpos monoclonales pueden ser preparados a partir de hibridomas de acuerdo con la técnica descrita por KOHLER y MILSTEIN (1975) . La presente invención se relaciona igualmente con anticuerpos dirigidos contra un polipéptido tal como el descrito anteriormente, o un fragmento o una variante de este
»^^^^^»tí^¿y¿« -M. A « ?É último, tales como los productos en la técnica del trioma o incluso la técnica del hibridoma descrito por KOZBOR et al. (1983) . La invención se trata igualmente con fragmentos de anticuerpos de cadena simple Fv (ScFv) , tales como los descritos en la patente US N° 4,946,778 o incluso por MARTINEAU et al. (1998). Los anticuerpos de acuerdo con la invención comprenden igualmente fragmentos de anticuerpos obtenidos con la ayuda de bancos de fagos RIDDER et al. (1995), o incluso de anticuerpo humanizados REIMANN et al. (1997); LEGER et al.
(1997) . Las preparaciones de anticuerpos de acuerdo con la invención son útiles en las pruebas de detección inmunológicas destinadas a la identificación de la presencia y/o de la cantidad de antígenos presentes en una muestra. Un anticuerpo de acuerdo con la invención podrá comprender además un marcador detectable isotópico o no isotópico, por ejemplo fluorescente o incluso ser acoplado a una molécula tal como la biotina, de acuerdo con las técnicas bien conocidas por el experto en la materia. Así, la mención tiene por objeto un procedimiento para detectar la presencia de un polipéptido de acuerdo con la invención es una muestra, dicho procedimiento comprende las etapas de: a) poner en contacto la muestra a probarse con un anticuerpo tal como el descrito anteriormente; b) detectar el complejo antígeno/anticuerpo formado . La invención es igualmente relativa con un estuche o equipo de diagnóstico o para la detección de la presencia de un polipéptido de acuerdo con la invención en una muestra, dicho estuche comprende: a) un anticuerpo tal como el definido anteriormente; b) un reactivo que permite la detección de los complejos antígeno/anticuerpo formados.
Método de tamizado de una molécula o de una sustancia que se fija sobre un polipéptido de acuerdo con la invención. Un polipéptido de acuerdo con la invención puede ser utilizado para tamizar las moléculas que se fijan sobre él. La fijación del polipéptido con la molécula o sustancia puede activar (molécula agonista) o inhibir (molécula antagonista) la actividad del dicho polipéptido. Tales moléculas capaces de fijarse sobre cualquiera de los polipéptidos de acuerdo con la invención comprenden los anticuerpos, los oligonucleótidos, otras proteínas y de manera general pequeñas moléculas de toda naturaleza.
¿^^^^^^ ^^-^^^ En una prueba tal de tamizado, se puede simplemente poner en evidencia la fijación de la molécula candidata a los polipéptidos, uno de los dos participantes está marcado por un compuesto detectable (polipéptido de interés o molécula candidata) , la visualización del complejo polipéptido/molécula candidata es entonces visualizada por la detección del marcador detectable, después de la eliminación de las moléculas candidatas no ligadas específicamente. A modo de ejemplo, una prueba de tamizado de una molécula candidata capaz de fijarse sobre un polipéptido de acuerdo con la invención, podrá comprender ventajosamente una primera etapa en el curso de la cual el polipéptido de interés o la molécula candidata se inmoviliza sobre un soporte, una segunda etapa, en el curso de la cual el segundo participante (molécula candidata o polipéptido de interés), se pone en presencia del primer compuesto en inmovilizada previamente sobre el soporte, una tercera etapa en el curso de la cual se efectúan uno o varios lavados en las condiciones apropiadas para la eliminación de los compuestos gue no están ligados específicamente, y finalmente una cuarta etapa en el curso de la cual el complejo eventualmente formado entre el polipéptido de interés y la molécula candidata es detectado. En la modalidad de prueba de tamizado de acuerdo con la cual la molécula candidata es inmovilizada previamente
Lt--t--t-?- t<.»*wtt¿t«t-^?l?at'; ^^¡^ del soporte, después se pone en presencia del polipéptido de interés de acuerdo con la invención, la detección del complejo formado por la molécula candidata y del polipéptido de interés de acuerdo con la invención, podrá ser realizada ventajosamente con la ayuda de un anticuerpo tal como el descrito anteriormente. En otra modalidad de la prueba de tamizado de acuerdo con la cual es el polipéptido de interés de acuerdo con la invención el que es previamente inmovilizado sobre el soporte, la molécula candidata será marcada ventajosamente con la ayuda de un marcador detectable previamente a su puesta en contacto con el polipéptido de interés inmovilizado. Tal marcador detectable puede ser radioactivo o no radioactivo, por ejemplo fluorescente o corresponder a un ligando para un tercer participante utilizado para la detección como una molécula de biotina. En consecuencia, la invención tiene igualmente por objeto un procedimiento de tamizado de una molécula o de una sustancia candidata que interactúa con un polipéptido de acuerdo con la invención, dicho método comprende las etapas de: a) poner en contacto un polipéptido de acuerdo con la invención con la sustancia o molécula candidata a probarse;
¿¿^^¡------l-tf-U- Kp-i-i*, b) detectar los complejos eventualmente formados entre dicho polipéptido y dicha sustancia o molécula candidata. La invención se relaciona igualmente con un estuche 5 o equipo para el tamizado de una molécula o de una sustancia candidata que interactúa con un polipéptido de acuerdo con la invención, dicho estuche comprende: a) un polipéptido de acuerdo con la invención; b) dado el caso, medios necesarios para la 10 detección del complejo formado entre el polipéptido y la molécula o sustancia candidata. La presente invención es ilustrada además, sin por lo tanto estar limitada, por los ejemplos siguientes:
15 EJEMPLOS
Ejemplo 1: Distribución tisular de los transcritos dß acuerdo con la invención El perfil de expresión de los polinucleótidos de 20 acuerdo con la presente invención se determina de acuerdo con los protocolos de análisis de manchado Northern y de transcripción inversa acoplada a la PCR, descritos particularmente por Sambrook et al (ref. CSH Sambrook, J., Fritsch, E.F., y Maniatis, T. (1989) 'Molecular Cloning: A
Laboratory Manual", 2a ed., Cold Spring Harbor Laboratory Press; Cold Spring Harbor, NY.). Por ejemplo, en el caso de un análisis por transcripción inversa, un par de cebadores sintetizados a partir de cualquiera de las secuencias nucleotídicas de los transcritos SEQ ID N°l a SEQ ID N°81, se utiliza para detectar el ADNc correspondiente. La reacción de la polimerasa en cadena (PCR) , se realiza sobre las matrices de ADNc correspondientes a los retrotranscritos de ARNm poliA+ (Clontech) . La transcripción inversa de ADNc es realizada con la enzima SUPERSCRIPT II (GibcoBRL, Life Technologies), de acuerdo con las condiciones descritas por el fabricante. La reacción de polimerasa en cadena se realiza de acuerdo con las condiciones estándar, en 20 µl de muestra de reacción con 25 ng de la preparación de ADNc. La mezcla de reacción esta compuesta de 400 µM de cada uno de los dNTP, de 2 unidades de Thermus aquiaticus (Taq) de ADN polimerasa (Ampli Taq Golg; Perkin Elmer), de 0.5 µ de cada cebador, de 2.5 mM de MgC12, y de amortiguador PCR. Treinta y cuatro ciclos de PCR (desnaturalización 30 s a 94°C, hibridación de 30 s descompuesta como sigue después de los 34 ciclos: 64 °C 2 ciclos, 61°C 2 ciclos, 58°C 2 ciclos y 55°C 28 ciclos y un alargamiento de un minuto por kilobase a 72°C) son realizados después de una etapa de desnaturalización a 94°C, durante 10 mín en un termociclador Perkin Elmer 9700. Las reacciones de PCR son visualizadas sobre un gel de agarosa por electroforesis. Los fragmentos de ADNc obtenidos pueden ser utilizados como sondas para un análisis por manchado Northern 5 y pueden igualmente ser utilizados para la determinación exacta de la secuencia polinucleotídica. En el caso de un análisis por manchado Northern, una sonda de ADNc producida como se describió anteriormente, es marcada con 32P gracias al sistema de marcado de ADN High
10 Prime (Boehringer) , de acuerdo con las instrucciones indicadas por el fabricante. Después del marcado, la sonda es purificada sobre una microcolumna de Sephadex G50
(Pharmacia) , de acuerdo con las instrucciones indicadas por el fabricante. La sonda marcada y purificada es entonces
15 utilizada para la detección de la expresión de los ARNm en los diferentes tejidos. El manchado Northern contiene las muestras de ARN de diferentes tejidos humanos ((Múltiple Tissue Northern, MNT, Clontech), Manchado 2, referencia 77759-1), y se híbrida
20 con la sonda marcada. El protocolo siguiente para las hibridaciones y lavados puede ser directamente descrito por el fabricante
(Manual de uso PT1200-1), como una adaptación de este protocolo utilizando los métodos conocidos por el experto en
mWi ^M^^ á s la materia y descritos por ejemplo en F. AUSUBEL et al (1999) . Se podrá también hacer variar por ejemplo, las temperaturas de prehibridación y de hibridación en presencia de formamida. Por ejemplo, se podrá utilizar el protocolo siguiente:
1 - Competencia de las membranas y prßhibridación: - Mezclar: 40 µl de ADN de esperma de .salmón
(lOmg/ml) + 40 µl de ADN de placenta humana (lOmg/ml) Desnaturalizar 5 min a 96°C, después sumergir en hielo la mezcla Sacar el SSC 2X y verter 4 ml de mezcla de formamida en el tubo de hibridación que contiene las membrana . Agregar la mezcla a los ADN desnaturalizados. - Incubación a 42°C durante 5 a 6 horas, con rotación.
2 - Competencia de la sonda marcada:
- * .i i Agregar a la sonda marcada y purificada 10 a 50 µl de ADN Cot 1, de acuerdo con la cantidad de repeticiones. Desnaturalizar 7 a 10 minutos a 95°C. - Incubar a 65°C durante 2 a 5 horas.
3 - HIBRIDACIÓN: Sacar la mezcla de prehibridación. Mezclar 40 µl de ADN de esperma de salmón + 40 µl de ADN de placenta humana; desnaturalizar 5 min a 96°C, después sumergir en hielo. Agregar en el tubo de hibridación 4 ml de mezcla de formamida, la mezcla de los dos ADN y la sonda marcada/ADN Cot I desnaturalizado. v - Incubar 15 a 20 horas a 42°C, con rotación.
4 - Lavados : Un lavado a temperatura ambiente en el SSC 2X, después enjuagar. - 2 veces 5 minutos a temperatura ambiente SSC 2 veces 15 minutos a 65°C SSC IX y SDS al 0,1% a 65°C. Después de la hibridación y lavado, el manchado es analizado después de una noche de exposición en contacto con
una pantalla de fósforo revelada con la ayuda de Storm (Molecular Dynamics, Sunnyvale, CA) .
Ejemplo 2: obtención de fragmentos de ADNc completos correspondientes a los transcriptos de acuerdo con la invención Pueden ser utilizados diferentes métodos para aislar el ADNc correspondiente a una de las clonas particulares entre las secuencias SEQ ID N°l a SEQ ID N°81. Por ejemplo, una clona completa puede ser directamente aislada por hibridación tamizando un banco de ADNc por medio de una sonda polinucleotídica específica de la secuencia del gen de interés. En particular, una sonda específica de 30-40 nucleótidos es sintetizada utilizando un sintetizador de marca Applied Biosystem/Perkin Elmer, de acuerdo con la secuencia elegida. El oligonucleótido obtenido es radiomarcado, por ejemplo con 32P-?ATP, utilizando la polinucleótido cinasa T4 y es purificado de acuerdo con los métodos usuales (por ejemplo Maniatis et al. Molecular clonign: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring, NY 1982 o incluso F. Ausubel et al. (Current Protocols in Molecular Biology, J. Wiley y Sons Eds, 1999) .
El banco de clonas que contiene el ADNc que queremos tamizar es fijado sobre un medio de cultivo en una caja de Petri (1.5% de agar) que contiene los antibióticos apropiados de acuerdo con los métodos usuales citados anteriormente (F. Ausubel et al.). Las colonias así producidas después de la incubación son transferidas sobre filtros de nitrocelulosa y tamizados por medio de la sonda nucleotídica radiomarcada, de acuerdo con los métodos usuales y las colonias que se hibridan con las sondas son aisladas y subclonadas . El ADN de las clonas así señalado y preparado es analizado por secuenciamiento. Las clonas que contienen los fragmentos que corresponden al ADNc completo son purificadas y reclonadas en el vector pcADN3 de los protocolos conocidos por el experto en la materia y presentados por ejemplo en F. Ausubel et al (1999) . Son conocidos diferentes métodos para identificar los extremos 5' y 3' del ADNc correspondientes a los genes descritos en la presente solicitud. Estos métodos incluyen pero no se limitan a la clonación por hibridación, a la clonación utilizando los protocolos similares o idénticos a la RACE-PCR 5' ó 3' (Amplificación Rápida del ADNc End-PCR) , que son bien conocidos por el experto en la materia. Por ejemplo, se podrá utilizar el equipo comercializado por la sociedad Clontech (Equipo ADNc Marathón Ready"11, protocolo referido PT1156-1), o alternativamente un método similar a al 5' RACE que está disponible para caracterizar el extremo 5' que carece de un ADNc (Fro ont-Racine et al. Nucleic Acid Res.21 (7) :1683-1684 (1993)). Brevemente, un oligonucleótido de ARN es ligado al extremo 5' de una población de ARNm. Después de la retrotranscripcíón de ADNc, un juego de cebadores específicos respectivamente del adaptador al ligado 5' y de una secuencia situada en 3' del gen de interés es utilizada en PCR para amplificar la porción 5' del ADNc buscado. El fragmento amplificado es a continuación utilizado para reconstruir el ADNc completo.
Ejemplo 3: Análisis del perfil dß expresión genética para la enfermedad de Tangier La verificación de la pérdida de expresión del gen candidato que entraña el genotipo celular de Tangier, puede ser determinado por la hibridación de estas secuencias con las sondas correspondientes al ARNm que proviene de los fibroblastos del sujeto que tiene o no la enfermedad, de acuerdo con los métodos descritos anteriormente:
1. Preparación del ARN total , del ARNm poli (A) * y de las sondas de ADNc Los ARN totales son obtenidos a partir de cultivos celulares de los fibroblastos de sujetos normales o bien que
.1 J t,,-l;af-.-.j-t. L-i-sufren de la enfermedad de Tangier por el método de isotiocianato de guanidina (Chomczynski & Sacchi, 1987) . Los ARNm poli (A) + son obtenidos por cromatografía de afinidad sobre columnas de oligo (dT) -celulosa (Sambrook et al., 1989), y los ADNc utilizados como sonda son obtenidos por RT-PCR (DeRisi et al., 1997) con los oligonucleótidos marcados con un producto fluorescente (Amersham Pharmacia Biotech; CyDyeMR) .
2. Hibridación y detección de los niveles de expresiones Las membranas de vidrio que contienen las secuencias presentadas en esta solicitud de patente, que corresponden al gen Tangier son hibridadas con las sondas del ADNc, obtenidas a partir de los fibroblastos (Lyer et al., 1999). La utilización del sistema Amersham/molecular Dynamics (Avalanche Microscanner1"1) permite la cuantificación de las expresiones de los productos de secuencia sobre el tipo celular sano o afectado.
Ejemplo 4: Construcción del vector de expresión en células de mamíferos . El gen de interés puede ser expresado en células de mamíferos. Un vector de expresión eucariótipico contiene un promotor que permite el inicio de la transcripción del ARNm,
kft . ? A,* j..., -.-.JHK* una secuencia que codifica para la proteína, y las señales requeridas para la terminación de la transcripción y para la poliadenilación del transcrito. Contiene también señales suplementarias como los amplificadores, la secuencia (de) Kozak y las secuencias necesarias para empalmar el ARNm. Una transcripción eficaz es obtenida con los elementos tempranos y tardíos de los promotores del virus SV40, los retrovirales LTR o el promotor temprano del vistus CMV. Sin embargo, los elementos celulares como el promotor de lactina pueden también ser empleados. Numerosos vectores de expresión pueden ser empleados para poner en práctica la presente invención como el vector pcDNA3.
Ejemplo 5: Producción de los polipéptidos El polipéptido que corresponde al transcripto parcial del gen GS N°XX o al ADNc completo descrito en el Ejemplo 2 (clonación del ADNc completo), puede ser fácilmente conocido en un sistema de expresión bacteriana, las células de insectos utilizando los vectores baculovirus o incluso en las células de mamíferos con o sin los vectores del virus de la vacuna. Todos los métodos son hoy en día bastante descritos y conocidos por el experto en la materia. Se encontrará por ejemplo, una descripción detallada en F. Ausubel et al. (1999).
Ejemplo 6: Producción de un anticuerpo derivado dß un polipéptido Los anticuerpos en la presente invención pueden ser preparados por diferentes métodos (Current Protocols In Molecular Biology Volumen 1, editado por Frederick M. Ausubel, Roger Brent, Robert E. Kingston, David D. Moore, J. G. Seidman, John A. Smith, Kevin Struhl Massachusetts General Hospital Harvard Medical School, capítulo 11) . Por ejemplo, las células que expresan un polipéptido de la presente invención son inyectadas en un animal con el fin de inducir la producción de suero que contiene los anticuerpos. En uno de los métodos descritos, las proteínas son preparadas y purificadas con el fin de evitar contaminaciones. Una preparación tal es entonces introducida en el animal con el objeto de producir antisueros policlonales de actividad mayor. En el método preferido, los anticuerpos de la presente invención son anticuerpos monoclonales. Tales anticuerpos monoclonales pueden ser preparados utilizando la técnica del hibridoma (Kohier et al, Nature 256:495(1975); Kóhler et al, Eur. J. Immunol. 6:511 (1976); Kohier et al, Eur. J. Immunol. 6:292 (1976); Hammeling et al., en: Monoclonal Antibodies and T-Cell Hybridomas, Elsevier, N.Y., pp. 563-681 51981) . En general, tales métodos implican inmunizar al animal (de preferencia un ratón) con un
"» *""* * **** * ¿ polipéptido, o mejor aún con una célula que exprese el polipéptido. Estas células pueden ser puestas en cultivo en un medio de cultivo tisular adecuado. Sin embargo, es preferible cultivar las células en un medio Eagle (modificado Earle) , suplementado con 10% de suero de bovino fetal (inactivado a 56°C) y adicionado con aproximadamente 10 g/l de aminoácidos no esenciales, con 1000 U/ml de penicilina y aproximadamente 100 µl de estreptomicina. Los esplenocitos de estos ratones son extraídos y fusionados con una línea celular de mieloma adecuada. Sin embargo, es preferible utilizar la línea celular del mieloma de origen (SP20) , disponible en él ATCC. Después de la fusión, las células de hibridoma resultantes son mantenidas selectivamente en medio, después clonadas por dilución límite como se describe por Wands et al. (Gastroenterology 80:225-232 (1981) ) . Las células de hibridomas obtenidas después de una selección tal son probadas con el fin de identificar las clonas que secretan los anticuerpos capaces de fijarse al polipéptido. Por otra parte, otros anticuerpos capaces de fijarse al polipéptido pueden ser producidos de acuerdo con un procedimiento de dos etapas utilizando anticuerpos antidiotípicos, tal método está clonado sobre el hecho de que los anticuerpos son ellos mismos antígenos y en consecuencia es posible obtener un anticuerpo que reconozca otro anticuerpo. De acuerdo con este método, los anticuerpos específicos de la proteína son utilizados para inmunizar un animal, de preferencia un ratón. Los esplenocitos de este animal son a continuación utilizados para producir las células de hibridomas, y estas últimas son tamizadas para identificar las clonas que producen un anticuerpo cuya capacidad de fijarse al complejo de proteína - anticuerpos específicos puede ser bloqueada por el polipéptido. Estos anticuerpos pueden ser utilizados para inmunizar un animal con el fin de usar la formación en mayor cantidad de anticuerpos específicos de la proteína. Será apreciado que Fab y F(ab')2 y los otros fragmentos de anticuerpos de la presente invención pueden ser utilizados de acuerdo con los métodos descritos aquí. Tales fragmentos son típicamente producidos por separación proteolítica, con la ayuda de enzimas tales como la papaína
(para producir los fragmentos Fab) o la Pepsina (para producir los fragmentos F(ab')2). Si no, los fragmentos secretados que reconocen la proteína pueden ser producidos aplicando la tecnología del ADN recombinante o de la química de síntesis. Para la utilización en vivo de los anticuerpos en el hombre, será preferible utilizar anticuerpos monoclonales quiméricos 'humanizados" . Tales anticuerpos pueden ser obtenidos utilizando los constructos genéticos derivados de
kis* células de hibridomas que producen los anticuerpos monoclonales descritos anteriormente. Los métodos para producir los anticuerpos quiméricos son conocidos por el experto en la materia. (Para una revisión, ver: Morrison, 5 Science 229:1202 (1985); Oi et al., Biotechnique 4:214 (1986); Cabilly et al., patente US n°4,816,567; Taniguchi et ' al., EP 171496; Morrison et al., EP 173444; Neuberger et al., WO 8601533; Robinson et al., WO 8702671; Boulianne et al; Nature 312:643 (1984); Neuberger et al., Nature 10 314:268(1985)).
Ejemplo 7: Corrección del fenotipo celular de la enfermedad de Tangißr La enfermedad de Tangier está caracterizada por un
15 catabolismo acelerado de las partículas lipoprotéicas de alta densidad (HDL) y una acumulación de colesterol en los tejidos. Especialmente, los fibroblastos de la piel de los pacientes que sufren de la enfermedad de Tangier, tienen la capacidad reducida de eliminar su contenido de colesterol por
20 los procesos de flujo de colesterol asegurados por la poliproteína A-l(apoA-l), proteína principal de las HDL
(Francis et al., 1995). Esta característica que corresponde a una pérdida de función es así encontrada en otras células fibroblásticas de pacientes que sufren de un déficit familiar
25 de HDL (Marcil et al., 1999).
ffi?W HMHH----M^BMmnHn?nMi?!rp???.^i .^i AAA^IÍ.IÍ^^ ¿-. TJ. ---.ü- i* ,., ¡^^^^^^^^^^í^^^^^j^-^^^^tf^ La corrección del fenotipo de los fibroblastos de Tangier puede ser asegurada por la transfección de los ADNc completos correspondientes a las secuencias compuestas, en dichas células. El ADNc es insertado en un vector de expresión que es a continuación transfectado de acuerdo con los métodos descritos a continuación:
1. Preparación de los cultivos fibroblásticos de sujetos normales y dß sujetos que sufren de la enfermedad de Tangier Los fibroblastos primarios de la piel humana son obtenidos por la puesta en cultivo de una biopsia de piel que proviene del antebrazo. Estas biopsias son efectuadas sobre pacientes que sufren de la enfermedad de Tangier que tengan las particularidades clínicas y bioquímicas de los 'homocigotos", es decir, amígdalas anaranjadas, concentraciones plasmáticas de apoA-1 y de colesterol HDL inferior a 5 por ciento. Las líneas de fibroblastos normales son obtenidas de American Type Culture Collection (Rockville, MD) . Los fibroblastos son cultivados en un medio EMMEM (medio esencial mínimo de Eagle modificado; GIBCO) completado por 10% de suero de bovino fetal, de glutamina a 2 mM, penicilina
100 Ul/ml y estreptomicina 100 µg/ml (medio designado por EMMEM 10) : en vista de la realización del estudio del flujo del colesterol, estas células son precargadas con colesterol por incubación de 24 con 50 µg/ml de colesterol en el medio descrito anteriormente sin suero de becerro, pero que contiene 2 mg/ml de albúmina bovina (BSA, fracción V) .
2. Estudio del flujo del colesterol Los fibroblastos precargados con colesterol que confluyen sobre las placas de 24 pozos, son incubados en el medio EMMEM 10 y 1 µCi/ml de 1, 2-3H-colesterol (50Ci/mmol; Dupont; Wilmington, DE) durante 48 horas. Aproximadamente 100 000 copos por minutos son obtenidos por pozo o 1000 copos por minuto por microgramo de proteína celular. Las células son lavadas tres veces con medios EMMEM/BSA e incubadas con este medio durante 24 horas antes de transfectar el gen de interés y comenzar el flujo agregando 10 µg/ml de proteoliposoma que contiene apo-A-I en medio EMMEM/BSA. Estas proteoliposomas son preparados por sonicación de fosfatidilcolina y apoA-I humana purificada (Joñas, 1986) . La transfección celular se efectúa por la técnica de precipitación de fosfato de calcio
(Sambrook et al., 1989). Después del periodo de flujo, generalmente 20 horas, el medio es recolectado, centrifugado (1000 g, 5 min), y la radioactividad determinada por conteo en centello líquido. La radiactividad desigual en las células es también determinada durante la noche después de la estación de los líquidos con isopropanol. El porcentaje de flujo es calculado dividiendo la radioactividad medida en el sobrenadante por la suma de las radiactividades medidas, en
l-ot-Aiá-ii *,! *-ß.aá ss,-<-_ _--L. , ¿í .
el sobrenadante, y el extracto celular. Se realiza un control interno por transfección de un gen marcador y la incubación durante 24 horas con un medio seco EMMEM/BSA y el proteoliposoma que contiene apoA-I. El flujo de control celular a partir de los fibroblastos normales y transfectados por un gen testigo que corresponde a 6+2% al momento en que este es obtenido a partir de los fibroblastos que sufren de la enfermedad de Tangier, y transfectados por este gen testigo es inferior a 1%. En cambio, la transfección de los fibroblastos que sufren de la enfermedad de Tangier por un plásmido que corresponde a los genes propuestos en esta descripción, permite restaurar la capacidad de estas células de eliminar su exceso de colesterol a un nivel correspondiente a aquel de los fibroblastos normales.
Ejemplo 8: Aislamiento dß las clonas genómicas que corresponden a un polinuclßótido El aislamiento de las clonas genómicas que corresponden a un transcrito se realiza por tamizado del banco de BAC ADN genómico humano (por ejemplo aquél proporcionado por Mel Simn, CalTech., ref: Kim et al. Genomics (1996), 34:213-218)) por PCR con cebadores específicos de la secuencia de ADNc que corresponde a la secuencia de los transcritos SEQ ID N°l a SEQ ID N°81 de
rf *!*.***. **Í?Í&. 1 * líJir-acuerdo con la invención, de acuerdo con el método descrito en el Ejemplo 1.
Ejemplo 9: Determinación del polimorfismo/mutación dß uno de los genes correspondientes a los transcritos dß acuerdo con la invención. La detección de polimorfismos y/o de mutaciones en las secuencias de los transcritos puede ser realizada de acuerdo con diferentes protocolos. El método de elección es el secuenciamiento directo. En el caso de un transcrito o donde la estructura del gen correspondiente no se conoce o se conoce parcialmente, es necesario determinar precisamente su estructura intron-exon, así como la secuencia genómica del gen correspondiente. Se trata por lo tanto, en un primer tiempo, de aislar la o las clonas de BAC de ADN genómico que corresponden al transcrito estudiado de acuerdo con el método descrito en el Ejemplo 8, de secuenciar el inserto de o las clonas correspondientes de determinar la estructura intron-exon comparando la secuencia de ADNc con aquella del ADN genómico obtenida. La técnica de detección de mutación por secuenciamiento directo consiste en comparar las secuencias genómicas del gen correspondiente al ADNc SEQ ID N°l a SEQ ID N°81, obtenidas a partir de al menos 8 individuos (4 individuos afectados por la patología estudiada y 4 individuos no afectados) . Las divergencias de secuencia constituyen los polimorfismos. Todo aquellos que modifique la secuencia de aminoácidos de la proteína silvestre son mutaciones susceptibles de afectar la función de dicha proteína que es interesante de considerar más particularmente en los estudios de asociación caso/testigo descrito en el ejemplo 8.
Ejemplo 10 Identificación del gen causal por la mutación causal o una diferencia transcripcional Entre las mutaciones identificadas de acuerdo con el método descrito en el Ejemplo 9, todas aquéllas asociadas con el fenotipo de la enfermedad son susceptibles de ser causales. La validación de estos resultados se hace secuenciando el gen en todos los individuos que están afectados y sus parientes (cuyo ADN está disponible) . Por otra parte, la realización del manchado en orden o RT-PCR de acuerdo con el método descrito en el Ejemplo 1, a partir del ADN específico de individuos afectados o no afectados, permite detectar variaciones notables del nivel de expresión del gen estudiado, en particular una ausencia de transcripción del gen.
- *• • » TABLA I BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN TABLA I (Continuación 1) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN TABLA I (Continuación 2) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN i t J r?*. a--- TABLA I (Continuación 3) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN ¡« A *ß TABLA I (Continuación 4) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN
10 15 20 25 TABLA I (Continuación 5) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN i- J¡t« ?«k;Í fj?^jfla & TABLA I (Continuación 6) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN
84 Sonda para la secuencia SEQ ID NO 4 85 Sonda para la secuencia SEQ ID NO 5 86 Sonda para la secuencia SEQ ID NO 10 87 Sonda para la secuencia SEQ ID NO 12 10 88 Sonda para la secuencia SEQ ID No 16 89 Sonda para la secuencia SEQ ID NO 16 90 Sonda para la secuencia SEQ ID NO 21
15 91 Sonda para la secuencia SEQ ID NO 23 92 Sonda para la secuencia SEQ ID NO 25 93 Sonda para la secuencia SEQ ID NO 27 94 Sonda para la secuencia SEQ ID NO 30 20 95 Sonda para la secuencia SEQ ID NO 33 96 Sonda para la secuencia SEQ ID NO 33 97 Sonda para la secuencia SEQ ID NO 35 25
TABLA I (Continuación 7) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN
& ii—? -—¿A¿^- TABLA I (Continuación 8) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN TABLA I (Continuación 9) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN k?ét.? Jt ¿» ad t , *L ,n * „•» ..ii- TABLA I (Continuación 10) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN 1- i ¿ aA ^- TABLA I (Continuación 11) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN kan* *,*+* .***.* .
TABLA I (Continuación 12) BREVE DESCRIPCIÓN DE LAS SECUENCIAS DE ACUERDO A LA INVENCIÓN ti»* .-t -; Í.j .¿ i -ias¿?fe**~*>" REFERENCIAS • BUSH et al., 1997, J. Chromatogr., 777: 311- 328. • FLOTTE et al., 1992, Am. J. ResPIR: (Secuencias PIR no redundantes, versión 57). Cell Mol. Biol., 7: 349-356. • HIGGINS et al. 1996, Methods Enzymol. 266: 383-402. • KOCH Y., 1997, Biochem. Biophys. Res. Commun., 74: 488-491. • KOHLER G. y MILSTEIN C, 1975, Nature, 256: 495. • KOZBOR et al., 1983, Hybridoma, 2(1): 7-16. • McLAUGHLIN BA et al., 1986, Am. J. Hum. Genet, 59: 561-569. • MERRIFIELD RB, 1965a, Nature, 207 (996) : 522- 523. • REIMANN KA, et al. 1997, AIDS Res Hum Retroviruses. 13 (11) : 933-943. • Ausubel et al., 1989, Current Protocoles in Molecular Biology, Green Publishing Associates and Wiley
Interscience, N. Y. • Beaucage et al., Tetrahedron Lett 1981, 22: 1859-1862.
aa= i ^.ij-j. iat • Brown EL, Belagaje R, Ryan MJ, Khorana HG, Methods Enzymol 1979; 68:109-151. • Bush et al., 1997, J. Chromatogr., 777: 311-328. • Flotte et al., 1992, Am. J. Respir. Cell Mol .
Biol . , 7: 349-356. • Fuller S. A. et al., 1996, I munology in Current Protocols in Molecular Biology, Ausubel et al. • Hames BD y Higgins SJ, 1985, 'Nucleic acid hybridization: a practical approach", Hames y Higgins Ed.,
IRL Press, Oxford. • Higgins et al., 1996, Methods Enzymol . 266:383-402. • Houbenweyl, 1974, in Meuthode der Organischen Chemie, E. Wunsch Ed., Volume 15-1 y 15-11. • Koch Y., 1977, Biochem. Biophys. Res. Commun., 74: 488-491 • Kohier G. y Milstein C, 1975, Nature, 256: 495. • Kozbor et al., 1983, Hybridoma, 2(1): 7-16. • Leger OJ, et al., 1997, Hum Antibodies, 8(1): 3-16
i ** ,-* -» jkj.fc as l^ • Martineau P, Jones P, Winter G, 1998, J Mol Biol, 280(1) : 117-127 • McLaughlin BA et al., 1996, Am. J. Hum. Genet . , 59: 561-569. • Merrifield RB, 1965a, Nature, 207(996): 522- 523. • Merrifield RB., 1965b, Science, 150(693): 178-185. • Narang SA, Hsiung HM, Brousseau R, Methods Enzymol 1979; 68: 90-98 • Reimann KA, et al., 1997, AIDS Res Hum Retroviruses. 13(11): 933-943 • Ridder R, Schmitz R, Legay F, Gram H, 1995, Biotechnology (NY) , 13(3): 255-260 • Rust S. et al., Nature Genetics, vol. 20,
Septiembre 1998, páginas 96-98 • Samulski et al., 1989, J. Virol . , 63: 3822-3828. • Sánchez-Pescador R., 1988, J. Clin . Microbiol . , 26(10): 1934-1938 • Urdea M. S., 1988, Nucleic Acids Research, 11: 4937-4957
hfcj*»»&*<-.ir »B»t.i,.. :- »J .» «^^ ^^¿^?¿*_¡ • Urdea MS et al., 1991, Nucleic Acids Symp Ser. , 24: 197-200. • Cho czynski, P., & Sacchi, N. (1987) Anal Biochem 1 62, 156-9. • DeRisi, J., Iyer, V., & Brown, P. (1997)
Science 278, 680-6. • Francis, G. A., Knopp, R. H., & Oram, J. F. (1995) Journal of Clinical Investigation 96, 78-87. • Iyer, V., Eisen, M., Ross, D., Schuler, G., Moore, T., Lee, J., Trent, J., • Staudt, L., Hudson, J. J., Boguski, M., Lashkari, D., Shalon, D., Botstein, • , & Brown, P. (1999) Science 283, 83-7. • Joñas, A. (1986) Reconsti tution of High Densi ty Lipoprotein, Vol. 128, • Academic Press, London. • Marcil, M., Yu, L., Krimbou, L., Boucher, B., Oram, J. , Cohn, J., & Genest, J. J. (1999) Arterioscler Thromb Vasc Biol 19, 159- 69. • Remaley, A. T., Schumacher, U. K., Stonik, J. A., Farsi, B. D., Nazih, H., &
Brewer, H. B. (1997) Arteriosclerosis Thrombosis and Vascular Biology 17, 1813-1821. • Sambrook, J., Fritsch, E. F., & Maniatis, T. (1989) Molecular Cloning, a Laboratory Manual , Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y. • F. Ausubel et al. Current Protocols in Molecular Biology, J. Wiley and Sons Eds, 1999 • Fromont-Racine et al. Nucleic Acid Res. 21(7): 1683-1684 (1993) Current Protocols In Molecular Biology Volume 1 editado por Frederick M. Ausubel, Roger Brent, Robert E. Kingston, David D. Moore, J. G. Seidman, John A. Smith, Kevin Struhl-Hospital General de Massachusetts Escuela Médica de Harvard, capítulo 11 • Kdhler et al, Nature 256 : 495 (1975) • Kdhler et al, Eur. J. Immunol. 6: 511 (1976) • Kóhler et al, Eur. J. Immunol. 6: 292 (1976) • Hammeling et al., en: Monoclonal Antibodies and T-Cell Hybrido as, Elsevier, N. Y., pp. 563-681 51981). • Wands et al. (Gastroentérology 80: 225-232
(1981) • Morrison, Science 229: 1202 (1985) • Oi et al., Biotechnique 4: 214 (1986).
i .1 AiA. -.ifcl ü-A-jl»*... -.tul.
Cabilly et al., Patente US n° 4,816,567 Taniguchi et al., EP 171496 Morrison et al., EP 173494 Neuberger et al., WO 8601533 Robinson et al., WO 8702671; Boulianne et al; Nature 312: 643 (1984) Neuberger et al., Nature 314 : 268 (1985) Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el convencional para la manufactura de los objetos a que la misma se refiere.
LISTADO DE SECUENCIAS <110> AVENTIS PHARMA S.A. <120> PRODUCTOS DE EXPRESIÓN DE GENES IMPLICADOS EN LAS ENFERMEDADES GENÉTICAMENTE LIGADAS AL SITIO 9q31-34 <130> Extensión FR61610K - AVENTIS
<140> <141>
<160> 160
<170> Patentln Ver. 2.1
<210> 1 <211> 552 <212> ADN <213> Homo sapiens
<400> 1 gggtaaatag ttgtgaacat aactattgtg aatactatgt tatatgttat agttgtgaat 60 gtaaatagta ttcacaattg tgaataosat gtaaatagct ttcacaattg tgaatacaat 120 gtaagtagct atgtaaatag tgaatacaat gtaaatagct atgtaaatag ttgttatgct 180 gattagggaa taatgagaag gaaaaaaagt atacatattc agtacagatg cagtcatctt 240 tttttcccct cgaacatttt tgatccacaa ttggttgaat ccacagatgg ggaacacaca 300 gtcttggtaa atttaaccaa caaggagggt aaacgcatcc caacagggaa ggtaaactgc 360
^A^É5^^^««^l^^SJ^^^^---------^g j^ ?^i.i-1.
acatccatca gtacctcttn gaggggcatc actggtttat aqgcttcaat tacagtggac 420 tatnttccag gantaatggg ccttttagtt tttccccnga angnttaant tggnggnttg 480 ccntttgttt ggantgagnt tantcnaacn tattgangta atttttaaag gggntttcat 540 aacagaaqgc ct 552
5 <210> 2 <211> 1246 <212> ADN <213> Homo sapiens 10 <400> 2 tagtggaatc agtaaggctt ggcagttgac cttgtttgtt ggagagaagg gataagattt 60 taaagctaca tgtctgaaag aatgatgctg ctgattgaaat aaaggaaga aaggatgcat 120 ttcgggctco aacctgtcct aqgaaggcct agacctcaaa caccaacacc tccatgcatt 180
15 tcctctttgg ctactatgtc ttttccctga cttctgcctc tccagctctc tgggctgctg 240 cttccacctg ttcatctgac ttagaccctc cctgctgggt ccttgttcac ctactcattt 300 ggtgcttcgt ctgccatcag tacctccatt goagctggtg ggatgtcagt caccatctct 360 tatatttgct tcccactaga aagatcaaga gaagttattt ctttcccttg cgotccaatt 420 tttctctaga cagttggtat ccacaatttt aaaaaatgtt ccatgtbgta taaacaagca 480
20 ttcgctgaga ggggctgtta atacacatcg tgcccctttt ataaaaattc atgcatggaa 540 tcctacatta ttatgcatca aaatctccag aaatgtctta ggatttttgc agggagaata 600 ttaaatgcat tgttttgctt tgttttgaag agactagatg tgcagaggaa gagaggtggc 660 atggtgggag ggtacatttg agttgtcaac agtctctgca gtgtcaggtc aattacatca 720 gcacttggac tggacgaggg aaaggaatga ttctgcttcc tgggaatgtc agaaggacct 780 25 gatgattata tttggcaaag ccaggaggag tggctttgaa tgtcattgct aagaattaca 840
ctttgagtag catttctgga tgtctgagct tttcaaatga tacttctttt ctgctgtggc 900 tttcctttct gttggactgg ttcccagagg gtcctcttgt ttgtccttgc cctcgctttt 960 atatcagttc atgttttctc ttctgtcatc ttccttccca gcgctgtttc tccaccccct 1020 cctgctgcac tcacaacagc ttcccctctc ctgtttagag gtggaagcat gtaagaatgc 1080 gtttgagggg gatgcttgcc aaaggacagc atattcaaca tctggtatca acaaggtaat 1140 gtttaacctt agactagcca aactagtgat gacctgcttc catgctgcat ctgctgcttt 1200 ttgtgttgat gggactcaga aatcatgaga aaggtcttca gtgatc 1246
<210> 3 <211> 3035 <212> ADN <213> Homo sapiens
<400> 3 aactgagcaa agattgcctt tgcttcacct attgacacat ttaagaacct cgttttatag 60 agagtacgga gtggggtctg agattctáca tttcttacaa gttcctggtt tatgccagtt 120 ctgtttgtct ggtcaccaca cttctgaata gcaaggtttc agaggactct atgaagtttt 180 tatttctcaa aaatttggct taggtacatc tttacataca gtggtgctag atattattct 240 ttcagaactt aaccatgcaa caatgcagaa gaatacaaaa aatgcttgca cacagtagtg 300 tattttaatg gaactataaa agcattcaac tgattcctaa ctttacatat aaaggataat 360 taaaccagca gcctaaagca ccttgctcta ctgttaatgg tacttatgag tttataacag 420 tagcttccaa ccttggctat gcattagaaa cagcatttta taaatgatta gtcccactgc 480 gtcccatttc cacaggattc tgattcaatt tacctgggct ggggccttgt cctctatatt 540 tttcagaagc tttacagggg attatgatgc ataattggga ttgagaatna ctgatgtagc 600 attcacaact gtgtctcatt ttattcttaa tcccatgagg ccatgcagaa ggaaggaaat 660
I rkc? U ? i gatgctcaga gaagaaccac ctggtgtcaa gcagatagct agccgaatgg caaagcagaa 720 cctcaatccc agatttcttg actccaaaat atgtagtcca aactgcctgc ccttgtccca 780 ttccttgagc tctatcatga attggtttta tcctgagagt cagatcacat tacagggtac 840 ttgtttcagt gtctccattt gtgagcaagt atatcacaat tcatttcact tttgagcagt 900 ttcttacccg aggtagaaat gcaataacca tttcttggta ggtggtgtag gggatagaca 960 ggtaaatatt aagacacagt tcatcatccc ccaccttggc aaattacgga cacagcccag 1020 taqggagtat aagggttgta cacagctatc atgcgcttga tcagtgcatg tcttcaaagt 1080 gcacttgtao ctcagcagag agctaagaag catgaaggaa gtcttcatgg aggagatggc 1140 actggagcta agtcttcaga gtcggcattt tggcaggtgg agattgggaa accagaggaa 1200 cttcactaga tgcaaggtcc tgttgaagat tcaaggtaat gagacacata attgagaggg 1260 agtgacagca tggggaattt ctgagtttgg gcagtaatgt gatcagaact gtactccagg 1320 aagaagagta gaagaaagaa ctgagtggag agaagactgg agtaggggat acgtaggagg 1380 gtttgtccct ggttaggatg agatgatagc aggacccaga agaggttgca gtaaaaccaa 1440 gagagacagc cgggtgcggt ggctcacgcc tgtaatccca gcacattggg aggccaaggc 1500 gggtggatca cctgaggtca ggagttcgcg agcagcctgg ccaacatggt gaaaccccgt 1560 ctatactaaa aatacaaaaa gatagccaga cgtggtggca ggcgcctgta atcctagcta 1620 cttgggaggc tgaggcaaga gaattgcttg aacccaggag gtggacgttg tagtgagcca 1680 agatcacacc attgcactcc agcctgggta acaagagtga aactccgtct ccaaacaaac 1740 aaacaaacaa acaaacccac gagggagatc agtgtgaagg gcattgccaa agtggaatca 1800 gtaaggcttg gcagttgacc ttgtttgttg gagagaaggg ataagatttt aaagctacat 1860 gtctgaaaga atgatgctgc tgattgaaat aaaggaagaa aggatgcatt tcgggctcca 1920 acctgtccta ggaaggccta gacctcaaac accaacacct ccatgcattt cctctttggc 1980 tactatgtct tttccctgac ttctgcctct ccagctctct gggctgctgc ttccacctgt 2040 tcatctgact tagaccctcc ctgctgggtc cttgttcacc tactcatttg gtgcttcgtc 2100 tgccatcagt acctccattg cagctggtgg gatgtcagtc accatctctt atatttgctt 2160 cccactagaa agatcaagag aagttatttc tttcccttgc gctccaattt ttctctagac 2220 agttggtatc cacaatttta aaaaatgttc catgttgtat aaacaagcat tcgctgagag 2280 gggctgttaa tacacatcgt gcccctttta taaaaattca tgcatggaat cctacattat 2340 tatgcatcaa aatctccaga aatgtcttag gatttttgca gggagaatat taaatgcatt 2400 5 gttttgcttt gttttgaaga gactagatgt gcagaggaag agaggtggca tggtgggagg 2460 gtacatttga gttgtcaaca gtctctgcag tgtcaggtca attacatcag cacttggact 2520 ggaccaggga aaggaatgat tctgcttcct gggaatgtca gaaggacctg atgattatat 2580 ttggcaaagc caggaggagt ggctttgaat gtcattgcta agaattacac tttgagtagc 2640 atttctggat gtctgagctt ttcaaatgat acttcttttc tgctgtggct ttcctttctg 2700
10 ttggactggt tcccagaggg tcctcttgtt tgtccttgcc ctcgctbtta tatcagttca 2760 tgttttctct tctgtcatct tccttcccag cgctgtttct ccaccccctc ctgctgcact 2820 cacaacagct tcccctctcc tgtttagagg tggaagcatg taagaatgcg tttgaggggg 2880 atgcttgcca aaggacagca tattcaacat ctggtatcaa caaggtaatg tttaacctta 2940 gactagccaa actagtgatg acctgcttcc atgctgcatc tgctgctttt tgtgttgatg 3000
15 ggactcagaa atcatgagaa aggtcttcag tgatc 3035
<210> 4 <211> 1479 <212> ADN 20 <213> Homo sapiens
<400> 4 gtctgcagaa ttcgcccttg ctgccaccta tgtaccagct attccagatg accaagccct 60 gctagaataa agactgactt ttcattgtga cctctgaagg atgtgcagct cagctttcac 120 25 ctatccccac gttcacccaa gccaaaaaga agaattgttc attcaaactg gaaatgatct 180
ccagcttgga aatgagactc ctcatgagct tattctaaga tcagagtctg aaaattattt 240 tctcaaaagt tacaaataaa tgtcttttaa cagtactgtc agactagtga ccaacaagtt 300 actttatgag gatggatgat gatattagag ttcaagcaat tgtccagttt gtttcgatgc 360 cacagtttgc ttttaaattc ccatagtgag cttccatctt gagacccact caacacagaa 420 ggattacata aaggttgatc acccacgctc tacagatgaa caaattgaga cccagagatg 480 ctaaactgct ctgcaggtca caaacctgaa cagcagcata gccaaaatgg gaacggagct 540 cttctgactt caagcccctg cacttttttc ttaaccacat taattttatg aatatctatg 600 tggtcaaagt ctcttttgta aaatctgagt ataagctgaa ctagatcatg tctctgtaag 660 ctaagatggc agaaacacat tgtcatgtta gtttggagga gcaaacagat ataagtatgt 720 gttgtaatgt tatagtgago tgttatgtat cccccagcaa tgtccaaagt gatcagagct 780 actagatgac ttattacaat gttcagatcc cactccttca ttcctcctct ctcagtgacc 840 tgtctacccc caagctttag aactgagctc tctccaactt agaactcatt agagtttgtt 900 gcattagtga ttggatctoc tcatgaaagt tttttgacca atgacagtag agccccttta 960 agctagccag gcccaagata gggaagcact gctggtttac atttctgctc tttctaattc 1020 agttgtctat tgcatgcaga catcccctgc ccgacttctc cattatggaa ggctaaggcc 1080 atccttcctt gtccagtttc tctacctaca cactaacatg ccttttcccc atggagtgaa 1140 ctctgccagt tgtctttgga cattttctgc agatgcaggc tcagttctgc tcttttgttc 1200 ccacccactt ctagatcttc ctccatttaa tcccttattc ttataaggag tctaattttt 1260 gtgtattgtc cttgattagg gcagctgaca gctttacacc aaagctgaag tctctcactt 1320 aatcctaagc aaggggctag ggagaactaa gatatccttc ccatatcaag ggatataggt 1380 tactagaagg gtggaggtct cttaacaggc tcactcacct ttcagagttt aaattatggt 1440 caggcttaag aagctctctc ttgtgactga gtgtattgc 1479
<210> 5 <211> 5169
IÜÉÉÉ <212> ADN <213> Homo sapiens
<400> 5 cagttctttt cattccatca ctttaggtga tgggtaagat ttttgaaagc cttatatttt 60 ttgattttgt tgtctagttt aatcctecct ttaatagttg tgtttggtaa aattcccact 120 tgaatgtgac actgataata attatgctga tttttagcat ctcttatagg aatcaaagtt 180 tattaaagtt acatagagga ttgaaaaatg tatatcactc aatttttatc taagaaggat 240 aggttataaa gggaggtacc taaatactca aataatgtat atattctttt tcataacata 300 tggaatgctt taagcaattg ttttgaaaaa aatctgcgta tctttgactt aattggcaca 360 tgactttttc aagcagccat tcatfcagag gtttgttttc tctcagtcct tttgctacat 420 tcactttctt ttcaaagaaa tgttaattat tacaaaaatt gacatag atatctttcccaa 480 acttggggta aaacccatgg ttatgtggaa cataactgtt cttaaaaagt caattataat 540 ttgtaactca catcctttga gctaaactaa attaaaatta cagtatttaa taattctttg 600 ggcattttta agaggtctga atttgtattt ttcttcattt ttgaaacttt acatttgttg 660 actttttttc attctcattt aaaatatatt gtgctatgat aaccaacctt cttccaagga 720 gtgaccatta ctgcctacat ttgcgttgct ttctacatag agacttgtat aatagtatta 780 atagtagctc attctctcta aaaatttact gcccactgag aggatgtttt gtttccttga 840 taaaacaaat gtaaatgagg aattttattt gaattggaat attgtttttc tagaggacat 900 tcatatctgc actattatct gatgacatgt tggtaatttt aaagactgca aggcagttta 960 gagaatgaag taaaccaata gatactcttt tgattctcca aagaaatata attttggttt 1020 ttgttcctca gagagagttt gaaagaaatt ttcagatgtt ctgttcccta tagagggcct 1080 attccaggat ctaaatgaat gggaatttat aattcctttc atagactcaa acctgaaagc 1140 agaaattttt agtagttgag ttgctttaag tgaattttaa caaatatgac acagaaaagg 1200 tcagatgctg ttgtataaaa ttttttacta gtgtgtctta tataattctt tcttctcatt 1260
- *» ? * i - aattcagtgc ctttttcctc taagcatact cttggtccat gccccatgca gtgtcaactg 1320 atgtttaagc tacagagcat tgttgtagtg gtgagggccc tctgttgcag gggcatgggg 1380 aaatgcatat attaatcagg ggctggagga gtatacatga ttcttgtgtt catgttgtca 1440 tttgaaactc ttcacataaa attttctaat attcatttgg aaaacctctc cactggagag 1500 gtttcatctc tgagaggttt tgtaataata gtgtaagttc agtaaatcca gtccaaattc 1560 tcatcacatg tattatttga tactaaattt tcaattatta cttcaaaata agagtctgag 1620 gatttcttct tactggcgtt cttaaaggtc tctaaaatta aagaacaaga tgtggttttt 1680 tgtttaagac gtttttagtt tatttgttgt taagttaaac tggagaaagt ttgtcatcct 1740 cattttcaaa ctgaaaaota atcaaatata gtgcctattt agtctcaaaa taaggtaact 1800 attaacttga ttatactata taatattcto aattacattt gaatttaaaa atattgagct 1860 cttgattaca atttaataca ttgtaaaaag tattaaatcc tttgaaacat cttttgttgc 1920 ttatttagtt tttgtttcta caggtcaaac atgattgctt tctataaaag aaatgcttga 1980 gaggttgact ataatggata tgtcacaggt ataaaacagt tgttttctaa aaacatgcat 2040 ttagtatggc attctctttt agcaactgaa ttcccaacga gttttattaa gctggatatc 2100 gaaatgaagg agctgcctta agcactttag aaaaagaatt tttttacaat tcattttgac 2160 tctcatggct gaccatgtca ttatgtcttt aaattttggt aaatatgtag ataccaagca 2220 ttaataacta atgcacacag aaatttaata tacagcaatt ctttgaatgt tccaggtgta 2280 cgtaaactaa ctgaaagtat taaggacatg cctgtctata catgggtttc attgatggta 2340 tctgtatcat cttgacaaat cgtgaactgc tgctgtatgg ctagactttg cctatttact 2400 ctgttatgca aacagtaatt tttccctatg ttatgaagag agacatattg gcttgcttta 2460 atttacttat ttatgaaatt aaagcatgaa taatatgtat aatttgaatt ttttgtgact 2520 gatccttggc agtataaatg ataaaagtaa atgtaatgga atcttttaat taggctaaga 2580 tatgctattt cataacttat gtagaatgat ttttatctat atactttgtc cataaaatta 2640 taattgttta tgtaatttta ttgtttctta tggaaacaat tggaaaagta tatggaaaat 2700 gattatttca aagaatattt atttaaagag ggaagtgtag acttcttact gtaaaatatg 2760 tgattccagg cttaagaaat tgattatatt ttaaaataat tattttttta aaaacgtaat 2820 ttgtttttaa aagatgagt ctccattcatt ggctaatcca tacagcaaat atttgagtgt 2880 ttgtgatatg gcagtaaaaa tgtgattact ttgtatgtac attaaccaaa accagtgaag 2940 tttgatggac tgtgcataga gttttgcagc ttttgagtag tgtgacagag tttgcctctt 3000 aaaattgttt tgctaataag tcagaagttt aaaatgtgt tatagtttgct aaaaaaaaat 3060 caaattaact gcatataaaa tggttcactt ttatatagtc acatgtaatg ggcctgaaaa 3120 agtttcttct ttgattatgt agttactcta gatacattct tttagggaag tgtatggtca 3180 acatatattt actcagtata cagataacca caaagttgt tatttttaacc aaaatataca 3240 tttcataatg ttggcactgg agtattataa gagatcatga atgtttcctt aattatcatg 3300 gcaagattac ctcacgttca gtatagttta gttttgtgtg tatcttacag tatgcatgtt 3360 ctgaaattat ttgtgatcct gatatgtcac atataatagc tttgttacct ggagtatttg 3420 attaacctaa acagtttaag cattttgaat tagttggagt ttaaatggat tacatttggt 3480 gtatattgtc ttcattgaaa agatattgtt ggatatgcca catcagagtt agcattgact 3540 tataaataaa taccagaatt taccagegta cacttttctc ttcagatgac tcaattatta 3600 aataaaagaa tatttcttat ttctgggtca atataaggta ctgacttctg atgcataatc 3660 acttaagcta tgtgagttta aactggtatc ttttcttagt ggtacccatt caatgtaagc 3720 tggtccatgg gaatggacat gaagaggat ttcacagtatg tagagcagaa ggcacgtgaa 3780 tgtgtttgct ttggcttgga gcttattaag ttttgactac ggttaaaata agtcaaatag 3840 taagtggtaa aacacatttt tgttagtatt ggaactttct ggagaacata agggctatga 3900 gaatgcat atatatattttt taacatttcc tatatatata aggtaccaaa gcactgagtc 3960 taatttacct attaagggag actctttaaa atcaacttta taactaattc atactataag 4020 aoagataata gctaaagttt tggaataatt tatattaaaa gccgcaagtc ttaaaaatcc 4080 ctggatatga cataaaaagg attttggctt cttttttgaa gtatttaaaa ttaatcacct 4140 tagctctacc atatactaga tctgtgaccg ctacacaaat tgtttatcat ctttgggtct 4200 ctattgcctt ctttataaaa taagtgtaag ttgttcagcc tgcctcacag ggctgttgtg 4260 aggaaataaa atgaaatgga gtatgtgaaa ttgcttcagc aacagcaaag tgctacgtaa 4320 atgtaaagtg ttgtttttag ctaataatgg atttaagtgt ttggataatt gtagatgcat 4380 ttactttgat aaagcgtgtg cttaaagtgg tatcaccagt gatttctaac atgattttaa 4440 aaaaataaaa ccccaattaa aatgttcttt aatattcatt taatttgtgc atgacttgtg 4500 gcctttttgt attttctcaa gcctattact ctagagctgt aaaagctctt gcacagcatt 4560 gttgtgtcag tgtagaatag tggcataaat aaatgaatta agctacattt ccatgcaggc 4620 atttgcactt tgaagttagg gctgcccagt gccacatgca aagagtgtat ttggtctaaa 4680 cagttctttc caaacaacca aatggctggg cagcttgttg tcacggataa atgatataaa 4740 atgtaaccac tgaacatttg acaactttgt tgcattatca tttttaaaaa aagatgaagc 4800 atttcaaaat cttgttaacc tggttatctc ttggtatete tcctgacata tttgttttgc 4860 tttaaattgg attaaatggt ttacaggtta tctgaatcta cagatttagt atgtctatta 4920 tctggacatg attttgctat gcagttgtga taataaaaat tetaattect caggtttggc 4980 cttttaagtt atggctgaag acctttaatg ataettatga tgcactcagt gccatacaat 5040 agtgttttaa gaagcacatg gcctcatttt cettagaaac aagacaaagc ctttttaaaa 5100 tgtttttttt tcactttaaa atagggtatt caaagtggag taacgtgtat tttgaaatga 5160 ttttgtgtt 5169
<210> 6 <211> 7723 <212> ADN <213> Homo sapiens
<400> 6 gtggggccgg gcggtgccgg tgcgggctgg ggcagtgcag tgagtagcgg tcttggggtg 60 tgcgatctcg ctgagcgtcc tcacacggtt cgtcgtctcg ggttcgagcc cagtgggctt 120
a Í*,*L*.?*ÍI*¡?AÍ *JuaL*?*, ^ * >*L?&-,». ..»».. »<-, «.-a.. -. ..« M ^g. ---g¡<-¡¡-,3 .-.. . .- . .? -..«J.^)a.iti.i? agccactcgc catggactcc cagaaatact gctttaagga gaatgaaaac gttacagttg 180 ataaagcctg ttttctgatc tctaacatca ctattggacc agagtctatt aacttgcagc 240 aggaagctct acagaggatc atttcaactc tggcaaataa aaatgatgaa attcagaact 300 ttattgatac actacatcat acactaaaag gagttcagga aaattcgtcc aacatactct 360 cagagttaga tgaagaattt gatagtttat actctatact ggatgaagta aaagaaagta 420 tgattaactg tatcaagcag gaacaagctc gtaaatccca agagttacag agtcagatta 480 gtcaatgtaa taatgccctg gagaactctg aagaactatt agaatttgca acaaggtcat 540 tagatataaa ggaacctgaa gaattttcaa aggctgccag acagatcaag gatagagtca 600 caatggcttc agcctttcgc ctttctttga aaccaaaggt cagtgacaac atgactcatt 660 taatggtgga tttctcacag gaaagacaga tgctgcaaac tttgaagttt ttgccagtcc 720 ccaaagctcc agagatagat ccagtagagt gtttggtggc agataactct gtaacagtgg 780 cttggagaat gccagaagaa gataataaga ttgaccattt tatactggaa cataggaaga 840 ctaattttga tggacttcca cgtgtaaagg atgagcgatg ctgggagata attgataata 900 ttaagggtac tgaatataca ctatcaggct taaaatttga ttcaaagtat atgaatttca 960 gagtgcgagc ttgtaacaag gctgtggctg gagagtattc tgatccagtg actctagaga 1020 ccaaagcact taacttcaat ttggataact cctcatccca tttgaacctg aaagttgaag 1080 atacatgtgt agagtgggat cctactggag gaaaaggtca agaaagtaaa attaaaggaa 1140 aagagaacaa gggcagtgtc catgttactt cactgaagaa acatacaaga agtggtacac 1200 catccccaaa acgaacatct gtaggctcca ggccaccagc agtaagaggc agtagagatc 1260 gttttactgg agaatcatac acagtgctgg gagacactgc tattgaaagt ggacaacatt 1320 attgggaggt caaggcccag aaggattgta aatcctacag tgtgggagta gcatacaaaa 1380 cgttggggaa atttgaccaa ttgggaaaga caaacactag agtcaaagct catgtcaaca 1440 actggctaca aaacacattt gcagcaaagc ataataataa ggtcaacttt ttggatgtta 1500 ctgttctgaa aaaataggtg tattttgtga ttttgatggg tttactcagc cattctatga 1560 tgcaaattct aaacagttgc tatattcctt taagacaaaa gggatgcagg cagtactacc 1620
.& í tggtttcatg gtatggtgtg gtggactttc tttgagtact tcagctagca ttccaagtgc 1680 tgtgagaaca cttcagaaaa gtgaaaatgg ttggtgtatc aatgactggt gcctgaacaa 1740 tgttgttact caatagtgtc tactcagaat acgtttaccc tccgtcttga ttaggtggcc 1800 ttttctgtgc agttactaat cacaggaatt tggtagtagt gaaaatcagg tttgctgtgt 1860 tctgctttga ggcctggaat cttttatcat taaacaccta gtacgaagca tttgcaggaa 1920 cctactgtgc agtatcatag aggcaagcag ataccaagca aaaaactgat gattgaagag 1980 taaatggggg aaaaggcagt gtttaattaa cataaaaact catttttgta tttcttggat 2040 tactttgact attctaatgt ttaattacat atggtaaccc taaggcctgg ggagaaaagc 2100 ttttaaatct tgccttcttt cttctgtact ttgtcttttt aaaatctcat tactatctat 2160 tatttagttc taacacagaa gctttaaaaa tacatagtca tccaaggttt tctaaaaatt 2220 gaaatcatat gttgggaatg gtaaaaaggt tttcaaatgg tttatttttc ctcttttata 2280 aataagtttt acaaaatttt cctcttttgt ttattgacta gattgtatat aattttcttt 2340 tttccaaaat attgtgataa gaaatttcta gacacaacag cttaaaatca cccaaatttc 2400 agttctttac ctaactgcac taacaatggc aaggggggta ttctttatat gttgccttgt 2460 ttaactacag ttcttttcat tccatcactt taggtgatgg gtaagatttt tgaaagcctt 2520 atattttttg attttgttgt ctagtttaat cctaccttta atagttgtgt ttggtaaaat 2580 tcccacttga atgtgacact gataataatt atgctgattt ttagcatctc ttataggaat 2640 caaagtttat taaagttaca tagaggattg aaaaatgtat atcactcaat ttttatctaa 2700 gaaggatagg ttataaaggg aggtacctaa atactcaaat aatgtatata ttctttttca 2760 taacatatgg aatgctttaa gcaattgttt tgaaaaaaat ctgcgtatct ttgacttaat 2820 tggcacatga ctttttcaag cagccattca ttcagaggtt tgttttctct cagtcctttt 2880 gctacattca ctttcttttc aaagaaatgt taattattac aaaaattgac atagatatct 2940 ttcccaaact tggggtaaaa cccatggtta tgtggaacat aactgttctt aaaaagtcaa 3000 ttataatttg taactcacat cctttgagct aaactaaatt aaaattacag tatttaataa 3060 ttctttgggc atttttaaga ggtctgaatt tgtatttttc ttcatttttg aaactttaca 3120
t*jSSá*& tttgttgact ttttttcatt ctcatttaaa atatattgtg ctatgataac caaccttctt 3180 ccaaggagtg accattactg cctacatttg cgttgctttc tacatagaga cttgtataat 3240 agtattaata gtagctcatt ctctctaaaa atttactgcc cactgagagg atgttttgtt 3300 tccttgataa aacaaatgta aatgaggaat tttatttgaa ttggaatatt gtttttctag 3360 aggacattca tatctgcact attatctgat gacatgttgg taattttaaa gactgcaagg 3420 cagtttagag aatgaagtaa accaatagat actcttttga ttctccaaag aaatataatt 3480 ttggtttttg ttcctcagag agagtttgaa agaaattttc agatgttctg ttccctatag 3540 agggcctatt ccaggatcta aatgaatggg aatttataat tcctttcata gactcaaacc 3600 tgaaagcaga aatttttagt agttgagttg ctttaagtga attttaacaa atatgacaca 3660 gaaaaggtca gatgctgttg tataaaattt tttactagtg tgtcttatat aattctttct 3720 tctcattaat tcagtgcctt tttcctctaa gcatactctt ggtccatgcc ccatgcagtg 3780 tcaactgatg tttaagctac agagcattgt tgtagtggtg agggccctct gttgcagggg 3840 catggggaaa tgcatatatt aatcaggggc tggaggagta tacatgattc ttgtgttcat 3900 gttgtcattt gaaactcttc acataaaatt ttctaatatt catttggaaa acctctccac 3960 tggagaggtt tcatctctga gaggttttgt aataatagtg taagttcagt aaatccagtc 4020 caaattctca tcacatgtat tatttgatac taaattttca attattactt caaaataaga 4080 gtctgaggat ttcttcttac tggcgttctt aaaggtctct aaaattaaag aacaagatgt 4140 ggttttttgt ttaagacgtt tttagtttat ttgttgttaa gttaaactgg agaaagtttg 4200 tcatcctcat tttcaaactg aaaactaatc aaatatagtg cctatttagt ctcaaaataa 4260 ggtaactatt aacttgatta tactatataa tattctcaat tacatttgaa tttaaaaata 4320 ttgagctctt gattacaatt taatacattg taaaaagtat taaatccttt gaaacatctt 4380 ttgttgctta tttagttttt gtttctacag gtcaaacatg attgctttct ataaaagaaa 4440 tgcttgagag gttgactata atggatatgt cacaggtata aaacagttgt tttctaaaaa 4500 catgcattta gtatggcatt ctcttttagc aactgaattc ccaacgagtt ttattaagct 4560 ggatatcgaa atgaaggagc tgccttaagc actttagaaa aagaattttt ttacaattca 4620
lasaaia- -n» HflHpfr' • -n-»~-> - •••» --« ^.«,-—B -•-.,.»<---.* -.-.a^ .. ..... ^ .-,-,,,,> , .x*^^ss ttttgactct catggctgac catgtcatta tgtctttaaa ttttggtaaa tatgtagata 4680 ccaagcatta ataactaatg cacacagaaa tttaatatac agcaattctt tgaatgttcc 4740 aggtgtacgt aaactaactg aaagta taa ggacatgcct gtctatacat gggtttcatt 4800 gatggtatct gtatcatctt gacaaatcgt gaactgctgc tgtatggcta gactttgcct 4860 atttaotctg ttatgcaaac agtaattttt ccctatgtta tgaagagaga catattggct 4920 tgctttaatt tacttattta tgaaattaaa gcatgaataa tatgtataat ttgaattttt 4980 tgtgactgat cottggcagt ataaatsata aaagtaaatg taatggaatc ttttaattag 5040 gctaagatat gctatttoat aacttatgta gaatgatttt tatatatata ctttgtccat 5100 aaaattataa ttgtttatgt aattttattg tttcttatgg aaacaattgg aaaagtatat 5160 ggaaaatgat tatttcaaag aatatttatt taaagaggga agtgtagact tcttactgta 5220 aaatatgtga ttcoaggctt aagaaattga ttatatttta aaataattat ttttttaaaa 5280 acgtaatttg tttttaaaag atgagtctcc attcattggc taatccatac agcaaatatt 5340 tgagtgtttg tgatatggca gtaaaaatgt gattactttg tatgtacatt aaccaaaacc 5400 agtgaagttt gatggactgt gcatagagtt ttgcagcttt tgagtagtgt gacagagttt 5460 gcctcttaaa attgttttgc taataa?tca gaagtttaaa atgtgttata gtttgctaaa 5520 aaaaaatcaa attaactgca tataaaatgt ttcactttta tatagtcaca tgtaatgggc 5580 ctgaaaaagt ttcttctttg attatgtaqt tactctagat acattctttt agggaagtgt 5640 atggtcaaca tatatttact cagtatacag ataaccacaa agttgttatt tttaaccaaa 5700 atatacattt cataatgttg gcactggagt attataagag atcatgaatg tttccttaat 5760 tatcatggca agattacctc acgttcagta tagtttagtt ttgtgtgtat cttacagtat 5820 gcatgttctg aaattatttg tgatcctgat atgtcacata taatagcttt gttacctgga 5880 gtatttgatt aacctaaaca gtttaagcat tttgaattag ttggagttta aatggattac 5940 atttggtgta tattgtcttc attgaaaaga tattgttgga tatgccacat cagagttagc 6000 attgacttat aaataaatao cagaatttac cagagtacac ttttctcttc agatgactca 6060 attattaaat aaaagaatat ttcttatttc tgggtcaata taaggtactg acttctgatg 6120
^C *¿L.f-*t?? -. . ,. „ s..m j ,4, .
cataatcact taagctatgt gagtttaaac tggtatcttt tcttagtggt acccattcaa 6180 tgtaagctgg tccatgggaa tggacatgaa gaggatttca cagtatgtag agcagaaggc 6240 acgtgaatgt gtttgctttg gcttggegct tattaagttt tgactacggt taaaataagt 6300 caaatagtaa gtggtaaaac acatttttgt tagtattgga actttctgga gaacataagg 6360 gctatgagaa tgcatatata tattttttaa catttcctat atatctaagg taccaaagca 6420 ctgagtctaa tttacctatt aagggagact ctttaaaatc aactttataa ctaattcata 6480 ctataagaca gataatagct aaagttttgg aataatttat attaaaagcc gcaagtctta 6540 aaaatccctg gatatgacat aaaaaggat tttggcttctt ttttgaagta tttaaaatta 6600 atcaccttag ctctaccata tactagatct gtgaccgcta cacaaattgt ttatcatctt 6660 tgggtctcta ttgccttott tataaaataa gtgtaagttg ttcagcctgc ctcacagggc 6720 tgttgtgagg aaataaaatg aaatggagta tgtgaaattg cttcagcaac agcaaagtgc 6780 tacgtaaatg taaagtgttg tttttagcta ataatggatt taagtgtttg gataattgta 6840 gatgcattta ctttgataaa qcgtgtgctt aaagtggtat caccagtgat ttctaacatg 6900 attttaaaaa aataaaaccc caattaaaat gttctttaat attcatttaa tttgtgcatg 6960 acttgtggcc tttttgtatt ttctcaagoc tattactcta gagctgtaaa agctcttgca 7020 cagcattgtt gtgtcagtgt agaatagtgg cataaataaa tgaattaagc tacatttcca 7080 tgcaggcatt tgcactttga agttagggct gcccagtgcc acatgcaaag agtgtatttg 7140 gtctaaacag ttctttccaa acaaccaaat ggctgggcag cttgttgtca cggataaatg 7200 atataaaatg taaccactga acatttgaca actttgttgc attatcattt ttaaaaaaag 7260 atgaagcatt tcaaaatctt gttaacctgg ttatctcttg gtatctctcc tgacatattt 7320 gttttgcttt aaattggatt aaatggttta caggttatct gaatctacag atttagtatg 7380 tctattatct ggacatgat tttgctatgca gttgtgataa taaaaattct aattcctcag 7440 gtttggcctt ttaagttatg gctgaagacc tttaatgata cttatgatgc actcagtgcc 7500 atacaatagt gttttaagaa gcacatggcc tcattttcct tagaaacaag acaaagcctt 7560 tttaaaatgt ttttttttca ctttaaaata gggtattcaa agtggagtaa cgtgtatttt 7620 gaaatgattt tgtgttctat atagaatgtc ccagttaaga ttttacagaa gcacctggaa 7680 tatctcatta aaaatttaaa aactcttaaa aaaaaaaaaa aaa 7723
<210> 7 <211> 1046 <212> ADN <213> Homo sapiens
<400> 7 ccttcagtgc tcagaggagc agacacagtt gctcactctc cactcaaagt tggtccaggc 60 cttgtgctaa ttaaaggagg aagcactgct gtagcgcaga aggaaaaggc cagtcctcca 120 cctgttcagc atgataatgc agctcccctg tggtaagggt tggtcggact acaatatctt 180 tgtgactttg atgaaagcat ctgcagttat aatgtggcaa agaaaaggat aattccagaa 240 tttcccattt ccatcatttg agcttgaaat atctgaatag atatttacaa aaccttgtga 300 agaagtcacc ttatttctca tgtttctaat gaacatatat aaacttctca tttccagctc 360 taggataagc aaacagaaaa aaattaccaa tgaaaagtta ggacttcaaa agaagtagtc 420 tgaactagat agattagatg tcatcctgtg aaataggttt accacatgat agggaagaac 480 tttcaaacag tacagggtct attttcagtt attcactatg aaatgagaac atttcacact 540 tgttaaaggt tgctttcaga agaaaagccc aactgatgaa tgtttttaaa aatgcactat 600 tgagagcgaa caacagactg gatgccataa ttttatagtc aagtttggga caagttttaa 660 gaaactgtgt tacaattcag agaaaagaca gttggtgacc atattaagag atatagggaa 720 cagatttaga tgatccaata tgcttattat cagaattcca gaaaaaggca tgaaatcata 780 aagaagacag aataccaggc aaaattaatg aaaaaatatt aatccaaaca catataataa 840 aaagtatcaa tttcaagaat aaaagaatta tataagcatt taacacacat aaacattggt 900 tacctgtaaa aggtgaaaaa aaaaaacagg ttcagatttt ctgcttaaat atcaaagggc 960
aaatggaaca tttttacgat cacctaaaat tcttgaaata ggccaagatt tttcatatac 1020 aaaggcaaca gccttcttgc cacaac 1046
<210> 8 <211> 280 <212> ADN <213> Homo sapiens
<400> 8 gggagaggag gcagaggcca gatcctcaaa aactcttcag tggtggactg aggtgcctgg 60 acttcagagg cgacaggagg gtagtgaggt ttctggagca ggctggtcaa agtcagcagc 120 acccttgttt gatatccatc ccattccctc accccacatc tacctgggac ttgcttctct 180 gaccctcctg ctgtggcaag atcc gattg tcccaggtgc acatggctct acttcctgac 240 tgctcatcct cacgcagtcc tcagcctct atgaccccccc 280
<210> 9 <211> 479 <212> ADN <213> Homo sapiens
<400> 9 aaatcaagaa catcattctc tcggtatctt tatggagcaa aatgtttatg gtagagacag 60 gtgaccttgc agctagccta accacattct ccaagtgtta attagatggt gcaatattca 120 catagaccta gagtccactg actatgaaag gctctgacct ttttgcggct tctttaccag 180 gagtgtataa tcttcctagt tcctaaatct ttctaagaga acctgactac ctccaggtct 240
___ au rf -,*i msrttt»C - **e* , ,-»- . ? Í t i t l agagggagca gccccttcac tatataacca atttccctga ctgcacatat ggtaattcca 300 tctatggtga ataatgaatc cattctaggc caaatagata ctcttatgca gagcccagct 360 gggacagtca cgtgcaagga gaaaagagaa agccagactg cagacatagc taatgcaaag 420 gcacggagat acagactaca caaactagaa gaaacgtaga gtaagctgct ttgtctctt 479
<210> 10 <211> 2599 <212> ADN <213> Homo sapiens
<400> 10 gaaatccagg ggaccaatgc attttatcac taaaactatt tttatataat tttaagaata 60 taccaaaagt tgtctgattt aaagttgtaa tacatgattt ctcactttca tgtaaggtta 120 tccacttttg ctgaagatat tttttattga atcaaagatt gagttacaat tatacttttc 180 ttacctaagt ggataaaatg tacttttgat gaatcaggga atttttttaa agttggagtt 240 tagttctaaa ttgactttac gtattactgc agttaattcc ttttttggct agggatggtt 300 tgataaacca caattggctg atattgaaaa tgaaagaaac ttaaaaggtg ggatggatca 360 tgattactgt cgataactgc agataaattt gattagagta ataattttgt catttaaaaa 420 cacagttgtt tatactgccc atcctaggat gctcaccttc caagattcaa cgtggctaaa 480 acatcttctg gtaaattgtg cgtccatatt cattttgtca gtagccagga gaaatgggga 540 tgggggaaat acgacttagt gaggcataga catccctggt ccatcctttc tgtctccagc 600 tgtttcttgg aacctgctct cctgcttgct ggtccctgac gcagagaccg ttgcctcccc 660 cacagccgtt tgactgaagg ctgctctgga gacctagagt aaaacggctg atggaagttg 720 tgggacccac ttccatttcc ttcagtcatt agaggtggaa gggaggggtc tccaagtttg 780 gagattgagc agatgaggct tgggatgccc ctgctttgac ttcagccatg gatgaggagt 840 gggatggcag caaggtggc tcctgtggcag tggagttgtg ccagaaacag tggccagttg 900 tatcgcctat aagacagggt aaggtctgaa gagctgagcc tgtaattctg ctgtaataat 960 gatagtgctc aagaagtgcc ttgagttggt gtacagtgcc atggccatca agaatcccag 1020 atttcaggtt ttattacaaa atgtaagtgg tcacttggcg attttgtagt acatgcatga 1080 gttacctttt ttctctatgt ctgagaactg tcagattaaa acaagatggc aaagagatcg 1140 ttagagtgca caacaaaatc actatcccat tagacacatc atcaaaagct tatttttatt 1200 cttgcactgg aagaatcgta agtcaactgt ttcttgacca tggcagtgtt ctggctccaa 1260 atggtagtga ttccaaataa tggttctgtt aacactttgg cagaaaatgc cagctcagat 1320 attttgagat actaaggatt atctttggac atgtactgca gcttcttgtc tctgttttgg 1380 attactggaa tacccatggg ccctctcaag agtgctggac ttctaggaca ttaagatgat 1440 tgtcagtaca ttaaactttt caatcccatt atgcaatctt gtttgtaaat gtaaacttct 1500 aaaaatatgg ttaataacat tcaacctgtt tattacaact taaaaggaac ttcagtgaat 1560 ttgtttttat tttttaacaa gatttgtgaa ctgaatatca tgaaccatgt tttgataccc 1620 ctttttcacg ttgtgccaac ggaatagggt gtttgatatt tcttcatatg ttaaggagat 1680 gcttcaaaat gtcaattgct ttaaacttaa attacctctc aagagaccaa ggtacattta 1740 cctcattgtg tatataatgt ttaatatttg tcagagcatt ctccaggttt gcagttttat 1800 ttctataaag tatgggtatt atgttgctca gttactcaaa tggtactgta ttgtttatat 1860 ttgtacccca aataacatcg tctgtacttt ctgttttctg tattgtattt gtgcaggatt 1920 ctttaggctt tatcagtgta atctctgcct tttaagatat gtacagaaaa tgtccatata 1980 aatttccatt gaagtcgaat gatactcaga agcctgtaaa gaggagaaaa aaacataagc 2040 tgtgtttccc cataagtttt tttaaattgt atattgtatt tgtagtaata ttccaaaaga 2100 atgtaaatag gaaatagaag agtgatgctt atgttaagtc ctaacaqtac agtagaagaa 2160 tggaagcagt gcaaataaat tacatttttc ccaagtgcca gtggcatatt ttaaaataaa 2220 gtgtatacgt tggaatgagt catgccatat gtagttgctg tagatggcaa ctagaacctt 2280 tgagttacaa gagtctttag aagttttcta accctgccta gtgcaagtta caatattata 2340 gcgtgttcgg ggagtgccct cctgtctgca ggtgtgtctc tgtgcctggg ggcttttctc 2400 cacatgctta ggggtgtggg tcttccattg gggcatgatg gacctgtcta caggtgatct 2460 ctgttgcctt tgggtcagca catttgttag tctcctgggg gtgaaaactt ggcttacaag 2520 agaactggaa aaatgatgag atgtggtccc caaacccttg attgactctg gggaggggct 2580 ttgtgaatag gattgctct 2599
<210> 11 <211> 222 <212> ADN <213> Homo sapiens
<400> 11 gtaggagaga agtatggcta cctttcactt ccaaagccaa tggtaagtag aagaattatg 60 tacattgcag aatgttttta ttcagaattc aaattatgct cttgttgcct gttgctgctc 120 ccctctacca caaataattg acatgacaga aaaaagttag gatattaatg ttgacttcag 180 agttgttatt ctgggtagca atctagttgt ggcttacact ct 222
<210> 12 <211> 3422 <212> ADN <213> Homo sapiens
<400> 12 gaagtcactg ataattataa ttagtttaaa tttattctta cactacttaa gaaaaatttc 60 atttagaaaa ggctascatg agatcttttg actatatgga gtagactgca tacagatctc 120 tttatttcta ttatgaatat tttagcgatt ataatcagct attccactga gtattagatt 180 tggtcactaa gtaactcatg tttttcttta gtcaatcatt cattcattca ctaaaacatt 240 tgttgagagt tggctaaact ctagattctg tgccaggcac tgtacagggt gatggagatc 300 actcataaga aggcctcttg ctcttagcca gatcatatgt aatactaaat ttaaattttt 360 tgcattaaaa ggctaaaaaa tcatttgttt ttgttaatta tatactggtt gatttataga 420 tgtaattagc acatattcat aagagacaaa tatatacaat gagttactat acatatacaa 480 agtgatttta gctgtataaa gtgatattgc aaaaaactac agctaatgtt tcttgctggg 540 taattattag cataaatatc aggttcttag aggtctttaa gagaatactt tagagctacc 600 aaaattagca gcagtgatgt aatatcacee tgaaatacca ggagcagagg tgccccagag 660 tgcttcacag ctatgatcag gaaacttgac ctgccccatt gctacagcaa cggcataagg 720 actaggaagg tccactagct ggggaggtct tggaaccctc cgagccagaa agaageatte 780 cageatgatt cctcagatgc aatgaggaag gtttacagaa ttttcacagg gcaacagaga 840 tcaagtggta tgaaaaggta ggagttttaa gctcaagtct caaagataac ctacctttac 900 attctcagtc agaatttgac ccagaaagag gaagtttctt caggaacaga ccgtacgttg 960 atgaagtaga agtcatttca gtaaaaacgg agtacagaac ttggtcataa tatcttgcat 1020 tttatagatt tattaaagat tagtttcaag ttcacattcg etatteagtt gtaaaccgaa 1080 tggatgggag gggagaaaat acaagctctc cacacaggta tgctcctctc ttttctgaga 1140 gagaaggcat gggattttca gcataaattc catgttatgt gagtgctgtt tgagttctga 1200 agttectate aatatctgtt cctgcaagtg atctctgtaa gaccacctta catgctggtc 1260 ttagttattg ttaaaattgc aaggtttctt cacaccctct ttgataagaa gtgtttagct 1320 ggcagagctt tcccttgact tctgagtcta gtgtgggttg gcccatgaca gtgggaagaa 1380 atecaacatg ttacatggag accttgtatg taaacaaact ctgtagcctt tgaaagtgga 1440 actgcttttt acagttaaag ggctgctaaa tggcttgcag atgagatctt ctggctcacc 1500 ttgatcttca catgaaccca ttgtgaccta tctggatttc ctaggacctg tagtttccat 1560 ttgggttata ttagtgcctc aggaatgtgt cactactggt caagcaatac tcagaaattc 1620
¿ aggctgtgag gggttagatt agaggaaagt aatttaggtg agctatccag agctttcaac 1680 ctcagggttt ataggaaaaa aaaacaaaat acaaaaaccc ttaggacttc tcatactcta 1740 gccctgacct tgcagtctcc tctgaggggc ctcctaagac ccttaaaata atattacaat 1800 aggactttga gtgtgcattt cacatgtgga aatacctctg gctagcatta cttccaaatg 1860 ctagttccag ctaaaaacaa gtacttttta ttagtttctt gtctttcaac attctgccat 1920 caaaatatat tcattttatt aacttaccga ttattgggaa cctgcaaaaa aaaaaaaaaa 1980 aacacacatg ctgtctgcag ccactgtttg gttatttttg atagtttaag agaattataa 2040 atcaagttgt tctgtctact agagtcagaa attctgtgct agaatgggac ttctaaaatt 2100 aggtggtcct gtcactttct agagaaegac ccaaattcat aggtttaagt ggcttgtctg 2160 acatacacat acagccagtt agtaacagaa ttcagaatag aatagagttc ttttttttct 2220 gtcagtccgt tgttctactt ctctttcctt ttcttcatgg ttgagcagct tttggcaaaa 2280 tgtgttccat atagcagtag ttccaagaga tgttaataga tgtaagaaaa aaagtgtgtg 2340 tgtgttgggg gtgggggatt gcatggtcaa ttaaaatgaa ggaatgctga gtttgtttcc 2400 ttactgtagg acttctaaga gttttgaaca tgctattaca cattgtgaat ttataaaagg 2460 ggacaaacac tgtttgacct tagactgcac tccccttctt tattcctcag agcatctcaa 2520 aggactacag ggtcctttga gaaacatggc ccttgatcaa gtttacaact ctttgagaag 2580 acatccctaa tggaaatact gaatggcaga tctattactg tggtaccatg tagtgtgtaa 2640 taaatcttga agtccagaaa gcaagtatat ttgctgttta gagctatact taaggtatag 2700 agattctttt ccacctgtgg tgtgtaaaat cagtattgtg tttaattttg caggtttttc 2760 aaggatcaac taatgtgcaa atacagtggt gatatattga tattacattt taataatgct 2820 tttgtatggc actttátagt tttcagacac cttttgtaac agccctgtga gacagacaat 2880 attatcctta ttgtacagat gggggggccc tggaggctct gaaaagtttt tggtgatatt 2940 cccctaagtt tataccacaa aatgatggag ccagaattta gttgcagaac ttctgactcc 3000 aagtccagag ttctttacta gacatctggt ttcttactag ctttttgcta gctttttatt 3060 ttacagtgaa aagtatggaa gcaaatcctg ataattttgg cttattatca aatatcattt 3120
attttttatt gcagagaccc agcagatgta actctcattg tagccatccc aaagaaaacc 3180 cttctttgcc ctttgcagtg ccacttattt aggtaactga agtgtatttc cagtacaatt 3240 tgattttgaa ctaagatttg atatagagt tgtaattgctt acataactct ttgaaaatgt 3300 atcatccctg ggttctcagg tgaaggaggc aattcaaaag taaaaaagaa tattcgaata 3360 caataaatac cctctgttct cacacaaatg ctgtttctta gctaacttgc tttgacaacc 3420 ta 3422
<210> 13 <211> 5791 <212> ADN <213> Homo sapiens
<400> 13 ctaatattat tggccagtct gtggaagaag ctatcagagg ggtgtttgat gcttccctca 60 aaatggctgg cttctatgga ttgtatacct ggctgactca tactatgttt ggcatcaata 120 ttgtcttcat accatcagca ttagcagcaa tccttggagc agtgccattc ctggggacat 180 actgggcagc agtacctgca gttcttgacc tgtggctgac acaagggtta ggatgcaagg 240 ccattttact gttgattttt catctcttgc caacatactt tgtagatact gcaatctact 300 ctgacatatc aggaggtg~c catccttacc tgacaggctt ggcagtggcc ggtggagcat 360 actacctagg cctggaagga gcaatcatcg gncctantct tctctgcata cttgtggttg 420 cttccaatat ctatagtgcc atgcta?tga gtccoacgaa ttcagttccc acgccaaacc 480 agaccccatg gcctgctcag cctcagcgga ctttccgtga catttctgaa gatctgaaat 540 cttcagtagg ttgatgtggt ttcctctgca ttgatttttc taggaagntc aaatttgaca 600 gcgagttcag ctcagctgtg gccntctgcc cttocagctg tgcctagcaa gcaaaaccca 660 ggaaagaagc agaagcctcc tggccttaca tacagaatgc ctggacaaga gagaacttgc 720
tgcgggctgc tttgtatttt aaaacacagc ttgagagttc agagttggtg gtttgctcac 780 ttaactgttg ttaagatggc ttgaaaagtt tcattttata cactggtacc ctggcttgaa 840 atttttccac tttggttatc tatgttacta tattatatat ttataaagtt attttaagaa 900 ctctaaacta cctgctgtta aaagaataga tggtgtaatt ttttcctggt ttaagaaatg 960 tattgttaaa cttttctaag acagtcactt ttcaaggaag agggctttca cttttgagtg 1020 tgtagttgag tgagcaggaa aaatgaatct tctaoccttc tcccacaatg tattatacgc 1080 tctttaagaa ataataaatc ataagtataa gggtggggtg gcttatttga tgttcagttt 1140 tatattataa ccotgggaga tacaaagact gaagctcttc ctcctcttcc ttttctcttc 1200 acgcttcttt acactattgc caaattataa aacttggctg accacgttga agtgaaanac 1260 ttattaagct gctatgaatg gtaacagtat gataaaattc atgctgttat taggttttct 1320 ccttccaggt ggttgaagtg aaaaatctca ggtgtagcaa tactctgatt tgttaaatgt 1380 atccgtttca ttatttggaa ctctgccaat aagttagttt tcagcagaat tttgtattta 1440 tgtagtattt tcccatctct tagcacagtg ccttgcacat gactctaaat gaatgcttgt 1500 tgaattgaat tgcagcttta aaaatatctc agatatcaca ataaccagca tagtgcttta 1560 cattttaoaa agtccttttg cacatactat ttcacaagta catcacatca gctttcatat 1620 agctttatat tattttacat cagttttaca ctgatggaga agctaaggtt cagaaaagtg 1680 accaactcaa agtcgtaaag tgtagtagga tttggcctca gatctttgac tccgttgtgt 1740 gcagattztg ctgtattagt gttccttcta aatattgtat gcagttttcc cagtgttang 1800 agattggtgt tgctatccat ttgttgngaa tgaagacttg tcctatagta catgacaggg 1860 ctgagagtgg actgtagttc ttagctgaac cctttctact gtttaaaaca atcatcaggc 1920 ctatcctctg ctcccagggg aatgtgggag agaaaagggt tcttggccag gctgtaggtg 1980 gtggctzaca tctgtaatcc cagcactttg gaaggctgag gngggtgggt tgcttgagcc 2040 cagggatttg agatcagcct aggcaacatg gcaaaacccc atctctacaa aaaaaaaaaa 2100 aaaaaaaaaa aaattagctg ggcacggtgg tgtggctana gtctgagcta ctcaggaggc 2160 tgatgtatga ggatcacctg agtccasgag gtcgaggctg cagtgagcca agatggcgcc 2220
»»-¿-»-¿a -* &...% . . .y*k^ .,¿-j. , , - . ,!.., , .. ,-^. . i t .. m~~****& actgcactcc agcctggotg agagagtgag acactgtccc aaggaaaaaa aaaagtgttg 2280 gggggtagtt cttaagcgtt gaagatttcc tttttggaaa gnatttaaag gtagaaatat 2340 taataatttt tcctaaaaca tctccctaag aagtcactga taattataat tagtttaaat 2400 ttattcttac actactnaag aaaaatttca tttagaaaag gctaccatga gatcntttga 2460 ctatatggag tagactgcat acagatctst ttacttctat tatgaatatt ttagcgatta 2520 taatcaccta ttocactgag tattagattt ggtcactaag taactcatgt tnttotttag 2580 tcaatcattc attcattcac taaaacattt gttgagagtt ggctaaactc tagattctgt 2640 gccaggcact gtacagggng atggagatca ctcataagaa ggcctcttgc tcttagccag 2700 atcatatgta atactaaatt taaatttttt gcattaaaag gctaaaaaat catttgtntt 2760 tgttaattat atactggttg atttatagat gtaattagca catattcata agagacaaat 2820 atatacaatg agttactata catatacaaa gtgattttag ctgtataaag tgatattgca 2880 aaaaactaca gctaatgttt cttgctgggt aattattagc ataaatatca ggttcttaga 2940 ggtctttaag agaatacttt agagctacca aaattagcag cagtgatgta atatcaccct 3000 gaaataccag gagcagaggt gccccagagt gcttcacagc tatgatcagg aaacttgacc 3060 tgccccattg ctacagcaac ggcataagga ctaggaaggt ccactagctg gggaggtctt 3120 ggaaccctcc gagccagaaa gaagcattcc agcatgattc ctcagatgca atgaggaagg 3180 tttacagaat tttcacaggg caacagagat caagtggtat gaaaaggtag gagttttaag 3240 ctcaagtctc aaagataacc tacctttaca ttctcagtca gaatttgacc cagaaagagg 3300 aagtttcttc aggaacagac cgtacgttga tgaagtagaa gtcatttcag taaaaacgga 3360 gtacagaact tggtcataat atcttgcatt ttatagattt attaaagatt agtttcaagt 3420 tcacattcgc tattcagttg taaaccgaat ggatgggagg ggagaaaata caagctctcc 3480 acacaggtat gctcctctct tttctgagag agaaggcatg ggattttcag cataaattcc 3540 atgttatgtg agtgctgttt gagttctgaa gttcctatca atatctgttc ctgcaagtga 3600 tctctgtaag accaccttac atgctggtct tagttattgt taaaattgca aggtttcttc 3660 acaccctctt tgataagaag tgtttagctg gcagagcttt cccttgactt ctgagtctag 3720 tgtgggttgg cccatgacag tgggaagaaa tccaacatgt tacatggaga ccttgtatgt 3780 aaacaaactc tgtagccttt gaaagtggaa ctgcttttta cagttaaagg gctgctaaat 38 0 ggcttgcaga tgagatcttc tggctcacct tgatcttcac atgaacccat tgtgacctat 3900 ctggatttcc taggacctgt agtttccatt tgggttatat tagtgcctca ggaatgtgtc 3960 actactggtc aagcaatact cagaaattca ggctgtgagg ggttagatta gaggaaagta 4020 atttaggtga gctatccaga gctttcaacc tcagggttta taggaaaaaa aaacaaaata 4080 caaaaaccct taggacttct catactctag ccctgacctt gcagtctcct ctgaggggcc 4140 tcctaagacc cttaaaataa tattacaata ggactttgag tgtgcatttc acatgtggaa 4200 atacctctgg ctagcattac ttccaaatgc tagttccagc taaaaacaag tactttttat 4260 tagtttcttg tctttcaaca ttctgccatc aaaatatatt cattttatta acttaccgat 4320 tattgggaac ctgcaaaaaa aaaaaaaaaa acacacatgc tgtctgcagc cactgtttgg 4380 ttatttttga tagtttaaga gaattataaa tcaagttgtt ctgtctacta gagtcagaaa 4440 ttctgtgcta gaatgggact tctaaaatta ggtggtcctg tcactttcta gagaaagacc 4500 caaattcata ggtttaagtg gcttgtctga catacacata cagccagtta gtaacagaat 4560 tcagaataga atagagttct tttttttctg tcagtccgtt gttctacttc tctttccttt 4620 tcttcatggt tgagcagctt ttggcaaaat gtgttccata tagcagtagt tccaagagat 4680 gttaatagat gtaagaaaaa aagtgtgtgt gtgttggggg tgggggattg catggtcaat 4740 taaaatgaag gaatgctgag tttgtttcct tactgtagga cttctaagag ttttgaacat 4800 gctattacac attgtgaatt tataaaaggg gacaaacact gtttgacctt agactgcact 4860 ccccttcttt attcctcaga gcatctcaaa ggactacagg gtcctttgag aaacatggcc 4920 cttgatcaag tttacaactc tttgagaaga catccctaat ggaaatactg aatggcagat 4980 ctattactgt ggtaccatgt agtgtgtaat aaatcttgaa gtccagaaag caagtatatt 5040 tgctgtttag agctatactt aaggtataga gattcttttc cacctgtggt gtgtaaaatc 5100 agtattgtgt ttaattttgc aggtttttca aggatcaact aatgtgcaaa tacagtggtg 5160 atatattgat attacatttt aataatgctt ttgtatggca ctttatagtt ttcagacacc 5220
y ... ,- .f--t...... ^ &¡¡tái *a*¿á* ^ ^^ ttttgtaaca gccctgtgag acagacaata ttatccttat tgtacagatg ggggggctct 5280 ggaggctctg aaaagttttt ggtgatattc ccctaagttt ataccacaaa atgatggagc 5340 cagaatttag ttgcagaact tctgactcca agtccagagt tctttactag acatctggtt 5400 tcttactagc tttttgctag ctttttattt tacagtgaaa agtatggaag caaatcctga 5460 taattttggc ttattatcaa atatcattta ttttttattg cagagaccca gcagatgtaa 5520 ctctcattgt agccatccca aagaaaaccc ttctttgccc tttgcagtgc cacttattta 5580 ggtaactgaa gtgtatttcc agtacaattt gattttgaac taagatttga tatagagttg 5640 taattgctta cataactctt tgaaaatgta tcatccctgg gttctcaggt gaaggaggca 5700 attcaaaagt aaaaaagaat attcgaatac aataaatacc ctctgttctc acacaaatgc 5760 tgtttcttag ctaacttgct ttgacaacct a 5791
<210> 14 <211> 2615 <212> ADN <213> Homo sapiens
<400> 14 acccaaactt caaaactggt caataattaa caatgtatta attttgaaaa gtttttaact 60 gtaagagtat caaatataat acagagctct taaatactta aagctttctg tcacaatatt 120 aaaaataaaa cttcttagca ttccaagact atgaaaagtg ccccctccca attttttaag 180 caagtaatag tatctgctgg tgtttatatt tgttaaaaat ttaaaataac aacaacaaaa 240 aaaaaacttc taacttgaat gtgatgtgac ttgagtactt ctaaaccatc gaaaatacct 300 gatacgggga gtaggttcat ggttttggta aaagaaacta tgtcacagag ttttaatatt 360 ataactggac ttctaaatca taaagtaaga aaattaacat catttagtat cttttcttgt 420 ttgtttttta ttttgctaag aaggaaccag attttatatc atcattcttc atctaaatgg 480 actgccatat gaagttctgg tttctctgtt tcttcttggt tagctggtta ctaccaaatg 540 cctaaggaca attctcagag catttccaca tgaaggtgat tagttttcat ttaataaaat 600 taataacaca ttacatgtag atgaaaatat aacaaaacca tacgaaagct tgtcagagat 660 attcaactag aaaactaaaa cagtagccac tagaaaaaag acatagtgga aaaatttttg 720 aacggatatg ctttttgttg aataattaca gtaattacta ccaatatatt cagaccaaca 780 aagattagaa agaacatgca aaatgctgag aaaatttctc ctacaattaa aacaaatgtg 840 tttttatgag agagaaaaaa ataagtcaag ctcctaaaat gaaaattaca aaacatagga 900 ttaacaattt attaaaaatt acacccttga tttttttgag gccaaaaaaa gtagtttttt 960 taaaacaagg gcatgaaaaa gacttcagat taagactcat actctgttct aaatgaaaag 1020 tagtaaaact acttctagta gaaaatacct gctatggaaa aaaaatttca gatattttcc 1080 atttgatgta ggtattaata aaaaatatga tgtttatatc taaaatataa actagcaatt 1140 tattttcatt tataatataa agtgttttag gaaaagttta ctcttctcag tgttcaaaat 1200 aaaataggaa ttgttetcca tacctagcaa ttttaatgat aatgtcaagt aaaaatttaa 1260 ttctgctgaa ctaaagctca aatagattca aattttaaaa atatgaaaaa tctacatttt 1320 taaaagctta aaatttttgt tactttgcaa tgacagatct gctttttcta acatttaaaa 1380 aattttgtct tcttttatta atataaaact attcaaataa tcacaacaga atctcttata 1440 ccggtaaagc ataatcacat gatacactcg taacactcta caaatacaat ccagaaaggg 1500 gaagtctccc tcaaacaaag aatttctttc tttctgtcac ctccattcca tatatatagt 1560 cttcatttca catcacatac atagaaaaat tagcacaata taacaggtag ataagaaaaa 1620 aaatttttgg ccttgtagag ctcatcacgt aaatttattc attcttctta gtatgtttct 1680 ttttaacatt atctgaggca acatctaccg gctttgaggc caatgaccca acgccattgg 1740 aaggtgactt tgcttcactt ttcttctcac atgatgaaaa cggctgctgc cagccaaata 1800 gcatccaact caatgtatcc tcaaaaggag caaatgtcat agtagaagtc tgtgtagtca 1860 tcatggttat ctttgtggcc acaataaaga tggtataaag gaacataaga ttatgctttg 1920 atattgccag atgctgggtg tgctggaatg tgaagataac tgaccccagc agggttacct 1980 tggcagggta tgacatcttc agccattcat caccttctgg tttccaatct ccttttacca 2040 acctctcaaa attcgttata atggtaccac ctgcacctcg ggcccatcca atagctatca 2100 tgactatcca gccatttttg taatagctat tagcatgtgt gactccacct actattttcc 2160 aagttctggt cacttccttc attcccgaag ccagtagttg aacaggtaga tatgaatagc 2220 cctgggaaac taggtcatgc gggcaaaaaa atgtaatata ccagattgaa gatgccagta 2280 atatgttagt gtggtttgca agaaacttca atggaggctc tgcaagcagt agacaggata 2340 aaattcctcc accaaaacag tggagcatag cagtaaacca gcttgaaata ggattcttcc 2400 atgccaatgc agctgctccc ggctgacgtt tcaccgccat cactgacact agatagtgcg 2460 cgatgtcaaa aaagggaaac atggacgtgc gggagaaggc cagagccaac tcgtcccatg 2520 gagaatccat aacgaccacc gaccgcggca accgaagcag ccgcggctac tggttccccg 2580 cgctcgcgcg gtgaggagta ggagagggca cagcc 2615
<210> 15 <211> 2551 <212> ADN <213> Homo sapiens
<400> 15 ggctgtgccc tctcctactc ctcaccgcgc gagcgcgggg aaccagtagc cgcggctgct 60 tcggttgccg cggtcggtgg tcgttatgga ttctccatgg gacgagttgg ctctggcctt 120 ctcccgcacg tccatgtttc ccttttttga catcgcgcac tatctagtgt cagtgatggc 180 ggngaaacgt cagccgggag cagctgcatt ggcatggaag aatcctattt caagctggtt 240 tactgctatg ctccactgnn tnggtggagg aattttatcc tgtctactgc ttgcagagcc 300 tccattgaag tttcttgcaa accacactaa catattactg gcatcttcaa tctggtatat 360 tacatttttt tgcccgcatg acctagtttc ccaggctatc tcatatctac ctgttcaact 420 actggcttcg ggaatgaagg aagtgaccag aacttggaaa atagtagtgc gagtcacaca 480 tgctaatagc tattacaaaa atggctggat agtcatgata gctattggat gggcccgagg 540 tgcaggtggt accattataa cgaattttga gaggttggta aaaggagatt ggaaazcaga 600 aggtgatgaa tggctgaaga tgtcataccc tgccaaggta accctgctgg ggtcagttat 660 cttcacattc cagcacaccc agcatctggc aatatcaaag cataatctta tgttccttta 720 taccatcttt atngtggcca caaagataac catgatgact acacagactt ctactatgac 780 atttgctcct tttgaggata cattgagttg gatgctattt ggctggcagc agccgttttc 840 atcatgtgag aagaaaagt~ aagcaaagtc accttccaat ggcgttgggt cattggcctc 900 aaagccggta gatgttgcct cagataangt taaaaagaaa catactaaga agaatgaata 960 aatttacgtg atgagctcta caaggccaaa aatttttttt cttatctacc tgttatattg 1020 tgctaatttt tctatgtatg tgatgtgaaa tgaagactat atatanggaa tggaggtgac 1080 agaaagaaag aaattctttg tttgagggag acttcccctt tctggattgt atttgtagag 1140 tgttacgagt gtatcatgtg attatgcttt accggtataa gagattctgt tgtgattatt 1200 tgaatagttt tatattaata aaagaagaca aaatttttta aatgttagaa aaagcagatc 1260 tgtcattgca aagtaacaaa aattttaagc ttttaaaaat gtagattttt catattttta 1320 aaatttgaat ctatttgagc tttagttcag cagaattaaa tttttacttg acattatcat 1380 taaaattgct aggtatggag aacaattcct attttatttt gaacactgag aagagtaaac 1440 ttttcctaaa acactttata ttataaatga aaataaattg ctagtttata ttttagatat 1500 aaacatcata ttttttatta atacctacat caaatggaaa atatctgaaa ttttttttcc 1560 atagcaggta ttttctacta gaagtagttt tactactttt catttagaac agagtatgag 1620 tcttaatctg aagtcttttt catgcccttg ttttaaaaaa actacttttt ttggcctcaa 1680 aaaaatcaag ggtgtaattt ttaataaatt gttaatccta tgttttgtaa ttttcatttt 1740 aggagcttga cttatttttt tctctctcat aaaaacacat ttgttttaat tgtaggagaa 1800 attttctcag cattttgcat gttctttcta atctttgttg gtctgaatat attggtagta 1860 attactgtaa ttattcaaca aaaagcatat ccgttcaaaa atttttccac tatgtctttt 1920
iÁú-1 ,%.* --..;- ttctagtggc tactgtttta gttttctagt tgaatatctc tgacaagctt tcgtatggtt 1980 ttgttatatt ttcatctaca tgtaat?tgt tattaatttt attaaatgaa aactaatcac 2040 cttcatgtgg aaatgctctg agaattgtcc ttaggcattt ggtagtaacc agctaaccaa 2100 gaagaaacag agaaaccaga acttcatatg gcagtccatt tagatgaaga atgatgatat 2160 aaaatctggt tccttcttag caaaataaaa aacaaacaag aaaagatact aaatgatgtt 2220 aattttctta ctttatgatt tagaagtcca gttataatat taaaactctg tgacatagtt 2280 tcttttacca aaaccatgaa cctactcccc gtatcaggta ttttcgatgg tttagaagta 2340 ctcaagtcac atcacattca agttagaagt tttttttttg ttgttgttat tttaaatttt 2400 taacaaatat aaacaccagc agatactatt acttgcttaa aaaattggga gggggcactt 2460 ttcatagtct tggaatgcta agaagtttta tttttaatat tgtgacagaa agctttaagt 2520 atttaagagc tctgtattat atttgatact c 2551
<210> 16 <211> 775 <212> ADN <213> Homo sapiens
<400> 16 tctatccgtc cgcgtcagcg ccttgccacc ctcatctcca atatgcctgg tccgaccccc 60 agtggcacta acgtgggat cctcagggcgc tctcccagca aagcagtggc cgcccgggcg 120 gcgggatcca ctgtccggca gaggtaagga accctgcagt tcgttcgctt ccagactcgg 180 agataggacc cagaacctcg ctgattctgg ggtggagacc ctagcatgtg aagattgaca 240 aaggcaaaat gagcttctag tgacgtggcc gtgggagtag ttaaaggcct tttgggagga 300 aggcgacat tttttttctcg ttgctcagtt tagggcacta ctcttaaaaa aggaaagtta 360 acaaactgga atagagtcag agataacttt gagaaaaccg atgtcattaa actggtgtct 420
* * ij.4* h.t?itL. -í ~ k* ctggacctga ggtttgcact cacatttcca tctggcggcc ccataagcaa tctgtcctac 480 agataactcg tcctacacaa aacttagtct cttttcagct cagctctctc actctcaatt 540 atatctcctt acttccatat ggcactgttg tacactcatt tactcagagc cagaaacgtc 600 agcgtcatct tggatttttc ttatgctctt tctctctcta gtcatatgcc agactttaaa 660 ctctgcttga aagctttctc ataagctctt tccttttccc tttctactgc tttgcatttg 720 ctacttaacc cttttcttca ggctgtttgc tttccagtcc atcgttcgct ctgct 775
<210> 17 <211> 491 <212> ADN <213> Homo sapiens
<400> 17 ccctcctttc ccaccagaca ctcccttaca ccatgcacat ttatttaatn atgtacttaa 60 ttcaaactta acacccaggc aacacttatc ctaaactatg tgctttcctt aagaagttcc 120 cagggctaat gtggaagaga aaaccaggcc tggnagatcc agtttcaaaa atnccagaga 180 ttacctcaaa ggccgtttgt caacaacccc agctattact gagatggagg ccaccatgct 240 ccnnggtggg accacggact caaggatagc cactggaaac aaggacacag aggaccttgt 300 gcccaggcaa cactcccgca tgcctcccat tccaaggttc cctttttang cccctctctt 360 ccagccaaag ttgnaaatgg ggtttnttta nggcactagc cttgggntat ttttacccnn 420 tgnnngctnt ggnagggaan gtcantttcc tttcactgnn tctcaccttt gttacctggc 480 tttgcaagtg g 491
<210> 18 <211> 293 <212> ADN <213> Homo sapiens
<400> 18 caccatgcac atttatttaa ttatgtactt attcaactta caccaggcac acttatctaa 60 ctatgtgctt tcttagaagt tccagggcta atgtggagag aaaccaggcc tggagatcca 120 gtttcaaaat tccagagatt acctcaaggc cgtttgtcaa caacccagct attactgaga 180 tgaggccacc atgctccagg tggaccacga ctcaagatag ccactgaaac aagacacaga 240 gaccttgtgc ccagcaacac tcccgcatgc ctcccattcc aaggttccct ttt 293
<210> 19 <211> 2442 <212> ADN <213> Homo sapiens
<400> 19 tatgtgggat tttagggcaa ggattttcaa cagtcaacag tactggaagc tgaggcttca 60 gaacccaggt atggáaggca gggagtttga actatgctcc ttgcacagaa tgggaagcca 120 ggaaaatgca aatgtcaaac tatcctacag ggaagtctct ataaacétcc acagaactcc 180 cacaaaagac acacttaggg aaaaggtatg cagcccaaaa tatacaagtc tgttcaactt 240 gctccctaaa ataagggaga atgccgacac cgcaggaaaa aggagctaat ggaactaaca 300 agaactttaa agaaacacca ataaaccaag aacacgcgaa aatgacaaaa taccaaataa 360 aaatccaaaa tagaaacaaa tccaaaagaa aacaaaagtt gatgaaataa aatctcagta 420 ggaggattaa gtaaaagaat tagcaaattg aaagattttt aagagacgaa gacagaataa 480 aaagctccct atgtttaaaa ggagttttta gaagaaaata gaaacaatgg gggaagatgg 540 ttaaaaatta ataataactt tccagacttg aagaaaaaaa actgaatctt cacattacag 600 aagcacacta tgtctagggc aggataaata acaaatctac actaggacac atcctgatct 660 gcaacacact gaagataaag agagaacagt aaaaatatag attactacct gtaagattac 720 tacctacaaa ctaagagggc tcagactaac agcagatttt ttcattagtt aacactgagg 780 caaggagaca atagaacagt atcttcaagg cacagcagac agtactaaac aactcaactc 840 ggtcaaacct aactttctgg ccagcacttg tgaaatcaaa ggctccccag taatttgatt 900 agcactttca tcattttgta atcttataaa caccttctcc agtggggaag aaatagccca 960 aatgggaat tttaggtacct aagacttcgg ctgccaactg tgcctaatat cctagtaatg 1020 ttaacctttc cagtacccag tatagaatac ccctacaact gggcatttta aacaggcaaa 1080 caagtattac acacacttaa ttttgttcat tccagccaca tgaagtcaaa ggatgtttct 1140 ctataagaaa ctacaataga tctttgaaac tttgcatgaa gttgttttag gggccatact 1200 tcaagtgaca ggaaataaca aatagcaata cacacacatt tcattaagtg gggatcttat 1260 aaaatctcta gaaccctgag aagttccttg ctacttataa agccttttct tgacctgtca 1320 gacctaatgt ttgatgatgt ataagaaaac tatcgtcgaa tttatgttat gcataaattt 1380 tatagtatat ttaaagtgaa atacacaatt tttttctatg cacatactct tactggaaaa 1440 aatttgaatg ctgacaataa aatggctaag ttatggtaca tgcatgtaac agaatactat 1500 agagcagact gagcaaact atggccacagg ccaaatccag cccatggtaa gtatttgtaa 1560 tattttttac tggacacaa ttatactcat ttatttacat attatctattt gatgctttca 1620 cactaccgtg gtagtgctga gtagccatga cagagaccta atggtctgca aaacctaaaa 1680 tatttactaa ctaacccttt atagaaagaa ctttgctgaa ccctggtatg gagaaataaa 1740 aacgaatgaa atacagctga atgagtcaac ttcaatcaat ctcaaaagca atgctgagag 1800 aatcaaatca caaaaaatac atgcagtata attcccatta caaaaaatcc acaaatatgc 1860 aaaacaaacc tgatactgtt cacaaatgca cataaaacca tttttttttt taaggtaatg 1920 aagttgatca acaccaagtg atctggggca gaggggtacg tagaagacat ttaactgtgc 1980 agggtacatt aacagtatat gtgctgatga tattctatat ccgaacctgg ggttggttaa 2040
kl,*r£ A r atggaggttc agtttataat taccttttaa actacataaa tgttttttta tacattcagt 2100 atatgtattt tcatgtcatt taaaagttca aaaaagacca aaaaggcaca tatcaaaaca 2160 ttaacagcag gtgacagaat atttgccaac ctgttagcag gttttaaaac cttctacaat 2220 gaacttttaa tgggcacaca aataagaaca caagcataaa atacttttta aaattaaagt 2280 aaaatcttcc caactacgct aaaagctcta gcctgaatat tttatatacg agcaaaagta 2340 ctaattaaaa gcactagcat cttagaagaa tttccttaaa tccaagattt taaaattccc 2400 actctggcta gctctaatga agctcaaaac aaaatacaaa gg 2442
<210> 20 <211> 4608 <212> ADN <213> Homo sapiens
<400> 20 ctcaaaacac actttccccc atgcccccgt cataaattca ttcttatgct aatactgcaa 60 agcctccggt accatgcttc ttaccgtgat attcttgatg atctgctgca ccaagatcgc 120 attggtcaac atatgagtcc tgaggggtgc atgctgaagc agcagtcgaa gcagctggcc 180 cacaacaggc agctcctcag gcccaactct gttcacccgc aggctctgca gcatcaacct 240 gaggactcga ggcaagagag ccaggatgga gacacagacc ccccacagct tgtccctaca 300 ataacagaga cagaaatgag tcagtgagca aatgcccaca ggaaaagccc cccttctata 360 ttcccccaaa gtgaaatgtc cttttaagga acatgttttc caataacatt taaactgaga 420 gccaaatcaa gaacgcaatc tcacttacaa tagccacaca cactaaatac ctaggaatac 480 atctaaccaa ggaggtgaaa gatctctaca agaaaaacta cagaacactg ctgagagaaa 540 tcacagatga cacagataaa tggaaaaaca ttccatgctc atgaattgga ataatcagta 600 ttgttaaaat ggccacactg ctcaaagcaa cctacagatt caactgtatt cctatcaaac 660
» «_.'.j ' ..J .IS .M A t taccaacatc attcttcaca caattaaaaa aaaatattct aaaattcaca tggaaccaaa 720 aaagccagaa tggccaaagc aatcctaagc aaaaacaacc tgacttcaca gtacactaca 780 aggctacagt agccaaaaca gcatggtaat gatagagaac aacagacaga taaaccaatg 840 gaacagaaaa gagaacccag aaataaagcc acatacctac aactatctca tcttcaacta 900 5 aggtgacaaa aacaagcaac agggcaagga ttccctattc aataaatggt gctgggacaa 960 ttggctatcc ttttgtagaa gaataaaaat ggatccctat ctttcatcat atacaaaaaa 1020 ttaactcggc caggcgcggt ggctcacgcc tgtaatccca gcactttggg aggctgaggc 1080 aggtggatca cgaagtcaag aaatcaagac catcctggcc aacatggaga aaccccgtct 1140 ctactacaga tacaaaatta gccaggcatg gtggcacgcg cctgcagtcc cagctactcg 1200
10 ggaggetgag gcaggagaat tgcttgaatc cgggaggtgg aggttgtagt gagccgagat 1260 cacaccactg cattccagcc tggcaaaaga atgagactcc gtctcaaaaa aaaaattaac 1320 tcaagataga ttaagaatte attactaagt cctcaaaagc aattgcaaaa acaaaaaatg 1380 acaagtgggc ectaattaaa cttaagaaca agagaaacta tccacatttc aataaacatg 1440 gtgtttttca ctaacattta ggetaagage caaatcaaga acatcattet ctcggtatct 1500
15 ttatggagca aaatgtttat ggtagagaca ggtgaccttg cagctagcct aaccacattc 1560 tccaagtgtt aattagatgg tgcaatattc acatagacct agagtccact gactatgaaa 1620 ggctctgacc tttttgcagc ttctttacca ggagtgtata atettectag ttcctaaatc 1680 tttctaagag aacctgacta cctccaggtc tagagggagc agccccttca ctatataacc 1740 aatttccctg actgeacata tggtaattcc atctatggtg aataatgaat ecattetagg 1800
20 ccaaatagat actettatge agagcccagc tgggacagtc acgtgcaagg agaaaagaga 1860 aagccagact gcagacatag ctaatgcaaa ggcacggaga tacagactac acaaactaga 1920 agaaacgtag agtaagctgc tttgtctctt gctaaatttc taattcctag cccttgggtt 1980 ttacaagtta ctcctgtaat aatcaaatat tttcattttc tacttttctt aatttgagtg 2040 gatttcaaat aaccacagac cttaaaaaaa aaagacagcc aagctcaagg ccagatgggt 2100
25 aaaacctcta ggtgaaagaa actataatga aattcatata aagatatcca acagtcataa 2160
^ggg^g^gg^j^ ^gfej^^^^^ aaactgtatg tgggatttta gggcaaggat tttcaacagt caacagtact ggaagctgag 2220 gcttcagaac ccaggtatgg aaggcaggga gtttgaacta tgctccttgc acagaatggg 2280 aagccaggaa aatgcaaatg tcaaactatc ctacagggaa gtctctataa acctccacag 2340 aactcccaca aaagacacac ttagggeaaa ggtatgcagc ccaaaatata caagtctgtt 2400 caacttgctc cctaaaataa gggagaatgc cgacaccgca ggaaaaagga gctaatggaa 2460 ctaacaagaa ctttaaagaa acaccaataa accaagaaca cgcgaaaatg acaaaatacc 2520 aaataaaaat ccaaaataga aacaaatcca aaagaaaaca aaagttgatg aaataaaatc 2580 tcagtaggag gattaagtaa aagaattagc aaattgaaag atttttaaga gacgaagaca 2640 gaataaaaag ctccctatgt ttaaaaggag tttttagaag aaaatagaaa caatggggga 2700 agatggttaa aaattaataa taactttcca gacttgaaga aaaaaaactg aatcttcaca 2760 ttacagaagc acactatgtc tagggcagga taaataacaa atctacacta ggacacatcc 2820 tgatctgcaa cacactgaag ataaagagag aacagtaaaa atatagatta ctacctgtaa 2880 gattactacc tacaaactaa gagggctcag actaacagca gattttttca ttagttaaca 2940 ctgaggcaag gagacaatag aacagtatct tcaaggcaca gcagacagta ctaaacaact 3000 caactcggtc aaacctaact ttctggccag cacttgtgaa atcaaaggct ccccagtaat 3060 ttgattagca ctttcatcat tttgtaatct tataaacacc ttctccagtg gggaagaaat 3120 agcccaaatg ggaattttag gtacctaaga cttcggctgc caactgtgcc taatatccta 3180 gtaatgttaa cctttccagt acccagtata gaatacccct acaactgggc attttaaaca 3240 ggcaaacaag tattacacac acttaatttt gttcattcca gccacatgaa gtcaaaggat 3300 gtttctctat aagaaactac aatagatctt tgaaactttg catgaagttg ttttaggggc 3360 catacttcaa gtgacaggaa ataacaaata gcaatacaca cacatttcat taagtgggga 3420 tcttataaaa tctctagaac cctgagaagt tccttgctac ttataaagcc ttttcttgac 3480 ctgtcagacc taatgtttga tgatgtataa gaaaactatc gtcgaattta tgttatgcat 3540 aaattttata gtatatttaa agtgaaatac acaatttttt tctatgcaca tactcttact 3600 ggaaaaaatt tgaatgctga caataaaatg gctaagttat ggtacatgca tgtaacagaa 3660 tactatagag cagactgagc aaactatggc cacaggccaa atccagccca tggtaagtat 3720 ttgtaaatag ttttactgga acacaattat actcatttat ttacatatta tctattgatg 3780 ctttcacact accgtggtag tgctgagtag ccatgacaga gacctaatgg tctgcaaaac 3840 ctaaaatatt tactaactaa ccctttatag aaagaacttt gctgaaccct ggtatggaga 3900 aataaaaacg aatgaaatac agctgaatga gtcaacttca atcaatctca aaagcaatgc 3960 tgagagaatc aaatcacaaa aaatacatgc agtataattc ccattacaaa aaatccacaa 4020 atatgcaaaa caaacctgat actgttcaca aatgcacata aaaccatttt tttttttaag 4080 gtaatgaagt tgatcaacac caagtgatct ggggcagagg ggtacgtaga agacatttaa 4140 ctgtgcaggg tacattaaca gtatatgtgc tgatgatatt ctatatccga acctggggtt 4200 ggttaaatgg aggttcagtt tataattacc ttttaaacta cataaatgtt tttttataca 4260 ttcagtatat gtattttcat gtcatttaaa agttcaaaaa agaccaaaaa ggcacatatc 4320 aaaacattaa cagcaggtga cagaatattt gccaacctgt tagcaggttt taaaaccttc 4380 tacaatgaac ttttaatggg cacacaaata agaacacaag cataaaatac tttttaaaat 4440 taaagtaaaa tcttcccaac tacgctaaaa gctctagcct gaatatttta tatacgagca 4500 aaagtaotaa ttaaaagcac tagcatctta gaagaatttc cttaaatcca agattttaaa 4560 attcccactc tggctagctc taatgaagct caaaacaaaa tacaaagg 4608
<210> 21 <211> 1627 <212> ADN <213> Homo sapiens
<400> 21 gaatgctgtt acctgaaccc cttacttcga aggatcataa gattcacagg ggtgtttgca 60 tttggacttt ttgctactga catttttgta aacgccggac aagtggtcac tgggcactta 120
acgccatact tcctgactgt gtgcaagcca aactacacca gtgcagactg ccaagcgcac 180 caccagttta taaacaatgg gaacatttgt actggggacc tggaagtgat agaaaaggct 240 cggagatcct ttccctccaa acacgctgct ctgagcattt actccgcctt atatgccacg 300 atgtatatta caagcacaat caagacgaag agcagtcgac tggccaagcc ggtgctgtgc 360 ctcggaactc tctgcacagc cttcct?aca ggcctcaacc gggtctctga gtatcggaac 420 cactgctcgg acgtgattgc tggtttcatc ctgggcactg cagtggccct gtttctggga 480 atgtgtgtgg ttcataactt taaaggaacg caaggatctc cttccaaacc caagcctgag 540 gatccccgtg gagtacccct aatggctttc ccaaggatag aaagccctct ggaaacctta 600 agtgcacaga atcactctgc gtccatgacc gaagttacct gagacgactg atgtgtcaca 660 agctgttttt taaaatcatc ttccaattct atacttcaaa acacacagtt gctcaatgtc 720 aaactgtgat gacaaatatt acgtttatct agttagaagc taatgttttg tacatttttt 780 gtatgaggaa gtgatgtagc ttgccctgat tttttttttt tntttggtca gctttaatat 840 atttatqcoa gaattttaaa accaacaaaa ttttcttgtt caagcgtgca ttgaagaacc 900 acatttattc aatggttgac gttgttttgt gatatttgta cacaaatttt cttttctcag 960 ttttataaac acagaatata acaattcact ttaaactttt attaccacag ttgctgcctc 1020 ctccagaatt tttgaatttt aataaaaggc aaaottttga gctgcaggaa ggacaatgtt 1080 ggttaataat aaatctcaaa gtcaattgta gaaaaaaaat tgtcttcaaa aagaatgtng 1140 cactctgatc tcttaacaaa ttgttacgtt caaagtttaa agtgatatat taacaaagtc 1200 acctagttat acaaacaatt gtcagagaat tctggatttg gagggtattg gggttatatg 1260 attctttctt agataatggc ctctactaaa gaaotcaaga tctttctgga atgtcttctg 1320 gcaggcaqgt gccactgtca gcntttctcc aaaaagcagc caacatcagc ctcccctgtc 1380 aactcaacag ttttgtatct catattatat ggactttata tgaaaatgaa tattttacag 1440 tttgcacagt attattttac agaaaaggaa tcagagaatc tacaacatag ggccccagaa 1500 caacagtttc actttgtggc ttttaattat tctagaattt taactgcatc tcatttttct 1560 agcatqqtga gaactaatat gtaactcctt tgattgaagg agctcttttg tccgtaccta 1620 tcagaat 1627
<210> 22 <211> 2333 <212> ADN <213> Homo sapiens
<400> 22 attcaagaga gcaaggacaa ataatggtca aggaaggaag tcagggattg gtggctctgt 60 actaagtgtc agcttcaaag ggagagacca gagcataaac agacaattct ctaggttgca 120 aattgggagg attaggaaca agtaagagag ttccatgcag gatggacaag aaaaaaaagt 180 tttataccaa aaattgttat tcatggcatt agggcagtct actggggtaa ggcactatgc 240 agtactaggc aattagaatt ctattcacta gctatgtgca caagcggctc ctgacctggt 300 cattttggct gtaaaactat tcatgcctgg acagtttttg acqgtgcagt cttgctatat 360 ggtgtgagaa atggctgtag gaaacaacac gcaacgaagt tattccatca gcccgtgttt 420 tatatttgtt gagcttgtca tcatggctgg gacagtgctg cttgcctact acttcgaatg 480 cactgacact tttcaggtgc atatccaagg attcttctgt caggacggag acttaatgaa 540 gccttaccca gggacagagg aagaaagctt catcacccct ctggtgctct attgtgtgct 600 ggctgccacc ccaactgcta ttatttttat tggtgagata tccatgtatt tcataaaatc 660 aacaagagaa tccctgattg ctcaggagaa aacaattctg accggagaat gctgttacct 720 gaacccctta cttcgaagga tcataagatt cacaggggtg tttgcatttg gactttttgc 780 tactgacatt tttgtaaacg ccggacaagt ggtcactggg cacttaacgc catacttcct 840 gactgtgtgc aagccaaact acaccagtgc agactgccaa gcgcaccacc agtttataaa 900 caatgggaac atttgtactg gggacctgga agtgatagaa aaggctcgga gatcctttcc 960 ctccaaacac gctgctctga qcatttectc cgccttatat gccacgatgt atattacaag 1020 cacaatcaag acgaagagca gtcgactggc caagccggtg ctgtgcctcg gaactctctg 1080 cacagccttc ctgactggcc tcaaccgggt ctctgagtat cggaaccact gctcggacgt 1140 gattgctggt ttcatcctgg gcactgcagt ggccctgttt ctgggaatgt gtgtggttca 1200 taactttaaa ggaacgcaag gatctccttc caaacccaag cctgaggatc cccgtggagt 1260 acccctaatg gctttcccaa ggatagaaag ccctctggaa accttaagtg cacagaatca 1320 ctctgcgtcc atgaccgaag ttacctgaga cgactgatgt gtcacaagct gttttttaaa 1380 atcatcttcc aattctatac ttcaaaacac acagttgctc aatgtcaaac tgtgatgaca 1440 aatattacgt ttatctagtt agaagctaat gttttgtaca ttttttgtat gaggaagtga 1500 tgtagcttgc cctgattttt tttttttttt tggtcagctt taatatattt atgccagaat 1560 tttaaaacca acaaaatttt cttgttcaag cgtgcattga agaaccacat ttattcaatg 1620 gttgacgttg ttttgtgata tttgtacaca aattttcttt tctcagtttt ataaacacag 1680 aatataacaa ttcactttaa acttttatta ccacagttgc tgcctcctcc agaatttttg 1740 aattttaata aaaggcaaac ttttgagctg caggaaggac aatgttggtt aataataaat 1800 ctcaaagtca attgtagaaa aaaaattgtc ttcaaaaaga atgttgcact ctgatctctt 1860 aacaaattgt tacgttcaaa gtttaaagtg atatattaac aaagtcacct agttatacaa 1920 acaattgtca gagaattctg gatttggagg gtattggggt tatatgattc tttcttagat 1980 aatggcctct actaaataac tcaagatctt tctggaatgt cttctggcag gcaggtgcca 2040 ctgtcagctt ttctccaaaa agcagccaac atcagcctcc cctgtcaact caacagtttt 2100 gtatctcata ttatatggac tttatatgaa aatgaatatt ttacagtttg cacagtatta 2160 ttttacagaa aaggaatcag agaatctaca acatagggcc ccagaacaac agtttcactt 2220 tgtggctttt aattattcta gaattttaac tgcatctcat ttttctagca tggtgagaac 2280 taatatgtaa ctcctttgat tgaaggagct cttttgtccg tacctatcag aat 2333
<210> 23 <211> 2764
<212> ADN <213> Homo sapiens
<400> 23 cagtttttat cacaggttca tgccgtggca ttggcaaagc tattgcattg aaagcagcaa 60 aggatggagc aaatattgtt attgctgcaa agaccgccca gccacatcca aaacttctag 120 gcacaatcta tactgctgct gaagaaattg aagcagttgg aggaaaggcc ttgccatgta 180 ttgttgatgt gagagatgaa cagcagatca gtgctgcagt ggagaaagcc atcaagaaat 240 ttggaggaat tgatattctg gtaaataatg ccagtgccat tagtttgacc aatacattgg 300 acacacctac caagagattg gatctgatga tgaacgtgaa caccagaggc acctaccttg 360 catctaaagc atgtattcct tatttgaaaa agagcaaagt tgctcatatc ctcaatatca 420 gtccaccact gaacctaaat ccagtttggt tcaaacagca ctgtgcttat accattgcta 480 agtatggtat gnctatgtat gtgcttggaa tggcagaaga atttaaaggt gaaattgcag 540 tcaatgcatt atggcctaaa acagccatac acactgctgc tatggatatg ctgggaggac 600 ctggtatcga aagccagtgt agaaaagttg atatcattgc agatgcagca tattccattt 660 tccaaaagcc aaaaagtttt act gcaact ttgtcattga tgaaaatatc ttaaaagaag 720 aaggaataga aaattttgac gtttatgcaa ttaaaccagg tcatcctttg caaccagatt 780 tcttcttaga tgaataccca gaagcagtta gcaagaaagt ggaatcaact ggtgctgttc 840 cagaattcaa agaagagaaa ctgcagctgc aaccaaaacc acgttctgga gctgtggaag 900 aaacatttag aattgttaag gactctctca gtgatgatgt tgttaaagcc actcaagcaa 960 tctatctgtt tgaactctcc ggtgaagatg gtggcacgtg gtttcttgat ctgaaaagca 1020 agggtgggaa tgtcggatat ggagagcctt ctgatcaggc agatgtggtg atgagtatga 1080 ctactgatga ctttgtaaaa atgttttcag ggaaactaaa accaacaatg gcattcatgt 1140 cagggaaatt gaagattaaa ggtaacatgg ccctagcaat caaattggag aagctaatga 1200 atcagatgaa tgccagactg tgaaggaaaa tataaaaaaa aagtcgactg ctatgctcaa 1260 aaagtaaaaa aagctcaaca gttaaaatct aatgtttgtt ttctttcctg ttatattata 1320 aggatatgca cgtttgttct ggaaaagata gaatttgtct ctaaaagact tgaaattgta 1380 attaaaatgg caagctaatc aaacataagc ttcattaagt gggattctaa gacagtctgt 1440 gtttttatat ttcaagggtt taaccctttg agccttacat ctcattcact gtctttctcc 1500 aagaaaagta ttttgggcgg acagtcagat caagcagtaa aattagctct ttcaaatctt 1560 cttgtcatgt aaaatgaagc tagtctgttt taaaattttt agttttggat tgtatactaa 1620 tgaaaatctt aatgatgttt ttgattttta tatacttatt ttaaagaaaa tcttatatag 1680 tacattttac aaaaattata aaaaatgaat tagtactggc gaggactaaa tgaaacaata 1740 atttttcatt ttgataacta gctttccagg tggacttagc cataggaaaa tattactaat 1800 gtaatttaac aaattgctgc atgtattcca tttaaaaata tgtttaaatt gtcctaaaac 1860 aaaataattt tctccctagg agtatgcatt tggctacagt gttttgaaac agaaacctta 1920 gaataggtca ttggtatggg ctgaactgtg tatcccccaa ttcatttgtt gaggtcctaa 1980 ctcccatttc ttttgaatgt gactgttcgg agatgaggcc tttaaagagg tgacttaagt 2040 tcaaaggagg ctgttagtct aatccaacat ggtgtccttt ggacataaga gataccagca 2100 atgtgtgcac agaacaaaga ccaggagagg acacagtgag aaggcagtta tctgcaagca 2160 aagagagagg cttcagaaga aacaaaatca ccagcacctt gatctttgac ttctaatctc 2220 cagaatagtg agaaataaat ttctgttgtt aagccgtcca ctgtgggagg ccgacgcagg 2280 aggattgctt gaggccagga gttcaaggcc agcctggaca acatagtaag accctatctc 2340 taccccccta ataaattaat ttaaaaagcc ccccaatctg tggtatttta ttatggcagc 2400 cctagcaagc taatacagtg gtttgagagg ctgggagggt tgaggggaag ataaactttt 2460 aaaaagctct tatctttcat ttcaatcagt taaaaatact tgctcagtgt aacaattttg 2520 cttctcagct tccactctaa tattgttgtg ccattaagca atttagctaa tcctgacatt 2580 tcttagattc ataatgttag gagcatttaa tctgtatttt acaagttagg aagcagagga 2640 tcagagatgg gaaaggacta gcccaaggcc aacattaaca agccctctaa caaaaacttt 2700 acaatacatt tatgttgaat ggaactccaa gatctcacct ctccatccag gaatggagtc 2760
- s i¡<a»rti catg 2764
<210> 24 <211> 3228 <212> ADN <213> Homo sapiens
<400> 24 gctcgccgcc gccgctgtcg ccgccacctc ctctgatcta cgaaagtcat gttacccaac 60 accgggaggc tggcaggatg tacagttttt atcacaggtg caagccgtgg cattggcaaa 120 gctattgcat tgaaagcagc aaaggatgga gcaaatattg ttattgctgc aaagaccgcc 180 cagccacatc caaaacttct aggcacaatc tatactgctg ctgaagaaat tgaagcagtt 240 ggaggaaagg ccttgccatg tattgttgat gtgagagatg aacagcagat cagtgctgca 300 gtggagaaag ccattcaaga atttggagga attgatattc tggtaaataa tgccagtgcc 360 attagtttga ccaatacatt ggacacacct accaagagat tggatctgat gatgaacgtg 420 aacaccagag gcacctacct tgcatctaaa gcatgtattc cttatttgaa aaagagcaaa 480 gttgctcata tcctcaatat cagtccacca ctgaacctaa atccagtttg gttcaaacag 540 cactgtgctt ataccattgc taagtatggt atgtctatgt atgtgcttgg aatggcagaa 600 gaatttaaag gtgaaattgc agtcaatgca ttatggccta aaacagccat acacactgct 660 gctatggata tgctgggagg acctggtatc gaaagccagt gtagaaaagt tgatatcatt 720 gcagatgcag catattccat tttccaaaag ccaaaaagtt ttactggcaa ctttgtcatt 780 gatgaaaata tcttaaaaga agaaggaata gaaaattttg acgtttatgc aattaaacca 840 ggtcatcctt tgcaaccaga tttcttctta gatgaatacc cagaagcagt tagcaagaaa 900 gtggaatcaa ctggtgctgt tccagaattc aaagaagaga aactgcagct gcaaccaaaa 960 ccacgttctg gagctgtgga agaaacattt agaattgtta aggactctct cagtgatgat 1020
, .ii ...
gttgttaaag ccactcaagc aatctatctg tttgaactct ccggtgaaga tggtggcacg 1080 tggtttcttg atctgaaaag caagggtggg aatgtcggat atggagagcc ttctgatcag 1140 gcagatgtgg tgatgagtat gactactgat gactttgtaa aaatgttttc agggaaacta 1200 aaaccaacaa tggcattcat gtcagggaaa ttgaagatta aaggtaacat ggccctagca 1260 5 atcaaattgg agaagctaat gaatcagatg aatgccagac tgtgaaggaa aatataaaaa 1320 aaaagtcgac tgctatgctc aaaaagtaaa aaaagctcaa cagttaaaat ctaatgtttg 1380 ttttctttcc tgttatatta taaggatatg cacgtttgtt ctggaaaaga tagaatttgt 1440 ctctaaaaga cttgaaattg taattaaaat ggcaagctaa tcaaacataa gcttcattaa 1500 gtgggattct aagacagtct gtgtttttat atttcaaggg tttaaccctt tgagccttac 1560
10 atctcattca ctgtctttct ccaagaaaag tattttgggc ggacagtcag atcaagcagt 1620 aaaattagct ctttcaaatc ttcttgtcat gtaaaatgaa gctagtctgt tttaaaattt 1680 ttagttttgg attgtatact aatgaaaatc ttaatgatgt ttttgatttt tatatactta 1740 ttttaaagaa aatcttatat agtacatttt acaaaaatta taaaaaatga attagtactg 1800 gcgaggacta aatgaáacaa taatttttca ttttgataac tagctttcca ggtggactta 1860
15 gccataggaa aatattacta atgtaattta acaaattgct gcatgtattc catttaaaaa 1920 tatgtttaaa ttgtcctaaa acaaaataat tttctcccta ggagtabgca tttggctaca 1980 gtgttttgaa acagaaacct tagaataggt cattggtatg ggctgaactg ggtatccccc 2040 aattcatttg ttgaggtcct aactcccatt tcttttgaat gtgactgttc ggagatgagg 2100 cctttaaaga ggtgacttaa gttcaaagga ggctgttagt ctaatccaac atggtgtcct 2160
20 ttggacataa gagataccag caatgtgtgc acagaacaaa gaccaggaga ggacacagtg 2220 agaaggcagt tatctgcaag caaagagaga ggcttcagaa gaaacaaaat caccagcacc 2280 ttgatctttg acttctaatc tccagaatag tgagaaataa atttctgttg ttaagccgtc 2340 cactgtggga ggccgacgca ggaggattgc ttgaggccag gagttcaagg ccagcctgga 2400 caacatagta agaccctatc tctacccccc taataaatta atttaaaaag ccccccaatc 2460
25 tgtggtattt tattatggca gcccta caa gctaatacag tggtttgaga ggctgggagg 2520
gttgagggga agataaactt ttaaaaagct cttatctttc atttcaatca gttaaaaata 2580 cttgctcagt gtaacaattt tgcttctcag cttccactct aatattgttg tgccattaag 2640 caatttagct aatcctgaca tttcttagat tcataatgtt aggagcattt aatctgtatt 2700 ttacaagtta ggaagcagag gatcagagat gggaaaggac tagcccaagg ccaacattaa 2760 caagccctct aacaaaaact ttacaataca tttatgttga atggaactcc aagatctcac 2820 ctctccatcc aggaatggag gccatgtaat caaagtgaac ttaaaaatag gacagtttca 2880 acaagtcagg agattcacag caactgatea aagggagtcc agtcaacgtg agcaagcgtg 2940 attatgatga ggaagccccc tctgctttaa tccacacaag gaacgtaacc tgaagtaacc 3000 tgatgttaac caatctgctg tgtctactat gctgtttcct tgttcctgct agtgctgctt 3060 tacaaatgea gaccatteta tcatacctgg cggggcttct gttttatttt gtaggctgga 3120 tgctacccag ttcatgaatc gctaataaaa gccaattaga tctttaaaaa aaaaaaaaaa 3180 aaaaaaaaaa aaaaaaaaaa ataataagat taattaaaat atagaaga 3228
<210> 25 <211> 3106 <212> ADN <213> Homo sapiens
<400> 25 accgaagtga gcgtggaccg gccgaaacag gccaaaggcc aggattggtt tgageagatt 60 gggtaccacg tggaccgtgg ggaaacagat tacggtggcc tccagggccg cgactctgcc 120 cagggtgcgc acgggcggga teatgecaaa cccagaaaaa agcagaggaa aatgggacct 180 gcttatgctt tacacggtcg agggaaagac tattetteag aaccaaacaa cctgcgggag 240 gagtttacaa ggtaccgggg tggttgacaa cgcaggcagg acattettte tggaaaattg 300 aaatgcccgt aggaaacagc tggggaagga gcggcgctct ggetacaage ggagcgtggg 360
gagggcgagc tgccagaaca cacaccagag cgggggtcgg aggtgcggtt cattccaaat 420 cagacagaag caagggaagg tgatagcttc cagagatgga aagagggcag gggaaagagc 480 cctgcccagg cggaacgctc cgatctgaag aaagcgaagt ggcgggaaat ggatggggga 540 gacaggcacg tgggcagggg aagagagggc ggggaagagt cgcgtggact gaccccgaca 600 ggcatagtaa tctgtgaagg agcgaacaaa agaggcttat tcgtgtggcc taaaatgacc 660 aaaatggatg tgaaaaagag caaattgaca ctcggggtgg tcgaggagga tgagcaggga 720 cgggagcaag agcacacgtt tgggggccgg ttagacagtg ccaggacctg caaacaccgt 780 tggaagtggg caggggagca ccacgcagtc ttccgacggc ggacgccagg aaacagcaaa 840 gccaagagag ccgactgtat caggctgggc tctcgctgca gagtcagggg gcggacagaa 900 tatcaagcta cacagggcgc caggttacga agaaccagca cctttgagag gaagccgagg 960 aaacggtatc catcccggag acagtceacg ttcaaagcaa gcaacccagt gagagcagcc 1020 cagcgctgcg cgaaaacaaa tccagaaggc cataattacc agccgcaaga tcagccgaag 1080 atccatccca gccagccccg ggggcagccg cactctccaa agggcaggcc agccgtgcag 1140 gatgacaggg cgcattggaa agcatcggcc agtggagatg acagccattt tgattatgtc 1200 cacgaccaga accagaagaa cttaggaggg atgcaaagta tgatgtatcg agataaacgc 1260 atgacggcac tttgagagac tgaagcagcg ctcttccatg caccgtcaga gtttcattgc 1320 atgccatgaa aagtgtctgg gccgcagagg gagggatgtg gggggacgag tgtctttaag 1380 gaggagtccg gaaaggggtg ttgggtgtcc aggtaaatat ttgaagagaa aaccacgaga 1440 gctgggcaga attgacggtt gactgcaggc tcattaaaat gaaggtaaag gctcaggaag 1500 cagattgatg ttctgatttt aaaattggag tcaaagtcga tgtttatcat tttactatgt 1560 tcctgatgtg cgtggttatt taagtaaggg gagcaaataa aaccagaaga gcgtgggaag 1620 agtgctcagc atagatgcct ggcggagaag ttgagagggc tagggtccag tttccctagt 1680 gtggccggga cgaggcattg ccccttcatt gaccgcattt tccccatctg aaaagagagg 1740 gttggactaa gggagctcca agggccggtc caacgcgaaa attcggcaag tggttaacat 1800 ttcattttgt ttaggttgag gacatacatt caaactaatt ttatcacaag gaaaactgca 1860
^* a ?a* atacccactt ccttgacaga gttactcctt tcagaagcta aataaagtat ataacttatt 1920 agatgttata tagatacagg gggactttga atttcacatc ttaaagcagt tgagctactt 1980 tgaatttaag cagtcgtact aatcttaaat tgcatagcat ttgttttgat cgaatttgct 2040 gctcaagtat gggaataatt tttaatgtct taatgattgg tgctgctaac ttgcgtgatt 2100 tcagaagaca taattgtgaa tacacactgt cagaattggg ggattggttt ttaccctaga 2160 cttcactctt aaaaagcaac gtgcaatcaa gatcatttat ggctcaaatg aaagcatata 2220 aggttttctt gaagttgtgc caaagcattc tgtagagtag gatgagatgg ttgttgccct 2280 agtctgttgg tagaaccaga aatcaatatg ttgtctttta ggttaaagct tgtaccaaaa 2340 tatttatttc ccccatttca agccctgagt caaacatttt tttctcttaa taatagacct 2400 gaaatgtttt attagtattt ctgtgaaatc agttgattct tgtgccattt ttgtatatgt 2460 aattgtaatt ttgcccatgt taggccctct aaaaaatgtt tgacatcctt tgagatattt 2520 tattactaaa atctgatctt ttttggctac tgcaaaaatc tattcagcaa gaaggtatca 2580 gctgcatacc ttgcacagtg gagctgacta cctataaact ctccctaagg catttgttta 2640 caggtgtatt ccattttagc agacgttctg atgctcagtg tatgtgctgc atacaaataa 2700 atgtgttctg aatcttttca tcttattgat agcattttta caaatgtgtt tccaaggaat 2760 aaagattatt cttgcttttt ttttgactcc atcttcattt tttttaaatt gattcttgtt 2820 gctatgcaga agtctcattt gtgaatgacc ttggtaacag aacagttggc ttttggaagt 2880 ctgaaggtga gcattcagtt aggtgggtgg agcaagatca tcctagaatg aggctgctct 2940 tggcaagagt ggatcttata ggcacagcag ctgatgcctt tcttcatctg gggcaactct 3000 ggtgaaggtt gtcctgcctg tcacaggtgc tgagtagaga gaagtggtgg cagtgggatt 3060 tcctcagtaa tagtcctgta aaggtacgtg tttgtcctgg ctactt 3106
<210> 26 <211> 3313 <212> ADN <213> Homo sapiens
<400> 26 gcgggcccct gctcaccggc ggcgcggccg tgcacatctc cgccgccggc gccgccaagg 60 ccaccctcta ctgccgcgtc ttcctgctcg acgggaccga agtgagcgtg gacctgccga 120 aacatgccaa aggccaggat ttgttt?atc agattgtgta ccacttggac cttgtggaaa 180 cagattactt tggcctccag ttcctcgact ctgcccaggt tgcgcactgg ctggatcatg 240 ccaaacccat aaaaaagcag atgaaaattg gacctgctta tgctttacac tttcgagtta 300 aatactattc ttcagaacca aacaaccttc gtgaggagtt tacaaggtac ctgtttgttt 360 tacaactcag gcatgacatt ctttctggaa aattgaaatg cccttatgaa acagctgtgg 420 aattagctgc tctctgtcta caagcggagc ttggggagtg cgagcttcca gaacacacac 480 cagagcttgt gtctgagttt cggttcattc caaatcagac agaagcaatg gaatttgata 540 tcttccagag atggaaagag tgcaggggaa agagccctgc ccaggcggaa ctctcctatc 600 tgaataaagc gaagtggctg gaaatgtatg gggtagacat gcacgttgtc aggggaagag 660 atggctgtga atattctctt ggactgaccc cgacaggcat attaatcttt gaaggagcta 720 acaaaatagg cttattcttt tggcctaaaa ttaccaaaat ggattttaaa aagagcaaat 780 tgacactcgt ggtggtcgag gatgatgatc agggacgtga gcaagagcac acgtttgtgt 840 tccggttaga cagtgccagg acctgcaaac acctttggaa gtgtgcagtt gagcaccacg 900 cattcttccg actgcggacg ccaggaaaca gcaaatccaa tagatccgac tttatcaggc 960 tgggctctcg cttcagattc agtgggcgga cagaatatca agctacacat ggctccaggt 1020 tacgaagaac cagcaccttt gagaggaagc ctagtaaacg ttatccatcc cggagacatt 1080 caacgttcaa agcaagcaac ccagtgatag cagcccagct ctgctctaaa acaaatccag 1140 aagtccataa ttaccagcct caatatcatc ctaatatcca tcccagccag ccccggtggc 1200 atcctcactc tccaaatgtc aggccatcct ttcaggatga caggtcgcat tggaaagcat 1260 cggccagtgg agatgacagc cattttgatt atgtccacga ccagaaccag aagaacttag 1320
gagggatgca aagtatgatg tatcgagata aactcatgac tgcactttga gagactgaag 1380 catctctctt ccattcacct tcatagtttc attgcattcc atgaaaagtg tcttggcctc 1440 agatggatgg atgtgtttgg acgagtgtct ttaaggagta gtcctgaaag gtgtttttgg 1500 tgtccatgta aatatttgaa gataaaacca ctatagcttg tcataattta ctgttgactg 1560 cattctcatt aaaatgaagg taaaggctca ggaatcatat tgatgttctg attttaaaat 1620 tggagtcaaa gtctatgttt atcattttac tatgttcctg atgttctttg ttatttaatt 1680 aatgggagca aataaaacca gaagagcttg ggaagattgc tcagcatata ttcctgtcgt 1740 agaagttgag attgc-taggg tccagtttcc ctagtgtggc ctggacgagt catttcccct 1800 tcattgacct cattttcccc atctgaaaag agagggttgg actaagtgat ctccaaggtc 1860 ctttccaact ctaaaattct gcaatttgtt aacatttcat tttgtttagg ttgaggacat 1920 acattcaaac taattttatc acaaggaaaa ctgcaatacc cacttccttg acagagttac 1980 tcctttcaga agctaaataa agtatataac ttattagatg ttatatagat acagggggac 2040 tttgaatttc acatcttaaa gcagttgagc tactttgaat ttaagcagtc gtactaatct 2100 taaattgcat agcatttgtt ttgatcgaat ttgctgctca agtatgggaa taatttttaa 2160 tgtcttaatg attggtgctg ctaacttgcg tgatttcaga agacataatt gtgaatacac 2220 ac gtcagaa ttgggggatt ggtttttacc ctagacttca ctcttaaaaa gcaacgtgca 2280 atcaagatca tttatggctc aaatgaaagc atataaggtt ttcttgaagt tgtgccaaag 2340 cattctgtag agtaggatga gatggttgtt gccctagtct gttggtagaa ccagaaatca 2400 atatgttgtc ttttaggtta aagcttgtac caaaatattt atttccccca tttcaagccc 2460 tgagtcaaac atttttttct cttaataata gacctgaaat gttttattag tatttctgtg 2520 aaatcagttg attcttgtgc catttttgta tatgtaattg taattttgcc catgttaggc 2580 cctctaaaaa atgtttgaca tcctttgaga tattttatta ctaaaatctg atcttttttg 2640 gctactgcaa aaatctattc agcaagaagg tatcagctgc ataccttgca cagtggagct 2700 gactacctat aaactctccc taaggcattt gtttacaggt gtattccatt ttagcagacg 2760 ttctgatgct cagtgtatgt gctgcataca aataaatgtg ttctgaatct tttcatctta 2820 ttgatagcat ttttacaaat gtgtttccaa ggaataaaga ttattcttgc tttttttttt 2880 gactccatct tcattttttt taaattgatt cttgttgcta tgcagaagtc tcatttgtga 2940 atgaccttgg taacagaaca gttggctttt ggaagtctga aggtgagcat tcagttaggt 3000 gggtggagca agatcatcct agaatgaggc tgctcttggc aagagtggat cttataggca 3060 cagcagctga tgcctttctt catctggggc aactctggtg aaggttgtcc tgcctgtcac 3120 aggtgctgag tagagagaag tggtggcagt gggatttcct cagtaatagt cctgtaaagg 3180 tacgtgtttg tcctggctac ttgtgctctt cctggcagga aggcatccaa acccttatct 3240 gtgggctcct ggaaattgtg tatgccatat aataccctct aataaatacc tctctgctta 3300 aaaaaaaaaa aaa 3313
<210> 27 <211> 1539 <212> ADN <213> Homo sapiens
<400> 27 ctgaggatga ttatggtgat gacccttcga ccaactcgtt tgagaaagag aagcaggact 60 atgtctattg cctggagtca tccctgcaga cctacaaccc agactacgtc ctgatggtag 120 aagacgatgc tgtaccagaa gagcagatct tcccagtctt ggagcacctt ctgcgggctc 180 gcttctctga gccacatete agagatgece tttatetcaa gctgtatcac cccgagaggc 240 tccagcacta catcaatcca gagcccatgc ggatcctgga atgggttggt gtaggcatgt 300 tgctggggcc cttactaacc tggatataca tgaggtttgc cagccgccca gggtttagct 360 ggcctgtaat gctcttcttc tccctgtata gcatgggtct ggtggagctg gtgggtcggc 420 actatttcct ggaactgcgg cggctgagtc cttccctgta cagtgtggtt cctgcctctc 480 agtgttgcac cccagccatg ctcttcccgg cacctgcggc ccgccggacc ctcacctacc 540 tgtcccaagt gtactgccac aagggctttg gcaaggacat ggcactgtac tcgctgttga 600 gggccaaggg agagagggcc tatgtagtgg agccgaacct cgtgaaacac atcgggctct 660 tctccagtct ccggtacaac tttcatccca gtctcctcta gggtgccaag agatgccttt 720 ctgaagttgg ccacttcttg aagattcaaa tatttatctc tttatttaga catggttgcc 780 tgcaggtatt tcactgttta ctgttgttag agatataggc actggggcag ctgaggaacc 840 tcaatatgtt aagagccttg gctttggtag cctcctggca ggagcagcag tttgccacag 900 gtccggacct ctccctccac acagccacac tgcctcatgc agtctgaccc acccagtgag 960 ggtgcatttg aacactgatt atattctcca tttgttttta agctctgctt tgtgttagag 1020 cttgtgactg ccaaaaattt tgtgcacagt gatatgactg ttttaggatc ttaagggtag 1080 aattttgtga aaggtgagat cctttggaat tgagttcttt ctcattgggt atgaaaatgg 1140 atgtatgttt agaatatatg cccaacgagg caggaccatg tggatagatt ccatttgttt 1200 ccttgacctg atgtaataaa aactgataaa agccgtgcag tgcccggcat cttggaggca 1260 ggtgatctgg cttttctgtt acctgggatt ttcttttcct atatatctgt agtgcactga 1320 taattgatat tgttagtgag aactttaagg cacgacaaga tctggaagag cttgtgaacc 1380 atcaaagtca gattgcttat gttgagtagt gatttaacat tgaacatttc tgtactactc 1440 tgactctttg aaaattggac atttcagaat gatacaatat aggggagctc tttacaagta 1500 gcatatcatt tttcctgact ttcctggctg actgcttac 1539
<210> 28 <211> 3404 <212> ADN <213> Homo sapiens
<400> 28 ctcttcctgt gcaacgtgga gcgtagtgtg agccattttg atgccaagtt gctctccaag 60 tatgtccctg tggccaatcg ctatgagggc actgaggatg attatggtga tgacccttcg 120 accaactcgt ttgagaaaga gaagcaggac tatgtctatt gcctggagtc atccctgcag 180 acctacaacc cagactacgt cctgatggta gaagacgatg ctgtaccaga agagcagatc 240 ttcccagtct tggagcacct tctgcgggct cgcttctctg agccacatct cagagatgcc 300 ctttatctca agctgtatca ccccgagagg ctccagcact acatcaatcc agagcccatg 360 cggatcctgg aatgggttgg tgtaggcatg ttgctggggc ccttactaac ctggatatac 420 atgaggtttg ccagccgccc agggtttagc tggcctgtaa tgctcttctt ctccctgtat 480 agcatgggtc tggtggagct ggtgggtcgg cactatttcc tggaactgcg gcggctgagt 540 ccttccctgt acagtgtggt tcctgcctct cagtgttgca ccccagccat gctcttcccg 600 gcacctgcgg cccgccggac cctcacctac ctgtcccaag tgtactgcca caagggcttt 660 ggcaaggaca tggcactgta ctcgctgttg agggccaagg gagagagggc ctatgtagtg 720 gagccgaacc tcgtgaaaca catcgggctc ttctccagtc tccggtacaa ctttcatccc 780 agtctcctct agggtgccaa gagatgcctt tctgaagttg gccacttctt gaagattcaa 840 atatttatct ctttatttag acatggttgc ctgcaggtat ttcactgttt actgttgtta 900 gagatatagg cactggggca gctgaggaac ctcaatatgt taagagcctt ggctttggta 960 gcctcctggc aggagcagca gtttgccaca ggtccggacc tctccctcca cacagccaca 1020 ctgcctcatg cagtctgacc caccca?tga gggtgcattt gaacactgat tatattctcc 1080 atttgttttt aagctctgct ttgtgttaga gcttgtgact gccaaaaatt ttgtgcacag 1140 tgatatgact gttttaggat cttaagggta gaattttgtg aaaggtgaga tcctttggaa 1200 ttgagttctt tctcattggg tatgaaaatg gatgtatgtt tagaatatat gcccaacgag 1260 gcaggaccat gtggatagat tccatttgtt tccttgacct gatgtaataa aaactgataa 1320 aagccgtgca gtgcccggca tcttggaggc aggtgatctg gcttttctgt tacctgggat 1380 tttcttttcc tatatatctg tagtgcactg ataattgata ttgttagtga gaactttaag 1440 gcacgacaag atctggaaga gcttgtgaac catcaaagtc agattgctta tgttgagtag 1500 tgatttaaca ttgaacattt ctgtactact ctgactcttt gaaaattgga catttcagaa 1560
LAAfc> . ^M, , . . ---» *? i • - ' f- "-- - tgatacaata taggggagct ctttacaagt agcatatcat ttttcctgac tttcctggct 1620 gactgcttac gaaaaaaaaa aaaaaaaagc atggactgaa gtcagaagac ctgacctttt 1680 atttcagatc tctgccatgg cctaacgacg tgaccacctt gggcaggtca tatattcact 1740 ctgggtttca atttcttcga acctgtaaaa tgaggacagt aatacttaca tgttaaagtt 1800 gccttgagga ttaaattgca gaatatatgt aaaacaccta gcaagtgctt agtccatagt 1860 agacacttgg caaacttttc tctcctataa taaacatata caactcaagc tttttgcgga 1920 aaaagatatt ggtgatgttg tttaaagtat gagatagggc atggagctgc cacctatgta 1980 ccagctattc cagatgacca agccctgcta gaataaagac tgacttttca ttgtgacctc 2040 tgaaggatgt gcagctcagc tttcacctat ccccacgttc acccaagcca aaaagaagaa 2100 ttgttcattc aaactggaaa tgatctccag cttggaaatg agacttctca tgagcttatt 2160 ctaagatcag agtctgaaaa ttattttctc aaaagttaca aataaatgtc ttttaacagt 2220 actgtcagac tagtgaccaa caagttactt tatgaggatg gatgatgata ttagagttca 2280 agcaattgtc cagtttgttt cgatgccaca gtttgctttt aaattcccat agtgagcttc 2340 catcttgaga cccactcaac acagaaggat tacataaagg ttgatcaccc acgctctaca 2400 gatgaacaaa ttgagaccca gagatgctaa actgctctgc aggtcacaaa cctgaacagc 2460 agcatagcca aaatgggaac ggagctcttc tgacttcaag cccctgcact tttttcttaa 2520 ccacattaat tttatgaata tctatgtggt caaagtctct tttgtaaaat ctgagtataa 2580 gctgaactag atcatgtctc tgtaagctaa gatggcagaa acacattgtc atgttagttt 2640 ggaggagcaa acagatataa gtatgtgttg taatgttata gtgagctgtt atgtatcccc 2700 cagcaatgtc caaagtgatc agagctacta gatgacttat tacaatgttc agatcccact 2760 ccttcattcc tcctctctca gtgacctgtc tacccccaag ctttagaact gagctctctc 2820 caacttagaa ctcattagag tttgttgcat tagtgattgg atctcctcat gaaagttttt 2880 tgaccaatga cagtagagcc cctttaagct agccaggccc aagataggga agcactgctg 2940 gtttacattt ctgctctttc taattcagtt gtctattgca tgcagacatc ccctgcccga 3000 cttctccatt atggaaggct aaggccatcc ttccttgtcc agtttctcta cctacacact 3060
¿ aacatgcctt ttccccatgg agtgaactct gccagttgtc tttggacatt ttctgcagat 3120 gcaggctcag ttctgctctt ttgttcccac ccacttctag atcttcctcc atttaatccc 3180 ttattcttat aaggagtcta atttttgtgt attgtccttg attagggcag ctgacagctt 3240 tacaccaaag ctgaagtctc tcacttaatc ctaagcaagg ggctagggag aactaagata 3300 tccttcccat atcaagggat ataggttact agaagggtgg aggtctctta acaggctcac 3360 tcacctttca gagnttaaat tatggtcagg cttaagaagc tete 3404
<210> 29 <211> 792 <212> ADN <213> Homo sapiens
<400> 29 ttgtacagca agttagctct tcagggagtt agctctgtct atcctgcccc tgtctgccta 60 gccactcctt ttctaggtag agtggacctt gctgttcacg tcatagatgg ccattccgtg 120 tacetagact cctttttatt cctttgccaa caagtaattg gaatgtttgg atttaagaac 180 atgtctgtgc tttgcaattt catgtgacca tggtgaaatt atgeacacat tetatcattg 240 tgattcaaca agtatttttt gaatgctgct gtgcatgagg catggtgtta gatggcagat 300 tgacagaaat gactaataca ggtatctggc ctcaaggagt ttacagtttc ataggagaaa 360 gaaaaacaaa actageaatt ctggtaagca gtatgtgttt tggagagcac ttaacttcat 420 cagagageat ggttgaaggt gtatctgtgt gtatgagaag gtgttggtga taattagaag 480 gcttccctaa agaggtcact cctggggttg agccataaag atcaagfaga tacaagt gg 540 catgaageta gtattttgct gccagtcatt tctgtagtta ggttgcctat gtggttggag 600 catgtatgta ttgttacagg tgtagtctgc ttggcttccc taagagaatg ccccagtcct 660 ggecagaata tacatgtctt ttttagggtt tgcaccaagg ggaatagaga gtgtctggct 720 cagtacaaat ctgtttccgt tactccatta tccagaaagc cactgaaatg gcattagcct 780 acacttaatg gg 792
<210> 30 5 <211> 2733 <212> ADN <213> Homo sapiens
<400> 30 10 ccacttgcca tgaacatgcc acatgccagc aaagagaagg gaagaagatc tgtatttgca 60 actatggatt tgtagggaac gggaggactc agtgtgttga taaaaatgag tgccagtttg 120 gagccactct tgtctgtggg aaccacacat cttgccacaa cacccccggg ggcttctatt 180 gcatttgcct ggaaggatat cgagccacaa acaacaacaa gacattcatt cccaacgatg 240 gcaccttttg tacagacata gatgagtgtg aagtttctgg cctgtgcagg catggagggc 300
15 gatgcgtgaa cactcatggg agctttgaat gctactgtat ggatggatac ttgccaagga 360 atggacctga acctttccac ccgaccaccg atgccacatc atgcacagaa atagactgtg 420 gtacccctcc tgaggttcca gatggctata tcataggaaa ttatacgtct agtctgggca 480 gccaggttcg ttatgcttgc agagaaggat tcttcagtgt tccagaagat acagtttcaa 540 gctgcacagg cctgggcaca tgggagtccc caaaattaca ttgccaagag atcaactgtg 600
20 gcaaccctcc agaaatgcgg cacgccatct tggtaggaaa tcacagctcc aggctgggcg 660 gtgtggctcg ctatgtctgt caagagggct ttgagagccc tggaggaaag atcacttctg 720 tttgcacaga gaaaggcacc tggagagaaa gtactttaac atgcacagaa attctgacaa 780 agattaatga tgtatcactg tttaatgata cctgtgtgag atggcaaata aactcaagaa 840 gaataaaccc caagatctca tatgtgatat ccataaaagg acaacggttg gaccctatgg 900
25 aatcagttcg tgaggagaca gtcaacttga ccacagacag caggacccca gaagtgtgcc 960
'--•-•i^*i*^*^^tí á^ *lS.y,.Í^^Í ^,?. I I¿ *L?* ¿ --.---.
tagccctgta cccaggcacc aactacaccg tgaacatctc cacagcacct cccaggcgct 1020 cgatgccagc cgtcatcggt ttccagacag ctggtagcag aaactcccac gggagaaata 1080 cacatataaa agaagttgat ctcttagaag atgatggaag tttcaatatt tcaatattta 1140 atgaaacttg tttgaaattg aacaggcgtt ctaggaaagt tggatcagaa cacatgtacc 1200 aatttaccgt tctgggtcag aggtggtatc tggctaactt ttctcatgca acatcgttta 1260 acttcacaac gagggaacaa gtgcctgtag tgtgtttgga tctgtaccct acgactgatt 1320 atacggtgaa tgtgaccctg ctgagatctc ctaagcggca ctcagtgcaa ataacaatag 1380 caactcecee agcagtaaaa cagaccatca gtaacatttc aggatttaat gaaacctgct 1440 tgagatggag aagcatcaag acagctgata tggaggagat gtatttattc cacatttggg 1500 gccagagatg gtatcagaag gaatttgccc aggaaatgac ctttaatatc agtageagea 1560 gccgagatcc cgaggtgtgc ttggacctac gtccgggtac caactacaat gtcagtctcc 1620 gggctctgtc ttcggaactt cctgtggtca tctccctgac aaeccagata acagagcctc 1680 ccctcccgga agtagaattt tttacggtgc acagaggacc tctaccacgc ctcagactga 1740 ggaaagccaa ggagaaaaat ggaccaatca gtteatatca ggtgttagtg cttcccctgg 1800 ccctccaaag cacattttct tgtgattctg aaggcgct tcctccttcttt agcaacgcct 1860 ctgatgctga tggatacgtg gctgcagaac tactggccaa agatgttcca gatgatgeca 1920 tggagatacc tataggagac aggctgtact atggggaata ttataatgea cccttgaaaa 1980 gagggagtga ttactgcatt atattaegaa tcacaagtga atggaataag gtgagaagac 2040 actcctgtgc agtttgggct caggtgaaag attcgtcact catgctgctg cagatggcgg 2100 gtgttggact gggttccctg gctgttgtga tcattctcac attcctctcc ttctcagcgg 2160 tgtgatggca gatggacact gagtggggag gatgcactgc tgctgggcag gtgttctggc 2220 agettetcag gtgcccgcac agaggctccg tgtgacttcc gtccagggag catgtgggcc 2280 tgcaactttc tccattccca gctgggcccc attcctggat ttaagatggt ggctatccct 2340 gaggagtcac cataaggaga aaactcagga attctgagtc ttccctgcta caggaccagt 2400 tctgtgcaat gaacttgaga ctcctgatgt acactgtgat attgaccgaa ggctacatac 2460 agatctgtga atcttggctg ggacttcctc tgagtgatgc ctgagggtca gctcctctag 2520 acattgactg caagagaatc tctgcaacct cctatataaa agcatttctg ttaattcatt 2580 cagaatccat tctttacaat atgcagtgag atgggcttaa gtttgggcta gagtttgact 2640 ttatgaagga ggtcattgaa aaagagaaca gtgacgtagg caaatgtttc aagcacttta 2700 gaaacagtac ttttcctata attagttgat ata 2733
<210> 31 <211> 2694 <212> ADN <213> Homo sapiens
<400> 31 ccacttgcca tgaacatgcc acatgccagc aaagagaagg gaagaagatc tgtatttgca 60 actatggatt tgtagggaac gggaggactc agtgtgttga taaaaatgag tgccagtttg 120 gagccactct tgtctgtggg aaccacacat cttgccacaa cacccccggg ggcttctatt 180 gcatttgcct ggaaggatat cgagccacaa acaacaacaa gacattcatt cccaacgatg 240 gcaccttttg tacagacata gatgagtgtg aagtttctgg cctgtgcagg catggagggc 300 gatgcgtgaa cactcatggg agcttt?aat gctactgtat ggatggatac ttgccaagga 360 atggacctga acctttccac ccgaccaccg atgccacatc atgcacagaa atagactgtg 420 gtacccctcc tgaggttcca gatggctata tcataggaaa ttatacgtct agtctgggca 480 gccaggttcg ttatgcttgc agagaaggat tcttcagtgt tccagaagat acagtttcaa 540 gctgcacagg cctgggcaca tgggagtccc caaaattaca ttgccaagag atcaactgtg 600 gcaaccctcc agaaatgcgg cacgccatct tggtaggaaa tcacagctcc aggctgggcg 660 gtgtggctcg ctatgtctgt caagagggct ttgagagccc tggaggaaag atcacttctg 720 tttgcacaga gaaaggcacc tggagagaaa gtactttaac atgcacagaa attctgacaa 780
agattaatga tgtatcactg tttaatgata cctgtgtgag atggcaaata aactcaagaa 840 gaataaaccc caagatctca tatgtgatat ccataaaagg acaacggttg gaccctatgg 900 aatcagttcg tgaggagaca gtcaacttga ccacagacag caggacccca gaagtgtgcc 960 tagccctgta cccaggcacc aactacaccg tgaacatctc cacagcacct cccaggcgct 1020 cgatgccagc cgtcatcggt ttccagacag ctgaagttga tctcttagaa gatgatggaa 1080 gtttcaatat ttcaatattt aatgaaactt gtttgaaatt gaacaggcgt tctaggaaag 1140 ttggatcaga acacatgtac caatttaccg ttctgggtca gaggtggtat ctggctaact 1200 tttctcatgc aacatcgttt aacttcacaa cgagggaaca agtgcctgta gtgtgtttgg 1260 atctgtaccc tacgactgat tatacggtga atgtgaccct gctgagatct cctaagcggc 1320 actcagtgca aataacaata gcaactcccc cagcagtaaa acagaccatc agtaacattt 1380 caggatttaa tgaaacctgc ttgagatgga gaagcatcaa gacagctgat atggaggaga 1440 tgtatttatt ccacatttgg ggccagagat ggtatcagaa ggaatttgcc caggaaatga 1500 cctttaatat cagtagcagc agccgagat cccgaggtgtg cttggaccta cgtccgggta 1560 ccaactacaa tgtcagtctc cgggctctgt cttcggaact tcctgtggtc atctccctga 1620 caacccagat aacagagcct cccctcccgg aagtagaatt ttttacggtg cacagaggac 1680 ctctaccacg cctcagactg aggaaagcca aggagaaaaa tggaccaatc agttcatatc 1740 aggtgttagt gcttcccctg gccctccaaa gcacattttc ttgtgattct gaaggcgctt 1800 cctccttctt tagcaacgcc tctgatgctg atggatacgt ggctgcagaa ctactggcca 1860 aagatgttcc agatgatgcc atggagatac ctataggaga caggctgtac tatggggaat 1920 attataatgc acccttgaaa agagggagtg attactgcat tatattacga atcacaagtg 1980 aatggaataa ggtgagaaga cactcctgtg cagtttgggc tcaggtgaaa gattcgtcac 2040 tcatgctgct gcagatggcg ggtgttsgac tgggttccct ggctgttgtg atcattctca 2100 cattcctctc cttctcagcg gtgtgatggc agatggacac tgagtgggga ggatgcactg 2160 ctgctgggca ggtgttctgg cagcttctca ggtgcccgca cagaggctcc gtgtgacttc 2220 cgtccaggga gcatgtgggc ctgcaacttt ctccattccc agctgggccc cattcctgga 2280
«¡tÜB -??S*- A -* * ? 8..-. Al .
tttaagatgg tggctatccc tgaggagtca ccataaggag aaaactcagg aattctgagt 2340 cttccctgct acaggaccag ttctgtgcaa tgaacttgag actcctgatg tacactgtga 2400 tattgaccga aggctacata cagatctgtg aatcttggct gggacttcct ctgagtgatg 2460 cctgagggtc agctcctcta gacattgact gcaagagaat ctctgcaacc tcctatataa 2520 aagcatttct gttaattcat tcagaatcca ttctttacaa tatgcagtga gatgggctta 2580 agtttgggct agagtttgact ttatgaagg aggtcattga aaaagagaac agtgacgtag 2640 gcaaatgttt caagcacttt agaaacagta cttttcctat aattagttga tata 2694
<210> 32 <211> 2765 <212> ADN <213> Homo sapiens
<400> 32 cacagcagca cattcactat tcagggtgag ccacaggagg aaagaagaga aatagagttt 60 agacgtctgt gccacttgcc atgaacatgc cacatgccag caaagagaag ggaagaagat 120 ctgtatttgc aactatggat ttgtagggaa cgggaggact cagtgtgttg ataaaaatga 180 gtgccagttt ggagccactc ttgtctgtgg gaaccacaca tcttgccaca acacccccgg 240 gggcttctat tgcatt-tgcc tggaaggata tcgagccaca aacaacaaca agacattcat 300 tcccaacgat ggcacctttt gtacagacat agatgagtgt gaagtttctg gcctgtgcag 360 gcatggaggg cgatgcgtga acactcatgg gagctttgaa tgctactgta tggatggata 420 cttgccaagg aatggacctg aacctttcca cccgaccacc gatgccacat catgcacaga 480 aatagactgt ggtacccctc ctgaggttcc agatggctat atcataggaa attatacgtc 540 tagtctgggc agccaggttc gttatgcttg cagagaagga ttcttcagtg ttccagaaga 600 tacagtttca agctgcacag gcctgggcac atgggagtcc ccaaaattac attgccaaga 660 gatcaactgt ggcaaccctc cagaaatgcg gcacgccatc ttggtaggaa atcacagctc 720 caggctgggc ggtgtggctc gctatgtctg tcaagagggc tttgagagcc ctggaggaaa 780 gatcacttct gtttgcacag agaaaggcac ctggagagaa agtactttaa catgcacaga 840 aattctgaca aagattaatg atgtatcact gtttaatgat acctgtgtga gatggcaaat 900 aaactcaaga agaataaacc ccaagatctc atatgtgata tccataaaag gacaacggtt 960 ggaccctatg gaatcagttc gtgaggagac agtcaacttg accacagaca gcaggacccc 1020 agaagtgtgc ctagccctgt acccaggcac caactacacc gtgaacatct ccacagcacc 1080 tcccaggcgc tcgatgccag ccgtcatcgg tttccagaca gctgaagttg atctcttaga 1140 agatgatgga agtttcaata tttcaatatt taatgaaact tgtttgaaat tgaacaggcg 1200 ttctaggaaa gttggatcag aacacatgta ccaatttacc gttctgggtc agaggtggta 1260 tctggctaac ttttctcatg caacatcgtt taacttcaca acgagggaac aagtgcctgt 1320 agtgtgtttg gatctgtacc ctacgactga ttatacggtg aatgtgaccc tgctgagatc 1380 tcctaagcgg cactcagtgc aaataacaat agcaactccc ccagcagtaa aacagaccat 1440 cagtaacatt tcaggattta atgaaacctg cttgagatgg agaagcatca agacagctga 1500 tatggaggag atgtatttat tccacatttg gggccagaga tggtatcaga aggaatttgc 1560 ccaggaaatg acctttaata tcagtagcag cagccgagat cccgaggtgt gcttggacct 1620 acgtccgggt accaactaca atgtcagtct ccgggctctg tcttcggaac ttcctgtggt 1680 catctccctg acaacccaga taacagagcc tcccctcccg gaagtagaat tttttacggt 1740 gcacagagga cctctaccac gcctcagact gaggaaagcc aaggagaaaa atggaccaat 1800 cagttcatat caggtgttag tgcttcccct ggccctccaa agcacatttt cttgtgattc 1860 tgaaggcgct tcctccttct ttagcaacgc ctctgatgct gatggatacg tggctgcaga 1920 actactggcc aaagatgttc cagatgatgc catggagata cctataggag acaggctgta 1980 ctatggggaa tattataatg cacccttgaa aagagggagt gattactgca ttatattacg 2040 aatcacaagt gaatggaata aggtgagaag acactcctgt gcagtttggg ctcaggtgaa 2100 agattcgtca ctcatgctgc tgcagatggc gggtgttgga ctgggttccc tggctgttgt 2160
?-* . . - ,^¿^ám* gatcattctc acattcctct ccttctcagc ggtgtgatgg cagatggaca ctgagtgggg 2220 aggatgcact getgetgggc aggtgttctg gcagcttctc aggtgcccgc acagaggctc 2280 cgtgtgactt ccgtccaggg agcatgtggg cctgcaactt tctccattcc cagctgggcc 2340 ccattcctgg atttaagatg gtggctatcc ctgaggagtc accataagga gaaaactcag 2400 gaattctgag tcttccctgc tacaggacca gttctgtgca atgaacttga gactcctgat 2460 gtacactgtg atattgaccg aaggctacat acagatctgt gaatcttggc tgggacttcc 2520 tctgagtgat gcctgagggt cagctcctct agacattgac tgcaagagaa tctctgcaac 2580 etectatata aaagcatttc tgttaattca tteagaatec attctttaca atatgeagtg 2640 agatgggctt aagtttgggc tagagtttga etttatgaag gaggtcattg aaaaagagaa 2700 cagtgacgta ggcaaatgtt tcaagcactt tagaaacagt acttttccta taattagttg 2760 atata 2765
<210> 33 <211> 4745 <212> ADN <213> Homo sapiens
<400> 33 gaccagatcc atgactgttg gtggagcatt tcatactact gaagctgaag etagttetca 60 gagtttgact cagatatatg ccttacctga aatteetcaa gatcaaaatg ctgeagaate 120 gtgggaaacc ttagaagcgg acttaattga aettagecaa ctggtcactg acttctctct 180 cctagtgaat tetcageagg agaagattga cageattgea gaccatgtca acagtgctgc 240 tgtgaatgtt gaagagggaa ccaaaaactt agggaaggct gcaaaataca agctggcagc 300 tctgcctgtg gcaggtgcac tcatcggggg aatggtaggg ggtcctattg gcctccttgc 360 aggcttcaaa gtggcaggaa ttgcagctgc acttggtggt ggggtgttgg gcttcacagg 420
te-... -* Jt ?r t -».-_¿.Í.»l -¿ .„! r. Ji¡l t.rXl tggaaaattg atacaaagaa agaaacagaa aatgatggag aagctcactt ccagctgtcc 480 agatcttccc agccaaactg acaagaaatg cagttaaaaa ccaaatttca gtattattgg 540 tgccaacatg tctatcctga ggacctttgc tgctgttgga cactccgtca ccttttggaa 600 cacaagtata tcaagatagt ggctactgat gttcaagtgg gattgaagtg tgataaatgg 660 atatattttg ttgtttgctg gggtgttcat ggagatgtta agagattgag gccctgggct 720 gagggtatat aatgtatgtc aggtaaagtt tgaagactgc caaggagcag attttctccc 780 tggaaatgtg aaaactgaac ctataactct gataaggact tgagatgtgt agaaacgttg 840 ggttatggaa gactagtttc ttccataacc ctgaattgga gaccttaatg ctaagtgtag 900 attattgagg tttgttagtg aggaaaagaa taagagttca gaagcctttg ttatcagata 960 gcgaaatcag ggcctagtga ggagcacagg tcgactacat aatggagtcc attggcgaac 1020 cctattgcaa tttggtccaa ctatatcttc tggtgaagga aattaatgat gtaagaaaat 1080 gcaagaggct caacttctct tccaaaaatc ttctggcttc tgaactcttc ctctgcctct 1140 ctttaaataa ataacacaga atttcaagtg gtaggagact tattaagcca gtcaccaagc 1200 ttggtctgtc agcctgtctt ctaacacctc aaagatcttg tgccctgtgc tgtccctecc 1260 ttgtaattat gaaaagttct ttggtttctg gggtgaattc tacccatgta taatgaggaa 1320 ttetetcata accttttttg tcttgtctgt catctctgtt catcccttcc tataaectet 1380 aggtaaaaag aaaagáaaaa aagaaatttc gagatatttt caacattgtt agagtttggg 1440 ctaaaatgag caaggagaaa aaaaccacca agaacattte ctggggcatg ttccagtttt 1500 gaggggtgat atatetgeca gatagggggt atctgaccca gtcttctttt cagctggtct 1560 ctggggggag ctgagaactc gcttgctacc tcacatcctt ttccccagac tttttatetc 1620 ctatgcatcc ctttgctttc tatagctggt gtttcttccc caaaatggcg ttcccatgct 1680 tacctttctc acattetaga caatgatgga caaagaegea tgcaagactc agacccgggg 1740 aatggtgtgg tgetaatetc aacacctgac atteacagea agcatggccc agcccaaccg 1800 catgtetate tcaaaccgca gaaaggcttt aatactggaa aaaaagaatt caagactaca 1860 ggeagetecc ctctgtaccc caaetcattt aaaataggag gaatcacttt ttgccttact 1920
? .. r i á . . , fe-afc-a- taacgctttt ttctgagcac agggatgggc acctgcaccc cagaaggtgt gagctgtctc 1980 tctgccagga gctaaggttc attaggggat tggatggttt atcacttctt tctttctgag 2040 tttactttta gtaactttta ttgatggcta cctttcatgt ccctgtctaa agagactttc 2100 tctttcatac gtcttaaatc tcatcaatga aatccagtga aacagcacca tttcttagta 2160 tcattaaata actagaaagt atcaagtatt gctctctgct gctttatatc attaacatat 2220 taataatacc aagaaggaaa tactttgaat aagtgtcaga ttctgatcca gtattggaca 2280 cctgtgatat tggacacctg tgaggctggg ataattactt ttgaattaca cctcttctct 2340 agtttctgga ccttgctctg tcactttaac acagggtgat caaacctgaa tgaggatcag 2400 aactcaccca ggcacatact aaagcaagat tcctaaacct cagttccagg ggtaattctg 2460 acatcacccg tccagcatag tcagctgaaa ttataaatct aagaaacagt tacatcaaga 2520 ttctgctgtg tcatttaatt ctgaaactcc cagtattcta cccttcttca tcactgcata 2580 ttaccccact cttccatccc aaattggcta tcctttcagc ccaccaactt agcggcagca 2640 ctagggattc attataaggt aaatctggtt tacataaaga cctgaaggag gcctgtattt 2700 gaagctcaca cttggtattg gtatctctca tttttactga gccagtgtgg aataccactg 2760 tatgtactca tataagccct tgacttttac tgctcatcag gattggaata ttactctagc 2820 agtcttcaca cataggcaag ttacagtcct tttaaaaagt atctcatttc cctataatgg 2880 aacctaatag ccaacttttt catagaaatt gctagaagag tttgatcaac tataaatgat 2940 aaagtgttta taagcatagt cagtgtgaca cagaaaccaa tcttaaaatt gaatttaatg 3000 ttttatcata tcagattaaa tattttctcc atgtcttatt tttactgcaa caagttagaa 3060 agtgggaaca ctttgattaa tgtcttaaaa tttgtgggcc ctcatttgga taaaggcagc 3120 aatcctaagg actttttttt tttttaecat aatctgagaa tttctctgta gagcagagac 3180 tttcaaacct tttggctgta acccacagta aaaaacgcat ttatatcaaa ccttagaata 3240 tgtttaatga acaatactta ccattctgat gctttttatt gtttcagttt ttaaaatatg 3300 ccagttgcaa cccactaaat tgatatctac caatgggttg caacccttag cttgaaaaaa 3360 acaccctcac agaggaactg gtatttcttg aataccttct gtttgccagg cacttcacca 3420
¡É--fe-----*-i---l--J-------_----------- jii^t ggcattttac aagtaaggaa actgggcttc agagaaaata atttgcagag gtttactcaa 3480 ctacaaaggg gtgaagccag gaatgttaac taggtctgtt gagctacaaa aacttttatg 3540 tctctcagac tatacagcct ctatacaaaa ttgagatggg ggttgggggc aggggctcat 3600 gcctgcaatc ccagcactta gggaggcaga ggccagaggat cacttgagc ccaggagttt 3660 gagaccagcc tgggcaacat agtgagactc tgtctgtatg aaaaaaatta agaattagct 3720 gggtgtggca tagcacacac ctgtggtccc agctacatgg gaagctgaag tgggaggatc 3780 acttgaactc aggagcagcc ttggtgacag aacaagaccc tctctcaaaa aaatatttaa 3840 aaaaaggtgg gtcatccatt ctcctttacc aaacaggctt tgaaatgaca cattccattc 3900 atttgcatct ttttaaaaaa cttctgattc cttactgagt gtccagcagc ctcaaagttt 3960 ttaatggtag ctgatgcaga cataaacagt gctcaatttg gcccttaaac tataaaatca 4020 agaaagtgta tttcaatccc atccacctgc ctgcaagatt tcttaatgtt cactagttat 4080 aaccattgtt taaacagtgc tttttgtgta atttaaaaat aaactttaat gctttttaaa 4140 acaaatttat cataattcat agatcaaatg attatccttt aaaatgatac ccttgggaaa 4200 tcatgtactt actgtagtga tgctagtatt aatattactt agaccaattt tgaagctgct 4260 ctttcagaat tgcctccaaa gacattttgc agatcatccc agaaaagggg gtatgatggt 4320 gctgtgtaga actgaccaga gttcctggag gattttgagg ttatactgaa actgagtgct 4380 gtacagggag aattgcatga gtccagaaac ttccttctgt gggctgcctg ccttcctgcc 4440 ctcccttaag tgctctaaga tttttgtaca ggagtaagaa tcaaatactg gtaacatcaa 4500 tcacaagaag ttgaggaaac ctgtaatata gctagataat atacaacgtt tgtcttccat 4560 cagagtgcag aaaccaaacc atgctttgtg ttaaccttaa atatgaaagg tgtttctcag 4620 ggtccccttt gtccttcgtt gctgccatat gaaatcttac aaggaaggat gaggaaaagc 4680 ctggggggag gttctcctcg gaaatgaggt ggtttttttt gttattaagt agaaccgtgg 4740 ctgtg 4745
*a i <210> 34 <211> 5241 <212> ADN <213> Homo sapiens
<400> 34 tgcgccgtgc ccaccgcccg gcct cgagcg ccccggcggg aggtttttct atatgagtgg 60 agaagacagc tgttaccagg gaggtcatac aacatttttt taggatgtct gaagatgaag 120 aaaaagtgaa attacgccgt cttgaaccag ctatccagaa attcattaag atagtaatcc 180 caacagacct ggaaaggtta agaaagcacc agataaatat tgagaagtat caaaggtgca 240 gaatctggga caagttgcat gaagagcata tcaatgcagg acgtacagtt cagcaactcc 300 gatccaatat ccgagaaat tgagaaacttt gtttgaaagt ccgaaaggat gacctagtac 360 ttctgaagag aatgatagat cctgttaaag aagaagcatc agcagcaaca gcagaatttc 420 tccaactcca tttggaatct gtagaagaac ttaagaagca atttaatgat gaagaaactt 480 tgctacagcc tcctttgacc agatccatga ctgttggtgg agcatttcat actactgaag 540 ctgaagctag ttctcagagt ttgactcaga tatatgcctt acctgaaatt cctcaagatc 600 aaaatgctgc agaatcgtgg gaaaccttag aagcggactt aattgaactt agccaactgg 660 tcactgactt ctctctccta gtgaattctc agcaggagaa gattgacagc attgcagacc 720 atgtcaacag tgctgctgtg aatgttgaag agggaaccaa aaacttaggg aaggctgcaa 780 aatacaagct ggcagctctg cctgtggcag gtgcactcat cgggggaatg gtagggggtc 840 ctattggcct ccttgcaggc ttcaaagtgg caggaattgc agctgcactt ggtggtgggg 900 tgttgggctt cacaggtgga aaattgatac aaagaaagaa acagaaaatg atggagaagc 960 tcacttccag ctgtccagat cttcccagcc aaactgacaa gaaatgcagt taaaaaccaa 1020 atttcagtat tattggtgcc aacatgtcta tcctgaggac ctttgctgct gttggacact 1080 ccgtcacctt ttggaacaca agtatatcaa gatagtggct actgatgttc aagtgggatt 1140 gaagtgtgat aaatggatat attttgttgt ttgctggggt gttcatggag atgttaagag 1200 attgaggccc tgggctgagg gtatataatg tatgtcaggt aaagtttgaa gactgccaag 1260 gagcagattt tctccctgga aatgtgaaaa ctgaacctat aactctgata aggacttgag 1320 atgtgtagaa acgttgggtt atggaagact agtttcttcc ataaccctga attggagacc 1380 ttaatgctaa gtgtagatta ttgaggtttg ttagtgagga aaagaataag agttcagaag 1440 cctttgttat cagatagcga aatcagggcc tagtgaggag cacaggtcga ctacataatg 1500 gagtccattg gcgaacccta ttgcaatttg gtccaactat atcttctggt gaaggaaatt 1560 aatgatgtaa gaaaatgcaa gaggctcaac ttctcttcca aaaatcttct ggcttctgaa 1620 ctcttcctct gcctctcttt aaataaataa cacagaattt caagtggtag gagacttatt 1680 aagccagtca ccaagcttgg tctgtcagcc tgtcttctaa cacctcaaag atcttgtgcc 1740 ctgtgctgtc cctcccttgt aattatgaaa agttctttgg tttctggggt gaattctacc 1800 catgtataat gaggaattct ctcataacct tttttgtctt gtctgtcatc tctgttcatc 1860 ccttcctata acctctaggt aaaaagaaaa gaaaaaaaga aatttcgaga tattttcaac 1920 attgttagag tttgggctaa aatgagcaag gagaaaaaaa ccaccaagaa catttcctgg 1980 ggcatgttcc agttttgagg ggtgatatat ctgccagata gggggtatct gacccagtct 2040 tcttttcagc tggtctctgg ggggagctga gaactcgctt gctacctcac atccttttcc 2100 ccagactttt tatctcctat gcatcccttt gctttctata gctggtgttt cttccccaaa 2160 atggcgttec catgcttacc tttctcacat tctagacaat gatggacaaa gacgcatgca 2220 agactcagac ccggggaatg gtgtggtgct aatctcaaca cctgacattc acagcaagca 2280 tggcccagcc caaccgcatg tctatctcaa accgcagaaa ggctttaata ctggaaaaaa 2340 agaattcaag actacaggca gctcccctct gtaccccaac tcatttaaaa taggaggaat 2400 cactttttgc cttacttaac gcttttttct gagcacaggg atgggcacct gcaccccaga 2460 aggtgtgagc tgtctctctg ccaggagcta aggttcatta ggggattgga tggtttatca 2520 cttctttctt tctgagttta cttttagtaa cttttattga tggctacctt tcatgtccct 2580 gtctaaagag actttctctt tcatacgtct taaatctcat caatgaaatc cagtgaaaca 2640 gcaccatttc ttagtatcat taaataacta gaaagtatca agtattgctc tctgctgctt 2700 tatatcatta acatattaat aataccaaga aggaaatact ttgaataagt gtcagattct 2760 gatccagtat tggacacctg tgatattgga cacctgtgag gctgggataa ttacttttga 2820 attacacctc ttctctagtt tctggacctt gctctgtcac tttaacacag ggtgatcaaa 2880 cctgaatgag gatcagaact cacccaggca catactaaag caagattcct aaacctcagt 2940 tccaggggta attctgacat cacccgtcca gcatagtcag ctgaaattat aaatctaaga 3000 aacagttaca tcaagattct gctgtgtcat ttaattctga aactcccagt attctaccct 3060 tcttcatcac tgcatattac cccactcttc catcccaaat tggctatcct ttcagcccac 3120 caacttagcg gcagcactag ggattcatta taaggtaaat ctggtttaca taaagacctg 3180 aaggaggcct gtatttgaag ctcacacttg gtattggtat ctctcatttt tactgagcca 3240 gtgtggaata ccactgtatg tactcatata agcccttgac ttttactgct catcaggatt 3300 ggaatattac tctagcagtc ttcacacata ggcaagttac agtcctttta aaaagtatct 3360 catttcccta taatggaacc taatagccaa ctttttcata gaaattgcta gaagagtttg 3420 atcaactata aatgataaag tgtttataag catagtcagt gtgacacaga aaccaatctt 3480 aaaattgaat ttaatgtttt atcatatcag attaaatatt ttctccatgt cttattttta 3540 ctgcaacaag ttagaaagtg ggaacacttt gattaatgtc ttaaaatttg tgggccctca 3600 tttggataaa ggcagcaatc ctaaggactt tttttttttt taacataatc tgagaatttc 3660 tctgtagagc agagactttc aaaccttttg gctgtaaccc acagtaaaaa acgcatttat 3720 atcaaacctt agaatatgtt taatgaacaa tacttaccat tctgatgctt tttattgttt 3780 cagtttttaa aatatgccag ttgcaaccca ctaaattgat atctaccaat gggttgcaac 3840 ccttagcttg aaaaaaacac cctcacagag gaactggtat ttcttgaata ccttctgttt 3900 gccaggcact tcaccaggca ttttacaagt aaggaaactg ggcttcagag aaaataattt 3960 gcagaggttt actcaactac aaaggggtga agccaggaat gttaactagg tctgttgagc 4020 tacaaaaact tttatgtctc tcagactata cagcctctat acaaaattga gatgggggtt 4080 gggggcaggg gctcatgcct gcaatcccag cacttaggga ggcagaggcc agaggatcac 4140
fea-* í - »j &&. J «a-fe * i*?* ttgagcccag gagtttgaga ccagcctggg caacatagtg agactctgtc tgtatgaaaa 4200 aaattaagaa ttagctgggt gtggcatagc acacacctgt ggtcccagct acatgggaag 4260 ctgaagtggg aggatcactt gaactcagga gcagccttgg tgacagaaca agaccctctc 4320 tcaaaaaaat atttaaaaaa aggtgggtca tccattctcc tttaccaaac aggctttgaa 4380 atgacacatt ccattcattt gcatcttttt aaaaaacttc tgattcctta ctgagtgtcc 4440 agcagcctca aagtttttaa tggtagctga tgcagacata aacagtgctc aatttggccc 4500 ttaaactata aaatcaagaa agtgtatttc aatcccatcc acctgcctgc aagatttctt 4560 aatgttcact agttataacc attgtttaaa cagtgctttt tgtgtaattt aaaaataaac 4620 tttaatgctt tttaaaacaa atttatcata attcatagat caaatgatta tcctttaaaa 4680 tgataccctt gggaaatcat gtacttactg tagtgatgct agtattaata ttacttagac 4740 caattttgaa gctgctcttt cagaattgcc tccaaagaca ttttgcagat catcccagaa 4800 aagggggtat gatggtgctg tgtagaactg accagagttc ctggaggatt ttgaggttat 4860 actgaaactg agtgctgtac agggagaatt gcatgagtcc agaaacttcc ttctgtgggc 4920 tgcctgcctt cctgccctcc cttaagtgct ctaagatttt tgtacaggag taagaatcaa 4980 atactggtaa catcaatcac aagaagttga ggaaacctgt aatatagcta gataatatac 5040 aacgtttgtc ttccatcaga gtgcagaaac caaaccatgc tttgtgttaa ccttaaatat 5100 gaaaggtgtt tctcagggtc ccctttgtcc ttcgttgctg ccatatgaaa tcttacaagg 5160 aaggatgagg aaaagcctgg ggggaggttc tcctcggaaa tgaggtggtt ttttttgtta 5220 ttaagtagaa ccgtggctgt g 5241
<210> 35 <211> 3014 <212> ADN <213> Homo sapiens <400> 35 cccactctcg ctgttctcct ccactctctc tccccatgaa ggaagagacc actggagttt 60 gcatgtaccc tccaatcaaa acgaggctga taaaaacatt cccggttgat acaatgaccc 120 cgtttcctga tactttcacc acagggccac agtttactgc agacttcaga gacagtaaat 180 tacaatgctg tcctggcccg acttccccgc tgatcccagc agcgaccctg aggcctttga 240 cagagaccgt ctccacagtg cagaccattt acaccacccg gaaacctgtt tctctggcag 300 ccagtgcaga gacactccgg caggaactgg agagagagaa gatgatgaaa agactgttga 360 tgaccgaact gtgaaattct ccccttgtca cctggaagat ggcatggtgc cttctgtccg 420 tcttctttct tcgggctttg tgtgctcact ctagcacagc atacaagtgt gtgctttgtt 480 cgcccaggtc tccatggtta gttgaagcca atttctggct tgacttttgt gggaaaagtt 540 attttatgtc tcctaagcat tagagttttt ctattactct atgtagttga gacaggattt 600 gataagtcta ggaaaagaaa gatgggaaaa cgggattcct tttcagaagt acctgtgtgt 660 atctgttaat aaccacaggg gttaatatga tgtaggatct tttactatca atttcaacca 720 tttgattttg tatgaftgaa acttgcaccg agctttgact gtttgttaaa gagtcatttt 780 taatgaaaga ataattcttt attgctggtt tttcatttac actgataaat acacagatct 840 tataaagtct ttaacattca tttgtattca gatgtgagta gaagaactaa aaaaagaaag 900 ttacatatca ctatgactga aggtacttca gcttaatctg aaatataatt taacttgtga 960 actccttgga tatgatatta tttggaataa acagaattta tcattgaacc caaagtagga 1020 aatgatagct tacattgtct aaaaatcctt acaaggttaa gatgattcaa tatcaagaat 1080 attcagaaaa ttatttctaa agttgatcga ttcatgtcgt attgatagaa tcttgaccag 1140 aagaaatttt gctcttttta tatagtttca agaaatgtgt ttttaaattt ttattaatgc 1200 acttgaacaa ctttgcagga ataaagcaac cccctaacca caaaatatcc ctctaaatta 1260 gttccctagc tttctcaatg aatacacaca tatttttaca tagctatgat cgttgtgtac 1320 attctccttt gttttacttc tcggcctaac acttgtctcc tcttgtcaac acagattcta 1380 ctctcaccaa tttaaatgtc tttatatcca tgtaacatgg gtaacctcac ttcaccccat 1440
tattagatat ttgagttata tctaattttt cactcttata aatagtgctg ctatgaatgt 1500 ctgtaaaaaa aaaaaaactg ctccttcttt tggattattc ccttaggaat atctccaaag 1560 agggattaca aggtcaaaga gcatgaagta ttttatagct cttgttttat attgccagat 1620 tgctttctag aaagatccaa tctttgggtt ggaaggacct taaaggtcat ctagtttagc 1680 ctccccaccc cctctgaatg cttgaatccc ctcgacaatt tatgatgcca ccagcaatgt 1740 ataagcattt ctgtttacca atagctctgc cagtattggg ttttgccatt tttatttatt 1800 tttgctagtt taataggtat gtatagttgt tcttgaagag ttgttttatt tcattaattg 1860 ctagcaaggc tgagcácttt tccatgtgat gatttactag ttgtatttcc ttgtgtgtaa 1920 aatgttcatt catttcttat gaccacttgt taagaggaac tgatctcata tatttgtatc 1980 agaactgtat ttttatgtta tattgtatag tttgctctcc tgcccctctc cttaaaactg 2040 aatggtgcca ataatttgat actaatgact acaaaaaaag gtaatgcctc atttactagt 2100 attgttgtaa aatgaggaat gtatgtgaat attcagataa ccgaggatta accctttaag 2160 tgctgaatct ttaaaatttt aatatatttt tttttgaggg aaatctttct aaaatgtatt 2220 acgcacttcc ctgccttagt aaacagagta tactggagag tatttaacct tttcttgatg 2280 agtcatggtc atgattataa acatcagccc cttttatacc ttggtacggt gcagtgatat 2340 cattaagagc tatcaatatg tgtagggctt ggcttggcct tttataggat attatgctgt 2400 tctcactgat ggttttttac tgctctctgc tctgtcagtg gagctatccg gggcaattgt 2460 agcgtttggg tccttttacc cctatgtccc ccggctatac ttttaaaaca gctttagctg 2520 ttctttatct tgtgcacatg atacaaaata tgttcccgta caatatgggg ctgtcacttc 2580 ttgccaaccc agcaccctct tcctcttcta acctgctttc tgaggcttct gctcttcacc 2640 tcctgctcgc tgatggaaac ctccagggca aagctgaagg tttcttgggg aagccaggaa 2700 agccagtatt tcctatgtgt cagatctgct tggcttccaa gaagggatgc atgggctttt 2760 tggccagtgt ttccaggagg ctctgggctt cctgcttctt ccccgcttcc cccagagttc 2820 acagatgttg aagtttctga aggttgacgt cactggaagt ctgaccacaa acaagttggc 2880 tgttactgta tttgaaaccc agtacctttg gcagctcacc tctaaccagt aaaataagag 2940
.4 * A .* &,lt]?*!AM , ,.LL „., . i , ., ., , i i ^a.*^s.^.
gattccatgg tttcagcagt tgtcctggtt atttgcctat ttaagtgaat gatgggtgct 3000 tggcattgtg actg 3014
<210> 36 <211> 1575 <212> ADN <213> Homo sapiens
<400> 36 tccaggggag atccagaatg catgtgtctc ttcccacgca tttatgtcat gttggtagct 60 ttagatcagc catggtgaga aaagaacaaa agcttttagt tgtttttgtt ttgttttgga 120 gaatttgttt accagtaaat acatcactgc ctgtacccca aatgttacca gctccctgag 180 gtgtcccaca tactattgtg agttctcaga gcatgaactg tcctcagaag agcagggcta 240 ggacttgtcc cagcatctgt gcctccatac caatcctctt tctcacagag aaccacttcc 300 catataagat gcttaaggct ctcaaaacag cagaacaatg aaacatactc tccctacact 360 tgcttagcca agagatacca ctcaggtaac ttttttcagg acatggaaga tctgtttcaa 420 ggagatttac tgctatttta tttggaagaa gctggcaact ggtcttgacc aaaatagaaa 480 aaaaaaaaaa agtccacaaa tttaatcact tgtagggaac ccatctatca aggtacccta 540 ccatatactt ttgtatttaa tagattactt agaaaccaca aaaataggaa tccttacccc 600 ttcaattcct gttcaaccct aaaaactgtg ataaacgctc ccaaccctgt ggtgatcagg 660 gttatgtaat gttcaaagat tcagacacac ctgggtttgg attcagttgc aactgggttg 720 ttatcacact cacttctttt tagctgtgtg agcatgaata atttacttag cctctctgtg 780 tctttccacc taattaaaga ggatcyaccc cagggttatt ttgaggattc aaaaaggcat 840 gcaacacacc tggagcacaa ttccactttc attcaactaa ttcccttccc ttcccccttc 900 ttccccttct acaagatcaa tatgtaaagg agacatgagg cttactggtt gcttttgaac 960 acttacttag ttcttagcta cacccactct aaaattaact ggacattagt gtacagccca 1020 tgtccaagcc cagagagaaa acaatgggaa caatttcaag gtcctcacca ctccttcatt 1080 tgcagagggg acaacagact ttctgacctg agaactggag aatttttaaa acaaaatctc 1140 tcattccagc ccaacctatt taactttttg tggaggaatt ttacatggag gaagtgagca 1200 catgtcatgc tagcpaagag gacattattg tcattaaaga gaggcattat ttatacaccc 1260 tgcaatgtgc acattaaaat atggaaattt taaaattatg accaagggct tgaaacatat 1320 tggattacat gctcacattt aacaaagaga ggaaatgtgt ttcagtttct ggagtggctg 1380 gaatttacaa gctaattgtt caataaatct actcaagata gttacctaag gctttgtggc 1440 aatgaccttg aactgagagc ctgtatctgg atttagcact tgaaagatct aactggatat 1500 ttgggttaaa agaatcacat ttattcccaa atcggaatgc tttgtttttc ctgtcagtta 1560 attgccagtt gccaa 1575
<210> 37 <211> 1607 <212> ADN <213> Homo sapiens
<400> 37 gcgaatcacg acgggcggtg gccgttgggt cccggcggga ggcggggttt ccgctccctg 60 gggcgcacgt cagtcaggag gcggaagcgc agcgggggcg ggaaggttgt agtgccgcga 120 gttgagctcc tcttgcctaa gtggtcgcgc cccctttaag agcagcgatt gtaaggagag 180 gcggtcccgg tgtcctcggg tcccaggtga ttgtgaagtg ctgaccaatt gccactggac 240 atacttgaaa caaaatagga aaatggcagc aaactcttca ggacaaggtt ttcaaaacaa 300 aaatagagtt gcaatcttgg cagaactgga caaagagaaa agaaaactac ttatgcagaa 360 ccagtcttca acaaatcatc ctggagctag cattgcactc tcgagaccct ctcttaataa 420
taak* <L* *á*t ...: A ¡J^í£r_¡i^ s_^ a-i- d---J--.--f -.«.fe ,*— I .i ->-. trS.,*. LL „ - „ ± * j \_ í ggacttccgg gatcacgctg agcagcagca tattgcagcc caacagaagg cagtttttca 480 gcatgctcat gcacattcat ctggatactt catcactcaa gactctgcat ttgggaacct 540 tattcttcct gttttacctc gccttgaccc agaatgaaga aaacatttgc gatggaaaag 600 tgactttgta atatcaaatg ccaaagctac tatcattcag tgctacatga actgtgactt 660 5 taagaatttt ggtgaacttt gatatttttt gtttgtctga aagaaaggaa tgtgtaagtg 720 aaagctgaaa gaagaataac caggatgatg agagctgtgg aagctgtatc gtccaaggaa 780 ttgattatgt accgtgactg taactttttt gtaatgctgt ttaactctca atcagactgt 840 gaactggatg gtcacgaagt cattccccaa ctcctagcaa gtttgactga atatatcatg 900 tccacagtag attttcaaga atcatttata gtacttaact ttaaagaaac aaggctgctt 960
10 ttaaaaaatg aactaatagg cttaaatcaa ttgcatccat atttgctgtt tataggattg 1020 ctatcagtat accttttgcg tttatagtca acatgtatca tcctgaaata ttctttctgg 1080 acttataact acttccccct ttttcacttt aaaacaaacc tcaagaataa attactaacc 1140 agtcttaacc atcttttata aacatatgct cttataaatg ttgtgactag atgcaattaa 1200 aaataatagg gaatgtggta ggtttttaat ttgtacatcc tcttatttag tgttaccaca 1260
15 taaatgatga gtttgtgtgg ttctgttttc catttttgtt ctaactgaaa actttttggc 1320 tgggcacggt gcctcatgcc tgtaatccca gcactttggg aggccaaggc gggcagatca 1380 cttgagatca ggagtttgag accagcctgg ccaacatggt gaaaccctgt ctctactaaa 1440 agtataaaaa attagccatg tgtggtggca cacgcctgta ttcccagcta ctctggaggc 1500 tgaggcagga gaatcgcttg aacctgggag gcaggggttg cagtgagctg agacggtgtc 1560
20 actgcactcc agcctgggtg acagtgagtc tttgtctcaa agaaaaa 1607
<210> 38 <211> 1161 <212> ADN 25 <213> Homo sapiens
wg^^^hi^a^g ^^^^^^t^^U <400> 38 agctcctctt gcctaagtgg tcgcgccccc tttaagagca gcgattgtaa ggagaggcgg 60 tcccggtgtc ctcgggtccc aggtgattgt gaagtgctga ccaattgcca ctggacatac 120 ttgaaacaaa ataggaaaat ggcagcaaac tcttcaggac aaggttttca aaacaaaaat 180 agagttgcaa tcttggcaga actggacaaa gagaaaagaa aactacttat gcagaaccag 240 tcttcaacaa atcatcctgg agctagcatt gcactctcga gaccctctct taataaggac 300 ttccgggatc acgctgagca gcagcatatt gcagcccaac agaaggcagc tttgcagcat 360 gctcatgcac attcatctgg atacttcatc actcaagact ctgcatttgg gaaccttatt 420 cttcctgttt tacctcgcct tgacccagaa tgaagaaaac atttgcgatg gaaaagtgac 480 tttgtaatat caaatgccaa agctactatc attcagtgct acatgaactg tgactttaag 540 aattttggtg aactttgata ttttttgttt gtctgaaaga aaggaatgtg taagtgaaag 600 ctgaaagaag aataaccagg atgatgagag ctgtggaagc tgtatcgtcc aaggaattga 660 ttatgtaccg tgactgtaac ttttttgtaa tgctgtttaa ctctcaatca gactgtgaac 720 tggatggtca cgaagtcatt ccccaactcc tagcaagttt gactgaatat atcatgtcca 780 cagtagattt tcaagaatca tttatagtac ttaactttaa agaaacaagg ctgcttttaa 840 aaaatgaact aataggctta aatcaattgc atccatattt gctgtttata ggattgctat 900 cagtatacct tttgcgttta tagtcaacat gtatcatcct gaaatattct ttctggactt 960 ataactactt cccccttttt cactttaaaa caaacctcaa gaataaatta ctaaccagtc 1020 ttaaccatct tttataaaca tatgctctta taaatgttgt gactagatgc aattaaaaat 1080 aatagggaat gtggtaggtt tttaatttgt acatcctctt atttagtgtt accacataaa 1140 atgatgagtt tgtgtggttc t 1161
<210> 39 <211> 1332
t JH- -J 2Í» í * t.«**t . „ U i . t i- - ,Jiím*?,-t¿** <212> ADN <213> Homo sapiens
<400> 39 gattaccggt gtgatccacc atgcccggcc aagaactgat tttaaaataa attccatctc 60 agcaataaca atgaaaaata aatntatata caaatanatt tggtctcaag cattnagaaa 120 gaggtaattg taatgccctt gggtcganga atgtgtattc tatgttaata gtttaattgg 180 cctttttgtt tggaatcttt cgcagcatag ctcatgcaca ttcatctgga tacttcatca 240 ctcaagactc tgcatttggg aaccttattc ttcctgtttt acctcgcctt gacccagaat 300 gaagaaaaca tttgcgatgg aaaagtgact ttgtaatatc aaatgccaaa gctactatca 360 ttcagtgcta catgaactgt gactttaaga attttggtga actttgatat tttttgtttg 420 tctgaaagaa aggaatgtgt aagtgaaagc tgaaagaaga ataaccagga tgatgagagc 480 tgtggaagct gtatcgtcca aggaattgat tatgtaccgt gactgtaact tttttgtaat 540 gctgtttaac tctc atcag actgtgaact ggatggtcac gaagtcattc cccaactcct 600 agcaagtttg actgaatata tcatgtccac agtagatttt caagaatcat ttatagtact 660 taactttaaa gaaacaaggc tgcttttaaa aaatgaacta ataggcttaa atcaattgca 720 tccatatttg ctgtttatag gattgctatc agtatacctt ttgcgtttat agtcaacatg 780 tatcatcctg aaatattctt tctggactta taactacttc cccctttttc actttaaaac 840 aaacctcaag aataaattac taaccagtct taaccatctt ttataaacat atgctcttat 900 aaatgttgtg actagatgca attaaaaata atagggaatg tggtaggttt ttaatttgta 960 catcctctta tttagtgtta ccacataaat gatgagtttg tgtggttctg ttttccattt 1020 ttgttctaac tgaaaacttt ttggctgggc acggtgcctc atgcctgtaa tcccagcact 1080 ttgggaggcc aaggcgggca gatcacttga gatcaggagt ttgagaccag cctggccaac 1140 atggtgaaac cctgtctcta ctaaaagtat aaaaaattag ccatgtgtgg tggcacacgc 1200 ctgtattccc agctactctg gaggctgagg caggagaatc gcttgaacct gggaggcagg 1260 ggttgcagtg agctgagacg gtgtcactgc actccagcct gggtgacagt gagtctttgt 1320 ctcaaagaaa aa 1332
<210> 40 <211> 10419 <212> ADN <213> Homo sapiens
<400> 40 accgcntccg ggctccttcg gccncgccat gggctgctgc agctccgcct cctccgccgc 60 gcagagctcc aaacgagaat ggaagccgct ggaggaccgt agctgcacag acataccatg 120 gctgctgctc ttcatcctct tctgcattgg gatgggattt atttgtggct tttcaatagc 180 aacaggtgca gcagcaagac tagtgtcagg atacgacagc tatggaaata tctgtgggca 240 gaaaaataca aagttggaag caataccaaa cagtggcatg gaccacaccc agcggaagta 300 tgtattcttt ttggatccat gcaacctgga cttgataaac cggaagatta agtctgtagc 360 actgtgtgta gcagcgtgtc caaggcaaga actgaaaact ctgagtgatg ttcagaagtt 420 tgcagagata aatggttcag ccctatgtag otacanccta aagccttctg aatacactac 480 atctccaaaa tcttctgttc tctgccccaa actaccagtt ccagcgagtg cacctattcc 540 attcttccat cgctgtgctc ctgtgaacat ttcctgctat gccaagtttg cagaggccct 600 gatcaccttt gtcagtgaca atagtgtctt acacaggctg attagtggag taatgaccag 660 caaagaaatt atattgggac tttgcttgtt atcactagtt ctatccatga ttttgatggt 720 gataatcagg tatatatcaa gagtacttgt gtggatctta acgattctgg tcatactcgg 780 ttcaottgga ggcacaggtg tactatggtg gctgtatgca aagcaaagaa ggtctcccaa 840 agaaactgtt actcctgagc agcttcagat agctgaagac aatcttcggg ccctcctcat 900 ttatgccatt tcagctacag tgttcacagt gatcttattc ctgataatgt tggttatgcg 960
caaacgtgtt gctcttacca tcgccttgtt ccacgtagct ggcaaggtct tcattcactt 1020 gccactgcta gtcttccaac ccttctggac tttotttgct cttgtcttgt tttgggtgta 1080 ctggatcatg acacttcttt ttcttggcac taccggcagt cctgttcaga atgagcaagg 1140 ctttgtggag ttcaaaattt ctgggcctct gcagtacatg tggtggtacc atgtggtggg 1200 cctgatttgg atcagtgaat ttattctagc atgtcagcag atgacagtgg caggagctgt 1260 ggtaacatac tattttacta gggataaaag gaatttgcca tttacaccta ttttggcatc 1320 agtaaatcgc cttattcgtt accacctagg tacggtggca aaaggatctt tcattatcac 1380 attagtcaaa attccgcgaa tgatccttat gtatattcac agtcagctca aaggaaagga 1440 aaatgcttgt gcacgatgtg tgctgaaatc ttgcatttgt tgcctttggt gtcttgaaaa 1500 gtgcctaaat tatttaaatc agaatgcata cacagccaca gctatcaaca gcaccaactt 1560 ctgcacctca gcaaaggatg cctttgtcat tctggtggag aatgctttgc gagtggctac 1620 catcaacaca gtaggagatt ttatgttatt ccttggcaag gtgctgatag tctgcagcac 1680 aggtttagct gggattatgc tgctcaacta ccagcaggac tacacagtat gggtgctgcc 1740 tctgatcatc gtctgcctct ttgctttcct agtcgctcat tgcttcctgt ctatttatga 1800 aatggtagtg gatgtattat tcttgtgttt tgccattgat acaaaataca atgatgggag 1860 ccctggcaga gaattctata tggataaagt gctgatggag tttgtggaaa acagtaggaa 1920 caatgaaa gaagctggta agggaggccg tcgctgattc cagagagcta aagccgatgg 1980 cctcgggagc aagttctgct tgaacctagc cgacggttat ggaaacccat tgacattcca 2040 aaacaatata tacacataac tatgtatttg tgtgtgtggg tgtgtgtata tatgtatatg 2100 tatgtgtgta tatatgtata tgtatataca cacacacaca taaatcagcc aaaatcagag 2160 aaaaggaaca gggatttaat acctttttta tgcttatttt tgtcaaacat gtactccttt 2220 catacgggtg gcttttacaa ggcaacttcc gtcatttaat gttttcaact gtaattgtct 2280 taatggaaat gttaaaattc atatctgatt aacattttta ataacttaga ggagatttta 2340 actttattta aaaataggta aaattattgt acctaattat gtctaaagtt tatt cagggg 2400 taatttccct gatgtctgta taaaatcaag atcttatttt actgatgcat aagtcctagt 2460
. t'??i., gggtcaagac taggcatatg ctttcagata aataaggaat tactccaatc agttttcccc 2520 aatcaaagaa gccatgtcat tttactttta gaaacataca attgggccca atatgggaat 2580 tttcataata gttcatacat ttgtcagcca acattaaaag gtaaccaact cctcaggtat 2640 ttgtagttta ccctaacgct tctttaaaag aaagtaggta aaaaaagaaa agggtagata 2700 atctttcgta tgcaaacttt tcccttatat tttgtctttc tttccttttt gactttagta 2760 gcatcctcca cacatttgtg tgcctgattt gaaaggaagc tggggcaccc agcgagttta 2820 gcctttaagt ttctgtgtat tgatttgcag attaagtaat gctgggagga ataaagaagg 2880 gacagaaaca tggaacataa agcattgaaa attccggtgc ttgggcttcg gcttcagagt 2940 nacgtcagtg gcttagggtt aaacggccat tttattcaaa tgcttgctat acaatctgaa 3000 -acacactgg caggtgctcc tctccttggc aattcattga gtatccagag ttctacgatg 3060 tttaactgaa gaattggcta atgttttgat cctccagtgt gactgttgtt tttgtttggg 3120 ggtgggttgg ggttttttgc tttttattcc tgaagcttac cagatatgaa tggctaatac 3180 tccattgttc tgcttgttgt aatggtgaat gctttaagaa aaaaaagtgt aatttgctaa 3240 gaataattca tgatctgttt atgcgataac tcctttttgt tacaattttt ttaaaaaaag 3300 ctatttttgt taatgtaaag taaatatttc agagcaaatt ttttaaactt attgcactaa 3360 atacaggctc tgtacaaaaa aaaaaaaaaa aaaaaaaagc ctcagcattt tatcattcca 3420 tggaaggaga atcttttgaa agaaagcat tgcctcctacc agaactagac agtgaattag 3480 atcggtatta tggaaatgca tacaagtaat gtcactaggg cttaataagc agccgtttgc 3540 taatgtgctt cctttcaaag ggttggacct ttaaattgct gcaaaaggta aattgtattt 3600 ttttttaagt attggtgttc tttactctag ctaggctaaa atttgctaaa tgccttggtt 3660 tcttttaaaa gttcatgtaa tatttctgat ttttcagaat atttgcaata agagtctgga 3720 ttttaaaaaa cacatgcata cacacaatta agagctcatg tcttagcaag atctgggaaa 3780 ccaacattgc gagagtagct attttgaaag aataattctc cagaagttaa catctaatat 3840 ctagtatcac caaacagtat cgctgttctc ttttattcat ttgaaatgaa tataattata 3900 taactaacaa ttgtccaaat agatgagaga gcaaatcatg tgagaaaatt cagaatacca 3960
: & J, TÍ& i ^*X*- . I- -.....
tctgtttcat agccgcacag attttggact ttcacaaaca ttgggaacta aatttagaat 4020 tggcaaaagt ctagaagatg ggtatcaaaa cagaagacat tccaggagct agcaatttta 4080 agaggtgtcc ctccaaagtg acctgatgga agtcctgaac ttggaaatta ggttctactc 4140 acttggacat ccctgcatca tggactgttg ctgctccctg ttccatatgc tcgcaatctc 4200 agctatttgg aagctaccag gaatgctttc taattatcat ttgcaactag aactgtaatc 4260 agaaagaaat tttgtatttt tgtataactt gattgtgtgc cattttatat aacaggtcct 4320 gttttacaaa taaattttgt tttactaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaggg 4380 tggggggaaa agagttgcaa attaattgcc aggctgtttt ccttaagtaa attcatgtgc 4440 cgtgtagaaa tatgcagata tgcattacac aggcacacac agagagatat ttaatatgtg 4500 gaatatcact ctttcatgag ctttattcct tgattaattt gataaagcct cacagaggat 4560 tttaagcaat atttaaatgt gttgaggtta tgtttggata ttcctgctgc ctcttttcat 4620 tcatttcaag tcattcttca gctagctatg ggctgcctta ttgctattcg ctcactgctt 4680 ccatcttctg cccaagtgag aagaatagat gaagaacaga aatttctctg tgaaatgtgg 4740 atacccgaat aatttcataa atcattgatt ctatgtggtg gtttttgtct tcttctgtgg 4800 tgaatcttca aaactgtatt caggactcat atttctagag ttttaattgg ggtcctctat 4860 tgtcaattgt agtagtgacc agagtatcgt ggtttttgcc atcagataat taaggctctg 4920 gtgcataatt tagactttct aagctcctgc ctgaagaata aggtcttcca taatatggaa 4980 gagaaaagtt atatttcagt gtaaatccaa gagacccatc ttctatgaga ggcttaccag 5040 tgcattagta ataaaacatt agcaatttag ctagagcact gagattgtat aatccttgca 5100 tggatgagca gagctcaaag ccagttgttc ctttaaagca tttaatgcaa tggctaatgt 5160 ttaggattaa agtttttatt ttatcctata agataattaa gtcctaagtc actacaactt 5220 aagtagctta actgtatgtt ggtacccaaa ctttttctat aatggttaag gaggaggcac 5280 ttactgagtt tattttaaag ttatgctaga aatgtttttc ttttgtagag atgctctctc 5340 tctctctctc tttttttttt tttttttttt ttccgtgagg gcattaggct gctgattgta 5400 agttatttcc aataccactg atcttggtat ctgccaaggg cttccttgcc ttccctgggc 5460 agttttagga tttcacccta gtagggggta tgaggcactg acccctttat tctggaccca 5520 aactgcttta gagcagagtt aatacctctc cctccctctt caaaacagct acaggaactg 5580 caggcaccac atatgtgtga ggccacatca ctgcccctga ggcttcaact atttccacca 5640 tgcactatta ctagctacta acagccattt taagagatct cctagcctgc aaggtagaat 5700 tctgggatca gttccaaaac cagaactgcc agtaatggtg acttgaatat tttatttgat 5760 ttttggtcag taaccttgtc atttaaattg gactttccaa tagccttaac atggcctctg 5820 agaagtttcc tccagaaagg tctttaagct ttcgcttttc aataagtaag ttctttactg 5880 cttttctact gctactttaa aaaaaaacac acacacaacc accaataaaa ctctcagagt 5940 ctggaggctt atcagtgcac ctgccacagt taatttctgt attcttttca tacattccat 6000 ctgacacata agagtgcact ataatggctt gcctagaact ggtaagaagt ggtctgtgaa 6060 tgtatattga aaaaatgtgg gttcataagt aaaagcgtaa cgcagatatt tgtgtattct 6120 gtattcacag cgtaggctgc cttttgcttt aaatgcatat tcatgtatct ttgtgtgcta 6180 agaatgcatg ttagcccttt tgaaaagtag gcactattca tacacagtag cttcttggaa 6240 ttaactcatc tttgttaact tagtggcaca tagtccaaat ttttaaaaag caagaccctt 6300 gaatatgcca agagaaaatc taaagctagc aaacttaaaa aacaaaataa aaattacacg 6360 tcgtgtacag ttatgaattt agaatagcac actttttcca ttcagatttc atacatttga 6420 gccaaattct tatactccat gttttaattt taaaaggata attttaatcc aagatttaaa 6480 tctttgaaaa tatctttctt atagaaaact ttaatgcagt ttttaaactt actgatttct 6540 gtggaaaacc tttcttttct atagaaatac tgtagtgccc tttcttccca tcttgatttt 6600 gtacatgtaa agacaaatga tgattcagtt tcaatattgc atgaacaatt gccactttgt 6660 aaattatatg gacagaatgt gttctaagga aattcgttag taaatttgtg aaaaacatgt 6720 gagattgttc gagacctatt aggctattct tcagttttga tgctcagttt tacaacttaa 6780 atgattttct ccaggacacg gagctcagaa taataaagct tttattaatg gtctagtgaa 6840 gatctagttg aacatggaaa cattgtaatt tacaaatgtc tcagaaattt ctcactttta 6900 tttgctaaga cctgaattta atatttgata ttcaaaaaca agttattttg aagagacaat 6960
-¡j- - ^^. .u. i í t.'-^'' gggtctcttt gagcttaaga aagctatgga ctatctttcc ttcaaatgca catcacatgt 7020 ctgtgaacac tcaaaatgct catagaattt cagggccctc agacggccag cttccacccc 7080 tgtaccccct caggggctaa tgaacccaag tcaaaaggct gctctaaagt tgttctgata 7140 atgtgttttg aaatgaggaa gtgattaggc ccccactaga gatacttttg agatgatgct 7200 taccaccttc tgacctggaa tcatttttat aacttaaaga ctttatgtaa tttagtagca 7260 ggttagggaa tagaaaccac actaatctga aggaataaca agatgatcaa cactgaatct 7320 tcatgacagt aagattttct ttccttggag gtatgagggt gtgtgtgtgt gtgtgtgtgt 7380 gtgtgtgtgt ttgtgtgtgt gtgtgtgtgt gtcctggcgg ttatttgggg gcaaggtacc 7440 agattatttg cagtgagcca aaaaaaaaaa atatccaaga agaaataaat agggaatcct 7500 tgtaattaat ccatctacca aaacacttga ttctttttat tgtagcbcag ctatgacatt 7560 atgacattat gtggcttagt gttatcagta tactactgtc ttaaaatata tttgtcaaca 7620 tgtccagttc caacaacagt tgaagatgat gataaattag caaactcaag ggtagtccat 7680 agttggcaaa aaataaattt ggtagaaagt tggaggagca gatgctgaag gtagaaatgc 7740 aaaagatgtt ttttcttcct gcataaatca cggaggtgtg ttctgtttta gtgttttcca 7800 gtcacccact agagcagctt cagattcctc tgccaataga actccacccc cagtccctta 7860 cctactctat cttctttagg gaagcatgtg gatttcttca catctgcacc ttactattag 7920 gtaagggtgc tgcatctaca tggaaggctc cctgggccct tgaaaaagca ggcagaaact 7980 catcaagggg tttgaagttc ttgtgaaatt tgatcccagt ggctcatgac ttatagtcag 8040 gcatcaaacc atttcctact ttttcaggct gaagaaagtg gaaatataac tggctggtga 8100 agaaaggaga aaagtcagcc ccctaccccg ccccacactc ctagaaaagt ttgggggttt 8160 tttttgtttg tttttggtgt ttttttgaga cggagtctcg ctctatcgcc agcttagagt 8220 gcagtggctc aatcttagct cactgcaacc tccacctccc aggttcaagt gattctcctg 8280 catcagcctc ctgagtagct gggaccacag gcatgtgcca ccacacccag ctaatttttg 8340 tatttttagt agagacgggg tttcaccacg ttggccaggc caatctcgaa ctcctgacct 8400 caggtgatee acccgcctca gcctcccaaa gtgetgggat tacaggcatg agccaccgcg 8460
BHA- l¿£ 3* -t* A «u .kL cccggcctag aagagtttta atgaaccttc cacagtagta aatgeagaga ccactggtgg 8520 aaatteccat gttggataga aaagggcgta agtccagtct aagtatctaa atgtgatatg 8580 cccttttgtc acagaagtgt aagacttaaa gggaatattc tgaccttcgt gtatgaatct 8640 gatccaccca tcctgtcagc taggattata atttgaactg tcgtttcagg agcatgtgtt 8700 aaatcatatg agtaaaaaaa aagtagacat tgaaaagaag acttgggaat aattgggcag 8760 atagaatggg ttccatggat cattetagtt gccactagaa aatgtgagct ccttcttcat 8820 ttaccatgtt gataatcegg tggtgacttt tttttttttt ttgtaaattg tattagatac 8880 cccacaggaa tgtgacaata ataggatagc tttgggggct ggtgatttga aacagggact 8940 attaagtaga ttttccccca tcctctaggt tcctgtagtc tgtgctcaga acttggtttt 9000 tggcccctat tgtttttgcc tattttgatt ttcagagatg atcacatggg gacagttaac 9060 ttttcttctg ctgtgttgcc ttaatgetac tagattgtgt tgtgttgttg gagttttctg 9120 acttcttccc tataaaaaga tactgagagc tecataatga aagaagttgt tatactttct 9180 cagaatatte tggaccactg aatgeaette taatagaget ttaatctaaa gaagttagtt 9240 cagtggttat taactgattt tattacagga gaaaaaaact ttaacaaaaa ggcagggaga 9300 aaagtgtgaa gggcatcaag caaaatgaca ggggcttcaa aaaacaacca aagacaaaac 9360 cctatcttct gaagaccaaa ggtccaactt tacttactgg ctggcacagc ctttctgaac 9420 tccttgagtt tagaatagag etectagaat aataaggcgg ccaaatttta aagatcagtc 9480 aatacagtag ggacctgcta ttgatctctc aggcactgag ttetteacat ccagtgtcaa 9540 gcccagccca gcatatgggg tgatatgagc agaaaacaca catcggtgtg tcttgatttc 9600 tcgcagctgt gtaatgtggc atgagaagta tgttttggtg ccacatattt ctcaatctga 9660 tgcctttttg tctttttttt tttttgccat ttgeatecta tttcatagtg ccaaaatgaa 9720 tttttgtatc ttgtcttgtc tttgtccatt ataaactgga ggatcacagt taagccttcc 9780 atgaattcat agtttggaat catttacctt accattattt tggatttttt tettattaca 9840 gtgtcactac actgtattca tgtgggggaa caaacatgta ggtgcttgaa catgccccac 9900 agacacagtt gtagccctag tatttgtgac ggtcattatt gacacagtge agactttnca 9960
iA¡j *,<> i t***i -OL A.
gatggagcat tatgetetca gaggacttta aaaatatgta tattaageaa ttaactttct 10020 ggagttggag ttatcaaatc ttgctgggaa attaaettec aagagctctg aattggatgg 10080 aattccatct ggcttcagag aacaatcage ctatatgaaa cggagctttg aaatgttttt 10140 cttgtgcaga aatacgaact agaaagaaaa gtgctgatct aatgctaagt tttctctgtg 10200 tactgactca gttgccagaa ttataatgaa aactgtattt tagtetaaca aatgtataga 10260 attttttang taataaataa aattttatag gaaagaaaaa aaaaaaaaac tgtgttgtaa 10320 cacttcccat gcccagggtg gtgacgataa aatcatgggc aacatcttcg tttcaaatta 10380 ggtcagtatg ctgcaagggt gccccagaat tcccagctg 10419
<210> 41 <211> 1813 <212> ADN <213> Homo sapiens
<400> 41 tgtgtgtagc agcgtgtcca aggcaagaac tgaaaactct gagtgatgtt cagaagtttg 60 cagagataaa tggttcagcc ctatgtagct acaaectaaa gccttctgaa tacactacat 120 ctccaaaatc ttctgttctc tgccccaaac taccagttcc agcgagtgca cctattccat 180 tcttccatcg ctgtgctcct gtgaacattt cctgctatgc caagtttgca gaggccctga 240 tcacctttgt cagtgacaat agtgtcttac acaggctgat tagtggagta atgaccagca 300 aagaaattat attgggactt tgcttgttat cactagttct atecatgatt ttgatggtga 360 taatcaggta tatatcaaga gtacttgtgt ggatettaac gattctggtc atactcggtt 420 cacttggagg cacaggtgta ctatggtggc tgtatgcaaa gcaaagaagg tctcccaaag 480 aaactgttac tcctgagcag cttcagatag ctgaagacaa tcttcgggcc ctcctcattt 540 atgccatttc agetacagtg ttcacagtga tettattect gataatgttg gttatgcgca 600
é.fí ti aJ». - -?Jti-í aacgtgttgc tcttaccatc gccttgttcc acgtagctgg caaggtcttc attcacttgc 660 cactgctagt cttccaaccc ttctggactt tctttgcrct tgtcttgttt tgggtgtact 720 ggatcatgac acttcttttt cttggcacta ccggcagtcc tgttcagaat gagcaaggct 780 ttgtggagtt caaaatttct gggcctctgc agtacatgtg gtggtaccat gtggtgggcc 840 tgatttggat cagtgaattt attctagcat gtcagcagat gacagtggca ggagctgtgg 900 taacatacta ttttactagg gataaaagga atttgccatt tacacctatt ttggcatcag 960 taaatcgcct tattcgttac cacctaggta cggtggcaaa aggatctttc attatcacat 1020 tagtcaaaat tccgcgaatg atccttatgt atattcacag tcagctcaaa ggaaaggaaa 1080 atgcttgtgc acgatgtgtg ctgaaatctt geatttgttg cctttggtgt cttgaaaagt 1140 geetaaatta tttaaatcag aatgeataca cagccacagc tatcaacagc accaacttct 1200 gcacctcagc aaaggatgcc tttgtcattc tggtggagaa tgctttgcga gtggctacca 1260 tcaacacagt aggagatttt atgttattcc ttggcaaggt gctgatagtc tgcagcacag 1320 gtttagetgg gattatgetg ctcaactacc agcaggacta cacagtatgg gtgctgcctc 1380 tgatcatcgt ctgcctcttt gctttcctag tegetcattg cttcctgtct atttatgaaa 1440 tggtagtgga tgtattattc ttgtgttttg ccattgatac aaaatacaat gatgggagcc 1500 ctggcagaga attctatatg gataaagtgc tgatggagtt tgtggaaaac agtaggaaag 1560 caatgaaaga agctggtaag ggaggcgtcg ctgattccag agagctaaag ccgatgctga 1620 agaaaaggtg actggtctca tgagccctga agaatgaact cagaggaggt tgtttacatg 1680 aggttctccc actcaccagc tgttgagagt ctgcgattat gaagagcagg atettattac 1740 tcaatgaaa gcatgtaaca agtttctcaa accaccaaca gccaagtgga tttggtacag 1800 tgcggctgtc taa 1813
<210> 42 <211> 1377 <212> ADN
y^^^^?^EjStót*^^^¿fc^ <213> Homo sapiens
<400> 42 ggggcccccc ccncccncca taataggntt tttgggannc ctggtcccta aacctcnaaa 60 gntngcccng gggnatattt ttgaggcaan aaagnccgac attgatggaa ggtcccaata 120 tg tactccc tncacccctc ccttaccatt tgggaagcag tgnctaaacc ctgggaaaat 180 acaaagnagt ctcctgccta cacattcate aaactttctg tatggtacca tggtttcata 240 cacctgtaac ccaggatatg aacttctggg gaaccctgtg ctgatctccc aggaagatgg 300 aacttggaat ggcagtgcac catcctgcat ttcaattgaa tgtgacttgc ctactgctcc 360 tgaaaatggc tttttgcgtt ttacagagac tagcatggga agtgctgtgc agtatagctg 420 taaacctgga cacattctag cgggctctga cttaaggctt tgtctagaga atagaaagtg 480 gagtggtgcc tccccacgct gtgaagccat ttcatgcaaa aagccaaatc cagtcatgaa 540 tggatccatc aaaggaagca actacacata cctgagcacg ttgtactatg agtgtgaccc 600 cggatatgtg ctgaatggca ctgagaggag aacatgccag gatgacaaaa actgggatga 660 ggatgagccc atttgcattc ctgtggactg cagttcaccc ccagtctcag ccaatggcca 720 ggtgagagga gacgagtaca cattccaaaa agagattgaa tacacttgca atgaagggtt 780 cttgcttgag ggagccagga gtcgggtttg tcttgccaat ggaagttgga gtggagccac 840 tcccgactgt gtgcctgtca gatgtgccac cccgccacaa ctggccaatg gggtgacgga 900 aggcctggac tatggcttca tgaaggaagt aacattccac tgtcangagg gctacatctt 960 gcacggtgct ccaaaactca cctgtcagtc agatggcaac tgggatgcag agattcctct 1020 ctgtaaacca gtcaactgtg gacctcctga agatcttgcc catggtttcc ctaatggttt 1080 ttcctttatt catgggggcc atatacagta tcagtgcttt cctggttata agctccatgg 1140 aaattcatca agaaggtgcc tctccaatgg ctcctggagt ggcagctcac cttcctgcct 1200 gccttgcaga tgttccacac cagtaattga atatggaact gtcaatggga cagattttga 1260 ctgtggaaag gcagcccgga ttcagtgctt caaaggcttc aagctcctag gactttctga 1320 aatcacctgt gaagcngatg gcnngtnnag ntntgggttc ccccactgtg aacacac 1377
<210> 43 <211> 452 <212> ADN <213> Homo sapiens
<400> 43 acaatcttga gcttcaagtc agtggaaaga aatgtacaat ctaattgaac acaaaaaaat 60 ttatatttca aaacattcaa agtgtcagat tggttgcata aattaaaaga gattagagaa 120 gaggaaaatc agtggacttg gagtgatcag caaaggcttc aataagtagg tagaacttaa 180 tctgggactt aaatgtgaaa attgaccagc ttgggaaggg aaaaagggag gtggtaccac 240 attaaggatg tggaagtcaa gcaggaacag caggaaatgg gataatgcta acggtatttt 300 gaaggcccag cagtggctgc ttgcagggaa gttggagtcc aatcnttttc cntacgtgcc 360 ntttttgggg tatccttccn gatttgctta agtttttntt ttnattaatt gctngggttt 420 tttttttccc gcngttttgc ccgtntcccc cg 452
<210> 44 <211> 562 <212> ADN <213> Homo sapiens
<400> 44 gtgcacatct tcagaaaact gatcctaagc aaatatcata atgaaaaacc atagattgtt 60 aatggactaa gagaccttta ggttcattag ctccaaaccc ctcattttac agaagagaga 120 attgtaagat agatagaaaa ctagtggcag aatcaagagt aaaactcagg tctgatgctt 180 ctcagatctt tccatáagtt agcacttgtt tcccatgcct cttagttatc tcaaagaatg 240 acccccatcc gtataaacat cacagataat gcccaggtat ctgggacttt caatcctgtt 300 ttcatcaact cctaaagaga tgttagctct tcagttcaat tttttctttt gaatctattt 360 ggttgctttt tttttttttt ccagggaaaa ggaggactgg gttttaacca ctgcacgacc 420 atctgggctc tcccaaaagg cagggatcca tctctcctcg gtagtggcct ggggcatcct 480 ggggaactta tggcaaagga aagtcccaac atgggtgctg gggtcttgtt tagtnaaact 540 tgttnacttg ggggttactt tt 562
<210> 45 <211> 1766 <212> ADN <213> Homo sapiens
<400> 45 anggaaaggg ttaattcccc nnttgggaat tnccnggat tttcccagant tncaatttcc 60 accnttggtc aanaaaaann ttggggnncc nctnnnttcn ccngtcanaa agannnnncn 120 cccttgaaag gnnccntnag agaatctcct gcagtccnaa aaaatgtcct ctcccggaaa 180 acataacaca tatacttgtt catggggacg atttcagtgt gaataggcaa gtttctgtgt 240 catgtgcaga agggtatacc tttgagggag ttaacatatc agtatgtcag cttgatggaa 300 cctgggagcc accattctcc gatgaatctt gcagtccagt ttcttgtggg aaacctgaaa 360 gtccagaaca tggatttgtg gttggcagta aatacacctt tgaaagcaca attatttatc 420 agtgtgagcc tggctatgaa ctagagggga acagggaacg tgtctgccag gagaacagac 480 agtggagtgg aggggtggca atatgcaaag agaccaggtg tgaaactcca cttgaatttc 540 tcaatgggaa agctgacatt gaaaacagga cgactggacc caacgtggta tattcctgca 600 acagaggcta cagtcttgaa gggccatctg aggcacactg cacagaaaat ggaacctgga 660 gccacccagt ccctctctgc aaaccaaatc catgccctgt tccttttgtg attcccgaga 720 atgctctgct gtctgaaaag gagttttatg ttgatcagaa tgtgtccatc aaatgtaggg 780 aaggttttct gctgcagggc cacggcatca ttacctgcaa ccccgacgag acgtggacac 840 agacaagcgc caaatgtgaa aaaatctcat gtggtccacc agctcacgta gaaaatgcaa 900 ttgctcgagg cgtacattat caatatggag acatgatcac ctactcatgt tacagtggat 960 acatgttgga gggtttcctg aggagtgttt gtttagaaaa tggaacatgg acatcacctc 1020 ctatttgcag agctgtctgt cgatttccat gtcagaatgg gggcatctgc caacgcccaa 1080 atgcttgttc ctgtccagag ggctggatgg ggcgcctctg tgaagaacca atctgcattc 1140 ttccctgtct gaacggaggt cgctgtgtgg ccccttacca gtgtgactgc ccgccttggc 1200 tggacggggt ctcgctgtca tacagctgtt tgccagtctc cctgcttaaa tggtggaaaa 1260 tgtgtaagac caaaccgatg tcactgtctt tcttcttgga cgggacataa ctgttccagg 1320 aaaaggagga ctgggtttta accactgcac gaccatctgg ctctcccaaa agcaggatca 1380 tctctcctcg gtagtgcctg ggcatcctgg aacttatgca aagaaagtcc aacatggtgc 1440 tgggtcttgt ttagtaaact tgttacttgg ggttactttt tttattttgt gatatatttt 1500 gttattcctt gtgacatact ttcttacatg tttccatttt taaatatgcc tgtattttct 1560 atataaaaat tatattaaat agatgctgct ctaccctcac aaaatgtaca tattctgctg 1620 tctattggga aagttcctgg tacacatttt tattcagtta cttaaaatga tttttccatt 1680 aaagtatatt ttgctactaa ataatattnn gctggatagn accattttat gaggngccaa 1740 gggatcatag agaggctcat ganttc 1766
<210> 46 <211> 601 <212> ADN <213> Homo sapiens
<400> 46 cagtggaaag aaatgtacaa tctaattgaa cacaaaaaaa tttatagttc aaaacattca 60 aagtgtcaga ttggttgcat aaattaaaag agattagaga agaggaaaat cagtggactt 120 ggagtgatca gcaaaggctt caataagtag gtagaactta atctgggact taaatgtgaa 180 aattgaccag cttggaagga aaaagggagg tggtaccaca taaggatgtg aagtcaagca 240 gaacagcaga aatggataat gctaacggta tatgaagacc ágcagtggct gctgcaggaa 300 gtagagtcaa atcttatcct acgtgccttt atggatatca tcagaattgc taagtattaa 360 ttaaataaat gcatgggttt tttattccag ctgtttgcca gtctccctgc ttaaatggtg 420 gaaaatgtgt aagaccaaac cgatgtcact gtctttcttc ttggacggga cataactgtt 480 ccaggaaaag gaggactggg ttttaaccac tgcacgacca tctggctctc ccaaaagcag 540 gatcatctct cctcggtagt gcctgggcat cctggaactt atgcaaagaa agtccaacat 600 g 601
<210> 47 <211> 3706 <212> ADN <213> Homo sapiens
<400> 47 gaatggcaaa ttctcttaca cggacctaca ctatggacag accgttacct actcttgcaa 60 ccgaggcttt cggcncgaag gtcccagtgc cttgacctgt ttagagacag gtgattggga 120 tgtagatgcc ccatcttgca atgccatcca ctgtgattcc ccacaaccca ttgaaaatgg 180 ttttgtagaa ggtgcagatt acagctatgg tgccataatc atctacagtt gcttccctgg 240 gtttcaggtg gctggtcatg ccatgcegac ctgtgaagag tcaggatggt caagttccat 300 cccaacatgt atgccaatag actgtggcct ccctcctcat atagattttg gagactgtac 360 taaactcaaa gatgaccagg gatattttga gcaagaagac gacatgatgg aagttccata 420 tgtgactcct caccctcctt atcatttggg agcagtggct aaaacctggg aaaatacaaa 480 ggagtctcct gctacacatt catcaaactt tctgtatggt accatggttt catacacctg 540 taanccagga tatgaacttc tggggaaccc tgtgctgatc tnccaggaag atggaacttg 600 gaatggcagt gcaccatcct gcatttcaat tgaatgtgac ttgcctactg ctcctgaaaa 660 tggctttttg cgttttacag agactagcat gggaagtgct gtgcagtata gctgtaaacc 720 tggacacatt ctagcgggct ctgacttaag gctttgtcta gagaatagaa agtggagtgg 780 tgcctcecea cgctgtgaag ccatttcatg caaaaagcca aatccagtca tgaatggatc 840 catcaaagga ageaactaca catacctgag cacgttgtac tatgagtgtg accccggata 900 tgtgctgaat ggcactgaga ggagaacatg ccaggatgac aaaaactggg atgaggatga 960 gcccatttgc attcctgtgg actgcagttc acccccagtc teagecaatg gccaggtgag 1020 aggagacgag tacacattcc aaaaagagat tgaatacact tgcaatgaag ggttcttgct 1080 tgagggagcc aggagtcggg tttgtcttgc caatggaagt tggagtggag ccactcccga 1140 ctgtgtgcct gtcagatgtg ccaccccgcc acaactggcc aatggggtga cggaaggcct 1200 ggactatggc ttcatgaagg aagtaacatt ccactgtcat gagggctaca tcttgcacgg 1260 tgctccaaaa ctcacctgtc agtcagatgg caactgggat geagagatte ctctctgtaa 1320 accagtcaac tgtggacctc ctgaagatct tgcccatggt ttccctaatg gtttttcctt 1380 tattcatggg ggecatatac agtatcagtg ctttcctggt tataagetec atggaaattc 1440 atcaagaagg tgcctctcca atggctcctg gagtggcagc tcaccttcct gcctgccttg 1500 cagatgttcc acaccagtaa ttgaatatgg aactgtcaat gggacagatt ttgactgtgg 1560 aaaggcagcc cggattcagt gcttcaaagg cttcaagctc ctaggacttt ctgaaatcac 1620 ctgtgaagcc gatggccagt ggagctctgg gttcccccac tgtgaacaca cttcttgtgg 1680 ttctcttcca atgataccaa atgcgttcat cagtgagacc agctcttgga aggaaaatgt 1740 gataacttac agctgcaggt ctggatatgt catacaaggc agttcagatc tgatttgtac 1800 agagaaaggg gtatggagcc agccttatcc agtctgtgag cccttgtcct gtgggtcccc 1860 accgtctgtc gccaatgcag tggcaactgg agaggcacac acctatgaaa gtgaagtgaa 1920 actcagatgt ctggaaggtt atacgatgga tacagataca gatacattca cctgtcagaa 1980 agatggtcgc tggttccctg agagaatctc ctgcagtcct aaaaaatgtc ctctcccgga 2040 aaacataaca catatacttg tncatgggga cgatttcagt gtgaataggc aagtttctgt 2100 gtcatgtgca gaagggtata cctttgaggg agttaacata tcagtatgtc agcttgatgg 2160 aacctgggag ccaccattct ccgatgaatc ttgcagtcca gtttcttgtg ggaaacctga 2220 aagtccagaa catggatttg tggttggcag taaatacacc tttgaaagca caattattta 2280 tcagtgtgag cctggctatg aactagaggg gaacagggaa cgtgtctgcc aggagaacag 2340 acagtggagt ggaggggtgg caatatgcaa agagaccagg tgtgaaactc cacttgaatt 2400 tetcaátggg aaagctgaca ttgaaaacag gacgactgga cccaacgtgg tatattectg 2460 caacagaggc tacagtcttg aagggccatc tgaggcacac tgcacagaaa atggaacctg 2520 gagccaccca gtccctctct gcaaaccaaa tccatgccct gttccttttg tgattecega 2580 gaatgctctg ctgtctgaaa aggagtttta tgttgatcag aatgtgtcca tcaaatgtag 2640 ggaaggtttt ctgctgcagg gccacggcat cattacctgc aaccccgacg agacgtggac 2700 acagacaage gccaaatgtg aaaaaatctc atgtggtcca ccagctcacg tagaaaatgc 2760 aattgctcga ggcgtacatt atcaatatgg agacatgatc acctactcat gttacagtgg 2820 atacatgttg gagggtttcc tgaggagtgt ttgtttagaa aatggaacat ggacatcacc 2880 tcctatttgc agagctgtct gtcgatttcc atgtcagaat gggggcatct gccaacgccc 2940 aaatgcttgt tcctgtccag agggct?gat ggggcgcctc tgtgaagaac caatctgcat 3000 tcttccctgt ctgaacggag gtcgctgtgt ggccccttac cagtgtgact gcccgcctgg 3060 ctggacgggg tctcgctgtc atacagctgt ttgccagtct ccctgcttaa atggtggaaa 3120 atgtgtaaga ccaaaccgat gtcactgtct ttcttcttgg acgggacata actgttccag 3180 gaaaaggagg actgggtttt aaccactgca cgaccatctg gctctcccaa aagcaggatc 3240 atctctcctc ggtagtgcct gggcatcctg gaacttatgc aaagaaagtc caacatggtg 3300 ctgggtcttg tttagtaaac ttgttacttg gggttacttt ttttattttg tgatatattt 3360 tgttattcct tgtgacatac tttcttacat gtttccattt ttaaatatgc ctgtattttc 3420 tatataaaaa ttatattaaa tagatgctgc tctaccctca caaaatgtac atattctgct 3480 gtctattggg aaagttcctg gtacacattt ttattcagtt acttaaaatg atttttccat 3540 taaagtatat tttgctacta aataanannn tgctggatag taccatttta tgaggtggcc 3600 aagggattca tagagaggac tcatgatctt tcatctgtgc cactggcacc acataggaga 3660 ccccttacaa taaaggagac ccctttgttc tggttccatc ttctat 3706
<210> 48 <211> 373 <212> ADN <213> Homo sapiens
<400> 48 tgagacattt ccactctggc att ctagagt tctctggctt gcccttgttg ctttaaagct 60 ggttccaact tcgtgggctt tatgattgag caacactggt gattgtgatt tctaatacca 120 ccctccagat tcatgtcaca ggtgaaagtc tgcctgtggg gagagctttc acattctcct 180 ggagttgaac caaaataagg aaaacatcaa caaacacagt taccaaaagc ttccaaggag 240 ggatggagga gaaattctgt tcattgcaga tggggagaaa ttaaatgaca tcaagtgcat 300 aatggaactg ggtaggattc aaactcaagt cccctggttc aagtccttga ctccactctg 360 ggcatggctt aag 373
<210> 49 <211> 459 <212> ADN " $^+ <213> Homo sapiens
<400> 49 agtcaaaagg tgaatatata aacatgattt cagatagaat gcagaagctg tatttaatta 60 5 agttggcttt tgtcattaaa gaaatcagaa agtttggaca actcaggaat ggatttccat 120 cctagatggt atttactact atttctggaa ttaagtttac tgtctatatt caggattttg 180 tgcataagag acgtgaccac tgaggttgtg tgtcattctt atctctactc caggggtcag 240 caaactttct ctgttaaggg tcagatagta gttttttggc ttttcagtct ctgtttggct 300 ctgctataaa caatacataa atgaatgagc atggctatgt tccaataaaa cttaattgac 360 10 actgaacttt gaatttcatg tacttttcaa atgtcacaaa tgttttcctt ttgatttttt 420 tcagaaagccat taaaaaaa tccaaagacc attcttagc 459
<210> 50 <211> 2575 15 <212> ADN <213> Homo sapiens
<400> 50 tctggcattc tagagttctc tggcttgccc ttgttgcttt aaagctggtt ccaacttcgt 60 0 gggctttatg attgagcaac actggtgatt gtgatttcta ataccaccct ccagattcat 120 gtcacaggtg aaagtctgcc tgtggggaga gctttcacat tctcctggag ttgaaccaaa 180 ataaggaaaa catcaacaaa cacagttacc aaaagcttcc aaggagggat ggaggagaaa 240 ttctgttcat tgcagatggg gagaaattaa atgacatcaa gtgcataatg gaactgggta 300 ggattcaaac tcaagtcccc tggttcaagt ccttgactcc actctgggca tggctaagtc 360 5 ttggcctgtgt ctcatctct cagctctagt ggctgtttag tagtgaagat actgatatgc 420
A£^gjgg aggcagccat gttgtaaata agatgcaaat atttttatat ttctctctct tatgtgtata 480 atatttgagc tacaaacagg ttaaaacaaa agagagactt cagcttagta gcaggcaggg 540 aaggaagaag tgaatgcagc ttccttccgc ttacatttct aatcaagcta attatttcac 600 tagtgatttc tcatttgatt accgattttg cttatttatg cttagaactt tcaatgactt 660 ctcagtgcca ttaaggtaaa atgcaagcca tttctgtgac ctgcaatatc atcttttgcc 720 actcctcctc acttgctatg tcttagcaag actgagaggc tctcagttct tcagacctgc 780 tctatctcac ctctcatttt gttcatattc tccacctctt gtgcttgatg aactcctatt 840 cacctatcag gtcacaactt aaatattttt tcctccaaat ctct~gacta cataggtcca 900 ggcccccatc aaatgctccc atagcacatt gggcttcctc atcaacatgc tcgttatact 960 tttctagaat tgctggcttg tcctccttgt tatctcccta atgcagagac cattactcat 1020 cattgtagca gatatttatc catatcaggt actcagcaaa catttgtgga atgaatctat 1080 atgtgaaact atacttctat ggcaagtttg tttggttcag aaggcttgca tttcatgtat 1140 attgggagac tggccaacat ttttatattc ttcctcctat gctcaaacca taaataatta 1200 tgttagcaaa cactgaactt tgtcttttga aacataaata gaaacatcct tagtaacagt 1260 actaacagta atcatttttc agaaataaga attcacacca gtgatacaga atggcctttg 1220 accattatct cagagaacta gcagtcgata gacatgctga agtgataatt ccaaaaactt 1380 cagtttcatt catccctact taaatataag agaatcaact tctattttat gtctgtattc 1440 ccattttcta atatactact tgtcacagay gagatgccca accagtgttt ttcgtaaagt 1500 acctgaatag attaataata atgctagtga aatatattta gtgcttttct aagcacttta 1560 catgaattaa ctcatttaat cctcaccgca accataggaa gtagattcta ttatttatcc 1620 aattttacag atgaaaaaac tgaggctggt oacttgacat aaattaccag tgctggccag 1680 gactttagag accatttaat ccaatgctct tattttacag gggtgcagct gaagcctaag 1740 gaggtgatat gatttcctac acattcatgc accttcgtgc acatccatta aaacttttat 1800 taaatggaac ccactatcca tactccaatt agctaggtgc cttttttccc ccatttagta 1860 atttacaatt aattggagga ctttttatag ttatatttag aggaaaggag catgttttac 1920 tctatatcaa ctttcttttc tgcttaaaag cattttgatt ctttatttta ccagtcattt 1980 tagttctttt aataggttta atacacagat caaacaagac ttaaatacat ttttaacaat 2040 gtaacaattt aaaagaaatt gcctaaatcc taggtcttct aacttggagc ccagtgcttt 2100 ttttattgct ccgctgagtc aaaaggtgaa tatataaaca tgatttcaga tagaatgcag 2160 aagctgtatt taattaagtt ggcttttgtc attaaagaaa tcagaaagtt tggacaactc 2220 aggaatggat ttccatccta gatggtattt actactattt ctggaattaa gtttactgtc 2280 tatattcagg attttggtca taagagacgt gaccactgag gttgtgtgtc attcttatct 2340 ctactccagg ggtcagcaaa ctttctctgt taagggtcag atagtagttt tttggctttt 2400 cagtctctgt ttggctctgc tataaacaat acataaatga atgagcatgg ctatgttcca 2460 ataaaactta attgacactg aactttgaat ttcatgtact tttcaaatgt cacaaatgtt 2520
» ttccttttga tttttttcag aaagccatta aaaaaatcca aagaccattc ttagc 2575
<210> 51 <211> 231 <212> ADN <213> Homo sapiens
<400> 51 tgattatttt cttttcccta tgtttagtta ctgtagtaga aggctatatg aacctttggg 60 aaaagttaga aggaaaatta acagtgtcag gcctcagtaa catatattaa gtttgtttct 120 caaggagatc tgtcctcgct ttccttaaac atgttctgga tctgtaaaat aggggattct 180 tccatgaagg caaaagggtt gatttagaga gaaaagttta agcgtgggaa t 231
<210> 52 <211> 344 <212> ADN <213> Homo sapiens
<400> 52 aatcccagaa ggacettata ggtgagatac aaagtgttac ctgtgaggaa gtgtattcca 60 ctcccccacc aaaaaaaatc tttggaatat atacaagcag aaatcgggcg aatatgtgtg 120 ggaatgccta ttaagggtat aggataatgg tggaaggaac ataaagattg aacaggccaa 180 attattgata tattggccca ctaaacagga attatttttt attgttgctg ctcatggagt 240 tagaaaggtc tctagcagta tggttagttt gctgaaacat acatcaaaat ggtccaccat 300 gagtgaattg gagatgttga acctctcttg gtttcatgca gagg 344
<210> 53 <211> 402 <212> ADN <213> Homo sapiens
<400> 53 ttgttgattc tccccccacc agcccctttg tttccagacc tataagtaga caagaatccc 60 agaaggacct tataggtgag atacaaagtg ttacctgtga ggaagtgtat tccactcccc 120 caccaaaaaa aatctttgga atatatacaa gcagaaatcg ggcgaatatg tgtgggaatg 180 cctattaagg gtataggata atggtggaag gaacataaag attgaacagg ccaaattatt 240 gatatattgg cccactaaac aggaattatt ttttattgtt gctgctcatg gagttagaaa 300 ggtctctagc agtatggtta gtttgctgaa acatacatca aaatggtcca ccatgagtga 360 attggagatg ttgaacctct cttggtttca tgcagaggaa gg 402
—— i-til <210> 54 <211> 228 <212> ADN <213> Homo sapiens
<400> 54 attttcttcc ctagtceatt tctttttgtc cagtattcct tttgttcata ggcagttcca 60 ctgtgagtcc tgtactcttt ctcattcatt catggctcac tgtgtgtcat gttctattct 120 aggtgttggg gatatagcag tgaacgaaac agaagacccc tgacactgag gagctcatgt 180 tctatgggga aggtgaagtg gaaaaaaact caaaagaata aataaggg 228
<210> 55 <211> 270 <212> ADN <213> Homo sapiens
<400> 55 tgccnttaca atttcancgt tttttacccc caaatggtta atgtaggtgt tttttttttt 60 ttttggaatc attttattct ttcgtatttc tgtgtcagtc gctaggagaa agaccaggaa 120 aatctgttaa actctaaacc aaaaattccc attcactgca gagtgabgat tcgcaacact 180 gctgcaattc aggtagtggg gtgtcctgaa gtgacaacac atcaccactg cagtcctaat 240 aaattaagtc tttttgtttt gaaaaaaaaa 270
<210> 56 <211> 1130
ÍJ&¿Í aj;3l £& S?^ , ^ , . „ -. .^ ^ p-r .. t ** ,* v . ** > a .* , .afufen , ^ t ,.„ ife' - «*, -^ -^ **--teJfc * ** Jjjfcjjfe§B¡S( <212> ADN <213> Homo sapiens
<400> 56 accaattctc agtccctaga ccccattctt tgttcctctt cttcctgatt ttcttcccta 60 gtccatttct ttttgtccag tattcctttt gttcataggc agttccactg tgagtcctgt 120 actctttctc attcattcat ggctcactgt gtgtcatgtt ctattctagg tgttggggat 180 atagcagtga acgaaacaga agacccctga cactgaggag ctcatgttct atggggaagg 240 tgaagtggaa aaaaactcaa aagaataaat aagggaattt caagaggttt gaaggaaatc 300 taactaggta atgtgattgc gggacctagg gatagggaag ggcatagact gctttagata 360 ggatgggaaa tctcttaggg gagattaaaa ttgaactaag acctgaatta catggaaaaa 420 tttagtcaaa ggaaaagcat tccagagaga gagcatggca gtgcaaagcc ttgcagaaag 480 aaccagtgta gaaagtccaa ggatgaaaga aagccagtgt agctagagcc tgaagaatga 540 ggatgggagt ggaagatgtg aaggtaagtt tgcaggggcc agatcatatc aggcctggaa 600 gatgatatag ctgtttaaag tttattctaa atgcaatgag aagccagctc ctagcaagat 660 aataaattgc ttttccagaa cgttaactgt ccattattta gttcctttgc attctccata 720 ggctggtctt ataaaggttc tgtgacagta gggaatccat taaagatcta ttacataagg 780 gaatgtggga catgcaaaag cagaagacaa atgtagaaac cctctgcttc acttggcatt 840 tctgtccttc atctttctga tattttaaag ctactgtgtt cctacataca tatgctatct 900 gttccttcat tctttttgat aaattcatca tttgccttta catttttgtc gttttttacc 960 cccaaatggt taatgtaggt gttttttttt tttttggaat cattttattc tttcgtattt 1020 ctgtgtcagt cgctaggaga aagaccegga aaatctgtta aactctaaac caaaaattcc 1080 cattcactgc agagtgatga ttcgcaacac tgctgcaatt caggtagtgg 1130 <210> 57 <211> 463 <212> ADN <213> Homo sapiens
<400> 57 cctaatgagt ggctctgtat tcccatttcc tcatgtggac taatgcggtg tgtggtgttt 60 ttcttttcct tttcagaagc agtggacagg ggagaatccg ctccaacgtt gtccacctcc 120 cc tcaccct cctccccttc acccacttcc ccttcaceta ctctgggcag acgaaggcct 180 gnaaatagga acgtttctta gaaagaagaa aactagtgac atctactttg tgtctctagt 240 ttgggccatt gtcgtcatgc agatctggtt gaacctgtgg attgtgcagt ttgctgccag 300 tgccgattgc aggtcgttat ctggttnaag tacgatctcg tcttgtcttt ggaagattga ,360 tttttttttt tttttttttt tnggatttta atntttgagn gacattttac cgtntttgca 420 aagtaaaaca ttttgatggt ttggnatttt aaatagttna ctt 463
<210> 58 <211> 289 <212> ADN <213> Homo sapiens
<400> 58 gactacagtg gagageaget tccaaaaatc agattacgtt ttaatcaata gtgaaaaacc 60 ttgacatagg aaatgaggag taatcaaatg tagaaggtac tcagaaggca aaatccacag 120 cagccactaa ggacttaata aatttgggca caaaatatgg gctgccataa ggaagagagc 180 ccaaataatc aggaaaatat tagggtaaaa gatgtttcta caatgcacct gtcaggggaa 240
I Sk J* & a 5&-.AáiiÍ.gg i Í - BJÁ* aactctccct tgctctttct agtcttaggg nggaaggaca gttttaggg 289
<210> 59 <211> 1542 <212> ADN <213> Homo sapiens
<400> 59 tgggccattg tcgtcatgca gatctggttg aacctgtgga ttgtgcagtt gctgccagtg 60 ccgattgcag gtcgttatct ggttaagtac gatctcgtct tgtctttgaa gattgatttt 120 tttctttttt tacttttgga ttttaatatt tgagatacat ttaccgtctt gcaaagtaaa 180 acaatcttat gtttgcattt aaatagtaaa caaacaccat ttggttaatt tattactttg 240 atacatcttt aatatttcac tttttttttt ttttttgaga cggagtcttg cccaggctgg 300 aagtgcagtg gcaccatttc agctcactgc aagctccacc tcccaggttc atgccatttt 360 cctgcctcag cctcccgagt agctgggact ataggtgccc accaccacac ccggctaatt 420 ttttttttat ttttagtaga gacagcgttt caccatgtta gccaggatag tctcgatctc 480 ctgacctcgt gatctgccca tctcggcctc ccaaagtgct gggattatag gtgtgagcca 540 ccgcgcccgg ccagtatttc acttttaagc tcaaaaaatg tgtttagctt cttacaattt 600 catgtagtat ttgagattaa tagctccata gagagatttg attgtttagc catccatgat 660 tctgtgaagg agaatgttaa caatatctgt gttttggaat ttgaagatcg aatgattttt 720 tgtttttttt tgagacggag tctcgctctg tcacccaggc tggattgcag tggcgcgatc 780 tcagctcact gcagcctttg ccccctgggt tcaagcaatt ctcccacctc agcctcctga 840 gttgctggga ctacaggcat gcgccaccac ccctggctaa ttttttgtat ttttagtaga 900 gacggagttt caccatgttg gccaggctgg tctcgaatcc ttaccttaag tcatccgctc 960 acctccgcct cccaaagtgc tggcattaca ggagtgagcc actgcgccta gctgagattg 1020
aatgattttt gagcgctact cttagggaag cacgttttac cttgcctttt taattcaaag 1080 gaaatgtagg ctttgagaaa tacatgtatg caaagtcttg tgatttggca gaaaaattaa 1140 attacatgta tatctatatt atatgtatta catcaaaatg gaatcatagt tttccataat 1200 ccattaaatc aggtctttgt atcttaatgc tgtggtaatt taaggcccac ctctattgtt 1260 ttgattctct ctaaaactgt ctttctccta agactagaaa gagcaaggga gagttttctc 1320 tgacaggtgc attgtagaaa catcttttac ctaatatttt cctgattatt tgggctctct 1380 tcttatggca gccatatttt gtgccaaatt tattaagtcc ttagtggctg ctgtggattt 1440 tgccttctga gtaccttcta catttgatta ctcctcattt cctatgtcaa ggtttttcac 1500 tattgattaa aacgtaatct gatttttgga agctgctctc ca 1542
<210> 60 <211> 1417 <212> ADN <213> Homo sapiens
<400> 60 gacacggctg gctgcttttc tcagcgccga agccgcgcca tgctcgtcct cagaagcgcc 60 ctgactcggg cgctggcctc acggac?ctg gcgcctcaga tgtgctcatc ttttgctacg 120 ggacccagac aatacgatgg aatattctat gaatttcgtt cttattacct taagccctca 180 aagatgaatg agttcctgga aaattttgag aaaaacgctc atcttcggac agctcactct 240 gaattggttg gatactggag tgtagaattt ggaggcagaa tgaatacagt gtttcatatt 300 tggaagtatg ataattttgc tcatcgaact gaagttcgga aagccttggc caaagataag 360 gaatggcaag aacaattcct cattccaaat ttggctctca ttgataaaca agagagtgag 420 attacttatc tggtaccatg gtgcaaatta gaaaaacctc caaaagaagg agtctatgaa 480 ctggccactt ttcagatgaa acctggtggg ccagctctgt ggggtgatgc atttaaaagg 540 gcagttcatg ctcatgtcaa tctaggctac acaaaactag ttggagtgtt ccacacagag 600 tacggagcac tcaacagagt tcatgttctt tggtggaatg agagtgcaga tagtcgtgca 660 gctgggagac ataagtccca tgaggatccc agagttgtgg cagctgttcg ggaaagtgtc 720 aactacctag tatctcagca gaatatgctt ctgattccta catcgttttc accactgaaa 780 tagttttcta ctgaaataca aaaéatttca ttaactgcta taggatctgt ctgctaatgg 840 tgcttaaatt ctcccaagag gttctcactt ttatttgaag gaggtggtaa gttaatttgc 900 tatgtttctt gcattatgaa ggctacatct gtgctttgta agtaccactt caaaaaatag 960 ttctgtttac tttctgcatg gtatttcagt gtctgtcata cattaaaaat acttgtcact 1020 gttttaagat cttgactctt catttgtttc agaatagctc ttctactgta ttctgacaac 1080 tctttgcttt atagcatttt gttgtattca aatgataatg gtagcatttc catgcttgtg 1140 acagcatttt taagttatta atatatttta tcaacctttc catcatgtct gttttcctgg 1200 ttttttttgg ttgttttttg accagtaaaa tttattttgt aataccaaat aggatttaag 1260 aaaattaacg tatttcttta ctatggaaaa ccacattgtc atttgtgaca tcatctatat 1320 taaatatggt tttcacatta gttatttgtc acttacttgg aaaatgatgc tgttaggtcc 1380 tggtattaaa aatctagaaa agacttgttg gtttatg 1417
<210> 61 <211> 696 <212> ADN <213> Homo sapiens
<400> 61 ctctaagcga tctgcagttt atctgggcta ttatgcaatg tgagatatta tttatgagag 60 gcaggcagtg gcagcttaaa cagacatacc tcctcagcat tcttttccat gcagagttca 120 aagaggccta agacatctca catttatgtg aaatagttga ggcacaagta tgtggttaac 180 tacacataaa ttaccaataa aattaaaagt taactaaaat actacagaag acatttaata 240 ttttgcttca gactgttata gtaccttagg gttatgaaca tcaattacct ttgagcctta 300 ctatatttaa agggaagggg aagctgacat ttttatcttt tttaatgggt acactctacg 360 ttaccttaaa ggcttccccg gtttaagcaa aaatagaatt atgtggttta aatcatatac 420 cttattcttc atacttagct ccaagtagat tatgactttt cctaaaactt aacatgacag 480 agatttgcct tccagggggt ctaatttgaa gaggaaagta atttaaatgt ataggtttat 540 ataatagcat tgtatttttc tctattttat tcattctttc attctcttcg atgactccca 600 gcacctgcgc gtccatcttc attcttagcc aatgaccttt ccttttactt aacagagaaa 660 ataacaatca gaagagt ctt cataagttcc cacccc 696
<210> 62 <211> 2702 <212> ADN <213> Homo sapiens
<400> 62 ctcagaaagg acacggctgg ctgcttttct cagcgccgaa gccgcgccat gctcgtcctc 60 agaagcgccc tgactcgggc gctggcctca cggacgctgg cgcctcagat gtgctcatct 120 tttgctacgg gacccagaca atacgatgga atattctatg aatttcgttc ttattacctt 180 aagccctcaa agatgaatga gttcctggaa aattttgaga aaaacgctca tcttcggaca 240 gctcactctg aattggttgg atactggagt gtagaatttg gaggcagaat gaatacagtg 300 tttcatattt ggaagtatga taattttgct catcgaactg aagttcggaa agccttggcc 360 aaagataagg aatggcaaga acaattcctc attccaaatt tggctctcat tgataaacaa 420 gagagtgaga ttacttatct ggtaccatgg tgcaaattag aaaaacctcc aaaagaagga 480 gtctatgaac tggccacttt tcagatgaaa cctggtgggc cagctctgtg gggtgatgca 540
tttaaaaggg cagttcatgc tcatgtcaat ctaggctaca caaaactagt tggngttttc 600 cacacagaat atggagaact caacagagtt catgttcttt ggtggaatga gagtgcagat 660 agtcgtgcag ctgggagaca taagtcccat gaggatccca gagttgtggc ggctgttcgg 720 gaaagtgtca actacctagt ttctcagcag aatatgcttc tgattcctgc atcattttca 780 ccattgaaat agttttctac tgaaatacaa aacatttcat taactgctct aagatgtgtc 840 tgctaatggt gcttaaattc tcccaagagg ttctcgcttt tatttgaagg aggtggtaag 900 ttaattagtt atgtttcttg cattatgaag gctacatctg tgctttgtaa gtaccacttc 960 aaaaaatagt tctgtttact ttctgcatgg tatttcagtg tctgtcatac attaaaaata 1020 cttgtcactg ttttaagatc ttgactcttc atttgtttca gaatagctct tctactgtat 1080 tctgacaact ctttgcttta tagcattttg ttgtattcaa atgataatgg tagcatttcc 1140 atgcttgtga cagcattttt aagttattaa tatattttat caacctttcc atcatgtctg 1200 ttttcctggt tttttttggt tgttttttga ccagtaaaat ttattttgta ataccaaata 1260 ggatttaaga aaattaacgt atttctttac tatggaaaac cacattgtca tttgtgacat 1320 catctatatt aaatatggtt ttcacattag ttatttgtca cttacttgga aaatgatgct 1380 gttaggtcct ggtattaaaa atctagaaaa gacttgttgg tttatgtgct gaaatgtntt 1440 tntttataat taattttact aatttctact tagtttggat cactaacaga gatcttggga 1500 catttatttg ttttaaagaa atatttatgg ttatggaaac gcttgcccta ataaaaatcc 1560 tgcatattca ttgttttttt aaattcacat tttatactta tatgatctct aaagctcttg 1620 ctatgttgct ataagacagt aatatagtga taatttacca actttattga aaatgttgtt 1680 acatcaataa aatagcatgc tgggaacctg agaaggaagg tttctttagt actgccacag 1740 atgtcctgga gttttccttg aaacatcttt catttccatt ttacttgatg cctctaccta 1800 ctaaaactag atttggtact tccgatagtg tatatttaca gctatattat atttacattt 1860 ttacagacta tcttctgata atctgtattt acagctatgt tattttatat ttttaaaatc 1920 ttacagctat aaaatagtaa attgtgaatt agctgtccaa gggcaatttg gaaaacaaac 1980 tgtacagttt cctctcattt atcaggctct aagcgatctg cagtttatct gggctattat 2040
ti *\JHLJ^.A* *3*.^ -Ufa ^^^^^¡^^j^^^*jj^g^»4?^i^^í^^^^^^*í^j|^^^^^^^^^^^¡^g«^^^ ^ gcaatgtgag atattattta tgagaggcag gcagtggcag cttaaacaga catacctcct 2100 cagcattctt ttccatgcag agttcaaaga ggcctaagac atctcacatt tatgtgaaat 2160 agttgaggca caagtatgtg gttaactaca cataaattac caataaaatt aaaagttaac 2220 taaaatacta cagaagacat ttaatatttt gcttcagact gttatagtac cttagggtta 2280 tgaacatcaa ttacctttga gccttactat atttaaaggg aaggggaagc tgacattttt 2340 atctttttta atgggtacac tctacgttac cttaaaggct tccccggttt aagcaaaaat 2400 agaattatgt ggtttaaatc atatacctta ttcttcatac ttagctccaa gtagattatg 2460 acttttccta aaacttaaca tgacagagat ttgccttcca gggggtctaa tttgaagagg 2520 aaagtaattt aaatgtatag gtttatataa tagcattgta tttttctcta ttttattcat 2580 tctttcattc tcttcgatga ctcccagcac ctgcgcgtcc atcttcattc ttagccaatg 2640 acctttcctt ttacttaaca gagaaaataa caatcagaag agtcttcata agttcccacc 2700 cc 2702
<210> 63 <211> 335 <212> ADN <213> Homo sapiens
<400> 63 taccttacca ttgtgcctgt tatgttcaaa aatacatttt gaaaagttct taaaataatt 60 gctctaaatt gaaatgtcaa aacctgaata ttctacatgt gtcttgggtg atgtccttta 120 agctaatcct atantacact aaggtacatt taattgtgga aatgtcattt cacaaggcta 180 tgtaaggcat ccctcgaggc ctgcatttta atgtctagtt ttcaatttta tggcacctaa 240 aatatcccna tggtggagga tattagggat ggggntatta tcccngggat ntctcacngg 300 cccggttggg gccccgggga tcttagggtt ttcca 335
<210> 64 <211> 447 <212> ADN <213> Homo sapiens
<400> 64 tccttactgg attgagcctt ggttacttgc cacccagagg gtgat tgagt tgcagtattc 60 tgttgcacct ttgatgtcaa cttatttttg gcttaaattt tttaaataac ataaggttaa 120 agaaaggatc acatctctat cttttcctca ttgacctccc tagttctaga caaattctat 180 acttttttcc tttctttttc tctgtggtcg attatgtcat tattccctcc ccctcaaaac 240 ctaccttctc ccttggtctc cgggaatact gcactctagt gattttcctc ctactacgga 300 aaatgatttc attacctctc tgggctgggt atttccttgg tctttagggc cctttatgga 360 aaacacaacc tttggcctan tttctctnca atttgccctt tttaagaatg gtcctggtac 420 tccttttata attaatctgg gtgnggc 447
<210> 65 <211> 2324 <212> ADN <213> Homo sapiens
<400> 65 actacaagcc agtgaagtgg gtgataagcc tgactccact atctcagcca ggtccttctt 60 ctaatattat tggceagtct gtggaagaag ctatcagagg ggtgtttgat gcttccctca 120 aaatggctgg cttctatgga ttgtatacct ggctgactca tactatgttt ggcatcaata 180 ttgtcttcat accatcagca ttagcagcaa tccttggagc agtgccattc ctggggacat 240 actgggcagc agtacctgca gttcttgacc tgtggctgac acaagggtta ggatgcaagg 300 ccattttact gttgattttt catctcttgc caacatactt tgtagatact gcaatctact 360 ctgacatatc aggaggtggc catccttacc tgacaggctt ggcagtggcc ggtggagcat 420 actacctagg cctggaagga gcaatcatcg gtcctattct tctctgcata cttgtggttg 480 cttccaatat ctatagtgcc atgctagtga gtcccacgaa ttcagttccc acgccaaacc 540 agaccccatg gcctgctcag cctcagcgga ctttccgtga catttctgaa gatctgaaat 600 cttcagtagg ttgatgtggt ttcctctgca gtgatttttc taggaagttc aaatttgaca 660 gcgagttcag ctcagctgtg gccctctgcc cttccagctg tgcctagcaa gcaaaaccca 720 ggaaagaagc agaagcctcc tggccttaca tacagaatgc ctggacaaga gagaacttgc 780 tgcgggctgc tttgtatttt aaaacacagc ttgagagttc agagttggtg gtttgctcae 840 ttaactgttg ttaagatggc ttgaaaagtt tcattttata cactggtacc ctggcttgaa 900 atttttccac tttggttatc tatgttacta tattatatat ttataaagtt attttaagaa 960 etetaaacta cctgctgtta aaagaataga tggtgtaatt ttttcctggt ttaagaaatg 1020 tattgttaaa cttttctaag acagtcactt ttcaaggaag agggctttca cttttgagtg 1080 tgtagttgag tgagcaggaa aaatgaatct tctacccttc tcccacaatg tattataege 1140 tctttaagaa ataataaatc ataagtataa gggtggggtg gcttatttga tgttcagttt 1200 tatattataa ccctgggaga tacaaagact gaagetette ctcctcttcc ttttctcttc 1260 acgcttcttt acactattgc caaattataa aacttggctg accacgttga agtgaaatac 1320 ttattaaget gctatgaatg gtaacagtat gataaaattc atgctgttat taggttttct 1380 ccttccaggt ggttgaagtg aaaaatctca ggtgtagcaa tactctgatt tgttaaatgt 1440 atccgtttca ttatttggaa ctctgccaat aagttagttt teageagaat tttgtattta 1500 tgtagtattt tcccatctct tagcacagtg ccttgcacat gactctaaat gaatgcttgt 1560 tgaattgaat tgcaacttta aaaatatctc agatatcaca ataaccagca tagtgcttta 1620 cattttacaa agtccttttg cacatactat ttcacaagta catcacatca gctttcatat 1680 agctttatat tattttacat cagttttaca ctgatggaga agctaaggtt cagaaaagtg 1740 accaactcaa agtcgtaaag tgtagtagga tttggcctca gatctttgac tccgttgtgt 1800 gcagattctg ctgtattagt gttccttcta aatattgtat gcagttttcc cagtgttacg 1860 agattggtgt tgctatccat ttgttgtgaa tgaagacttg tcctatagta catgacaggg 1920 ctgagagtgg actgtagttc ttagctgaac cctttctact gtttaaaaca atcatcaggc 1980 ctatcctctg ctcccagggg aatgtgggag agaaaagggt tcttggccag gctgtaggtg 2040 gtggctcaca tctgtaatcc cagcactttg gaaggctgag gtgggtggat tgcttgagcc 2100 cagggatttg agatcagcct aggcaacatg gcaaaacccc atctctacaa aaaaaaaaaa 2160 aaaaaaaaaa aaattagctg ngnacggtgg tgtggctata gtctgagcta ctcaggaggc 2220 tgatgtatga ggatcacctg agtccaggag gtcgaggctg cagtgagcca agatggcgcc 2280 actgcactcc agcctgggtg agagagt gag acactgtccc aagg 2324
<210> 66 <211> 447 <212> 7ADN <213> Homo sapiens
<400> 66 tgttggacct ggtactctcc accacataat tatgtcctgg tacttagggt agcctggcta 60 attcttttca caacatttga aaagccgtac gtttaacttc atggatgtgg agaaacagca 120 taatgacctt ggttcacaat gaaagtgcta gccttctttc tcgtggctgg aataagaaat 180 gcaagaactg gaagattaac agagagctga tacccggact ggtaatccca caactcacta 240 ttttgggagg aaggggaaga cagggaaaga gaaggaaaaa gggcaaatgg ggaaacattt 300 ccccagagct gtgntcctgg gtcttcacct gcaaaaaaga tttgcagcca cctaaggaga 360 aagntgagct tgcccntcag ttcctcantg ttcacctacc ttttttcaca acatttgtta 420 cccaggttga ggttttttcc agatttt 447
<210> 67 <211> 564 <212> ADN <213> Homo sapiens
<400> 67 attgggcctc gggnccaaaa aacgggcacg angcggactg ggtaanccca naactcacta 60 ntttgggagg gaaggggaag acaggggaaa gaganggaaa aaggcaaang ggaaacatnc 120 cccagagctg tgcncctggt ctcacctgca aaaaagaatt gcagcccacc ctaagagaaa 180 gctgagctgc ccccctcagt cctcactgtc accctacctc tatcacaaca attgtaccca 240 agatgaagac ttctcccaga cttcagaaaa taaagtcaaa ccctagattt tgttttaaaa 300 taggaaactc agaatcaact tgcctccatc ctctgggaaa actgctccca cacaggcctt 360 ggagtgtgtt gtagcactgt ggaggaatgc agaaaggatg aaagagatct tgattctcct 420 agtggttctc ttcactaccg taggcatccc tcagccattg actcctcctt ctttctcttg 480 acattcactt tcttggccag tcttacatgc ttatgagtct actttccaat aaatttactc 540 atagtccnat taacttccna aant 564
<210> 68 <211> 604 <212> ADN <213> Homo sapiens <400> 68 cacataatta tgtcctggta cttagggtag cctggctaat tcntttcaca acatttgaaa 60 agccgtaggc attaacttca tggatgtgga gaaacagcat aatgaccttg gttcacaatg 120 aaagtgctag ccttctttct cgtggctgga ataagaaatg caagaactgg aagattaaca 180 aagagctgat acccggactg gtaatcccac aactcactat tttgggagga aggggaagac 240 agggaaagag aaggaaaaag gcaaatggga aacattcccc agagctgtgc tcctggtctc 300 acctgcaaaa aagaattgca gccacctaag agaaagctga gctgcccctc agtcctcact 360 gtcacctacc tctatcacaa caattgtacc aagatgaagc cttccccaga cttcagaaaa 420 taaagtcaaa ccctagattt tgttttaaaa taggaaactc agaatcaact tgcctccatc 480 ctctgggaaa actgctccca cacaggcctt ggagtgtgtt gtagcactgt ggaggaatgc 540 agaaaggatg aaagagatct tgattctcct agtggttctc ttcactaccg taggcatccc 600 tcag 604
<210> 69 <211> 482 <212> ADN <213> Homo sapiens
<400> 69 aaaaagctct gccagctgag cgnacttaaa ttgaggaaga gttcccttct ctattaactc 60 attttgggca gtaacaacat accctgcctg atattttcct tctgagactt tggcatagga 120 cccacgaaca aaaagtatca actcaggatt atccaatgga gcatctcata aatcaacaca 180 aggggctact agtttggata ctacacctac acaattgtga tctttaccac agtcagtcag 240 aggtaatgga gtagcagggt taagtaggtt ttaggatggg agtaggcatt ttaggatggg 300 aggtcagaag ggaggncagg gaggaaaatt tncattaagg ttcataaggt gttagttttc 360
tttsgctgga aaantgctgg agcttgggtt gggattttag gtaggacttt tccacagcct 420 gtgggaattt tggcaantta agtttcnttc ccttaaaacc cgttccggtg gaaanttgtt 480 gg 482
<210> 70 <211> 402 <212> ADN <213> Homo sapiens
¿0C" 70 ttccagntat ggatatgtta cagacatgac tgaattggtg gccttagctg aacattttga 60 gaggactctg gagcaagaaa aaacccaaaa gactaccaag cttatgtctc accaattaca 120 acagttacag gggctgagac caaaggaacc ttctttttta ttttaaatca caaccaagag 180 atagatccta ggaacaagaa attcttttcc ccgaggatgt ctgccttcct tggcaaataa 240 ggcagggaca ctgggaaaag agttgtctgc ttctctgtta ggtctaccaa taaggcctcc 300 tcccattasg gccacactgt ttcaccacta aagggaaggc ctaaggacag atcctgtgtc 360 tttaaaaaaa aaaaaaattg gaggcggcgg caggccacca ng 402
<210> 71 <211> 758 <212> ADN ?13> Homo sapiens
<400> 71 agtaacaaca taccctgcct gatattttcc ttczgagpcz ttggcatagg acccacgaac 60 aaaaagtatc aactcaggat tatccaatgg agcatctcat aaatcaacac aaggggctac 120 tagtttggat actacaccta cacaattgtg atctttacca cagtcagtca gaggtaatgg 180 agtagcaggg ttaagtaggt tttagatgga gtagcatttt agatggaggt cagaaggagg 240 caggagaaaa tttcataaga tcataagatg ttagttttct tgctgaaaaa tgctgagctt 300 ggttggaatt tagtagactt tccacagcat gtggaatttg caaattaagt tcattcccta 360 aaaccagctc agatgaaact tgtagcaact tggtggctgc tgctgcttct attttttttt 420 ttttttttaa gacacaggat ctgtcttagg cttcctttag tggtgaaaca gtgtggccta 480 atgggaggag gcttattggt agactaacag agaagcagac aactcttttc cagtgtcctg 540 cttatttgca aggaaggcag acatctcggg gaaaagaatt tcttgttcta ggatctatct 600 cttggttgtg atttaaaata aaaaagaagg ttcctttggt ctcagcccct gtaactgttg 660 taattggtga gacataagct tggtagtctt ttgggttttt tcttgctcca gagtcctctc 720 aaaatgttca gctaaggcca ccaattcagt catgtctg 758
<210> 72 <211> 673 <212> ADN <213> Homo sapiens
<400> 72 caggttgagc ccttgaaaaa cacaaaeagg acaagttcct gtgttgaaac acccccatcc 60 cctcacgttc tcacccccag gcccagaagt aggttgcaac tgcctttgga agattttgcc 120 ccttagccat ccccacccac ttgtaccagc taagaatgct ggagactctg ccaccatgct 180 ctgcgtgccc ctgaacctct gtgcagcccg gaaggctgat gtacaggtgt acctcaatcc 240 acattacagc catgctccta atgtacatgg acatttttgt aactcagctc atattctgac 300
^^^^^^^^^^^^^ 4^ m&á ^^^^^^^ tgtatttgag aagctggctg tttaagggaa cccagaagtg aattcttttg taaagtaaag 360 cacccttttg taatgcaatt aattatccct taatgtatct gttttgtaag tctgcatttt 420 tgtatatcgg atttacctta agcttctcta gtgaggcatt ctgagcagtg gtgatcacat 480 gccagatccg gccctgccna tccacaaaag tagatganca atgcacgctc ctcaaacatc 540 tttggaggaa ctacctgggc canancactg gccagggtgg cagcaagcag cagcaggggc 600 tgacagcagg gtttactgnc attcaacatt gcttganatt gcctctaatg ttctgnatta 660 aangaaaaac cat 673
<210> 73 <211> 554 <212> ADN <213> Homo sapiens
<400> 73 aaagggggaa aggaaactac tttaagagcc ccctttttcn tcccnaactc caaatttttg 60 aaaggggaaa aaacnggaaa accccacccc agttccttcc agaaaaatgc cttttcctag 120 gncattaaat acctaccttt acctatccta anactgntta agntaaatcc ctttccttta 180 ccccacccta aactanccca ttctaanccc ggantccctc actctttttt tttagttact 240 aatcatttta tgaaaataat gtatttataa gtattttcct taaggtttgt gaagagtatt 300 tgcantgtgt ccttcatttt natgtgtttg cnannnctcc gctccaggaa gaacggaaat 360 gctgtcttgt gagcatgaag tgaacgggct gttttgctcc agccactttt cttgtacaac 420 cacatggatg gattagatgt cctcaggtct tttccatctt cagtttctat gactgtggaa 480 taaatgttca gatagaaact tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa gtacctcggc 540 cgcgaccacg ctaa 554 <210> 74 <211> 1794 <212> ADN <213> Homo sapiens
<400> 74 gttctcaccc caggcccaga agtaggttgc aactgccttt ggaagatttt gccccttagc 60 catccccacc cacttgtacc agctaagaat gctggagact ctgccaccat gctctgcgtg 120 cccctgaacc tctgtgcagc ccggaaggct gatgtacagg tgtacctcaa tccacattac 180 agccatgctc ctaatgtaca tggacatttt tgtaactcag ctcatattct gactgtattt 240 gagaagctgg ctgtttaagg gaacccagaa gtgaattctt ttgtaaagta aagcaccctt 300 ttgtaatgca attaattatc ccttaatgta tctgttttgt aagtctgcat ttttgtatat 360 cgggtttacc ttaagcttct ctagtgeggc attctgagca gtggtgatca catgccagat 420 cgccctgcct atccacaaag tagatgacca atgcacgctc ctcaaacatc tttggaggaa 480 ctacctggcc aaaacactgg ccaggatgca gcaagcagca gcaggggctg acagcaggct 540 tactgccatc aacattgctt gaaatgcctc tatgttctga ataaagaaaa accataattg 600 cttgtggtga aacgaagcag tcttcatgtt aagtagcaat ggttattttt attggtagta 660 actgaacagt gttttgcaat ttgtgaaaca gtgtattgtg ttttgtaaaa tgatgtcatg 720 aaatggtggg tccttggaaa cctcctttcc gttcagctct gcctctgttc tttcaactcc 780 tttgaggctc aaaaaaaaca caaagatcag aagccttcag atagagggtg gtattctggt 840 aaagaagaaa gagataaggg acgctacctt gcttttctgg cacaggaagc acatgataaa 900 gcatgctcag atgagctgga acagatatag ctacctggtt cgtgtaaata agaataatca 960 aggccccaga gtgtgtatgc ttccaggtgg aggagaaagg ggaatctccc aaaatttaaa 1020 aacaaattgg aagaataacc aggacagcca agtgaagcag ccacagggac ccaagcagtc 1080 gaggtcttta atgtgcctgg agatgactct ctgctattca tgaatcttgc tattgcacaa 1140
^K^fcßtel^jat^^^^^?lgiJ accctatcaa gagctgctgc ttcccttcca gccagaaaag tggtaagcgg agcaagtgcc 1200 aagcagaaca gaccttatca tctgggtaac agacttctca gtgttggtgc tgtgtctgtt 1260 agagccttag agcaagttaa gcacttcctt ggtgtgggta aagaataaag gggaaagaaa 1320 ctactttaga gcctcttttt ctcccaactc atatttttga taggaaaaac agaaaaccca 1380 tccagttctt cagaaattgc tttctaggca ttaatactac tttactatct atactgttta 1440 gttattcctt tctttaccca cctaaactat ccatctaatc caggattccc tcactctttt 1500 tttttagtta ctaatcattt tatgaaaata atgtatttat aagtattttc ttaaggtttg 1560 tgaagagtat ttgcattgtg tcttcatttt aatgtgtttg caatcgctcc gctccaggaa 1620 gaacggaaat gctgtcttgt gagcatgaag tgaacgggct gttttgcaat ccagccactt 1680 ttcttgtaca accacatgga tggattagat gtcctcaggt cttttccatc ttcagtttct 1740 atgactgtgg aataaatgtt cagatagaaa cttcaaaaaa aaaaaaaaaa aaaa 1794
<210> 75 <211> 507 <212> ADN <213> Homo sapiens
<400> 75 aagaaatgat tgaaatgttt caaggggaca tggagctgaa aggtggaatg agagacttcc 60 gtttgggcta taagcttgtg gttttatttg accttttaaa ctcagcactt acactacttt 120 atttctaaat gttctatgaa ggaataagag tttgtagaac aaaagagaag ggctaaaaga 180 gagaccagtt agaaagaggt ggagagtcag aactggagtg caaaagcaca aagattccag 240 ggcatacaag gatgataaat cacttccaca aatgagcgca aagggatatt gtgtacaatg 300 cttccatgaa ggaaagaggg gcactggatt aggtacccac ctgggtttga attgaacaac 360
í^^ i ffaaa------a tactgttttt cccaagcttr tgtgtttgac agtttttaac cctttggcat gttccatttt 420 cccgggggng ttgaggaccn tttaggagct tgggatgcct taagtcccgt taacnttaag 480 ttttctttcc ccccaaaggn gggttna 507
<210> 76 <211> 415 <212> ADN <213> Homo sapiens
<400> 76 ttttttttaa tatttcgatg acatgttgaa tgcatataag aggttagagt gaacaaggaa 60 gttaagggct ttcttttttc aaaatcatat ttgcatttaa cttgaaattc tttccagtca 120 tacgattttt gcataaatat ttatgggatc ttgatggcta attagattat aagtctttta 180 tccaggaatt tgtctaattt tatgctctcc atcaaacctg agctctgtgc tgatcttcag 240 tccatgttaa acaaaattat tttaacaccc tttaaggctg catttcaaat tctctcattt 300 gttactcata ctatgtcatg ggaatatata gtctttattt ttgggatgaa agtttgaaga 360 cccaaatccc ccaaaaattg gatttcccnt gtggaaagct ctcattttgg ateca 415
<210> 77 <211> 1318 <212> ADN <213> Homo sapiens
" •-• -<400> 77 ggagctgaaa ggtggaatga gagacttccg tttgggctat aagccttgtg gttttatttg 60 accttttaaa ctcagcactt acactacttt atttctaaat gttctatgaa ggaataagag 120 tttgtagaac aaaagagaag ggctaaaaga gagaccagtt agaaagaggt ggagagtcag 180 aactggagtg caaaagcaca aagattecag gcatacaagg atgataaatc acttccacaa 240 atgagcgcaa agggatattg tgtacaatgc ttccatgaag aaagagggca ctgataggta 300 cccacctggt tgaaatgaac aactactgta ttccaagctt tgtgttgaca gttttaacct 360 ttgcatgtca ttttccaggg agtgagacct ttagagctgg atgcttaagt ctgtaactta 420 agtttcttcc acaaagagga tttattttgc tttttgtgac atgatggtgc tagaacaaaa 480 tgtactaaga aaaatttgat ggcagtaata gcattatctt gagggataaa gaagtggagt 540 gagaatgeta agtgtagatg aaaaggcctc ttcaaaaccc atttggattt gtaaagtgca 600 tgcctggaga cagcttgagc ctctagaaat gagaagaaca atgggagaat ggttttattc 660 ccatctgaat aattgcaagt tgaccttcct ccaactagaa aagtggggtt gtgtctgagg 720 acttggttgg agaataattt ttccttagtt gcttcatgat actgaacagg tcacttagcc 780 tttctcctcc ttactttctt tcacagtaaa atgagatggt aatctccact tetaagggtt 840 gttgtggaga ccacatgaag acattgatgt aactctgcct ggcagatgat gtaaagtgcc 900 catttgtgcc ttttgctttc tttgcttttg aggcatttgg cacttttatt attctttgat 960 caaaatgaga gctttcacat gggaaatcaa tttttggggg atttgggtct tcaaactttc 1020 atccaaaaat aaagactata tattccgtga catagtatga gtaacaaatg agagaatttg 1080 aaatgeagee ttaaagggtg ttaaaataat tttgtttaac atggactgaa gatcageaca 1140 gagctcaggt ttgatggaga gcataaaatt agacaaatte ctggataaaa gacttataat 1200 etaattagee atcaagatec cataaatatt tatgcaaaaa tcgtatgact ggaaagaatt 1260 tcaagttaaa tgcaaatatg attttgaaaa aagaaagccc ttaacttcct tgttcact 1318
t ^ At-l J. *Jtotfc- >> * ^Ü^- - <210> 78 <211> 530 <212> ADN <213> Homo sapiens
<400> 78 tagtctctac aatattgtca gactgatctc tgcaaaactc aaaagtcaaa ttactcttct 60 aetttaaact tecagtaget cccggattca tttaagggta gaatetaaat cctttggcat 120 ageaettaag accatttcca agggagtggc tetaccatgg agecetagag actetacatg 180 tgtctacatg ggatgcacag gcaaagettg gactgecata tgacctaaat ctgggtggaa 240 tgccctgtga tcctcctagg aacatgggca agggaggaaa tetteagaga aggcttcgcg 300 aggttgtttt ctcatctgcc tctatcttgt ggggatgctg ccatgaggcg gttttctgga 360 tattaactec caggtttcca gaggaacatg gaggatttcc aacttaaccc natggtttcc 420 gtagggtcag gaactgcagn tctattaggc ctttaggngg cagtctggga tttgacntgg 480 ecageattag gggtgtattc acaantttgc tgnaggcctt ttgaccctat 530
<210> 79 <211> 495 <212> ADN <213> Homo sapiens
<400> 79 ctgtatttgt atagageaga aaatggatag tcagataaag aagcagactt tcacaatatc 60 atatgttaat tttgtaatga gatagttgtt tagactagta aatagatcag ggttaaaggc 120 tttgattgaa tcagattatg aaaggtgcca aacacaaagg accgtccaag tctaacactt 180 acagattcag ctggtaaaga aataatgaac taattttaga ttcagccaga ttattactta 240 tatacatagg tgaaggaaaa gagaagctaa aggtgtcagc cctatgagtc cttatcccac 300 acaccaaaag ggtgggcact ggaaacaaan ggggtcagnt gggcttcagc nangngttgt 360 ggatacaccc tnttgctggc cngtcnattc cagactggca getaantggc tatagagetg 420 cagttctgcc ctacgggngc ctaggggtta agttgggagt ctcntgttcc cctgggccng 480 gggtttatat engtt 495
<210> 80 <211> 594 <212> ADN <213> Homo sapiens
<400> 80 catttaaggg tagaatetaa atcctttggc atageaetta agaccattte caagggagtg 60 gctctaccat ggagccctag agactetaca tgtgtctaca tgggatgcac aggcaaagct 120 tggactgcca tatgacctaa atctgggtgg aatgccctgt gatcctccta ggaacatggc 180 aagggaggaa atetteagag aaggcttcgc gaggttgttt tctcatctgc etetatettg 240 tgggatgctg ccatgaggcg gttttctgat ataactccca ggttccagag gaacatgaga 300 cttccaactt aacccctatg cttccgtagg gcagaactgc agetetatag ecatttaget 360 gcagtctgga attgactggc cagcaatagg gtgtatcaca actcttgctg aagccatctg 420 accccttttg tttcagtgcc atccttttgg tgtgtgggat aaggactcat agggctgaca 480 tctttagctt ctcttttctt cactatgtat ataagtaata atctggctga atctaaaatt 540 agtteattat ttctttacca gctgaatctg taagtgttag acttggacgg tect 594
LL.
<210> 81 <211> 582 <212> ADN <213> Homo sapiens
5 <400> 81 gttttctgga agtagggaga aaatcagagg ctaaagagtt tgaaaatgtg cacagaacag 60 tttgagctca aaatgccact cctaccttat tttgccaggt gattatcaat tcaccacaat 120 tcccacagga aatgagaggc attatctttt gccaaataga acttgatagg ctattaactt 180 gggtaccctg ggcctggagg aggatggaaa taagatagaa gactaaaaac aggatactaa 240
10 gtggaagtct gaataaaagg ggatgaactc caactcctat cccaccatgt ggcgtgcctc 300 tgcctgctcg ccagtaatgg tagccaggct tatatccccc atgctgacta gaacatcctt 360 ctctggggaa attaaagagc agacctctgg agaaattaca cttctcaaag aaaaattaac 420 aggcactgac atttagggtc ccaaaggcaa aaagtaggtc acactcaaag catctaactc 480 aaagaccctg gacttcagtt gtagaccctg agcagattag actttggatt gtctcccttg 540
15 ggtaaaatac agtggtctcc ccttattcaa agtttcactt te 582
<210> 82 <211> 321 20 <212> ADN <213> Homo sapiens
<400> 82 agtaaggctt ggcagttgac cttgtttgtt ggagagaagg gataagattt taaagctaca 60
a^^^g É«*^?*i^|ta^«g^¡^^^^fc ^^^^^jij¡ tgtetgaaag aatgatgctg ctgattgaaa taaaggaaga aaggatgcat ttcgggctcc 120 aacctgtcct aggaaggcct agacetcaaa caccaacacc tecatgeatt tcctctttgg 180 ctactatgtc ttttccctga cttctgcctc tccagctctc tgggctgctg cttccacctg 240 ttcatctgac ttagaccctc cctgctgggt ccttgttcac etaetcattt ggtgcttcgt 300 ctgccatcag tacctccatt g 321
<210> 83 <211> 545 <212> ADN <213> Homo sapiens
<400> 83 gtcaattaca teageaettg gactggacca gggaaaggaa tgattctgct tcctgggaat 60 gtcagaagga cctgatgatt atatttggca aagccaggag gagtggcttt gaatgtcatt 120 gctaagaatt acactttgag tagcatttct ggatgtctga gcttttcaaa tgatacttct 180 tttctgctgt ggctttcctt tctgttggac tggttcccag agggtcctct tgtttgtcct 240 tgccctcgct tttatatcag ttcatgtttt ctcttctgtc atcttccttc ccagcgctgt 300 ttctccaccc cctcctgctg cactcacaac agcttcccct ctcctgttta gaggtggaag 360 catgtaagaa tgcgtttgag ggggatgctt gccaaaggac agcatattca acatctggta 420 tcaacaaggt aatgtttaac cttagactag ccaaactagt gatgacctgc ttccatgctg 480 catctgctgc tttttgtgtt gatgggactc agaaatcatg agaaaggtct tcagtgatcc 540 atgac 545 <210> 84 <211> 183 <212> ADN <213> Homo sapiens
<400> 84 caccaaagct gaagtctctc acttaatcct aagcaagggg ctagggagaa ctaagatatc 60 cttcccatat caagggatat aggttactag aagggtggag gtctcttaac aggctcactc 120 acctttcaga gtttaaatta tggtcaggct taagaagctc tctcttgtga ctgagtgtat 180 tgc 183
<210> 85 <211> 843 <212> ADN <213> Homo sapiens
<400> 85 ggaatggaca tgaagaggat ttcacagtat gtagagcaga aggcacgtga atgtgtttgc 60 tttggcttgg agcttattaa gttttgacta cggttaaaat aagtcaaata gtaagtggta 120 aaacacattt ttgttagtat tggaactttc tggagaacat aagggctatg agaatgcata 180 tatatatttt ttaacatttc ctatatatct aaggtaccaa agcactgagt ctaatttacc 240 tattaaggga gactctttaa aatcaacttt ataactaatt catactataa gacagataat 300 agetaaagtt ttggaataat ttatattaaa agccgcaagt cttaaaaatc cctggatatg 360 acataaaaag gattttggct tcttttttga agtatttaaa attaatcacc ttagctctac 420
catatactag atetgtgace gctacacaaa ttgtttatca tctttgggtc tctattgcct 480 tctttataaa ataagtgtaa gttgttcagc ctgcctcaca gggctgttgt gaggaaataa 540 aatgaaatgg agtatgtgaa attgcttcag caacagcaaa gtgctacgta aatgtaaagt 600 gttgttttta gctaataatg gatttaagtg tttggataat tgtagatgca tttactttga 660 taaagcgtgt gcttaaagtg gtatcaccag tgatttctaa catgatttta aaaaaataaa 720 accccaatta aaatgttctt taatattcat ttaatttgtg catgacttgt ggcctttttg 780 tattttctca agectattac tetagagetg taaaagctct tgcacagcat tgttgt tca 840 gtg 843
<210> 86 <211> 613 <212> ADN <213> Homo sapiens
<400> 86 aggttatcca cttttgctga agatattttt tattgaatca aagattgagt tacaattata 60 cttttcttac ctaagtggat aaaatgtact tttgatgaat cagggaattt ttttaaagtt 120 ggagtttagt tctaaattga ctttacgtat tactgcagtt aattcctttt ttggctaggg 180 atggtttgat aaaccacaat tggctgatat tgaaaatgaa agaaacttaa aaggtgggat 240 ggatcatgat tactgtcgat aactgcagat aaatttgatt agagtaataa ttttgtcatt 300 taaaaacaca gttgtttata ctgcccatcc taggatgctc accttccaag attcaacgtg 360 gctaaaacat cttctggtaa attgtgcgtc catatteatt ttgtcagtag ccaggagaaa 420 tggggatggg ggaaatacga cttagtgagg catagacatc cctggtccat cctttctgtc 480 tccagctgtt tcttggaacc tgctctcctg cttgclggtc cctgacgcag agaccgttgc 540
^^^^ —— J^- - — —- - - .*- M . * ^. ~ * **.m vxn ctcccccaca gccgtttgac tgaaggctgc tctggagacc tagagtaaaa cggctgatgg 600 aagttgtggg acc 613
<210> 87 <211> 705 <212> ADN <213> Homo sapiens
<400> 87 gctaatgttt cttgctgggt aattattagc ataaatatca ggttcttaga ggtctttaag 60 agaatacttt agagctacca aaattagcag cagtgatgta atatcaccct gaaataccag 120 gagcagaggt gccccagagt gcttcacagc tatgatcagg aaacttgacc tgccccattg 180 ctacagcaac ggcataagga ctaggaaggt ccactagctg gggaggtctt ggaaccctcc 240 gagecagaaa gaageattec ageatgatte etcagatgea atgaggaagg tttacagaat 300 tttcacaggg caacagagat caagtggtat gaaaaggtag gagttttaag ctcaagtctc 360 aaagataacc tacetttaca ttctcagtca gaatttgacc cagaaagagg aagtttcttc 420 aggaacagac cgtacgttga tgaagtagaa gtcatttcag taaaaacgga gtacagaact 480 tggtcataat atettgeatt ttatagattt attaaagatt agtttcaagt tcacattcgc 540 tattcagttg taaaccgaat ggatgggagg ggagaaaata caagctctcc acacaggtat 600 gctcctctct tttctgagag agaaggcatg ggattttcag cataaattec atgttatgtg 660 agtgctgttt gagttctgaa gttectatca atatctgttc ctgea 705
<210>
t- -¿»i-¡l-_,.fc a*í.i** <211> 459 <212> ADN <213> Homo sapiens
<400> 88 ctcgttgctc agtttagggc actactctta aaaaaggaaa gttaacaaac tggaatagag 60 tcagagataa ctttgagaaa accgatgtca ttaaactggt gtctctggac ctgaggtttg 120 cactcacatt tccatctggc ggccccataa gcaatctgtc ctacagataa ctcgtcctac 180 acaaaactta gtctcttttc agctcagctc tctcactctc aattatatct ccttacttcc 240 atatggcact gttgtacact catttactca gagecagaaa cgtcagcgtc atcttggatt 300 tttcttatgc tctttctctc tetagtcata tgccagactt taaactctgc ttgaaagctt 360 tetcataage tctttccttt tccctttcta ctgctttgca tttgctactt aacccttttc 420 ttcaggctgt ttgctttcca gtccatcgtt cgctctgct 459
<210> 89 <211> 775 <212> ADN <213> Homo sapiens
<400> 89 tctatccgtc cgcgtcagcg ccttgccacc ctcatctcca atatgcctgg tccgaccccc 60 agtggcacta acgtgggatc ctcagggcgc tctcccagca aagcagtggc cgcccgggcg 120 gcgggatcca ctgtccggca gaggtaagga accctgcagt tcgttcgctt ccagactcgg 180 agataggacc cagaacctcg ctgattctgg ggtggagacc ctagcatgtg aagattgaca 240 aaggcaaaat gagettetag tgacgtcgcc gtgggagtag ttaaaggect tttgggagga 300 aggcgacatt ttttttctcg ttgctcagtt tagggcacta ctcttaaaaa aggaaagtta 360 acaaactgga atagagtcag agataaettt gagaaaaccg atgtcattaa actggtgtct 420 ctggacctga ggtttgcact cacatttcca tctggcggcc ccataagcaa tctgtcctac 480 agataactcg tcctacacaa aacttagtct cttttcagct cagctctctc actctcaatt 540 atatctcctt acttccatat ggcactgttg tacactcatt tactcagagc cagaaacgtc 600 agcgtcatct tggatttttc ttatgctctt tctctctcta gtcatatgee agactttaaa 660 ctctgcttga aagctttctc ataagetett tccttttccc tttctactgc tttgcatttg 720 ctacttaacc cttttcttca ggctgtttgc tttccagtcc atcgttcgct ctget 775
<210> 90 <211> 727 <212> ADN <213> Homo sapiens
<400> 90 gaatgctgtt acctgaaccc ettaettega aggatcataa gatteacagg ggtgtttgca 60 tttggacttt ttgctactga catttttgta aacgccggac aagtggtcac tgggcactta 120 acgccatact tcctgactgt gtgcaagcca aactacacca gtgcagactg ccaagcgcac 180 caccagttta taaacaatgg gaacatttgt actggggacc tggaagtgat agaaaaggct 240 cggagatcct ttccctccaa acacgctgct ctgagcattt actccgcctt atatgecaeg 300 atgtatatta caageacaat caagaegaag agcagtcgac tggccaagcc ggtgctgtgc 360 ctcggaactc tctgcacagc cttcctgaca ggcctcaacc gggtctctga gtatcggaac 420 cactgctcgg acgtgattgc tggtttcatc ctgggcactg cagtggccct gtttctggga 480
"-^*a atgtgtgtgg ttcataactt taaaggaacg caaggatetc cttccaaacc caagcctgag 540 gatccccgtg gagtacccct aatggctttc ccaaggatag aaagccctct ggaaacctta 600 agtgeacaga atcactctgc gtccatgacc gaagttacct gagaegactg atgtgtcaca 660 agctgttttt taaaatcatc ttccaattct atacttcaaa acacacagtt gctcaatgtc 720 aaactgt 727
<210> 91 <211> 478 <212> ADN <213> Homo sapiens
<400> 91 cagtttttat cacaggtgca agccgtcgca ttggcaaagc tattgcattg aaagcagcaa 60 aggatggage aaatattgtt attgctgcaa agaccgccca gccacatcca aaacttctag 120 geacaateta tactgctgct gaagaaattg aagcagttgg aggaaaggcc ttgccatgta 180 ttgttgatgt gagagatgaa cageagatca gtgctgcagt ggagaaagcc atcaagaaat 240 ttggaggaat tgatattctg gtaaataatg ccagtgccat tagtttgacc aatacattgg 300 acacacctac caagagattg gatctgatga tgaacgtgaa caccagaggc acctaccttg 360 catetaaage atgtattcct tatttgaaaa agagcaaagt tgetcatate etcaatatca 420 gtccaccact gaacctaaat ccagtttggt tcaaacagca ctgtgcttat accattgc 478
<210> 92 <211> 679
<212> ADN <213> Homo sapiens
<400> 92 gccaggaaac agcaaatcca atagatccga ctttatcagg ctgggctctc gcttcagatt 60 cagtgggcgg acagaatatc aagctacaca tggctccagg ttacgaagaa ccagcacctt 120 tgagaggaag cctagtaaac gttatccatc ccggagacat tcaacgttca aagcaagcaa 180 cccagtgata gcagcccagc tctgctctaa aacaaatcca gaagtccata attaccagcc 240 tcaatatcat cctaatatcc atcccagcca gccccggtgg catcctcact ctccaaatgt 300 caggccatcc tttcaggatg acaggtcgca ttggaaagca tcggccagtg gagatgacag 360 ccattttgat tatgtccacg accagaacca gaagaactta ggagggatgc aaagtatgat 420 gtatcgagat aaactcatga ctgcactttg agagactgaa gcatctctct tccattcacc 480 ttcatagttt cattgcattc catgaaaagt gtcttggcct cagatggatg gatgtgtttg 540 gacgagtgtc tttaaggagt agtcctgaaa ggtgtttttg gtgtccatgt aaatatttga 600 agataaaacc actatagett gtcataattt actgttgact geattetcat taaaatgaag 660 gtaaaggctc aggaatcat - 679
<210> 93 <211> 691 <212> ADN <213> Homo sapiens
<400> 93 ctgaggatga ttatggtgat gacccttcga ccaactcgtt tgagaaagag aagcaggact 60
A^Jtoí » atgtctattg cctggagtca tccctgcaga cctacaaccc agactacgtc ctgatggtag 120 aagacgatgc tgtaccagaa gagcagatct tcccagtctt ggagcacctt ctgcgggctc 180 gcttctctga gccacatctc agagatgccc tttatctcaa gctgtatcac cccgagaggc 240 tccagcacta catcaatcca gagcccatgc ggatcctgga atgggttggt gtaggcatgt 300 tgctggggcc cttactaacc tggatataca tgaggtttgc cagccgccca gggtttagct 360 ggcctgtaat gctcttcttc tccctgtata gcatgggtct ggtggagctg gtgggtcggc 420 actatttcct ggaactgcgg cggctgagtc cttccctgta cagtgtggtt cctgcctctc 480 agtgttgcac cccagccatg ctcttcccgg cacctgcggc ccgccggacc ctcacctacc 540 tgtcccaagt gtactgccac aagggctttg gcaaggacat ggcactgtac tcgctgttga 600 gggecaaggg agagagggee tatgtagtgg agccgaacct cgtgaaacac atcgggctct 660 tctccagtct ccggtacaac tttcatccca g 691
<210> 94 <211> 451 <212> ADN <213> Homo sapiens
<400> 94 caactttctc cattcccagc tgggccccat tectggattt aagatggtgg ctatccctga 60 ggagtcacca taaggagaaa actcaggaat tctgagtctt ccctgctaca ggaccagttc 120 tgtgcaatga acttgagact cctgatgtac actgtgatat tgaccgaagg ctacatacag 180 atctgtgaat cttggctggg acttcctctg agtgatgcct gagggtcagc tcctctagac 240 attgactgca agagaatetc tgcaacctcc tatataaaag catttctgtt aatteattea 300 gaatccattc tttacaatat gcagtgagat gggcttaagt ttgggctaga gtttgacttt 360
atgaaggagg tcattgaaaa agagaacagt gacgtaggca aatgtttcaa gcactttaga 420 aacagtactt ttcctataat tagttgatat a 451
5 <210> 95 <211> 662 <212> ADN <213> Homo sapiens
10 <400> 95 ggacctttgc tgctgttgga cactccgtca ccttttggaa cacaagtata tcaagatagt 60 ggctactgat gttcaagtgg gattgaagtg tgataaatgg atatattttg ttgtttgctg 120 gggtgttcat ggagatgtta agagattgag gccctgggct gagggtatat aatgtatgtc 180 aggtaaagtt tgaagactgc caaggagcag attttctccc tggaaatgtg aaaactgaac 240
15 etataactet gataaggact tgagatgtgt agaaaegttg ggttatggaa gactagtttc 300 ttccataacc ctgaattgga gacettaatg ctaagtgtag attattgagg tttgttagtg 360 aggaaaagaa taagagttca gaagcctttg ttatcagata gcgaaatcag ggcctagtga 420 ggagcacagg tegactacat aatggagtcc attggcgaac cctattgcaa tttggtccaa 480 etatatette tggtgaagga aattaatgat gtaagaaaat gcaagaggct caacttctct 540
20 tccaaaaatc ttctggcttc tgaactette ctctgcctct ctttaaataa ataacacaga 600 atttcaagtg gtaggagact tattaageca gtcaccaagc ttggtctgtc agcctgtctt 660 ct 662
25 <210> 96
^jíiUMtttt^M^á^^^^^ <211> 766 <212> ADN <213> Homo sapiens
5 <400> 96 ctatcctttc agcccaccaa cttagcggca gcactaggga ttcattataa ggtaaatctg 60 gtttacataa agacctgaag gaggcctgta tttgaagctc acacttggta ttggtatctc 120 tcatttttac tgagccagtg tggaatacca ctgtatgtac tcatataagc ccttgacttt 180 tactgetcat caggattgga atattactct agcagtcttc acacataggc aagttacagt 240
10 ccttttaaaa agnatetcat ttccctataa tggaacctaa tagecaaett ttteatagaa 300 attgctagaa gagtttgatc aactataaat gataaagtgt ttataagcat agtcagtgtg 360 acacagaaac caatettaaa attgaattta atgttttatc atatcagatt aaatattttc 420 ccatgtctt atttttactg caacaagtta gaaagtggga acactttgat taatgtctta 480 aaatttgtgg gccctcattt ggataaaggc ageaatecta aggacttttt ttttttttaa 540
15 cataatctga gaatttctct gtagagcaga gactttcaaa ccttttggct gtaacccaca 600 gtaaaaaacg catttatatc aaacettaga atatgtttaa tgaacaatac ttaccattct 660 gatgcttttt attgtttcag tttttaaaat atgccagttg caacccacta aattgatatc 720 taccaatggg ttgcaaccct tagcttgaaa aaaacaccct cacaga 766
20 <210> 97 <211> 584 <212> ADN <213> Homo sapiens 25
<400> 97 agttgatcga ttcatgtcgt attgatagaa tcttgaccag aagaaatttt gctcttttta 60 tatagtttca agaaatgtgt ttttaaattt ttattaatgc acttgaacaa ctttgcagga 120 ataaagcaac cccctaacca caaaatatcc ctctaaetta gttccctagc tttctcaatg 180 aatacacaca tatttttaca tagctatgat cgttgtgtac attctccttt gttttacttc 240 tcggcctaac acttgtctcc tcttgtcaac acagattcta ctctcaccaa tttaaatgtc 300 tttatatcca tgtaacatgg gtaacctcac ttcaccccat tattagatat ttgagttata 360 tctaattttt cactcttata aatagtgctg ctatgaatgt ctgtaaaaaa aaaaaaactg 420 ctccttcttt tggattattc ccttaggaat atctccaaag agggattaca aggtcaaaga 480 geatgaagta ttttatagct cttgttttat attgccagat tgetttetag aaagatecaa 540 tctttgggtt ggaaggacct taaaggtcat ctagtttagc etec 584
<210> 98 211> 1251 <213> Homo sapiens
<400> 98 gtgtgtagca gcgtgtccaa ggcaagaact gaaaactctg agtgatgttc agaagtttgc 60 agagataaat ggttcagccc tatgtagcta cancctaaag ccttctgaat acactacatc 120 tccaaaatct tctgttctct gccccaaact accagttcca gcgagtgcac etattecatt 180 cttccatcgc tgtgctcctg tgaacatttc ctgctatgcc aagtttgcag aggccctgat 240 cacctttgtc agtgacaata gtgtcttaca caggctgatt agtggagtaa tgaccagcaa 300 agaaattata ttgggacttt gcttgttatc actagtteta tccatgattt tgatggtgat 360 aatcaggtat atatcaagag taettgtgtg gatcttaacg attctggtca tactcggttc 420 acttggaggc acaggtgtac tatggtggct gtatgcaaag caaagaaggt ctcccaaaga 480 aactgttact cctgagcagc ttcagatagc tgaagacaat cttcgggccc tcctcattta 540 tgccatttca gctacagtgt tcacagtgat cttattcctg ataatgttgg ttatgcgcaa 600 acgtgttgct cttaccatcg ccttgttcca cgtagctggc aaggtcttca ttcacttgcc 660 actgctagtc ttccaaccct tctggacttt ctttgctctt gtettgtttt gggtgtactg 720 gatcatgaca cttctttttc ttggcactac cggcagtcct gttcagaatg agcaaggctt 780 tgtggagttc aaaatttctg ggcctctgca gtacatgtgg tggtaccatg tggtgggcct 840 gatttggatc agtgaattta ttctagcatg teageagatg acagtggcag gagctgtggt 900 aacatactat tttactaggg ataaaaggaa tttgccattt acaectattt tggcatcagt 960 aaatcgcctt attcgttacc acctaggtac ggtggcaaaa ggatctttca ttatcacatt 1020 agtcaaaatt ccgcgaatga tccttatgta tatteacagt cagctcaaag gaaaggaaaa 1080 tgcttgtgca cgatgtgtgc tgaaatcttg catttgttgc ctttggtgtc ttgaaaagtg 1140 ectaaattat ttaaatcaga atgeatacae agccacagct atcaacagea ccaacttctg 1200 cacctcagca aaggatgcct ttgtcattct ggtggagaat gctttgcgag t 1251
<210> 99 <211> 710 <212> ADN <213> Homo sapiens
<400> 99 tttgatcctc cagtgtgact gttgtttttg tttgggggtg ggttggggtt ttttgctttt 60 tattcctgaa gettaccaga tatgaatggc taatacteca ttgttetgct tgttgtaatg 120 gtgaatgctt taagaaaaaa aagtgtaatt tgctaagaat aattcatgat ctgtttatgc 180
¡la-». H^A. á-t^ii^ gataactcct ttttgttaca atttttttaa aaaaagctat ttttgttaat gtaaagtaaa 240 tatttcagag caaatttttt aaacttattg cactaaatac aggctctgta caaaaaaaaa 300 aaaaaaaaaa aaaagcctca gcattttatc attccatgga aggagaatct tttgaaagaa 360 agcattgcct cctaccagaa ctagacagtg aattagatcg gtattatgga aatgeataca 420 agtaatgtca ctagggctta ataageagee gtttgctaat gtgcttcctt tcaaagggtt 480 ggacctttaa attgctgcaa aaggtaaatt gtattttttt ttaagtattg gtgttcttta 540 etetagetag gctaaaattt gctaaatgcc ttggtttctt ttaaaagttc atgtaatatt 600 tctgattttt cagaatattt gcaataagag tctggatttt aaaaaacaca tgeatacaca 660 caattaagag ctcatgtctt agcaagatct gggaaaccaa cattgcgaga 710
<210> 100 <211> 580 <212> ADN <213> Homo sapiens
<400> 100 aggttcctgt agtctgtgct cagaacttgg tttttggccc ctattgtttt tgcctatttt 60 gattttcaga gatgatcaca tggggacagt taacttttct tctgctgtgt tgccttaatg 120 ctactagatt gtgttgtgtt gttggagttt tctgacttct tecetataaa aagatactga 180 gagetecata atgaaagaag ttgttatact ttctcagaat attctggacc actgaatgca 240 cttctaatag agetttaate taaagaagtt agttcagtgg ttattaactg attttattac 300 aggagaaaaa aactttaaca aaaaggcagg gagaaaagtg tgaagggcat caagcaaaat 360 gacaggggct tcaaaaaaca accaaagaca aaaccctatc ttctgaagac caaaggtcca 420 actttactta ctggctggca cagcctttct gaaetcettg agtttagaat agagetecta 480
* i A ^i* a- i 4.
gaataataag gcggccaaat tttaaagatc agtcaataca gtagggacct gctattgatc 540 tctcaggcac tgagttcttc acatccagtg tcaagcccag 580
<210> 101 5 <211> 223 <212> ADN <213> Homo sapiens
<400> 101 10 atgacagaga tttgccttcc agggggtcta atttgaagag gaaagtaatt taaatgtata 60 ggtttatata atagcattgt atttttctct attttattca ttctttcatt ctcttcgatg 120 actcccagca cctgcgcgtc catcttcatt cttagccaat gacctttcct tttaettaac 180 agagaaaata acaatcagaa gagtcttcat aagttcccac ecc 223
15 <210> 102 <211> 19 <212> ADN <213> Homo sapiens 20 <400> 102 ctcctttccc accagacac 19
25 <210> 103
,* tí¡* *&~*i ^ ,l t^ .. U faA. *L * ... .. ^L. A^^j¡*¡?^& &¡J^Í¡¡&A2£^m? <211> 20 <212> ADN <213> Homo sapiens
<400> 103 cattecaagg ttcccttttt 20
<210> 104 <211> 22 <212> ADN <213> Homo sapiens
<400> 104 agctcctctt gcctaagtgg te 22
<210> 105 <211> 22 <212> ADN <213> Homo sapiens
<400> 105 gtttgtgtgg ttctgttttc ca 22 <210> 106 <211> 19 <212> ADN <213> Homo sapiens
<400> 106 aaccctgtgc tgatctccc 19
<210> 107 <211> 18 <212> ADN <213> Homo sapiens
<400> 107 gtgcttcaaa ggcttcaa 18
<210> 108 <211> 17 <212> ADN <213> Homo sapiens
<400> 108 tcagtggaaa gaaatgt 17
i-, i -* í . ria fmihiti <210> 109 <211> 18 <212> ADN <213> Homo sapiens
<400> 109 atggggaega tttcagtg 18
<210> 110 <211> 21 <.212> ADN <213> Homo sapiens
<400> 110 ctgctgtcta ttgggaaagt t 21
<210> 111 <211> 20 <212> ADN <213> Homo sapiens
<400> 111 agaagcagtg gacaggggag 20
---_-*-_í_* M <210> 112 <211> 22 <212> ADN <213> Homo sapiens
<400> 112 ctggttgaac ctgtggattg tg 22
<210> 113 <211> 22 <212> ADN <213> Homo sapiens
<400> 113 tggagageag cttccaaaaa te 22
<210> 114 <211> 18 <212> ADN <213> Homo sapiens
<400> 114 caatgcacct gtcagggg 18
. -t **La.*?*?a* <210> 115 <211> 22 <212> ADN <213> Homo sapiens
<400> 115 tgttggaect ggtactctcc ac 22
<210> 116 <211> 18 <212> ADN <213> Homo sapiens
<400> 116 gggcaaatgg ggaaacat 18
<210> 117 <211> 19 <212> ADN <213> Homo sapiens
<400> 117 gggaagacag gggaaagag 19
J^k?^AJ^J <210> 118 <211> 22 <212> ADN <213> Homo sapiens
<400> 118 ccattgactc ctccttcttt ct 22
<210> 119 <211> 19 <212> ADN <213> Homo sapiens
<400> 119 agtaacaaca taccctgcc _ 19
<210> 120 <211> 21 <212> ADN <213> Homo sapiens
<400> 120 cagacatgac tgaattggtg g 21
LL <210> 121 <211> 20 <212> ADN <213> Homo sapiens
<400> 121 aaacaccccc atcccctcac 20
<210> 122 <211> 19 <212> ADN <213> Homo sapiens
<400> 122 ggggctgaca gcagggttt 19
<210> 123 <211> 20 <212> ADN <213> Homo sapiens
<400> 123 aaaccccacc ccagttcctt 20
,-M*,.*!., <210> 124 <211> 21 <212> ADN <213> Homo sapiens
<400> 124 gaagtgaacg ggetgttttg c 21
<210> 125 <211> 19 <212> ADN <213> Homo sapiens
<400> 125 ggagctgaaa ggtggaatg . 19
<210> 126 <211> 22 <212> ADN <213> Homo sapiens
<400> 126 agtgaacaag gaagttaagg gc 22
jyy^^^^j?A^^^^* l--<210> 127 <211> 21 <212> ADN <213> Homo sapiens
<400> 127 cccggattca tttaagggta g 21
<210> 128 <211> 18 <212> ADN <213> Homo sapiens
<400> 128 cacaaaggac cgtccaag - 18
<210> 129 <222> 461 <222> PRT <223> Homo sapiens <400> 129 Met Asp Ser Gln Lys Tyr Cys Phe Lys Glu Asn Glu Asn Val Thr Val 1 5 10 15
Asp Lys Ala Cys Phe Leu He Ser Asn He Thr He Gly Pro Glu Ser 20 25 30
He Asn Leu Gln Gln Glu Ala Leu Gln Arg He He Ser Thr Leu Ala 35 40 45
Asn Lys Asn Asp Glu He Gln Asn Phe He Asp Thr Leu His His Thr 50 55 60
Leu Lys Gly Val Gln Glu Asn Ser Ser Asn He Leu Ser Glu Leu Asp 65 70 75 80
Glu Glu Phe Asp Ser Leu Tyr Ser He Leu Asp Glu Val Lys Glu Ser 85 90 95
Met He Asn Cys He Lys Gln Glu Gln Ala Arg Lys Ser Gln Glu Leu 100 105 110
Gln Ser Gln He Ser Gln Cys Asn Asn Ala Leu Glu Asn Ser Glu Glu 115 120 125
... .-.-.,. . . - . a^a¿Bag Leu Leu Glu Phe Ala Thr Arg Ser Leu Asp He Lys Glu Pro Glu Glu 130 135 140
Phe Ser Lys Ala Ala Arg Gln He Lys Asp Arg Val Thr Met Ala Ser 145 150 155 160
Ala Phe ArgLeu Ser Leu Lys Pro Lys Val Ser Asp Asn Met Thr His 165 170 175
Leu Met Val Asp Phe Ser Gln Glu Arg Gln Met Leu Gln Thr Leu Lys 180 185 190
Phe Leu Pro Val Pro Lys Ala Pro Glu He Asp Pro Val Glu Cys Leu 195 200 205
Val Ala Asp Asn Ser Val Thr Val Ala Trp Arg Met Pro Glu Glu Asp 210 215 220
Asn Lys He Asp His Phe He Leu Glu His Arg Lys Thr Asn Phe Asp 225 230 235 240
Gly Leu Pro Arg Val Lys Asp Glu Arg Cys Trp Glu He He Asp Asn 245 250 255
He Lys Gly Thr Glu Tyi Thr Leu Ser Gly Leu Lys Phe Asp Ser Lys 260 265 270
Tyr Met Asn Phe Arg Val Arg Ala Cys Asn Lys Ala Val Ala Gly Glu 5 275 280 285
Tyr Ser Asp Pro Val Thr Leu Glu Thr Lys Ala Leu Asn Phe Asn Leu 290 295 300
10 Asp Asn Ser Ser Ser His Leu Asn Leu Lys Val Glu Asp Thr Cys Val 305 310 315 320
Glu Trp Asp Pro Thr Gly Gly Lys Gly Gln Glu Ser Lys He Lys Gly 325 330 335 15 Lys Glu Asn Lys Gly Ser Val His Val Thr Ser Leu Lys Lys His Thr 340 345 350
Arg Ser Gly Thr Pro Ser Pro Lys Arg Thr Ser Val Gly Ser Arg Pro 20 355 360 365
Pro Ala Val Arg Gly Ser Arg Asp Arg Phe Thr Gly Glu Ser Tyr Thr 370 375 380
Val Leu Gly Asp Thr Ala He Glu Ser Gly Gln His Tyr Trp Glu Val
385 390 395 400
Lys Ala Gln Lys Asp Cys Lys Ser Tyr Ser Val Gly Val Ala Tyr Lys 405 410 415
Thr Leu Gly Lys Phe Asp Gln Leu Gly Lys Thr Asn Thr Ser Trp Cys 420 425 430
He His Val Asn Asn Trp Leu Gln Asn Thr Phe Ala Ala Lys His Asn 435 440 445
Asn Lys Val Lys Ala Leu Asp Val Thr Val Leu Lys Lys 450 455 460
<210> 130 <211> 32 <212> PRT <.213> Homo sapiens
<400> 130 He Lys Asn He He Leu Ser Val Ser Leu Trp Ser Lys Met Phe Met 1 5 10 15
Val Glu Thr Gly Asp Leu Ala Ala Ser Leu Thr Thr Phe Ser Lys Cys 20 25 30
<210> 131 <211> 183 <212> PRT <213> Homo sapiens
<400> 131 Asn He He Gly Gln Ser Val Glu Glu Ala He Arg Gly Val Phe Asp 1 5 10 15
Ala Ser Leu Lys Met Ala Gly Phe Tyr Gly Leu Tyr Thr Trp Leu Thr 20 25 30
His Thr Met Phe Gly He Asn He Val Phe He Pro Ser Ala Leu Ala 35 40 45
Ala He Leu Gly Ala Val Pro Phe Leu Gly Thr Tyr Trp Ala Ala Val 50 55 60
Pro Ala Val Leu Asp Leu Trp Leu Thr Gln Gly Leu Gly Cys Lys Ala 65 70 75 80
j^ jg¡ He Leu Leu Leu He Phe His Leu Leu Pro Thr Tyr Phe Val Asp Thr 85 90 95
Ala He Tyr Ser Asp He Ser Gly Gly Gly His Pro Tyr Leu Thr Gly 5 100 105 110
Leu Ala Val Ala Gly Gly Ala Tyr Tyr Leu Gly Leu Glu Gly Ala He 115 120 125
10 He Gly Pro He Leu Leu Cys He Leu Val Val Ala Ser Asn He Tyr 130 135 140
Ser Ala Met Leu Val Ser Pro Thr Asn Ser Val Pro Thr Pro Asn Gln 145 150 155 160
15 Thr Pro Trp Pro Ala Gln Pro- Gln Arg Thr Phe Arg Asp He Ser Glu 165 170 175
Asp Leu Lys Ser Ser Val Gly 2C 180
<210> 132 <211> 291 25 <212> PRT
--«^'- ^a i i i 4 *»• -<213> Homo sapiens
<400> 132 Met Asp Ser Pro Trp Asp Glu Leu Ala Leu Ala Phe Ser Arg Thr Ser 1 5 10 15
Met Phe Pro Phe Phe Asp He Ala His Tyr Leu Val Ser Val Met Ala 20 25 30
Val Lys Arg Gln Pro Gly Ala Ala Ala Leu Ala Trp Lys Asn Pro He 35 40 45
Ser Ser Trp Phe Thr Ala Met Leu His Cys Phe Gly Gly Gly He Leu 50 55 60
Ser Cys Leu Leu Leu Ala Glu Pro Pro Leu Lys Phe Leu Ala Asn His 65 70 75 80
Thr Asn He Leu Leu Ala Ser Ser He Trp Tyr He Thr Phe Phe Cys 85 90 95
Pro His Asp Leu Val Ser Gln Gly Tyr Ser Tyr Leu Pro Val Gln Leu 100 105 110
Leu Ala Ser Gly Met Lys Glu Val Thr Arg Thr Trp Lys He Val Gly 115 120 125
^^^^£^^^^^^^^^ ^^^^^^^^^^3& ?* a s^^j k¡&rft^^& .A 8 11 ¡ Gly Val Thr His Ala Asn Ser Tyr Tyr Lys Asn Gly Trp He Val Met 130 135 140
He Ala He Gly Trp Ala Arg Gly Ala Gly Gly Thr He He Thr Asn 145 150 155 160
Phe Glu Arg Leu Val Lys Gly Asp Trp Lys Pro Glu Gly Asp Glu Trp 165 170 175
Leu Lys Met Ser Tyr Pro Ala Lys Val Thr Leu Leu Gly Ser Val He 180 185 190
Phe Thr Phe Gln His Thr Gln His Leu Ala He Ser Lys His Asn Leu 195 200 205
Met Phe Leu Tyr Thr He Phe He Val Ala Thr Lys He Thr Met Met 210 215 220
Thr Thr Gln Thr Ser Thr Met Thr Phe Ala Pro Phe Glu Asp Thr Leu 225 230 235 240
Ser Trp Met Leu Phe Gly Trp Gln Gln Pro Phe Ser Ser Cys Glu Lys 245 250 255 Lys Ser Glu Ala Lys Ser Pro Ser Asn Gly Val Gly Ser Leu Ala Ser 260 265 270
Lys Pro Val Asp' Val Ala Ser Asp Asn Val Lys Lys Lys His Thr Lys 275 280 235
Lys Asn Glu 290
<210> 133 <211> 48 <212> PRT <213> Homo sapiens
<400> 133 Ser He Arg Pro Arg Gln Arg Leu Ala Thr Leu í le S --;r Asn Met Pro 1 5 10 15
Gly Pro Thr Pro Ser Gly Th r Asn Va l Gly Ser 3er Gly Arg Ser Pro 20 25 30
Ser Lys Ala Val Ala Ala Arg Ala Ala Gly Ser Thr Val Arg Gln Arg 35 40 45
<210> 134 <211> 22 <212> PRT <213> Homo sapiens
<400> 134 Asn Lys Thr Gln Arg Pro Cys Ala Gln Gln His Ser Arg Met Pro Pro 1 5 10 15
He Pro Arg Phe Pro Phe 20
<210> 135 <211> 95 <212> PRT <213> Homo sapiens
<400> 135 Met Trp Asp Phe Arg Ala Arg He Phe Asn Ser Gln Gln Tyr Trp Lys 1 5 10 15
Leu Arg Leu Gln Asn Pro Glv Met Glu Gly Arg Glu Phe Glu Leu Cys 20 25 30
i i - ekl i t i « * Ser Leu His Arg Met Gly Ser Gln Glu Asn Ala Asn Val Lys Leu Ser
35 40 45
Tyr Arg Glu Val Ser He Asn Leu His Arg Thr Pro Thr Lys Asp Thr 50 55 60
Leu Arg Glu Lys Val Cys Ser Pro Lys Tyr Thr Ser Leu Phe Asn Leu 65 70 75 80
Leu Pro Lys He Arg Glu Asn Ala Asp Thr Ala Gly Lys Arg Ser 85 90 95
<210> 136 <211> 108 <212> PRT <213> Homo sapiens
<400> 136 Leu Lys Thr His Phe Pro Pro Cys Pro Arg His Lys Phe He Leu Met 1 5 10 15
Leu He Leu Gln Ser Leu Arg Tyr His Ala Ser Tyr Arg Asp He Leu 20 25 30 Asp Asp Leu Leu His Gln Asp Arg He Gly Gln His Met Ser Pro Glu 35 40 45
Gly Cys Met Leu Lys Gln Gin Ser Lys Gln Leu Ala His Asn Arg Gln 50 55 60
Leu Leu Arg Pro Asn Ser Val His Pro Gln Ala Leu Gln His Gln Pro 65 70 75 80
Glu Asp Ser Arg Gln Glu Ser Gln Asp Gly Asp Thr Asp Pro Pro Gln 85 90 95
Leu Val Pro Thr He Thr Glu Thr Glu Met Ser Gln 100 105
<210> 137 <211> 213 <212> PRT <213> Homo sapiens
<400> 137 Glu Cys Cys Tyr Leu Asn Pro Leu Leu Arg Arg He He Arg Phe Thr 1 5 10 15
Í¿É A A*Jk?t+*L£& &. I » «ttlfc Gly Val Phe Ala Phe Gly Leu Phe Ala Thr Asp He Phe Val Asn Ala 20 25 30
Gly Gln Val Val Thr Gly His Leu Thr Pro Tyr Phe Leu Thr Val Cys 35 40 45
Lys Pro Asn Tyr Thr Ser Ala Asp Cys Gln Ala His His Gln Phe He 50 55 60
Asn Asn Gly Asn He Cys Thr Gly Asp Leu Glu Val He Glu Lys Ala 65 70 75 80
Arg Arg Ser Phe Pro Ser Lys His Ala Ala Leu Ser He Tyr Ser Ala 85 90 95
Leu Tyr Ala Thr Met Tyr He Thr Ser Thr He Lys Thr Lys Ser Ser 100 105 110
Arg Leu Ala Lys Pro Val Leu Cys Leu Gly Thr Leu Cys Thr Ala Phe 115 120 125
Leu Thr Gly Leu Asn Arg Val Ser Glu Tyr Arg Asn His Cys Ser Asp 130 135 140
^^¿fc tffctó?*^ Val He Ala Gly Phe He Leu Gly Thr Ala Val Ala Leu Phe Leu Gly 145 150 155 160
Met Cys Val Val His Asn Phe Lys Gly Thr Gln Gly Ser Pro Ser Lys 165 170 175
Pro Lys Pro Glu Asp Pro Arg Gly Val Pro Leu Met Ala Phe Pro Arg 180 185 190
He Glu Ser Pro Leu Glu Thr Leu Ser Ala Gln Asn His Ser Ala Ser 195 200 205
Met Thr Glu Val Thr 210
<210> 138 <211> 325 <212> PRT <213> Homo sapiens
<400> 138 Met Ala Val Gly Asn Asn Thr Gln Arg Ser Tyr Ser He He Pro Cys 1 5 10 15
Phe He Phe Val Glu Leu Val He Met Ala Gly Thr Val Leu Leu Ala 20 25 30
Tyr Tyr Phe Glu Cys Thr Asp Thr Phe Gln Val His He Gln Gly Phe 35 40 45
Phe Cys Gln Asp Gly Asp Leu Met Lys Pro Tyr Pro Gly Thr Glu Glu 50 55 60
Glu Ser Phe He Thr Pro Leu Val Leu Tyr Cys Val Leu Ala Ala Thr 65 70 75 80
Pro Thr Ala He He Phe He Gly Glu He Ser Met Tyr Phe He Lys 85 90 95
Ser Thr Arg Glu Ser Leu He Ala Gln Glu Lys Thr He Leu Thr Gly 100 105 110
Glu Cys Cys Tyr Leu Asn Pro Leu Leu Arg Arg He He Arg Phe Thr 115 120 125
Gly Val Phe Ala Phe Gly Leu Phe Ala Thr Asp He Phe Val Asn Ala 130 135 140 Gly Gln Val Val Thr Gly Hi s Leu Thr Pro Tyr Phe Leu Thr Val Cys 145 150 155 160
Lys Pro Asn Tyr Thr Ser Ala Asp Cys Gln Ala His His Gln Phe He 165 170 175
Asn Asn Gly Asn He Cys Thr Gly Asp Leu Glu Val He Glu Lys Ala 180 185 190
Arg Arg Ser Phe Pro Ser Lys His Ala Ala Leu Ser He Tyr Ser Ala 195 200 205
Leu Tyr Ala Thr Met Tyr He Thr Ser Thr He Lys Thr Lys Ser Ser 210 215 220
Arg Leu Ala Lys Pro Val Leu. Cys Leu Gly Thr Leu Cys Thr Ala Phe 225 230 235 240
Leu Thr Gly Leu Asn Arg Val Ser Glu Tyr Arg Asn H s Cys Ser Asp 245 250 255
Val He Ala Gly "Phe He Leu Gly Thr Ala Val Ala Leu Phe Leu Gly 260 265 270
Met Cys Val Val His Asn Phe Lys Gly Thr Gln Gly Ser Pro Ser Lys 275 280 2 -A
Pro Lys Pro Glu Asp Pro Arg Gly Val Pro Leu Met Ala Phe Pro Arg 5 290 295 300
He Glu Ser Pro Leu Glu Thr Leu Ser Ala Gln Asn His Ser Ala Ser 305 310 315 320
10 Met Thr Glu Val Thr 325
<210> 139 15 <211> 406 <212> PRT <213> Homo sapiens
<400> 139 20 Val Phe He Thr' Gly Ala Ser Arg Gly He Gly Lys Ala He Ala Leu 1 5 10 15
Lys Ala Ala Lys Asp Gly Ala Asn He val He Ala A l a Lys Thr Ala 20- 25 30
Gln Pro His Pro Lys Leu Leu Gly Thr He Tyr Thr Ala Ala Glu Glu 35 40 45
He Glu Ala Val Gly Gly Lys Ala Leu Pro Cys He Val Asp Val Arg 50 55 60
Asp Glu Gln Gln He Ser Ala Ala Val Glu Lys Ala He Lys Lys Phe 65 70 75 80
Gly Gly He Asp He Leu Val Asn Asn Ala Ser Ala He Ser Leu Thr 85 90 95
Asn Thr Leu Asp Thr Pro Thr Lys Arg Leu Asp Leu Met Met Asn Val 100 105 110
Asn Thr Arg Gly Thr Tyr Leu Ala Ser Lys Ala Cys He Pro Tyr Leu 115 120 125
Lys Lys Ser Lys Val Ala His He Leu Asn He Ser Pro Pro Leu Asn 130 135 140
Leu Asn Pro Val Trp Phe Lys Gln His Cys Ala Tyr Tnr He Ala Lys 145 150 155 160
jjt l **Á-FA** * ». Ji i*.- Tyr Gly Met Ser Met Tyr Val Leu Gly Met Ala Glu Glu Phe Lys Gly 165 170 175
Glu He Ala Val Asn Ala Leu Trp Pro Lys Thr Ala He His Thr Ala 5 180 185 190
Ala Met Asp Met Leu Gly Gly Pro Gly He Glu Ser Gln Cys Arg Lys 195 ' 200 205
10 Val Asp He He Ala Asp Ala Ala Tyr Ser He Phe Gln Lys Pro Lys 210 215 220
Ser Phe Thr Gly Asn Phe Val He Asp Glu Asn He Leu Lys Glu Glu 225 230 235 240
15 Gly He Glu Asn Phe Asp Val Tyr Ala He LYs Pro Gly His Pro Leu 245 250 255
Gln Pro Asp Phe Phe Leu Asp Glu Tyr Pro Glu Ala Val Ser Lys Lys 20 260 265 270
Val Glu Ser Thr Gly Ala Val Pro Glu Phe Lys Glu Glu Lys Leu Gln 275 280 2 5
** i * ?.¿&±*é. fe* &=- &¿ , i- A- ^ , Leu Gln Pro Lys Pro Arg Ser Gly Ala Val Glu Glu Thr Phe Arg He 290 295 300
Val Lys Asp Ser Leu Ser Asp Asp Val Val Lys Ala Thr Gln Ala He 305 310 315 320
Tyr Leu Phe Glu Leu Ser Gly Glu Asp Gly Gly Thr Trp Phe Leu Asp 325 330 335
Leu Lys Ser Lys Gly Gly Asn Val Gly Tyr Gly Glu Pro Ser Asp Gln 340 345 350
Ala Asp Val Val Met Sei Met Thr Thr Asp Asp Phe Val Lys Met Phe 355 360 365
Ser Gly Lys Leu Lys Pro Thx Met Ala Phe Met Ser Giy Lys Leu Lys 370 375 330
He Lys Gly Asn Met Ala Leu Ala He Lys Leu Glu Lys Leu Met Asn 385 390 395 400
Gln Met Asn Ala Arg Leu 405
-Xyk.X i s <210> 140 <211> 422 <212> PRT <213> Homo sapiens
<400> 140 Ser Thr Lys Val Met Leu Pro Asn Thr Gly Arg Leu Ala Gly Cys Thr 1 5 10 15
Val Phe He Thr Gly Ala Ser Arg Gly He Gly Lys Ala He Ala Leu 20 25 30
Lys Ala Ala Lys Asp Gly Ala Asn He Val He Ala Ala Lys Thr A la 35 40 45
Gln Pro His Pro Lys Leu Leu. Gly Thi He Tyr Thr Ala Ala Glu Glu 50 55 60
He Glu Ala Val Gly Gly Lys Ala Leu Pro Cys He Val Asp Val Arg 65 70 75 80
sp Glu Gln Gln He Ser Ala Ala Val Glu Lys Ala Hs Lys Lys Phe 85 90 95
J Gly Gly He Asp He Leu Val Asn Asn A--a Ser Ala He Ser Leu Thr 100 105 110
Asn Thr Leu Asp Thr Pro Thr Lys Arg Leu Asp Leu Met Met Asn Val 5 115 120 125
Asn Thr Arg Gly Thr Tyr Leu Ala Ser Lys Ala Cys He Pro Tyr Leu 130 135 140
10 Lys Lys Ser Lys Val Ala His He Leu Asn He Ser Pro Pro Leu Asn 145 150 155 160
Leu Asn Pro Val Trp Phe Lys Gln His Cys Ala Tyr Thr He Ala Lys • 165 170 175 15 Tyr Gly Met Ser Met Tyr Val Leu Gly Met Ala Glu Glu Phe Lys Gly 180 185 190
Glu He Ala Val Asn Ala Leu Trp Pro Lys Thr Ala He His Thr Ala 20 195 200 205
Ala Met Asp Met Leu Gly Gly Pro Gly He Glu Ser Gln Cys Arg Lys 210 215 220
Val Asp He He Ala Asp Ala Ala Tyr Ser He Phe Gln Lys Pro Lys 225 230 235 240
Ser Phe Thr Gly Asn Phe Val He Asp Glu Asn He Leu Lys Glu Glu 245 250 255
Gly He Glu Asn Phe Asp Val Tyr Ala He Lys Pro Gly His Pro Leu 260_ 265 270
Gln Pro Asp Phe Phe Leu Asp Glu Tyr Pro Glu Ala Val Ser Lys Lys 275 280 285
Val Glu Ser Thr Gly Ala Val Pro Glu Phe Lys Glu Glu Lys Leu Gln 290 295 300
Leu Gln Pro Lys Pro Arg Ser. Gly Ala Val Glu Glu Thr Phe Arg He 305 310 315 320
Val Lys Asp Ser Leu Ser Asp Asp Val Val Lys Ala Thr Gln Ala He 325 330 335
Tyr Leu Phe Glu Leu Ser Gly Glu Asp Gly Gly Thr Trp Phe Leu Asp 340 345 350
.. ., s. fata^ Leu Lys Ser Lys Gly Gly Asn Val Gly Tyr Gly Glu Pro Ser Asp Gln 355 360 365
Ala Asp Val Val Met Ser Met Thr Thr Asp Asp Phe Val Lys Met Phe
370 375
Ser Gly Lys Leu Lys Pro Thr Met Ala Phe Met Ser Gly Lys Leu Lys 385 390 395 400
He Lys Gly Asn Met Ala Leu Ala He Lys Leu Glu Lys Leu Met Asn 405 410 415
Gln Met Asn Ala Arg Leu 420
<210> 141 <211> 424 <212> PRT <213> Homo sapiens
<400> 141 Thr Glu Val Ser Val Asp Leu Pro Lys His Ala L s Gly Gln Asp Leu 1 5 10 15 Phe Asp Gln He Val Tyr His Leu Asp leu Val Glu Thr Asp Tyr Phe 20 25 30
Gly Leu Gln Phe Leu Asp Ser Ala Gln Val Ala His Trp Leu Asp His 35 40 45
Ala Lys Pro He Lys Lys Gln Met Lys He Gly Pro Ala Tyr Ala Leu 50 55 60
His Phe Arg Val Lys Tyr Tyr Ser Ser Glu Pro Asn Asn Leu Arg Glu 65 70 75 80
Glu Phe Thr Arg Tyr Leu Phe Val Leu Gln Leu Arg His Asp He Leu 85 90 95
Ser Gly Lys Leu Lys Cys Pro. Tyr Glu Thr Ala Val Glu Leu Ala Ala 100 105 110
Leu Cys Leu Gln Ala Glu Leu Gly Glu Cys Glu Leu Pro Glu His Thr 115 120 125
Pro Glu Leu Val Ser Glu Phe Arg Phe He Pro Asn Gln Thr Glu Ala 130 135 140 Met Glu Phe Asp He Phe Gln Arg Trp Lys Glu Cys Arg Gly Lys Ser 145 150 155 160
Pro Ala Gln Ala Glu Leu Ser Tyr Leu Asn Lys Ala Lys Trp Leu Glu 165 170 175
Met Tyr Gly Val Asp Met His Val Val Arg Gly Arg Asp Gly Cys Glu 180 185 190
Tyr Ser Leu Gly Leu Thr Pro Thr Gly He Leu He Phe Glu Gly Ala 195 200 205
Asn Lys He Gly Leu Phe Phe Trp Pro Lys He Thr Lys Met Asp Phe 210 215 220
Lys Lys Ser Lys Leu Thr Leu.Val Val Val Glu Asp Asp Asp Gln Gly 225 230 235 240
Arg Glu Gln Glu His Thr Pha Val Phe Arg Leu Asp Ser Ala Arg Thr 245 250 255
Cys Lys His Leu Trp Lys Cys Ala Val Glu His His Ala Phe Phe Arg 260 265 270
jfrjflftriMy» fca -t, J. ?. to> »» -*»j-. X*A*. -- » J ~« *¡¡ -. ± . . --> » .. . - * », ». « « * _a¡¿=¿-aat?a Leu Arg Thr Pro Gly Asn Ser Lys Ser Asn Arg Ser Asp Phe He Arg 275 280 285
Leu Gly Ser Arg Phe Arg Phe Ser Gly Arg Thr Glu Tyr Gln Ala Thr 5 290 295 300
His Gly Ser Arg Leu Arg Arg Thr Ser Thr Phe Glu Arg Lys Pro Ser 305 310 315 320
10 Lys Arg Tyr Pro Ser Arg Arg His Ser Thr Phe Lys Ala Ser Asn Pro 325 330 335
Val He Ala Ala Gln Leu Cys Ser L s Thr Asn Pío Glu Val His Asn 340 345 350 15 Tyr Gln Pro Gln Tyr His Pro Asn He His Pro Ser Gln Pro Arg Trp 355 360 365
His Pro His Ser Pro Asn Val Arg Pro Ser Phe Gln Asp Asp Arg Ser 20 370 375 3^0
His Trp Lys Ala Ser Ala Ser Gly Asp Asp Ser His Phe Asp Tyr Val 385 390 395 400
His Asp Gln Asn Gln Lys Asn Leu Gly Gly Met Gln Ser Met Met Tyr 405 410 415
Arg Asp Lys Leu Met Thr Ala Leu 420
<210> 142 <211> 455 <212> PRT <213> Homo sapiens
<400> 142 Gly Pro Leu Leu Thr Gly Gly Ala Ala Val His He Ser Ala Ala Gly 1 5 10 15
Ala Ala Lys Ala Thr Leu Tyr Cys Arg Val Phe Leu Leu Asp Gly Thr 20 25 30
Glu Val Ser Val" Asp Leu Pro Lys His Ala Lys Gly Gln Asp Leu Phe 35 40 45
Asp Gln He Val Tyr His Leu Asp Leu Val Glu Thr Asp Tyr Phe Gly 50 - 55 60
JíX^ L...?~ ?- JLL?1??- ¿ , ^ í. ^^¿i^^^^^^^^^^^^^^^^^^^^^^j Leu Gln Phe Leu Asp Ser Ala Gln Val Aia His Trp Leu Asp His Ala 65 70 75 80
Lys Pro He Lys Lys Gln Met Lys He Gly Pro Ala Tyr Ala Leu His 85 90 95
Phe Arg Val Lys Tyr Tyr Ser Ser Glu Pro Asn Asn Leu Arg Glu Glu 100 105 110
Phe Thr Arg Tyr Leu Phe Val Leu Gln Leu Arg His Asp He Leu Ser 115 120 125
Gly Lys Leu Lys Cys Pro Tyr Glu Thr Ala Val Glu Leu Ala Ala Leu 130 . 135 140
Cys Leu Gln Ala Glu Leu Gly Glu Cys Glu Leu Pro Glu His Thr Pro 145 150 155 160
Glu Leu Val Ser Glu Phe Arg Phe He Pro Asn Gln Thr Glu Ala Met 165 170 175
Glu Phe Asp He Phe Gln Arg Trp Lys Glu Cys Arg Gly Lys Ser Pro 180 185 190
l * i»í » J^^U- Ala Gln Ala Glu Leu Ser Tyr Leu Asn Lys Ala Lys Trp Leu Glu Met 195 200 205
Tyr Gly Val Asp Met His Val Val Arg Gly Arg Asp Gly Cys Glu Tyr 5 210 215 220
Ser Leu Gly Leu Thr Pro Thr Gly He Leu He Phe Glu Gly Ala Asn 225 230 235 240
10 Lys He Gly Leu Phe Phe Trp Pro Lys He Thr Lys Met Asp Phe Lys 245 250 255
Lys Ser Lys Leu Thr Leu Val Val Val Glu Asp Asp Asp Gln Gly Arg 260 265 270 15 Glu Gln Glu His Thr Phe Val- Phe Arg Leu Asp Ser Ala Arg Thr Cys 275 280 285
Lys His Leu Trp Lys Cys Ala Val Glu His His Ala Phe Phe Arg Leu 20 290 295 300
Arg Thr Pro Gly Asn Ser Lys Ser Asn Arg Ser Asp Phe He Arg Leu 305 310 315 320
Gly Ser Arg Phe Arg Phe Ser Gly Arg Thr Glu Tyr Gln Ala Thr His 325 330 335
Gly Ser Arg Leu Arg Arg Thr Ser Thr Phe Glu Arg Lys Pro Ser Lys 340 345 350
Arg Tyr Pro Ser Arg Arg His Ser Thr Pne Lys A a Ser Asn Pro Val 355 360 365
He Ala Ala Gln Leu Cys Ser Lys Thr Asn Pro Glu Val His Asn Tyr 370 375 3r!0
Gln Pro Gln Tyr His Pro Asn He His Pro Ser Gln Pro Arg Trp His 385 390 395 400
Pro His Ser Pro Asn Val Arg. Pro Ser Phe Gln Asp Asp Arg Ser His 405 410 415
Trp Lys Ala Ser Ala Ser Gly Asp Asp Ser His Phe Asp Tyr Val His 420 425 430
Asp Gln Asn Gln Lys Asn Leu Gly Gly Met Gln Ser Met Met Tyr Arg 435 440 445 Asp Lys Leu Met Thr Ala Leu 450 455
<210> 143 <211> 232 <212> PRT <213> Homo sapiens
<400> 143 Glu Asp Asp Tyr Gly Asp Asp Pro Ser Thr Asn Ser Phe Glu Lys Glu 1 5 10 15
Lys Gln Asp Tyr Val Tyr Cys Leu Glu Ser Ser Leu Gln Thr Tyr Asn 20 25 30
Pro Asp Tyr Val Leu Met Val Glu Asp Asp Ala Val Pro Glu Glu Gln 35 40 45
He Phe Pro Val Leu Glu Has Leu L u Arg Ala Arg Phe Ser Glu Pro 50 55 60
is Leu Arg Asp Ala Leu Tyr Leu L s Leu Tyr hi-s Pro Glu Arg Leu 65 70 75 80
-^á****** Gln His Tyr He Asn Pro Glu Pro Met Arg He Leu Glu Trp Val Gly 85 90 95
Val Gly Met Leu Leu Gly Pro Leu Leu Thr Trp He Tyr Met Arg Phe 100 105 110
Ala Ser Arg Pro Gly Phe Ser Trp Pro Val Met Leu Phe Phe Ser Leu 115 120 125
Tyr Ser Met Gly Leu Val Glu Leu Val Gly Arg His Tyr Phe Leu Glu 130 135 140
Leu Arg Arg Leu Ser Pro Ser Leu Tyr Ser Val Val Pro Ala Ser Gln 145 150 155 160
Cys Cys Thr Pro Ala Met Leu Phe Pro Ala Pro Ala Ala Arg Arg Thr 165 170 175
Leu Thr Tyr Leu Ser Gln Val Tyr Cys His Lys Gly Phe Gly Lys Asp 180 1&5 190
Met Ala Leu Tyr Ser Leu Leu Arg Ala Lys Gly Glu Arg Ala Tyr Val 195 200 205
irt-?.A J Í iai-tJ:. . «J--L-.Í Val Glu Pro Asn Leu Val Lys His He Gly Leu Phe Ser Ser Leu Arg 210 215 220
Tyr Asn Phe His Pro Ser Leu Leu 225 230
<210> 144 <211> 263 <212> PRT <213> Homo sapiens
<400> 144 Leu Phe Leu Cys Asn Val Glu Arg Ser Val Ser His Phe Asp Ala Lys 1 . 5 10 15
Leu Leu Ser Lys Tyr Val Pro Val Ala Asn Arg Tyr Glu Gly Thr Glu 20 :s 30
Asp Asp Tyr Gly Asp Asp Pro Ser Thr Asn Ser Phe Glu Lys Glu Lys 35 40 45
Gln Asp Tyr Val Tyr Cys Leu Glu Ser Ser Leu Gln Thr Tyr Asn Pro 50 55 60
Asp Tyr Val Leu Met Val Glu Asp Asp Ala Val Pro Glu Glu Gln He 65 70 75 80
Phe Pro Val Leu Glu His Leu Leu Arg Ala Arg Phe Ser Glu Pro His 85 90 95
Leu Arg Asp Ala Leu Tyr Leu Lys Leu Tyr His Pro Glu Arg Leu Gln 100 105 110
His Tyr He Asn Pro Glu Pro Met Arg He Leu Glu Trp Val Gly Val 115 120 125
Gly Met Leu Leu Gly Pro Leu Leu Thr Tip He Tyr Met Arg Phe Ala 130 135 140
Ser Arg Pro Gly Phe Ser Trp. Pro Val Met Leu Phe Phe Ser Leu Tyr 145 150 155 160
Ser Met Gly Leu Val Glu Leu Val Gly Arg His Tyr Phe Leu Glu Leu 165 170 175
Arg Arg Leu Ser Pro Ser Leu Tyr Ser Val Val Pro Ala Ser Gln Cys 180 i 5 190
^^^^^^^^^^^I Cys Thr Pro Ala Met Leu Phe Pro Ala Pro Ala Ala Arg Arg Thr Leu 195 200 205
Thr Tyr Leu Ser Gln Val Tyr Cys His Lys Gly Phe Gly Lys Asp Met 210 215 220
Ala Leu Tyr Ser Leu Leu Arg Ala Lys Gly Glu Arg Ala Tyr Val Val 225 230 235 240
Glu Pro Asn Leu Val Lys His He Gly Leu Phe Ser Ser Leu Arg Tyr 245 250 255
Asn Phe His Pro Ser Leu Leu 260
<210> 145 <211> 68 <212> PRT <213> Homo sapiens
<400> 145 Leu Tyr Ser Lys Leu Ala Leu Gln GJ y Val Ser Ser Val Tyr Pro Ala 1 5 10 15
-?-^? ?. ?m jtím»? ^í^t < - Pro Val Cys Leu Ala Thr Pro Phe Leu Gly Arg Val Asp Leu Ala Val 20 25 30
His Val He Asp Gly His Ser Val Tyr Leu Asp Ser Phe Leu Phe Leu 35 40 45
Cys Gln Gln Val He Gly Met Phe Gly Phe Lys Asn Met Ser Val Leu 50 55 60
Cys Asn Phe Met 65
<210> 146 <211> 720 <212> PRT <213> Homo sapiens
<400> 146 Thr Cys His Glu His Ala Thr Cys Gln Gln Arg Glu Gly Lys Lys He 1 5 10 15
Cys He Cys Asn Tyr Gly Phe Val Gly Asn Gly Arg Thr Gln Cys Val 20 25 30
Asp Lys Asn Glu Cys Gln Phe Gly Ala Thr Leu Val Cys Gly Asn His 35 40 45
Thr Ser Cys His Asn Thr Pro Gly Gly Phe Tyr Cys He Cys Leu Glu 50 55 60
Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr Phe He Pro Asn Asp Gly 65 70 75 80
Thr Phe Cys Thr Asp He Asp Glu Cys Glu Val Ser Gly Leu Cys Arg 85 90 95
His Gly Gly Arg Cys Val Asn Thr His Gly Ser Phe Glu Cys Tyr Cys 100 105 110
Met Asp Gly Tyr Leu Pro Arg Asn Giy Pro Glu Pro Phe His Pro Thr 115 120 125
Thr Asp Ala Thr Ser Cys Thr Glu He Asp Cys Gly Thr Pro Pro Glu 130 " 135 140
Val Pro Asp Gly Tyr He He Gly Asn Tyr Thr Ser Ser Leu Gly Ser 145 150 155 160
Gln Val Arg Tyr Ala Cys Arg Glu Gly Phe Phe Ser Val Pro Glu Asp 165 170 175
Thr Val Ser Ser Cys Thr Gly Leu Gly Thr Trp Glu Ser Pro Lys Leu 180 185 190
His Cys Gln Glu He Asn Cys Gly Asn Pro Pro Glu Met Arg His Ala 195 200 205
He Leu Val Gly Asn His Ser Ser Arg Leu Gly Gly Val Ala Arg Tyr 210 215 220
Val Cys Gln Glu Gly Phe Glu Ser Pro Gly Gly Lys He Thr Ser Val 225 . 230 235 240
Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser Thr Leu Thr Cys Thr Glu 245 250 255
He Leu Thr Lys He Asn Asp Val Ser Leu Phe Asn Asp Thr Cys Val 260 265 270
Arg Trp Gln He Asn Ser Arg Arg He Asn Pro Lys He Ser Tyr Val 275 280 285
^¡j¡^¡£¡* ., •- . . -^¿¿aadÉ He Ser He Lys Gly Gln Arg Leu Asp Pro Met Glu Ser Val Arg Glu 290 295 300
Glu Thr Val Asn Leu Thr Thr Asp Ser Arg Thr Pro Glu Val Cys Leu 305 310 315 320
Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val Asn He Ser Thr Ala Pro 325 330 335
Pro Arg Arg Ser Met Pro Ala Val He Gly Phe Gln Thr Ala Gly Ser
340 345 350
Arg Asn Ser His Gly Arg Asn Thr His He Lys Glu Val Asp Leu Leu 355 360 365
Glu Asp Asp Gly Ser Phe Asn. He Ser He Phe Asn Glu Thr Cys Leu 370 ' 375 3b0
Lys Leu Asn Arg Arg Ser Arg Lys Val Gly Ser Glu His Met Tyr Gln 385 390 395 400
Phe Thr Val Leu Gly Gln Arg Trp Tyr Leu Ala Asn Phe Ser His Ala 405 4 10 415 Thr Ser Phe Asn Phe Thr Thr Arg Glu Gln Val Pro Val Val Cys Leu 420 425 430
Asp Leu Tyr Pro Thr Thr Asp Tyr Thr Val Asn Val Thr Leu Leu Arg 435 440 445
Ser Pro Lys Arg His Ser Val Gln He Thr He Ala Thr Pro Pro Ala 450 455 460
Val Lys Gln Thr He Ser Asn He Ser Gly Phe Asn Glu Thr Cys Leu 465 ' 470 475 480
Arg Trp Arg Ser He Lys Thr Ala Asp Met Glu Glu Met Tyr Leu Phe 485 490 495
His He Trp Gly Gln Arg Trp Tyr Gln Lys Glu Phe Ala Gln Glu Met 500 505 510
Thr Phe Asn He Ser Ser Ser Ser Arg Asp Pro Glu Val Cys Leu Asp 515 520 525
Leu Arg Pro Gly Thr Asn Tyr Asn Val Ser Leu Arg Ala Leu Ser Ser 530 535 540
A»-&- &-iya-lfc.A rJc aSr *»Ll * <**& Glu Leu Pro Val Val He Ser Leu Thr Thr Gln He Thr Glu Pro Pro 545 550 555 560
Leu Pro Glu Val Glu Phe Phe Thr Val His Arg Gly Prp Leu Pro Arg 565 570 575
Leu Arg Leu Arg Lys Ala Lys Glu Lys Asn Gly Pro He Ser Ser Tyr 580 585 590
Gln Val Leu Val Leu Pro Leu Ala Leu Gln Ser Thr Phe Ser Cys Asp 595 600 605
Ser Glu Gly Ala Ser Ser Phe Phe Ser Asn Ala Ser Asp Ala Asp Gly 610 615 620
Tyr Val Ala Ala Glu Leu Leu Ala Lys Asp Val Pro Asp Asp Ala Met 625 630 635 640
Glu He Pro He Gly Asp Arg Leu Tyr Tyr Gly Glu Tyr Tyr Asn Ala 645 650 655
Pro Leu Lys Arg Gly Ser Asp Tyr Cys He He Leu Arg He Thr Ser 660 665 670
fe fc m *í ?&& á . . -as >ia afe.
Glu Trp Asn Lys Val Arg Arg His Ser Cys Ala Val Trp Ala Gln Val 675 680 685
Lys Asp Ser Ser Leu Met Leu Leu Gln Met Ala Gly Val Gly Leu Gly 690 695 700
Ser Leu Ala Val Val He He Leu Thr Phe Leu Ser Phe Ser Ala Val 705 710 715 720
<210> 147 <211> 707 <212> PRT <213> Homo sapiens
<400> 147 Thr Cys His Glu His Ala Thr Cys Gln Gln Arg Glu Gly Lys Lys He 1 5 10 15
Cys He Cys Asn Tyr Gly Phe Val Gly Asn Gly Aig Thr Gln Cys Val 20 25 30
Asp Lys Asn Glu Cys Gln Phe Gly Ala Thr Leu Val Cys Gly Asn His 35 • 40 45
yyfcA^^^^^^^^^^^^ Thr Ser Cys His Asn Thr Pro Gly Gly Phe Tyr Cys He Cys Leu Glu 50 55 60
Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr Phe He Pro Asn Asp Gly 65 70 75 80
Thr Phe Cys Thr Asp He Asp Glu Cys Glu Val Ser Gly Leu Cys Arg 85 90 95
His Gly Gly Arg Cys Val Asn Thr His Gly Ser Phe Glu Cys Tyr Cys 100 105 110
Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro Glu Pro Phe His Pro Thr 115 120 125
Thr Asp Ala Thr Ser Cys Thr- Glu He Asp Cys Gly Thr Pro Pro Glu 130 135 140
Val Pro Asp Gly Tyr He He Gly Asn Tyr Thr Ser Ser Leu Gly Ser 145 150 155 160
Gln Val Arg Tyr Ala Cys Arg Glu Gly Ppe Phe Ser Val Pro Glu Asp 165 170 175
Thr Val Ser Ser Cys Thr Gly Leu Gly Thr Trp Glu Ser Pro Lys Leu 180 185 190
His Cys Gln Glu He Asn Cys Gly Asn Pro Pro Glu Met Arg His Ala 195 200 205
He Leu Val Gly Asn His Ser Ser Arg Leu Gly Gly Val Ala Arg Tyr 210 215 220
Val Cys Gln Glu Gly Phe Glu Ser Pro Gly Gly Lys He Thr Ser Val 225 230 235 240
Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser Thr Leu Thr Cys Thr Glu 245 250 255
He Leu Thr Lys He Asn Asp Val Ser Leu Phe Asn Asp Thr Cys Val 260 265 270
Arg Trp Gln He Asn Ser Arg Arg He Asn Pro Lys He Ser Tyr Val 275 280 2£5
He Ser He Lys Gly Gln Arg Leu Asp Pro Met Glu Ser Val Arg Glu 290 295 300
in i T --*^ » - - Glu Thr Val Asn Leu Thr Thr Asp Ser Arg Thr Pro Glu Val Cys Leu 305 310 315 320
Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val Asn He Ser Thr Ala Pro 325 330 335
Pro Arg Arg Ser Met Pro Ala Val He Gly Phe Gln Thr Ala Glu Val 340' 345 350
Asp Leu Leu Glu Asp Asp Gly Ser Phe Asn He Ser He Phe Asn Glu 355 360 365
Thr Cys Leu Lys Leu Asn Arg Arg Ser Arg Lys Val Gly Ser Glu His 370 375 380
Met Tyr Gln Phe- Thr Val Leu Gly Gln Arg Trp Tyr Leu Ala Asn Phe 385 390 395 400
Ser His Ala Thr Ser Phe Asn Phe Thr Thr Arg Glu Gln Val Pro Val .405 410 415
Val Cys Leu Asp Leu Tyr Pro Thr Thr Asp Tyr Thr Val Asn Val Thr 420 425 430
Leu Leu Arg Ser Pro Lys Arg His Ser Val Gln He Thr He Ala Thr 435 440 445
Pro Pro Ala Val Lys Gln Thr He Ser Asn He Ser Gly Phe Asn Glu 450 455 460
Thr Cys Leu Arg Trp Arg Ser He Lys Thr Ala Asp Met Glu Glu Met 465 470 475 480
Tyr Leu Phe His He Trp Gly Gln Arg Trp Tyr Gln Lys Glu Phe Ala 485 490 495
Gln Glu Met Thr Phe Asn He Ser Ser Ser Ser Arg Asp Pro Glu Val 500 505 510
Cys Leu Asp Leu Arg Pro Gly- Thr Asn Tyr Asn Val Ser Leu Arg Ala 515 520 525
Leu Ser Ser Glu Leu Pro Val Val He Ser Leu Thr Thr Gln He Thr 530 535 540
Glu Pro Pro Leu Pro Glu Val Glu Phe Phe Thr Val His Arg Gly Pro 545 550 555 560
•*» » iStSiJX * Leu Pro Arg Leu Arg Leu Arg Lys Ala Lys Glu Lys Asn Gly Pro He 565 570 575
Ser Ser Tyr Gln Val Leu Val Leu Pro Leu Ala Leu Gln Ser Thr Phe 580 585 590
Ser Cys Asp Ser Glu Gly Ala Ser Ser Phe Phe Ser Asn Ala Ser Asp 595 600 605
Ala Asp Gly Tyr Val Ala Ala Glu Leu Leu Ala Lys Asp Val Pro Asp 610 615 620
Asp Ala Met Glu He Pro He Gly Asp Arg Leu Tyr Tyr Gly Glu Tyr 625 630 635 640
Tyr Asn Ala Pro Leu Lys Arg Gly Ser Asp Tyr Cys He He Leu Arg 645 650 655
He Thr Ser Glu Trp Asn Lys Val Arg Arg His Ser Cys Ala Val Trp 660 665 670
Ala Gln Val Lys Asp Ser Ser Leu Met Leu Leu Gln Met Ala Gly Val 675 680 685
a k?&*¿ * Gly Leu Gly Ser Leu Ala Val Val He He Leu Thr Phe Leu Ser Phe 690 695 700
Ser Ala Val 705
<210> 148 <211> 713 <212> PRT <213> Homo sapiens
<400> 148 Ser Leu Asp Val Cys Ala Thr Cys His Glu His Ala Thr Cys Gln Gln 1 5 10 15
Arg Glu Gly Lys Lys He Cys He Cys Asn Tyr Gly Phe Val Gly Asn 20 25 30
Gly Arg Thr Gln Cys Val Asp Lys Asn Glu Cys Gln Phe Gly Ala Thr 35 40 45
Leu Val Cys Gly Asn His Thr Ser Cys His Asn Thr Pro Gly Gly Phe 50 55 60
Tyr Cys He Cys Leu Glu Gly Tyr Arg Ala Thr Asn Asn Asn Lys Thr 65 70 75 80
Phe He Pro Asn Asp Gly Thr Phe Cys Thr Asp He Asp Glu Cys Glu 85 90 95
Val Ser Gly Leu Cys Arg His Gly Gly Arg Cys Val Asn Thr His Gly 100. 105 110
Ser Phe Glu Cys Tyr Cys Met Asp Gly Tyr Leu Pro Arg Asn Gly Pro 115 120 125
Glu Pro Phe His Pro Thr Thr Asp Ala Thr Ser Cys Thr Glu He Asp 130 135 140
Cys Gly Thr Pro Pro Glu Val- Pro Asp Gly Tyr He He Gly Asn Tyr 145 150 155 160
Thr Ser Ser Leu Gly Ser Gln Val Arg Tyr Ala Cys Arg Glu Gly Phe 165 170 175
Phe Ser Val Pro Glu Asp Thr Val Ser Ser Cys Thr Gly Leu Gly Thr 180 185 190 Trp Glu Ser Pro Lys Leu His Cys Gln Glu He Asn Cys Gly Asn Pro 195 200 205
Pro Glu Met Arg His Ala He Leu Val Gly Asn His Ser Ser Arg Leu 210 215 220
Gly Gly Val Ala Arg Tyr Val Cys Gln Glu Gly Phe Glu Ser Pro Gly 225 230 235 240
Gly Lys He Thr Ser Val Cys Thr Glu Lys Gly Thr Trp Arg Glu Ser 245 250 255
Thr Leu Thr Cys Thr Glu He Leu Thr Lys He Asn Asp Val Ser Leu 260 265 270
Phe Asn Asp Thr Cys Val Arg. Trp Gln He Asn Ser Arg Arg He Asn 275 280 285
Pro Lys He Ser Tyr Val He Ser He Lys Gly Gln Arg Leu Asp Pro 290 295 300
Met Glu Ser Val Arg Glu Glu Thr Val Asn Leu Thr Thr Asp Ser Arg 305 310 315 320
E™»^-'-*^- - - ^- ^¿^^^^^^^^^^^^^^^^^^^^^^^^^^afj^j^jjj^j^^^rf^^^Sj^^^^^^^^^^ ^^^fc^^^^^ Thr Pro Glu Val Cys Leu Ala Leu Tyr Pro Gly Thr Asn Tyr Thr Val 325 330 335
Asn He Ser Thr Ala Pro Pro Arg Arg Ser Met Pro Ala Val He Gly 340 345 350
Phe Gln Thr Ala Glu Val Asp Leu Leu Glu Asp Asp Gly Ser Phe Asn 355 360 365
He Ser He Phe Asn Glu Thr Cys Leu Lys Leu Asn Arg Arg Ser Arg 370 375 380
Lys Val Gly Ser Glu His Met Tyr Gln Phe Thr Val Leu Gly Gln Arg 385 390 395 400
Trp Tyr Leu Ala Asn Phe Ser His Ala Thr Ser Phe Asn Phe Thr Thr 405 410 415
Arg Glu Gln Val Pro Val Val Cys Leu Asp Leu Tyr Pro Thr Thr Asp 420 425 430
Tyr Thr Val Asn Val Thr Leu Leu Arg Ser Pro Lys Arg His Ser Val 435 440 445
Lt -.«.¿.¿-.¿..A &*i *¿ Gln He Thr He Ala Thr Pro Pro Ala Val Lys Gln Thr He Ser Asn 450 455 460
He Ser Gly Phe Asn Glu Thr Cys Leu Arg Trp Arg Ser He Lys Thr 5 465 470 475 480
Ala Asp Met Glu Glu Met Tyr Leu Phe His He Trp Gly Gln Arg Trp 485 490 495
10 Tyr Gln Lys Glu Phe Ala Gln Glu Met Thr Phe Asn He Ser Ser Ser 500 505 510
Ser Arg Asp Pro Glu Val Cys Leu Asp Leu Arg Pro Gly Thr Asn Tyr 515 520 525 15 Asn Val Ser Leu Arg Ala Leu. Ser Ser Glu Leu Pro Val Val He Ser 530 535 540
Leu Thr Thr Gln He Thr Glu Pro Pro Leu Pro Glu Val Glu Phe Phe 20 545 550 555 560
Thr Val His Arg Gly Pro Leu Pro Arg Leu Arg Leu Arg Lys Ala Lys "565 570 575
Glu Lys Asn Gly Pro He Ser Ser Tyr Gln Val Leu Val Leu Pro Leu 580 585 590
Ala Leu Gln Ser Thr Phe Ser Cys Asp Ser Glu Gly Ala Ser Ser Phe 595 600 605
Phe Ser Asn Ala Ser Asp Ala Asp Gly Tyr Val Ala Ala Glu Leu Leu 610 615 620
Ala Lys Asp Val Pro Asp Asp Ala Met Glu He Pro He Gly Asp Arg 625 630 635 640
Leu Tyr Tyr Gly Glu Tyr Tyr Asn Ala Pro Leu Lys Arg Gly Ser Asp 645 650 655
Tyr Cys He He Leu Arg He. Thr Ser Glu Trp Asn Lys Val Arg Arg 660 665 670
His Ser Cys Ala Val Trp Ala Gln Val Lys Asp Ser Ser Leu Met Leu 675 680 685
Leu Gln Met Ala Gly Val Gly Leu Gly Ser Leu Ala Val Val He He 690 695 700
^j^giáj^gs&y^jj^^^^j^feji**^ Leu Thr Phe Leu Ser Phe Ser Ala Val 705 710
<210> 149 <211> 170 <212> PRT <213> Homo sapiens
<400> 149 Arg Ser Met Thr Val Gly Gly Ala Phe His Thr Thr Glu Ala Glu Ala 1 5 10 15
Ser Ser Gln Ser Leu Thr Gl He Tyr Ala Leu Pro Glu He Pro Gln 20 25 30
Asp Gln Asn Ala Ala Glu Ser Trp Glu Thr Leu Glu Ala Asp Leu He 35 40 45
Glu Leu Ser Gln Leu Val Thr Asp Phe Ser Leu Leu Val Asn Ser Gln 50 55 60
Gln Glu Lys He Asp Ser He Ala Asp His Val Asn Ser Ala Ala Val 65 70 75 80
C^g¡¡^4*?^-^g^^^Mjßg#2^2^^^^^^ ggj^^-^^-^ Asn Val Glu Glu Gly Thr Lys Asn Leu Gly Lys Ala Ala Lys Tyr Lys 85 90 95
Leu Ala Ala Leu Pro Val Ala Gly Ala Leu He Gly Gly Met Val Gly 100 105 110
Gly Pro He Gly Leu Leu Ala Gly Phe Lys Val Ala Gly He Ala Ala 115 120 125
Ala Leu Gly Gl'y Gly Val Leu Gly Phe Thr Gly Gly Lys Leu He Gln 130 135 140
Arg Lys Lys Gln Lys Met Met Glu Lys Leu Thr Ser Ser Cys Pro Asp 1 5 . 150 155 160
Leu Pro Ser Gln Thr Asp Lys Lys Cys Ser . 165 170
<210> 150 <211> 318 <212> PRT <213> Homo sapiens
í^- k . -á^. ^ .JÍL. i <400> 150 Val Glu Lys Thr Ala Val Thr Arg Glu Val He Gln His Phe Phe Arg 1 5 10 15
5 Met Ser Glu Asp Glu Glu Lys Val Lys Leu Arg Arg Leu Glu Pro Ala 20 25 30
He Gln Lys Phe He Lys He Val He Pro Thr Asp Leu Glu Arg Leu 35 40 45 10 Arg Lys His Gln He Asn He Glu Lys Tyr Gln Arg Cys Arg He Trp 50 55 60
Asp Lys Leu His Glu Glu His He Asn Ala Gly Arg Thr Val Gln Gln 15 65 70 75 80
Leu Arg Ser Asn He Arg Gl j He Glu Lys Leu Cys Leu Lys Val Arg 85 90 95
20 Lys Asp Asp Leu Val Leu Leu Lys Arg Met He Asp Pro Val Lys Glu 100 105 110
Glu Ala Ser Ala Ala Thr Ala Glu Phe Leu Gln Leu His Leu Glu Ser 115 120 125 25
Val Glu Glu Leu Lys Lys Gln Phe Asn Asp Glu Glu Thr Leu Leu Gln 130 135 140
Pro Pro Leu Thr Arg Ser Met Thr Val Gly Gly Ala Phe His Thr Thr 145 150 155 160
Glu Ala Glu Ala Ser Ser Gln Ser Leu Thr Gln He Tyr Ala Leu Pro 165 170 175
Glu He Pro Gln Asp Gln Asn Ala Ala Glu Ser Trp Glu Thr Leu Glu 180 185 190
Ala Asp Leu He Glu Leu Ser Gln Leu Val Thr Asp Phe Ser Leu Leu 195 200 205
Val Asn Ser Gln Gln Glu Lys He Asp Ser He Ala Asp His Val Asn 210 215 220
Ser Ala Ala Val Asn Val Glu Glu Gly Thr Lys Asn Leu Gly Lys Ala 225 230 235 240
Ala Lys Tyr Lys Leu Ala Ala Leu Pro Val Ala Gly Ala Leu He Gly 245 250 255
i-í ?.?,*?i?*ßJíx? . . ¿ *^t¿s*& Gly Met Val Gly Gly Pro He Gly Leu Leu Ala Cly Phe Lys Val Ala 260 265 270
Gly He Ala Ala Ala Leu Gly Gly Gly Val Leu Gly Phe Thr Gly Gly 275 280 285
Lys Leu He Gln Arg Lys Lys Gln Lys Met Met Glu Lys Leu Thr Ser 290 295 300
Ser Cys Pro Asp Leu Pro Ser Gln Thr Asp Lys Lys Cys Ser 305 310 315
<210> 151 <211> 123 <212> PRT <213> Homo sapiens
<400> 151 His Ser Arg Cys Ser Pro Pro Leu Ser Leu Pro Met Lys Glu Glu Thr 1 5 10 15
Thr Gly Val Cys Met Tyr Pro Pro He Lys Thr Arg Leu He Lys Thr 20 25 30
ü Phe Pro Val Asp Thr Met Thr Pro Phe Pro Asp Thr Phe Thr Thr Gly 35 40 45
Pro Gln Phe Thr Ala Asp Phe Arg Asp Ser Lys Leu Gln Cys Cys Pro 50 55 60
Gly Pro Thr Ser Pro Leu He Pro Ala Ala Thr Leu Arg Pro Leu Thr 65 70 75 80
Glu Thr Val Ser Thr Val Gln Thr He Tyr Thr Thr Arg Lys Pro Val 85 90 95
Ser Leu Ala Ala Ser Ala Glu Thr Leu Arg Gln Glu Leu Glu Arg Glu 100 105 110
Lys Met Met Lys Arg Leu Leu Met Thr Glu Leu 115 ' 120
<210> 152 <211> 58 <212> PRT <213> Homo sapiens
<400> 152 Gln Gly Arg Ser Arg Met His Val Ser Leu Pro Thr His Leu Cys Hia 1 5 10 15
Val Gly Ser Phe Arg Ser Ala Met Val Arg Lys Glu Gln Lys Leu Leu 20 25 30
Val Val Phe Val Leu Phe Trp Arg He Cys Leu Pro Val Asn Thr Ser 35 40 45
Leu Pro Val Pro Gln Met Leu Pro Ala Pro 50 55
<210> 153 <211> 36 <212> PRT <213> Homo sapiens
<400> 153 Arg He Thr Thr Gly Gly Gly Arg Trp Val Pro AJ a Gly Gly Gly Val 1 5 10 15
Ser Ala Pro Trp Gly Ala Arg Gln Ser Gly Gly Gly Ser Ala Ala Gly 20 25 30 Ala Gly Arg Leu 35
<210> 154 <211> 651 <212> PRT <213> Homo sapiens
<400> 154 Pro Xaa Pro Gly Ser Phe Gly Xaa Ala Met Gly Cys Cys Ser Ser Ala 1 5 10 15
Ser Ser Ala Ala Gln Ser Ser Lys Arg Glu Trp Lys Pro Leu Glu Asp 20 25 30
Arg Ser Cys Thr Asp He Pro Trp Leu Leu Leu Phe He Leu Phe Cys 35 40 45
He Gly Met Gly Phe He Cys Gly Phe Ser He Ala Thr Gly Ala Ala 50 55 60
Ala Arg Leu Val Ser Gly Tyr Asp Ser Tyr Gly Asn He Cys Gly Gln 65 70 75 80
l i i. ¿ i-j- .?- . r. Llí Lys Asn Thr Lys Leu Glu Ala He Pro Asn Ser Gly Met Asp His Thr 85 90 95
Gln Arg Lys Tyr Val Phe Phe Leu Asp Pro Cys 7-sn Leu Asp Leu He 100 105 110
Asn Arg Lys He Lys Ser Val Ala Leu Cys Val Ala Ala Cys Pro Arg 115 120 125
Gln Glu Leu Lys Thr Leu Ser Asp Val Gln Lys Phe Ala Glu He Asn 130 135 140
Gly Ser Ala Leu Cys Ser Tyr Xaa Leu Lys Pro Ser Glu Tyr Thr Thr 145 150 155 160
Ser Pro Lys Ser Ser Val Leu Cys Pro Lys Leu Pro Val Pro Ala Ser 165 170 175
Ala Pro He Pro Phe Phe His Arg Cys Ala Pro Val Asn He Ser Cys 180 185 190
Tyr Ala Lys Phe Ala Glu Ala Leu He Thr Phe Val Ser Asp Asn Ser 195 200 205
Val Leu His Arg Leu He Ser Gly Val Met Thr Ser Lys Glu He He 210 215 220
Leu Gly Leu Cys Leu Leu Ser Leu Val Leu Ser Met He Leu Met Val 225 230 235 240
He He Arg Tyr He Ser Arg Val Leu Val Trp He Leu Thr He Leu 245 250 255
Val He Leu Gly Ser Leu Gly Gly Thr Gly Val Leu Trp Trp Leu Tyr
260 265 270
Ala Lys Gln Arg Arg Ser Pro Lys Glu Thr Val Thr Pro Glu Gln Leu 275 280 285
Gln He Ala Glu Asp Asn Leu Arg Ala Leu Leu He Tyr Ala He Ser 290 295 300
Ala Thr Val Phe Thr Val He Leu Phe Leu He Met Leu Val Met Arg 305 310 315 320
Lys Arg Val Ala Leu Thr He Ala Leu Phe His Val Ala Gly Lys Val 325 330 335
r r'Ti - j u u .j-.td * . aJiL .
Phe He His Leu Pro Leu Leu Val Phe Gln Pro Phe Trp Thr Phe Phe 340 345 350
Ala Leu Val Leu Phe Trp Val Tyr Trp He Met Tnr Leu Leu Phe Leu 355 360 365
Gly Thr Thr Gly Ser Pro Val Gln Asn Glu Gln Gly Phe Val Glu Phe 370 375 380
Lys He Ser Gly Pro Leu Gln Tyr Met Trp Trp Tyr His Val Val Gly 385 390 395 400
Leu He Trp He Ser Glu Phe He Leu Ala Cys Gln Gln Met Thr Val 405 410 415
Ala Gly Ala Val Val Thr Tyr Tyr Phe Thr Arg Asp Lys Arg Asn Leu 420 425 430
Pro Phe Thr Pro He Leu Ala Ser Val Asn Arg Leu He Arg Tyr His 435 440 445
Leu Gly Thr Val Ala Lys Gly Ser Phe He He Thr Leu Val Lys He 450 455 4 0
Pro Arg Met He Leu Met Tyr He His Ser Gln Leu Lys Gly Lys Glu 465 470 475 480
Asn Ala Cys Ala Arg Cys Val Leu Lys Ser Cys He Cys Cys Leu Trp 485 490 495
Cys Leu Glu Lys Cys Leu Asn Tyr Leu Asn Gln Asn Ala Tyr Thr Ala 500 505 510
Thr Ala He Asn Ser Thr Asn Phe Cys Thr Ser Ala Lys Asp Ala Phe 515 520 525
Val He Leu Val Glu Asn Ala Leu Arg Val Ala Thr He Asn Thr Val 530 535 540
Gly Asp Phe Met Leu Phe Leu Gly Lys Val Leu He Val Cys Ser Thr 545 550 555 560
Gly Leu Ala Gly He Met Leu Leu Asn Tyr Gln Gln Asp Tyr Thr Val 565 570 575
Trp Vai Leu Pro Leu He He Val Cys Leu Phe A La Phe Leu Val Ala 580 585 590
i i-ilí His Cys Phe Leu Ser He Tyr Glu Met Val Val Asp Val Leu Phe Leu 595 600 605
Cys Phe Ala He Asp Thr Lys Tyr Asn Asp Gly Ser Pro Gly Arg Glu 610 615 620
Phe Tyr Met Asp Lys Val Leu Met Glu Phe Val Glu Asn Ser Arg Lys 625 630 635 640
Ala Met Lys Glu Ala Gly Lys Gly Gly Arg Arg 645 650
<210> 155 <211> 1066 <212> PRT <213> Homo sapiens <400> 155
Asn Gly Lys Phe Ser Tyr Thr Asp Leu His Tyr Gly Gln Thr Val Thr 1 5 10 15
Tyr Ser Cys Asn Arg Gly Phe Arg Xaa Glu Gly Pro Ser Ala Leu Thr 20 25 30
L-- --LJt--t¿Íki -^-'.J - . * l- *-* Pro Lys Lys Cys Pro Leu Pro Glu Asn He Thr His He Leu Val His 675 680 685
Gly Asp Asp Phe Ser Val Asn Arg Gln Val Ser Val Ser Cys Ala Glu 690 695 700
Gly Tyr Thr Phe Glu Gly Val Asn He Ser Val Cys Gln Leu Asp Gly 705 710 715 720
Thr Trp Glu Pro Pro Phe Ser Asp Glu Ser Cys Ser Pro Val Ser Cys 725 730 735
Gly Lys Pro Glu Ser Pro Glu His Gly P'^e al Val Gly Ser Lys Tyr 740 745 750
Thr Phe Glu Ser Thr He He. Tyr Gln Cys Glu Pro Gly Tyr Glu Leu 755 760 765
Glu Gly Asn Arg Glu Arg Val Cys Gln G^u Asn A>~g Gln Trp Ser Gly 770 775 7c0
Giy Val Ala He Cys Lys Glu Thr Arg Cys Glu Thr Pro Leu Glu Phe 785 790 795 800 Cys Leu Glu Thr Gly Asp Trp Asp Val Asp Ala Pro Ser Cys Asn Ala 35 40 45
He His Cys Asp Ser Pro Gln Pro He Glu Asn Gly Phe Val Glu Gly 5 50 55 60
Ala Asp Tyr Ser Tyr Gly Ala He He He Tyr Ser Cys Phe Pro Gly 65 70 75 80
10 Phe Gln Val Ala Gly His Ala Met Gln Thr Cys Glu Glu Ser Gly Trp 85 90 95
Ser Ser Ser He Pro Thr Cys Met Pro He Asp Cys Gly Leu Pro Pro 100 105 110 15 His He Asp Phe Gly Asp Cys- Thr Lys Leu Lys Asp Asp Gln Gly Tyr 115 120 125
Phe Glu Gln Glu Asp Asp Met Met Glu Val Pro Tyr Val Thr Pro His 20 130 135 140
Pro Pro Tyr His Leu Gly Ala Val Ala Lys Thr Trp Glu Asn Thr Lys 145 150 155 160
*?*iM?Í mi * m*?.r* . ».--. s t<..j....; -- -i--- - A^?- ..,. - r * *** -^^«- » ... «- - .-.... .... i *.~ *" * •** • " *• « * » Glu Ser Pro Ala Thr His Ser Ser Asn Phe Leu Tyr Gly Thr Met Val 165 170 175
Ser Tyr Thr Cys Xaa Pro Gly Tyr Glu Leu Leu Gly Asn Pro Val Leu 180 185 190
He Xaa Gln Glu Asp Gly Thr Trp Asn Gly Ser A_a Pro Ser Cys He 195 200 205
Ser He Glu Cys Asp Leu Pro Thr Ala Pro Glu Asn Gly Phe Leu Arg 210 215 220
Phe Thr Glu Thr Ser Met Gly Ser Ala Val Gln Tyr Ser Cys Lys Pro 225 230 235 240
Gly His He Leu Ala Gly Ser. Asp Leu Arg Leu Cys Leu Glu Asn Arg 245 250 255
Lys Trp Ser Gly Ala Ser Pro Arg Cys Glu Ala He Ser Cys Lys Lys 260 265 270
Pro Asn Pro Val Met Asn Gly Ser He Lys Gly Ser Asn Tyr Thr Tyr 275 280 285
Leu Ser Thr Leu Tyr Tyr Glu Cys Asp Pro Gly Tyr Val Leu Asn Gly 290 295 3 )0
Thr Glu Arg Arg Thr Cys Gln Asp Asp Lys Asn Trp Asp Glu Asp Glu 305 310 315 320
Pro He Cys He Pro Val Asp Cys Ser Ser Pro Pro Val Ser Ala Asn 325 330 335
Gly Gln Val Arg Gly Asp Glu Tyr Thr Phe Gln L/s Glu He Glu Tyr 340 345 350
Thr Cys Asn Glu Gly Phe Leu Leu Glu Gly Ala Arg Ser Arg Val Cys 355 360 365
Leu Ala Asn Gly Ser Trp Ser. Gly Ala Thr Pro Asp Cys Val Pro Val 370 375 3 A
Arg Cys Ala Thr Pro Pro Gln Leu Ala Asn Gly Val Thr Glu Gly Leu 385 390 395 400
Asp Tyr Gly Phe Met Lys Glu Val Thr Phe His Cys His Glu Gly Tyr 405 410 415
tj *-riL.?* A.*~±.?*t -» • '-- ? «—- ... i ?lAá .t-tlAi»,. -"• •* -"-'-- -" "•*•"' -*-" He Leu His Gly Ala Pro Lys Leu Thr Cys Gln Ser Asp Gly Asn Trp 420 425 430
Asp Ala Glu He Pro Leu Cys Lys Pro Val Asn Cys Gly Pro Pro Glu 435 440 445
Asp Leu Ala His Gly Phe Pro Asn Gly Phe Ser Phe He His Gly Gly 450 455 460
His He Gln Tyr Gln Cys Phe Pro Gly Tyr Lys Lsu His Gly Asn Ser 465 470 475 480
Ser Arg Arg Cys Leu Ser Asn Gly Ser Trp Ser Gly Ser Ser Pro Ser 485 490 495
Cys Leu Pro Cys Arg Cys Ser. Thr Pro Val He Glu Tyr Gly Thr Val 500 505 510
Asn Gly Thr Asp Phe Asp Cys Gly Lys Ala Ala Arg He Gln Cys Phe 515 520 525
Lys Gly Phe Lys Leu Leu Gly Leu Ser Glu He Tnr Cys Glu Ala Asp 530 535 540
¡¡A.t ? ?d.?.?tí *.l..-, i Jt ^I*.
Gly Gln Trp Ser Ser Gly Phe Pro His Cys Glu His Thr Ser Cys Gly 545 550 555 560
Ser Leu Pro Met He Pro Asn Ala Phe He Ser Glu Thr Ser Ser Trp 565 570 575
Lys Glu Asn Val He Thr Tyr Ser Cys Arg Ser Gly Tyr Val He Gln 580 585 590
Gly Ser Ser Asp Leu He Cys Thr Glu Lys Gly Val Trp Ser Gln Pro 595 600 605
Tyr Pro Val Cys Glu Pro Leu Ser Cys Gly Ser Pro Pro Ser Val Ala 610 615 620
Asn Ala Val Ala Thr Gly Glu. Ala His Thr Tyr Glu Ser Glu Val Lys 625 630 635 640
Leu Arg Cys Leu. Glu Gly Ty_t Thr Met Asp Thr Asp Thr Asp Thr Phe 645 650 655
Thr Cys Gln Lys Asp Gly Arg Trp Phe Pro Glu Arg He Ser Cys Ser 660 665 670
'-*- *^ ^ Leu Asn Gly Lys Ala Asp He Glu Asn Arg Thr Thr Gly Pro Asn Val 805 810 815
Val Tyr Ser Cys Asn Arg Gly Tyr Ser Leu Glu Gly Pro Ser Glu Ala 820 825 830
His Cys Thr Glu Asn Gly Thr Trp Ser His Pro Val Pro Leu Cys Lys 835 840 845
Pro Asn Pro Cys Pro Val Pro Phe Val He Pro Glu Asn Ala Leu Leu 850 855 860
Ser Glu Lys Glu Phe Tyr Val Asp Gln Asn Val Ser He Lys Cys Arg 865 870 875 880
Glu Gly Phe Leu Leu Gln Gly. His Gly He He Thr Cys Asn Pro Asp 885 890 895
Glu Thr Trp Thr Gln Thr Ser Ala Lys Cys Glu Lys He Ser Cys Gly 900 905 910
Pro Pro Ala His Val Glu Asn Ala He Ala Arg Gly Val His Tyr Gln 915 920 925
¡í Á. . i.?l,tr Tyr Gly Asp Met He Thr Tyr Ser Cys Tyr Ser Gly Tyr Met Leu Glu 930 935 940
Gly Phe Leu Arg Ser Val Cys Leu Glu Asn Gly Thr Trp Thr Ser Pro 945 950 955 960
Pro He Cys Arg Ala Val Cys Arg Phe Pro Cys Gln Asn Gly Gly He 965 970 975
Cys Gln Arg Pro Asn Ala Cys Ser Cys Pro Glu Gly Trp Met Gly Arg
980 985 990
Leu Cys Glu Glu Pro He Cys He Leu Pro Cys Leu Asn Gly Gly Arg 995 1000 1005
Cys Val Ala Pro Tyr Gln Cys. Asp Cys Pro Pro Gly Trp Thr Gly Ser 1010 1015 1020
Arg Cys His Thr Ala Val Cys Gln Ser Pro Cys Leu Asn Gly Gly Lys 1025 1030 1035 1040
Cys Val Arg Pro Asn Arg Cys His Cys Leu Ser Ser Trp Thr Gly His 1045 1050 1055 Asn Cys Ser Arg Lys Arg Arg Thr Gly Phe 1060 1065
<210> 156 <211> 43 <212> PRT <213> Homo sapiens
<400> 156 Ser Gln Lys Asp Leu He Gly Glu He Gln Ser Val Thr Cys Glu Glu 1 5 10 15
Val Tyr Ser Thr Pro Pro Pro Lys Lys He Phe Gly He Tyr Thr Ser 20 25 30
Arg Asn Arg Ala Asn Met Cys Gly Asn Ala Tyr 35 40
<210> 157 <211> 61 <212> PRT <213> Homo sapiens
r«fni?if»--- .« &¿¡ ¡*A^,i?,L??ÍL*ÍAÍJ?. mÍ¡¿'. -»->*• <400> 157 Val Asp Ser Pro Pro Thr Ser Pro Phe Val Ser Arg Pro He Ser Arg 1 5 10 15
Gln Glu Ser Gln Lys Asp Leu He Gly Glu He Gln Ser Val Thr Cys 20 25 30
Glu Glu Val Tyr Ser Thr Pro Pro Pro Lys Lys He Phe Gly He Tyr 35 40 45
Thr Ser Arg Asn Arg Ala Asn Met Cys Gly Asn Ala Tyr 50 55 60
<210> 158 <211> 263 <212> PRT <213> Homo sapiens
<400> 158 Leu Arg Lys Asp Thr Ala Gly Cys Phe Ser Gln Arg Arg Ser Arg Ala 1 5 10 15
Met Leu Val Leu Arg Ser Ala Leu Thr Arg Ala Leu Ala Ser Arg Thr 20 25 30
^ ^^^u Leu Ala Pro Gln Met Cys Ser Ser Phe Ala Thr Gly Pro Arg Gln Tyr 35 40 45
Asp Gly He Phe Tyr Glu Phe Arg Ser Tyr Tyr Leu Lys Pro Ser Lys 50 55 60
Met Asn Glu Phe Leu Glu Asn Phe Glu Lys Asn Ala His Leu Arg Thr 65 70 75 80
Ala His Ser Glu Leu Val Gly Tyr Trp Ser Val Glu Phe Gly Gly Arg 85 90 95
Met Asn Thr Val Phe His He Trp Lys Tyr Asp Asn Phe Ala His Arg 100 105 110
Thr Glu Val Arg Lys Ala Leu Ala Lys Asp Lys Glu Trp Gln Glu Gln 115 120 125
Phe Leu He Pro Asn Leu Ala Leu He Asp Lys Gln Glu Ser Glu He 130 135 140
Thr Tyr Leu Val Pro Trp Cys Lys Leu Glu Lys Pro Pro Lys Glu Gly 145 150 155 160
. . ..Á¿a a¿¿a¿ai Val Tyr Glu Leu Ala Thr Phe Gln Met Lys Pro Gly Gly Pro Ala Leu 165 170 175
Trp Gly Asp Ala Phe Lys Arg Ala Val His Ala His Val Asn Leu Gly 180 185 190
Tyr Thr Lys Leu Val Gly Val Phe His Thr Glu Tyr Gly Glu Leu Asn 195 200 205
Arg Val His Val Leu Trp Trp Asn Glu Ser Ala Asp Ser Arg Ala A la 210 . 215 220
Gly Arg His Lys Ser His Glu Asp Pro Arg Val Val Ala Ala Val Arg 225 230 235 240
Glu Ser Val Asn Tyr Leu Vai Ser Gln Gln Asn Met Leu Leu He Pro 245 250 255
Ala Ser Phe Ser Pro Leu Lys 260
<210> 159 <211> 203 <212> PRT
Í? ??- ? Jk tAa». ,?tMitfiMH!4*' '-A'Í''ir'Mf" rr i -. --, A .i i-? <213> Homo sapiens
<400> 159 Tyr Lys Pro Val Lys Trp Val He Ser Leu Thr Pro Leu Ser Gln Pro 1 5 10 15
Gly Pro Ser Ser Asn He He Gly Gln Ser Val Glu Glu Ala He Arg 20 25 30
Gly Val Phe Asp Ala Ser Leu Lys Met Ala Gly Phe Tyr Gly Leu Tyr 35 40 45
Thr Trp Leu Thr His Thr Met Phe Gly He Asn He Val Phe He Pro 50 55 60
Ser Ala Leu Ala Ala He Leu. Gly Ala Val Pro Phe Leu Gly Thr Tyr 65 70 75 80
Trp Ala Ala Val Pro Ala Val Leu Asp Leu Trp Leu Thr Gln Gly Leu 85 90 95
Gly Cys Lys Ala He Leu Leu Leu He Phe His Leu Leu Pro Thr Tyr 100 105 110
Phe Val Asp Thr Ala He Ty^ Ser Asp He Ser Gly Gly Gly His Pro 115 120 125
Tyr Leu Thr Gly Leu Ala Val Ala Gly Gly Ala Tyr Tyr Leu Gly Leu 130 135 140
Glu Gly Ala He He Gly Pro He Leu Leu Cys He Leu Val Val Ala 145 150 155 160
Ser Asn He Tyr Ser Ala Met Leu Val Ser Pro Thr Asn Ser Val Pro 165 170 175
Thr Pro Asn Gln Thr Pro Trp Pro Ala Gln Pro Gln Arg Thr Phe Arg 180 185 190
Asp He Ser Glu Asp Leu Lys Ser Ser Val Gly 195 200
<210> 160 <211> 85 <212> PRT <213> Homo sapiens
<400> 160 Val Leu Thr Pro Gly Pro Glu Val Gly Cys Asn Cys Leu Trp Lys He 1 5 10 15
Leu Pro Leu Ser His Pro His Pro Leu Val Pro Ala Lys Asn Ala Gly 5 20 25 30
Asp Ser Ala Thr Met Leu Cys Val Pro Leu Asn Leu Cys Ala Ala Arg 35 40 45
10 Lys Ala Asp Val Gln Val Tyr Leu Asn Pro His Tyr Ser His Ala Pro 50 55 60
Asn Val His Gly His Phe Cys Asn Ser Ala His He Leu Thr Val Phe 65 70 75 80 l o Glu Lys Leu Ala Val 85
*j¡~?.&-h¿?*
Claims (29)
1. Un ácido nucleico, caracterizado porque codifica para una proteína que tiene una secuencia de aminoácidos elegida en el grupo de las secuencias de aminoácidos SEQ ID N°129 a SEQ ID N°160, o un fragmento peptídico o una variante de este último, o un ácido nucleico de secuencia complementaria.
2. Un ácido nucleico, caracterizado porque comprende al menos ocho nucleótidos consecutivos de un polinucleótido elegido en el grupo constituido de las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81, o un ácido nucleico de secuencia complementaria.
3. El ácido nucleico de conformidad con la reivindicación 2, caracterizado porque comprende al menos veinte nucleótidos consecutivos de un polinucleótido elegido en el grupo constituido de las secuencias nucleotídicas SEQ ID N°l a SEQ ID N°81, o un ácido nucleico de secuencia complementaria .
4. Un ácido nucleico caracterizado porque tiene al menos 80% de identidad de nucleótidos con un ácido . . ?¿ *^¿* nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 3, o un ácido nucleico de secuencia complementaria .
5. Un ácido nucleico caracterizado porque se híbrida, en condiciones de hibridación de fuerte astringencia, con un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 4, o un ácido nucleico de secuencia complementaria.
6. Una sonda o cebador nucleotídico, caracterizado porque comprende al menos ocho nucleótidos consecutivos de un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 5.
7. La sonda o cebador nucleotídico de conformidad con la reivindicación 6, caracterizado porque tiene una longitud de 15 a 300 nucleótidos.
8. La sonda o cebador nucleotídico de conformidad con la reivindicación 6, caracterizado porque tiene una longitud de 20 a 200 nucleótidos.
9. Una sonda o cebador nucleotídico, caracterizado porque comprende al menos ocho nucleótidos consecutivos de un polinucleótido elegido entre las secuencias SEQ ID N°82 a 101 y 102 a 128.
10. Un procedimiento para la amplificación de un ácido nucleico de conformidad con cualquiera de las i¿t¿JjJ tr? ¿ i . h. . reivindicaciones 1 a 5, contenido en una muestra, dicho método está caracterizado porque comprende las etapas de: a) poner en contacto la muestra en la cual se sospecha la presencia del ácido nucleico blanco, con un par de cebadores nucleotídicos, cuya posición de hibridación está localizada respectivamente del lado 5' y del lado 3' de la región del ácido nucleico blanco, cuya amplificación se busca, en presencia de los reactivos necesarios para la reacción de amplificación, y b) detección de los ácidos nucleicos amplificados.
11. El procedimiento de amplificación de conformidad con la reivindicación 10, caracterizado porque los cebadores nucleotídicos son elegidos entre los cebadores de conformidad con una cualquiera de las reivindicaciones 6 a 9.
12. Un estuche para la amplificación de un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 5, caracterizado porque comprende: a) un par de cebadores nucleotídicos, cuya posición de hibridación está localizado respectivamente del lado 5' y del lado 3' del ácido nucleico blanco, cuya amplificación es buscada; b) dado el caso, los reactivos necesarios para la reacción de amplificación. iBÜ¿ ? -t J¿ A**kJb¿U ?* -..- ¿.-kl-,
13. El estuche para la amplificación de un ácido nucleico de conformidad con la reivindicación 12, caracterizado porque los cebadores nucleotídicos son elegidos en el grupo constituido de los cebadores de conformidad con una de las reivindicaciones 6 a 9.
14. La sonda nucleotídica de conformidad con una cualquiera de las reivindicaciones 6 a 9, caracterizada porque comprende un compuesto marcador, cuya presencia es detectable.
15. El procedimiento de detección de la presencia de un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 5, en una muestra, el método está caracterizado porque comprende las etapas de: a) poner en contacto una o varias sondas nucleotídicas de conformidad con una de las reivindicaciones 6 a 9 y 14, con la muestra a probarse; b) detectar el complejo eventualmente formado en la o las sondas y el ácido nucleico presente en la muestra.
16. El procedimiento de detección de conformidad con la reivindicación 15, caracterizado porque la o las sondas son inmovilizadas sobre un soporte.
17. Un estuche para la detección de la presencia de un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 5, en una muestra, dicho estuche está caracterizado porque comprende: a) una o varias sondas nucleotídicas de conformidad con una cualquiera de las reivindicaciones 6 a 9 y 14; b) dado el caso, los reactivos necesarios para la 5 reacción de hibridación.
18. El procedimiento de detección de conformidad con la reivindicación 17, caracterizado porque la o las sondas son inmovilizadas sobre un soporte.
19. Un vector recombinante, caracterizado porque 10 comprende un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 5.
20. Una célula huésped recombinante, caracterizada porque comprende un ácido nucleico de conformidad con una cualquiera de las reivindicaciones 1 a 5. 15
21. La célula huésped recombinante, caracterizada porque comprende un vector recombinante de conformidad con la reivindicación 18.
22. Un polipéptido, caracterizado porque se elige en el grupo de los polipéptidos siguientes: 20 a) un polipéptido que comprende una secuencia de al menos 15 aminoácidos elegidos en el grupo constituido de los péptidos de las secuencias SEQ ID N°129 a la SEQ ID N°160, o un fragmento peptídico o una variante de éste último; -* ' b) un polipéptido que tiene al menos 80% de identidad de aminoácidos con un polipéptido, tal como el definido en a) .
23. Un polipéptido caracterizado porque comprende modificaciones de aminoácidos de 1, 2, 3, 4, 5, 10 a 20 sustituciones, adiciones o supresiones de un aminoácido con respecto a la secuencia de aminoácidos de un polipéptido de conformidad con la reivindicación 21.
24. Un anticuerpo, caracterizado porque está dirigido contra un polipéptido de conformidad con una de las reivindicaciones 21 ó 22.
25. El anticuerpo de conformidad con la reivindicación 23, caracterizado porque comprende un compuesto detectable.
26. Un procedimiento para detectar la presencia de un polipéptido de conformidad con una de las reivindicaciones 21 ó 22, en una muestra, caracterizado porque comprende las etapas de: a) poner en contacto la muestra con un anticuerpo de conformidad con una de las reivindicaciones 23 ó 24; b) detección del complejo antígeno/anticuerpo formado.
27. Un estuche de diagnóstico para la detección de la presencia de un polipéptido de conformidad con una de las l l ' ? IJMBiliÉMMlifrtlllÉÉTIrfti^^ reivindicaciones 21 ó 22, en una muestra, dicho estuche está caracterizado porque comprende: a) un anticuerpo de conformidad con una de las reivindicaciones 23 ó 24; b) un reactivo que permite la detección de los complejos antígenos/anticuerpos formados.
28. Un procedimiento para el tamizado de una molécula o de una sustancia candidata, que interactúa con un polipéptido de conformidad con una de las reivindicaciones 21 ó 22, dicho método está caracterizado porque comprende las etapas de: a) poner en contacto un polipéptido de conformidad con una de las reivindicaciones 21 ó 22, con la sustancia o molécula candidata; b) detectar los complejos eventualmente formados entre el polipéptido y la -sustancia candidata.
29. Un estuche para el tamizado de una molécula o sustancia candidata, que interactúa con un polipéptido de conformidad -con una de las reivindicaciones 21 ó 22, dicho estuche está caracterizado porque comprende: a) un polipéptido de conformidad con una de las reivindicaciones 21 ó 22; b) dado el caso, los medios necesarios psm . la detección del complejo formado entre el polipéptido y la molécula o sustancia candidata.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9906587A FR2794131B1 (fr) | 1999-05-25 | 1999-05-25 | Produits d'expression de genes impliques dans des affections associees au metabolisme du cholesterol |
US13945099P | 1999-06-16 | 1999-06-16 | |
PCT/FR2000/001426 WO2000071710A2 (fr) | 1999-05-25 | 2000-05-25 | Produits d'expression de genes impliques dans des affections du metabolisme du cholesterol |
Publications (1)
Publication Number | Publication Date |
---|---|
MXPA01011882A true MXPA01011882A (es) | 2002-05-06 |
Family
ID=26234967
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MXPA01011882A MXPA01011882A (es) | 1999-05-25 | 2000-05-25 | Productos de expresion de genes implicados en enfermedades relacionadas con el metabolismo del colesterol. |
Country Status (11)
Country | Link |
---|---|
EP (1) | EP1183350A2 (es) |
JP (1) | JP2003518918A (es) |
KR (1) | KR20020033627A (es) |
AU (1) | AU4931800A (es) |
BR (1) | BR0010916A (es) |
CA (1) | CA2371500A1 (es) |
HU (1) | HUP0203164A2 (es) |
IL (1) | IL145835A0 (es) |
MX (1) | MXPA01011882A (es) |
NO (1) | NO20015729L (es) |
WO (1) | WO2000071710A2 (es) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1100895B1 (en) | 1999-03-15 | 2007-06-13 | University of British Columbia | Abc1 polypeptide and methods and reagents for modulating cholesterol levels |
CA2417900A1 (en) * | 2000-08-01 | 2002-02-07 | Amgen Inc. | C3b/c4b complement receptor-like molecules and uses thereof |
AT413701B (de) * | 2001-11-06 | 2006-05-15 | Bmt Medizinische Forschung Und | Strukturelle und funktionelle charakterisierung von cdw92 |
JP5618172B2 (ja) | 2007-01-05 | 2014-11-05 | 国立大学法人東京大学 | 抗prg−3抗体を用いる癌の診断および治療 |
AU2008321840B2 (en) | 2007-11-14 | 2014-02-06 | Chugai Seiyaku Kabushiki Kaisha | Diagnosis and treatment of cancer using anti-GPR49 antibody |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998020165A2 (en) * | 1996-11-06 | 1998-05-14 | Whitehead Institute For Biomedical Research | Biallelic markers |
-
2000
- 2000-05-25 WO PCT/FR2000/001426 patent/WO2000071710A2/fr not_active Application Discontinuation
- 2000-05-25 BR BR0010916-9A patent/BR0010916A/pt not_active IP Right Cessation
- 2000-05-25 HU HU0203164A patent/HUP0203164A2/hu unknown
- 2000-05-25 AU AU49318/00A patent/AU4931800A/en not_active Abandoned
- 2000-05-25 JP JP2000620087A patent/JP2003518918A/ja not_active Withdrawn
- 2000-05-25 MX MXPA01011882A patent/MXPA01011882A/es unknown
- 2000-05-25 IL IL14583500A patent/IL145835A0/xx unknown
- 2000-05-25 CA CA002371500A patent/CA2371500A1/fr not_active Abandoned
- 2000-05-25 EP EP00931354A patent/EP1183350A2/fr not_active Withdrawn
- 2000-05-25 KR KR1020017015017A patent/KR20020033627A/ko not_active Application Discontinuation
-
2001
- 2001-11-23 NO NO20015729A patent/NO20015729L/no not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
BR0010916A (pt) | 2002-02-19 |
WO2000071710A3 (fr) | 2001-05-17 |
HUP0203164A2 (hu) | 2002-12-28 |
NO20015729D0 (no) | 2001-11-23 |
NO20015729L (no) | 2002-01-22 |
CA2371500A1 (fr) | 2000-11-30 |
EP1183350A2 (fr) | 2002-03-06 |
JP2003518918A (ja) | 2003-06-17 |
WO2000071710A2 (fr) | 2000-11-30 |
KR20020033627A (ko) | 2002-05-07 |
IL145835A0 (en) | 2002-07-25 |
AU4931800A (en) | 2000-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20020193567A1 (en) | Secreted proteins and polynucleotides encoding them | |
EP0973896A2 (en) | SECRETED EXPRESSED SEQUENCE TAGS (sESTs) | |
US20040034192A1 (en) | Human proteins having hyprophobic domains and dnas encoding these proteins | |
WO2001012659A2 (en) | Human dna sequences | |
EP0973898A2 (en) | SECRETED EXPRESSED SEQUENCE TAGS (sESTs) | |
US20040248256A1 (en) | Secreted proteins and polynucleotides encoding them | |
EP0973899A2 (en) | SECRETED EXPRESSED SEQUENCE TAGS (sESTs) | |
WO1998039448A9 (en) | 186 human secreted proteins | |
WO1995014772A1 (fr) | Signature genique | |
CA2340616A1 (en) | Secreted proteins and polynucleotides encoding them | |
US6573068B1 (en) | Claudin-50 protein | |
KR101621273B1 (ko) | 카텝신 c의 용도 | |
WO1998056804A1 (en) | 86 human secreted proteins | |
KR20220025806A (ko) | 핵산의 무작위 구성 표적화 통합 | |
JP2003156489A (ja) | 痛みに関連する分子の同定及び使用 | |
CN101151371B (zh) | 治疗中的逆转录转座子抑制 | |
JP2001245666A (ja) | 新規ポリペプチド | |
US20030022217A1 (en) | Isolated human secreted proteins, nucleic acid molecules encoding human secreted proteins, and uses thereof | |
WO1999047655A2 (de) | Menschliche nukleinsaeurefragmente, deren expression in brustnormalgewebe erhöht ist | |
MXPA01011882A (es) | Productos de expresion de genes implicados en enfermedades relacionadas con el metabolismo del colesterol. | |
WO2001038523A1 (fr) | Nouveau polypeptide, gene humain 14 lie a la surdite, et polynucleotide codant pour ce polypeptide | |
US20040157258A1 (en) | 101 human secreted proteins | |
US6706869B1 (en) | Map kinase phosphatases and polynucleotides encoding them | |
US20030039968A1 (en) | Isolated human secreted proteins, nucleic acid molecules encoding human secreted proteins, and uses thereof | |
US20030077773A1 (en) | Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof |