MXPA06003120A - Prediccion del resultado del tratamiento de cancer de seno - Google Patents

Prediccion del resultado del tratamiento de cancer de seno

Info

Publication number
MXPA06003120A
MXPA06003120A MXPA/A/2006/003120A MXPA06003120A MXPA06003120A MX PA06003120 A MXPA06003120 A MX PA06003120A MX PA06003120 A MXPA06003120 A MX PA06003120A MX PA06003120 A MXPA06003120 A MX PA06003120A
Authority
MX
Mexico
Prior art keywords
breast cancer
expression
sample
sequences
genes
Prior art date
Application number
MXPA/A/2006/003120A
Other languages
English (en)
Inventor
G Erlander Mark
Ma Xiaojun
C Sgroi Dennis
Enright Edward
Original Assignee
Arcturus Bioscience Inc
Enright Edward
G Erlander Mark
Ma Xiaojun
C Sgroi Dennis
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Arcturus Bioscience Inc, Enright Edward, G Erlander Mark, Ma Xiaojun, C Sgroi Dennis filed Critical Arcturus Bioscience Inc
Publication of MXPA06003120A publication Critical patent/MXPA06003120A/es

Links

Abstract

Se proporcionan métodos y composiciones para la identificación de las señales de expresión en casos de cáncer de seno ER+, en donde las señales se correlacionan con la respuesta, o falta de ella, al tratamiento con tamoxifen u otro agente antiestrógeno contra el cáncer de seno. Los perfiles de las señales se identifican con base en el muestreo de las muestras de tejido de pecho de referencia de casos independientes de cáncer de pecho y proporcionan un juego confiable de criterio molecular para predecir la eficacia de tratar a un sujeto con cáncer de seno con tamoxifen u otro agente antiestrogeno contra el cáncer de seno. Se proporcionan métodos y composiciones adicionales para predecir la respuesta a tamoxifen u otro agente antriestrógeno contra el cáncer de seno en casos de cáncer de seno por medio del uso de múltiples biomarcadores. Dos biomarcadores despliegan expresión incrementada correlacionada con la respuesta a tamoxifen mientras que otros dos biomarcadores despliegan la expresión disminuida correlacionada con la respuesta a tamoxifen.

Description

PREDICCIÓN DEL RESULTADO DEL TRATAMIENTO DE CÁNCER DE SENO Campo de la Invención La invención se relaciona a la identificación y uso de perfiles de expresión de gen, o patrones, con relevancia clínica al tratamiento del cáncer de seno usando tamoxífen • (nolvadex) y otros agentes "antiestrógeno" contra el cáncer de seno, incluyendo otros "moduladores del receptor de estrógeno selectivos" ("SERM"s), "reguladores hacia abajo del receptor de estrógeno selectivos" ("SERD"s) , e inhibidores de aromatasa ("AI"s) . En particular, la invención proporciona las identidades de secuencias de gen, la expresión de las cuales están correlacionadas con la supervivencia del paciente y la recurrencia del cáncer de seno en mujeres tratadas con tamoxifen u otros agentes "antiestrógeno" contra el cáncer de seno. Los perfiles de expresión de gen, ya sea englobados en la expresión de ácido nucleico, expresión de proteina u otros formatos de expresión, pueden ser utilizados para seleccionar sujetos afectados con cáncer de seno quienes probablemente responderán positivamente al tratamiento con tamoxifen u otro agente "antiestrógeno" contra el cáncer de seno asi como aquellos quienes probablemente serán no responsivos y de esta manera candidatos para otros tratamientos. La invención también proporciona las identidades de conjuntos de secuencia de múltiples genes con patrones de expresión que son fuertemente predictivas de la respuesta a tamoxifen y otros agentes "antiestrógeno" contra el cáncer de seno. Antecedentes de la Invención El cáncer de seno es con gran diferencia el cáncer más común entre las mujeres. Cada año, más de 180,000 y 1 millón de mujeres en los Estados Unidos y mundialmente, de manera respectiva, se diagnostican- con cáncer de seno. El cáncer de seno es la causa principal de muerte para mujeres entre edades de 50-55, y es la malignidad no prevenible más común en mujeres en el Hemisferio Occidental, ün estimado de 2,167,000 mujeres en los Estados Unidos están actualmente viviendo con la enfermedad (National Cáncer Institute, Surveillance Epidemiology and End Results (NCI SEER) programa, Cáncer Statistics Review (CSR) , www. seer . ims . ci .nih .gov/Publicat.ions/CSRl973 (1998)). Basado en las tasas de cáncer desde 1995 hasta 1997, un reporte del Instituto Nacional del Cáncer (NCI) estima que aproximadamente 1 en 8 mujeres en los Estados Unidos (aproximadamente 12.8 por ciento) desarrollarán cáncer de seno durante su tiempo de vida (NCTs Surveillance, Epidemiology, and End Results Program (SEER) publication SEER Cáncer Statistics Review 1973-1997) . El cáncer de seno es la segunda forma más común de cáncer, después del cáncer de piel, entre las mujeres en los Estados Unidos. Un estimado de 250,100 nuevos casos de cáncer de seno se esperan que sean diagnosticados en los Estados Unidos en el 2001. De estos, 192,200 nuevos casos de cáncer de seno más avanzados (invasivo) se esperan que ocurran entre mujeres (un incremento de 5% sobre el último año), 46,400 nuevos casos de cáncer de seno de etapa temprana (in situ) se esperan que ocurran entre mujeres (arriba de 9% desde el último año) , y aproximadamente 1,500 nuevos casos de cáncer de seno se esperan que sean diagnosticados en hombres (Cáncer Facts & Figures 2001 American Cáncer Society). Un estimado de 40,600 muertes (40,300 mujeres, 400 hombres) de cáncer de seno se esperan en el 2001. El cáncer de seno se clasifica segundo solamente al cáncer de pulmón entre las causas de muerte de cáncer en mujeres. Casi 86% de mujeres quienes son diagnosticadas con cáncer de seno son probables que todavia estén con vida cinco años después, aunque 24% de estas morirán de cáncer de seno después de 10 años, y casi la mitad (47%) morirá de cáncer de seno después de 20 años. Cada mujer está en riesgo para el cáncer de seno. Arriba de 70 por ciento de cáncer de seno ocurren en mujeres quienes no tienen factores de riesgo identificables diferentes a la edad (U.S. General Acounting Office. Breast Cáncer, 1971-1991: Prevention, Treatment and Reserach. GAO/PEMD-92-12: 1991). Solamente 5 a 10% de cáncer de seno están enlazados con una historia familiar del cáncer de seno (Henderson IC, Breast Cáncer, In: Murphy GP, La rence WL, Lenhard RE (eds) . Clinical Oncology. Atlanta, GA: American Cáncer Society; 1995:198-219). Cada seno tiene 15 a 20 secciones llamadas lóbulos. Dentro de cada lóbulo están muchos lobulillos más pequeños. Los lóbulos terminan en docenas de bulbos delgados que pueden producir leche. Los lóbulos, lobulillos y bulbos están todos enlazados por tubos delgados llamados conductos. Estos conductos conducen al pezón en el centro de un área oscura de la piel llamada la areola. La grasa circunda los lóbulos y conductos. No hay músculos en el seno, pero los músculos se encuentran debajo de cada seno y cubren las costillas. Cada seno también contiene vasos sanguíneos y vasos linfáticos. Los vasos linfáticos llevan el fluido incoloro llamado linfa y conducen a los ganglios linfáticos. Agrupaciones de ganglios linfáticos se encuentran cerca del pecho en la axila (bajo el brazo) arriba de la clavícula y en el pecho. Los tumores de seno pueden ser ya sean benignos o malignos. Los tumores benignos no son cancerosos, ellos no se difunden a otras partes del cuerpo y no son una amenaza para la vida. Ellos usualmente pueden ser removidos, y en la mayoria de los casos, no regresan. Los tumores malignos son cancerosos, y pueden invadir y dañar los tejidos y órganos cercanos . Las • células de tumor maligno pueden extenderse por metástasis, entrando a la corriente sanguínea o sistema linfático. Cuando las células de cáncer de seno se extienden por metástasis fuera del seno, ellas frecuentemente se encuentran en los ganglios linfáticos bajo el brazo (ganglios linfáticos axilares) . Si el cáncer ha alcanzado estos ganglios, esto significa que las células de cáncer pueden haberse difundido a otros ganglios linfáticos u otros órganos, tales como huesos, hígado o pulmones. La investigación principal e intensiva se ha enfocado sobre la detección temprana, tratamiento y prevención. Esto ha incluido un énfasis en determinar la presencia de células epiteliales ductales precancerosas o cancerosas. Estas células se analizan, por ejemplo, para la morfología celular, por marcadores de proteina, por marcadores de ácido nucleico, por anormalidades cromosómicas, por marcadores bioquímicos y por otros cambios característicos que señalarían la presencia de células cancerosas o precancerosas . Esto ha conducido a varias alteraciones moleculares que se han reportado en el cáncer de seno, pocas de las cuales han sido bien caracterizadas en especímenes de seno clínicos humanos. Las alteraciones moleculares incluyen la presencia/ausencia de receptores esteroides de estrógeno y progesterona, expresión/amplificación de HER-2 (Mark HF, y colaboradores, HER-2/neu gene amplification in stages I-IV breast cáncer detected by fluorescent in situ hibridization. Genet Med; (3): 98-103 1999), Ki-67 (un antígeno que está presente en todas las etapas del ciclo celular excepto GO y utilizado como un marcador para la proliferación de células de tumor, y marcadores de pronóstico (incluyendo oncogenes, genes supresores de tumor y marcadores de angiogénesis) similares a p53, p27, Catepsina D, pS2, gen de resistencia a multifármaco (MDR) y CD31. El tamoxifen es el agente antiestrógeno más frecuentemente prescrito en mujeres con cáncer de seno tanto de etapa temprana como positivo de receptor de hormona metastática (para revisiones, ver Clarke, R. y colaboradores, "Antiestrogen resistance in breast cáncer and the role of estrogen receptor signaling". Ocogene 22, 7316-39 (2003) y Jordán, C. "Historical perspective on hormonal therapy of advanced breast Cáncer". Clin. Ther. 24 Suppl A, A3-16 (2002)). En el conjunto adyuvante, la terapia de tamoxifen da por resultado una reducción del 40-50% en el riesgo anual de recurrencia, conduciendo a una mejora de 5.6% en la supervivencia de 10 años en pacientes negativos en el ganglio linfático, y una mejora del 10.9% correspondiente en los pacientes de ganglio positivo (Group, E.B.C.T.C. Tamoxifen for early breast cáncer. Cochrane Datábase Syst. Rev, CD000486 (2001) ) . El tamoxifen se piensa que actúa principalmente como un inhibidor competitivo del enlace de estrógeno al receptor de estrógeno (ER) . Los niveles absolutos de expresión de ER, así como aquel del receptor de progesterona (PR, un indicador de una ruta de ER funcional) son actualmente los mejores predictores de la respuesta de tamoxifen en el experimento clínico (Group, (2001) and Bardou, V.J. y colaboradores, "Progesterone receptor status significantly improves outcome prediction over estrogen receptor status alone for' adjuvant endocrine therapy in two large breast cáncer databases" J Clin Oncol 21, 1973-9 (2003)). Sin embargo,. 25% de tumores de ER+/PR+, 66% de casos de ER+/PR- y 55% de casos de ER-/PR+ no logran responder, o desarrollan resistencia temprana al tamoxifen, a través de mecanismos que permanecen grandemente inciertos (ver Clarke y colaboradores; Nicholson, R.I. y colaboradores, "The biology of • antihormone failure in breast cáncer" Breast Cáncer Res Treta 80 Suppl 1, S29-34; discussion S35 (2003) y Osborne, C.K. y colaboradores, "Growth factor receptor cross-talk with estrogen receptor as a mechanism for tamoxifen resista'nce in breast cáncer". Breast 12, 362-7 (2003)). Actualmente, no existen medios confiables para permitir la identificación de estos no respondedores. En estos pacientes, el uso de terapias hormonales alternativas, tal como los inhibidores de aromatasa letrozol y anastrozol (Ellis, M.J. y colaboradores, "Letrozole is more effective neoadjuvant endocrine therapy than tamosifen for ErbB-1 y/o ErbB-2-positive, estrogen receptorpositive primary breast cáncer: evidence from a phase III randomized trial" J. Clin Oncol 19, 3808-16 (2001); Buzdar, A.U. "Anastrozole: a new addition to the armamentarium against advanced breast cáncer". Am J. Clin Oncol 21, 161-6 (1998); y Goss, P.E. y colaboradores, "A randomized trial of letrozole in postmenopausal women after five years of tamoxifen therapy for early-stage breast cáncer". N Engl J Med 349, 1793-802 (2003)); agentes quimioterapéuticos, o inhibidores de otras rutas de señalización, tales como trastuzmab y gefitinib podrían ofrecer la posibilidad de mejorar el resultado clínico. Por lo tanto, la habilidad para predecir precisamente el resultado del tratamiento con tamoxifen debe adelantar significativamente el manejo del cáncer de seno de etapa temprana al identificar pacientes quienes no son probables de beneficiarse del TAM de modo que puedan ser buscadas terapias adicionales o alternativas. La cita de documentos en la presente no se propone como una admisión de que cualquiera es la técnica previa pertinente. Todas las declaraciones en cuanto a la fecha o representación en cuanto a los contenidos de los documentos están basadas en la información disponible para el solicitante y no constituyen ninguna admisión en cuanto a lo correcto de las fechas o contenidos de los documentos . Breve Descripción de la Invención La presente invención se relaciona a la identificación y uso de patrones de expresión de gen (o perfiles o "señales") y los niveles de expresión de secuencias de gen individuales que son clinicamente relevantes al cáncer de seno. En particular, se proporcionan las identidades de genes que están correlacionadas con la supervivencia del paciente y la recurrencia del cáncer de seno (por ejemplo metástasis del cáncer de seno) . Los perfiles de expresión de gen, ya sea englobados en la expresión de ácido nucleico, expresión de proteina u otros formatos de expresión, se pueden utilizar para predecir la supervivencia de sujetos afectados con cáncer de seno y la probabilidad de la recurrencia del cáncer de seno, incluyendo la metástasis del cáncer. La invención de esta manera proporciona la identificación y el uso de patrones de expresión de gen (o perfiles o "señales") y los niveles de expresión de secuencias de gen individuales que se correlacionan con (y de esta manera son capaces de discriminar entre) pacientes con buenos o pobres resultados de supervivencia. En una modalidad, la invención proporciona patrones que son capaces de distinguir pacientes con tumores de seno de receptor de estrógeno (isoforma a) positivo en aquellos que son responsivos, o probablemente que son responsivos, al tratamiento con tamoxifen (TAM) u otro agente "antiestrógeno" contra el cáncer de seno (tal como un "modulador de receptor de estrógeno selectivo" ("SERM") , "regulador hacia abajo del receptor de estrógeno selectivo" ("SERD") , o inhibidor de aromatasa ("AI) ) y aquellos que no son responsivos, o probablemente que no son responsivos a tal tratamiento. En una modalidad alternativa, la invención puede ser aplicada a pacientes con tumores de seno que no exhiben niveles detectables de expresión de ER (llamados sujetos "ER") pero donde el paciente no obstante se beneficiará de la aplicación de la invención debido a la presencia de algún bajo nivel de expresión de ER. La respuesta puede ser visualizada en términos de mejores resultados de supervivencia a través del tiempo. Estos patrones de esta manera son capaces de distinguir pacientes con tumores de seno ER+ en por lo menos dos subtipos. En un primer aspecto, la presente invención proporciona un medio no subjetivo para la identificación de pacientes con cáncer de seno (ER+ o ER-) como probables de tener un resultado de supervivencia bueno o pobre después del tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno al analizar los patrones de expresión divulgados en la presente. Así donde la interpretación subjetiva puede haber sido utilizada previamente para determinar la prognosis y/o el tratamiento de pacientes de cáncer de seno, la presente invención proporciona patrones de expresión de gen objetivos, que pueden ser utilizados solos o en combinación con criterios subjetivos para proporcionar una estimación más precisa de los resultados del paciente de cáncer de seno ER+ o ER- o resultados esperados, incluyendo la supervivencia y la recurrencia del cáncer, después del tratamiento con TAM u otro agente "antiéstrógeno" contra el cáncer de seno. Los patrones de expresión de la invención de esta manera proporcionan un medio para determinar la prognosis del cáncer de seno ER+ o ER-. Además, los patrones de expresión también pueden ser utilizados como un medio para analizar tumores de ganglio negativo, pequeños que no son fácilmente analizados por otros medios. Los patrones de expresión de gen comprenden uno o más de un gen capaz de discriminar entre los resultados del cáncer de seno con precisión significante. La(s) secuencia (s) de gen se identifican como correlacionadas con los resultados del cáncer de seno ER+ tal que los niveles de su expresión son relevantes a una determinación de los protocolos de tratamiento preferidos para un paciente, ya sea ER+ o ER-. Asi, en una modalidad, la invención proporciona un método para determinar el resultado de un sujeto afectado con cáncer de seno al analizar una muestra que contiene células del sujeto para la expresión de uno o más de un gen divulgado en la presente como correlacionado con los resultados de cáncer de seno después del tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno.
La* habilidad para correlacionar la expresión de gen con el resultado del cáncer de seno y la respuesta a TAM es particularmente ventajosa en vista de la posibilidad de que hasta 40% de sujetos ER+ que se someten al tratamiento de TAM no son respondedores. Por lo tanto, la habilidad para identificar, con confidencia, estos no respondedores en un punto de tiempo temprano permite la consideración y/o aplicación -de terapias alternativas (tal como un agente "antiestrógeno" diferente contra el cáncer de seno u otros tratamientos anti-cáncer de seno) a los no respondedores. Estabilizados diferentemente, la habilidad para identificar sujetos no respondedores a TAM permiten al personal médico considerar y/o utilizar terapias alternativas para el tratamiento de los sujetos antes de que el tiempo sea consumido sobre la terapia de TAM inefectiva. El tiempo consumido en una terapia inefectiva, frecuentemente permite el crecimiento de cáncer adicional, y la probabilidad de éxito con terapias alternativas disminuye a través del tiempo dado tal crecimiento. Por lo tanto, la invención también proporciona métodos para mejorar el resultado de supervivencia de los no respondedores mediante el uso de los métodos divulgados en la presente para identificar no respondedores para el tratamiento con terapias alternativas. Los patrones de expresión de gen de la invención se identifican como es descrito enseguida. Generalmente, un muestreo grande del perfil de. expresión de gen de una muestra se obtiene a través de la cuantificación de los niveles de expresión de mRNA correspondientes a muchos genes . Este perfil luego ' se analiza para identificar genes, la expresión de los cuales son positivamente o negativamente, correlacionados con el resultado del cáncer de seno ER+ en el tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno. Un perfil de expresión de un subconjunto de genes humanos luego puede ser identificado mediante los métodos de la presente invención, como correlacionado con un resultado particular. El uso de múltiples muestras incrementa la confidencia de que un gen se puede creer que sea correlacionado con un resultado de supervivencia particular. Sin confidencia suficiente, permanece impredecible si la expresión de un gen particular es realmente correlacionada con un resultado y también impredecible si la expresión de un gen particular puede ser utilizado exitosamente para identificar el resultado para un paciente de cáncer de seno. Mientras que la invención puede ser practicada en base a las identidades de las secuencias de gen divulgadas en la presente o en las secuencias reales utilizadas, independiente de la identificación, la invención también puede ser practicada con cualquiera de otras secuencias, la expresión de las cuales está correlacionada con la expresión de secuencias divulgadas en la presente. Tales secuencias adicionales pueden ser identificadas por cualquier medio conocido en la técnica, incluyendo los métodos divulgados en la presente. Un perfil de genes que están altamente correlacionados con un resultado relativo a otro puede ser utilizado para analizar una muestra de un sujeto afectado con cáncer de seno para predecir la respuesta probable (o falta de la misma) a TAM u otro agente "antiestrógeno" contra el cáncer de seno en el sujeto de quien se obtuvo la muestra. Tal ensayo puede ser utilizado como parte de un método para determinar el tratamiento terapéutico del sujeto con base en el resultado del cáncer de seno identificado. Como es discutido enseguida, los genes correlacionados pueden ser utilizados individualmente con precisión significante o en combinación para incrementar la habilidad para correlacionar precisamente un fenotipo de expresión molecular con un resultado de cáncer de seno. Esta correlación es una manera para proporcionar molecularmente la determinación de los resultados de supervivencia como es divulgado en la presente. Usos adicionales de (los) gen (es) correlacionados están en la clasificación de células y tejidos; la determinación de diagnóstico y/o prognosis y la determinación y/o alteración de la terapia. La habilidad para discriminar está conferida por la identificación de la expresión de los genes individuales como relevantes y no por la forma del ensayo utilizado para determinar el nivel real de expresión. Un ensayo puede utilizar cualquier aspecto de identificación de un gen individual identificado como es divulgado en la presente mientras que el ensayo refleje, cuantitativamente o cualitativamente, la expresión del gen en el "transcriptoma" (la fracción transcrita de genes en un genoma) o el "proteoma" en la fracción traducida de genes expresados en un genoma. Ensayos adicionales incluyen aquellos basados en la detección de fragmentos de polipéptido del miembro o miembros relevantes de proteoma. La identificación de características incluyen, pero no están limitadas a, secuencias de ácido nucleico únicas utilizadas para codificar (DNA) , o expresar (RNA) , el gen o epitopes específicos a, o actividades de, una proteína codificada por el gen. Todo lo que se requiere son la(s) secuencia (s) de gen necesarias para discriminar entre los resultados del cáncer de seno y una muestra que contiene células apropiadas para el uso en un ensayo de expresión. En otra modalidad, la invención proporciona la identificación de los patrones de expresión de gen al analizar la expresión de gen global, o casi global, de células individuales o poblaciones de células homogéneas que se han disectado o de otra manera aislado o purificado de, células contaminantes más allá de lo que es posible mediante una biopsia simple. Debido a que la expresión de numerosos genes fluctúan entre las células de diferentes pacientes asi como las células de la misma muestra de paciente, múltiples datos de la expresión de genes individuales y patrones de expresión de gen se utilizan como datos de referencia para generar modelos que a su vez permite la identificación de gen(s) individual (es) , la expresión de los cuales están más altamente correlacionadas con los resultados del cáncer de seno particulares. En modalidades adicionales, la invención proporciona medios físicos y metodológicos para detectar la expresión del (los) gen (es) identificados por los modelos generados por los patrones de expresión individuales. Estos medios pueden ser dirigidos para analizar uno o más aspectos de la(s) plantilla (s) de DNA que implica la expresión del (los) gen (es) del RNA utilizado como un intermediario para expresar el (los) gen (es) o del producto proteináceo expresado por el (los) gen(es). En modalidades adicionales, el (los) gen (es) identificado por un modelo como capaz de discriminar entre los resultados del cáncer de seno pueden ser utilizados para identificar el estado celular de una muestra no conocida de célula (s) del seno. De preferencia, la muestra se aisla por medios no invasivos. La expresión del (los) gen (es) en la muestra no conocida se puede determinar y comparar con la expresión del (los) gen (es) en datos de referencia de patrones de expresión de gen correlacionados con los resultados del cáncer de seno. Opcionalmente, la comparación a muestras de referencia puede ser mediante la comparación a (los) modelo (s) construidos basados en las muestras de referencia. Una ventaja proporcionada por la presente invención es que las células no de seno contaminantes (tales como linfocitos infiltración u otras células del sistema inmune) no están presentes para posiblemente afectar los genes identificados o el análisis subsecuente de la expresión de gen para identificar los resultados de supervivencia de los pacientes con cáncer de seno. Tal contaminación está presente donde se utiliza una biopsia para generar perfiles de expresión de gen. Sin embargo, y como es mencionado en la presente, la invención incluye la identidad de genes que pueden ser utilizados con precisión significante aun en la presencia de células contaminantes. En un segundo aspecto, la invención proporciona un medio no subjetivo basado en la expresión de múltiples genes, o combinaciones de los mismos, para la identificación de pacientes con cáncer de seno como probables de tener un resultado de supervivencia bueno o pobre después del tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno. Estos genes son miembros de los patrones de expresión divulgados en la presente que se han encontrado que son fuertemente predictivos del resultado clínico después del tratamiento con TAM del cáncer de seno ER+. La presente invención de esta manera proporciona secuencias de gen identificadas como diferencialmente expresadas en el cáncer de seno ER+ en correlación a la respuesta al TAM. Las secuencias de dos genes exhiben expresión incrementada en células ER+ que responden al tratamiento a TAM (y de esta manera la falta de expresión incrementada en casos no responsivos) . Las secuencias de dos de otros genes exhiben expresión disminuida en células de seno de ER+ que responden al tratamiento TAM (y de esta manera la falta de expresión disminuida en casos no responsivos) . El primer conjunto de secuencias encontradas que son más altamente expresadas en células de seno ER+ responsivas a TAM son aquellas de receptor B de interieucina 17 (IL17RB) , que se ha apeado al cromosoma 3 humano en 3p21.1. IL17RB también es referido como receptor de interieucina 17B (IL17BR) y las secuencias correspondientes a este, y de esta manera se puede utilizar en la práctica de la presente invención, son identificados por UniGene Cluster Hs.5470. El segundo conjunto de secuencias encontradas que son más altamente expresadas en las células de seno ER+, responsivas a TAM son aquellas de una región transcrita recientemente identificada dé colina deshidrogenasa (CHDH) , que se ha mapeado al cromosoma 3 humano en 3p21.1. Este está cerca de la localización mapeada' para la subunidad alfa ID, tipo L dependiente de calcio, de canal de calcio (CACNA1D) en 3pl4.3. La invención está basada en parte en el descubrimiento inesperado de un error en las bases de datos públicas que identificaron la secuencia de AI240933 como correspondiente a una parte transcrita de CACNA1D (en Hs.3999666). Como es detallado enseguida, las regiones transcritas de CHDH y CACNAlD están convergentemente orientadas tal que la transcripción procede de las regiones regulatorias de cada una hacia la región regulatoria de la otra. Mencionado diferentemente, ellas están transcritas convergentemente de las hebras complementarias en la misma región del cromosoma 3. Por lo tanto, la invención incluye la identificación de AI240933 que está en la orientación incorrecta con respecto a la transcripción CACNA1D pero en la orientación correcta como la transcripción CHDH y como es localizada en el extremo 3' de la transcripción CHDH. Sin que sea relacionado por la teoría, y ofrecida para mejorar el entendimiento de la invención, se cree que la secuencia de AI240933 es una parte del extremo 3' del transcripto CHDH. Este es posiblemente parte de la región no traducida 3' (UTR) de CHDH. La invención puede ser practicada con secuencias correspondientes a CHDH así como aquellas identificadas por Hs.126688. El primer conjunto de secuencias encontradas que son expresadas en niveles inferiores en células de seno ER+, responsivas a TAM son aquellas de homeobox B13 (HOXB13) que se han mapeado al cromosoma 17 humano en 17q21.2. Las secuencias correspondientes a HOXB13, y de esta manera pueden ser utilizadas en la práctica de la presente invención, son identificadas por UniGene Cluster Hs.66731. El segundo conjunto de secuencias encontradas que son expresadas a niveles inferiores en células de seno ER+, responsivas a TAM son aquellas de quinolinato fosforibosiltransferasa (QPRT, también . conocida como nicotinato-nucleótido pirofosforilasa, carboxilante) , que se ha mapeado al cromosoma 16 humano en 16pl2.1. Las secuencias correspondientes a QPRT que pueden ser utilizados en la práctica de la presente invención, son identificadas por UniGene Cluster Hs.335116. Mientras que la invención puede ser practicada con base en las identidades de estas secuencias de gen o las secuencias reales utilizadas independientes de la identidad asignada, la invención también puede ser practicada con cualquier otra secuencia, la expresión de la cual está correlacionada con la expresión de estas secuencias divulgadas. Tales secuencias adicionales pueden ser identificadas por cualquier medio conocido en la técnica, incluyendo los métodos divulgados en la presente. Las secuencias identificadas de esta manera pueden ser utilizadas en métodos para determinar la respuesta, o no respuesta, de un cáncer de seno ER+ o ER- del sujeto a tratamiento a TAM, o el tratamiento con otro agente "antiestrógeno" contra el cáncer de seno, por la vía del análisis de células de seno en un tejido o muestra que contiene células de un sujeto. Como ejemplos no limitativos, la falta de expresión incrementada de las secuencias IL17BR y/o CHDH y la falta de expresión disminuida de las secuencias H0XB13 y/o QPRT, puede ser utilizada como un indicador de casos no responsivos. La presente invención proporciona un medio no empírico para determinar la respuesta a ATM u otros SERM en pacientes ER+ o ER-. Esto proporciona ventajas sobre el uso de un procedimiento de "espera y observación" después del tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno. Los niveles de expresión de estas secuencias también pueden ser utilizados como un medio para analizar tumores de ganglio negativo, pequeños que no son fácilmente estimados por medios convencionales . Los niveles de expresión de las secuencias identificadas pueden ser utilizados solos o en combinación con otras secuencias capaz de determinar la respuesta al tratamiento con TAM u otro agente "antiestrógeno" contra al cáncer de seno. De preferencia, las secuencias de la invención se utilizan solas o en combinación entre sí, tal como en el formato de una relación de niveles de expresión que pueden tener poder predictivo mejorado sobre el análisis basado en la expresión de secuencias correspondientes a genes individuales. La invención proporciona relaciones del nivel de expresión de una secuencia que está subexpresada al nivel de expresión de una secuencia que es sobreexpresada como un indicador de respuesta o de no respuesta. Por ejemplo, las relaciones de H0XB13 o QPTR con relación a IL17BR o CHDH pueden ser utilizadas. Por supuesto las relaciones de ya sea IL17BR o CHDH con relación a ya sea HOXB13 o QPTR también pueden ser utilizadas. La presente invención proporciona un medio para correlacionar un fenotipo de expresión molecular o una respuesta biológica en un sujeto con cáncer de seno ER+ o ER-. Esta correlación proporciona una manera para diagnosticar molecularmente y determinar el tratamiento para un sujeto afectado con cáncer de seno. Los usos adicionales de la secuencias está en la clasificación de células y tejidos; y la determinación del diagnóstico y/o prognosis. El uso de las secuencias para identificar células de una muestra como responsivas, o no responsivas al tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno se puede utilizar para determinar la elección, o alteración, de terapia utilizada para tratar tales células en el sujeto, asi como el sujeto mismo, del cual se originó la muestra. Tales métodos de la invención se pueden utilizar para ayudar a la determinación de proporcionar tamoxifen u otro agente "antiestrógeno" contra el cáncer de seno como un agente quimiopreventivo o quimioprotector a un sujeto en alto riesgo para el desarrollo de cáncer de seno. Estos métodos de la invención son un avance sobre los estudios de Fabián y colaboradores, (J Nati Cáncer Inst. 92 (15) : 1217-27, 2000) , que propuso una combinación de citomorfologia y el modelo de riesgo Gail para identificar pacientes de alto riesgo. Los métodos se pueden utilizar en combinación con estimaciones de riesgo relativo de cáncer de seno tales como aquellos discutidos por Tan-Chiu y colaboradores, (J Nati Cáncer Inst. 95 (4) :32-307, 2003). Ejemplos no limitativos incluyen el análisis del muestreo mínimamente invasivo, tal como aspirados de aguja fina (periareolar) aleatorios o muestras de lavado ductal (tales como aquellos descritos por Fabián y colaboradores, y opcionalmente en combinación con o como una adición a un mamograma positivo para el cáncer de seno benigno o maligno) de células de seno para los niveles de expresión de secuencias de gen como es divulgado en la presente para ayudar a la determinación de la terapia de administración con un agente "antiestrógeno" contra el cáncer de seno, tal como aquel que puede ocurrir en caso de sujetos de alto riesgo (similar a aquel descrito por Tan-Chiu y colaboradores) . Los ensayos de esta manera conducirían a la identificación de sujetos para quienes la aplicación de un agente "antiestrógeno" contra el cáncer de seno probablemente seria benéfico como un agente quimiopreventivo o quimioprotector. Se contempla que tal aplicación, es permitida por la presente invención podria conducir a efectos benéficos tales como aquellos observados con la administración de tamoxifen (ver por ejemplo, Wickerham D.L., Breast Cáncer Res. and Treatment 75 Suppl 1.S7-12, Discusión S33-5, 2000) . Otras aplicaciones de la invención incluyen el análisis de cáncer de seno avanzado, incluyendo el cáncer metastático, para determinar la respuesta, o no respuesta del mismo al tratamiento con un agente "antiestrógeno" contra cáncer de seno. Un ensayo de la invención puede utilizar un medio relacionado con el nivel de expresión de las secuencias divulgadas en la presente mientras que el ensayo refleje, cuantitativamente o cualitativamente, la expresión de la secuencia. De preferencia, sin embargo, se prefiere un medio de ensayo cuantitativo. La habilidad para determinar la respuesta a TAM u otro agente "antiestrógeno" contra el cáncer de seno y de esta manera el resultado del tratamiento con el mismo, se proporcionan por el reconocimiento de la relevancia del nivel de expresión de las secuencias identificadas y no por la forma del ensayo usado para determinar el nivel real de expresión. Las características de identificación para las secuencias incluyen, pero no están limitadas a, secuencias de ácido nucleico únicas utilizadas para codificar (DNA) , o expresadas (RNA) , las secuencias divulgadas o epitopes específicos a, o actividades de, las proteínas codificadas por las secuencias. Los medios alternativos incluyen la detección de la amplificación de ácido nucleico como indicativo de los niveles de expresión incrementados y la inactivación, supresión o metilación del ácido nucleico, como indicativo de niveles de expresión disminuidos. Mencionado diferentemente, la invención puede ser practicada al analizar uno o más aspectos de la(s) plantilla (s) de DNA que implica (n) la expresión de la(s) secuencia (s) divulgada (s) del RNA utilizado como un intermediario para expresar la(s) secuencia (s) , o del producto proteináceo expresado por la secuencia (s) , asi como fragmentos proteoliticos de tales productos. Como tal, la detección de la presencia de, cantidad de, estabilidad de, o degradación (incluyendo proporción) de, tal DNA, RNA y moléculas proteináceas se puede utilizar en la práctica de la invención. La práctica de la presente invención no es afectada por la presencia de desigualaciones menores entre las secuencias divulgadas y aquellas expresadas por las células de una muestra del sujeto. Un ejemplo no limitativo de la existencia de tales desigualaciones se observan en casos de polimorfismos de secuencia entre individuos de una especie, tal como pacientes humanos individuales dentro de Homo sapiens . El conocimiento de que la expresión de las secuencias divulgadas (y secuencias que varian debido a desigualaciones menores) está correlacionada con la presencia de células de seno no normales o anormales y el cáncer de seno es suficiente para la práctica de la invención con una muestra que contiene células apropiada por la via de un ensayo para la expresión. En una modalidad, la invención proporciona la identificación de los niveles de expresión de las secuencias divulgadas mediante el análisis de su expresión en una muestra que contiene células de seno ER+ o ER- . En una modalidad preferida, la muestra contiene células individuales o poblaciones de células homogéneas que se han disertado, o de otra manera aislado o purificado de, células contaminantes más allá de lo que es posible por una biopsia simple. Alternativamente, las células no disectadas dentro de una "sección" de tejido pueden ser utilizadas. Múltiples medios para tales análisis están disponibles, incluyendo la detección de expresión dentro de un ensayo para la expresión de gen global, o casi global, en una muestra (por ejemplo, como una parte de un análisis de perfilamiento de expresión de gen tal como sobre un microarreglo) o mediante la detección especifica, tal como la PCR cuantitativa (Q-PCR) , o la PCR cuantitativa de tiempo real. De preferencia, la muestra se aisla por la via de medios no invasivos o mínimamente invasivos. La expresión de la(s) secuencia (s) divulgada (s) en la muestra se puede (n) determinar y comparar la expresión de la(s) secuencia (s) en datos de referencia de células de seno no normales o cancerosas. Alternativamente, el nivel de expresión puede ser comparado a los niveles de expresión en células normales o no cancerosas de preferencia de la misma muestra o sujeto. En modalidades de la invención utilizando la Q-PCR, el nivel de expresión puede ser comparado con los niveles de expresión de genes de referencia en la misma muestra o se puede utilizar una relación de niveles de expresión. Cuando células de seno individuales se aislas en la práctica de la invención, un beneficio es que las células no de seno, no contaminantes (tales como linfocitos infiltrantes u otras células del sistema inmune (no están presentes para afectar posiblemente la detección de la expresión de la(s) secuencia (s) divulgada (s) . Tal contaminación está presente donde se utiliza una biopsia para generar perfiles de expresión de gen. Sin embargo, el análisis de la expresión de gen diferencial y la correlación a los resultados del cáncer de seno ER+ con muestras tanto aisladas como no aisladas, como es descrito en la presente, incrementa el nivel de confidencia de las secuencias divulgadas como capaz de tener poder predictivo significante con cualquier tipo de muestra. Mientras que la presente invención se describe principalmente en el contexto de cáncer de seno humano, esta puede ser practicada en el contexto de cáncer de seno de cualquier animal conocido que es potencialmente afectado por el cáncer de seno. Los animales preferidos para la aplicación de la presente invención son mamíferos, particularmente aquellos importantes para aplicaciones de agricultura (tales como, pero no limitados a, ganado vacuno, ovejas, caballos y otros "animales de granja"), modelos de animales de cáncer de seno, y animales para compañía humana (tal como, pero no limitados a, perros y gatos) . Los aspectos y modalidades anteriores de la invención se pueden aplicar igualmente con respecto al uso de más de un agente "antiestrógeno" contra el cáncer de seno. En el caso de una combinación de agentes, cualquier combinación de más de un SERM, SERD o AI se puede utilizar en lugar de TAM u otro agente "antiestrógeno" contra el cáncer de seno. La aromatasa es una enzima que proporciona una mayor fuente de estrógeno en los tejidos corporales incluyendo el seno, hígado, músculo y grasa. Sin que sea relacionado por la teoria, y solamente proporcionado para ayudar a un mejor entendimiento de la invención, los Ais se entienden que funcionan de una manera comparable a TAM y otros agentes "antiestrógeno" contra el cáncer de seno, que se cree que actúan como antagonistas del receptor de estrógeno en tejidos de seno y así como contra cáncer de seno. Ais pueden ser agentes no esteroidales o esteroidales. Ejemplos de los primeros, que inhiben la aromatasa por la via del grupo protésico (heme) incluyen, pero no están limitados a anastrozol (arimidex) , letrozol (femara) y vorozol (rivisor) , que se han utilizado o contemplado como tratamientos para el cáncer de seno metastático. Ejemplos de Ais esteroidales, que inactivan la aromatasa, incluyen, pero no están limitados a, exemestano (aromasin) , androstenediona y formestano (lentaron) . Otras formas de terapia para reducir los niveles de estrógeno incluyen la ablación ovárica quirúrgica o química. La primera es la remoción fisica de los ovarios mientras que la segunda es el uso de agentes que bloquean la producción ovárica de estrógeno. Un ejemplo no limitativo de la segunda son agonistas de la hormona de liberación de gonadotropina (GnRH) , tal como goserelin (zoladex) . Por supuesto la presente invención también puede ser practicada con estas terapias en lugar del tratamiento con uno o más agentes "antiestrógeno" contra el cáncer de seno. La invención divulgada en la presente está basada en parte en el desempeño de un análisis de microarreglo de amplio genoma de tumores de seno invasivos positivos del receptor de hormona de 60 pacientes tratados con el adyuvante tamoxifen solo, que conduce a la identificación de una relación de expresión de dos genes que es altamente predictiva del resultado clínico. Esta relación de expresión, que es fácilmente adaptada al análisis basado en PCR de especímenes clínicos incrustados en parafina estándares, fue validada en un conjunto independiente de 20 pacientes como es descrito enseguida. Breve Descripción de los Dibujos La Figura 1 muestra los análisis característicos de operación de receptor (ROC) de los niveles de expresión de IL17BR, HOXB13 y CACNA1D como predictores de los resultados del cáncer de seno en secciones de tejido completo (3 gráficas superiores) y células microdisectadas con láser (3 gráficas del fondo) . AUC se refiere al área bajo la curva. La Figura 2 contiene seis partes relacionadas con la validación de una relación de expresión de HOXB13 a la expresión IL17BR como un indicador de respuesta, o falta de la misma, a TAM. Las Partes a y b muestran los resultados o análisis de expresión de gen de las secuencias HOXB13 e IL17BR mediante Q-PCR en muestras tanto Respondedoras como No Respondedoras. Las gráficas de los conjuntos de datos de entrenamiento y validación respondedores y no respondedores, se muestra en las Partes c y d, donde "0" indica los puntos de datos del Respondedor en ambos y "1" indica los puntos de datos del No Respondedor en ambos . Las Partes e y f muestran gráficas de los conjuntos de datos de entrenamiento y validación del Respondedor y No Respondedor como una función de la supervivencia, donde la linea superior en cada parte representa los Respondedores y la línea inferior representa los No Respondedores. La Figura 3 muestra una representación esquemática de la región 3' conocida de la secuencia de gen de CHDH en combinación con las secuencias traducidas 3' de CHDH adicionales identificadas por la presente invención. La Figura 4 muestra los resultados de una reacción de amplificación de PCR en donde un amplicón consistente con aquel esperado de la representación esquemática de la Figura 1 es producido. Los cebadores de PCR utilizados fueron como sigue: cebadores de CHDH delantero: 5'-AAAGTCTTGGGAA?TGAGACAAGT-3' ; cebadores traseros 83R: 5'-AGCTGTCATTTGCCAGTGAGA-3' y 81R: 5' -CTGTCATTTGCCAGTGAGAGC-3' . La Figura 5 muestra la alineación de 28 secuencias de identidad de un contiguo que comprende la región terminal 3' CHDH. La alineación incluye la secuencia de AI240933, que incluye el extremo 3' de la secuencia consensual ensamblada. La Figura 6 muestra la secuencia de un contiguo ensamblado que contiene el nuevo extremo 3' de CHDH. La Figura 7 muestra una representación de una región del cromosoma 3 humano en donde la localización de CACNA1D es identificado por la via "Hs.399966" y la localización de CHDH sea identificado por la via "Hs.126688". La Figura 8, Parte A contiene seis partes relacionadas con la validación de una relación de la expresión de QPRT a la expresión CHDH como un indicador de respuesta, o como falta de la misma, a TAM. Las tres porciones identificadas por "QPRT: CHDH AI240933" reflejan la relación utilizando una sonda para la expresión de la secuencia AI240933 de GenBank. Las tres oraciones identificadas por "QPRT: CHDH AJ272267" reflejan la relación utilizando una sonda para la expresión de la secuencia AJ272267 de GenBank, identificada como aquella de mRNA parcial para CHDH. La Parte B contiene el uso análogo de una relación de la expresión HOXB13 a la expresión de IL17BR como un indicador de la respuesta a TAM. Gráficas de los conjuntos de datos del Respondedor ("R") y No Respondedor ("NR") son mostradas. Los valores P son la prueba t de dos muestras. Modos para Practicar la Invención Definiciones de términos como se utilizan en la presente: Un "patrón" o "perfil" o "señal" de expresión de gen se refiere a la expresión relativa de los genes correlacionados con la respuesta al tratamiento del cáncer de seno de ER+ con TAM u otro agente "antiestrógeno" contra el cáncer de seno. La respuesta o falta de la misma puede ser expresada como resultados de supervivencia que están relacionados con un "patrón" o "perfil" o "señal" de expresión que es capaz de distinguir entre, y predecir, los resultados. Un "modulador del receptor de estrógeno selectivo" o SERM es un agente "antiestrógeno" que en algunos tejidos actúa similar a los estrógenos (agonista) pero bloquea la acción del estrógeno en otros tejidos (antagonista) . Los "reguladores hacia abajo del receptor de estrógeno selectivos" (o "SERD"s) o antiestrógenos "puros" incluyen agentes que bloquean la actividad del estrógeno en todos los tejidos. Ver Howell y colaboradores, (Best Bractice & Res. Clin. Endocrinol. Metab. 18(l):47-66, 2004). Los SERMs preferidos de la invención son aquellos que son antagonistas de estrógeno en tejidos y células de seno, incluyendo aquellas de cáncer de seno. Ejemplos no limitativos de tales incluyen TAM, raloxifen, GW5638 e ICI 182,780. Los mecanismos posibles de acción por varios SERMs han sido revisados (ver por ejemplo Jordán y colaboradores, 2003, Breast Cáncer Res. 5:281-283; Hall y colaboradores, 2001, J. Biol. Chem. 276(40) :36869-36872; Dutertre y colaboradores, 2000, J. Pharmacol. Exp. Therap. 295 (2) : 431-437; y Wijayaratne y colaboradores, 1999, Endocrinology 140 (12) : 5828-5840) . Otros ejemplos no limitativos de SERMs en el contexto de la invención incluyen trifeniletilenos, tal como tamoxifen, GW5638, TAT-59, clomifen, toremifen, droloxifen y yodoxifen; benzotiofenos, tal como arzoxifeno (LY353381 o LY353381-HC1) ; benzopiranos, tal como EM-800; naftálenos, tal como CP-336,156 y ERA-923. Ejemplos no limitativos de SERD o antiestrógeno "puro" incluyen agentes tal como ICI 182,780 (fulvestrant o faslodex) o el análogo oral SR16243 y ZK 191703 asi como inhibidores de aromatasa y agentes de ablación ovárica químicos como es descrito en la presente. Otros agentes comprendidos por SERM como se utiliza en la presente incluyen inhibidores del receptor de progesterona y fármacos relacionados, tales como progestomiméticos similares a acetato de medroxiprogesterona, megace y RU-486; e inhibidores de la acción ER basados en péptido, tal como análogos de LH-RH (leuprolide, zoladex, [D-Trp6]LH-RH) , análogos de somatostatina e imitaciones de porción LXXLL de ER así como tibolone y resveratrol. Como es mencionado en lo anterior, los SERMs preferidos de la invención son aquellos que son antagonistas de estrógeno en tejidos y células de seno, incluyendo aquellos de cáncer de seno. Ejemplos no limitativos de SERMs preferidos incluyen a los metabolitos actuales o contemplados (in vivo) de cualquier SERM, tales como, pero no limitados a, 4-hidroxitamoxifen (metabolito de tamoxifen) , EM652 (o SCH 57068 donde EM-800 es un profármaco de EM-652) y GW7604 (metabolito de GW5638) . Ver Wilson y colaboradores, (1997, Endocrinology 138 (9) : 3901-3911) y Dauvois y colaboradores, (1992, Proc. Nat'l. Acad. Sci. USA 89:4037-4041) para discusiones de algunos SERMs específicos. Otros SERMs preferidos son aquellos que producen el mismo perfil de expresión de gen relevante como tamoxifen o 4-hidroxitamoxifen. Un ejemplo del medio para identificar tales SERMs se proporciona por Levenson y colaboradores, (2002, Cáncer Res. 62:4419-4426). Un "gen" es un polinucleótido que codifica un producto discreto, ya sea RNA o de naturaleza proteinácea. Se aprecia que más de un polinucleótido puede ser capaz de codificar un producto discreto. El término incluye alelos y polimorfismos de un gen que codifica el mismo producto, o un análogo funcionalmente asociado (incluyendo ganancia, pérdida, o modulación de función) del mismo, basado en la localización cromosómica y la habilidad para recombinar célula de la mitosis normal. Una "secuencia" o "secuencia de gen" como se utiliza en la presente es una molécula de ácido nucleico o polinucleótido compuesto de un orden discreto de bases de nucleótidos . El término incluye el ordenamiento de bases que codifican producto discreto (es decir, "región de codificación") , ya sea RNA o de naturaleza proteinácea, así como las bases ordenadas que preceden o siguen una "región de codificación". Ejemplos no limitativos de estos últimos incluyen las regiones no traducidas 5' y 3' de un gen. Es apreciado que más de un polinucleótido puede ser capaz de codificar un producto discreto. También es apreciado que los alelos y polimorfismos de las secuencias divulgadas pueden existir y se pueden utilizar en la práctica de la invención para identificar el (los) nivel (es) de expresión de las secuencias divulgadas o el alelo polimorfismo. La identificación de un alelo o polimorfismo depende en parte de la localización cromosómica y la habilidad para recombinarse durante la mitosis. Los términos "correlacionar" o "correlación" o equivalentes de los mismos se refieren a una asociación entre la expresión de uno o más genes y una respuesta fisiológica de una célula de cáncer de seno y/o un paciente de cáncer de seno en comparación a la falta de la respuesta. Un gen puede ser expresado a niveles más altos o más bajos y todavía será correlacionado con la respuesta, no respuesta o supervivencia del cáncer de seno o resultado. La invención proporciona, por ejemplo, la correlación entre incrementos en la expresión de la secuencia IL17BR y CHDH y la respuesta de las células de seno de ER+ a TAM u otro agente "antiestrógeno" contra el cáncer de seno. Asi los incrementos son indicativos de respuesta. A la inversa, la falta de incrementos, incluyendo los niveles de expresión sin cambio, son indicadores de no respuesta. De manera similar, la invención proporciona, por ejemplo, la correlación entre disminuciones en la expresión de las secuencias H0XB13 y QPRT y la respuesta de las células de seno ER+ al TAM u otro SERM. Así las disminuciones son indicativas de respuesta mientras que la falta de disminuciones, incluyendo los niveles de expresión sin cambio, son indicadores de no respuesta. Los incrementos o disminuciones se pueden expresar fácilmente en la forma de una relación entre la expresión en una célula no normal y una célula normal tal que una relación de uno (1) indica nada diferencia mientras que las relaciones de dos (2) y un medio indican dos veces de tanta, y media tanta, expresión en la célula no normal contra la célula normal, respectivamente. Los niveles de expresión pueden ser fácilmente determinados por métodos cuantitativos como es descrito enseguida. Por ejemplo, los incrementos en la expresión de gen se pueden identificar por relaciones de o aproximadamente 1.1, de o aproximadamente 1.2, de o aproximadamente 1.3, de o aproximadamente 1.4, de o aproximadamente 1.5, de o aproximadamente 1.6, de o aproximadamente 1.7, de o aproximadamente 1.8, de o aproximadamente 1.9, de o aproximadamente, 2, de o aproximadamente 2.5, de o aproximadamente 3, de o aproximadamente 3.5, de o aproximadamente 4, de o aproximadamente 4.5, de o aproximadamente 5, de o aproximadamente 5.5, de o aproximadamente 6, de o aproximadamente 6.5, de o aproximadamente 7, de o aproximadamente 7.5, de o aproximadamente 8, de o aproximadamente 8.5, de o aproximadamente 9. de o aproximadamente 9.5, de o aproximadamente 10, de o aproximadamente 15, de o aproximadamente 20, de o aproximadamente 30, de o aproximadamente 40, de o aproximadamente 50, de o aproximadamente 60, de o aproximadamente 70, de o aproximadamente 80, de o aproximadamente 90, de o aproximadamente 100, de o aproximadamente 150, de o aproximadamente 200, de o aproximadamente 300, de o aproximadamente 400, de o aproximadamente 500, de o aproximadamente 600, de o aproximadamente 700, de o aproximadamente 800, de o aproximadamente 900, o de o aproximadamente 1000. Una relación de 2 es un 10% (o de dos veces) el incremento en la expresión. Las disminuciones en la expresión de gen pueden ser indicadas por relaciones de o aproximadamente 0.9, de o aproximadamente 0.8, de o aproximadamente 0.7, de o aproximadamente 0.6, de o aproximadamente 0.5, de o aproximadamente 0.4, de aproximadamente 0.3, de aproximadamente 0.2, de aproximadamente 0.1, de aproximadamente 0.05, de aproximadamente 0.01, de aproximadamente 0.005, de aproximadamente 0.001, de o aproximadamente 0.0005, de o aproximadamente 0.0001, de o aproximadamente 0.00005, de o aproximadamente 0.00001, de o aproximadamente 0.000005 o de o aproximadamente 0.000001. Para un fenotipo dado, una relación de la expresión de una secuencia de gen expresada en niveles incrementados en correlación con el fenotipo a la expresión de una secuencia de gen expresada en niveles disminuidos en correlación con el fenotipo también se pueden utilizar como un indicador del fenotipo. Como un ejemplo no limitativo, el fenotipo de la no respuesta al tratamiento con tamoxifen del cáncer de seno está correlacionado con la expresión incrementada de HOXB13 y/o QPRT así como la expresión disminuida de IL17BR y/o CHDH. Por lo tanto, una relación de los niveles de expresión de HOXB13 o QPRT a IL17BR o CHDH se puede utilizar como un indicador de no respuesta. Un "polinucleótido" es una forma polimérica de nucleótidos de cualquier longitud, ya sea ribonucleótidos o desoxiribonucleótidos . Este término se refiere solamente a la estructura primaria de la molécula. Asi, este término incluye DNA y RNA de doble y de una sola hebra. Este también incluye tipos conocidos de modificaciones que incluyen marcas conocidas en la técnica, metilación, "caps", sustitución de uno o más de los nucleótidos que ocurren de manera natural con un análogo, y modificaciones de internucleótido tales como enlaces no cargados (por ejemplo, fosforotioatos, fosforoditioatos, etc.) asi como formas no modificadas del polinucleótido . El término "amplificar" se utiliza en el sentido amplio para dar a entender la creación de un producto de amplificación que se puede hacer enzimáticamente con DNA o RNA polimerasas. "Amplificación" como se utiliza en la presente, generalmente se refiere al proceso de producir múltiples copias de una secuencia deseada, particularmente a aquellas de una muestra. "Múltiples copias" significa por lo menos 2 copias. Una "copia" no necesariamente significa la complementariedad o identidad de secuencia perfecta a la secuencia de plantilla. Los métodos para amplificar mRNA son generalmente conocidos en la técnica, e incluyen la PCR de transcripción inversa (RT-PCR) y aquellas descritas en la solicitud de patente norteamericana 10/062,857 (presentada el 25 de octubre del 2001) , asi como las solicitudes de patente provisional norteamericana 60/298,847 (presentada el 25 de junio del 2001) y 60/257,801 (presentada el 22 de diciembre del 2000) , todas las cuales son incorporadas en la presente por referencia en sus totalidades como si expusieran completamente. Otro método que puede ser utilizado es la PCR cuantitativa (o Q-PCR) . Alternativamente, el RNA puede ser directamente marcado por el cDNA correspondiente por métodos conocidos en la técnica. Por "correspondiente" se propone que una molécula de ácido nucleico comparte una cantidad sustancial de identidad de secuencia con otra molécula de ácido nucleico. Cantidad sustancial significa por lo menos 95%, usualmente por lo menos 98% y más usualmente por lo menos 99%, e identidad de secuencia se determina utilizando el algoritmo BLAST, como es descrito en Altschul y colaboradores, (1990) , J. Mol. Biol. 215:403-410 (usando el ajuste de error publicado, es decir los parámetros w=4, t=17) . Un "microarreglo" es un arreglo lineal o bi-dimensional o tri-dimensional (y fase sólida) de regiones preferentemente discretas, cada una que tiene un área definida, formada en la superficie de un soporte sólido tal como, pero no limitado a membrana de vidrio, de plástico sintética. La densidad de las regiones discretas sobre un microarreglo se determina por los números totales de polinucleótidos inmovilizados que son detectados en la superficie de un soporte en fase sólida individual, de preferencia por lo menos aproximadamente 50/cm2, más de preferencia por lo menos aproximadamente 100/cm2, aún más de preferencia por lo menos aproximadamente 500/cm2, pero de preferencia por debajo de aproximadamente 1000/cm2. De preferencia, los arreglos contienen menos de aproximadamente 500, aproximadamente 1000, aproximadamente 1500, aproximadamente 2000, aproximadamente 2500, o aproximadamente 3000 polinucleótidos inmovilizados en total. Como se utiliza en la presente, un microarreglo de DNA es un arreglo de oligonucleótidos o polinucleótidos colocados sobre un chip u otras superficies utilizadas para hibridar a polinucleótidos amplificados o clonados a partir de una muestra. Puesto que la posición de cada grupo particular de cebadores en el arreglo es conocida, las identidades de una muestra de polinucleótidos se puede determinar en base a su enlace a una posición particular en el microarreglo. Como una alternativa para el uso de un microarreglo, un arreglo de cualquier tamaño puede ser utilizado en la práctica de la invención, incluyendo un arreglo de una o más posiciones de un arreglo bidimensional o tridimensional en una fase sólida para detectar la expresión de una secuencia de gen individual. Debido a que la invención depende de la identificación de genes que son sobre- o sub-expresados, una modalidad de la invención involucra determinar la expresión mediante la hibridación de mRNA, o una versión amplificada o clonada del mismo, de una célula de muestra a un polinucleótido que es único a una secuencia de gen particular. Los polinucleótidos preferidos de este tipo contienen por lo menos aproximadamente 16, por lo menos aproximadamente 18, por lo menos aproximadamente 20, por lo menos aproximadamente 22, por lo menos aproximadamente 24, por lo menos aproximadamente 26, por lo menos aproximadamente 28, por lo menos aproximadamente 30, o por lo menos aproximadamente 32 pares de bases consecutivas de una secuencia de gen que no se encuentra en otras secuencias de gen. El término "aproximadamente" como se utiliza en la oración previa se refiere a un incremento o disminución de 1 del valor numérico establecido. Aun más preferidos son los polinucleótidos de por lo menos o aproximadamente 50, por lo menos o aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350, por lo menos o aproximadamente 400, por lo menos o aproximadamente 450, por lo menos o aproximadamente 500 bases consecutivas de una secuencia que no se encuentra en otras secuencias de gen. El término "aproximadamente" como se utiliza en la oración precedente se refiere a un incremento de disminución de 10% del valor numérico establecido. Los polinucleótidos más largos por supuesto pueden contener desigualaciones menores (por ejemplo, por la via de la presencia de mutaciones, que no afectan la hibridación a los ácidos nucleicos de una muestra. Tales polinucleótidos también pueden ser referidos como sondas de polinucleótido que son capaces de hibridar a secuencias de los genes, o porciones únicas de los mismos, descritos en la presente. Tales polinucleótidos pueden ser marcados para ayudar en su detección. De preferencia, las secuencias son aquellas de mRNA codificado por los genes, el cDNA correspondiente a tales mRNAs y/o versiones amplificadas de tales secuencias. En modalidades preferidas de la invención, las sondas de polinucleótido son inmovilizadas en un arreglo, otros dispositivos de soporte sólido, o en manchas individuales que localizan las sondas. En otra modalidad de la invención, toda o parte de una secuencia divulgada puede ser amplificada y detectada por métodos tal como la reacción en cadena de polimerasa (PCR) y variaciones de la misma, tales como, pero no limitados a, PCR cuantitativa (Q-PCR) , PCR de transcripción inversa (RT-PCR) y PCR tiempo real (incluyendo como un medio para medir las cantidades iniciales de copia de mRNA para cada secuencia en una muestra) , opcionalmente RT-PCR en tiempo real o Q-PCR en tiempo real. Tales métodos utilizarían uno o dos cebadores que son complementarios a porciones de una secuencia divulgada, donde los cebadores se utilizan para cebar la síntesis de ácido nucleico. Los ácidos nucleicos recientemente sintetizados son opcionalmente marcados y pueden ser detectados directamente o mediante hibridación a un polinucleótido de la invención. Los ácidos nucleicos recientemente sintetizados se pueden poner en contacto con polinucleótidos (que contienen secuencia) de la invención bajo condiciones que permiten su hibridación. Los métodos adicionales para detectar la expresión de ácidos nucleicos expresados incluyen los ácidos nucleicos de protección de RNAsa, incluyendo las hibridaciones en fase liquida, y la hibridación in situ de células. Alternativamente, y en todavia otra modalidad de la invención, la expresión de gen se puede determinar mediante el análisis de la proteína expresada en una muestra de células de interés mediante el uso de una masa anticuerpos específicos para una masa epitope de productos de gen individuales (proteína) o fragmentos proteolíticos de los mismos, en la muestra de células o en un fluido corporal de un sujeto. La muestra de células puede ser una de células epiteliales de cáncer de seno enriquecidas de la sangre de un sujeto, tal como mediante el uso de anticuerpos marcados contra marcadores de superficie celular seguidos por la clasificación de células activadas con fluorescencia (FACS) . Tales anticuerpos de preferencia son marcados para permitir su fácil detección después del enlace de producto de gen. Las metodologías de detección adecuadas para el uso en la práctica de la invención incluyen, pero no están limitadas a, inmunohistoquímica de muestras que contienen células o tejido, ensayos inmunosorbentes enlazados a enzimas (ELISAs) que incluyen ensayos de intercalación de anticuerpo de muestras de tejido o sangre que contienen células, espectroscopia de masas e inmuno-PCR. El término "marca" se refiere a una composición capaz de producir una señal detectable indicativa de la presencia de la molécula marcada. Las marcas adecuadas incluyen radioisótopos, cromóforos de nucleótido, enzimas, sustratos, moléculas fluorescentes, porciones quimioluminiscentes, partículas magnéticas, porciones bioluminiscentes y los similares. Como tal, como una marca es cualquier composición detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímícos, eléctricos, ópticos o químicos. El término "soporte" se refiere a soportes convencionales tales como cuentas, partículas, adherentes, fibras, filtros, membranas y soportes de silano o silicato tales como platinas de vidrio. Como se utiliza en la presente, una "muestra de tejido de seno" o "muestra de células de seno" se refiere a una muestra de tejido o fluido de seno aislado de un individuo que se sospecha ser afectado con, o en riesgo de desarrollar, cáncer de seno. Tales muestras son aislados primarios (en contraste células cultivadas) y se pueden recolectar mediante cualquier medio no invasivo o mínimamente invasivo, incluyendo, pero no limitado, a lavado ductal, aspiración con aguja fina, biopsia con aguja, los dispositivos y métodos descritos en la patente norteamericana 6,328,709 o cualquier otro medio adecuado reconocido en la técnica. Alternativamente, la "muestra" puede ser recolectada mediante un método invasivo, incluyendo, pero no limitado a, la biopsia quirúrgica. "Expresión" y "expresión de gen" incluye la transcripción y/o traducción de material de ácido nucleico. Como se utiliza en la presente, el término "que comprende" y sus cognados se utilizan en su sentido inclusivo; esto es, equivalente al término "que incluye" y sus cognados correspondientes. Las condiciones que "permiten" que un evento ocurra a las condiciones que son "adecuadas para que un evento ocurra, tal como la hibridación, extensión de hebra y los similares o "condiciones adecuadas" son condiciones que no previenen de que tales eventos ocurran. Así, estas condiciones permiten, aumentan, facilitan y/o son conducentes al evento. Tales condiciones, conocidas en la técnica descritas en la presente, dependen de, por ejemplo, la naturaleza de la secuencia de nucleótidos, temperatura, y condiciones de la solución reguladora. Estas condiciones también dependen de que evento es deseado, tal como la hibridación, segmentación, extensión o transcripción de la hebra . "Mutación" de secuencia, como se utiliza en la presente, se refiere a cualquier alteración de la secuencia en la secuencia de un gen divulgado en la presente de interés en comparación a una secuencia de referencia. Una mutación de secuencia incluye cambios de nucleótidos individuales, o alteraciones de más de un nucleótido en una secuencia, debido a mecanismos tal como sustitución, supresión o inserción. El polimorfismo de nucleótido individual (SNP) también es una mutación de secuencia como se utiliza en la presente. Debido a que la presente invención está avanzada en el nivel relativo de la expresión de gen, las mutaciones en regiones de no codificación de genes como es divulgado en la presente también pueden ser analizados en la práctica de la invención. "Detección" incluye cualquier medio para detectar, incluyendo la detección directa e indirecta de la expresión de gen y cambios en la misma. Por ejemplo, productos "menos detectables" pueden ser observados directamente o indirectamente, y el término indica cualquier reducción (incluyendo la ausencia de la señal detectable) . De manera similar, producto "más detectable" significa cualquier incremento, ya sea observado directamente o indirectamente. Los incrementos y disminuciones en la expresión de las secuencias divulgadas se define en los siguientes términos basado en el por ciento o los cambios en veces sobre la expresión de las células normales. Los incrementos pueden ser de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180 o 200% con relación a los niveles de expresión en células normales. Alternativamente, los incrementos en veces pueden ser de 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5 o 10 veces sobre los niveles de expresión en células normales. La disminución puede ser de 10, 20, 30, 40, 50, 55, 60, 65, 70, 75, 80, 82, 8, 86, 88, 90, 92, 94, 96, 98, 99 o 100% con relación a los niveles de expresión en células normales. A menos que se defina de otra manera todos los términos técnicos y científicos utilizados en la presente tiene el mismo significado como es comúnmente entendido para un experto ordinario en la técnica a la cual está invención pertenece. Modalidades de la Invención En un primer aspecto, la invención divulgada se relaciona a la identificación y el uso de patrones (o perfiles o "señales") de expresión de gen que discriminan entre (o están correlacionados con) la supervivencia del cáncer de seno en un sujeto tratado con tamoxifen (TAM) u otro agente "antiestrógeno" contra el cáncer de seno. Tales patrones pueden ser determinados por lo métodos de la invención mediante el uso en un número de muestras de células o de tejido a la referencia, tales como aquellas realizadas por un patólogo de habilidad ordinaria y la patología del cáncer de seno, que refleja las células de cáncer de seno opuesto a las células normales u otras células no cancerosas. Los resultados experimentados por los ejemplos de quienes las muestras pueden ser correlacionadas con datos de expresión para identificar patrones que se correlacionan con los resultados después del tratamiento contra TAM u otro agente "antiestrógeno" contra el cáncer de seno. Debido a que el perfil de expresión de gen global difiere de persona, cáncer a cáncer y célula de cáncer a célula de cáncer, las correlaciones entre ciertas células y genes expresados y subexpresados de pueden hacer como es divulgado en la presente para identificar genes son capaces de la discriminación entre los resultados del cáncer de seno. La presente invención puede ser practicada con cualquier número de los genes que se creen o probablemente son, diferencialmente expresados con respecto a los resultados del cáncer de seno, particularmente en los casos del cáncer de seno ER+. La identificación se puede hacer al utilizar perfiles de expresión de varias poblaciones de células de cáncer de seno homogéneas, que se aislaron mediante microdisección, tales como, pero no limitados, la microdisección de captura de láser (LCM) de 100-1000 células. El nivel de expresión de cada gen del perfil de expresión puede ser correlacionado con un resultado particular. Alternativamente, los niveles de expresión de múltiples genes pueden ser agrupados para identificar correlaciones con resultados particulares. Los genes con correlaciones significantes a la supervivencia del cáncer de seno cuando el sujeto se trata con tamoxifen pueden ser utilizados para generar modelos de expresiones de gen que discriminarían máximamente entre los resultados cuando un sujeto responde al tratamiento con tamoxifen u otro agente "antiestrógeno" contra el cáncer de seno y los resultados cuando el tratamiento no es exitoso. Alternativamente, los genes con correlaciones significantes pueden ser utilizados en combinación con genes con correlaciones menores sin pérdida significante en la habilidad para discriminar entre los resultados. Tales modelos pueden ser generados mediante cualquier medio apropiado reconocido en la técnica, incluyendo, pero no limitado a, el análisis de agrupación, máquinas de vector soportado, redes neurales u otro algoritmo conocido en la técnica. Los modelos son capaces de producir la clasificación de una muestra conocida t basada en la expresión de los genes utilizado para la discriminación los modelos. La validación cruzada de "dejar uno fuera" se puede utilizar para probar el desempeño de varios modelos y para ayudar a identificar pesos (genes) que son informativos o perjudiciales a la habilidad predictiva de los modelos. La validación cruzada también se puede utilizar para identificar genes que mejoran la habilidad predictiva de los modelos. El (los) gen (es) identificados como correlacionados con los resultados de cáncer de seno particulares relacionados con el tratamiento de tamoxifen en los modelos anteriores proporcionan la habilidad para enfocar el análisis de expresión de gen solamente aquellos genes que contribuyen a la habilidad para identificar un sujeto como probable de tener un resultado particular con relación a otro. La expresión de otros genes en una célula de cáncer de seno sería relativamente incapaz de proporcionar información concerniente, y de esta manera ayudar a la discriminación de, un resultado de cáncer de seno. Como será apreciado por aquellos expertos en la técnica, los modelos son altamente útiles con algún conjunto pequeño de datos de expresión de gen de referencia que pueden llegar a ser cada vez más precisos con la inclusión de más datos de referencia aunque el incremento incrementado en precisión probablemente disminuirá con cada dato adicional. De la preparación de datos de expresión de gen de referencia adicionales utilizando genes identificados y divulgados en la presente para discriminar entre los diferentes resultados en el cáncer de seno después del tratamiento con tamoxifen u otro agente "antiestrógeno" contra el cáncer de seno es de rutina y se puede realizar fácilmente por la persona experta para permitir la generación de modelos como es descrito en lo anterior para predecir el estado de una muestra no conocida en base a los niveles de expresión de esos genes. Para determinar los niveles de expresión "incrementados o disminuidos" de genes en la práctica de la presente invención, se puede utilizar cualquier método conocido en la técnica. En una modalidad preferida de la invención, la expresión basada en la detección de RNA que híbrida los genes identificados y divulgados en la presente es utilizado. Esto es fácilmente realizado mediante cualquier detección de RNA o método de amplificación más detección conocida o reconocida como equivalente en la técnica tal como, pero no limitado a, la PCR de transcripción inversa, los métodos divulgados en la patente norteamericana 6,794,141, y métodos para detectar la presencia o ausencia, o secuencias estabilizantes o desestabilizantes de RNA. Alternativamente, la expresión basada en la detección del estado de DNA puede ser utilizado. La detección del DNA de un gen identificado como metilado suprimido se pueden utilizar para genes que tienen expresión disminuida en correlación con un resultado de cáncer de seno particular. Esto puede ser fácilmente realizado mediante los métodos basados en PCR conocidos en la técnica, incluyendo, pero no limitado a, Q-PCR. A la inversa, la detección de un gen de DNA identificado como amplificado se puede utilizar para genes que tienen expresión incrementada en correlación con un resultado de cáncer de seno particular. Esto se puede realizar fácilmente mediante la hibridación in situ fluorescente basada en PCR (FISH) y la hibridación in situ de cromosoma (CISH) conocidos en la técnica. La expresión basada en la detección de una presencia, incremento o disminución en los niveles de proteína o la actividad también puede ser utilizada. La detección puede ser realizada mediante cualquier método basado en inmunohistoquímica (IHC) basado en sangre (especialmente para proteínas secretadas) , basado en anticuerpo (incluyendo anticuerpos contra la proteína) , basado en célula exfoliada (a partir del cáncer) basado en la espectroscopia de masas y el método basado en imagen (incluyendo el utilizado del ligando marcado) conocido en la técnica y reconocido como apropiado para la detección de la proteína. Los métodos basados en anticuerpo e imagen son adicionalmente útiles para la localización de tumores después de la determinación del cáncer mediante el uso de células obtenidas mediante un procedimiento no invasivo (tal como el lavado ductal o aspiración con aguja fina) , donde la fuente de las células cancerosas no es conocida. Un anticuerpo ligando marcado puede ser utilizado para localizar el (los) carcinomas (dentro de un paciente) o para ayudar al enriquecimiento de las células de cáncer exfoliadas a partir de un fluido corporal. Una modalidad preferida usando un ensayo basado en ácido nucleico para determinar la expresión es mediante la inmovilización de una o más secuencias de los genes identificados en la presente sobre un soporte sólido, incluyendo, pero no limitado a, un sustrato sólido, un arreglo o a cuentas o tecnología basada en cuentas como es conocido en la técnica. Alternativamente, los ensayos de expresión basados en solución conocidos en la técnica también pueden ser utilizados. El (los) gen (es) movilizado (s) puede estar en la forma de polinucleótidos que son únicos o de otra manera específicos al (los) gen (es) tal que el polinucleótido sería capaz de hibridar a un DNA o RNA correspondiente al (los) gen (es). Estos polinucleótidos pueden ser la longitud completa del (los) gen (es) o ser secuencias cortas de los genes (hasta un nucleótido más corto de la secuencia de longitud completa conocida en la técnica mediante la supresión del extremo 5' o 3' de las secuencias) que están de manera opcional mínimamente interrumpida (tal como mediante desigualaciones o pares de bases no complementarias insertadas) , tal que la hibridación con un DNA o RNA correspondiente al (los) ge (es) no es afectada. De preferencia, los polinucleótidos usados son del extremo 3' del gen, tal como de aproximadamente 350, aproximadamente 300, aproximadamente 250, aproximadamente 200, aproximadamente 150, aproximadamente 100 o aproximadamente 500 nucleótidos de la señal de poliadenilación o sitios de poliadenilación de un gen o secuencia expresada. Las mutaciones que contienen polinucleótidos con relación a las secuencias de los genes divulgados también pueden ser utilizadas mientras que la presencia de las mutaciones todavía permite la hibridación para producir una señal detectable. El (los) gen (es) inmovilizado (s) o secuencias complementarias a los mismos, se pueden utilizar para determinar el estado de las muestras de ácido nucleico preparadas a partir .de la(s) célula (s) de seno de muestra para la cual el resultado del sujeto de la muestra (por ejemplo el paciente de quien se obtiene la muestra) no es conocido para la confirmación de un resultado que ya es asignado al sujeto de la muestra. Sin limitar la invención, tal célula puede ser de un paciente con cáncer de seno ER+ o ER-. El (los) polinucleótido (s) inmovilizado (s) necesita ser solamente suficiente para específicamente hibridar a las moléculas de ácido nucleico correspondientes derivadas de la muestra bajo condiciones adecuadas. Mientras que aun una secuencia de gen correlacionada individual puede ser capaz de proporcionar precisión adecuada en la discriminación entre dos resultados de cáncer de seno, dos o más, tres o más, cuatro o más, cinco o más, seis o más, siete o más, ocho o más, nueve o más, diez o más, once o más o cualquier número entero de los genes identificados en la presente puede ser utilizado como un subconjunto capaz de la discriminación en combinación para incrementar la presión del método. La invención específicamente contempla la selección de más de uno, dos o más, tres o más, cuatro o más, cinco o más, seis o más, siete o más, ocho o más, nueve o más, diez o más, once o más, o cualquier número entero de los genes divulgados en las tablas y figuras en la presente para el uso como un subconjunto de identificación del resultado de supervivencia de cáncer de seno. Por supuesto 1 o más, 2 o más, 3 o más, 4 o más, 5 o más, 6 o más, 7 o más, 8 o más, 9 o más, cualquier número entero de, todos los genes proporcionados en las Tablas 2, 3 y/o XXX enseguida pueden ser utilizados. "Acceso" como se utiliza en el contexto de las Tablas en la presente así como en la presente invención se refiere al número de acceso de GenBank de una secuencia de cada gen, las secuencias que son incorporadas en la presente por referencia en su totalidad como ellas están disponibles de GenBank como es accesado en la fecha de presentación de la presente solicitud. El valor p se refiere a valores asignados como es descrito en los ejemplos enseguida. Las indicaciones de "E-xx" donde "xx" es un número de dos dígitos se refiere a la anotación alternativa para figuras exponenciales donde "-xx" es "10_xx". Así en combinación con los números a la izquierda de "E-xx", el valor que es representado es los números para las veces a la izquierda de 10~xx. "Descripción" como se utiliza en las Tablas proporciona un breve identificador de lo que la secuencia/gen codifica. Los genes con una correlación identificada por un valor abajo de o aproximadamente 0.02, abajo de o aproximadamente 0.01, abajo de o aproximadamente 0.005, abajo de o aproximadamente 0.001 son preferidos para el uso en la práctica de la invención. La presente invención incluye el uso de gen(s) la expresión de los cuales identifican diferentes resultados de cáncer de seno después del tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno para permitir la identificación simultánea del resultado de supervivencia del cáncer de seno de un paciente basado en el análisis de una muestra de cáncer de seno, a partir del paciente. En un segundo aspecto, que también sirve como modalidad el uso de un subconjunto de los genes divulgados en la presente, la presente invención se relaciona a la identificación de uso de múltiples conjuntos de secuencia para la determinación de la respuesta del cáncer de seno ER+ del tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno. La expresión diferencial de estas secuencias en el cáncer de seno correlacionan las células de seno normales se utiliza para predecir la respuesta a TAM u otro agente "antiestrógeno" contra el cáncer de seno en un sujeto. Para identificar los patrones de expresión de gen en cánceres de seno invasores de etapa temprana, ER positivo que podrían predecir la respuesta a la terapia hormonal, el análisis de expresión de gen de microarreglo se realizó cobre tumores de 60 mujeres uniformemente tratadas con el adyuvante tamoxifen solo. Estos pacientes se identificaron de un total de 103 casos de etapa temprana de ER+ presentados en el Hospital General de Massachussets entre 1987 y 1997, de quienes se congelaron rápidamente especímenes de tumor y para quienes estuvo disponible un seguimiento de 5 años mínimo (ver la Tabla 1 para detalles) . Dentro de este grupo, 28 (46%) mujeres desarrollaron metástasis distante con un tiempo medio para la recurrencia de 4 años ("no respondedores a tamoxifen") y 32 (54%) mujeres permanecieron libres de enfermedad con continuación media de 10 años ("respondedores a tamoxifen") . Los respondedores se igualaron con los casos no respondedores con respecto a la etapa de TNM (ver Singletary, S. E. y colaboradores, "Revisión of the American Joint Committee on Cáncer staging system for breast cáncer. "J Clin Oncol 20, 3628-36 (2002)) y el grado de tumor (ver Dalton, L. W. y colaboradores, "Histologic grading of breast cáncer: linkage of patient outcome with level of pathologist agreement. "Mod Pathol 13,730-5. (2000)). Estudios previos de los perfiles de expresión de gen de enlace al resultado clínico en el cáncer de seno han demostrado que el potencial para la metástasis distante y la probabilidad de supervivencia total puede ser predecible a través de características biológicas del tumor primario en la etapa de diagnosis (ver Huang, E. y colaboradores, "Gene expression predictors of breast cáncer outcomes. "Lancet 361, 1590-6 (2003); Sorlie, T. y colaboradores, "Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications . "Proc Nati Acad Sci E U A 98:10869-74 (2001); Sorlie, T. y colaboradores, "Repeated observation of breast tumor subtypes in independent gene expression data sets. "Proc Nati Acad Sci E U 100, 8418-23 (2003) ; Sotiriou, C. y colaboradores, "Breast cáncer classification and prognosis based on gene expression profiles from a population-based study. "Proc Nati Acad Sci E U A 100, 10393-8 (2003); van' t Veer, L. J. y colaboradores, "Gene expression profiling predicts clinical outcome of breast cáncer. "Nature 415, 530-6 (2002); y van de Vijver, M. J. y colaboradores, "A gene-expression signature as a predictor of survival in breast cáncer. "N Engl J Med 347, 1999-2009 (2002)). En particular, una señal de expresión de 70 genes ha probado que es un factor de pronóstico fuerte, realizando todos los parámetros clinicopatológicos conocidos. Sin embargo, en esos estudios los pacientes ya sea que recibieron terapia sin adyuvante (van't Veer, L. J. y coloarabores, Nature 2002) o se trataron no uniformemente con regímenes hormonales y quimioterapéuticos (Huang, E. y colaboradores; Sorlie, T. y colaboradores; Sorlie, T. y colaboradores; Sotiriou, C. y colaboradores; y van de Vijver, M. J. y colaboradores, N Engl J Med 2002) . Los pacientes con cáncer de seno de etapa temprana ER+ tratados con tamoxifen solamente, tal como el grupo estudiado aquí, representa solamente un subconjunto de la población probada con la señal de 70 genes. Por supuesto, 61 de los genes en la señal de 70 genes estuvieron presente en el microarreglo utilizado como es descrito enseguida, pero nada de asociación significante con el resultado clínico se observó en el subconjunto definido de pacientes. En comparación con los biomarcadores existentes, incluyendo ESR1, PGR, ERBB2 y EGFR, los conjuntos de secuencias de gen divulgados en la presente son significativamente más predictivos de la respuesta al tratamiento con TAM. El análisis multivariable indicó que estos tres genes fueron predictores significantes del resultado clínico independiente del tamaño de tumor, estado nodal y grado de tumor. ER y la expresión de receptor de progesterona (PR) han sido los mayores predictores clinicopatológicos para la respuesta a TAM. Sin embargo, hasta 40% de los tumores ER+ no logran responder o desarrollan resistencia a TAM. La invención así proporciona el uso de los biomarcadores identificados para permitir el mejor manejo del paciente al identificar pacientes quienes son más probables de beneficiarse del TAM u otra terapia endocrina y aquellos que son probables de desarrollar resistencia y recurrencia de tumor. Como se mencionó en la presente, la(s) secuencia (s) identificadas por la presente invención se expresan en correlación con células de cáncer de seno ER+. Por ejemplo, IL17BR identificado por las Agrupaciones del Consorcio I.M.A.G.E. NM_018725 y NM_172234 ("The I.M.A.G.E. Consortiu : An Integrated Molecular Analysis and their Expression, "Lennon y colaboradores, 1996, Genonjics 33: 151-152; ver también image.llnl.gov) se han encontrado que son útiles en predecir la respuesta al tratamiento con TAM. En modalidades preferidas de la invención, cualquier secuencia, o porción única de la misma, de las secuencias IL17BR de la agrupación, así como la agrupación Hs.5470 de Homo sapiens de UniGene, puede ser utilizada. De manera similar, cualquier secuencia que codifica toda o parte de la proteína codificada por cualquier secuencia IL17BR divulgada en la presente puede ser utilizada. Las secuencias consensúales de las agrupaciones del Consorcio I.M.A.G.E. son como sigue, con la región de codificación asignada (que termina con un codon de terminación) subrayada y precedida por la región no traducida 5' y/o de no codificación y seguido por la región no traducida 3' y/o de no codificación: SEQ ID NO: 1 (secuencia consensual para IL17BR, variante de transcripto 1, identificada como NM_018725 o NM_018725.2) : agcgcagcgt gcgggtggcc tggatcccgc gcagtggccc ggcgatgtcg ctcgtgctgc taagcctggc cgcgctgtgc aggagcgccg taccccgaga gccgaccgtt caatgtggct ctgaaactgg gccatctcca gagtggatgc tacaacatga tstaatcccc ggagacttga gggacctccg agtagaacct gttacaacta gtgttgcaac aggggactat tcaattttga tgaatgtaag ctgggtactc cgggcagatg ccagcatccg cttgttgaag gccaccaaga tttgtgtgac gggcaaaagc aacttccagt cctacagctg tgtgaggtgc aattacacag aggccttcca gactcagacc agaccctctg gtggtaaatg gacattttcc tacatcggct tccctgtaga gctgaacaca gtctatttca ttggggccca taatattcct aatgcaaata tgaatgaaga tggcccttcc atgtctgtga atttcacctc accaggctgc ctagaccaca taatgaaata taaaaaaaag tgtgtcaagg ccggaagcct gtgggatccg aacatcactg cttgtaagaa gaatgaggag acagtagaag tgaacttcac aaccactccc ctgggaaaca gatacatggc tcttatccaa cacagcacta tcatcgggtt ttctcaggtg tttgagccac accagaagaa acaaacgcga gcttcagtgg tgattccagt gactggggat agtgaaggtg ctacggtgca gctgactcca tattttccta cttgtggcag cgactgcatc cgacataaag gaacagttgt gctctgccca caaacaggcg tccctttccc tctggataac aacaaaagca agccgggagg ctggctgcct ctcctcctgc tgtctctgct ggtggccaca tgggtgctgg tggcagggat ctatctaatg tggaggcacg aaaggatcaa gaagacttcc ttttctacca csacactact gccccccatt aaggttcttg tggtttaccc atctgaaata tgtttccatc acacaatttg ttacttcact gaatttcttc aaaaccattg cagaagtgag gtcatccttg aaaagtggca gaaaaagaaa atagcagaga tgggtccagt gcagtggctt gccactcaaa agaaggcagc agacaaagtc gtcttccttc tttccaatga cgtcaacagt gtgtgcgatg gtacctgtgg caagagcgag ggcagtccca gtgagaactc tcaagacctc ttcccccttg cctttaacct tttctgcagt gatctaagaa gccagattca tctgcacaaa tacgtggtgg tctactttag agagattgat acaaaagacg attacaatgc tctcagtgtc. tgccccaagt accacctcat gaaggatgsc actgctttct gtgcagaact tctccatgtc aagcagcagg tgtcagcagg aaaaagatca caagcctgcc acgatggctg ctgctccttg tagcccaccc atgagaagca agagacctta aaggcttcct atsccaccaa ttacagggaa aaaacgtgtg atgatcctga agcttactat gcagcctaca aacagcctta gtaattaaaa cattttatac saataaaatt ttcaaatatt gctaactaat gtagcattaa ctaacgattg gaaactacat ttacaacttc aaagctgttt tatacataga aatcaattac agttttaatt gaaaactata accattttga taatgcaaca ataaagcats ttcagccaaa catstagtct tccatagacc atgcattgca gtgtacccag aactgtttag ctaatattct atgtttaatt aatgaatact aactctaaga acccctcact gattcactca atagcatctt aagtgaaaaa ccttctatta catgcaaaaa atcattgttt ttaagataac aaaagtaggg aataaacaag ctgaacccac ttttaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa SEQ ID NO: 2 (secuencia consensual para IL17BR, variante de transcripto 2, identificada como NM_172234 o NM_172234.1) : agcgcagcgt gcgggtggcc tggatcccgs gsagtggccc ggcgatgtcg ctcgtgctgc taagcctggc cgcgctgtgc aggagcgccg taccccgaga gccgaccgtt caatgtggct ctgaaactgg gccatctcca gagtggatgc tacaacatga tstaatcccc ggagacttga gggacctccg agtagaacst gttasaacta gtgttgcaac aggggactat tcaattttga tgaatgtaag ctgggtactc cgggcagatg ccagcatccg cttgttgaag gccaccaaga tttgtgtgac gggcaaaagc aacttccagt cctacagctg tgtgaggtgc aattacacag aggccttcca gactcagacc agaccctctg gtggtaaatg gacattttcc tacatcggct tccctgtaga gctgaacaca gtctatttca ttggggccca taatattcct aatgcaaata tgaatgaaga tggcccttcc atgtctgtga atttcacctc accaggctgc ctagaccaca taatgaaata taaaaaaaag tgtgtcaagg ccggaagcct gtgggatccg aacatcactg cttgtaagaa gaatgaggag acagtagaag tgaacttcac aaccactccc ctgggaaaca gatacatggc tcttatccaa casagcacta tcatcgggtt ttctcaggtg tttgagccac accagaagaa acaaacgcga gcttcagtgg tgattccagt gactggggat agtgaaggtg ctacggtgca ggtaaagttc agtgagctgc tctggggagg gaagggacat agaagactgt tccatcattc attgctttta aggatgagtt ctctcttgtc aaatgcactt ctgccagcag acaccagtta agtggcgttc atgggggctc tttcgctgca gcctccaccg tgctgaggtc aggaggccga cgtggsagtt gtggtccctt ttgcttgtat taatggctgc tgaccttcca aagcactttt tattttcatt ttctgtcaca gacactcagg gatagcagta ccattttact tccgcaagcc tttaactgca agatgaagct gcaaagggtt tgaaatggga aggtttgagt tccaggcagc gtatgaactc tggagagggg ctgccagtcc tctctgggcc gcagcggacc cagctggaac acaggaagtt ggagcagtag gtgctccttc acctctcagt atgtctcttt caactctagt ttttgaggtg gggacacagg aggtccagtg ggacacagcc actccccaaa gagtaaggag cttccatgct tcattccctg gcataaaaag tgctcaaaca caccagaggg ggcaggcacc agccagggta tgatggctac tacccttttc tggagaacca tagacttcsc ttactacagg gacttgcatg tcctaaagca ctggctgaag gaagccaaga ggatcactgc tgctcctttt ttctagagga aatgtttgtc tasgtggtaa gatatgacct agccctttta ggtaagcgaa ctggtatgtt agtaacgtgt acaaagttta ggttcagacc ccgggagtct tgggcacgtg ggtctcgggt cactggtttt gactt'taggg ctttgttaca gatgtgtgac caaggggaaa atgtgcatga caacactaga ggtatgggcg aagccagaaa gaagggaagt tttggctgaa gtaggagtct tggtgagatt ttgctctgat gcatggtgtg aactttctga gcctcttgtt tttcctcagc tgactccata ttttcctact tgtggcagcg actgcatscg acataaagga acagttgtgc tstgcccaca aacaggcgtc cctttcsctc tggataacaa caaaagcaag csgggaggct ggctgcctct cctcctgctg tctctgctgg tggccacatg ggtgctggtg gcagggatct atctaatgtg gaggcacgaa aggatcaaga agacttcctt ttctaccacc acactactgc cccccattaa ggttsttgtg gtttacccat ctgaaatatg tttccatcac acaatttgtt acttcactga atttcttcaa aaccattgca gaagtgaggt catccttgaa aagtggcaga aaaagaaaat agcagagatg ggtccagtgc agtggcttgc cactcaaaag aaggcagcag acaaagtcgt cttccttctt tccaatgacg tcaacagtgt gtgcgatggt acctgtggca agagcgaggg cagtcccagt gagaactctc aagacctctt cccccttgcc tttaaccttt tctgcagtga tctaagaagc cagattcatc tgcacaaata cgtggtggtc tactttagag agattgatac aaaagacgat tacaa gctc tcagtgtctg ccccaagtac cacctcatga aggatgccac tgctttctgt gcagaacttc tccatgtcaa gcagcaggtg tcagcaggaa aaagatcaca agcctgccac gatggctgct gctccttgta gcccacccat gagaagcaag agaccttaaa ggcttcctat cccaccaatt acagggaaaa aasgtgtgat gatcctgaag cttactatgc agcctacaaa cagccttagt aattaaaaca ttttatacca ataaaatttt caaatattgc taactaatgt agcattaact aasgattgga aactacattt acaacttcaa agctgtttta tacatagaaa tcaattacag ttttaattga aaactataac cattttgata atgcaacaat aaagcatctt cagccaaaca tctagtcttc catagaccat gcattgcagt gtacccagaa ctgtttagct aatattctat gtttaattaa tgaatactaa ctctaagaac ccctcactga ttcactcaat agcatcttaa gtgaaaaasc ttctattaca tgcaaaaaat cattgttttt aagataacaa aagtagggaa taaacaagct gaaccsactt ttaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa Los Números de ID del Clon del Consorcio I.M.A.G.E. y los números de acceso de GenBank correspondientes de las secuencias identificadas que pertenecen a las agrupaciones del Consorcio I.M.A.G.E. y UniGene, se listan enseguida. También se incluyen secuencias que no son identificadas por tener un número de ID de Clon pero todavía identificadas como ser aquellas de IL17BR. Las secuencias incluyen aquellas de las secuencias de "sentido" y de hebras complementarias correspondientes a IL17BR. La secuencia de cada número de acceso de GenBank se presenta en el Apéndice adjunto. 48442 H14692 1302619 AA732635 1562857 AA928257 1731938 AI184427 1896025 AI298577 2336350 AI692717 1520997 AA910922 240506 H90761 2258560 AI620122 1569921 AI793318, AA962325, AI733290 6064627 BQ226353 299018 W04890 5500181 BM455231 2484011 BI492426 4746376 BG674622 233783 BX111256 1569921 BX117618 450450 AA682806 1943085 AI202376 1943085 2250390 4526156 BG403405 3249181 BE673417 2484395 AW021469 3.1E+07 CF455736 2878155 AW339874 4556884 BG399724 3254505 BF475787 3650593 BF437145 233783 H64601 Ninguno (secuencias de mRNA) AF212365, AF208110, AF208111, AF250309, AK095091 BM983744, CB305764, BM715988, BM670929, BI792416, BI715216, N56060, CB241389, AV660618, BX088671, CB154426, CA434589, CA412162, CA314073, BF921554, BF920093, AV685699, AV650175, BX483104, CD675121, BE081436, AW970151, AW837146, AW368264, D25960, AV709899, BX431018, AL535617, AL525465, BX453536, BX453537, AV728945, AV728939, AV727345 En una modalidad preferida, cualquier secuencia o porción única de la misma, de la siguiente secuencia IL17BR, identificada por AF208111 o AF20111.1, se puede utilizar en la práctica de la invención.
SEQ ID NO : 3 ( secuencia para : IL17BR) : CGGCGATGTCGCTCGTGCTGATAAGCCTGGCCGCGCTGTGCAGGAGCGCCGTACCCCGAG AGCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACATG ATCTAATCCCCGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAACTAGTGTTGCAA C_AGGGGACTATTCL?Í-ATTTTGATGAATGTAAGCTGGGTACTCCGGGC_AGATGCCAGCATCC GCTTGTTGAAGGCC?CC^AGATTTGTGTGACGGGC?AAAGCAACTTCCAGTCCTAC?GCT GTGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGACCAGACCCTCTGGTGGTAAAT GGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACACAGTCTATTTCATTGGGGCCC ATAATATTCCTAATGC?AATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCT (^CC?GGCTGCCTAGACCIA(^TAATGAAATAT_ ?AAAZ^AAGTGTGTCAAGGCCGGAAGCC TGTGGGATCCGAAGATC?CTGCTTGTAAGAAGA?TGAGGAGAC?GTAGAÑ.GTGAACTTC-?_ (^IACCIACTCCCCTGGGAAACAGATACATGGCTCTTATCC?ACACAGC?CTATC?TCGGGT TTTCTCL?GGTGTTTGAGCCAC?CC?GAAGAAAC^^ TGACTGGGGATAGTGA?GGTGCTACGGTGCAGGTAAAGTTCAGTGAGCTGCTCTGGGGAG GGAAGGGACATAGAAGACTGTTCCATCATTCATTGCTTTTAAGGATGAGTTCTCTCTTGT CAAZ_TGC1?_CTTCTGCC1AG(_?GA(-?CCAGTTAAGTGGCGTTCATGGGGGTTCTTTCGCTGC GCCTCCACCGTGCTGAGGTCAGGAGGCCGACGTGGCAGTTGTGGTCCCTTTTGCTTGTA TTAATGGCTGCTGACCTTCCAAAGCACTTTTTATTTTCATTTTCTGTCACAGACACTCAG GGATAGC1AGTACCATTTTACTTCCGC^!-AGCCTTTAACTGC_?^GATGAAGCTGCAA?GGGT TTGAAATGGGAAGGTTTGAGTTCCAGGCAGCGTATGAACTCTGGAGAGGGGCTGCCAGTC CTCTCTGGGCCGCAGCGGACCCAGCTGGAACACAGGAAGTTGGAGCAGTAGGTGCTCCTT C^CCTCTCAGTATGTCTCTTTCAACTCTAGTTTTTGAAGTGGGGACACAGGAAGTCCAGT GGGGAC?C^GCC?CTCCCCAAAGAATAAGGAACTTCCATGCTTC?TTCCCTGGCATAAAA AGTGL^GÑAACAC-ACCAGAGGGGG( GG(^C<^GCC?GGGTATGATGGGTACTACCCTT^ TCTGGAGA?CCATAGACTTCCCTTACTACAGGGACTTGCATGTCCTAAAGCACTGGCTGA AGGAAGCCAAGAGGATCACTGCTGCTCCTTTTTTGTAGAGGAAATGTTTGTGTACGTGGT AAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTTAGTAACGTGTACAAAGTT TAGGTTCAGACCCCGGGAGTCTTGGGCATGTGGGTCTCGGGTCACTGGTTTTGACTTTAG GGCTTTGTTACAGATGTGTGACC-AAGGGGAAAATGTGCATGACAACACTAGAGGTAGGGG CGAAGCCAGAAAGAAGGGAAGTTTTGGCTGAAGTAGGAGTCTTGGTGAGATTTTGCTGTG ATGCATGGTGTGAACTTTCTGAGCCTCTTGTTTTTCCTCAGCTGACTCCATATTTTCCTA CTTGTGGCAGCGACTGCL?_TCCGAC?TAAAGGAACAGTTGTGCTCTGCCC?C^^ACAGGCG TCCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGC TGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGC?CG AAAGGATCAAGAAGACTTCCTTTTCTACCACCACACTACTGCCCCCCATTAAGGTTCTTG TGGTTTACCCATCTGAAATATGTTTCCATCACACAATTTGTTACTTCACTGAATTTCTTC AAAACCL?_TTGCLAGA&GTGAGGTCATCCTTGA-^ TGGGTC(^GTGCAGTGGCTTGCCACTCAAAAGAAGGC?G(^GACAAAGTCGTCTTCCTTC TTCCAATGACGTO^C?GTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCA GTGAGAACTCTCA?GACCTCTTCCCCCTTGGCTTTAACCTTTTCTGCAGTGATCTAAGAA GCC-A.GATTCATCTGCA?AATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACG ATTACAATGCTCTCAGTGTCTGCGCCAAGTACCACTTCATGAAGGATGCCACTGCTTTCT GTGCAGAACTTCTCCATGT?^GCLAGCAGGTGTCAGCAGGAAAAAGATGACAAGCCTGCC ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCT ATCCCACCAATTACAGGGAAAAA?CGTGTGATGATCCTGAAGCTTACTATGC?GCCTACA AACAGCCTTAGTAATTAAAACATTTTATACCAATAAAATTTTCAAATATTACTAACTAAT GTAGCATTAACTAACGATTGGAAACTACATTTACAACTTCAAAGCTGTTTTATACATAGA AATC^^TTAC?GCTTTAATTGAÑAACTGTAAC(_?TTTTGATAATGCAACAATAAAGCATC TTCC^AAAAAAA AAA?AA?^AAAAA?AAAAAAA?A En modalidades preferidas de la invención, cualquier secuencia o porción única de la misma, de las secuencias CHDH de la agrupación, así como la agrupación Hs . 126688 de Homo sapiens de UniGene pueden ser utilizadas . De manera similar, cualquier secuencia que codifica toda o parte de la proteína codificada por cualquier secuencia de CHDH divulgada en la presente, incluyendo las secuencias de contiguo ensamblado nuevo, pueden ser utilizadas . Las secuencias consensúales de las agrupaciones del Consorcio de I . M.A. G . E . son como sigue, con la región de codificación asignada (que termina con un codón de terminación) subrayada y precedida por la región no traducida 5 ' y/o de no codificación y seguida por la región no traducida 3' y/o de no codificación previamente identificada : SEQ ID NO : 4 ( secuencia consensual para CHDH, identificada como NM_018397 o NMJD18397 . 1 ) : agcgggccgc ggccacccgc tcctcccgct ccggtcccga ctgtcgggct ctcggccgag tcgccccgga caatcacaaa gagtgtgtag gccagccccg gtcacagagt gcaccgtatc ctgtcacttc tggatgtgag ggagaagtga gtcatctcat tcccctccgt ggatcagagg acttggacta gatagaagca tgtggtgtct cctacgaggc ctgggscggc ctggagccct ggcacgggga gccctggggc agcagcaatc cctgggtgcc cgggccctgg ccagcgcagg ctctgagagc cgggacgagt acagctatgt ggtggtgggc gcgggctcgg cgggctgcgt gctggctggg aggctcacgg aggaccccgc cgagcgcgtg ctgctgctgg aggccgggcc caaggacgtg cgcgcgggga gsaagcggct stcgtggaag atccacatgc ccgcggccct ggtggccaac ctgtgcgacg acaggtacaa ctggtgctac cacacagagg tgsagcgggg cctggacggc cgcgtgctgt actggccacg cggccgcgtc tggggtggct cctcatccct caatgscatg gtctacgtcc gtgggcacgc cgaggactac gagsgctggc agcgscaggg cgcccgcggs tgggactacg cgcactgcct gccctacttc cgcaaggcgc agggccacga gctgggcgcc agccggtacc ggggcgccga tggcccgctg cgggtgtccc ggggcaagac caaccacccg ctgcactgcg cattcctgga ggccacgcag caggccggct acccgctcac cgaggacatg aatggcttcc agcaggaggg cttcggctgg atggacatga ccatccatga aggcaaacgg tggagcgcag cctgtgccta sctgcaccca gcactgagcc gcaccaacct caaggccgag gccgagacgc ttgtgagcag ggtgctattt gagggcaccc gtgcagtggg cgtggagtat gtcaagaatg gccagagcca cagggcttat gccagcaagg aggtgattct gagtggaggt gccatcaact ctccacagct gctcatgctc tctggcatcg ggaatgctga tgacctcaag aaactgggca tccctgtggt gtgccaccta cctggggttg gccagaacct gcaagaccac ctggagatct acattsagca ggcatgcasc cgccctatca ccctccattc 99a*gggagcc actgcccatc tggaaacagg tgggttcatc cgcagccagc ctggggtccc ccacscggac atccagttcc atttcctgcc atcccaagtg attgaccacg ggcgggtccc cacccagcag gaggcttacc aggtacatgt ggggcccatg cggggcacga gtgtgggctg gctcaaactg agaagtgcca atccccaaga ccaccctgtg atccagccca actacttgtc aacagaaact gatattgagg atttscgtct gtgtgtgaag ctcaccagag aaatttttgc acaggaagcc ctggctccgt tccgagggaa agagctccag ccaggaagcc acattcagtc agataaagag atagatgcst ttgtgcgggc aaaagccgac agcgcctacc acccctcgtg cacstgtaag atgggccagc cctccgatsc cactgccgtg gtggatccgc agacaagggt cctcggggtg gaaaacctca gggtcgtcga tgcctccatc atgcctagca tggtcagcgg caacctgaac gcccccacaa tcatgatcgc agagaaggca gctgacatta tcaaggggca gcctgcactc tgggacaaag atgtccctgt ctacaagccc aggacgctgg ccacccagcg ctaagacagt tgctgctgga ggatgaccag ggaagccccc tgataagcca agagggccag cacagccctt gctcccaggc tcctgcctga aactatctag cacactagga cccaggtggt accctactca gtggctgaga attggataaa gtcttgggaa atgagacaaa aaaaaaaaaa aa Los números de ID del Clon del Consorcio I.M.A.G.E. y los números de acceso de GenBank correspondientes de las secuencias identificadas que pertenecen a las agrupaciones del Consorcio I.M.A.G.E. y UniGene, se listan enseguida. También se incluyen secuencias que no son identificadas por tener un número de ID del clon pero todavía identificadas por ser aquellas de CHDH. Las secuencias incluyen aquellas de las secuencias de "sentido" y hebras complementarias correspondientes a CHDH. Las secuencias adicionales para el uso en la práctica de la invención son aquellas alineadas en la Figura 5, que también se proporcionan en el Apéndice adjunto. Número de ID del Clón/Número (s) de acceso de GenBank 4824572/BC034502 y BG720228 5191415/BI765156 5311690/BI667529 5267676/BI460380 1031605/AA609488 3842653/BE732217 4543273/BG336766 3504516/BE279319 3140587/BE279968 6297066/BQ648069 2734263/AW449121 2735859/AW450678 2720363/AW139168 3642981/BF195860 5931105/BQ066460 3574335/BF430927 3268842/BF435866 3267752/BF435185 1868020/AI264647 y BX116752 y AI733810 y AI7926322 2528186/AW337722 2028284/AI262965 3436048/BF940636 2344677/AI695649 123940/R00897 y R01524/ 240988/H90906 y H91018 240077/H82409 y H822667 Ninguno (secuencias de mRNA) /NM_018397.1 y AJ272267.1 y AK055402.1 Ninguno/AA772473.1 y BM682615.1 y BM713059.1 y BM716959.1 y BU738538.1 y AA324019.1 y AA302740.1 y 20981.1 y BF930030.1 y BQ303877.1 y BM769931.1 y AW900269.1 y 26419.1 y CB147231.1 y BE765491.1 AV656671.1 En una modalidad preferida, cualquier secuencia, o porción única de la misma, de las secuencias de CHDH en las Figuras 5 o 6 pueden ser utilizadas en la práctica de la invención. En otro conjunto de modalidades preferidas de la invención, cualquier secuencia, o porción única de la misma, de las secuencias de QPRT de la agrupación NM_014298 del Consorcio I.M.A.G.E. así como la agrupación Hs .126688 de Homo sapiens de UniGene pueden ser utilizadas. De manera similar, cualquier secuencia que codifica toda o una parte de la proteína codificada por cualquier secuencia QPRT divulgada en la presente puede ser utilizada. La secuencia consensual de la agrupación del Consorcio I.M.A.G.E. es como sigue, con la región de codificación asignada (que termina con un codón de iniciación) subrayada y precedida por la región no traducida ' y/o de no codificación y seguida por la región no traducida 3' y/o de no codificación: SEQ ID NO: 5 (secuencia consensual para QPRT, identificada como NM__014298 o NM_014298.2) : gtcctgagca gccaacacac cagcccagac agctgcaagt caccatggac gctgaaggcc tggcgctgct gctgccgccc gtcaccctgg cagccctggt ggacagctgg ctccgagagg actgcccagg gctcaactac gcagccttgg tcagcggggc aggcccctcg caggcggcgc tgtgggccaa atcccctggg gtactggcag ggcagccttt cttcgatgcc atatttaccc aactsaactg ccaagtctcc tggttcctcc ccgagggatc gaagctggtg ccggtggcca gagtggccga ggtccggggc cctgcccact gcctgctgct gggggaacgg gtggcsctca acasgctggc ccgctgcagt ggcattgcca gtgctgccgc sgctgcagtg gaggccgcca 999999csgg ctggactggg cacgtggcag gcacgaggaa gaccacgcca ggcttccggc tggtggagaa gtatgggctc ctggtgggcg gggccgcctc gcaccgctac gacctgggag ggctggtgat gttgaaggat aaccatgtgg tgccccccgg tggcgtggag aaggcggtgc gggcggccag acaggcggct gacttcgctc tgaaggtgga agtggaatgc agcagcctgc aggaggtcgt ccaggcagct gaggctggcg ccgaccttgt cctgctggac aacttcaagc cagaggagct gcaccccacg gccaccgcgc tgaaggccca gttcccgagt gtggctgtgg aagccagtgg gggcatcacc ctggacaacc tcccccagtt ctgcgggccg cacatagacg tcatctccat ggggatgctg acccaggcgg tcccagccct tgatttctcc ctsaagctgt ttgccaaaga ggtggctcca gtgcccaaaa tccactagtc ctaaaccgga agaggatgac accggccatg ggttaacgtg gctcctcagg accctctggg tcacacatct ttagggtcag tgaasaatgg ggcacatttg gcactagctt gagcccaact ctggctctgc cacctgctgc tsctgtgacc tgtcagggct gacttcacct ctgctcatct cagtttccta atctgtaaaa tgggtctaat aaaggatcaa ccaaaaaaaa aaaaaaaaaa aa Los números de ID del Clon del Consorcio I.M.A.G.E. y los números de acceso de GenBank correspondientes de las secuencias identificadas que pertenecen a las agrupaciones del Consorcio I.M.A.G.E. y UniGene, se listan enseguida. También se incluyen secuencias que no son identificadas por tener un número de ID del clon pero todavía identificadas como ser aquellas de QPRT. Las secuencias incluyen aquellas de las secuencias de "sentido" y de hebras complementarias correspondientes a QPRT. Las secuencias representativas de los números de acceso de GenBank enseguida se presentan en el Apéndice adjunto. Número de ID del clon/Número de acceso de GenBank 2960170/BC005060 y BE299670 y BE299712 D 3506460/BE273102 y BC010033 D 3959973/BC018910 y BE902622 D 267692/N23182 y N32648 D 3843834/BE735342 D 4872092/BX283118 y BG769505 D 4845859/BG750434 D 4868806/BG766440 D 4594651/BG401877 D 4553618/BG337811 D 4554044/BG338063 D 4473161/BG251163 D 4581127/BG396079 D 4136221/BF316915 D 4127089/BF313098 D 4508387/BG257831 D 5087154/BI252426 y BI252874 6085289/BU174626 5741237BM558378 4995462/BI088884 6720160/CA488404 5764841/BM926410 6208509/BQ879962 4581968/BG396587 5554997/BM477735 3451668/BE538581 5803440/BQ069150 6250974/BQ688755 6251079/BQ685759 5535758/BM468306 6146330/BU165540 1740729/AI191477 2729947/AW293885 6082577/BU174653 2753118/AW275889 2437568/AI884372 2507497/AI961218 5207705/BI771713 2067750/AI383718 263894/N28522 y H99843 5182393/BI518189 y BI517759 5417445/BM015407 6015713/BU175170 417111/ 87557 y W87461 4580196/BG395022 6271908/BQ648651 6298174/BQ652789 6271910/BQ653475 6271630/BQ647246 5798664/BM928534 6652195/BU860925 6299767/BQ651366 5225259/BI838658 4895399/BI198873 740128/AA477534 y AA479051 6172561/BU178924 4562784/BG326197 3957711/BE902093 6293406/BQ650920 Ninguno (secuencias de mRNA) /BT007231.1 y NM_014298.2 y AK090801.1 y D78177.1 Ninguno/CB156177.1 y BM711970.1 y BM675916.1 y BM675420.1 y BM714918.1 y AA337770.1 y A305670.1 y AA305611.1 y BU622082.1 y AV705250.1 y AL528086.2 y AL531128.2 y AL543783.2 y AL548817.2 y AL554386.2 y AL563056.2 y AL563955 2 y AL570131.2 y AL573234.2 y BF956608.1 y AV648116 1 y AV645766.1 y BF742969.1 y AL577191.2 y CD050133 1 y CB049103.1 y BX417895.1 y CB529044.1 y CD250136 1 y AA054830.1 y BX508036.1 y BX454610.1 En otro conjunto de modalidades preferidas de la invención, cualquier secuencia, o porción única de la misma, de las secuencias H0XB13 de la agrupación NM_006361 del Consorcio I.M.A.G.E. así como la agrupación Hs.66731 de Homo sapiens de UniGene pueden ser utilizadas. De manera similar, cualquier secuencia que codifica toda o una parte de la proteína codificada por cualquier secuencia H0XB13 divulgada en la presente puede ser utilizada. La secuencia consensual de la agrupación del Consorcio I.M.A.G.E. es como sigue, con la región de codificación asignada (que termina con un codon de terminación) subrayada y precedida por la región no traducida 5' y/o de no codificación y seguida por la región no traducida 3' y/o de no codificación: SEQ ID NO: 6 (secuencia consensual para HOXB13, identificada como NM_006361 o NM_006361.2) : cgaatgcagg cgacttgcga gctgggagcg atttaaaacg ctttggattc ccccggcctg 99^ggggaga gcgagctggg tgccccctag attccccgcc cccgcacctc atgagccgac cctcggctcc atggagcccg gcaattatgc caccttggat ggagccaagg atatcgaagg cttgctggga gcgggagggg ggcggaatct ggtcgcccac tcccctctga ccagccaccc agcggcgcct acgctgatgc ctgctgtcaa ctatgccccc ttggatctgc caggctcggc ggagccgcca aagcaatgcc acccatgccc tggggtgccc caggggacgt ccccagctcc cgtgccttat ggttactttg gaggcgggta ctactsctgc cgagtgtccc ggagctcgct gaaaccctgt gcccaggcag ccaccctggc cgcgtacccc gcggagactc ccacggccgg ggaagagtac cccagtcgcc ccactgagtt tgccttctat scgggatatc cgggaaccta ccacgctatg gccagttacc tggacgtgtc tgtggtgcag actctgggtg ctcctggaga accgcgacat gactccctgt tgcctgtgga cagttaccag tcttgggctc tcgctggtgg ctggaacagc cagatgtgtt gccagggaga acagaaccca ccaggtccct tttggaaggc agcatttgca gactccagcg ggcagcaccc tcctgacgcc tgcgcctttc gtcgcggccg caagaaacgc attccgtaca gcaaggggca gttgcgggag ctggagcggg agtatgcggc taacaagttc atcaccaagg acaagaggcg caagatctcg gcagccacca gcctctcgga gcgccagatt accatstggt ttcagaaccg ccgggtcaaa gagaagaagg ttctcgccaa ggtgaagaac agcgctaccc cttaagagat ctccttgcct gggtgggagg agcgaaagtg ggggtgtsct ggggagacca gaaacctgcc aagcccaggc tggggccaag gactctgctg agaggcccct agagacaaca cccttcccag gccactggct gstggactgt tcstcaggag cggcctgggt acccagtatg tgcagggaga cggaacccca tgtgacaggc ccactccacc agggttccca aagaacctgg cccagtcata atcattcatc ctcacagtgg caataatcac gataacsagt Los números de ID del Clon del Consorcio I.M.A.G.E. y los números de acceso de GenBank correspondientes de las secuencias identificadas que pertenecen a la cementaciones del Consorcio I.M.A.G.E. y UniGene, se listan enseguida.
También se incluyen secuencias que no son identificadas por tener un número de ID del clon pero todavía identificadas como que son aquellas de HOXB13. Las secuencias incluyen aquellas de las secuencias de "sentido" y hebras complementarias correspondientes a HOXB13. la secuencia de cada número de acceso de GenBank se presenta en el Apéndice adjunto. Números de ID de clon Números de acceso de GenBank ! « En una modalidad preferida, cualquier secuencia, o porción única de la misma, de la secuencia siguiente HOXB13, identificada por BC007092 o BC007092.1, se puede utilizar en la práctica de la invención. SEQ ID NO: 7 (secuencia para HOXB13) : GGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCG CACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAG CCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCC CTCCC CTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTC?ACTATGCCCCCTTGG ATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGG GGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAG TGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGG AGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGG GATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTC TGGGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTT GGGCTCTCGCTGGTGGCTGGAAC?GC(^GATGTGTTGCC-?-GGGAGAAC_AGAACCCACCAG GTCCCTTTTGGAAGGCAGCIATTTGCAGACTCCAGCGGGCAGCACCCTCCTGACGCCTGCG CCTTTCGTCGCGGCCGCIAAGA?ACGC?TTCCGTAC?GCAAGGGGCAGTTGCGGGAGCTGG AGCGGGAGTATGCGGCTAACAAGTTCATC1ACCAAGGACAAGAGGCGCAAGATCTCGGCAG CCACCAGCCTCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAGA AGAAGGTTCTCGCC?AGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGT GGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGG GCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTG GACTGTTCCT(^GGAGCGGCCTGGGTACCCLAGTATGTGC^GGGAGACGGAACCCCATGTG AC^GCCC?CTCC&CC^GGGTTCCCAAAGAACCTGGCCCAGTC^^ AGTGGCAATAATCACGATAACCAGTACTAGCTGCCATGATCGTTAGCCTCATATTTTCTA TCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGAGCTAATTATGAATAA ATTTGGAAAAAA?A?AA??AAAAAAAAAAAAAAAA Las secuencias identificadas por SEQ ID NO. se proporcionan utilizando representaciones convencionales de una hebra de DNA que inicia a partir del extremo enlazado de fosfato 5' al extremo enlazado de hidroxilo 3' . La asignación de las regiones de la codificación es generalmente por comparación a la(s) secuencia (s) consensual (es) disponible (s) y por lo tanto puede contener inconsistencias con relación a otras secuencias asignadas a la misma agrupación. Estos no tienen efecto sobre la práctica de la invención debido a que la invención puede ser practicada mediante el uso de segmentos más cortos (o combinaciones de lo mismos) de secuencias únicas para cada uno de los tres conjuntos descritos anteriormente y no afectados por las inconsistencias. Como ejemplos no limitativos, un segmento de la secuencia de ácido nucleico IL17BR, CHDH, QPRT o H0XB13 compuesto de una secuencia de región no traducida 3' y/o una secuencia del extremo 3' de la región de codificación puede ser utilizada como una sonda para la detección de la expresión IL17BR, CHDH, QPRT o HOXB13, sin ser afectado por la presencia de cualquier inconsistencia en las regiones de codificación debido a diferencias entre las secuencias. De manera similar, el uso de un anticuerpo que específicamente reconoce una proteína, o fragmento de la misma, codificada por las secuencias IL17BR, CHDH, QPRT o H0XB13 descritas en la presente, para detectar su expresión no sería afectado por la presencia de cualquier inconsistencia en la representación de las regiones de codificación proporcionadas en lo anterior. Como será apreciado por aquellos expertos en la técnica, algunas de las secuencias anteriores incluyen estiramientos 3' poly A (o poly T en la hebra complementaria) que no contribuyen a la unicidad de las secuencias divulgadas. La invención así puede ser practicadas con secuencias que carecen de los estiramientos 3' poly A (o poly T) . La unicidad de las secuencias divulgadas se refiere a las porciones o totalidades de las secuencias que se encuentran solamente en los ácidos nucleicos IL17BR, CHDH, QPRT o HOXB13, incluyendo secuencias únicas encontradas en la porción no traducida 3' de los genes. Las secuencias únicas preferidas para la práctica de la invención son aquellas que contribuyen a las secuencias consensúales para cada uno de los tres conjuntos tal que las secuencias únicas serán útiles en detectar la expresión en una variedad de individuos antes de ser específico para un polimorfismo presente en algunos individuos. Alternativamente, las secuencias únicas para un individuo o una subpoblación pueden ser utilizadas. Las secuencias únicas preferidas son de preferencia de las longitudes de polinucleótidos de la invención como se discute en la presente. Para determinar los niveles de expresión (incrementados o disminuidos) de las secuencias descritas en lo anterior en la práctica de la presente invención, se puede utilizar cualquier método conocido en la técnica. En una modalidad preferida de la invención, la expresión basada en la detección de RNA que híbrida polinucleótidos que contienen las secuencias descritas en lo anterior es utilizado. Esto es fácilmente realizado mediante cualquier método de detección de RNA o amplificación + detección conocido o reconocido como equivalente en la técnica tal como, no limitado a, transcripción inversa-PCR (opcionalmente PCR en tiempo real) , los métodos divulgados en la Patente Norteamericana No. 6,794,141, los métodos divulgados en la Patente Norteamericana No. 6,291,170 y la PCR cuantitativa. Los métodos para identificar la estabilidad de RNA incrementada (que da por resultado una observación de la expresión incrementada) o estabilidad de RNA disminuida (que da por resultado una observación de la expresión disminuida) también pueden ser utilizados. Estos métodos incluyen la detección de secuencias que incrementan o disminuyen la estabilidad de los mRNAs y contienen las secuencias IL17BR, CHDH, QPRT o HOXB13 divulgadas en a presente. Estos métodos también incluyen la detección de la degradación de mRNA incrementada. En modalidades particularmente preferidas de la invención, los polinucleótidos que tienen secuencias presentes en las regiones no traducidas 3' y/o de no codificación de las secuencias divulgadas en lo anterior se utilizan para detectar la expresión o no expresión de la secuencias IL17BR, CHDH, QPRT o HOXB13 en células de seno en la práctica de la invención. Tales polinucleótidos opcionalmente pueden contener as secuencias encontradas en las porciones 3' . De las regiones de codificación de las secuencias divulgadas anteriores. Los polinucleótidos que contiene una combinación de secuencias de las regiones de codificación y de no codificación 3' de preferencia tienen las secuencias arregladas contiguamente, sin secuencia (s) heteróloga (s) de intervención. Alternativamente, la invención puede ser practicada con polinucleótidos que tienen secuencias presentes en las regiones no traducidas 5' y/o de no codificación de las secuencias IL17BR, CHDH, QPRT o H0XB13 en células de seno para detectar sus niveles de expresión. Tales polinucleótidos opcionalmente pueden contener secuencias encontradas en las porciones 5' de las regiones de codificación. Los polinucleótidos que contiene una combinación de secuencias de las regiones de codificación y de no codificación 5' de preferencia tienen las secuencias arregladas contiguamente, sin secuencia (s) heteróloga (s) de intervención. La invención también puede ser practicada con secuencias presentes en las regiones de codificación de IL17BR, CHDH, QPRT o H0XB13. Los polinucleótidos preferidos contienen secuencias de las regiones no traducidas 3' o 5' y/o de no codificación de por lo menos aproximadamente 16, por lo menos aproximadamente 18, por lo menos aproximadamente 20, por lo menos aproximadamente 22, por lo menos aproximadamente 24, por lo menos aproximadamente 26, por lo menos aproximadamente 28, por lo menos aproximadamente 30, por lo menos aproximadamente 32, por lo menos aproximadamente 34, por lo menos aproximadamente 36, por lo menos aproximadamente 38, por lo menos aproximadamente 40, por lo menos aproximadamente 42, por lo menos aproximadamente 44 o por lo menos aproximadamente 46 nucleótidos consecutivos. El término "aproximadamente" como se utiliza en la oración previa se refiere a un incremento o disminución de 1 del valor numérico establecido. Aun más preferido son los polinucleótidos que contienen secuencias de por lo menos o aproximadamente 50, por lo menos o aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350 o por lo menos o aproximadamente 400 nucleótidos consecutivos. El término "aproximadamente" como se utiliza en la oración precedente se refiere a un incremento o disminución de 10% a partir del valor numérico establecido. Las secuencias del extremo 3' o 5' de las regiones de codificación descritas anteriormente como se encuentran en polinucleótidos de la invención son de las mismas longitudes como aquellas descritas en lo anterior, excepto que ellas naturalmente se han limitadas por la longitud de la región de codificación. El extremo 3' de una región de codificación puede incluir secuencias de hasta la mitad de 3' de la región de codificación. A la inversa, el extremo 5' de una región de codificación puede incluir secuencias hasta la mitad de 5' de la región de codificación. Por supuesto las secuencias descritas en lo anterior, o las regiones de codificación y polinucleótidos que contienen porciones de las mismas, pueden ser utilizados en sus totalidades. Los polinucleótidos que combinan las secuencias de una región no traducida 3' y/o de no codificación del extremo 3' asociado de la región de codificación son de preferencia por lo menos o aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350 o por lo menos o aproximadamente 400 nucleótidos consecutivos. De preferencia, los polinucleótidos utilizados son desde el extremo 3' del gen, tal como dentro de aproximadamente 350, aproximadamente 300, aproximadamente 250, aproximadamente 200, aproximadamente 150, aproximadamente 100 o aproximadamente 50 nucleótidos de la señal de poliadenilación o sitio de poliadenilación de un gen o secuencia expresada. Ls polinucleótidos que contiene mutaciones con relación a las secuencias de los genes divulgados también pueden ser utilizados mientras que la presencia de las mutaciones todavía permita la hibridación para producir una señal detectable. En otra modalidad de la invención, los polinucleótidos que contienen supresiones de nucleótidos desde el extremo 5' y/o 3' de las secuencias divulgadas en lo anterior pueden ser utilizados. Las supresiones son de preferencia de 1-5, 5-10, 10-15, 15-20, 20-25, 25-30, 30-35, 35-40, 40-45, 45-50, 50-60, 60-70, 70-80, 90-100, 100-125, 125-150, 150-175 o 175-200 nucleótidos desde el extremo 5' y/o 3' , aunque el grado de las supresiones naturalmente sería limitado por la longitud de las secuencias divulgadas y la necesidad ser capaz de utilizar los polinucleótidos para la detección de niveles de expresión. Otros polinucleótidos de la invención desde el extremo 3' de las secuencias divulgadas en lo anterior incluyen aquellas de cebadores y sondas opcionales para la PCR cuantitativa. De preferencia, los cebadores y las sondas son aquellos que amplifican una región de menos de aproximadamente 350, menos de aproximadamente 300, menos de aproximadamente 250, menos de aproximadamente 200, menos de aproximadamente 150, menos de aproximadamente 100 o menos de aproximadamente 50 nucleótidos a partir de la señal de poliadenilación o sitio de poliadenilación de un gen o secuencia expresada. En todavía otra modalidad de la invención, los polinucleótidos que contienen porciones de las secuencias divulgadas en lo anterior incluyendo el extremo 3' pueden ser utilizados en la práctica de la invención. Tales polinucleótidos contendrían por lo menos o aproximadamente 50, por lo menos o aproximadamente 100, por lo menos o aproximadamente 150, por lo menos o aproximadamente 200, por lo menos o aproximadamente 250, por lo menos o aproximadamente 300, por lo menos o aproximadamente 350 o por lo menos o aproximadamente 400 nucleótidos consecutivos desde el extremo 3' de las secuencias divulgadas. La invención así también incluye polinucleótidos utilizados para detectar la expresión IL17BR, CHDH, QPRT o H0XB13 en células de seno. Los polinucleótidos pueden comprender un polinucleótido más corto que consiste de secuencias encontradas en la SEQ ID NOS proporcionadas en lo anterior en combinación con secuencias heterólogas no encontradas naturalmente en combinación con laso secuencias IL17BR, CHDH, QPRT o H0XB13. Como ejemplos no limitativos, un polinucleótido que comprende una de las siguientes secuencias puede ser utilizada en la práctica de la invención. SEQE)NO:8: GCTCTCACTGGCaAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAAAAATTATTAC SEQIDNO:9: TGCCTAATTTCACTCTCAGAGTGAGGCAGGTAACTGGGGCTCCACTGGGTCACTCTGAGA SEQIDNO:10: GATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCA SEQ ID NO: 8 es una porción de la secuencia AI240933 mientras que SEQ ID NO: 9 es una porción de la secuencia AJ272267. Ellos corresponden a las posiciones "60mer" indicadas en la Figura 3. La SEQ ID NO: 10 es un polinucleótido capaz de hibridar algunas secuencias H0XB13 como es descrito en la presente. Así, la invención puede ser practicada con un polinucleótido que consiste de la secuencia de SEQ ID NOS: 8, 9 o 10 en combinación con una o más secuencias heterólogas que normalmente no se encuentran con la SEQ ID NOS: 8, 9 o 10. Alternativamente, la invención también puede ser practicada con un polinucleótido que consiste en la secuencia de SEQ ID NOS: 8, 9 o 10 en combinación con una o más secuencias que ocurren naturalmente que normalmente se encuentran con la SEQ ID NOS: 8, 9 o 10. Los polinucleótidos con secuencias que comprenden SEQ ID NOS: 8 o 9, ya sea que ocurren naturalmente o sintéticos, pueden ser utilizados para detectar ácidos nucleicos que son sobre expresados en células de cáncer de seno que son responsivas, y aquellos que no son sobreexpresado en células de cáncer de seno que no son responsivos, al tratamiento con TAM u otro agente "antiestrógenos" contra el cáncer de seno. Los polinucleótidos con secuencias que comprenden SEQ ID NO: 10 ya sea que ocurre naturalmente o sintéticos, se puede utilizar para detectar ácidos nucleicos que son subexpresados en células de cáncer de seno que son responsivas, y aquellas que no son subexpresados en células de cáncer de seno que no son responsivas, al tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno.
Las secuencias adicionales que pueden ser utilizadas en polinucleótidos como es descrito anteriormente para la SEQ ID NOS: 8 y 9 es la siguiente, que es complementaria a una porción de las secuencias IL17BR divulgadas en la presente: SEQIDNO:ll: TCCAATCGTTAGTTAATGCTACATTAGTT Las secuencias adicionales que pueden ser utilizadas en polinucleótidos como es descrito anteriormente para la SEQ ID NO: 10 son las siguientes, que son complementarias o una porción de las secuencias IL17BR divulgada en la presente: SEOIDNO:12: CAATTCATGAAAGCGGTTTCTAAAG Adicionalmente, los cebadores de secuencias definidas pueden ser utilizados para amplificar por PCR porciones de secuencias de CHDH para determinar su nivel de expresión. Por ejemplo, los cebadores que comprenden las siguientes secuencias pueden ser utilizados para amplificar una porción de la secuencia AI240933. Cebador delantero (SEQ ID NO: 13) : TGAAGTGTTTTTGCCTGGATCA Cebador trasero (SEQ ID NO: 14) : CACCACTTTGTTATGAAGACCTTACAA En algunas modalidades de la invención, los cebadores pueden ser utilizados en los métodos de RT-PCR cuantitativos, conocidos en la técnica, opcionalmente en la presencia de una sonda marcada o detectable que enlaza los ácidos nucleicos de doble hebra (tal como Sybr Green™) o una sonda específica tal como una sonda "TaqMan". En una modalidad, tal sonda puede comprender la secuencia AGTAAGAATGTCTTAAGAAGAGG (SEQ ID NO: 15) para la detección de la expresión AI240933. Adicionalmente, los polinucleótidos que contienen otras secuencias, particularmente secuencias únicas, presentes en moléculas de ácido nucleico que ocurren naturalmente que comprenden SEQ ID NOS: 8-15 pueden ser utilizados en la práctica de la invención. Otros polinucleótidos para el uso en la práctica de la invención incluyen aquellos que tienen suficiente homología a aquellas descritas anteriormente para detectar la expresión mediante el uso de técnicas de hibridación. Tales polinucleótidos de preferencia tienen aproximadamente 95%, aproximadamente 96%, aproximadamente 97%, aproximadamente 98% o aproximadamente 99% de identidad con la secuencias IL17BR, CHDH, QPRT o HOXB13 como es descrito en la presente. La identidad se determina utilizando el algoritmo BLAST, como es descrito en lo anterior. Los otros polinucleótidos para el uso en la práctica de la invención también pueden ser descritos en la base de habilidad para hibridar a polinucleótidos de la invención bajo condiciones severas de aproximadamente 30% v/v a aproximadamente 50% de formamida y de aproximadamente 01 M a aproximadamente 15 M de sal para hibridación y de aproximadamente 0.01 M a aproximadamente 0.15 M de sal para condiciones de lavado en aproximadamente 55 a aproximadamente 65 °C o más alta o condiciones equivalentes a las mismas. En una modalidad adicional de la invención, una población de moléculas de ácido nucleico de una sola hebra que comprenden una o ambas hebras de una secuencia IL17BR, CHDH, QPRT o HOXB13 humanas se proporciona como un sonda, tal que por lo menos una porción de la población puede ser hibridada a una o ambas de una molécula de ácido nucleico cuantitativamente amplificada a partir del RNA de una célula de cáncer de seno. La población puede ser solamente la hebra antisentido de una secuencia IL17BR, CHDH, QPRT o HOXB13 humanas tal que una hebra de sentido de una molécula de, o amplificada de, una célula de cáncer de seno puede ser hibridada en una porción de la población. En el caso de IL17BR o CHDH, la población de preferencia comprende una cantidad suficientemente en exceso de una o ambas hebras de una secuencia IL17BR o CHDH humana en comparación a la cantidad de moléculas de ácido nucleico expresadas (o amplificadas) que contienen una secuencia IL17BR o CHDH complementaria de una célula de seno normal. Esta condición de exceso permite la cantidad incrementada de expresión de ácido nucleico en una célula de cáncer de seno que sea fácilmente detectable como un incremento. Alternativamente, la población de moléculas de una sola hebra es igual o está en exceso de toda de una o ambas hebras de las moléculas de ácido nucleico amplificadas de una célula de cáncer de seno tal que la población es suficiente para hibridar a todas de una o ambas hebras. Las células preferidas son aquellas de un paciente de cáncer de seno que es ER+ o para quien el tratamiento con tamoxifen o uno o más de otros agentes "antiestrógeno" contra el cáncer de seno es contemplado. Las moléculas de una sola hebra por supuesto pueden ser de la forma desnaturalizada de cualquier secuencia IL17BR, CHDH, QPRT o HOXB13 que contiene molécula de ácido nucleico de doble hebra o polinucleótido como es descrito en la presente. La población también puede ser descrita por ser hibridada a una secuencia IL17BR o CHDH que contiene moléculas de ácido nucleico a un nivel por lo menos dos veces tanto como aquella por las moléculas de ácido nucleico de una célula de seno normal. Como en las modalidades descritas en lo anterior, las moléculas de ácido nucleico pueden ser aquellas cuantitativamente amplificadas a partir de una célula de cáncer de seno tal que ella refleja en la cantidad de expresión en la célula. La población de preferencia es inmovilizada sobre un soporte sólido, opcionalmente en la forma de una localización sobre un microarreglo. Una porción de la población de preferencia es hibridada a las moléculas de ácido nucleico cuantitativamente amplificadas de una célula de seno no normal o anormal mediante la amplificación de RNA. El RNA amplificado puede ser aquel derivado de una célula de cáncer de seno, mientras que la amplificación utilizada fue cuantitativa con respecto a las secuencias que contienen IL17BR, CHDH, QPRT o HOXB13. En otra modalidad de la invención, la expresión basada en la detección del estado de DNA puede ser utilizada. La detección del DNA de QPRT o HOXB13 como es metilada suprimida o de otra manera inactivada, puede ser utilizada como una indicación de la expresión disminuida como se encuentra en las células de seno no normales. Esto puede ser fácilmente realizado por los métodos basados en PCR conocidos en la técnica. El estado de las regiones de promotor de QPRT o HOXB13 también puede ser analizado como una indicación de la expresión disminuida de las secuencias QPRT o HOXB13. Un ejemplo no limitativo es el estado de metilación de las secuencias encontradas en la región de promotor. A la inversa, la detección del DNA de una secuencia como es amplificada puede ser utilizada como una indicación de la expresión incrementada como se encuentra en las células de seno no normales. Esto puede ser realizado fácilmente mediante los métodos basados en PCR, de hibridación in situ fluorescente (FIHS) y de hibridación in situ de cromosomas (CISH) conocidos en la técnica.
Una modalidad preferida usando un ensayo basado en ácido nucleico para determinar la expresión es mediante la inmovilización de una o más de las secuencias identificadas en la presente sobre un soporte sólido, incluyendo, pero no limitados a, un substrato sólido como un arreglo o a cuentas o la tecnología basada en cuentas como es conocido en la técnica. Alternativamente, los ensayos de expresión basados en solución conocidos en la técnica también pueden ser utilizados. La(s) secuencia (s) inmovilizada (s) puede estar en la forma de polinucleótidos como es descrito en la presente tal que el polinucleótido sería capaz de hibridar a un DNA o RNA correspondiente a la(s) secuencia (s) . El (los) polinucleótido (s) inmovilizado (s) se puede utilizar para determinar el estado de las muestras de ácido nucleico preparadas a partir de la célula (s) de cáncer de seno de la muestra, opcionalmente como parte de un método para detectar el estado ER en la(s) célula (s). Sin la limitar de la invención, tal célula puede ser de un paciente que sospecha que es afectado con, o en riesgo de desarrollar, cáncer de seno. El (los) polinucleótido (s) inmovilizado (s) necesita solamente ser suficiente para específicamente hibridar a las moléculas de ácido nucleico correspondientes derivadas de la muestra (y a la exclusión de la hibridación detectable o significante a otras moléculas de ácido nucleico) .
En todavía otra modalidad de la invención, una relación de los niveles de expresión de dos de los genes divulgados puede ser utilizada para predecir la respuesta al tratamiento con TAM u otro SERM. De preferencia, la relación es aquella de dos genes con patrones de expresión opuestos, tal como un gen subexpresado a un gen sobreexpresado, en correlación al mismo fenotipo. Ejemplos no limitativos incluyen la relación de H0XB13 sobre IL17BR o la relación de QPRT sobre CHDH. Este aspecto de la invención está basado en parte en la observación de que tal relación tiene correlación más fuerte con el resultado del tratamiento con TAM que el nivel de expresión de cualquier gen solo. Por ejemplo, la relación de tiene una presión de clasificación observada del 77%. Como un ejemplo no limitativo, los valores Ct de la detección basada en Q-PCR de los niveles de expresión de gen se puede utilizar para derivar una relación para predecir la respuesta al tratamiento con uno o más agentes "antiestrógeno" contra el cáncer de seno. Modalidades Adicionales de la Invención En modalidades donde solamente uno o unos cuantos genes van a ser analizados, el ácido nucleico derivado de la(s) célula (s) de cáncer de seno de la muestra puede ser preferencialmente amplificado mediante el uso de cebadores apropiados tal que solamente los genes que son analizados son amplificados para reducir las señales antecedentes contaminantes de otros genes expresados en la célula de seno. Alternativamente, y donde múltiples genes van a ser analizados o donde muy pocas células (o una célula) son utilizas, el ácido nucleico de la muestra puede ser globalmente amplificado antes de la hibridación a los polinucleótidos inmovilizados. Por supuesto el RNA, o la contraparte de cDNA del mismo puede ser directamente marcado y utilizada, sin amplificación, por métodos conocidos por la técnica. La expresión de secuencia basada en la detección de una presencia, incremento o disminución en los niveles o actividad de proteína también puede ser utilizada. La detección puede ser realizada mediante cualquier método basado inmunohistoquímica sobre (IHC) basado en fluido corporal (donde un polipéptido IL17BR, CHDH, QPRT o HXOB13 o fragmento del mismo, se encuentra en un fluido corporal, tal como, pero no limitado a sangre) , anticuerpo (incluyendo anticuerpos contra la proteína donde están presentes) basado en células exfoliadas (a partir del cáncer) basado en la, espectroscopia de masas y método basado en imagen (incluyendo el utilizado del ligando marcado donde es disponible) conocidos en la técnica y reconocidos como apropiados para la detección de la proteína. Los métodos basados en anticuerpo e imagen son adicionalmente útiles para la localización de tumores después de la determinación del cáncer mediante el uso de células obtenidas mediante un procedimiento no invasivo (tal como el lavado ductal o la aspiración con aguja fina) , donde la fuente de las células cancerosas no es conocida. Un anticuerpo o ligando marcado puede ser. utilizado para localizar el(s) carcinoma(s) dentro de un paciente. Los anticuerpos para el uso en tales métodos de detección incluyen anticuerpos policlonales, opcionalmente aislados de fuentes que ocurren de manera natural donde están disponibles, y anticuerpos monoclonal, incluyendo aquellos preparados mediante el uso de polipéptidos IL17BR, CHDH, QPRT o HXOB13 (o fragmentos de los mismos) como antígenos. Tales anticuerpos, así como fragmentos de los mismos (incluyendo pero no limitados a fragmentos Fab) funcionan para detectar o diagnosticar células de seno no normales o cancerosas en virtud de su habilidad para específicamente enlazar a polipéptidos IL17BR, CHDH, QPRT o HXOB13 para la exclusión de otros polipéptidos para producir una señal detectable. Los anticuerpos recombinantes, sintéticos e híbridos con la misma habilidad también pueden ser utilizados en la práctica de la invención. Los anticuerpos se pueden generar fácilmente mediante la inmunización con un polipéptido IL17BR, CHDH, QPRT o HXOB13 (o fragmento del mismo) , y sueros policlonales también pueden ser utilizados en la práctica de la invención. Los métodos de detección basados en anticuerpos son bien conocidos en la técnica e incluyen los ensayos de intercalación y de ELISA así como manchado de Western y los ensayos basados en citometría de flujo como ejemplos no limitativos. Las muestras para análisis en tales métodos incluyen cualquiera que contengan polipéptidos IL17BR, CHDH, QPRT o HX0B13 o fragmentos de los mismos. Ejemplos no limitativos incluyen aquellos que contienen células de seno y contenidos de células así como fluidos corporales (incluyendo sangre, suero, saliva, fluido linfático, así como secreciones mucosales y otras secreciones celulares como ejemplos no limitativos) que contienen los polipéptidos. Las modalidades de ensayo anteriores se pueden utilizar en un número de maneras diferentes para identificar o detectar la respuesta al tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno basado en la expresión del gen en una muestra de células de cáncer de seno de un paciente. En algunos casos, esto reflejaría una clasificación secundaria para el paciente, quienes ya se han sometido a la mamografía o al examen físico como una clasificación primaria. Si es positivo de la clasificación primaria, la biopsia de aguja subsecuente, lavado ductal, aspiración con aguja fina u otro método mínimamente invasivo o análogo puede proporcionar la muestra para el uso en las modalidades de ensayo antes, simultánea, o después del análisis para el estado de ER. La presente invención es particularmente útil en combinación con protocolos no invasivos, tal como el lavado ductal o la aspiración con aguja fina, para preparar una muestra de células de seno. La presente invención proporciona un conjunto de criterios más objetivo, en la forma de perfiles de expresión de gen de un conjunto discreto de genes, para discriminar (o delinear) entre los resultados del cáncer de seno. En modalidades particularmente preferidas de la invención, los ensayos se utilizan discriminar entre buenos y- pobres resultados después del tratamiento con tamoxifen u otro agente "antiestrógeno" contra el cáncer de seno. Las comparaciones que discriminan entre los resultados después de aproximadamente 10, aproximadamente 20, aproximadamente 30, aproximadamente 40, aproximadamente 50, aproximadamente 60, aproximadamente 70, aproximadamente 80, aproximadamente 90, aproximadamente 100 o aproximadamente 150 meses pueden ser realizadas . Mientras que buenos y pobres resultados de supervivencia pueden ser definidos relativamente en comparación entre sí, un resultado "bueno" puede ser visualizado como una proporción de supervivencia mejor que 50% después de aproximadamente 60 meses de intervención post-quirúrgica para remover el (los) tumor (es) de cáncer de seno. Un resultado "bueno" también puede ser una proporción de supervivencia mejor que aproximadamente 60%, aproximadamente 70%, aproximadamente 80% o aproximadamente 90% después de aproximadamente 60 meses de intervención post-quirúrgica. Un resultado "pobre" puede ser visualizado como una proporción de supervivencia de 50% o menor después de aproximadamente 60 meses de intervención post-quirúrgica para remover el (los) tumor (es) de cáncer de seno. Un resultado "pobre" también puede ser aproximadamente una proporción de supervivencia de 70% o menor después de aproximadamente 40 meses, o una proporción de supervivencia de aproximadamente 80% o menor después de aproximadamente 20 meses, de intervención post-quirúrgica. En otra modalidad de la invención basada en la expresión de unos cuantos genes, el aislamiento y el análisis de una muestra de célula de cáncer de seno puede ser realizado como sigue: (1) lavado ductal u otro procedimiento no invasivo se realiza sobre un paciente para obtener una muestra. (2) la muestra se prepara y se recubre sobre una platina de microscopio. Se observa que los resultados del lavado ductal en agrupaciones de células que son citológicamente examinadas como se mencionó anteriormente. (3) el patólogo o software de análisis de imagen explora la muestra para la presencia de células atípicas. (4) si se observan células atípicas, esas células son recolectadas (por ejemplo mediante microdisección tal como LCM) . (5) el RNA se extrae de las células recolectadas. (6) el RNA se analiza, directamente o después de la conversión a cDNA o amplificación del mismo, para la expresión de las secuencias IL17BR, CHDH, QPRT y/o HX0B13. Con el uso de la presente invención, los médicos expertos pueden prescribir o sostener el tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno basado en la prognosis determinada por la vía de la práctica de la presente invención. La discusión anterior también es aplicable donde se detecta una lesión palpable seguido por la aspiración con aguja fina o la bispsia con aguja de células a partir del seno. Las células se colocan sobre placas y se revisan por un patólogo y sistema de formación de imagen automatizado que selecciona las células para el análisis como es descrito en lo anterior. La presente invención también puede ser utilizada, sin embargo, con biopsias de tejido sólido, incluyendo aquella almacenadas como un espécimen FFPE. Por ejemplo, una biopsia sólida puede ser recolectada y preparada para la visualización seguido por la determinación de la expresión de uno o más genes identificados en la presente para determinar el resultado del cáncer de seno. Como otro ejemplo no limitativo, una biopsia sólida puede ser recolectada y preparada para la visualización seguido por la determinación de la expresión IL17BR, CHDH, QPRT y/o HX0B13. Un medio preferido es mediante el uso de la hibridación in situ con sonda (s) para la identificación de polinucleótido de proteína para analizar la expresión del (los) gen (es). En un método alternativo, la biopsia de tejido sólido se puede utilizar para extraer moléculas seguido por el análisis para la expresión de uno o más gene(s) . Esto proporciona la posibilidad de evitar la necesidad para la visualización y la recolección de solamente células cancerosas o células que se sospechan de ser cancerosas. Este método por supuesto puede ser modificado tal que solamente células que se han seleccionado positivamente son recolectadas y utilizadas para extraer moléculas para el análisis. Esto requeriría la visualización y selección como un prerrequisito para el análisis de expresión de gen. En el caso de una muestra 'FFPE, las células se- pueden obtener seguido por la extracción de RNA, amplificación y. detección como es descrito en la presente. En una alternativa en lo anterior, la(s) secuencia (s) identificada (s) en la presente puede ser utilizada como parte de un PCR simple o ensayo basado en arreglo simplemente para determinar la respuesta al tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno mediante el uso de una muestra de un procedimiento de muestreo no invasivo o mínimamente invasivo. La detección de la expresión de secuencia de las muestras puede ser mediante el uso de un microarreglo individual capaz de la expresión de ensayo de las secuencias divulgadas así como otras secuencias, incluyendo secuencias conocidas que no varían en niveles de expresión entre las células de seno normales y no normales, para conveniencia y preescisión mejorada. Otros sus de la presente invención incluyen proporcionar la habilidad para identificar muestras de células de cáncer de seno por tener diferentes respuestas al tratamiento con TAM u otro agente "antiestrógeno" contra el cáncer de seno para la investigación o estudio adicional. Esto proporciona un avance sobre los criterios genéticos/moleculares objetivos. En todavía otra modalidad de la invención basada en la expresión de múltiples genes en un patrón o perfil de expresión, el aislamiento y el análisis de una muestra de células de cáncer de seno se puede realizar como sigue: (1) lavado ductal u otro procedimiento no invasivo se realiza sobre un paciente para obtener una muestra. (2) la muestra se prepara y se recubre sobre una platina de microscopio. Se observa que los resultados del lavado ductal en las agrupaciones de células que son citológicamente examinadas como se mencionó en lo anterior. (3) el patólogo o software de análisis de imagen explora la muestra para la presencia de células de cáncer de seno no normales y/o atípicas . (4) si se observan tales células, esas células son recolectadas (por ejemplo mediante microdisección tal como LCM) . (5) el RNA se extrae de las células recolectadas. (6) el RNA se purifica, se amplifica y se marca. (7) el ácido nucleico marcado se pone en contacto con un microarreglo que contiene polinucleótidos complementarios a todos o parte de uno o más de los genes identificados en la presente como es correlacionado con las discriminaciones entre los resultados de cáncer de seno bajo condiciones de hibridación adecuadas, luego se procesa y se explora para obtener un patrón de intensidades de cada mancha (con relación a un control para la expresión de gen general en células) que determinan el nivel de expresión del (los) gene(s) en las células. (8) el patrón de intensidad se analiza mediante comparación con los patrones de expresión de los genes en muestras conocidas de células de cáncer de seno correlacionadas con los resultados (relativo al mismos control) . Un ejemplo específico del método anterior sería realizar el lavado ductal después de una clasificación primaria, observar y recolectar células no normales y/o atípicas para el análisis. La comparación con los patrones de expresión conocidos, tales como aquellos hechos posible mediante un modelo generado por un algoritmo (tal como, pero no limitado al análisis de tipo vecino más cercano, SVM o redes neurales) con datos de expresión de gen de referencia para los diferentes resultados de supervivencia de cáncer de seno, identifica las células como que son correlacionadas con sujetos con buenos o pobres resultados. Otro ejemplo sería tomar un tumor de seno removido de un sujeto después de la intervención quirúrgica, opcionalmente convertir todo o parte de éste a una muestra FFPE antes del aislamiento subsecuente y la preparación de las células de cáncer de seno a partir del tumor para la determinación y/o identificación de células atípicas, no normales o de cáncer y el aislamiento de las células seguido por las etapas 5 hasta 8 anteriores.
Alternativamente, la muestra puede permitir la recolección de células tanto normales así como de cáncer para el análisis. Los patrones de expresión de gen para cada una de estas dos muestras será comparado entre sí así como el modelo y las comparaciones normales contra individuales en los mismos basados en el conjunto de datos de referencia. Este procedimiento puede ser significativamente más potente que las células de cáncer solamente se aproximan debido a que utiliza información más significativa a partir de las células normales y las diferencias entre las células normales y de cáncer (en ambos de los conjuntos de muestra y de datos de referencia) para determinar el resultado del cáncer de seno del paciente basado en la expresión de gen en las células de cáncer de la muestra. Los genes identificados en la presente también pueden ser utilizados para generar un modelo capaz de predecir la supervivencia de cáncer de seno y los resultados de recurrencia de una muestra de células de seno ER+ basado en la expresión de los genes identificados en la muestra. Tal modelo puede ser generado mediante cualquiera de los algoritmos descritos en la presente o de otra manera conocidos en la técnica así como aquellos reconocidos como equivalentes en la técnica utilizando gen (es) (y subconjuntos de los mismos) divulgados en la presente para la identificación de los resultados de cáncer de seno. El modelo proporciona un medio para comparar los perfiles de expresión de gen (es) del subconjunto de la muestra contra los perfiles de datos de referencia utilizados para construir el modelo. El modelo puede comparar el perfil de muestra contra cada uno de los perfiles de referencia o contra un modelo que define las dimensiones hechas basadas en los perfiles de referencia. Adicionalmente, los valores relativos del perfil de muestra pueden ser utilizados en comparación con los perfiles de modelo o de referencia. En una modalidad preferida de la invención, las muestras de células de seno identificadas como normales y cancerosas a partir del mismo sujeto pueden ser analizadas, opcionalmente mediante el uso de un microarreglo individual, para sus perfiles de expresión de los genes utilizados para generar el modelo. Esto proporciona un medio ventajoso para identificar resultados de supervivencia y recurrencia basado en las diferencias relativas a partir del perfil de expresión de la muestra normal. Estas diferencias luego pueden ser utilizadas en comparación con diferencias entre datos de referencia cancerosas individuales y normales que también se utilizaron para generar el modelo. Artículos de Manufactura Los materiales y métodos de la presente invención son idealmente adecuados para la preparación de equipos producidos de acuerdo con .procedimientos bien conocidos. La invención así proporciona equipos que comprenden agentes (similares a los polinucleótidos y/o anticuerpos descritos en la presente como ejemplos no limitativos) para la detección de expresión de las secuencias divulgadas. Tales equipos, que opcionalmente comprenden el agente con una descripción o marca de identificación o instrucciones relacionadas con su uso en los métodos de la presente invención, son proporcionados. Tal equipo puede comprender contenedores, cada uno con uno o más de diversos reactivos (típicamente en forma concentrada) utilizados en los métodos, incluyendo, por ejemplo, microarreglos pre-fabricados, soluciones reguladoras, los trifosfatos de nucleótido apropiados (por ejemplo, dATP, dCTP, dGTP y dTTP; o rATP, rCTP, rCTP, rGTP y UTP) , transcriptasa inversar, DNA polimerasa, RNA polimerasa y uno o más complejos de cebadores de la presente invención (por ejemplo, poli(T) de longitud apropiada o cebadores aleatorios enlazados a un promotor reactivo con RNA polimerasa) . Un conjunto de instrucciones también típicamente será incluido. Los métodos proporcionados por la presente invención también pueden ser automatizados por completo o en parte. Todos los aspectos de la presente invención también pueden ser practicados tal que ellos consisten esencialmente de un subconjunto de los genes divulgados para la exclusión del material irrelevante para la identificación de los resultados de supervivencia de cáncer de seno por la vía una muestra que contiene células. Habiéndose ahora descrito generalmente la invención, la misma será más fácilmente entendida a través de la referencia de los siguientes ejemplos que se proporcionan a manera de ilustración, y no proponen para ser limitativos de la presente invención, a menos que sea especificado. Ejemplos Ej emplo 1 Métodos generales Criterios de selección de paciente y de tumor y diseño del estudio Los criterios de inclusión de paciente para este estudio fueron: Mujeres diagnosticadas en el Hospital General de Massachusetts (MGH) entre 1987 y 2000 con cáncer de seno ER positivo, tratamiento con cirugía de seno estándar (mastectomía radical modificada o lumpectomía) y radiación seguido por cinco años de tamoxifen adyuvante sistémico; ningún paciente recibió quimioterapia antes de la recurrencia. Los datos clínicos y de seguimiento se derivaron del registro de tumor de MGH. No hubo perdida de los datos de registro y todos los registros médicos disponibles se revisaron como una segunda hilera de confirmación de datos. Todos los especímenes de tumor recolectados en el tiempo de la diagnosis inicial se obtuvieron a partir de depósitos de tejido congelados e incrustados en parafina fijados con formalina (FFPE) en el hospital general de Massachusetts. Las muestras de tumor con mayor que 20% de células de tumor se seleccionaron con una media de mayor que 75% para todas las muestras. Cada muestra se evaluó para las siguientes características: tipo de tumor (ductal contra lobular) , tamaño de tumor y el grado histológico combinado de Nottingham. La expresión del receptor de estrógeno y progesterona se determinó mediante el análisis de enlace de hormona bioquímico y/o mediante el manchado inmunohistoquímico como es descrito (Long, A. A. y colaboradores, "High-specificity in-situ hybridization. Methods and application. "Diagn Mol Pathol 1, 45-57 (1992)); la positividad del receptor se definió como mayor que 3 fmol/mg de tejido de tumor (Long y colaboradores) y mayor que 1% de manchado nuclear para los ensayos bioquímicos e inmunohistoquímicos, respectivamente . El diseño del estudio es como sigue: Un conjunto de entrenamiento de 60 especímenes de cáncer de seno congeladas se seleccionaron para identificar señales de expresión de gen predictivos del resultado o respuesta, en el conjunto de la terapia con tamoxifen adyuvante. Los tumores de los respondedores se igualaron a los no respondedores con respecto a la etapa de TNM y al grado de tumor. La expresión de gen de diferencial identificada en el junto de entrenamiento se validó en un grupo independiente de 20 tumores de ser invasivos con muestras de tejido e incrustada parafina fijado con formalina (FFPE) . LCM, aislamiento de RNA y amplificación Con cada muestra de tumor congelado dentro del grupo de 60 casos, el RNA se aisló de tanto una sección de tejido completo de 8 µm de espesor y una población altamente enriquecida de 4,000-5,000 células epiteliales malignas adquiridas mediante la microdisección de captura con láser utilizando un sistema PixCell lie LCM (Arcturus, Mountain View, CA) . A partir de cada muestra de tumor dentro del conjunto de prueba 20 casos, el RNA se aisló de cuatro secciones de tejido FEPP de 8 µm de espesor. El RNA aislado se sometió a una ronda de T7 polimerasa de la transcripción in vitro utilizando el equipo RiboAmp™ (muestras congeladas) u otro sistema para las muestras FFPE de acuerdo con las instrucciones del fabricante (Arcturus Bioscience, Inc., Mountain View, CA) . El cRNA marcado se generó mediante una segunda ronda de transcripción in vitro de RNA basado en T7 en la presencia de 5- [3-Aminoalil]uridina 5' -trifosfato (Sigma-Aldrich, St. Louis, MO) . El RNA de referencia humano universal (Stratagene, San Diego, CA) se amplificó de la misma manera. El aRNA purificado se conjugó después con el tinte Cy5 (muestras experimentales) o Cy3 (muestra de referencia (Amersham Biosciences) .
Análisis de microarreglo Un microarreglo de oligonucleótido de (60 mer) de 22,000 genes diseñado a la medida se fabricó utilizando la tecnología de síntesis in-situ de chorro de tinta (Agilent Technologies, Palo Alto, CA) . El RNA de muestra marcado con Cy5 y el RNA de referencia marcados con Cy3 se có-hibridaron a 65 °C, solución reguladora de hibridación IX (Agilent Technologies). Las platinas se lavaron a 37°C con' 0.1X SSC/0.005% Tritón X-102. El análisis de imagen se realizó utilizando el software de análisis de imagen de Agilent. Las relaciones de Cy5/Cy3 se normalizaron utilizando la regresión no lineal dependiente de intensidad. Una matriz de datos que consiste esencialmente de relaciones de Cy5/Cy3 normalizadas de todas las muestras se centraron al medio para gen. La variación de cada gen sobre todas las muestras se calculó y los genes de alta variación de 25% superior (5,475) se seleccionaron para el análisis adicional. La prueba de identificación y permutación para el significado de la expresión de gen diferencial se realizaron utilizando BRB ArrayTools, desarrollado por el Dr. Richard Simón y Amy Peng (ver el sitio HTTP en linus.nci.nih.gov/BRB-ArrayTool.html). El análisis de agrupación jerárquica se realizó con el software GeneMaths (Applied-Maths, Bélgica) utilizando la correlación de coseno y el enlace completo. Todos los otros procedimientos estadísticos (prueba t de dos muestras, análisis de características de operación de receptor, regresión logística multivariada y análisis de supervivencia) se realizaron en el ambiente estadístico R de fuente abierta (ver el sitio http a www.r-project.org). La prueba estadística del significado de las curvas ROC fue el método de DeLong ("Comparing the áreas under two or more correlated receiver operating characteristic curves: a nonparametric approach. "Biometrics 44, 837-45 (1988)). La supervivencia libre de enfermedad se calculó a partir de los datos de diagnosis. Los eventos se registraron en la primer metástasis distante, y los pacientes que permanecen libres de enfermedad en el último seguimiento fueron censurados . Las curvas de supervivencia se calcularon mediante los estimados de Kaplan-Meiler y se compararon mediante las pruebas de log-rank. Análisis de PCR Cuantitativo en Tiempo Real La PCR en tiempo real se realizó en 59 de los 60 casos de muestras de entrenamiento (un caso se excluyó debido a materiales insuficientes) y las muestras de validación de 20 casos. Brevemente, 2 µg del RNA amplificado se convirtió en cDNA de doble hebra. Para cada caso 2 ng de cDnA por triplicado se utilizó para la PCR en tiempo real con una ABI 7900HT (Applied Biosystems) como es descrito (Gelmini, S. y colaboradores, "Quantitative polymerase chain reaction-based homogeneous assay with fluorogenic probes to measure c-erbB-2 oncogene amplification. "Clin Chem 43, 752-8 (1997)). Las secuencias de los pares de cebadores de PCR y la sonda MGB fluorogénica (5' a 3'), respectivamente, que se utilizaron para cada gen son como sigue: HoxBl3 TTCATCCTGACAGTGGCAATAATC, CTAGATAGAAA?TATGAGGCTAACGATCAT, VIC-CGATAACCAGTACTAGCTG; IL17BR GCATTAACTAACGATTGGAAACTACATT, GGAAGATGCTTTATTGTTGCATTATC, VIC-ACAACTTCAAAGCTGTTTTA. Los niveles de expresión relativos de HOXB13 en muestras normales, DCIS e IDC se calcularon como sigue. Primero, todos los valores CT se ajustaron al sustraer el CT más alto (40) entre todas las muestras, luego la expresión relativa = 1/2 CT. Hibridación In Situ Sondas de RNA marcadas con DIG se preparan utilizando el equipo de marcación de RNA de DIG (SP6/T7) Roche Applied Science, siguiendo el protocolo proporcionado c con el equipo. La hibridación in situ se realizó en secciones de tejido congeladas como es descrito (Long y colaboradores) . Tabla 1. Características de los pacientes y del tumor del co unto de entrenamiento .
Muestra Tipo de ID tumor Tamaño Grado Nodos ER PR Edad DFS Estado 1389 D 1.7 2 0/1 Pos Pos 80 94 0 648 D 1.1 2 0/15 Pos ND 62 160 0 289 D 3 2 0/15 Pos ND 75 63 1 749 D 1.8 2 2/9 Pos Pos 61 137 0 420 - D/L 2 3 ND Pos Pos 72 58 1 633 D 2.7 3 0/11 Pos ND 61 20 1 662 D 1 3 6/11 Pos Pos 79 27 1 849 D 2 1 0/26 Pos Neg 75 23 1 356 D 1 2 2/20 Pos ND 58 24 1 1304 D 2 3 0/14 Pos Pos 57 20 1 1419 D 2.5 2 1/8 Pos Pos 59 86 0 1093 D 1 3 1/14 Pos Pos 66 85 0 1047 D/L 2.6 2 0/18 Pos Neg 70 128 0 1037 D/L 1.5 2 0/4 Pos Pos 85 83 0 319 D 4 2 1/13 Pos ND 67 44 1 D 3.5 2 0/9 Neg Pos 62- 75 1 180 D 1.6 2 2/19 Pos Pos 69 169 0 687 D 3.5 3 3/16 Pos ND 73 142 0 856 D 1.6 2 0/16 Pos Pos 73 88 0 1045 D 2.5 3 1/12 Pos Neg 73 121 0 1205 D 2.7 2 1/19 Pos Pos 71 88 0 1437 D 1.7 2 2/22 Pos Pos 67 89 0 1507 D 3.7 3 0/40 Pos Pos 70 70 0 469 D 1 1 0/19 Pos ND 66 161 0 829 D 1.2 2 0/9 Pos ND 69 136 0 868 D 3 3 0/13 Pos Pos 65 130 0 1206 D 4.1 3 0/15 Pos Neg 84 56 1 843 D 3.4 2 11/20 Pos Neg 76 122 1* 342 D 3 2 9/21 Pos ND 62 102 1 1218 D 4.5 1 3/16 Pos Pos 62 10 1 547 D/L 1.5 2 ND Pos ND 74 129 1 1125 D 2.6 2 0/18 Pos Pos 54 123 0 1368 D 2.6 2 ND Pos Pos 82 63 0 605 D 2.2 2 6/18 Pos ND 70 110 0 59 L 3 2 33/38 Pos ND 70 21 1 68 D 3 2 0/17 Pos ND 53 38 1 317 D 1.2 3 1/10 Pos Pos 71 5 1 374 D -1 3 0/15 Pos Neg 57 47 1 823 D 2 2 0/6 Pos Pos 51 69 1 280 D 2.2 3 0/12 Pos ND 66 44 1 651 D 4.7 3 10/13 Pos ND 48 137 1 763 D 1.8 2 0/14 Pos Pos 63 118 0 1085 D 4.7 2 0/8 Pos Pos 48 101 1 1363 D 2.1 2 0/15 Pos Pos 56 114 0 295 D 3.5 2 3/21 Pos Pos 52 118 1 871 D 4 3 0/16 Pos Neg 61 6 1 1343 D 2.5 3 ND Pos Pos 79 21 1 140 L >2.0 2 18/28 Pos ND 63 43 1 260 D/L 0.9 2 1/13 Pos ND 73 42 1 297 D 0.8 2 1/16 Pos Pos 66 169 0 1260 D 3.5 2 0/14 Pos Pos 58 79 0 1405 D 1 3 ND Pos Pos 81 95 0 518 L 5.5 2 3/20 Pos ND 68 156 0 607 D 1.2 2 5/14 Pos Pos 76 114 0 638 D 2 2 1/24 Pos Pos 67 148 0 655 D 2 3 ND Pos Pos 73 143 0 772 D 2.5 2 0/18 Pos Pos 68 69 1 887788 DD//LL 1.6 2 0/9 Pos Neg 76 138 0 1279 D 2 2 0/12 Pos Pos 68 102 0 1370 D 2 2 ND Pos Pos 73 61 0 Abreviaciones : D, ductal; L, lobular; D/L. características ductales y lobulares; pos, positivo; neg, negativo; ND, no determinado; ER, receptor de estrógeno; PR, receptor de progesterona; DFS, supervivencia libre de enfermedad (número de meses) ; estado = 1, recurrido; estado = 0, lbre de enfermedad. Ejemplo 2 Identificación de genes diferencialmente expresados La perfilación de la expresión . de gen se realizó utilizando un microarreglo de oligonucleótido de 22,000 genes como es descrito en lo anterior. En el análisis inicial, el RNA aislado de las secciones de tejido de tumor congelado tomados de las biopsias primarias logradas se utilizaron. El conjunto de datos de expresión resultante primero se filtró basado en la variación total de cada gen con los 5,475 genes de alta variación superior (75= porcentil) seleccionado para el análisis adicional. Utilizando es conjunto de datos reducidos, la prueba t se realizó en cada gen comparando los respondedores y no respondedores a tamoxifen, conduciendo a la identificación de 19 genes diferencialmente expresados en el corte de valor P de 0.001 (Tabla 2). La probabilidad de seleccionar esto de muchos o más genes diferencialmente expresados por oportunidad que se estimó que es de 0.04 al permutar aleatoriamente la clase del paciente con respecto al resultado del tratamiento y al repetir del procedimiento de prueba t 2,000 veces. Este análisis así demostró la existencia de diferencias estadísticamente significantes en la expresión de gen entre los cánceres de seno primarios de respondedores y no respondedores a tamoxifen. Tabla 2. Señal de 19 genes identificadas por la prueba t en el conjunto de datos de las Secciones Para refinar el análisis de los inventores a las células de tumor y evitar la viabilidad potencial atribuible a la contaminación de células estromáticas, el mismo grupos se reanalizó después de la microdisección de captura con láser (LCM) de células de tumor dentro de cada sección de tejido. Utilizando la filtración del gen basada en la ' variación y la clasificación de prueba t idéntica aquella utilizada para el conjunto de datos de sección de tejido completo, 9 secuencias de gen diferencialmente expresadas se identificaron con P <0.001 (Tabla 3). Tabla 3. Señal de 9 genes identificada por la prueba t en el conjunto de datos LCM Solo 3 genes se identificaron como diferencialmente expresados en ambos de los análisis de LCM y sección de tejido completo: el gen homeobox H0XB13 (identificado dos veces como AI7003663 y BC007092) , el receptor de interieucina 17B y IL17BR (AF208111) y el canal de calcio activado con voltaje CACN1D (AI240933) . H0XB13 se sobreexpresó diferencialmente en los casos no responsivos a tamoxifen, mientras que IL17BR y CACNA1D se sobreexpresaron en los casos responsivos a tamoxifen. De manera interesante, la secuencia QPRT tuvo similitudes a la secuencia XOHB13 en relación a los niveles de expresión en respondedores y no respondedores. Basado en su identificación como marcadores de tumor significativamente asociados con el resultado clínico en dos análisis independientes, la utilidad de cada uno de estos genes se evaluó por sí mismo y en combinación con los otros. Para definir la sensibilidad y especificidad de la expresión HOXB13, IL17BR y CACNA1D como marcadores de resultado clínico, se utilizó el análisis de Característica de Operación de Recptor (ROC) (Pepe, M. S. "A interpretation for the ROC curve and inference using GLM procedures". Biometrics 56, 352-9 (2000) ) . Para los datos derivados de la secciones de tejido completo, los valores del Área Bajo la Curva (AÜC) para IL17BR, HOXB13 y CACNAID fueron 0.79, 0.67 y 0.81 para IL17BR, HOXB13 y CACNAlD, respectivamente (ver a Tabla 4 y la Fig. 1, porción superior) . El análisis de ROC de los datos generados de las células de tumor microdisectadas produjeron valores AUC de 0.76, 0.8 y 0.76 para estos genes (ver la Tabla 4 y la Fig. 1, porción inferior) . Tabla 4. Análisis de ROC de la utilización de la expresión IL17BR, CAC A1D y HOXB13 para predecir la respuesta a tamoxifen Respuestas de Tejido LCM AUC Valor P AÜC Valor P IL17BR 0.79 1.58E-06 0.76 2.73E-05 CACNA1D 0.81 3.02E-08 0.76 1.59E-05 HOXB13 0.67 0.012 0.79 9.94E-07 ESR1 0.55 0.277 0.63 0.038 PGR 0.63 0.036 0.63 0.033 ERBB2 0.69 0.004 0.64 0.027 EGFR 0.56 0.200 0.61 0.068 AUC, área bajo la curva; valores P are AUC > 0.5. Una prueba estadística del significado indicó que estos valores de AUC todos son significativamente más grandes que 0.5, el valor expectado del modelo nulo que predice el resultado clínico aleatoriamente. Por lo tanto, estos tres genes tienen utilidad potencial para predecir el resultado clínico de la terapia con tamoxifen adyuvante. Como comparación, los marcadores que son actualmente útiles en evaluar la respuesta a tamoxifen se analizaron en comparación. Los niveles de ER (símbolo de gen ESR1) y recetor de progesterona (PR, símbolo de gen PGR) se conocen que están positivamente correlacionados con la respuesta a tamoxifen (ver Fernandez, M. D. y colaboradores, "Quantitative oestrogen and progesterone receptor valúes in primary breast cáncer and predictability of response to endocrine therapy". Clin Oncol 9, 245-50 (1983); Ferno, M. y colaboradores, "Results of two or five years of adjuvant tamoxifen correlated to steroid receptor and S-phase levéis". South Sweden Breast Cáncer Group, and South-East Sweden Breast Cáncer Group. Breast Cáncer Res Treat 59, 69-76 (2000) ; Nardelli, G. B. y colaboradores, "Estrogen and progesterone receptors status in the prediction of response of breast cáncer to endocrine therapy (preliminary report)". Eur J Gynaecol Oncol 7, 151-8 (1986); y Osborne, C. K. y colaboradores, "The valué of estrogen and progesterone receptors in the treatment of breast cáncer". U 46, 2884-8 (1980) ) . Además, las rutas de señalización del factor de crecimiento (EGFR, ERBB2) se piensan que regulan negativamente la señalización dependiente del estrógeno, y por consiguiente contribuyen a la pérdida de respuesta a tamoxifen (ver Dowsett, M. "Overexpression of HER-2 as a resistance mechanism to hormonal therapy for breast cáncer". Endocr Relat Cáncer 8, 191-5 (2001)). El análisis de ROC de estos genes confirmó su correlación con el resultado clínico, pero con valores de AUC que varían solamente de 0.55 a 0.69, alcanzando el significado estadístico de PGR y ERBB2 (ver la Tabla 4) . El conjunto de datos LCM es particularmente relevante, puesto que EGFR, ERBB2, ESR1 y PGR están actualmente medidos al nivel de célula de tumor utilizando ya sea inmunohistoquímica o la hibridación in situ de fluorescencia. Como marcadores clínicos individuales del resultado clínico, HOXB13, IL17BR y CACID todos se realizaron para ESR1, PGR, EGFR y ERBB2 (ver la Tabla 4) . Ejemplo 3 Identificación de la Relación de Expresión HQXB13 :EL17BR La relación de expresión HOXB13: IL17BR se identificó como un predictor compuesto robusto del resultado como sigue. Puesto que HOXB13 y IL17BR tiene patrones opuestos de expresión, la relación de expresión de HOXB13 sobre IL17BR se examinó para determinarse proporciona un mejor predictor compuesto de la respuesta a tamoxifen. En realidad, ambos análisis de prueba t y ROC demostraron que la relación de dos genes tiene una correlación más fuerte con el resultado de tratamiento que cualquier gen solo, ambos en las secciones de tejido completo y los conjuntos de datos LCM (ver la Tabla 5). Los valores AUC para H0XB13: IL17BR alcanzaron 0.81 para los conjuntos de datos de secciones de tejido y 0.84 para el conjunto de datos LCM. El emparejamiento de HOXB13 con CACNA1D o el análisis de todos los tres marcadores conjuntamente no proporcionó poder predictivo adicional. Tabla 5. La relación HOXB13 : IL17BR es un pred ctor más f erte del resultado de tratamiento prueba t ROC t- valor P AUC valor P. estadístico IL17BR 4.15 1.15E-04 0.79 1.58B-06 Sección HOXB13 -3.57 1.03E-03 0.67 0.01 de Tejido HOXB13 : IL17B R -4.91 148E-05 0.81 1.08E-07 LCM IL17BR 3.70 5.44E-04 0.76 2.73E-05 HOXB13 -4.39 8.00E-05 0.79 9.94E-07 HOXB13:IL17B -5.42 2.47E-06 0.84 4.40E-11 AUC, área bajo la curva; valores P son AUC > 0.5. La relación HOXB13/1L7BR se comparó con los factores de pronóstico bien establecidos para el cáncer de seno, tal como la edad del paciente, tamaño del tumor, grado y estado del ganglio linfático (ver Fitzgibbons, P. L. y colaboradores, "Prognostic factors in breast cáncer. College of American Pathologists Consensus Statement 1999". Arch Pathol Lab Med 124, 966-78 (2000)). El análisis de regresión logística univariable indicó que solamente el tamaño de tumor fue marginalmente significante en este grupo (P=0.04); esto no fue sorprendente dado que el grupo respondedor estuvo estrechamente acoplado al grupo no respondedor con respecto al tamaño de tumor, grado de tumor y estado ganglio linfático durante la selección del paciente. Entre los predictores positivos conocidos (ESR1 y PGR) y negativos (ERBB2 y EGFR) de respuesta a tamoxifen, el análisis ROC de los datos de secciones de tejido indicaron que solamente PGR y ERBB2 fueron significantes (ver la Tabla 4) . Por lo tanto, una comparación de los modelos de regresión logísticos que contienen la relación: HOXB13: IL17BR ya sea por sí mismo o en combinación con el tamaño del tumor, y los niveles de expresión de PGR y ERBB2, se hicieron (ver la Tabla 6) . la relación HOXB13 : IL17BR sola fue un predictor altamente significante (P=0.0003) y tuvo una relación de disparidad de 10.2 (95%CI 2.9-35.6). En el modelo multivariable, la relación HOXB13: IL17BR es la única variable significante (P=0.002) con una relación de disparidad de 7.3 (95% 2.1-26 ) . Así, la relación de expresión de HOXB13 : IL17BR en un fuerte predictor independiente de resultado del tratamiento en el conjunto de la terapia de tamoxifen adyuvante. Tabla 6. Análisis de Regresión Logística Modelo Univariable Modelo Univariable Predictor Relación 95% Cl Valor P de Disparidad HOXB13.- IL17BR 10.17 2.9-35.6 0.0003 Modelo Multivariable Predictor Relación 95% Valor P de Disparidad Tamaño de 1 . 5 0.7-3.5 0.3289 Tumor PGR 0 . 8 0.3-1.8 0.5600 ERBB2 1 . 7 0.8-3.8 0.1620 ~)XB13 : IL1 7BR 7 . 3 2.1-26.3 0.0022 Todos los predictores son variables continuos. Los valores de expresión de gen fueron de mediciones de microarreglo. La relación de disparidad es la relación de disparidad inter-cuartil basada en la diferencia de un predictor de su menor cuartil (0.25) a su superior cuartil (0.75); Ci, intervalo de confidencia. Ejemplo 4 Validación independiente de la relación de expresión H0XB13:IL, La reducción de una señal de microarreglo complejo a una relación de expresión de dos genes permite el uso de estrategias de relación más simples, tal como el análisis de PCR cuantitativa en tiempo real (RT-QPCR) . La relación de expresión H0XB13: IL17BR mediante RT-QPCR utilizando secciones de tejido congelado que fueron disponibles de 59 de los 60 casos de entrenamiento se analizaron .(Fig 2, parte a). Los datos de RT-QPCR fueron altamente concordantes con los datos de microarreglo de los especímenes de tumor congelados (coeficiente de correlación r=0.83 para HOXB13, 0.93 para IL17BR) . Además, las relaciones de HOXB13: IL17BR derivadas de PCR, representadas como ?CTs, donde CT es los ciclos de amplificación de PCR para alcanzar una cantidad de umbral predeterminada (por ejemplo, Fig. 2, partes a y b) y ?CT es la diferencia de CT entre HOXB13 y IL17BR, fueron altamente correlacionados con los datos de derivados del microarreglo (r= 0.83) y con el resultado del tratamiento (prueba t P=0.0001, Fig. 2, parte c) . Así, el análisis de RT-QPCR convencional para la relación de expresión de HOXB13 a IL17BR se presenta que es equivalente al análisis basado en microarreglo de especímenes de tumor congelado. Para validar la utilidad predictiva de la relación de expresión HOXB13 :IL17BR en un grupo de pacientes independiente, 20 tumores de seno primario de etapa temprana ER positivo adicionales de mujeres tratadas con tamoxifen adyuvante solamente en MGH entre 1991 y 2000, y ara el cual estuvieron disponibles los registros médicos y los tejidos incrustados en parafina, se identificaron. De los 20 casos de archivo, 10 han recurrido con un tiempo medio de recurrencia de 5 años y 10 han permanecido libres de enfermedad con un seguimiento medio de 9 años (ver la Tabla 7 para detalles) . Tabla 7. Paciente y características de tumor del conjunto de validación.
Abreviaciones: Las mismas como la Tabla 1 suplemental. ^Paciente que recibió tamoxifen durante 2 años. El RNA se extrajo de secciones de tejido completo incrustados en parafina fijadas con formalina (FFPE) , linealmente amplificadas y se utilizó como plantilla para el análisis RT-QPCR. Consistente con los resultados del grupo de entrenamiento, la relación de expresión, HOXB13 : IL17BR en este grupo de pacientes independiente fue altamente correlacionada con el resultado clínico (prueba t P=0.035) con más alta expresión H0XB13 (menores a ?CTs) correlacionado con pobre resultado (Fig. 2, parte d) . Para probar la precisión predictiva de la relación HOXB13 : IL17BR, los datos de RT-QPCR de las secciones de tejido congelado (n=59) se utilizaron para construir un modelo de regresión logístico. Con este conjunto de entrenamiento, el modelo predijo el resultado del tratamiento con una precisión global de 76% (P=0.000065, 95% de intervalo de confidencia 63%-86%) . Los valores predictivos positivos y negativos fue de 78% y 75%, respectivamente. Aplicando este modelo a los 20 pacientes independientes en el grupo de validación, el resultado del tratamiento para 15 de los 20 pacientes fue predicho correctamente (precisión total 75%, P=0.04, 95% de intervalo de confidencia 51%-91%) , con valores predictivos positivos y negaticos de 78% y 73%, respectivamente. El análisis de Kaplan-Meier de los grupos de pacientes como son predichos por los modelos resultantes dieron por resultado las curvas de supervivencia libres de enfermedad significativamente diferentes en tanto el conjunto de entrenamiento como el conjunto de prueba independiente (Fig. 2, partes e y f) . Un ejemplo representativo adicional de la aplicación de la relación a las muestras de sección y las muestras LCM del grupo de 60 pacientes se muestra en la Figura 8, Parte B (indicada por "Secciones" y "LCM" respectivamente) . También mostrado en el mismo está una aplicación ejemplar de la relación a 31 muestras FFPE (indicado por "FFPE") . Ejemplo 5 Identificación de secuencias adicionales como el resultado de la expresión CHDH El hecho de que la secuencia de AI240933 fue complementaria a la hebra de codificación de CACNA1D condujo a la cuestión de si la expresión de una secuencia diferente de aquella de CACNA1D fue detectada en el Ejemplo 2 anterior. Por lo tanto, se hizo un ensamble de secuencias, que condujo a la identificación de una región 3' más grande de las secuencias conocidas expresadas como parte de CHDH (ver Figuras 5 y 3) . Esta secuencia más grande se confirmó que es expresada mediante el análisis de PCR utilizando sondas que son capaces de amplificar una región de 4283 nucleótidos calculada que se expande a ambas porciones de la secuencia CHDH previamente identificada y la secuencia AI240933 (ver la Figura 4) . El ensamble de secuencias de la Figura 5 condujo a la identificación de un contiguo más grande de secuencias mostradas en la Figura 6. El soporte adicional para la probabilidad del contiguo más grande se proporcionó por una alineación del contiguo a la secuencia CHDH de ratón. La relación probable entre las secuencias CHDH y CACNA1D se muestra en la Figura 7. Ej emplo 6 Identificación y uso de la Relación de Expresión QPRT: CHDH Una relación de expresión QPRT: CHDH se identificó com un predictor compuesto robusto del resultado de manera similar aquel descrito en el Ejemplo 3 anterior. Puesto que QPRT y CHDH tiene patrones opuestos de expresión, la relación de expresión de QPRT sobre CHDH se examinó para determinar su habilidad para funcionar como un predictor compuesto de la respuesta a tamoxifen. Los resultados de la aplicación de la relación a las muestras de sección y las muestras LCM del grupo de 60 pacientes se muestra en la Figura 8, Parte A (indicado por "Sección" y "LCM" respectivamente) . También se muestra en la misma una aplicación ejemplar de la relación a 31 muestras FFPE (indicado por "FFPE") . Referencias Adicionales Ma, X. J. y colaboradores, Gene expression profiles of human breast cáncer progression. Proc Nati Acad Sci E U 100, 5974-9 (2003) . Nicholson, R. I. y colaboradores, Epidermal growth factor receptor expression in breast cáncer: association with response to endocrine therapy. Breast Cáncer Res Treat 29, 117-25 (1994). Todas las referencias citadas en la presente', incluyendo patentes, solicitudes de patente y publicaciones, son incorporadas aquí por referencia en sus totalidades, ya sea de manera previa específicamente incorporadas o no incorporadas . Habiéndose descrito ahora completamente esta invención, será apreciado por aquellos expertos en la técnica que la misma se puede realizar dentro de un intervalo amplio de parámetros equivalentes, concentraciones y condiciones sin salir apartarse del espíritu y alcance de la invención y sin la experimentación indebida. Mientras que esta invención se ha descrito en relación con modalidades específicas de la misma, será entendido que es capaz de modificaciones adicionales. Esta solicitud se propone para cubrir cualquiera de las variaciones, usos o adaptaciones de la invención que siguen, en general, los principios de la invención y que incluyen tales desviaciones de la presente descripción como provienen dentro de práctica conocida o usual dentro de la técnica a la cual la invención pertenece y como puede ser aplicada a las características esenciales expuestas anteriormente en la presente. Apéndice Secuencias identificadas como aquellas de la agrupación IL17BR A 675096 CCGGCGATGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCA6GAGCGCCGTACCCCGA GAGCCGACCGTT?^TGTGGCTCTGAAACTGGGCC?TCTCCAGAGTGGATGCTACAAC?T GATCTAATCCCGGGAGACTTGAGGGACCTCGGAGTAGAACCTGTTACAACTAGTGTTGCA A(^GGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGCAGATGCCAGCATC CGCTTGTTGA?GGCC?CCAAGATTTGTGTGACGGGC^AA?GCAACTTCCLAGTCCTAC?GC TGTGTGAGGTGC^ATTAC^CAGAGGCCTTCC^GACTCAGACCAGACCCTCTGGTGGTAAA GGACATTTTCCTACATCGGCTTCCCTGTAGAGCTGAACACAGTCTATTTCATTGGGGCC (^TAATATTCCTAATGCAAATATG?ATGAAG?.TGGCCCTTCCATGTCTGTGAATNTCACC TC^CCAGGCTGCCTAGAC(^CI?1TAATGAAATATAAAAAAAAGTGTGTCAAGGCCGGAAGC CTGTGGGATCCGAACATCACT A 673932 TTTTTTTTTTTTTTTTTTTA?AAGTGGGTTCAGCTTGTTTATTCCCTACTTTTGTTATCT AZ^?AACAATGATTTTTTGCATGTAATAGAAGGTTTTTCACTTAAGATGCTATTGAGTGA ATC?GTGAGGGGTTCTTAGAGTTAGTATTCPÍTT2^ATTAAACATAGAATATTAGCTAAACA GTTCTGGGTACACTGCAATGCATGGTCTATGGA?GACTAGATGTTTGGCTGAAGATGCTT TATTGTTGCATTATCAAA?TGGTTATAGTTTTCAATTAAAACTGTAATTGATTTCTATGT ATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTAATGCTACATTAGTT AGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGC TGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGG BC000980 .ggcccggcga tgtcgctcgt gctgctaagc ctggccgcgc tgtgcaggag cgccgtaccc cgagagccga ccgttcaatg tggctctgaa actgggccat ctccagagtg gatgctacaa satgatctaa tcccgggaga cttgagggac ctccgagtag aacctgttac aactagtgtt gcaacagggg actattcaat tttgatgaat gtaagctggg tactccgggc agatgccagc atccgcttgt tgaaggccac caagatttgt gtgacgggca aaagcaactt ccagtcctac agctgtgtga ggtgcaatta cacagaggcc ttccagactc agaccagacc ctctggtggt aaatggacat tttcctacat cggcttccct gtagagctga acacagtcta tttsattggg gcccataata ttcctaatgc aaatatgaat gaagatggcc cttccatgtc tgtgaatttc acctcaccag gctgcctaga ccacataatg aaatataaaa aaaagtgtgt caaggscgga agcctgtggg atscgaacat cactgcttgt aagaagaatg aggagacagt agaagtgaac ttcacaacca ctcccctggg aaacagatac atggctctta tcsaacacag cactatcatc gggttttctc aggtgtttga gccacascag aagaaacaaa cgcgagcttc agtggtgatt ccagtgactg gggatagtga aggtgctacg gtgcagctga ctccatattt tcctacttgt ggcagcgact gcatccgaca taaaggaaca gttgtgctct gcccacaaac aggcgtccct ttccctctgg ataacaacaa aagcaagccg ggaggstggc tgcctctcct cctgctgtct ctgctggtgg ccacatgggt gctggtggca gggatctatc taatgtggag gcacgaaagg atcaagaaga cttccttttc taccaccaca ctactgcccc ccattaaggt tcttgtggtt tacccatctg aaatatgttt ccatcacasa atttgttact tcactgaatt tcttcaaaac cattgcagaa gtgaggtcat ccttgaaaag tggcagaaaa agaaaatagc agagatgggt ccagtgcagt ggcttgccac tcaaaagaag gcagsagaca aagtcgtctt ccttctttcc aatgacgtca acagtgtgtg cgatggtacc tgtggcaaga gcgagggcag tcccagtgag aactctcaag acctcttccc ccttgccttt aaccttttct gcagtgatct aagaagccag attcatctgc acaaatacgt ggtggtctac tttagagaga ttgatacaaa agacgattac aatgctctca gtgtctgccc caagtaccac ctcatgaagg atgccactgc tttctgtgca gaacttctcc atgtcaagca gcaggtgtca gcaggaaaaa gatcacaagc ctgccacgat ggctgctgct ccttgtagcc sacccatgag aagcaagaga ccttaaaggc ttcctatccc accaattaca gggaaaaaac gtgtgatgat cctgaagctt actatgcagc ctacaaacag ccttagtaat taaaacattt tataccaata aaattttcaa atattgctaa ctaatgtagc attaactaac gattggaaac tacatttaca acttcaaagc tgttttatac atagaaatca attacagttt taattgaaaa ctataaccat tttgataatg caacaataaa gcatcttcag ccaaacatct agtcttccat agaccatgca ttgcagtgta cccagaactg tttagctaat attctatgtt taattaatga atactaactc taagaasccc tcactgattc actcaatagc atcttaagtg aaaaacctts tattacatgc aaaaaatcat tgtttttaag ataacaaaag tagggaataa acaagctgaa cccactttta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa BI602183 AGCGGAGCTGCGGGTGGCCTGGATCCCGCGCAGTGGCCCGGCG?TGTCGCTCGTGCTGCT AAGCCTGGCCACGCTGTGCAGGAGCGCCGTACCCCGAGAGCCGACCGTTCÍ^TGTGGCTC TG?AACTGTGGAC?TTTTCCTATATCGGCTTCCCTGTAGAGCTGAAAAC?GTCTATTTCA TTGGGGCCCAT.?ATATTCCTAATGC?AATATG.^^ ATTTC&CCTCACC?GGCTGCCTAGACC?^ CGG_^GCCTGTGGGATCCGAACL?_T?_CTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGT GAACTTC?C^CC&CTCCCCTGGGAAACAGAT^^ TCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACA?ACGCGAGCTTCAGTGGTGA TTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTACTT GTGGC?GCGACTG(_?TCCGAC?TA?AGGAACAGTTGTGCTCTGCCC?C?AACAGGCGTCC CTTTCCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTG TCTCTGCTGGTTGGCC?C?TTGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACG I^AAGGATCCAGAAGACTTCCTTTTCTACCACAAACTACTGCCCCCATTAAGGTCCTGTGG TTACCCATCTTGAAA.TATGTTCCTCAC ACAATTTGTTACT?C?CTGIAATTCTTCA?AACC TG BI458542 AGCGGAGCGTGCGGGTGGCCTGGATCCCGCGCAGTGGCCCGGCGATGTCGCTCGTGCTGC TAAGCCTGGCC?CGCTGTGCaGGAGCGCCGTACCCCGAGAGCCGACCGTTCAATGTGGCT CTGAAACTGTGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAAAACAGTCTATTTC ATTGGGGCC(_!ATAATATTCCTAATGCft2^ATATGAATGAAGATGGCCCTTCCATGTCTG_?G AATTTCLACCTC^CCAGGCTGCCTAGACCACATAATG?^^ GCCGGAAGCCTGTGGGATCCGAACATCIACTGCTTGTAAG?AGA?TGAGGAGACAGTAGAA GTGAACTTCACAACC-?CTCCCCTGGGAAACAGATAC^^ CATCGGGTTTTCTCAGGTGTTTGAGCCA(^CCAGAAGAAACAAACGCGAGCTTCAGTGGT GATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTGCATATT?TCCTAC TTGTGGC.AGCGACTGClñ.TCCGACATAAAGGAACAGTTGTGCTCTGCCCAC?AACAGGCGT CCCTTTCCCTCTGI^TAACAACA?AAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCT GTCTCTGCTGGTGGNC_?-C_ .TT8GTGCTGGTGGCAGGGATCTATCTAATGTGGAGGGAGG AAAGGATaGAAG?CTTCCTTTTCTACCACCAC?TACTGCCCCCCATTAAGGTTCTTGTG GTTTACCC BI823321 GGCGATGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAGGAGCGCCGTACCCGGAGA GCCGACCGTTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACATGA TCTAATCCCG3GGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAÍ-CTAGTGTTGCAAC AGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCGGGCAGATGCCAGCATCCG CTTGTTGAAGGCCLACCAAGATTTGTGTGACGGGCAA?AGCAACTTCCAGTCCTACAGCTG TGTGAGGTGCAATTAC?CAGAGGCCTTCCAGACTCAGACCAGACCCTCTGGTGGTAAATG GACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACACAGTCTATTTCATTGGGGCCCA TAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTC ACCAGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAAGAATGAGGAGACAGTAG AAGTGAACTTCACAACCACTCCCCTGGGAAACAGATACIAGGGCTCTTATCCAACACAGCA CTATCLATCGGGTTTCTCAGGTGTTTGAGCCACACC.AGAAGAAACAAACGCGAGCTTCAGT GGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATATTTTCC TACTTGTGGCAGCGACTGCAATCCGACATAAAGGAACAGTTGTGCTCTGCCCACAAACAG GCGTCCCTTTCCCTCTTGGATAGCAACAGAAGCAAGCCGGGAGGCTGGTGCCTCTTCTTC TGGTGTCTCTGCTGGTGGCACATTGAGTGCTGGTGGCAGGATCCATCTAATGTGGAGGCC CCAAAGGACCAGGAAAGACTTCCTTTATTAGCACCAAGTATTGCCC AA514396 TGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGT AATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTT AATGCTACATTAGTTAGCAATATTTGAA? vrTTTATTGGTATAA2y_TGTTTTAATTACTA AGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGT¿ ATT GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTAC?AGGAGCAGCA GCC_ATCGTGGCL?_GGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAG TTCTGCACl?GAAAGCAGTGGCaTCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC ATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATG AATCTGGC BF110326 TTTGTTTGGCTGAAGATGCTTTATTGTTGCATTATCA?AATGGTTATAGTTTTCAATTAA AACTGTAATTGATTTCTATGTATAAAZ_CAGCTTTGAAGTTGTAAATGTAGTTTCCAATCG TTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAA TTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCT GTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTTTCATGGGTGGGCTACAAGGA GCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATG GAGA?GTTCTGC?CAGAAAGC?GTGGCATCCTTCL?_TGAGGTGGTACTTGGGGCAGACACT GAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTG CAGATGAATCTGGCTTCTTAGATCACTGC BE466508 TGGCATGAGATGCTATATTGTTGCATTATCAAAATGGGTTTAGTCTTCAATTAACACTGT AATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTGGTTTCCAATCGTCAGTT AATGCTACL?TTAGTTAGC?ATATTTGASAATTTTATTGGTATAAAATGTTTTAATTACTA. AGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATT GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCA GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAG TTCTGC1ACAGAAAGCAGTGGC-?_TCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC ATTGTAATCGTCTTTTGTATCAATCTCTCTA?AGTAGACCACCACGTATTTGTGCAGATG AATCTGGCTTCTTAGATCACTG BF740045 GTTTGGCTGAAGATGCTTTATTGTTGC_ñ.TTATC?AAATGGTTATAGTTTTCAATTAA?AC TGTAATTGATTTGTATGTAT?AAAG^CGCTTTG?AGTTGTAAArGTAGTTTCCAATCGTT AGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAA.TGTTTTAATT ACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCGCTGT AATTGGTGGGATAGGAAGCCTTTAAGGTGTCTTGCTTCTCATGGGTGGGCTAC?AGGAGC AGC?GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGA GAAGTTCTGCACAGA?AGCAGTGGCL?TCCTTCATC GGTGGTACTTGGGGCLAGACACTGA GAGCATTGT.A&TCGTCTTTTGTATCAATCTCTCTAAAGTA AW299271 TGGCTGAAGATGCTTTATTGTTGCATTATCA?AATGGTTATAGTTTTCAATTAAAAC?GT AATTGATTTCTATGTATAAAACAGCGTTGAAGTTGTAAATGTAGTTTCC2ÍATCGTTAGTT AATGCTACATTAGTTAGCAATATTTG?A?ATTTTATTGGTATAAAATGTTTTAATTACTA AGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATT GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCA GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAG TTCTGCLACLAGA?AGCAGTGGC?TCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGC ATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGAGCACCACGTATTTGTGCAGATG AATCTGGCTTCTTAGATCACTGCAGAAAAG AA836217 TTTTTTTTTTAC^^CTTCAAAGCTGTTTTATACATAGAAATCA?TTACAGTTTTAATTGA AAACTATAACCATTTTGATAATGC^^CAATAAAGC?TCTTCAGCCAAACATCTAGTCTTC CATAGACCL?TGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATTCTATGTTTAATTAA TGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAAAAACC TTCTATTAC?TGCAAAAAATCATTGTTTTTAAGATAAC?AAAGTAGGGA?TAAACAAGCT GAACCCACTTTTACTGGACCAAATGATCTATTATATGTGTACCACTTGTATGATTTGGTA TTTGC_?TAAGACCTTCCCTCTAC»AACTAGATTC_ATATCTTGATTCTTGTACAGGTGCCT TTTAACL?TGJ _?^CA??ATACCCACA?ACTTGTCTACTTTTGCC AI203628 TAGTAA.TTAAAACATTTTATACCAATAAAATTTTCA?ATATTGCTAACTAATGTAGGATT AACTAACGATTGGA.y_CTAClArTTAC^^CTTC^A?GCTGTTTTATACATAGAZ^ATC?ATT ACAGTTTTAATTGAAAACTATAACCL?_TTTTGATAATGCañ.C?ATAA?GC_ATCTTC_?_ AACATCTAGTCTTCCATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATT CTATGTTTAATTAATGAATACTAñ.CTCTA?GA?CCCCTCL?_GTGATTCACTGAATAGCATC TTAñ.GTGAA?AACCTTCTATTAC_A.TGCaiyy AATCATTGTTTTTAAGATAACaA?AGTAG GGAATAAAC?^GCTGAACCCIACTTTTACTGGACCAAATGATCTATTATATGTGTAACCAC TTGTATGATTTGGTATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATT CTTGTACAGGTGCCTTTTAACATGAA AI627783 TTTTTTTTTTTTTTTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACT AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTJ\AT TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGC AGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAA GTTCTGCACAGAAAGCL?lGTGGCl?TCCTTCATGñ.GGTGGTACTTGGGGCAGZ-CACTGAGAG CATTGTAATCGTCTTTTGTATCAATCTCTCTAAA.GTAGACCACCACGTATTTGTGCAGAT GAATCTGGCTTCTTAGATCL?_CTGC .GAAAAGGTTAAAGGCAAGGGGGñAG-_GGTCTTGAG AGTTCTC AI744263 TTA]^GTGGGTTC?GCTTGTTTATTCCCTACTTTTGTTATCTTAñAAACAATGATTTTTT GC?TGTAATAGAA.GGTTTTTCACTTAAGATGCTATTGAGTGAATCAGTGAGGGGTTCTTA GAGTTAGTATTCATTAATTAAAC_ATAGAATATTAGCTAAA.CAGTTCTGGGTACACTGCAA 5 TGGATGGTCTATGGAAG?CTAGATGTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAA TGGTTACIAGTTTTC-^TTAAAGCTGTAATTG?TTTCTATGTATAAAA.CAGCTTTGAAGT TGTAAA.TGTAGTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAA?ATTT TATTGGTATAA?_ATGTTTTAATTACTAAGGCTGTTTGTAGGCTGC_?_TAGTAAGCTTCAGG ATCATCACACGTTNTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTA AI401622 AGTTAGCÜ^TATTTGAA?ATTTTATTGGTATA??ATGTTTTAATTACT_\AGGCTGTTTGT AGGCTGC?TAGTAAGCTTCLA.GGATCATCAC?CGTTTTTTCCCTGTAATTGGTGGGATAGG AAGCCTTTAAGGTCTGTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCATCGTGGC 1 ° AGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAGTTCTGCACAGA AAGC?GTGGCIATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGT CTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCT_?C TTAGATCACTGCA.GAAAAGGTTAAAGGCAAGGGGGAAGÑ.GGTCTTGAGAGTTCTCACTGG AI826949 TTGGCTGA?GATGCTTTATTGTTGCATTATCA??ATGGTTATAGTTTTCAATTAAAACTG AATTGATTTCTATGTATAAAACLAGCTTTGA?GTTGTAAATGTAGTTTCCAATCGTTAGT TAATGCTAC?TTAGTTAGCAATATTTGAAAATTTTATTGGTATMAATGTTTTAATTACT , - AAGGCTGTTTGTAGGCTTGCATAGAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAAT TGGTGGGATAGGAZ.GCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGC AGCC?TCGTGGC!AGGCTTGTGATCTTTTTCCTGCTGAC-?-CCTGGTGCTTGACATGGAG?-A GTTCTGCACAGAZ^GC_?_GTGGCATCCTTCA.TG?GGTGGTACTTGGGGCAGAC?CTGAGAG CATTGTAATCGTCT BE047352 TTTTTTTTTTAGC?ATATTTGAAAATTXTATTGGTATA?A?TGTTTTAATTACTAAGGCT GTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGG GATAGGAA.GCCTTTA?GGTCTCTTGCTTCTC^TGGGTGGGCTACAAGGAGCAGCAGCCAT 0 CGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAGTTCTG C?C?GAA?GC?GTGGC_?TCCTTC?TGAGGTGGTACTTGGGGC?GACACTGAGAGCATTGT AATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCT GGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCA?GGGGGAAGAGGTCTTGAGAG AI 11549 TTTGGCTGÍ^GATGCTTTATTGTTGC AGTATCAAAATGGTTACAGTTTTCAATTAAAGCT GTAATTGATTTCTATGTATAAAAC?GCTTTGAAGTTGTAÑATGTAGTTTCCAATCGTTAG TTAATGCTACATTAGTTAGCA?TATTTG?A?ATTTTATTGGTATAAAATGTTTTAATTAC TAAGGCTGTTTGTAGGCTGC^TAGTAA.GCTTC_Ñ.GGATCATCACACGTTTTTTCCCTGTA? 5 TTGGTGGGATAGGAAGCCTTTAA.GGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAG C?GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGA AGTTCTGCACAGAA?GCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACA BF194822 TTCTCTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAA GCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGT TAGTTAATGCTACLATTAGTTAGC?ATATTTGAAAA.TTTTATTGGTATAFTAATGTTTTAAT TACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTC?GGATCLÑ.TCACACGTTTTTTCCCTG TAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAG CAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGG AGAAGTTCTGCACAGA?AGCAGTGGCATCCTTCATGAGGTGGTACTTGG AI034244 TTTTTTTTTTTTTTTACAACCTTGAAAGCTGTTTTATACATAGAAATC?ATTACAGTTT TAATTGAAAACTATAACCMTTTTGATAATGC_?^C^^TAAÑ.GCLA.TCTTCAGCCAAAC?TCT AGTCTTCCATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAATATTCTATGTT TAATTAATGAATACTAA.CTCTAAGAACCCCTCACTGATTCL?CTC-ÑATAGCATCTTAAGTG AAAAACCTTCTATTAC^TGCAA?AAATCATTGTTTTTAAGATAACS^AAGTAGGGAATAA ACAAGCTGAACCC?CTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATG ATTTGGATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATTCT AI033911 TTTTTTTTTTTTTTTTAGAACTGCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTT AATTGAA2 ACTATAACCATTTTGATAATGCAACAATAA?GCATCTTCL?LGCC^Y_CATCTA GTCTTCCATAGACCATGCATTGCAGTGTACCCAGAACTGTTTAGCTAÑ.TATTCTATGTTT ATTAATGAATACTAACTCTAAGAACCCCTCACTGATTC?CTCAATAGCATCTTA?GTGA AAAACCTTCTATTACATGC A?^AAAATCLKTTGTTTTTAAGATAACA3^AA.GTAGGGAATAA? CAAGCTGAACCCACTTTTACTGGACCAAÑ.TGATCTATTATATGTGTAACCACTTGTATGA TTTGGTATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATATCTTGATTCT BF064177 TTTTTTAGTTAGCAATATTTGAAAATTTTATTGGTATA ?ATGTTTTAATTACTAAGGCT GTTTGTAGGCTGC?TAGTA?GCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGG GATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCAT CGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTACTTGACATGGAGAAGTTCTG CAC.AGAAAGC1A.GTGGCATCCTTCATGAGGTGGTACTTGGGGC1AGACACTGAGAGCATTGT AATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGAATCT GGCTTCTTAGATCACTGC AGAAA?GGTTAAAGGCAAGGGGGAAGAGG?CTTGAGAGTTCT C ?CTGGGACTGCCCTCGCTCTTGCC?CI?GGTACCATCGCACACACTGTTGACGTCATTGG AAAG AA847767 GGCTGA._GATGCTTTATTGTTGCATTATCAAAñ.TGGTTATAGTTTTCAATTAAAACTGTA ATTGATTTCTATGTATAAAAGAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA GGCTGTTTGTAGGCTGCATAGTAAGGTTCAGGATCATCACACGTTTTTTCCCTGTAATTG GTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAG CCATCGTGGC AGGCTTGTGATCTTTTTGCTGCTGACACCTGCTGCTTGACATGGAGAAGT TCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTA AK38624 TTGGCTGA?GATGCTTTATTGTTGCATTATCAAAA.TGGTTACAGTTTTCAATTAAAGCTG TAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGT .TAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAA.TTACT 5 AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAAT TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTClATGGGTGGGCTACaAGGAGCAGC AGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAA GTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTAC AI913613 TTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTG TAATTGATTTCTATGTATAAAACAGCTTTGA^GTTGT_\AATGTAGTTTCCAATCGTTAGT TAATGCTACATTAGTTAGCAñ.TATTTGAñAATTTTATTGGTATAAAATGTTTTAATTACT AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTNTTTCCCTGTAAT 1° TGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTC1ATGGGTGGGCTACAAGGAGCAGC AGCCATCGTGGC?GGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAA GTTCTGCACAGAñAGCAGTGGCATCCTTCATG AI942234 GTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAA?AC TGTAATTGATTTCTATGTATAAA?CAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA --5 ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCA GCAGCCATCGTGGCAGCTTGGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACAXGA?.G AAGTTCTGCACAGAAAGCAGTGGCAT AI580483 GTTTGGCTGA?GATGCTTTATTGTTGCATTATC?AAATGGTTATAGTTTTCAATTAAAAC TGTA?TTGATTTCTATGTATAAAAC?GCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA GTTAATGCTACATTAGTTAGCAATATTTG?AAATTTTATTGGTATA?AATGTTTTAATTA CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA •ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACA?GGAGCA 20 GCAGCCATCGTGGCAGGCTTGGATCTTTTTCCTGCTGACACCTGCTGCTTGACATTGGAA AGTTCTGCACAGAAAGCAGTGGCATC AI831909 TTTTGGCTGATGATGCTTTATTGTTGCATTATCAA?ATGGTTACAGTTTTCAATTAAAGC TGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTA?ATGTAGTTTCC?ATCGTTA GTTA?TGCTACATTAGTTAGC?ATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA CTA?GGCTGTTTGTAGGCTGCIAGAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCA G IA.GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAG AAGTTCTGCACAGA?AGCAGTGGCAT AI672344 GGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAGTTTTCAATTAAAGCTGTA ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA GGCTGTTTGTAGGCTGC^TAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTG GTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAG CCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGT TCTGCACAGAAAG A 025192 GATTGGCTGTTTTATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAA CTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTA?ATGTAGTTTCCAATCGTT AGTTAATGCTAC-?TTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTA TT ACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGT TATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGC AGC?GCCLÑ.TCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGA GAAGTTCTGCLACAAAAAGCAGTGGCATCCTTCATGAGGTGGTA AA677205 GCAATATTTTAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGCT GCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTGGCATAGGAAGCC TTTAAGGTCTCTTGCTTCTCATGGTGTGGGCTACAAGGAGCAGCAGCCATCGTGGCAGGC TTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCTGCACAGAAAGC AGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTTT TGTATCAATGTCTCTAAAGTAGAGCACCACGTATTTGTGCAGATGAATCTGGCTTCTTAG ATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGGGACT GCCCTCGCTCTTGCCACAGGTACCATCGCACACACTG AA721647 TTTTTTTTTTACAACTTCA?AGCTGTTTTATACATAGAAATCAATTACAGTTrTAATTGA AAACTATAACCATTTTGATAATGCAACAATAASLGCATCTTCAGCCAAACATCTAGTCTTC CL?_TAGACC-A.TGCATTGC1A.GTGTACCCAGAACTGTTTAGCTAATATTCTATGTTTAATTAA TGAATACTAACTCTAAGAACCCCTC?CTGATTCACTCAATAGCATCTTAAGTGAAA?ACC TTCTATTAC?TGC??AA^TCATTGTTTTTAAGATAACAAAAGTAGGGAATAAACAAGCT GAACCCZ-CTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATGATTTGGT ATTTG BF115018 GTTTCGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAZ_C GTAATTGATTTCTATGTATAAA?CAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTAAGGCCCATCACACGTTTTTTCCCTGTA ATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTNTCATGGGTGGGCTACAAGGAGCA GCAGCCATCGTGGCAGGCTTGNGATCTTTTTCCTGCTGGCCCCTGCTGCTTGACAT 61238 NAAAGCACTGGCTGAAGGAAGCGaAGAGGATCACTGCTGCTCCTTTTTTCTAGAGGAAAT GTTTGTCTACGTGGTAAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTTAGT AACGTGTAC^?AGT_?TAGGTTC-?_GACCCCGGGAGTCTTGGGCACGTGGGTCTCGGGTCAC TGGTTTTGACTTTAGGGCTTTGTTACAGATGTGTGACCAAGGGGAAAATGTGCATGACAA C?CTAGAGGTATGGGCGACACGAN'AACGAACGGGAAGTTTTGGCTGAAGTAGGAGTCTTG GTGAGATTTTGCTCTGATGCATGGTGTGAACTTTCTGAGCCTCTTGTTTTTCCTCAAGCT GACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAG 61239 TAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTA?GGCTGTTTGTAGG CTGCATAGTA?GGTTC?GGATCATC?CACGTTTTTTCCCTGTAATTGGTGGGATAGG?AG CCTTTAAGGTCTCTTGCTTCTC?TGGGTGGGCTACAAGGAGC?GCAGCCATCGTGGCAGG CTTGTGATGTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCTGCACAGAAAG CAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTT TTGTATCL2Y:ITCTCTGTAAAGTAGACCACCACGTATTTGTGCAGATGAATCTGGCTTCTTA GATCACTGCAGAAAAGGTTAAAGGCAAGGGGGGA AI032064 GCA?TATTTGAAAATTTTATTGGTATAAAATGTTTTÍATTACTAAGGCTGT?XGTAGGC TGCATAGTAAGCTTCLAG3ATC_?TC?C?CGTTTTTTCCCTGTAATTGGTGGC_A.TAGGAAGC CTTTA?GGTCTCTTGCTTCTC?TGGGTGGGCTACAAGGAGCAGCAGCCATCGTGGCAGGC TTGTGATCTTTTTCCTGCTGACACCTGCTGCTTG?CATGGAGAAGTTCTGCIACAG??AGC AGTGGC?TCCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTTT TGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGA.TGAATCTGGCTTCTTAG ATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGGGACT GCCCTCGCTCTTGCCAC AW236941 TTTTTTTTTTTAGCAATATTTGA?AATTTTATTGGTATAA?ATGTTTTAATTACTAAGGC TGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTAATTGGTG GGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCA TCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCT GCACAMÜY_GC?GTGGCLÑ.TCCTTCATGAGGTGGTACTTGGGGC?GACACTGAGAGCATTG TAATCGTCTTTTGTATCAATC AW236941 TTTTTTTTTTTAGCIAA.TATTTGAAAATTTTATTGGTATAAAA.TGTTTTAATTACTAAGGC TGTTTGTAGGCTGC1A.TAGTAAGCTTCAGGATCATCAC?CGTTTTTTCCCTGTAATTGGTG GGATAGGAAGCCTTTAAGG'TCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCA TCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTCT GCLñ.C2^?AAGCAGTGGC_ .TCCTTC?TGAGGTGGTACTTGGGGCAGACACTGAGAGCATTG TAATCGTCTTTTGTATCAATC BG057174 TTTTATACATAGAAATCaATTACAGCTTTAATTGAAAACTATAACCATTTTGATAATGCA AC^^TAAAGCATCTTCAGCCAAAC?TCTAGTCTTCCATAGACCATGCATTGCAGTGTACC CLAGAACTGTTTAGCTAATATTCTATGTTTAATTAATGAATACT2 ACTCTAAGAACCCCTC ACTGATTCACTC?^TAGC?TCTTAAGTGAAAAACCTTCTATTACATGCAAAAAATCATTG TTTTTAAGATAACaAAAGTAGGGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATG ATCTATTATATGTG AW058532 GGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTA ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA 5 ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA GGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCCTGTATGG GTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCT T98360 TNAGGAANGAGAAGAAGCGAGAT_^A3 T™^ ATTGATNCAAAAG píGATTN ^^Ti NCTCAGTGNCTNCCCAAGTNCC_NCCTCATGAAGG ATNC-ACTNCTTTCTGTGCkGACTITON^ C ACAAGCTCOÍ3CGATGGCTGCTGCTCCTTGTAGCCCNCC-ATGAGAAGCL? AGAGNCTTAAA l o GGCTTCCTATCCCACCAATTACAGGGAAAAACGTGTGATGACCTGAGCTTACTATGCAGC CTACAANCAGCCTTAGTAATTAAACCNTTTATT T98361 NAI ATGAAGATGCTTTATTGTTGC?TTATCA?AATGGTTAC?GTTTTCAATTAAAGCTG TAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGT TAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGNATAAAATGTTTTAATTACT AAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTNCCCTGTAAT TGGGTGGGGATAGGGAAGCCCTTTAAGGGTCTCTTGCTTCTCATGGGGTGGGGCCTACNA AGGGAGCAGC(^GCCCLATCGTGMCC_AGGGCCTTGTGG_^CCTTTTTCCCTGCCTGGACAC 15 CCTGCCTGCCTTGGACCATGGGGAGGAAGGTTCTGGC?CC^G?AAAGCCAGGTGGCCCLAT CCGTTCCATGAGGGTGGGGTACTTNGGGGGGCCAGGACCACTGAGGNGCCATTGGTAATC CGTCCTTTTNGTATCCAATCCCCTCCTAAGGTAGGNCCCCCC AI470845 TTTTGTGGGTTCAGCTTGTTTATTCCCTACTTTTGTTATCTTAAAAACAATGATTTTTTG CATGTAATAGAAGGTTTTTCACTTAAGATGCTATTGAGTGAATCAGTGAGGGGTTCTTAG AGTTAGTATTCATTAATTAAAC-ATAGAATATTAGCTAAACaGTTCTGGGTACLACTGCAAT GCATGGTCTATGGAAGACTAGATGTTTGGCTGAAGATGCTTTTATTGTTGCATTATCAAN 20 ATGGTTTATAGTTTTCAATTAAAACTGTAATTGATTT AI497731 GGCTG24AGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATTAAAACTGTA ATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTAGTTA ATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAA GGCTGTTTGTAGGCTGCATAGTAAGCTTAAWGATCATACNCACGTTTTTCCCTGAATTTG GTGGGATAAGAAGCCTTTAAAGGT T96629 TTGAAAATTTTATTGGNATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGC1.GCATAGT AAGCTTCAGGAMCATCACACGTTTTTTCCCTGTAATTGGTGGCATAGGAAGCCTTTAAGG TCTCTTGCTTCTí^TGGGTGGGCTAC AAGGAGC?GCAGCCATCGTGGCAGGCTTGTGATC TTTTTCCTGCTGA(_?CCTGCTGCTTGACATGGAGAAGTTCTGC1?_CAGAAAGCAGTGGCAT CCTTCATGAGGTGGTACTTGGGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAA TCTCTCTAAAGTAGACC ACa^CCGTNTTTGTGCAGATGGAiTTCTGGCTTC T96740 AGGC^CTATC_ATCGGGTTTTCTCL&GGTGTTTGAGCC-A<_M TTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCCATA TTTTCCTACTTGTGGC?GCGACTGCATCCGAC.ATAAAGGAACAGTTGTGCTCTGCCCACA AACAGGCGTCCCTTTCCCTCTGGATAAC^-C?2\aAGCaAGCCGGGANGGNCTGNCCTCTC CTCCTGCTGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGG AGGCACGAAAGGAT(^AAGAAGACTTCCTTTTCTA?C(^_CCAC--TTACTGCCCCCCATTTA AGGTTCTTGTGGTTTTACCCATCTGGAAATATGTTTTCCCTTCACACATTTGTTTATTTC ATTGATTTNTTTCAAAACCTTGGCAGGAGTTT H25975 GGGTCCAGTGCAGTGGCTTGCNTGCAGAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCT TTCCAATGACGTCÍ.ACAGTGTGTGCGATGGTACCTGTGGC?AGAGCGAGGGCAGTCCCAG TGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAG Cí^GATTC?TCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAA?GACGA TTACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTG GCLAGAACTTCTCCATGTCA^GCAGC?GGTGTCAGCAGGAAAAAGATTCACAAGCCTGCC ACGATGGCTGCTTGCTTCCTTTGTAGCCCACCCATGAGGAAGNCftAGAGACCTTNAAAGG GTTCCTTTTCCCATCñ]^TTAC_ñ.GGGGAlJAAAACGTGTGATGATC H25941 TTTTGTTTGGCTNATNTNNTTCTTATTGTTGCATTATCAAAATGGTTATAGTTTTCAATT AAAACTGTAATTGATTNCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAAT CGTTAGTTAATGCTA1ATTAGTTAGCAATATTTG?AAATTTTATTGGTATAAAANGTTTT AATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTCCC CTGTAATTGGTGGK-ATAGGi??GCCTTTAAGGTCTCTNGCTTCTClATGGGTGGGCTACAAG GAGCAGCAGCCATCGTGGCAGGCTTGTGANCTTTTNCCTGCTGACACCTGCTGCTTGACA TGGGAGAAGTTCTGCACAGAAAGGCAGTGGGCATCCTTCATGAGGTGGGTACTTGGGGGN CAGACACTGAGGAGCATTGT BE539514 CTCAAAAGAAGGCAGCAGACIAAAGTCGTCTTCCTTCTTTCCA?TGACGTCAACAGTGTG TGCGATGGTACCTGTGGCAAGAGCGAGGGC1AGTCCCAGTGAGAACTCTCAAGACCTCTTC CCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCCAGATTCATCTGCACAAATAC GTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATTACAGTGCTCTCAGTGTCTGC CCC?AGTACCACCTCATGAAGGATGCCACTGCTTTCTGTGCAGAACTTCTCCATGTCAAG CAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCACGATGGCCGCTGCTCCTTGTAG CCC_ACCC^TGAGAAGCAAGAGACCTTAAAGGCTTCCTATCCCACC^^TTA?IGGGAAAAA ACGTGTGATGATCCTGAAGCTTACTATGCAGCCTACAAACAGCCTTAGTAATTAAAACAT TTTATACCAATAAJ-ATTTTCAAATATGCTAACTAATGTAGC?TTAACTAACGATTGGAAA CTACATTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGCTTTAATTGAAA ACTGTAACCATTTTGATAATGCAACAATAAAGCATCTTCAG BX282554 GTCClAGTGC?GTGGCTTGCC?CTCyy^AAGAAGGC?GCAGAC^AAGTCGTCTTCCTTCTTT CCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGTG AGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCC AGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATT ACAGTGCTCTa_GTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTG CAGAACTTCTCIATGTCAAGIAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCCACG ATGGCCGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCTATC 5 CCACCAATTACAGGGGAAAAAACGTGTGATGATCCTGAAGCTTACTAT R74038 TATTGTTGCATTATCAAAATGGTTATAGTTTTGAATTAAAACTGTAATTGATTTCTATGT ATAAAACAGCTTTGA?GTTGTAAATGTAGTTTCCAATCGTTAGTTAATGCTACATTAGTT AGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTACTAAGGCTGTTTGTAGGC GCATAGTAAGCTTCAGGATCATCACACGTTTTTNCCCTGTA?TTGGGTGGGGATAGGGA AGCCTTTAAGGTCTCTTGCTTCTCATGGGGTGGGGCTAGAAGGGAGGCAGGCAGCCATCG TGGGCAGGGCTTGTGATCTTTTTCCCTGCTGACACCTGCTGCTTGACATGGGGGGAAGGT TCTGGCACAGAAAGC1AGTGGGC_ATCCTTCATGAGGGTGGTACTTGGGGGGCAGACACTGA ° GGAGGCNTTGTAAATCGNCTTTTTNGTATCCAANCTCTNCTAAAGTAGGGNCCACCNCGT TTTTTNTTGCAGGTGGATNCGGGGCTN R74129 GGGTCCLAGTGCAGTGGCTTGCNTNC?^AAGAAGGC1AGCAGACAAAGTCGTCTTCCTTCTT TCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGT GAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGC CAGATTCATCTGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGAT TAC?ATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGT 5 GC1AGAACTTCTCCATGTCAAG(_AGCAGGTGTC?GC1AGGAAAAAGATCACAAGCCTGCCAC GATNGCTGCTGCTCCTTGTAGNCCACCCATGAGAAGCAAGTGACCTTTAAAGGNTTTCCT ATTNCCACCNATTTACAGGG BG433769 GACTAGATGTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAGTTTTCA ATTAAAACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCC AATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGT TTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTT Q TCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTAC AAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTG ACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTGGGGCAG ACA.CTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTAT TTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAG AGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGCCAClAGGTACCLATCGí^ACACA CTGTTGACGTCATTGGAAAAGAAGGAAGAC BG530489 GAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCGCACACACTGTTGACG 5 TCATTGGAAAGAAGGAAGACGACCTTGTCTGCTACCTTCTTTTGAGTGGCAAGCCACTGC ACTGGACCCATCTCTGCTATTTTCTTTTTCTGCCACTTTTCAAGGATGACCTCACTTCTG O^TGGTTTTGAAGAAATTCAGTG- AGTAACA?ATTGTGTGATGGAAACATATTTCAGAT GGGTAAACCACAAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTC TTGATCCTTTCTGTGAGAGGAGAftAAGC_ATTTGTTATCTGTGA?TAG(_AAACAGCAGGCT TTCACTCTGTAAACC?TCCCTGAaU^TGATCCCTTGCTAGAGAATGT lAGCTGAGCACC AAGGGCCTTGTTAGTGACAGCAAGGAAAAACATCCTGATGTTCCTTTTGAACACATCACC TGAAAC1AC?CTGATGCTTAAACCTTAACTTTTTTTTTTTGGGGGACATAGTCTCACTCTG TCGCCC?GGCTGGAGTGCGTGGGAGAGGACCTCGGAAAGACTGGCñAGCATCCGCATACA AGGGAGTAACAGCACAATACTCCGTGAACTTCGGAGCCCTCCAAAGGAATACTCAAGGGC GGGTAAAGGATGGCAAGGGTCGACGGAGAGCCCACGAGGAGAGCGGAAGGTAGAGAGGAG AO^GCATAAGACGCGAGAGGAACTCC?AGGCGGGGCCAAAGAGAGAAACCACGGTCACC AACAGAAG AA007528 AGAAGCC?GATTCATCTGCACAAATACGTGGTG1^CTACTTTAGAGAGATTGATAC2\AAA GACGATTAO^TGCTCTC^GTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCT TTCTGTGC^GAACTTCTC<^TGTCAAGCAGCAGGTGTCAGC?GGAAAAAGATCacaAGCC TGCC.ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCT TCCTATCCCACCAATTACAGGGNAAAAACNGTAGTGATNATCCCTGACAGCTTACTATGC CAGCCNT AA007529 TTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATCGGTTACAGTTTTCAATTAAAGCT GTAATTNGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGTTTCCAATCGTTA GTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATAAAATGTTTTAATTA CTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACACGTTTTTTCCCTGTA ATTGGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATTGGGTGGGCTACAAGGAG CAGCAGCCATCCGTNGGCAAGGCTTTGTGGATNCT BI260259 GGAAGAGAAAGATCGTCCAGAGGTTC<_ATCGCIAC?C?CTGTATGACGTCATTGGAAATGA AGGAAGACGACTTTGTCTGCTGGCTTCTTGTGAGTGGC^-AGCCACTGCAGTGGACCCATC TCTGCTATTTTCTTTATTCTGCC?CTTTTCAAGGATGACCTCACTTCTGCAATGGTTTTG AAGAAAGTTC?GTGAAGTAAC_AAATTGTGTGATGGA2^CATATTTC1AGATGGGTAAACCA CAAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAA2^AGGAAGTCTTCTTGATCCTTT CTGTGAGAGGAGAAAÑGCLATTAGTTATCTGTGAAC?GC^^ GTAAACCL TCCCTGAC_^AATGATCCCTTGCTAGAGAATGT(^GCTGAGC?CCAAGGGGCC TTGTTAGTGACA.GO\AGGAC?^AAACATCCTGATGTTCCTTTTGAACACATCAGCTGAAAC ACACTGATGCTCTAAACCGTTAACTATTTATTAATGGGGGAACATAGGTCTCAACTCATG TACGACC?GGCTGGAGTGCAGTGGGGTTGAAC?TCGACAGACATAGCÑAACCACCGATC-A CTAGGGAAACAACGCACAG?ACTCCAGACTTAA?ACACC AA287951 ATTCGGCACCTGGGGGGCLAGAC?CTGAGAGCATTGTAATCGTCTTTTGTATCaATCTCTC TAAAGTAGACC.ACCACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAA GGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGC C^C-AGGTACCATCGCACACIACTGTTGACGTCATTGGAAAGAAGGAAGACGACTTTGTCTG CTGCCTTCTTTTGAGTGGCAAGCCACTGCACTGGACCCATCTCTGCTATTTTCTTTTTCT GCC?CTTTTCAAGGATGACCTCACTTCTGCAATGGTTTTGAAGAAATTCAGTGAAGTAAC AAATNTGTGTGATGGAAACATATTTCAGATGGGTAAACCACAAGAACCTTAATGGGGGGC AGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTTCTGTGAGAGGAGAAAGC AA287911 TTTTGATGGTCCACTTCCATTTAATGAATTAGTAAATATCTTTTCTCATGATTTTAATTA C?TTTTTTTCTCTAGCTTACTTTATTATAATACAGCACATAATACACCTAACATGCAAAA TATGTGTTAATTGGCTGTTTATGTTATTGGTAAGACTTCCAGTCAACAGTAGGCTATTAG AAGTTAAGTTGTGGGAAAAT<_AAAGGTTATAGGAGATTTTCAACTGCATGCAGGGCCGGT GCCCTCCCCACTGTGTTGTTCAAGGGTCAGCTGTACTCTCTAAGGGCTTTGCTAACTTCA AAACATGGAGTATTTGAATA(^GAAACCAG?G?TTTACATACTCAGCTCAAGGCAGAGC TATTAAAAAAACTCCTCTTCTCCATATGTAGGAAAGGAAATACAAATGCATCCTTTGAGT CATTTGTGATGT T97852 AA ?GTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAACAAAAGCAA GCCGGGA GNCTG$TCGCTCTCCTCCTGCTGTCTCTGCTGGTGGCC?CATGGGTGCTGGTN GCAGGGATCTATCTAATGTNGAGGCACGAAAGGGATCAAGAGGACTTCCTTTTCTACCAC CACACTACTGCCCCCCATTAAGGTTCTTGTNGGTTTACCC?TCTGGAAATATGTTTCCAT CLACA(^^TTTGTTACTTC_ACTGGAATTTCRAC_?^AAACCATTGGCAGGANGTGAGGGTCAT CCTTGGAAAAGTGGGC T97745 CCTCACTTCTGCAATGGTTTTGAAGAAATTCAGTGAAGTAACAAATTGTGTGATGGAAAC ATATTTCLAGATGGGTA?ACCAC?AGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAA AGGAAGTCTTCTTGATCCTTTCGTGCCTCCACATTAGATAGATCCCTGCCACCAGCACCC ATGTGGCCACC?GCAGAGACAGCAGGAGGAGAGGCAGCCAGCCTCCCGGCTTTGCTTTTG TTGTTATCCAGAGGGGAAAGGGGACGCCTGTTTNTGGGGCAGAGCACAACTGTTTCCCTC GTGCCCGAATTCTTTGGGCCTTCGAGGGGCCAAATTTCCCTATTAGGTGAGGTCGTATTT TAAATTTCGGTAATTCATGGTCATAGGCTTGTTTTTCCCCG N40294 GTTTCAACAÍ^^TTTTGGATCAGCTGCCTGTTTGC^AAAACATAATATATTTCTGTTAAA CAGTTCTTCACCTAACAGCATATTGCTCTTATAACTGGTAGAGCTGTTTCAAAGGAAGTT GGTTTCTGGTCCAAGTTTTGACCTAAACCATGTCCATCTTCTATTACCAGCACTTACAAG CIACTGTGAA?ACTGATC?TGACAAATAAGTAA?ATTTGCTACATTAAAC-ATATTGCCTCA GCCATTACTAAGCGTCCACTTGTAAAGCTGGACACAGTTTTTACTTTATGCTTCATTTTG ATTTTTTATCCGTAAGACATAAATTAGAAGGCATGAGGTGGCCCTTTAAGGATAATCTGC AAATATACAG^TTTTAAATAGTCATCCLATCTGGAAATCGNTCCACCATTCC?GGGGAAGG ATTCCAGGTATTGGTGCTGTGGTGGAAATAAAGCATTCCCCNGGGAAAAAAACCATTTTA TGNCTAAATAATTACCACCATTAACCTCNTGGGGTT AA809841 GAATACTAACTCTAAGAACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAAAAACCT TCTATTACLATG AAAAAATCATTGTTTTTA?GATAACAAAAGTAGGGAATAAACAAGCTG AACCCACTTTTACTGGACCAAATGATCTATTATATGTGTAACCACTTGTATGATTTGGGA TTTGCAT AA832389 TTTTTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTTAATTGAAAAC TATAACCATTTTGATAATGCAACAATAA?GCATCTTCAGCCAAACATCTAGTCTTCCATA GACCATGCATTGCAGTGTACCCAGAACTGTTTAGCT H14692 CTGAGTGTGATGGTGTAAGCCTGTGGTCCCAGCTACTAGGGAGGCTGAGATGGGATTACA GGTGTGAGCCACGGCGCCTGGCCTAAAAGCATCTTTTTCTTTAACGCAGAGGTTATGTTG ATTATTAGCATAAATGTTTTTTTCTGGGAATGCTTATTTCACACAGCACAATACTGAAT CTTCTCTGGAATGTGGATCGATTTCAGATGGATGACTATTAAAATGTGTATATTTGCAGA TTATCCTTAAAGGGCCACCTCATGCCTTCTAATTTATGTCTTACGGATAAAAAATCA2^AA TGAAGCATAAAGTAAAAACTGTGTCCAGCTTTACAAGTGGACGCTTAGTAATGGCTGAGG C?ATATGTTTAATGTAGCCAAATTTTACTTATTTGTCCATGATCCAGTTTTTCACAGTGC TTGTTAAGTGCTGGTAATTAGGAAGGTGGGACATGGGTTAGGTCAAAACTTGGGACCNGA AACCAACTTGN AA732635 TTTTTTTTTTACAACTTCAAAGCTGTTTTATACATAGAAATCAATTACAGTTTTAATTGA AAACTATAAGCATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAACATCTAGTCTTC C^TAGACCATGCATTGCATTGTACCCAGAACTGTTTAGCTAATATTCTATGTTTAATTAA TGAATACTAACTCTA?G?ACCCCTCACTGATTCACTCAATAGCATCTTAAGTGAA?AACC TTCTATTACATGCAAAAAATCATTGGTTTT AA928257 TTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGA TACACAGAAGGGAA?AAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCT GCTGAAAAAAGCCA?AGATGTAAGATGGCTGGGTATATATGAGAATG?ATATTTCACTAT ATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCACATGGC C^AACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAACAGCA TGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAA ATACL?^TGTTTACLA.G^CAGTCCAGGGGTGGGGTCAAAAGTTGGAAGGTGTCATTAGACG CAGCCAAATAAAGTGAAGACAACCCAGGTGACTGGCAGCCCTGACTTGTGCGTGGGCG Al 184427 TTTCTGAGTAAGA?CAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGAT ACAC1AGAAGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAGTGCCACAAGGATCTG CTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATA TTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTGGTGGTGGTCACATGGCC AACATTTGGATAACAAATGAGGA AI298577 GAGATGGAGGTCTCGCTTTGTGACGTAGCCTGGTCTTGAGCGATCCTTTTGCCTTGGCCT TGCCAAAGTGCTGGGATTGGAGGCATGAGCCACTGCACCCACCCCTGTTTTTTTTTTAAG TAAACCATTATAATAACTCATTTATAAAAAGGTTACTTCAAGAGGGCTTTCAACTTAAGA ATTATTTTCATTTTGAACATGAAAAGTTAAATAGTAACTAAGAAACTGAGAACTCTGACA GTGACCTCTAATAGGTAACTTTAGGCAAAAGTAGACAAGTTTGTGGGTATTTTGTTGTTC ATGTTAAAAGGCACCTGTACAAGAATCAAGATATGAATCTAGTTTGTAGAGGGAAGGTCT TATGCAAATACCAAATCATACAAGTGGT AI692717 AGAGATGTTGGTCTCGCTTTGTGACGTAGCCTGGGCTTGAGCGATCCTTTTGCCTTGGCC TTGCCAAAGTGCTGGGATTGGAGGCATGAGCCACTGCACCCACCCCTGTTTTTTTTTTAA GTAAAECATTATAATAACTCATTTATAAAAAGGTTACTTCAAGAGGGCTTTCAACTTAAG AATTATTTTCATTTTGAACATGAAA?GTTAAATAGTAACTAAGAAACTGAGAACTCTGAC AGTGACCTCTAATAGGtAACTTTAGGCAAAAGTAGACAAGTTTGTGGGTATTTTGTTGTT <-A.TGTTAAAAGGCACCTGTACAAGAATCAAGATATGAATCTAGTTTGTAGAGGGAAGGTC TTATGCAAATACC?AATCaTACAAGTGGTTACACATATAATAGATCATTTGGTCCAGTAA AAGTGGGTTCAGCTTGTTTATTCCCTACTT AA910922 GAGATGGAGGTCTCGCTTTGTGACGTAGCCTGGTCTTGAGCGATCCTTTTGCCTTGGCTT GCAAAGTGCTGGGATTGGAGGCATGAGCACTGCACCCACCCCTGTTTTTTTTTTTAAGTA AACCATTATAATAACTCATTTATAAAAAGGTTACTTCAAGAG H90761 TTCACTCAATAGC1ATCTTA?GTGAAAAACCTTCTATTACATGCAAAAAATCATTGTTTTT AAGATAACAAAAGTAGGGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATGANCTA TTATATGTATAACCACTTGTATGATTTGGTATTTGCATAAGACCTTCCCTCTACAAACTA GATTCATATCTTGATTCTTGTACAGGTGCCTTTTTAATATTCTGTGATGAAATCGTTCAC AGTaGAGTACATGTCTGCTGCATATGGGAAATAGGGACTGTTGTTCTGAGGGACAAGGC ACTCAATTCAGCCGTAAAGK3CTGACCCGGGCTACTTTTTTTC(_AGGGAATACAATTTTT TTACCTTGGAATAAAATNGGGCCCGACNGGAC AI620122 TTTTTTTTTTTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAG CAGGATAC^CAGAAGGGAAAAAAATAC^CAGTGCAAAATGGATGTTCTGAGTGCCACAAG GATCTGCTGAAAAAAAGCCAAAGATGTAAGÁTGGCTGGGTATATATGAGAATGAATATTT CACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCA CATGGCO^CLATTTGGATi\ACaAATGAGGAATAATGGTACCGCCTC-?_CTAGTGCCTGAGA ACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGAT GGAGAAATAC^TGTTTACLAC^CAGTCCAGGGGTGGGGTay^^ TAGACGCA AI793318 AAATTTTTAACTTTTAATAGTTAAAATAGTTAACTATTGGTATGGTAGGAAATGATAAAG TAGACTAGTATCTGTATACATTTTCTGCATTTATGACATACCTTTTTCTTCATTTTTTTC AATATTTTAATTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCAAAGTGATACAAAT CTCC?AAAAATTTTCCAATATATGTATTGAAAAAATCCAGGTGTAAGTGGCTCTGCGCAG TCCAAACCTGTGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGAAAGCTTTTCTTAA C?CCTC?TAAGAACTATTTTTTAAAAAACAGGAACTAGC_?TAGAGTAACC?TC_?_CAGGTA AAGTGTAATTTGTTATCAGCCATCTTTTGCCCATTTCAGTACTGGTAGAAGGCTCAATGG TAAAAATAAA AA962325 TTTTTTTTTTTTTTTTTTTTTTTTCTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTT CTACCIAGTACTGAA?TGGGCAAAAGATGGCTGATAACAAATTACACTTTACCTGTGATGG TTACTCTATGCTAGTTCCTGTTTTTTAAAAAATAGTTCTTATGAGGTGTTAAG?AAAGCT TTCGCTTGGATTC-?TAC?CIAGTTGACCCTTGAACAACACAGGTTTGGACTGCGCAGACCA CTTACACCTGGATTTTTTCAATACATATATTGGAAAATTTTTTGGGGATTTGTATCACTT TGAAAAAACTTAGATGAAACTCGGATGGACTTTTCCATTAAAATATTGGAAAA?ATGAAG AAAAAGGT A1733290 TTTTTTTTTTTTTTTTTTTTTTTTCTGACTGGCCCGTTTTTATTTTTACCATTGAGCCTT CTACC?GTACTGAAATGGGCAAAAGATGGCTGATAACAAATTACACTTTACCTGGGATGG TTACTCTATGCTAGTTCCTGTTTTTTAAAA?ATAGTTCTTATGAGGGGTTAAAAAAAGCT TTCGCTTGGATT_ATACACAGTTGACCCTTGA?CAACACAGGTTTGGACTGCGCAGAGCC ACTTACACCTGGATTTTTTCA?TACATATATTGGAAAATTTTTTGGAGATTTGTATCACT TTGAAAAAACTTAGATGAAACTCGG?TGAACTTTTC^^TTAA?ATATTG_^AAAAATGAA GAAAAAGGTATGTCATAAATGCAGAAAATGTATACAGATACTAGTCTACTTTATCATTTC CTACCATACCAATAG BQ226353 TAAAGGAAC?GTTGTGCTCTGCCCACAAAC?GGCGTCCCTTTCCCTCTGGATAACAGTAA GTGCCC?GTAACTTCAACCAGATGATC AGTGGCTC?CACACAGTCIACTGCCCCCCACT CAGTATGTGGAAGGGTTGTGTGTATGTGGGCAGTGCAAGGGGTCGCTGCCTGTGTACACT GAACTGGGGTGCIAGAGAAAGCCAACAGTGCTGTCCC?GAGAACCTAGAATCTGAGTAAGA AC?GGCTTTATTTGTAAAACCACTCGTGACTCTTTA(_AAAGCAGGATACACAGAAGGGAA AAAAATACACAGTGCAAAATGGATGTTCTGAGTGC(^CAAGGATCTGCTGAAAAA?GCCA AAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATATTCTGATTCAATT ACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGGTCACATGGCCA?CATTTGGATAA C¿^AATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAACAGCATGTTCTGG_VAAATG TCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAAATACAATGTTTACA CAAC_AGTCC_;.GGGGTGGGGGTC^^GTTGGAAGGTGTCATTAGACGCAGCCOAATAAAG TGAAGACCACCCAGGTGACTGGCAGCCCTGACTTGTGCGTGGGCGAAACCTTACAGATTC CTGGGGCACTCTGTGCCTGAACTTACCTGGATGGTCTTTGTGAGGCGGGTGGGCACTTAT CCTGCATNAATGGTCAGTCTAACAAGACCGGCCTGTAAAAATGGCATCTAATAGGGGCTA TGGAATGGAAAACAGTTGGTACCCAGAAATAACTTTAATT W04890 GACAGTCTGGGAGCCCAGAGCTCTGGGAGGAGTNGGGAAAATGCTGCTTCGTGCTGCTTG CTTCTAGGCACCTGCTTCCGCCATCTCACTTAGCATGGCTAGAGATGGGGGTGAGAGTGG GG_^GGACA?AAGCAGGGAACAGATAAGGGATGGAAATCAGAAGGGAATATAGAAAGAAC TCTGGATATGCNAGAAATGCCGGTACCTGAGCATTTTGTATCAATGGGAGTACCCTCTGT AACTGCTC1AGTAGGTTACAAATGAAGAGTCCACCAGTATTAGAA?CAATTTAAACTTGCC AGTACCAACTGGGATGTGTGCCTTCAATTTGAAAATTGTATGTTTTATTTTTTAAATTTG GTTAACAGCATTAATTTATAGAGTATTTGATGTCATTTATGGTTCCCGAGGTGTTTCCAA CACAATTTTTGGGATCA B 455231 CTTTTAATAGTTAAAATAGTTAACTATTGGTATGGTAGGAAATGATAAAGTAGACTAGTA TCTGTATAClATTTTCTGCATTTATGAaiTACCTTTTTCTTCATTTTTTTCAATATTTTAA TTGAAAAGTT(_?TCCGAGTTTC_ATCTA?GTTTTTTCAAAGTGATACAAATCTCCAAAAAA TTTCCAATATATGTATTGAAAA?ATCCAGGTGTAAGTGGCTCTGCGC?GTCCAAACCTG TGTTGTTO^GGGTCAACTGTGTATGAATCCAAGCGAAAGCTTTTCTTAACACCTCATAA GAACTATTTTTTAA?A?AC?GGAACTAGCATAGAGTAACCATCACAGGTAAAGTGTAATT TGTTATCAGCCATCTTTTGCCCATTTI^GTACTGGTAGAAGGCTCAATGGTAAAAATAAA AACGGGACAGTCAGAAGATCTGGAAGTCCTGACCCTGCTTTCACCTGGCATGTGTAATCC AGT(_ATGCTCGTATCAGTCTCTGTAGGAGCACTTGAAGGTATTACATAAATGCTATCTAA CTCTGGGAAACGCCAACATGTGATTGCCTC(^GAGGAATCTTCTTTAAA2_AAAAATTCAA AATGTTATTTCCTTACTAGGATGTCTTTAAAGAATTATAACCCTTACCGTGCCTCCACAT TAGATAGATCCCTGCC?CC?GCACCCATGTGGCCACC&GC?^ C^GCCAGCCTCCCGGCTTGCTTTTGTCTGGAAA?AAACAAAGCTTATTCACCTTTGGAAA AAAATCCACACTTATCTCTTAATTTAAAAACTAAGACTTGGTATACTTTATAGAGGGTTA TTTATTTTTTATTATTTTTTAGTTTTGAGACAGAGTCTCGCTTTGTTGCCTANGCTGGAG TGC.AGTGGCGCAATCTCGGTTCACTGCAGCCTCCGTTCTCCGGGGTTCAAGGCATGCTGG CTCAGCCTCCTGTATAGCTGGGGATTAAAGGCATGTGTTCACGCGGCCCAGCCCCTTTTG TAAAAGATTTAGATCCCTTTTAAAACCATCAGTCAGGAGGCTCCTTTAAAAAGTCTGGCC ATCTAATCTTTTTTCCCCCAAAAGGGG BI492426 TTTTTTTTTTTCTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTC TTTACAAAGC?GGATAC?C?GAAGGGAAAaAAA^^ TGC<ZAO_AGGATCTGCTGAAAA?^GCCAAAGATGTAAGATGGCTGGGTATATATGAGAAT GAATATTTC?CTATATTCTGATTCAATTACC?GTCTC-AGTGGCCCAGGATGAGCTTTTGG TGTGGTCIACI^TGGCCAACATTTGGATAACAAATGAGGAATAATCTCGTGC BG674622 AATTTATAGAGTATTGATGTCATTTATGTTTCTGAGGTGTTTC^^CACAATTTTGGATCA GCTGCCTGTTTGCA?^AAAC?TAATATATTTCTGTTAAACAGTTCTTC?CCTAAC?GCa.TA TTGCTCTTATAACTGGTAGAGCTGTTTCAAAGGAAGTTGGTTTCTGGTCCAAGTTTTGAC CTAAACCATGTCC-ATCTTCTATTACCAGC?CTTACAP-GCACTGTGAAZ^CTGATC?TGAC AAATA?GTAAñATTTGCTACATTAAACATATTGCCTCAGCCATTACTAAGCGTCCACTTG TAAAGCTGGACACAGTTTTTACTTTATGCTTCATTTTGATTTTTTATCCGTAAGACATAA ATTAGAAGGCATGAGGTGGCCCTTTA?GGATAATCTGCAAATATACACATTTTAATAGTC ATCCATCTGAAATCGATCC?CATTCC12_GAGAAGATTCAGTATTGTGCTGTGTGAAATAAG CATTCCC?G&AAAAAAACATTTATGCTAAT^ AGATGCTTTTAGGCCAGGCGCCGTGGCTCACGCCTGTAATCCCTGCACTTTGAGAGGCTG AGGTGGGTGGATC1ATGAGGTC_AGGAGATCAAGAC(_?TCCTGGCTAACAGGGTGAAACCCC GTCTCTACTGGGGATATAACAAAGTTAGCTGGGTGTGGTGGTGGGTGCTTGTGGTCCCAG CTACTCAGGAGGCTGAGGO.GGAGAATGGCGTGAACCCGGAAGGCAGAGGTTGTAGTGAC GCGAGGTTCACGCCACTGCATTCCAGTCTGGG BX111256 (^GGAAGIWAAGAACAGTCCTAAAATCTCTTTGGCTTCTTTGTCCTGATATGCACCGGCA TTTTCACAGTAGGAACTAGGGTTTCTGTCCAGTTTTTTTGGTTCTTTAAGGAATTAATGT TATTCTGGGTAC^y_CTGCTTAC^TAC_ATAGC?CA.TATAGATGACATTTTTACAGGCCGTC TTGTTAGACTGA(_ATAC1ATGGAGGATAGTGCCACCCGCCTC?CM.GAA 1ATCAGGTAAGC TCAGGCL?_CAGAGTGCCCAGGAATCTGTAAGGCTTCGCCC?CGCACAAGTCAGGGCTGCCA GTCACCTGGGTTGTCTTCACTTTATTTGGCTGCGTCTAATGACACCTTCCAACTTTTGAC CCCACCCCTGGACTGTTGTGTAAACATTGTATTTCTCCATCTGTAATGAAAAAGCTAACA C_ATCTCTAACTCC?GAGACATTTTCC?GAAC_ATGCTGTTCTCAGGCACTAGTGAGGCGGT ACCATTATTCCTClATTTGTTATCCL ATGTTGGC( TGTGAC(_aCACC_aAAAGCTCATCC TGGGCCACTGAGACTGGTAATTGAATCAGAATATAGTGAAATATTCATTCTCATATATAC CC1AGCCATCTTACATCTTTGGCTTTTTT ?G(^GATCCTTGTGG(-?CTC1AGAACATCCAT TTTGCACTGTGTATTTTTT BX117618 AAATTTTTAACTTTTAATAGTTAAAATAGTTAACTATTGGTATGGTAGGAAATGATAAAG TAGACTAGTATCTGTATACATTTTCTGCATTTATGACATACCTTTTTCTTCATTTTTTTC AATATTTTAATTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCAAAGTGATACAAAT CTCGAAAAAATTTTCCAATATATGTATTGAAAAAATCCAGGTGTAAGTGGCTCTGCGCAG TCCAAACCTGTGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGAÍ-AGCTTTTCTTAA CACCTCATAAGAACTATTTTTTA?AAAAC1AGGAACTAGCATAGAGTAAC(_AT(^CAGGTA AAGTGTAATTTGTTATCAGCCATCTTTTGCCCATTTCAGTACTGGTAGAAGGCTCAATGG TAAAAATAAAAACGGGACAGTCAGAAAAA AA682806 TCTGAGTAAGAAC?GGCTTTATTTGTAAAACCACTCGTGACTCTTTAC?AAGCaGGATAC AC?GAAGGGAA AAATACAC?GTG(_AAAATGGATGTTCTGAGTGCa-CAAGGATCTGCT GAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATATT CTGATTO^TTACCAGTCTCAGTGGCCí^GGATGAGCTTTTGGTGTGGTCACATGGCCAA C?TTTGGATAAG? AATGAGG?ATAATGGTACCGCCTCA.CTAGTGCCTGAGAACAGCATGT TCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAAATA CAATGTTTACACAACAGTCCAGGGGTGGGGTCAAAG A1202376 CTGACTGTCCCGTTTTTATTTTTACC1?TTGAGCCTTCTACCAGTACTGAAATGGGCAAAA GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTT TTAAAAAATAGTTCTTATGAGGTGTTAAGA?AAGCTTTCGCTTGGATTCATACACAGTTG ACCCTTGAACAACACAGGTTTGGACTGCGCAGAGCCACCCTCGTGCCGAATT AI658949 CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTT TTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACACAGTTG ACCCT BG403405 GGAAATGATAAAGTAGACTAGTATCTGTATACATTTTCTGCATTTATGACATACCTTTTT CTTCATTTTTTTCAATATTTTAATTGAAAAGTTCATCCGAGTTTCATCTAAGTTTTTTCA AAGTGATAO^ATCTCC^AA??ATTTTCCAATATATGT^^ TGGCTCTGCGCAGTCCAJ^ACCTGTGTTGTTCAAGGGTCAACTGTGTATGAATCCAAGCGA AAGCTTTTCTTAACACCTCATAAGAACTATTTTTTAAA?^AACAGGAACTAGCATAGAGTA ACCATC?CLAGGTA2^GTGTAATTTGTTATC_AGCC-ATCTTTGCC 1ATTTCAGTACTGGTAG AAGGCT ^^TGGTAAAAATAAAAACGGGACAGTCAGAAGATCTGGAAGTCCTGACCCTGC TTTCACCTGGCATGTGTAATCCAGTCATGCTCGTATCAGTCTCTGTAGGAGCACTTGAAG GTATTACLATAAATGCTATCTAACTCTGGGAAACGCCaACATGTGATTGCCTCCAGAGGAA TCTTCTTTAAAAAAAAATTCAAAATGTTATTTCCTTACTAGGATGTCTTTAAAGAATTAT AACCCTTACCGTGCCTCCIAC?TTAGATAG?TCCCTGC^^CAGACCC ATGTGGCLACCAGCA GAGACAGCAGGAGGAGAGGCAGCAGCTCCCGGTTGTTTGTCTGGAAAAACAAAGGTTATC ACTTTG BE673417 CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTT TTAAAAAATAGTTCTTATGAGGTGTTAAGAAAAGCTTTCGCTTGGATTCATACÁCAGTTG ACCCT AW021469 GC ACGAGATTATTCCTCATTTGTTATCCAAATGTTGGCCATGTGACCACACCAAAAGCTC ATCCTGGGCCaCTGAGACTGGTAATTGAATCAGAATATAGTGAAATATTCATTCTCATAT ATACCCAGCCLATCTTACATCTTTGGCTTTTTT(_?GCIA.GATCCTTGTGGGACTCAGAACAT CCATTTTGCACTGTGTATTTTTTTCCCTTCTGTGTATCCTGCTTTGTAAAGAGTCACGAG TGGTTTTAC^^TAAAGCCTGTTCTTACTCAGAAAAAAñAAAñAAAAAAAA CF455736 NNTTGAACAGGCGTGACGGTGCGGATTCCCGGGATGTTGTGCTCTGCC(ACAA?CAGGCG TCCCTTTCCCTCTGGATAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGC TGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACG AAAGGATCAAGAAGACTTCCTTTTCTACCACCACACTACTGCCCCCCATTAAGGTTCTTG TGGTTTACCC?TCTGÍ^?TATGTTTCCIATCIAC?C?ATTTGTTACTTCACTG?ATTTCTTC AAAACC_ATTG(^GAAGTGAGGTC?TCCTTGAAAAGTGGCAGAAAAAGAAAATAGCAGAGA TGGGTCCAGTGCAGTGGCTTGCCACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTC TTTCC?ATGACGT<_-AAC?GTGTGTGCGATGGTACCTGTGGCA^GAGCGAGGGCAGTCCCA GTGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAA GCCAGATTC-?_TCTG(_AC?AATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACG ATTAC?ATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCT GTGC GAACTTCTCC?TGTC^^GCAGCAGGTGTCAGCAGGAAAAAGATCACAAGCCTGCC ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGA?GCAAGAGACCTTNAAGGCTTCCT ATCCCACCATTACAG AW339874 TTTTTTTTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTTTAC AAGCAGGATAC?CAGAAGGGAA?AAAATAC-ACAGGGCAAAATGGATGTTCTGAGTGCCA C?^GGATCTGCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATA TTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTGTGG TCA^TGGCC?ACATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGCCTG AGAACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACA GATGGAGAAATACAATGTTTACACAAC BG399724 CATGATGTTC1AGTATGATCAGTTAACCTTAACCTCTGAG(^TCCTGAAGCAAAATCTAAA TAATGCLAGCTATTACCACTGGTGGTCCAGGCTCTGGTGAAGCCCTCTGAGCCCAGGAGGA AGAGAAAGC^TTGTCC_?-GAGGTAGGAACACAGTCTGGGAGCCCAGAGCTCTGGGAGGAGT GGGAAAATGCTGCTTCCTGCTGCTTGCTTCTAGGCACCTGCTTCCGCCATCTCACTTACC ATGGCTAGAGATGGGGGTGAGACTGGGGAAGGACAAAAGCAGGGAACAGATAAGGGATGG AAATCAGAAGGGAATATAGAAAGAACTCTGGATGTGGAGAAATGCCGGTACCTGAGCATT TTGTATC^ATGGGAGTACCCTCTGTAACTGCTCAGTAGGTTACAAATGAAGAGTCCACCA GTATTAGAZ^CAATTTAAACTTGCC?GTACC-AACTGGGATGTGTGCCTTCAATTTGAAAA TTGTATGTTTTATTTTTTAAATTTGTTAACAGCATTAATTTATAGAGTATTGATGTCATT TATGTTTCTGAGGTGTTTCAA BF475787 TCTGAGTAAGAAC?GGCTTTATTTGTAAAACCACTCGTGACTCTTTACAAAGCAGGATAC ACAGAAGGGAAAAAAATA(^(^GTGCAA¡^TGGÁTGTTCTGAGTGCCAG?_AGGATCTGCT GAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGAATATTTCACTATATT CTGATTCAATTACCAGTCTC^GTGGCCC?GGATGAGCTTTTGGTGTGGTCACATGGCCAA CATTTGGAT2^C3«ATGAGGAATAATGGTACCGCCTCACTAGTGCCTGAGAAGAGCATGT TCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATTACAGATGGAGAAATA CAATGTTTAC?C^C^GTCCAGGGGTGGGGTC^ÍAAGTTGGAAGGTGTC?TTAGACGCAG CCAAATAAAGTGAAGACÍ_ACCCAGGTGACTGGCAGCCCTGACTTGTGCGTGGGCGA BF437145 CTGACTGTCCCGTTTTTATTTTTACCATTGAGCCTTCTACCAGTACTGAAATGGGCAAAA GATGGCTGATAACAAATTACACTTTACCTGTGATGGTTACTCTATGCTAGTATCCTGTTT TTTAAAAAATAGTTCTTATGAGGTGTTAAGAAñAGCTTTCGCTTGGATTCATACACAGTT GACCCT H64601 AGGAAGTTAAGAACAGTCCTAAAATCTCTTTGGCTTCTTTGTCCTGATATGCACCGGCAT TTTCACAGTAGGAACTAGGGTTTCTGTCCAGTTTTTTTGGTTCTTTAAGGAATTAATGTT ATTCTGGGTAC^^CTGCTTACLATACaTAGCACATATAGATGAC?TTTTTACAGGCCGTCT TGTTAGACTGAC_ATACATGGAGGATAGTGCC-ACCCGCCTC1AC3^GAAC?TC?GGTÍ_AGCT CLAGGCACIAGAGTCCNAGGGNATCTGTAAGGGCTTCGCC(^CGCAa^GTCAGGGCTGCCA GTCACCNGGGTTGTCTTCACTTTATTTGGGCTGCGTCTAATGACACCTTNCCAACTTTTT GACCCCACCCTGGGGCTTGTTGTGTAAACCATTGTTATTTCTCCCNTCTGTAATGGAAAA AGGTTAACACNTTTTTAACTTCCGGNGACATTTTTC AF212365 gcacgagcga tgtcgctcgt gctgctaagc ctggccgcgc tgtgcaggag cgccgtaccc cgagagccga ccgttcaatg tggctctgaa actgggccat ctccagagtg gatgctacaa catgatctaa tccccggaga cttgagggac ctccgagtag aacctgttac aactagtgtt gcaacagggg actattcaat tttgatgaat gtaagctggg tactccgggc agatgccagc atccgcttgt tgaaggscac caagatttgt gtgacgggca aaagcaactt ccagtcctac agctgtgtga ggtgcaatta cacagaggcc ttccagactc agaccagacc ctctggtggt aaatggacat tttcctacat cggcttccct gtagagctga acacagtcta tttcattggg gcccataata ttcctaatgc aaatatgaat gaagatggcc cttccatgtc tgtgaatttc acctcaccag gctgcctaga ccacataatg aaatataaaa aaaagtgtgt caaggcsgga agcctgtggg atscgaacat cactgsttgt aagaagaatg aggagacagt agaagtgaac ttcacaacca ctcccctggg aaacagatac atggctctta tccaacacag cactatsatc gggttttctc aggtgtttga gccacaccag aagaaacaaa cgcgagcttc agtggtgatt ccagtgactg gggatagtga aggtgctacg gtgcagctga ctccatattt tcctacttgt ggcagcgact gcatccgaca taaaggaaca gttgtgctct gcccacaaac aggcgtccct ttccctctgg ataacaacaa aagsaagccg ggaggctggs tgcctctcst cctgctgtct ctgctggtgg ccacatgggt gctggtggca gggatctatc taatgtggag gcacgaaagg atsaagaaga cttccttttc taccaccaca ctactgcccc ccattaaggt tcttgtggtt tacccatctg aaatatgttt ccatcacaca atttgttact tcactgaatt tcttcaaaac cattgcagaa gtgaggtcat ccttgaaaag tggcagaaaa agaaaatagc agagatgggt ccagtgcagt ggcttgccac tcaaaagaag gcagcagaca aagtcgtctt ccttctttcc aatgacgtca acagtgtgtg cgatggtacc tgtggcaaga gcgagggcag tcccagtgag aactctcaag actcttcccc ttgcctttaa csttttctgc agtgatctaa gaagccagat tcatctgcac aaatacgtgg tggtctactt tagagagatt gatacaaaag acgattacaa tgctctcagt gtctgcccca agtaccacct catgaaggat gccactgctt tctgtgcaga acttctccat gtcaagtagc aggtgtcagc aggaaaaaga tcacaagcct gccacgatgg ctgctgctcc ttgtagccca cccatgagaa gcaagagacc ttaaaggctt cctatcccac caattacagg gaaaaaacgt gtgatgatcc tgaagcttac tatgcagcct acaaacagcc ttagtaatta aaacatttta taccaataaa attttcaaat attgctaact aatgtagcat taactaacga ttggaaacta catttacaac ttcaaagctg ttttatacat agaaatcaat tacagtttta attgaaaact ataaccattt tgataatgca acaataaagc atcttcagcc aaaaaaaaaa aaaaaa AF208110 cggcgatgtc gctcgtgctg ataagcctgg ccgcgctgtg caggagcgcc gtaccccgag agccgaccgt tcaatgtggc tctgaaactg ggccatctcc agagtggatg ctacaacatg atctaatccc cggagacttg agggacctcc gagtagaacc tgttacaact agtgttgcaa caggggacta ttcaattttg atgaatgtaa gctgggtact ccgggcagat gccagcatcc gcttgttgaa ggccaccaag atttgtgtga cgggcaaaag caacttccag tcctacagct gtgtgaggtg caattacaca gaggccttcc agactsagac sagaccctct ggtggtaaat ggacattttc ctatatcggc ttccctgtag agctgaacac agtctatttc attggggccc ataatattcc taatgcaaat atgaatgaag atggcccttc catgtctgtg aatttcacct caccaggctg cctagaccac ataatgaaat ataaaaaaaa gtgtgtcaag gccggaagcc tgtgggatcc gaacatcact gcttgtaaga agaatgagga gacagtagaa gtgaacttca caaccactcc cctgggaaac agatacatgg ctcttatcca acacagcact atcatcgggt tttctcaggt gtttgagcca caccagaaga aacaaacgcg agcttcagtg gtgattccag tg?ctgggga tagtgaaggt gctacggtgc agctgactcc atattttcct acttgtggca gcgactgcat ccgacataaa ggaacagttg tgctctgccc acaaacaggc gtccctttcc ctctggataa caacaaaagc aagccgggag gctggctgcc tctcctcctg ctgtstctgc tggtggccac atgggtgctg gtggcaggga tctatctaat gtggaggcac gaaaggatca agaagacttc cttttctacc accacactac tgccccccat taaggttctt gtggtttacc catctgaaat atgtttccat cacacaattt gttacttcac tgaatttctt caaaaccatt gcagaagtga ggtcatcctt gaaaagtggc agaaaaagaa aatagcagag atgggtccag tgcagtggct tgccactcaa aagaaggcag cagacaaagt cgtcttcctt ctttccaatg acgtcaacag tgtgtgcgat ggtacctgtg gcaagagcga gggcagtccc agtgagaact ctcaagacct cttccccctt gcctttaacc ttttctgcag tgatctaaga agccagattc atctgcacaa atacgtggtg gtctacttta gagagattga tacaaaagac gattacaatg ctctcagtgt ctgccccaag taccacttca tgaaggatgs cactgctttc tgtgcagaac ttctcsatgt caagcagcag gtgtcagcag gaaaaagatc acaagcctgc cacgatggct gctgctcctt gtagcccacc catgagaagc aagagacctt aaaggcttcc tatcccacca attacaggga aaaaacgtgt gatgatcctg aagcttacta tgcagcctac aaacagcctt agtaattaaa acattttata ccaataaaat tttcaaatat tactaactaa tgtagcatta actaacgatt ggaaactaca tttacaactt caaagctgtt ttatacatag aaatcaatta cagctttaat tgaaaactgt aaccattttg ataatgcaac aataaagcat cttccaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa AF208111 cggcgatgtc gctcgtgctg ataagcctgg ccgcgctgtg caggagcgcc gtaccccgag agccgaccgt tcaatgtggc tctgaaactg ggccatctcc agagtggatg ctacaacatg atctaatccc cggagacttg agggacctcc gagtagaacc tgttacaact agtgttgcaa caggggasta ttcaattttg atgaatgtaa gctgggtact ccgggcagat gccagcatcc gcttgttgaa ggccaccaag atttgtgtga cgggcaaaag caacttccag tcctacagct gtgtgaggtg caattacaca gaggccttcs agactcagac cagaccctct ggtggtaaat ggacattttc ctatatcggs ttccctgtag agctgaacac agtctatttc attggggccc ataatattcc taatgcaaat atgaatgaag atggcccttc catgtctgtg aatttcacct caccaggctg cctagaccac ataatgaaat ataaaaaaaa gtgtgtcaag gccggaagcc tgtgggatcc gaacatcact gcttgtaaga agaatgagg gacagtagaa gtgaacttca saaccactcc cctgggaaac agatacatgg ctcttatcca acacagcact atcatcgggt tttctcaggt gtttgagcca caccagaaga aacaaacgcg agcttcagtg gtgattccag tgactgggga tagtgaaggt gctacggtgc aggtaaagtt cagtgagctg ctctggggag ggaagggaca tagaagactg ttccatcatt cattgctttt aaggatgagt tctctcttgt caaatgcact tctgccagca gacaccagtt aagtggcgtt catgggggtt ctttcgctgc agcctccacc gtgctgaggt caggaggccg acgtggcagt tgtggtccct tttgcttgta ttaatggctg ctgaccttcc aaagcacttt ttattttcat tttstgtcac agacactcag ggatagcagt accattttac ttccgcaagc ctttaactgc aagatgaagc tgcaaagggt ttgaaatggg aaggtttgag ttccaggcag cgtatgaact ctggagaggg gctgccagtc ctctctgggc cgcagcggac ccagctggaa cacaggaagt tggagcagta ggtgctcctt casctctcag tatgtctctt tcaastctag tttttgaagt ggggacacag gaagtccagt ggggacacag ccactcccca aagaataagg aacttccatg cttcattccc tggcataaaa agtgntcaaa cacaccagag ggggcaggca ccagccaggg tatgatgggt actacccttt tctggagaac catagacttc ccttactaca gggacttgca tgtcctaaag castggctga aggaagccaa gaggatcact gctgctcctt ttttgtagag gaaatgtttg tgtacgtggt' aagatatgac stagcccttt taggtaagcg aactggtatg ttagtaacgt gtasaaagtt . taggttcaga ccccgggagt cttgggcatg tgggtctcgg gtcactggtt ttgactttag ggctttgtta cagatgtgtg accaagggga aaatgtgcat gacaacacta gaggtagggg cgaagccaga aagaagggaa gttttggctg aagtaggagt cttggtgaga ttttgctgtg atgcatggtg tgaactttct gagcctcttg tttttcctca gctgactcca tattttccta cttgtggcag cgastgcatc cgacataaag gaasagttgt gctctgccca caaacaggcg tccctttccc tctggataac aacaaaagca agccgggagg ctggctgcct ctcctcctgc tgtctctgct ggtggccaca tgggtgctgg tggcagggat ctatctaatg tggaggcacg aaaggatcaa gaagacttcc ttttctacca ccac ctact gccccccatt aaggttcttg tggtttaccc atctgaaata tgtttccatc asacaatttg ttacttcact gaatttcttc aaaaccattg cagaagtgag gtcatccttg aaaagtggca gaaaaagaaa atagcagaga tgggtccagt gcagtggctt gccactcaaa agaaggcagc agacaaagtc gtcttccttc tttccaatga cgtcaacagt gtgtgcgatg gtacctgtgg caagagcgag ggcagtccca gtgagaactc tcaagacctc ttcccccttg cctttaacct tttctgcagt gatctaagaa gccagattca tctgsacaaa tacgtggtgg tctactttag agagattgat acaaaagacg attacaatgc tctcagtgtc tgccccaagt accacttcat gaaggatgcc actgctttct gtgcagaact tstccatgtc aagcagcagg tgtcagcagg aaaaagatca caagcctgcc acgatggctg ctgctccttg tagcccaccc atgagaagca agagacctta aaggcttcct atcscascaa ttasagggaa aaaacgtgtg atgatcctga agcttactat gcagcstasa aacagcctta gtaattaaaa cattttatac caataaaatt ttcaaatatt actaactaat gtagcattaa ctaacgattg gaaactacat ttacaacttc aaagctgttt tatacataga aatcaattac agctttaatt gaaaactgta accattttga taatgcaaca ataaagcatc ttccaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa AF250309 atgtcgctcg tgctgctaag cctggccgcg ctgtgcagga gcgccgtacc ccgagagcsg accgttcaat gtggctctga aactgggcca tetecagagt ggatgetaca acatgateta atcccgggag acttgaggga cctccgagta gaacctgtta caactagtgt tgcaacaggg gastattcaa ttttgatgaa tgtaagctgg gtactccggg cagatgccag catccgcttg ttgaaggcca ccaagatttg tgtgacgggc aaaagcaact tccagtccta sagctgtgtg aggtgcaatt acacagaggc cttccagact cagaccagac cctctggtgg taaatggaca ttttcctata tcggcttccs tgtagagctg aacacagtct atttcattgg ggcccataat attcctaatg caaatatgaa tgaagatggc ccttccatgt ctgtgaattt cacctcacca ggctgcctag accacataat gaaatataaa aaaaagtgtg tcaaggccgg aagcctgtgg gatccgaaca tcactgcttg taagaagaat gaggagasag tagaagtgaa cttcaca.acc actccsctgg gaaacagata catggctctt atccaacaca gcactatcat cgggttttct caggtgtttg agccacasca gaagaaacaa acgcgagctt cagtggtgat tccagtgact ggggatagtg aaggtgctac ggtgcagctg actecatatt ttcctacttg tggcagcgac tgcatccgac ataaaggaac agttgtgctc tgcccacaaa caggcgtccc tttccctctg gataacaaca aaagcaagcc gggaggctgg ctgcctctcc tcctgctgtc tctgctggtg gccacatggg tgstggtggc agggatctat ctaatgtgga ggcacgaaag gatcaagaag acttcstttt ctascaccac astactgccc eccattaagg ttcttgtggt ttacccatct gaaatatgtt tccatcacac aatttgttac ttcactgaat ttcttcaaaa ccattgcaga agtgaggtca tccttgaaaa gtggcagaaa aagaaaatag cagagatggg tccagtgcag tggcttgcca ctcaaaagaa ggcagcagac aaagtcgtct tccttstttc caatgacgtc aacagtgtgt gcgatggtac ctgtggcaag agcgagggca gtccsagtga gaactetcaa gacctsttcc cccttgcctt taaccttttc tgcagtgatc taagaageca gatteatetg cacaaatacg tggtggtsta stttagagag attgatacaa aagaegatta caatgctctc agtgtctgcc ccaagtacca cctcatgaag gatgecactg ctttctgtgc agaaettetc catgtcaagc agcaggtgtc agcaggaaaa agatcacaag cstgccacga tggctgctgc tccttgtagc ccacccatga gaagcaagag accttaaagg gttccttttc ccatsattta caggggaaaa acgtgtgatg ate AK095091 catattagag tetacagata tgcstttctt .acagcaatcc tgcacccaca taaaagctac attttcaata caagattaaa aggtattctg caaaatgtgc aaggttttca tgtctgctgg tgtagctgta gtgatggctt catgaatttt tttctttttt gactatggtc cttacgctgg attcatttat sttgaaatgg tgaacaatca cagetgeaga ccctcaattt atggtacata tcaagcaatt tggctttttt tcttgtaatg aaaaaaaaaa gttttttttg ctttttttca tgacactgct tcttgggagc astgccagca ttactagtgg casttcgtat gggtcctaag gtgttattga aggtttacga tattgeacta aacacgaaaa ataccagaga accactggag atacttttta ctgtgatatg taatttactg gagacaggaa ctgctcgttt ggagatggtt ageatcacag ggtgttttaa gtcgatactt gcaacccttg agctcaccac agtagcaaca ggaggtggct aggaaattat teacageagg acagtaegea ctgcaattaa ttgtatgcag ttatgattta atascacatc tttatgstca cgtttctctc aactgtgaat ggtgccatgt acagttggta tgtgtgtgtt taagttttga taaattttta acttttaata gttaaaatag ttaactattg gtatggtagg aaatgataaa gtagactagt atctgtatac attttctgca tttatgacat acctttttct tcattttttt caatatttta attgaaaagt teatcegagt ttcatctaag ttttttcaaa gtgatasaaa tctccaaaaa attttccaat atatgtattg aaaaaatcca ggtgtaagtg gctctgcgca gtccaaacct gtgttgttca agggtcaast gtgtatgaat ccaagcgaaa gsttttctta acacctcata agaactattt tttaaaaaac aggaactagc atagagtaac satcacaggt aaagtgtaat ttgttatcag ccatcttttg cccatttcag tactggtaga aggctcaatg gtaaaaataa aaacgggaca gtcagaagat ctggaagtcc tgaccctgct ttcacctggc atgtgtaatc cagtcatget cgtatcagtc tstgtaggag cacttgaagg tattacataa atgstatcta actctgggaa acgccaacat gtgattgcct ccagaggaat cttctttaaa aaaaaattca aaatgttatt teettactag gatgtcttta aagaattata accsttaccg tgcctccaca ttagatagat ccctgccacc agcacccatg tggccaccag cagagacagc aggaggagag gcagccagcc tcccggcttg cttttgtctg gaaaaaacaa agcttattca cctttggaaa acaaatccac acttatctct taatttaaaa actaagactt ggtatacttt atagaggttt atttattttt tattattttt tagttttgag acagagtctc gctttgttgc ctaggctgga gtgcagtggc gcaatctcgg ttcactgcag cctccgtctc csgggttcaa gcaatgctgc ctcagcctsc tgagtagctg ggattacagg catgtgtcac cgcgcccagc cactttgtag agatttagat ccctttaaaa ccatcagtca gaagctcttt agatagtctg ccaatcatat ctttttccct agagtgtgca ggtcttgcat tagattctca aaagggatat gggacccagg aagttaagaa cagtcctaaa atctctttgg cttctttgtc ctgatatgca ccggcatttt cacagtagga actagggttt ctgtccagtt tttttggtts tttaaggaat taatgttatt ctgggtacaa ctgcttacat acatagcaca tatagatgac atttttacag gccgtcttgt tagactgaca tacatggagg atagtgccac ccgcctcaca agaacatcag gtaagctcag gcacagagtg cccaggaatc tgtaaggctt cgcccacgca caagtcaggg ctgccagtca cctgggttgt cttcacttta tttggctgcg tctaatgaca ccttccaact tttgacccca cccctggact gttgtgtaaa cattgtattt ctccatctgt aatgaaaaag ctaacacatc tctaactcca gagacatttt ccagaacatg ctgttctcag gcactagtga ggcggtacca ttattcctca tttgttatcc aaatgttggc catgtgacca caccaaaagc tcatcctggg ccactgagac tagtaattga atcagaatat agtgaaatat tcattctcat atatacccag ccatcttaca tctttggctt ttttcagcag atccttgtgg cactcagaac atccattttg cactgtgtat ttttttccct tctgtgtatc ctgctttgta aagagtcacg agtggtttta caaataaagc ctgttcttac tsag BM983744 TTTTTTTTTTTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTCTT TAC^AAGClAGGATACaCAGAAGGGAAAAA?ATACACAGTGCAAAATGGATGTTCTGAGTG CC A ^^GGATCTGCTGAAAAAAGCCAAAGATGTAAGATGGCTGGGTATATATGAGAATGA ATATTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGGTG TGGT(-?CATGGCC-?AC?TTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGTGC CTGAGAACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCATT ACAGATGGAGAAATAC^ATGTTTACIACAACIAGTCC AGGGGTGGGGTC^?AAGTTGGAAGG GTC-ATTAGACGCAGCCAAATA?AGTGAAGACAACCCAGGTGACTGGCAGCCCTGACTTG TGCGTGGGCGAAGCCTTACAGATTCCTGGGCAGTCTGTGCCTGAGCTTACCTGATGTTCT TGTGAGGCGGGTGGCACTATCCTCCATGTATGTCAGTCTAACAAGACGGCCTGTAAAAAT GTCATCTATATGTGCTATGTATGTAAGCAGTTGTACCCAGAATAACATTAATCCTCGTGG CGAAT CB305764 TTTTTTTTTTTTTTTGTTGGGCTGAAGATGCTTTATTATTGC?TTATCAAAATGGTTATA GTTTTCAATTAAAACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGT AGTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAA??TTTTATTGGTAT AAAATGTTTTAATTACTAAGGGTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACA CGTTTTTTCCCTGTAATTGGTGGGATAGGAAGCGTTTAAGGTCTCTTGCTTCTCATGGGT GGGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTG CTGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTT GGGGCIAGACACTGAGAGCATTGTAATCGTCTTTTGT?TCAATCTCTCTAAAGTAGACCAC CACGTATTTGTGCAGATG_\ATCTGGCTTCTTAGATCACTGCAGAAA?GGTTAAAGGCAAG GGGGAAGAGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATC GCACLACACTGTTNACGTCATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTG AGTG BM715988 TGGTTTTTGTTTTTTTTTCATTTTCTGTTGGATTACAGA?AAAGAATGGGACCCATTCAG GTCTCGATTTCCAA?GGTAAAGATGGAAGGCTGGGCAGACTGGCTTTTGTTACCTGACAT GCCGTAGGGTGAGCTTAGAGGAAGAAAGAAAACAATTTTTATTTGGCCAAAACAGAACAA ATGCTGAAAAGGAAATCTTGTTTTTTTCCTAAAGCCAAATAGAAATGATTTGGGTATAAT TTAAGAGTCCTTGTGTTGTACAGATATGGTGACTGATGTAGTTATTAATACTACCAACTT AGTCATCAAGCCTCAATTTTCCTTTACCTGAAGGATTAAGTGAAAGCTTTTGGAGTTCAT GATGTTCAGTATGATCAGTTAACCTTA?CCTCTGAGCATCCTGAAGCAAAATCTAAATAA GCAGCTATTACCACTGGTGGTCCAGGCTCTGGTGAAGCCCTCTGAGCCCAGGAGGAAGA GAAAGCATTGTCCAGAGGTAGGAAC1ACAGTCTGGGAGCCCAGAGCTCTGGGAGGAGTGGG AAAATGCTGCTTCCTGCTGCTTGCTTCTAGGCACCTGCTTCCGCCATCTCACTTACCATG GCTAGAGATGGGGGTGAGACTGGGGAAGGACACAAGCAGGGAACAGATAAGGGATGGAAA TC?GAAGGGAATATAGAAAGAACTCTGGATGTGGAGACATGCCGGTACCTGAGCATTTTG ATCAATGGGAGTACCTCT BM670929 TTTTTTTTTTTTTTTTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTACAG TTTCAATTAAAGCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTA GTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATA AAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACAC GTTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTGTCATGGGT GGGCTACA?GGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTG CTGCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTT GGGGCAGACACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCAC CACGTATTTGTGCIAGATGAATCTGGCTTCTTAGATC?CTGCAGAAAAGGTTAAAGGCAAG .GGGGAAGAGGTCTTGAGAGTTCTCACTGGGACTTGCCTCGCTCTTGCCACAGGTACCATC GCACACACTGTTGACGTCATTGGAAAGAA?GAAGACGACTTTGTCTGCTGCCTTCTT BI792416 GCTGAAGATGCTTTATTGTTGC?TTATCAAAATGGTTACAGTTTTCAATTAAAGCTGTAA TGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTAGT BI715216 CACGCGTCCGATTTTATAGCAATAAAATTTTCAAATATTGCTAACTAATGTAGCATTAAC TAACGATTGGAAACTAC?TTTACL?^CTTCAAAGCTGTTTTATAC?TAGAAATCAATTACA GCTTTAATTGAAAACTGTAACC1ATTTTGATAATGCAACAATAAAGCATCTTCAGCCAAAA AAAAAAA N56060 AG?AAAAGAAAATAGC_AGAGATGGGTCCAGTGC?GTGGCTTGCIATAAAAAAGA?.GGCAGC AGACAA?GTCGTCTTCCTTCTTTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGG CAAGAGCGAGGGCAGTCCCAGTGAGAACTCTCAAGACCTCTTCCCCCCTTGCCTTTAACC TTTTCTGCAGTGATCTAAGA?GCCAGATTCATCTGCACAAATACGTGGTGGTCTACTTTA GAGAGATTGATACAAAAGACGATTACAATGCTCTCAGTGTCTGCCGCAAGTACCACCTCA GAAGGATGCCACTGCTTTCTGTGCAGAACTTCTCCATGTCAAGCAGCAGGTTTCAGCAG G CB241389 TTTTTTTTTTTTTTGTTTGGCTGAAGATGCTTTATTGTTGC-ATTATC.A?AATGGTTACAG TTTTCAATTAAAGCTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAA?TGTA GTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCA?TATTTGAAAATTTTATTGGTATA AAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACAC GTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTA?GGTCTCTTGCTTCTCATGGGTG GGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGC GCTTGACATGGAGAAGTTCTGCACAGAAAGCAGTGGCATCCTTCATGAGGTGGTACTTG GGGCIAGACIACTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACC ACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGG GGGAAGAGGTCTTGAGAGTTCTCACTGGGACTGCCCTCGCTCTTGCCACAGGTACCATCG (-?C?CACTGTTGACGTCATTGGA?AGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGA GTGGCAAGCCLACTGÍ^CTGGACCCATCTCTGCTATTTTCTTTTTCTNGCACTTTTCAAGG ATGACTCACTTCTG^^-ATGGTTTTTGAGAATTC^GTGAAGTACAAATGTGTGATGGAACA TAT AV660618 CGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAGGGCGCCGTACCCCGAGAGCCGACCG TTCAATGTGGCTCTGAAACTGGGCCATCTCCAGAGTGGATGCTACAACATGATCTAATCC CCGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACAACTAGTGTTGCAACAGGGGACT ATTCAATTTTG?TGAATGTAAGCTGGGTACTCCGGGC?GATGCCLAC?CCAGAAGAAACAA ACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTG ACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTC TGCCC?CAAACAGGCGTCCCTTTCCCTCTGGATAACAAC BX088671 GCTGAGTGTGATGGTGTAAGCCTGTGGTCCCAGCTACTAGGGAGGCTGAGATGGGATTAC AGGTGTGAGCCACGGCGGCTGGCCTAAAAGCATCTTTTTCTTTAACGCAGAGGTTATGTT GTATTATTAGC?TAAATGTTTTTTTCTGGGAATGCTTATTTCACACAGCACAATACTGAA TCTTCTCTGGAATGTGGATCGATTTCAGATGGATGACTATTAAAATGTGTATATTTGCAG ATTATCCTTAAAGGGCCACCTCATGCCTTCTAATTTATGTCTTACGGATAAAAAATCAAA ATGAAGCATAAAGTAAAAACTGTGTCCAGCTTTACAAGTGGACGCTTAGTAATGGCTGAG GCAATATGTTTAATGTAGCAAATTTTAGTTATTTGTCATGATCAGTTTTCACAGTGCTTG TAAGTGCTGGTAATAGAAGATGGACATGGTTTAGGTCAAAACTTGGACCAGAAACCAACT TCCTTTGAAACAGCTCTACCAGNTATAAGAGCAATATG CB154426 CTGTTGACGTCATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGAGTGGCA AGCCACTGCACTGGACCCATCTCTGCTATTTTCTTTTTCTGCCACTTTTCAAGGATGACC TC^CTTCTGCAATGGTTTTGAAGAAATTCIAGTGAAGTAACAAATTGTGTGATGGAAACAT ATTTCLAGATGGGTAAACCACSAGAACCTTAATGGGGGGCAGTAGTGTGGTGGTAGAAAAG GAAGTCTTCTTGATCCTTTCTGTGAGAGGAGAAAAGCATTTGTTATCTGTGAACAGCAJ_A C?GCAGGCTTTC?CTCTGTAAACC?TCCCTGACAAATGATCCCTTGCTAGAGAATGTCAG CTGAGC_ACC_?AGGGCCTTGTTAGTGACAGC?^GGAAñAACATCCTGATGTTCCTTTTGAA C^CIATCACCTGAAACAC?CTGATGCTTAAACCTTAACTTTTTTTTTTTTGGAGACACAGT CTCACTCTGT CA434589 TTTTTTTTTTTTTTTTTTCTGAGTAAGAACAGGCTTTATTTGTAAAACCACTCGTGACTC TTTACaAAG^GGATACAC?G?AGGGAAAAAAATACACAGTGCAAAATGGATGTTCTGAG TGC(_AClAAGGATCTGCTGAAAAAAGCCaAAGATGTAAGATGGCTGGGTATATATGAGAAT GAATATTTCACTATATTCTGATTCAATTACCAGTCTCAGTGGCCCAGGATGAGCTTTTGG TGTGGTCACATG^CCAAC-ATTTGGATAACAAATGAGGAATAATGGTACCGCCTCACTAGT GCCTGAGAACAGCATGTTCTGGAAAATGTCTCTGGAGTTAGAGATGTGTTAGCTTTTTCA TTACAG?TGGAGAAATAC^TGTTTACACAACAGTCC?^ G CA412162 TTTTTTTTTTTTTTTTTTGGCTGAAGATGCTTTATTGTTGCATTATCAAAATGGTTATAG TTTTCAATTAAAACTGTAATTGATTTCTATGTATAAAACAGCTTTGAAGTTGTAAATGTA GTTTCCAATCGTTAGTTAATGCTACATTAGTTAGCAATATTTGAAAATTTTATTGGTATA AAATGTTTTAATTACTAAGGCTGTTTGTAGGCTGCATAGTAAGCTTCAGGATCATCACAC GTTTTTTCCCTGTAATTGGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTG GGCTACAAGGAGCAGCAGCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGC TGCTTGAC1ATGGAGAAGTTCTGCACAGAAAGC?GTGGCATCCTTCATGAGGTGGTACGTG GGGI^GAC?CTGAGAGCATTGTAATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACC ACGTATTTGTGCAGATGAATCTGGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGG GGGAAGA CA314073 TTTTTTTTTTTTTTTTTTGAAAGGGTCAGGACTTCCAGATCTTCTGACTGTCCCGTTTTT ATTTTTACCATTGAGCCTTCTACC1AGTACTGAAATGGGCAAAAGATGGCTGATAACAAAT TACACTTTACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTTTTAAAAAATAGTTCTTA TGAGGTGTTAAGAAAAGCTTTCGCTTGGATTC1ATACAC?GTTGACCCTTGAACAACACAG GTTTGGACTGCGCAGAGCCACTTACACCTGGATTTTTTCAATACATATATTGGAAAATTT TTTGGAGATTTGTATC1ACTTTGAAAAAACTTAGATGAAACTCGGATGAACTTTTCAATTA AATATTGAA?AA?ATGAAGAAAAAGGTATGTCATAAATGCIAGAAAATGTATACAGATAC TAGTCTACTTTATCATTTCCTACCATACCAATAGTTAACTATTTTAACTATTAAAAGTTA AAAATTTATCSAAACTTAAACACACA(-ATACCAACTGTACATGGC1ACCATT<^C?-GTTGA GAGAAACGTGAGCATAAAGATGTGGTATTAAATCATAACTGCATACAATTAATTGCAGTG CGTACTGTCCTGCTGTGAATATTTCCTAGCCCTCGTGCCGAATC BF921554 GTGGGTGACCGTGGCTTGCC-ACTCAAAAGAAGGCAGCAGACAAAGTCGTCTTCCTTCTTT CCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAGGGCAGTCCCAGTG AGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCC AGATTCATCTGCAC?^AATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAAGACGATT ACAATGCTCTCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTG CATAACTTCTCCLATGTC?AGC&GavC^^ ATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCTATC CCACCAATTACAGGGAAAAAAACGTGTGATGATCCTGAAGCCACGGTCAA BF920093 TAGAGGATCCCGGTCGACGGTGGTTCaGTGATCATCACACTTTTTCCCTGTAATAGGTGG GATAGGAAGCCTTTAAGGTCTCTTGCTTCTCATGGGTGGGCTACAAGGAGCAGCAGCCAT CGTGG(-?GGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAGAAGTTATG (_ACAGAAAGCAGTGGC?TCCTT(-ATGAGGTGGTACTTGGGGC?GACACTGAGAGCATTGT AATCGTCTTTTGTATCAATCTCTCTAAAGTAGACCACCACGTATTTGTGCAGATGA?TCT GGCTTCTTAGATCACTGCAGAAAAGGTTAAAGGCAAGGGGGAAGAGGTCTTGAGAGTTCT C_ACTGGGACTGCCCTCGCTCTTGCCACLAGGTAC(_ATCG(_AC-?-CACTGTTGACGTCATTGG AAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGAGTGGCAAGCCACGGTCAACCCA CAAGCCACGGTCAACCCAC AV685699 TCTACGTGGTAAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTTAGTAACGT GTACAAAGTTTAGGTTCAGACCCCGGGAGTCTTGGGCATGTGGGTCTCGGGTCACTGGTT TTGACTTTAGGGCTTTGTTACAGATGTGTGACCAAGGGGAAAATGTGCATGACAACACTA GAGGTAGGGGCGAAGCCAGAAAGAAGGGAAGTTTTGGCTGAAGTAGGAGTCTTGCGACTG CIATCCGA<_?TAAAGGAAC?GTTGTGCTCTGCC1ACAAACAGGCGTCCCTTTCCCTCTGGA TAACAACAAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTGTCTCTGCTGGTGGC CA<_?TGGGTGCTGGTGGCLAGGGATCTATCTAATGTGGAGGCACG?AAGGATCAAG?AGAC TTCCTTTTCTACC_?_CCACACTACTGCCCCCCATTAAGGTTCTTGTGGTTTACCCATCTGA AATATGTTTCCATCACLA(-AATTTGTTACTT(^CTGAATTTCTT?^-^ACCATTGCAGAAG TGAGGTCATCCTTGAA?GTGGC?GAGTAGCAGAGATGGGTCC?GTGCAGTGGCTTGCCAC TCGTGCGATGGTCTT AV650175 GGCACGAG(_ACTGGCTGAAGGAAGCC-?^GAGGATCACTGCTGCTCCTTT1ITTCTAGAGGA AATGTTTGTCTACGTGGTAAGATATGACCTAGCCCTTTTAGGTAAGCGAACTGGTATGTT AGTAACGTGTAC^i^AGTTTAGGTTCAGACCCCGGGAGTCTTGGGCATGTGGGTCTCGGGT (_LACTGGTTTTGACTTTAGGGCTNTGTTA(-AGATGTGTGAC<_1? AGGGGAAAATGTGCATGA CAAC _CTAGAGCTGACTCCA.TATTTTCCTACTTGTGG(_AGCGACTGCATCCGACATAAAG GAACAGTTGTGCTCTGCC(^CA A(^GGCGTCCCTTTCCCTCTGGATA?CAACATAAGCA AGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTGTCTCTGCTGGTGGCACATGGGTGCTGGT GGAGGGATCTATCTAATGTGGAGGs_CGGATCAAGAAGACTTNCTTNTCTACCACCACAC TACTGGCCCCAATAAGGGTCTNGTGGNTACCCCATCTGAATATGTTCATACACAATTTGT ACTCL?-CTGAATTCTCAAAACATTGAGAGTG?GGCATCCTGAAAGTGCGAAAAGAN?TGCH AATGGTCAGTGCATGCTGCACTAGCAGCATGGACTT BX483104 GATCCCGCGCAGTGGCCCGGCGATGTCGCTCGTGCTGCTAAGCCTGGCCGCGCTGTGCAG GAGCGCCGTACCCCGAGAGCCGACCGTTC?ATGTGGCTCTGAAACTGGGCCATCTCCAGA GTGGATGCTACAACATGATCTAATCCCCGGAGACTTGAGGGACCTCCGAGTAGAACCTGT TAGAACTAGTGTTGCAACAGGGGACTATTCAATTTTGATGAATGTAAGCTGGGTACTCCG GGC?GATGCCAGCATCCGCTTGTTGAAGGCCa.CC?AGATTTGTGTGACGGGCAAAAGC?A CTTCCLAGTCCTAC AGCTGTGTGAGGTGG^TTAC ACAGAGGCCTTCCAGACTCAGACCAG ACCCTCTGGTGGTAAATGGACATTTTCCTACATCGGCTTCCCTGTAGAGCTGAACACAGT CTATTTCIATTGGGGCCCATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTTCCAT GTCTGTGAATTTC?CCTCACCIAGGCTGCCTAGACCAC ATAATGAAATATAAAAAA2ÍAGTG TGTC^AGGCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGGAGAC AGTAGAAGTGAACTTCaCAACCACTCCCCTGGGAAACAGATAa-TGGCTCTTATCCAACA CAGCACTATCATTCGG CD675121 GTCTTGCATTAGATTCTCAAAAGGGATATGGGACCCAGGAAGTTAAGAACAGTCCTAAAA TCTCTTTGGCTTCTTTGTCCTGATATGC?CCGGCATTTTCACAGTAGGAACTAGGGTTTC TGTCCAGTTTTTTTGGTTCTTTAAGGAATTAATGTTATTCTGGGTACAACTGCTTACATA CATAGCAC^TATAGATGAC?TTTTTACaGGCCGTCTTGTTAGACTGACATACATGGAGGA TAGTGCCIACCCGCCTCAC_AAGAACATCAGGTAAGCTC_?GGCAC?GAGTGCCC?GGAATCT GTAAGGCTTCGCCCACGCL?lCAAGTCaGGGCTGCClAGTC_?-CCTGGGTTGTCTTCa.CTTTAT TTGGCTGCGTCTAATGACACCTTCCAACTTTTGACCCCACCCCTGGACTGTTGTGTAAAC ATTGTATTTCTCC?TCTGTAATGAAAAAGCTAACACATCTCTAACTCCAGAGACATTTTC CLAGAACATGCTGTTCTCAGGCACTAGTGAGGCGGTACCATTATTCCTCATTTGTTATCCA AATGTTGGCClATGTGACCL?_(_?CCAAAAGCTCatCCTGGGCC_l-CTGAGACTGGTAATTG?^A TCLAGAATATAGTGAAATATTCATTCTC-ATATATACCCAGCCATCTTACATCTTTGGCTTT TTTCAGClAGATCCTTGTGG(_?CTC_A.GAACaTCa TTTTGCACTGTGTATTTTTTTCCCTT CT BE081436 TGTGTAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAA GCC?GIATTCATCTGI^CAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAA?AGACG ATTACAATGCTCTCaGTGTCTGCCCCAAGTAC(^CCTCATGGAGGATGCCACTGCTTTCT GTGCAGAACTTCTCCATGT(_ ^GTAGC_a.GGTGTCAGCAGGAAAAAGATC-?-CAAGCCTGCC ACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTAAAGGCTTCCT ATCC<_ACCAATTACAGGGAAAAAACGTGTGATGAT AW970151 CTGAAATATGTTTCC?TC?ClAa^TTTGTTACTTCaCTGAATTTCTTCAAAACCATTC GAAGTGAGGTCIATCCTTGAAAAGTGGCAGAAAAAGAAAATAGCAGAGATGGGTCCAGTGC AGTGGCTTGCCIACTCA2^A?GAAGGC!AGC?GACAAAGTCGTCTTCCTTCTTTCC?ATGACG TCAAC^GTGTGTGCGATGGTACCTGTGG(^AAGAGCGAGGGC?GTCCCAGTGAGAACTCTC AAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGTGATCTAAGAAGCCAGATTCATC TGCACAAATACGTGGTGGTCTACTTTAGAGAGATTGATACAAAñ.GACGATTACAATGCTC TCAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCCACTGCTTTCTGTGCAGAACTTC TCCATGTC^-AGTAGCAGGTGTC?GCAGGAAAAAGATCACAAGCCTGCCACGATGGCTGCT GCTCCTTGTAGCC(?CCCATGAGAAGCAa.GAGACCTTAAAGGCTTCCTATCCCACCAATT AC?GGGAAAAAAACGTGTGATGATCCCTGAAGCTTACTATGCAGCCTACAKI?CAGCCTTA GTAATAAAACATTTTATCCAATAAAATTTCAAATTTTGCTTAACTATGTGCATAAACTAC GATTGAAAACTCTTTACACT AW837146 C?TTGTGGTTG(2AGCTGC_ATAGTAAGCTTC?GGATCATCACACGTTTTTTCCCTGTAATT GGTGGGATAGGAAGCCTTTAAGGTCTCTTGCTTCTC1ATGGGTGGGCTA(_ ^AGGAGCAGCA GCCATCGTGGCAGGCTTGTGATCTTTTTCCTGCTGACACCTGCTGCTTGACATGGAG?AG TTCTGC?CAGZIAAGCAGTGGCATCCTT _?_TGAGGTGGTACTTGGGGCAGACACTGAGAGC ATTGTAATCGTCTTTTGTATC -A.TCTCCCTAAAGTAGACC?CCACGTATTTGTGCAGATG AATCTGGCTTCTTAGATC1ACTGCAGAAA?GGTTAAAGGCAAGGGGGAAGAGGTCTTGAGA GTTCTCACTGGGACTGCCCTCGCTCTTGCCACL?IGGTACCATCGCACACACTGTTGACGTC ATTGGAAAGAAGGAAGACGACTTTGTCTGCTGCCTTCTTTTGAGTGGCAAGCCACTGCAC TGGACCCATCT AW368264 GTGAATAAGCTTTGTTTTTTCC^GACAAAAGCAAGCCAGGAGGCTGGCTGCCTCTCCTCC TGCTGTCTCTGCTGGTGGCCA(_!ATGGTTGCTGGTGGCAGGGATCTATCTAATGTGGAGGC ACGGTAAGGGTTATAATTCTTTAAAGTCATCCTAGTAAGGAAATAACATTTGGAATTTTT TTTTAAAGAAGATTCCTCTGGAGGC-AATC?CCGGTTGGCGTTTCCCAGAGTTAGATAGCA TTTATGTAATACCTTCAAGTGCTCCTACAGAGACTGATACGAGCATGACTGGATTACACA TGCCAGGTGAAAGCAGGGCCAGGACTTCCAGATCTTCTGACTGTCCCGTTTTTATTTTTA CC?TTGAGCCTTCTACCAGZ^CTGAAATGGGCAAAAGATGGCTGATAAC^AATTACACTT TACCTGTGATGGTTACTCTATGCTAGTTCCTGTTTTTAAAAAAATAGTTCTTATGAGGTG TCAAGAAAAGCTTTCGCTTGGATTCATACACAGTTGACCCTTGAACAACACAG D25960 GATCCTGAAGCTTACTATGCAGCCTA(_AAACAGCCTTAGTAATTAA?AC_?-TTTTATACCA ATAA?ATTTTCaAATATTGCTAACTAATGTAGCaTTAACTA?CGATTGGAAACTACATirer ACAACTT ^AA.GCTGTTTTATAC_a.TAGAAATCAATTACAGCTTTAATTGAAAACTATAAC CATTTTGATAATGI-AAC^NTAAAGCATCTTCAGCCAAA AV709899 GCAACTTCCIAGTCCTACAGCTGTGTGAGGTGCAATTACACAGAGGCCTTCCAGACTCAGA CCAGACCCTCTGGTGGTAAATGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACA CAGTCTATTTCATTGGGGCCCATAATATTCCTAATGCAAATATGAATGAAGATGGCCCTT CCATGTCTGTGAATTTC?CCTCACCAGGCTGCCTAGACCACATAATG?AATATAAAAAAA AGTGTGT ^GGCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGAGG AGA.CAGTAGAAGTGAACTTCA(_aACCACTCCCCTGGGAAACAGATACATGGCTCTTATCC ACACAGC?CTAT IATCGGGTTTTCTCAGGTGTTTGAGCCACACCAGAAGAAACAAACGC GAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTC CATATTTTCCTACTTGTGGCAGCGACTGCATCCGACATAAAGGAACAGTTGTGCTCTGCC CAC^AAClAGGCGTNCCTTTTCCTCTGGATAACa^CAAAAGCAAGCCGGGAGGCTTGGCTG CTCTCCTTCTGCTGGCCTTTGCTGTGGCCACATTGGTGCTGGTGGCAGGGATCTATCTAA TGTGGATGCACGTCTCGTGGTTTACCCATCTGAAATATGTTCN BX431018 ATTTTTCCTCTTGTGGCAGCGACTGGCLATCCGAC.ATAAAGGAACAGTTGTGCTCTGCCCA CAAACAGGCGTCCCTTTCCCTCTGGATAACAACAAASGCAAGCCGGGAGGCTGGCTGCCT CTCCTCCTGCTGTCTCTGCTGGTGGCCACATGGGTGCTGGTGGCAGGGATCTATCTAATG TGGAGGCACGAAAGGATO^GAAGACTTCCTTTTCTACí^CCLACACTACTGCCCCCCATT AAGGTTCTTGTGGTTTACCC?TCTGAAATATGTTTC(_?TCACLAC^ATTTGTTACTTCACT GAATTTCTT(^AAACCATTGCAGAAGTGAGGTC_ATCCTTGAAAAGTGGCAGAAAAAG?AA ATAGC^GAGATGGGTCCAGTGC?GTGGCTTßCCACTC?AAAGAAGGCAGCAGACAAAGTC GTCTTCCTTCTTTCCAATGACGTCAACAGTGTGTGCGATGGTACCTGTGGCAAGAGCGAG GGCAGTCCCAGTGAGAACTCTCAAGACCTCTTCCCCCTTGCCTTTAACCTTTTCTGCAGT GATCTAAGAAGC(__I.GATTC ATCTGC-?CAAATACGTGGTGGTCTACTTTAGAGAGATTGAT ACIAAAAGACGATTACAATGCTCTCIAGTGTCTGCCCCAAGTACCACCTCATGAAGGATGCC ACTGCTTTCTGTG(^GAACTTCTCC?TGT(__ GC?GCAGGTGTCAGCAGGAAAAAGATCA C?AGCCTGCCACGATGGCTGCTGCTCCTTGTAGCCCACCCATGAGAAGCAAGAGACCTTA AGGCTTCTATCCCACCA3SÍTACAGGNAAA?ACGTGTGATGATCCTGAAGCTTACTATGCAG CCTACAAG?GGCTTAGTATTAAAAC^TTTATACCCia.TAAATTTTCAAATTGCT AL535617 TAGGTGACl?CTATAGAACaAGTTTGTACAAA??AGCAGGCTGGTACCGGTCCGGAATTCC CGGGATAGTGGMCCGGCGAKGTCGCTCGTGCTGCTAñ.GCCTGGCCGCGCTGTGCAGGAGC GCCGTACCCCGAGAGCCGACCGTTCy iTGTGGCTCTGAAACTGGGCCATCTCCARAGTGG ATGSKACAACATGATCTAATCCCGGGAGACTTGAGGGACCTCCGAGTAGAACCTGTTACA ACTAGTGTTGCAACAGGGGACTATTCAATTTTGATG?ATGTAAGCTGGGTACTCCGGGSA GATGCCAGCATCCGCTTGTTGAAGGCC-ACCÑAGATTTGTGTGAM^^ CAGTCCTACAGC GTGTGAGGTAGCAATTACA(^GAGAGCACA.TATCC?GACTCTAGACC AGACCCTCTGG GGTAAATGGACATTTTCCTATATCGGCTTCCCTGTAGAGCTGAACACA GTCTATATTCATTGGGGCCCAWAATAWÍCCTAATGCAAATATGAATGAAGATGGCCCTTC C?TGTCTGTGAATTTC1ACCTCACC-AGGCTGCCTAGACCA<_ATAATG?AATA AAAA?A?A GTGTGTO^GGCCGGAAGCCTGTGGGATCCGAACATCACTGCTTGTAAGAAGAATGARGA GACLAGTAGAA.GTGAACTTCACAACCACTCCCCTGGGAAACAGATAMATKGCTCTTATCCA. ACLAC IWACTATC&TCGGGTTTTCTCAGGTGTTTGAGCCAC?^ AGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTGAAGGTGCTACGGTGCAGCTGACTCC ATATTTTCCTACTTGTGGCAGCG CTGCATCCGACATAAAGGAACAGTTGTGCTCTGCCC AClAAACAGGCGTCCCTTTYCCTCTGGATAACAACA?^AAGCAACYGGGAGSTGGyTGYCT AL525465 AAT AKñDDRATAimTGA?AACTATAACC?TTTNTGATAATNGNAANAATAAAGCATCT TCAGCCAAACATCTAGTCTTCCATAGACCATGCATTGCAGTGTACCCAGAWCTGTTTAGC TAATATTCTATGTTTAATTAATGAATACTAACTCTAAGAACCCCTCACTGATTCACTCAA TAGC1ATCTTAAGTGA?AAACCTTCTATTACIATGCAAAAAATCA.TTGTTTTTAAGATAAC1A AAAGTAGGGAATAAACAAGCTGAACCCACTTTTACTGGACCAAATGATCTATTATATGTG TAACCACTTGTATGATTTGGTATTTGCATAAGACCTTCCCTCTACAAACTAGATTCATAT CTTGATTCTTGTAC_?-GGTGCCTTTTAAC1ATGAAC-AAC?A?^TACCC_ACA?ACTTGTCTAC TTTTGCCTAAAGTTACCTATTAGAGGTCACTGTSAGAGTKCTCAGTTTCTTAGTTACTAT TTAASTTTTSATGTTCAAAATGAAAATAATTCTKAAGTKGAAAGSGCTCTTGAAGTAACC TTTTTATAAATGAGTTATTATAATGGTTTACTTAAATAAAAVAGAGGGGKTTTTGCGGTG GCTCATGCCTCCi TCCC^GCACTTTGGCAAGGCCAAGGCAAAAVGATCGCTCl?-AGACCA GGCTACGTCACAAñ.GCGAGACCTCCATCTCTACAAA2GATTTAAAA?ATTAGCTGAGTGT GATGGTGTGAGCCTGTGGTCCCAGCTACTAGGGAGGCTGAGATGGGAGGATCACTTGAGC CCTGGAGGTC^AGGGTGCAGTAAACGGTGATTGTGCCACTGCACTCCATCCTGGGTGAGA GCAGACCCTGTCTAAAAC?AACAAACGAAAñAACCCCCACAGAATGA(^GAAC_ATAA-?G ATGCACATTTTGTCTTCCAACTTTTTACTCTTCTAAAAGCATCTTTTTTAAATTTTTTAA ATTTTTTTTTTTTTGAGACAGAGTTTCACTCTGTCAC_i_CAGGCTGGAGTGMGTGGCGTGA CTCGGCTClACTAMftACTCTGCYTCCGGGGTYACSCATCTCCTGC CAGCTCCTGAGAAGC KGGAYAMAGGMCCA(^CaAACCAGTAAYTTTAT TTTTG?AA?^GGGTTYACCTGTASMA GI^GGCTGAATCCGACMAARTi CCMCCACYYCA?ADGAGGAWAAGKGK SMGGSCBGGC A BX453536 TTATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTTCGTGCCTCC CATTAGATAGATCCCTGCCACC1AGC?CCCATGTGGCC1ACCAGCA.GAGACAGCAGGAGGAG AGGC?GCCAGCCTCCCGGCTTGCTTTTGTTGTTATCCAGAGGGAAAGGGACGCCTGTTTG TGGGCLAGAGCA?-ACTGTTCCTTTATGTCGGATGC?GTCGCTGCCACAAGTAGGAAAATA TGGAGTÍ-AGCTGCACCGTAGCACCTTC-ACTATCCCC?GTC?CTGGAATCACCACTGAAGC TCGCGTTTGTTTCTTCTGGTGTGGCTCAAACACCTGAGAAAACCCGATGATAGTGCTGTG TTGGATAAGAGCCATGTATCTGTTTCCCAGGGGAGTGGTTGTGAAGTTCACTTCTACTGT CTCCTC?TTCTTCTTA(_AAGC_AGTGATGTTCGGATCCC?CAGGCTTCCGGCCTTGACAC_A CTNTNTTTTATATTT(_ATTATGTGGTCTAGGCAGCCTGGTGAGGTGAAATTCACAGACAT GGAAGGGCCATCTTCLATT?_TATTTGCATTAGGAATATTATGGGCCCCAATGAAATAGAC TGTGTT(^GCTCTA(ZAGGGGAAGCCGATATAGGAAAATGTC(-ATTTACCACCAGAGGGTC TGGTCTGAGTCTTGAAGGCCTTTTGTGTTATTGCACCTTACACAGCTGTTAGACTGGGAA GTTGCTTTTGCCCCGCACACAAATCTTGTGGGCCTTCAACAGCGGATGCTGCCATTTGCC CCGAAGTCCCC^GCTO^TTCLATTAAAAATTGFTATAGGCCCCTTGTGGCAACCCTAGTTG GTACAGGGTTTTACTTGGGGGGCCCCTCTAAGTTTCCCCGGGATATAAACAAAGTGTGG BX453537 TTATGGGGGGCAGTAGTGTGGTGGTAGAAAAGGAAGTCTTCTTGATCCTTTCGTGCCTCC AC1ATTAGATAGATCCCTGC<_?CCAGC-ACCC^T^^ GAGGCAGCCAGCCTCCCGGCTTGCTTTTGTTGTTATCCAGAGGGAAAGGGACGCCTGTTT GTGGGC?GAGCAO^CTGTTCCTTTATGTCG^ATGCAGTCGCTGCCACAAGTAGGAAAAT ATGGAGTCAGCTGCACCGTAGC^CCTTCACTATCCCCAGTCACTGGAATCACCACTGAAG CTCGCGTTTGTTTCTTCTGGTGTGGCTCAAACACCTGAGAAAACCCGATGATAGTGCTGT GTTGGATAAGAGCCATGTATCTGTTTCCCAGGGGAGTGGTTGTGAAGTTCACTTCTACTG TCTCCTC1ATTCTTCTTA(_AAGC_AGTGATGTTCGGATCCCAC?GGCTTCCGGCCTTGACAC ACTTTTTTTTATATTTCATTATGTGGTCTAGGCAGCCTGGTGAGGTGAAATTCACAGACA TGGAAGGGCCATCTTC_ATT(^TATTTGCATTAGGAATATTATGGGCCC<_!AATGAAATAGA CTGTGTTCAGCTCTACAGGGAAGCCGATATAGGAAAATGTCCATTTACCACCAGAGGGTC TGGTCTGAGTCTGGAAGGCCTCTGTGTAATTGCACCTCACACAGCTGTAGGACTGGGAGT TGCTTTTGCCCGTACACA?ATCTTGTTGGCCTTCAACAAGCGGATGCTGGCATCTGGCGG GGGTACCCL?GCTTACLATTCATCAAAATTG?ATAGTCCCCTTGTTGCAACACTAGTTTGTA AACAGGTTCTACTCCGGGGGTCCCCTCAGTCTCCCGG AV728945 CAAATATGAATGAAGATGGCCCTTC 1ATGTCTGTGAATTTCACCTCACCAGGCTGCCTAG ACCIACATAATGAAATATAA?AA?AAGTGTGTC?AGGCCGGAAGCCTGTGGGATCCGAACA TC1ACTGCTTGTAAGAAGAA.TGAGGAGACAGTAGAAGTGAACTTC?CAACCACTCCCCTGG GAAACLAGATAC?TGGCTC_?TATCC^C?C-&GCAC^^ AGCCACACCAGAAGAAACAAACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGTG AAGGTGCTACGGTGCAACTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGAC ATAAAGGAACLAGTTGTGCTCTGCCCAC?AACAGGCGTCCCTTTCCCTCTGGATAACAAC AV728939 GCAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTCACCAGGCTGCCTA GACC1A(_ATAATGA?ATATA?AAAAAAGTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAAC ATC1ACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGTGAACTTCACAACCACTCCCCTG GGAAACAGATAC?TGGCTCTTATCCAAC?C?GCACTATCATCGGGTTTTCTCAGGTGTTT GAGC(-?CAC(_AGAAGAAACAAACGCGAGCTTCAGTGGTGATTCCÑ.GTGACTGGGGATAGT GAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGA CLATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAAC AV727345 GCIAAATATGAATGAAGATGGCCCTTCCATGTCTGTGAATTTCACCTCACCAGGCTGCCTA GACCACLATAATGAAATATAA?AAAAAGTGTGTCAAGGCCGGAAGCCTGTGGGATCCGAAC ATCACTGCTTGTAAGAAGAATGAGGAGACAGTAGAAGTGAACTTCACAACCACTCCCCTG GGAAACIAGATAC?TGGCTCTTATCCAACACAGCACTATCATCGGGTTTTCT.CAGGTGTTT GAGCCACACCAGAAGAAACA?ACGCGAGCTTCAGTGGTGATTCCAGTGACTGGGGATAGT GAAGGTGCTACGGTGCAGCTGACTCCATATTTTCCTACTTGTGGCAGCGACTGCATCCGA CATAAAGGAACAGTTGTGCTCTGCCCACAAACAGGCGTCCCTTTCCCTCTGGATAACAAC AAAAGCAAGCCGGGAGGCTGGCTGCCTCTCCTCCTGCTGTCTCTGCTGGTGGCCACATGG GTGCTGGTGGCAGGGATCTATCTAATGTGGAGGCACGAAAGGATCAAGAAGACTTCCTTT TTTACCACCACACTACTGTCTCCCATTAAAGATCTTGTGGTTTATCCATCTGAAATATTG TTCCLATTAC^(_ATATTG 3TACCTAACTGAAATTCTTTAA?ACCATTGCAÑATTGAGGTCA CTCTTGAAAGGGCGTG Secuencias identificadas como aquellas de CHDH >gi|26011703|gb|CA774243.1|CA774243 in24a07.xl HumanFetal Páncreas IB Homo sapiens cDNA clon MAGE: 3' TAAATAACAAACACCACTGGGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTTA CTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACRCTTTCCTGACATAAATCCT TTTTTATGAAAATGCAAAATGTGCTGCAGAATAAAACTGTGTAATAAT I^ AGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACTGT GCCAGGGCAGCTCTGAAATTATGGATATTCT ATCCTCCTGGTTCC?CGGTGCCAATGGT AACC AATACCAGCCGCAGGGAGCG CATITCTCCTAAAGGGCTACACCACTGTCAACAT TATCCTGGACTCTGTGTCTCRCTCTGTTGGGTCTTGTE<JCATCACATCAGGCCAAAATTGC CAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAAGTCAGTACTTACA AACTGGCATTCTTACAGG TGCACCATTTCCTAGTATGTCTG^?TGAAGCCTGGTTCAACC TCTCATCGAATATTAAATTTTTCTTTGTA >gi]23527150|gb|BU679327.1|BU67932 UI-CF-DUl-aau-i-03-0-UI.sl UI-CF-DU1 Homo sapiens cDNA clon UI-CF-DUl-aau-i-03-0-UI3' tt? r?t?t]rrttrrcrtACAAA TAAAGCAGACATACTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGA (. ITGGAAAAGATCATCGCCTCTATCAGACACITAGGGTCCTGGTCTGGCAATTGTGGCC TGATGTGATGCCACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAG TGGTGTAGCCCTTGAGGAGAAATGGCGCTCCCTGCGGC GGTATTAGGTTACCATTGGCA CCGAAGGAACCAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACC TGCCCCGTCGGAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGT ATAAAAATTATTACACAGTTTTATTCTGAAG TATGTCAGGAAAGAGTCATTTACAAACCGGGAAGTGTTGTTGCCTGGATCAGAGTAAGAA TGTCTTAAGAAGAGGTTTGTAAGGTCTTCATAACA AGTGGTGTTTGTTATTTACAAAAA AAAAAAAAAAAAAAATAAAAAAAAAAAAAAAAACCTCGTGCCGAATTCT >gi|23274053|gb|BU608029.11BU608029 UI-CF-FNO-aes-l-02-O-DI.sl UI-CF-FNO Homo sapiens cDNA clon UI-CF-FN0-aes-l-02-0-UI 3' TIGTITITITGTTTTTTGTAAATAACAAACA TTCTGAAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTC^ TCCTGACATAAATCCTTITITATTAAAATGCAAAATGTTCT CAGAATAAAACTGTGTAAT AATLTRRATAC-TTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCG ACAGGGCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTRATCCTCCTGGTT CCTTCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGC TACACCACTGTCAACATTATCCTGGACTCTGTGT(_?:CTCTCTGTTGGGTCTTGTGGCATCA CATCAGGCCAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTC CAAAGTCAGTACTTACAAACTGGCATTC GACAGGCGGCACCATTTCCTAGTATGTCTGC TTGAAGCCTGGTTCAACCTCTCATCGAATATTAAATTTTTCITGGTAAGAAAA^ TTGTAGAGCATGGTTITITGTTTTCCCTTGTCTTAGGAAAGTTTGAAGATG CC >gi|11451784]gb|BF439267.1|BF439267 nab62a07.xl Soares_NSF_F8_9W_OT_PA_P_Sl Homo sapiens cDN clon IMAGE:32723403' TTTTTTTTTTGTAAATAACAAACACCACTTTG? GACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTTT? CATAAATO?TTTTTATTAAA^ TATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGG CAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGG TGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACC ACTGTCAACATTATCCTGG >gi|11448468|gb|BF436153.1|BF436153 nab77hl0.xl Soares_NSF_F8_9W_OT_PA_P__Sl Homo sapiens cDNA clon IMAGE:3273859 3' TGTGTTTTTGGTCCAAAATTITGAATAGTATACAGACAACCTGTTAA TITGTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCT^ TCTTACTCTGATCCAGGCAAAAACACirCAAGGTTTGTAAATGACTCTTTCCTGACATAA ATCCITITITATTAAAATGCAAAA^ TGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCCA ATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTC AACATTATCCTGGACTC >gi|10033200|gb|BE672659.1|BE672659 7b71b03.xl NCI_CGAP_Lu24 Homo sapiens cDNA clon IMAGE:3233645 3' TITGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCITsrrAAGACATT CTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTITCCTGACATAAA TCCTTTTTTATTAAAATGCAAAATG?^ TGGGAGTGCTCCTTGCACAGAGCTGTCATiTGCCAGTGAGAGCCTCCGACAGGGCAGGT ACTGTGCCAGGGCAGCTCTGAAATTATGGATATT(_TrATCCTCCTGGTTCs[TCGGTGCCA ATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTC AACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCCAAA ATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCT TTCCAAAGTCAGTAC TTACAAACTGGCATTCTTACAGGCTGCACCATTTCCTAGTATGTCTGCTTTAAGCCTGGTT CAACC >gi|6837905|gb|AW341279.1|A 341279 xz97e03 xl NCI_CGAP_Lu24 Homo sapiens cDNA clon MAGE:28721563' TAAATAACTAACACCATTI GTTATGAAGACCTTACAAACCTC RCTTAAGACATTC?AC TCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCR?CCTGACATAAATCCTT TTTTTATTAAAATGCAAAATGTGCTT^^ AGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACTGT GCCAGGK_CAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTGCCTTCGGTGCCAATGGT AACCTAATACCAGCCGCAGGGAGCGCCATTGCTCCGAAAGGGCTACACCACTGTCAACAT TATCCTGGACTCTGTGTCTCTCGCTGTTGGGTCTTGTGGCATCACATCAGGCCAAAATTGC CAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTGTTCCAAAGTCAGTACTTACA AACTGGCATTCTTACAGGCTGCACCATTTCCTAGTATGTCTG >gi|5543775|gb|AI869807.1|AI869807 wm04b02.xl NCI_CGAP_Ut4Homo sapiens cDNA clon IMAGE:2434923 3' GTAAATAACAAACACCACTI GTTATGAAGACCTGACAAACCTCTTCTTAAGACATTCTT ACTCTGATCCAGGCAAAAACACT CAAGGTTGGTAAATGACTCTTTCCTGACATAAATCC TITITGATGAAAATGCAAAATGTGCTTCAGAATAAAACTGTGTAATAATT^ GAGTGCTCC GGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGCAGGTACTGT GCCAGGGCAGCTCTGAAATATGGATATTCTTACCTCCTGGTTCTTTCGGTGCAAATGGTA ACCTAATACCAGCCGCAGGGAGCGCCATTTCT >gi|5543768|gb|AI869800.1|AI869800 m04a03.xl NCI_CGAP_Ut4 Homo sapiens cDNA clon MAGE:24349243* GTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTC?T ACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAATCC TTTITGATTAAAATGCAAAATGTTC^ GAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGNGCAGGTACTG TGCCAGGGCAGCGCTGAATTATGGATATTCTTATCCTCCTG >gi|46102811gb|AI601252.1|AI601252 ar88c09.xl Barstead colon HPLRB7 Homo sapiens cDNA clon IMAGE.21523363' TTTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCp CTTAC CTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAA TCC?TITGATGAAAATG?AAAATGT CTTCAGAATAAAACTGTGTAATAAT^^ TGGGAGTGCTCCTGGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCCA ATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCC?'AAAGGGCTACACCACTGTC AACATTATCCTGGACTCTGTGTCGCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCCAAA ATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTTCCAAAGTCAGTAC TTACAAACT >gi|4330088|gb|AI467998.1|AI467998 tj84el0.xl Soares_NSF_F8_9W_OT_PAJP_Sl Homo sapiens cDNAclon AGE:21482343' TTTTTTTTTTTTTT^ TTTTTT TTTTTTGTAAATAACAA^ AAGACATTCTTACTCTGATCCAGGCAAAAA GACATAAATCCTTTTTTATTAAA^ TTTRATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACG GGGCAGGTACGGTGCCAGGGCAGCTCTGAAATGATGGATATTCTTATCCGCCTGGTTCCT TCGGTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTAC ACCACTGTCAACATTATCC >gi|4311745|gb|AI459166.1|AI459166 t¡65h07.xl Soares_NSF_F8_9W_OT_PA_P_Sl Homo sapiens cDNAclon MAGE.21464293' TTTTTTTT GGTCCAAAATTTTTAATAGTATACAGACAACCTGT^ TTTTRGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACAT TC? ACTCTGATCCAGGCAAAAACA(_TGCAAGGTTTGTAAATGACT(_^^ ATCCTTITITATTAAAATGCAAAATG^ TTGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGT ACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCCA ATGGTAACCTAATACCAGCCGCAGGGAGCGCCATT T >gi|4222874|gb¡AI393327.1]AI393327 tg44al2.xl Soares_NFL_T_GBC_Sl Homo sapiens cDNA clon IMAGE^lHóW S' TTTATATTATTCACCACTITGTT^^ TCTGATCCAGGCAAAAACACTTCAAGGTTGGTAAATGACTCGTTCCTGACATAAATCCTT TTTTAT AAAATGCAAAATGTT<_?TCAGAATAAAACTGTGTAATAAT ^ GTGCTCCITGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACAGGGCAGGTACTGTG CCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCCAATGGTA ACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTCAACATT ATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCCAAAATTGCC AGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTTTT >gi|3933768)gb|AI290994.1|AI290994 qm09e05.xl NCI_CGAP_Lu5 Homo sapiens cDNA clon IMAGE: 18813443' TAAATAACAAACACCACHTGGTTATGAAGAC^ CTCTGATCCAGGCAAAAACACTTCAAGGTITGTAAATGACTCTTTCCTGACATAAATCCT TTTTTATTAAAATGCAAAATGTTC^ AGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACTGT GCCAGGGCAGCTCTGAAATGATGGATATTCTTATCCTCCTGGTTCCTTCGGTGCCAATGGT AACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTCAACAT TATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCCAAAATTGC CAGACCAGGACCCTAAGTGTCTGATAGA >gi|3844395|gb|AI248998.1|AI248998 qh80f04.xl Soares_fetal_Hver_spleen_lNFLS_Sl Homo sapiens cDNA clon IMAGE: 18510073' TGTAAATAACAAACACCACTTTGTTATGAAGACCT ACAAACCTCTTC1 AAGACATTCT TACTCTGATCCAGGCAAAAACACTTCAAGGT^ CTTTTTTATTAAAATGCAAAATGTT^ GGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACT GTGCCAGGGCAGCTCTGAAATTATGGATATT(_pTATCCTCCTGGT CCTTCGGTGCCAATG GTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTCAAC ATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTC GGTGGCATCACATCAGGCCAAAATT GCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGAT(_ 1TGCCAAAGTCAGTACTTA CAAACTGGCATTCTTACAG >gi|3405022|gb|AI075844.1|AI075844 ozl6d08.xl Soares_fetal_liver_spleen_lNFLS_Sl Homo sapiens cDNA clon IMAGE: 1675503 3' TT_TI TGITGGTAAATAACAAACACCACTTGGTTATGAAGACCTTACAAAC AGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTGTCCTG ACATAAATCCTTTTTGATTAAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATTT TTATACTGGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGG GCAGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCCTGGTTCCTTCG GTGCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACAC CACTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGGGTCTTG >gi|3307963lgb|AI051972.1|AI051972 o 83hl0.xl Soates_fetal_Hver_spleen_lNFLS_Sl Homo sapiens cDNA clon IMAGE: 1653475 3' ACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTGGTAAATGACTCTTTCCTGAC ATAAATCCTITITTATTAAAATGCAAA^ ATACTTGGGAGTGCTCCTTGCACAGAGCTGTCATTGGCCAGTGAGAGCCTCCGACAGGGC AGGTACTGTGCCAGGGCAGCTCTGAAATTATGGATATTCGGATCCTCCTGGTTCCTTCGGT GCCAATGGTAACCTAATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCA CTGTCAACATTATCCTGGACTCTGTGTCTCTCTCTGTTGAGTCTTGTGGCATCACATCAGG CCAAAATTGCCAGACCAGGACCCTAAGTGTCTGATAGAGGCGATGATCTT >gi|32546011gb|AI033648.1|AI033648 o 22e09.xl Soaresjparathyroid_tumor_NbHPA Homo sapiens cDNA clon AGE: 16475923' TGTAAATAACAAACACCACTTGGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCT TACTCTGATCCAGGCAAAAACACTTCAAGGTTGGTAAATGACTCTTTCCTGACATAAATC CTTTTTTATTAAAATGCAAAATGTT^ GGAGTGCTCCE GCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACT GTGCCAGGGCAGCTCTGAAATTATGGATATTCTGATCCTCCGGGTTCCTTCGGTGCCAATG GTAAC<-^AATACCAGCCGCAGGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTCAAC ATTATCCTGGACTC >gi|3229367|gb|AI015031.1|AI0l5031 ot3O0)4.sl Soares estisJNHT Homo sapiens cDNAclon MAGE: 16183033' TTTTTCTGACAAAGAAAAATTGAATATGCGATGAGAGGTTGAACCAGGCTTAAAGCAGAC ATACTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGACTTTGGAAAA GATCATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGATG CCACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTGGACAGTGGTGTAGCC CTTTAGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAGAGAC CAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACCTGCCCCGTCG GAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAAAAATTA TGACACAGTTTTATTCTG >gi|3055333|gb|AA915941.1|AA915941 onl8d06.sl NCI_CGAP_Lu5 Homo sapiens cDNA clon IMAGE: 15570353* TTGTAAATAACAAACACCACTTTGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTC TTACTCTGATCCAGGCAAAAACACTTCAAGGTTGGTAAATGACTCTTGCCTGACATAAAT CCTTTTITAT AAAATGCAAAATGTTCTTCAGAATAAAACTGTGTAATAATIT^ GGGAGTGCTC(_ RGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGAAGGGGCAGGTA CTGTGCCAGGGCAGCTCTGAAATTATGGATATTCTTATCCTCC GGTTCCTTCGGTGCCAA TGGTAACCTAATACCAGCCGCAGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTCAA CATTATCCGGGACGCTGTGTCTCTCTCTGTTGGGTCTTGTGGCATCACATCAGGCCAAAAT TGCCAGACCAGGACCCTAAGTGT<_TGATAGAGGCGATGATC1TTTCCAAAGTCAGTACTT >gi|2953300|gb|AA861160.1|AA861160 ak36bl2.sl Soares_testís_NHTHomo sapiens cDNAclon IMAGE: 1408031 3' TTGGTAAATAACAAACACCAC?TGGTTATGAAGACCTTACAAACCTCTTCTTAAGACATT CTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGTAAATGACTCTTTCCTGACATAAA TCCTGITGTATTAAAATGCAAAATGTTC^ TGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGAC >gi|1782040|gb|AA192157.1|AA192157 zq02g05.sl Stratagene muscle 937209 Homo sapiens cDNA clon IMAGE:6285683* GTAAATAACAAACACCACT?TGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTCTT ACTCTGATCCAGGCAAAAACACT CAAGGTTTGTAAATGACTCTTTCCTGACATAAATCC TTTTTTATTAAAATGCAAAATGTTCTTCAG GAGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACTG TGCCAGGGCAGCTCTGAAATTATGGATATT( [TATCCRCCTGGTTCCTTCGGTGCCAATGG TAACCTAATACCAGCCGCAGGAGCGCCATTTCTCCTAAAGGGCTACACCACTGTCAACAT TATCCTGGGACTCGGTGTCTCGCTCTGTTGGGTÍ-TGGTGGCATCACATCAGGCCAAAATTG GCCAGACCAGGACCCCAAGTGGTCTGATAGAAGGCGATGATCTTTTCCAAAGTCAGTAC TTACA >gi|1230953|gb|N73668.11N73668 yz78h05.sl Soares_multiple_sclerosis_2NbHMSP Homo sapiens cDNAclon MAGE:2892093' GGTCCAAAATTITTAATAGTATACAGACAACCTG^ ATAACAAACACCA<_?TGGTTATGAAGACCTTACAAACCTCTTCTTAAGACATTC GACTCT GATCCAGGCAAAAACACTTCAAGGTTTGTAAATCGACTCTTTCCTGACATAAATCCTTTT TTATTAAAATNGCAAAA?TGTTCTTCAGA^ AGTGCTCCTTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCCGACGGGGCAGGTACTGT GCCAGGGCAGCTCTGAAATTATGGAAATTCTTATCCCCCTGGTTCCTNCGGTGGCCAATG GGTAACCTAATACCAGCCCGCGGGAAGCGCCAATTTCNCCCAAAAGGGGGTAAACCACT GGTNAAACATTA >gi|2142013|gb|AA437099.1|AA437099 zv53b09.sl Soares_testis_NH Homo sapiens cDNA clon IMAGE:7573373* CTTACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCTTAAAGCAGACATAC TAGGAAATGGTGCAGCCTGTAAG TGCCAGTTTGTAAGTACTGACTTTGGAAAAGATC ATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGATGCCAC AAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTAGCCCpr AGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAGAGACCAG GAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACCTGCCCCGTCGGAG GCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTCCCAAGTATAAAAATTAT >gi|3836330|gb|AI240933.1|AI240933 qk01bll.xl NCI_CGAP_Kid3 Homo sapiens cDNA clon MAGE:18676773' TTGITITGTTTITITIT?^ TTTTGTTTTTTTITGTG^ TC GAAGACATTCTTACTCTGATCCAGGCAAAAACACTTCAAGGTTTGGAAATGACT(_^ TCCTGACATAAATCCTITITGA^ TAATTI^- ATACTGGGGAGTGCTCCTTGCACAGAGCTGTCATTTGCCAG >gi|2669971)gb|AA682690.1|AA682690 zj86f07.sl Soares_fetal_Hver_spleen_lNFLS_Sl Homo sapiens cDNA clon IMAGE:461797 3' AATGCAAAATGTTC1TCAGAATAAAACTGTGTAATAATTTTTATACT GGGATGTGCT TTGCACAGAGCTGTCATTTGCCAGTGAGAGCCTCGACAGGCAGGTACTGTGCCAGGGCA GCTCTGAAATTATGGATATT<_TTATCC CCTGGTTCCTTCTGTGCT ACCAGCCGCAGGA(^CGCCATTTCTCCTAAAGGGCTACACCACTGTCAACATTATC >gi|1162804]gblN39597.1|N39597 y51e04.sl Soares_multíple_sclerosis_2NbHMSP Homo sapiens cDNA clon MAGE:27708631 ACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCTTAAAGCAGACATACTAG GAAATGGTGCAGCCTGTAAGAATGCCAGTTGGTAAGTACTGACTTGGGAAAAGATCATC GCCTCTATCAGACACTTAGGGTCCTGGTCGGGCAATTTTGGCCTGATGTGATGCCACAAG ACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTAGCCCTTTAGG AGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAGAACCAGGAGG ATAAGAATATCCATAATTTCAGAGCTTGCCCTGGCACAGTACCTGCCCCGTCGGAGGCTC TCACTGGGCAAATGGACAGCTCTGTGCAAGGAGCACGCCCAAGTATAANAATTATTACA CAGTTI ATTCTGAAGAACATTTTGCATTTTAATAAAAAANGGA >gi|3838507|gb|AI243110.1|AI243110 qh26f06.xl Soares_NFL_T_GBC_Sl Homo sapiens cDNA clon BVLAGE: 1845827 3' TTTITCTTACAAAGAAAAATTTAATATTCGATGAGAGGTTGAACCAGGCT AAAGCAGAC ATACTAGGAAATGGTGCAGCCTGTAAGAATGCCAGTTTGTAAGTACTGACTTTGGAAAA GATCATCGCCTCTATCAGACACTTAGGGTCCTGGTCTGGCAATTTTGGCCTGATGTGATG CCACAAGACCCAACAGAGAGAGACACAGAGTCCAGGATAATGTTGACAGTGGTGTAGCC CTTTAGGAGAAATGGCGCTCCCTGCGGCTGGTATTAGGTTACCATTGGCACCGAAGGAAC CAGGAGGATAAGAATATCCATAATTTCAGAGCTGCCCTGGCACAGTACCTGCCCCGTCG GAGGCTCTCACTGGCAAATGACAGCTCTGTGCAAGGAGCACTC Secuencias identificadas como aquellas de la agrupación QPRT BC005060 1 caccagccca gacagctgca agtcaccatg gacgctgaag gcctggcgct gctgctgccg 61 cccgtcaccc tggcagccct ggtggacagc tggctccgag aggactgccc agggctcaac 121 tacgcagcct tggtcagcgg ggcaggcccc tcgsaggcgg cgctgtgggc caaatcccct 181 gggatactgg cagggcagcc tttcttcgat gccatattta cccaactcaa ctgccaagtc 241 tcctggttcc tccccgaggg atcgaagctg gtgccggtgg ccagagtggc cgaggtccgg 301 ggccctgccc actgcctgct gctgggggaa cgggtggccc tcaacacgct ggcccgctgc 361 agtggcattg ccagtgctgc cgccgctgca gtggaggccg ccaggggggc cggctggact 421 gggcacgtgg caggcacgag gaagaccacg ccaggcttcc ggctggtgga gaagtatggg 481 ctcctggtgg gcggggccgc ctcgcaccgc tacgacctgg gagggctggt gatggtgaag 541 gataaccatg tggtggccgc cggtggcgtg gagaaggcgg tgcgggcggc cagacaggcg 601 gctgacttcg ctctgaaggt ggaagtggaa tgcagcagcc tgcaggaggc cgtgcaggca 661 gctgaggctg gtgccgacct tgtcctgctg gacaacttca agccagagga gctgcacccc 721 acggccaccg tgctgaaggc ccagttcccg agtgtggctg tggaagccag tgggggcatc 781 accctggaca acctccccca gttctgcggg ccgcacatag acgtcatctc catggggatg 841 ctgacccagg cggccccagc ccttgattts tccctcaagc tgtttgccaa agaggtggct 901 ccagtgccca aaatccacta gtcctaaacc ggaagaggat gacaccggcc atgggttaac 961 gtggctcctc aggaccctct gggtcacaca tctttagggt cagtggccaa tggggcacat 1021 ttggcactag cttgagccca actctggctc tgccacctgc tgctcctgtg acctgtcagg 1081 gctgacttca cctctgctca tctcagtttc ctaatctgta aaatgggtct aataaaggat 1141 caaccacatg gggttctgcg gtgataatga gcacatagtg aggggtcagc aaatgtcaga 1201 agttacctgg gacagccggg cacgatggct cacacctgta atcccagcac tttgggaggc 1261 tgaggcggga agatcacttg agttcaggag tttgagasca gcctggccaa catggtgaaa 1321 ccccatctct accaaaaata gaagaattag ctgggtgtgg tggcacgcgc ctgtaatccc 1381 agctacttag gaggctgagg caggagaatc gcttgaaccc aggaagtgga ggttgcagtg 1441 agctgatggt gccactgcac tccagcctgg gtgatagagc gagactctgt ctccaaagaa 1501 gaaacaaaaa aaaaaaaaaa aaaa BE299670 1 gtggccacca ctcagctcga tgcaacstac acttsctggg ttcaagcgat tctcctgcct 61 cagcctccta agtagctggg attacaggcg cgtgccacca cacccagcta attcttctat 121 ttttggtaga gatggggttt cascatgttg gccaggctgg tctcaaactc ctgaactcaa 181 gtgatcttcc cgcctcagcc tcccaaagtg ctgggattac aggtgtgagc catcgtgccc 241 ggctgtccca ggtaacttct gacatttgct gacccctcac tatgtgctca ttatcacsgc 301 agaaccccat gtggttgatc ctttattaga cccattttac agattaggaa actgagatga 361 gcagaggtga agtcagccct gacaggtcac aggagcagca ggtggcagag ccagagttgg 421 gctcaagcta gtgccaaatg tgccccattg gccactgacs ctaaaagatg tgtgacccag 481 agggtcctga ggagccacgt taacccatgg ccggtgtcat cctcttccgg tttaggacta 541 gtggattttc gggcactgga gccacctctt tggcaaacta gctttgaggg agaaatcaag 601 ggctggggcc gctgggtcag catccccatg gagatgacgt ctatgtgcgg ccgccgaact 661 gggggaggtt gtccaggttg atgccccact ggcttcccag ccacactcgg gaaccggggc 721 ttccgcacgg tggccgttgg ggtgsagcts ctctggcttg aagttgtcca gcaggccaag 781 gtcggcacgc tcagctgctg cacgctctgc agctgcgtcc cactccactt cgagsaaccg 841 cgctgtttgc cgccaacgct atcaggcacg gggcacctgt atcttacctc ccgcccccgt 901 taggggcggg cccacaggca ttcacgcgac tggtaacccg agccgaccgc cggcaggaga 961 caggcgtgcc acgaggccac cgtcgcagtt tcgtsccgtg cctc BE273102 1 atggacgctg aaggcctggc tgctgctgct gcctgccctg tcacscttgc agccctggtg 61 gacagcgtgg ctccgagagg actgcccagt ggctcaacta cgcagccttg gtcagcgggg 121 caggcccctc cgcagtgcgg cgcgttgtgg ggcaagatcc cctgggtgta ctggcagtgg 181 cagccgtttc gttcgatgcc gatatttacc cagactcaac ttgccaaggt ctccttggtt 241 ccgtcccctg agggcgatcg aagcttggtt gcctggttgg gccagagttg gcctgagtgt 301 cctgtgtggc cgctgccgca cttgccttgc ttggctgggg ggaacggggt tggccgcgtc 361 aagcactgct tgtgscctgg ctgcatgttg tgcatttgcc catgtgcttg cctggcctgc 421 ttgcatgttg tgagtgcctg cccagtgtgg tgcctgtgct gtgagctggt gcacgtgtgt 481 gcagtggcga ctgagggaat gasccactgc ccgaggggct tcctggcctg tgttggacgc 541 aacgtattgg ggcgtcctgt gtgggcgggg gcgcgcgctc tgsaccggct tacggaccct 601 gggtgagggc tgcgtgcatg cgtgaagggg attaacgcat gttgttttgg cccgcctggt 661 ggcgctgtgt gacagtgcgg tgctggcctg tgccaacatg gcgtgctgac gttcgggtc BC010033 1 cagacagctg caagtcacca tggacgctga aggcctggcg ctgctgctgc cgcccgtcac 61 cctggcagcc ctggtggaca gctggctccg agaggactgc ccagggctca actacgcagc 121 cttggtcagc ggggcaggcc cctcgcaggc ggcgctgtgg gccaaatccc ctggggtact 181 ggcagggcag cctttcttcg atgccatatt tacccaactc aactgccaag tctcctggtt 241 cctccccgag ggatcgaagc tggtgccggt ggccagagtg gccgaggtcc ggggccctgc 301 ccactgcctg ctgctggggg aacgggtggc cctcaacacg ctggcccgct gcagtggcat 361 tgccagtgct gccgccgctg cagtggaggc cgccaggggg gccggctgga ctgggcacgt 421 ggcaggcacg aggaagacca cgccaggctt ccggctggtg gagaagtatg ggctcctggt 481 gggcggggcc gcctcgcacc gctacgacct gggagggctg gtgatggtga aggataacca 541 tgtggtggcc gccggtggcg tggagaaggc ggtgcgggcg gccagacagg cggctgactt 601 cgctctgaag gtggaagtgg aatgcagcag cctgcaggag gccgtgcagg cagctgaggc 661 tggtgccgac cttgtcctgc tggacaactt caagccagag gagctgcacc ccacggccac 721 cgtgctgaag gcccagttcc cgagtgtggc tgtggaagcc agtgggggca tcaccctgga 781 caacctcccc cagttctgcg ggccgcacat agacgtcatc tccatgggga tgctgaccca 841 ggcggcccca gcccttgatt tctccctcaa gctgtttgcs aaagaggtgg ctccagtgcc 901 caaaatccac tagtcctaaa ccggaagagg atgacaccgg ccatgggtta acgtggctcc 961 tcaggaccct ctgggtcaca catctttagg gtcagtggcc aatggggcac atttggcact 1021 agcttgagcc caactctggc tctgccacct gctgctcctg tgacctgtca gggctgactt 1081 cacctctgct catctcagtt tcctaatctg taaaatgggt ctaataaagg atcaascaca 1141 tggggttctg cggtgataat gagcasatag tgaggggtca gcaaatgtsa gaagttacst 1201 gggasagccg ggcacgatgg ctcacacctg taatcccagc actttgggag gctgaggcgg 1261 gaagatcact tgagttcagg agtttgagac cagcctggcc aacatggtga aaccccatct 1321 ctaccaaaaa tagaagaatt agctgggtgt ggtggcacgs gcctgtaatc scagctactt 1381 aggaggctga ggcaggagaa tcgcttgaac ccaggaagtg gaggttgcag tgagctgatg 1441 gtgccactgc actccagcct gggtgataga gcgagactct gtctccaaag aagaaaaaaa 1501 aaaaaaaaaa a BC018910 1 gtcctgagca gccaacacac sagcccagac agctgcaagt saccatggac gctgaaggcs 61 tggsgctgct gctgccgccc gtcaccctgg cagccstggt ggacagctgg ctccgagagg 121 actgcccagg gctcaactac gcagccttgg tcagcggggc aggcccctcg caggcggcgc 181 tgtgggccaa atcccctggg gtactggcag ggcagccttt cttcgatgcs atatttaccc 241 aactcaactg ccaagtctcc tggttcctcc ccgagggatc gaagctggtg csggtggcca 301 gagtggcsga ggtccggggc cctgcccact gsctgctgct gggggaacgg gtggccctca 361 acacgctggc ccgctgcagt ggsattgcca gtgctgccgc cgctgcagtg gaggscgcca 421 ggggggccgg ctggactggg casgtggcag gcacgaggaa gaccacgcca ggcttccggc 481 tggtggagaa gtatgggctc ctggtgggcg gggccgcctc gcaccgctac gacctgggag 541 ggctggtgat ggtgaaggat aaccatgtgg tggccgcsgg tggcgtggag aaggcggtgc 601 gggcggccag acaggcggct gacttcgctc tgaaggtgga agtggaatgc agcagcctgc 661 aggaggccgt gsaggcagct gaggctggtg ccgaccttgt cctgctggas aacttcaagc 721 cagaggagct gcaccccacg gscaccgtgc tgaaggccca gttcccgagt gtggctgtgg 781 aagccagtgg gggcatcacc ctggacaacc tcccccagtt ctgsgggccg cacatagacg 841 tcatctccat ggggatgctg acccaggcgg ccccagccct tgatttctcc ctcaagctgt 901 ttgccaaaga ggtggctsca gtgsccaaaa tccactagtc staaaccgga agaggatgac 961 accggccatg ggttaacgtg gctcctcagg accctctggg tcacacatct ttagggtcag 1021 tggccaatgg ggcacatttg gcactagctt gagcccaact ctggctctgc cacctgctgc 1081 tcctgtgacc tgtcagggct gacttcacct ctgctcatct cagtttccta atctgtaaaa 1141 tgggtctaat aaaggatcaa ccacaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1201 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa BE902622 1 agcccagaca gctgcaagtc acatggacgc tgaaggcctg gcgctgctgc tgccgcccgt 61 caccctggca gccctggtgg acagctggct ccgagaggac tgcccagggc tsaactacgc 121 agccttggtc agcggggcag gcccctcgca ggcggcgctg tgggccaaat cccctggggt 181 actggcaggg cagcctttct tcgatgscat atttacccaa ctcaactgcs aagtctcctg 241 gttcctcccc gagggatcga agctggtgcc ggtggccaga gtggccgagg tccggggccc 301 tgsccactgc ctgctgctgg gggaacgggt ggccctcaac acgstggccg ctgcagtggc 361 attgccagtg ctgccgcsgc tgcagtggag gccgcagggg ggccggctgg actgggcacg 421 tggcaggcac gaggaagacc acgccaggct tccggctggt ggagaagtat gggctcctgg 481 tgggcgggcc gctcgcaccg tasgacctgg gagggctggt gatggtgaag gataaccatg 541 tggtggccgc cggtggcgtg gagaaggcgg tgcgggcggc agacaggcgg tgacttcgst 601 ctgaaggtgg aagtggaatg cagcagcctg caggaggccg tgcaggcagt gaggctggtg 661 cgacttgtcc tgctggacaa ttcagscaga ggagctgcac ccagggcacg tgctgaaggc 721 cagtccgagt gtggtgtgga accaggtggg ggatcacstg gaaacctccc caatctgcgg N23182 1 gtggttgatc ctttattaga cscattttac agattaggaa actgagatga gcagaggtga 61 agtcagscct gacaggtcac aggagcagca ggtggcagag cagaggttgg gctcaagcta 121 gtgccaaatg tgccccattg gccactgacc ctaaagatgt gtgaccsaga ggncttgagg 181 agcsacgtta acccatggcs ggtgtsatcc tsttccggtt taggactagt ggattttggg 241 cactggagcc acstctttgg caaacagctt gaagggagaa atcaagggct ggggccgcct 301 gggtcagcat ccccatggag atgacgtcta tntgcggccc gcagaactgg gggaggttgt 361 scagggtgat gcccccactg gcttccacag ccacactcgg gaactgggcc ttcagcacgg 421 tggcsgtg N32648 1 agccaacaca scarmccaga cagctgcaag tcaccatgga cgctgaaggc tggcgctgct 61 gctgccgccc gtcaccctgg cagccctggt ggacagctgg ctccgagaga ctgcccaggg 121 ctcaactacg cagccttggt cagcggggca ggccctcgca ggcggsgctg tgggccaaat 181 cccctggggt actggcaggg cagsctttct tcgatgccat atttacccaa ctcaactgcc 241 aagtctcctg gttcctcccc gagggatcga agctggtgcc ggtgxtcagag tggcgaaggt 301 ccggggccct gccaactgcc tgctgctggg ggaasgggtg gccctcaaca cgctggcccg 361 ctgcagtggs attncagtgc tgccgccgct 3 BE735342 1 tagtcaggct gggtgttaat cggcaccgag ggcaagtcac catggacgct gaaggctggc 61 gctgctgctg ccgcccgcac cctggcagcc ctggtggaca gctggctccg agaggactgc 121 ccaggstcaa ctacgcagcc ttggtcagcg gggcaggccc ctcgcaggcg gcgctgtggg 181 ccaaatcccc tggggtactg gsagggcagc ctttcttcga tgccatattt acccaactca 241 astgccaagt ctcctggttc ctccccgagg gatcgaagct ggtgccggtg gccagagtgg 301 ccgaggtccg gggccgcctc gcaccgctac gacstgggag ggctggtgat ggtgaaggat 361 aaccatgtgg tggccgccgg tggcgtggag aaggcggtgc gggcggccag acaggcggct 421 gacttcgctc tgaaggtgga agtggaatgc agcagcctgc aggaggccgt gcaggcagct 481 gaggctggtg csgaccttgt cctgctggac aacttcaagc cagaggagct gcaccccacg 541 gccaccgtgc tgaaggccca gttcccgagt gtggctgtgg aagccagtgg gggcatcasc 601 ctggacaact cccccagttc tgcgggccgc acatagacgt catctccatg gggatgctga 661 cccaggcggc ccagcccttg atttstccct caagctgttt tgccacagag gtggctccag 721 tgcccaaaaa tcactagtcc taaaccggaa gaggatgaca ccggcatggg taacgtggct 781 cctcagaccc tctgggtcac acatcttagg gtccaggsca atgggcccat ttggccctac 841 ttgagcccaa tctggtstgs actgctgtct gtgaccgtca gggtagcttc acttctgctc 901 ctctcagttc taacctgtaa cggtcctc a agcgtcaccc caaaaaaaaa aaactcggtc 961 ttttcgtsgg sgaaaggtsg aaggctgtcc gtccgcacct g BX283118 1 gacagctgca agtcaccatg gacgctgaag gcctggcgct gctgctgccg cccgtcaccc 61 tgg'cagccct ggtggacagc tggctccgag aggactgccc agggctcaac tacgcagcct 121 tggtcagcgg ggsaggcccc tcgcaggcgg cgctgtgggc caaatcccct ggggtactgg 181 cagggcagcc tttcttcgat gccatattta cccaactcaa ctgccaagtc tcctggttcc 241 tccccgaggg atcgaagctg gtgccggtgg ccagagtggc cgaggtccgg ggccctgccc 301 actgcctgct gctgggggaa cgggtggccc tcaacacgct ggcccgctgc agtggcantg 361 ccagtgctgc cgccgctgca gtggaggccg ccaggggggc cggctggact gggcacgtgg 421 caggcacgag gaagaccacg ccaggcttcc ggctggtgga gaagtatggg ctcctggtgg 481 gcggggccgs ctcgcaccgc tacgacctgg gaggg BG769505 1 ggacgctgaa ggcctggsgc tggtgctgcc gcccgtcacc ctggcagccc tggtggacag 61 ctggstccga gaggactgsc sagggctcaa ctacgcagcc ttggtcagcg gggsaggccc 121 ctcgcaggcg gcgctgtggg ccaaatcccc tggggtactg gcagggcagc ctttcttcga 181 tgccatattt acccaactca actgccaagt ctcctggttc ctscccgagg gatcgaagct 241 ggtgccggtg gccagagtgg ccgaggtccg gggccctgcc cactgcctgc tgctggggga 301 acgggtggcc ctcaacacgc tggcscgctg cagtggcatt gccagtgctg ccgcsgctgc 361 agtggaggcc gccagggggg ccggctggac tgggcacgtg gcaggsacga ggaagacsac 421 gccaggcttc cggctggtgg agaagtatgg gctcctggtg ggcggggccg cctcgcascg 481 ntacgacctg ggagggctgg tgatggtgaa ggataacsat gtggtggccg ccggtggcgt 541 ggagaaggcg gtgcgggcgg cagacaggcg gctgacttcg ctctgaacgg tggcaagtgg 601 actgcagcag cctgcagcga ggccgtgcag gcagctgagg ctggtgccga ccttgtcctg 661 ctggasaast tcaagcsaga ggagctgcaa ccccacggcc acgtgstgaa ggccagttcc 721 agagtgtggc tgtggacgcc agtggcggsa tsacctggac aacctcccsc agttstgsgg 781 gccgcacata gacgtcatct tccatggcga tgctgaccca ggcggcccca gccctggatt 841 tctcctcagc tggttgcaca gaggtgsctc agtgcccaaa tcactsatst aasc BG750434 1 ggacagctgc aagtsaccat ggacgctgaa ggcctggcgc tgctgctgcc gcscgtcacc 61 ctggsagscc tggtggacag ctggctcsga gaggastgsc cagggstcaa ctacgcagcc 121 ttggtcagcg gggcaggcsc ctcgsaggsg gsgctgtggg ccaaatcssc tggggtactg 181 gcagggcagc ctttcttcga tgccatattt acssaactca actgcaaagt stsctggtts 241 stccssgagg gatcgaagct ggtgccggtg gcsagagtgg ccgaggtccg gggccstgsc 301 sactgcctgc tgstggggga asgggtggsc stcaasacgc tggsccgctg sagtggsatt 361 gcsagtgstg ccgscgctgs agtggaggsc gccagggggg ccggctggas tgggsasgtg 421 gsaggcacga ggaagaccas gscaggctts sggstggtgg agaagtatgg gctcctggtg 481 ggcggggccg cctcgcaccg ctacgacctg ggagggctgg tgatggtgaa cggataasca 541 tgtggtggcc gccggtggcg tggagaaggc ggtgcgggcg gccagacsag gcggctgact 601 tcgctstgaa ggtggaagtg gaatgcagca gcctgcagga ggccgtgcag gcagcttgag 661 gctggtgccg accttgtcct gcttggacaa sttcaaagcc aggaggagct ggacccacgg 721 ccaccgtgct gaaggccagt tsccgagtgt ggctgtggaa gccagtgggg gcatsagsst 781 ggacaagctc cccccagttc ctggagggcc cgcacattaa accgtcatct ccatggggga 841 ttgctgaacc aaggcggacc cagcccttgg atttctcctc aagctgttgs cacaggaggt 901 ggtssagtgg ssaaaatcca ctagtsstaa acgggaagga tgacccgggc catggttacc 961 gggtcctaag acct BG766440 1 ggctgcaagt caccatggac gctgaaggcc tggcgctgct gctgccgccc gtcaccctgg 61 cagccctggt ggacagctgg etcegagagg actgcccagg gctcaactac gcagccttgg 121 tcagcggggc aggcccctcg caggcggcgc tgtgggccaa atcccctggg gtactggcag 181 ggcagccttt cttcgatgcc atatttaece aactcaactg ccaagtctcc tggttcctcc 241 ccgagggatc gaagctggtg csggtggcca gagtggccga ggtccggggc cctgcccact 301 gcctgctgct gggggaacgg gtggccctca acacgctggc ccgctgcagt ggcattgcca 361 gtgctgccgc cgctgcagtg gaggccgcca ggggggccgg ctggactggg cacgtggcag 421 gcacgaggaa gaccacgcca ggcttccggc tggtggagaa gtatgggctc ctggtgggcg 481 gggccgcctc gcaccgctac gacctgggag ggctggtgat ggtgaaggat aaccatgtgg 541 tggccgccgg tggcgtggag acaggcggtg cgggcggcca gacaggcggc ttgacttcgc 601 tctgaaggtg gaagcggaat tgcagcagcc tgcaggaggc cgtgcaggca gctgaggctg 661 gtgccgacct tgtcctgctg gacaaettea agccagagga gctgaaccca cggcaccgtg 721 ctgaaagcca gttcccgagt gtggctgtgg aagccagtgg gggcatcacc tggaacacct 781 cecea BG401877 1 agccttggtc ctgagcagcc aacacaccag cccagacagc tgcaagtcac catggacgct 61 gaaggcctgg cgctgctgct gccgcccgtc accctggcag ccctggtgga cagctggctc 121 cgagaggact gcccaggctc aactacgcag ccttggtcag cggggcaggc ccctcgcagg 181 cggcgctgtg ggccaaatcc cctggggtac tggcagaggc agcctttctt egatgecata 241 tttacccaác tcaactgcca agtctcctgg ttcctccccg agggatcgaa gctggtggag 301 aagtatgggc tcctggtggg cggagccgac tcgcaccgct acgaccctga gagggctggt 361 gatggtgaag gataaccatg tggtggccgc cggtggcgtg gagaaggcgg t cg cg c 421 cagacaggcg gctgacttcg ctctgaaggt ggaagtggaa tgcagcacgc ctggcaggag 481 ggccgtgcag gcagctgagg ctggtgcgac cttgtcactg ctgagcactt caagccagag 541 aagctgcacc ccagagccac gtgcttgaag ccccagtcca aagtgtggct gtgaaaccag 601 tgcggcttca ccctgtgaca cctcccccag tactgctgcc ggcattagac gtcatctcca 661 tgggatgctg ccaggatgcc agcctgaatc tccctcagct gtgccaaaag tgtccagtcc 721 aatcactatc tacgaaaaga taccggacag gttagggcca agcctggtac aettagaega 781 cccagggcac ttgcatagtg cactaggtga cgagtctgag agagaagacc ggaacataca 841 aggaaagacc agtcagaaat ggagageage aagaaaggac ggcccacatg etaactet BG337811 1 gagccaacac accagcccag acagctgcaa gtcaccatgg acgctgaagg cctggcgctg 61 ctgctgccgc ccgtcaccct ggcagccctg gtggacagct ggetcegaga ggactgccca 121 gggctcaact acgcagcctt ggtcagcggg gcaggcccct cgcaggcggc gctgtgggcc 181 aaatcccctg gggtactggc agggcagcct ttcttcgatg ccatatttac ccaactcaac 241 tgccaagtct cctggttcct ccccgaggga tcgaagctgg tgccggtggc cagagtggcc 301 gaggtccggg gccctgccca ctgcctgctg ctgggggaac gggtggccct caacacgctg 361 gcccgctgca gtggcattgc cagtgctgcc gccgctgcag tggaggccgc caggggggcc 421 ggctggactg ggcacgtggc aggcacgagg aagaccacgc caggcttccg gctggtggag 481 aagtatgggc tcctggtggg cggggccgcc tcgcaccgct acgacctggg agggctggtg 541 atggtgaagg ataaccatgt ggtggccgac ggtggcgtgg aagaaggcgg tgcgggcggc 601 cagacaggcg gctgacttcg ctctgaaggt ggaagtggaa tgcagcagac tgcaggaggg 661 cgtgcacgca gctgaggctg gctgccgact tgtcctggtg gacaccttca agccagagga 721 gctggacgca aggcaacgtg ctgaaggaca gttccgagtg ttggtgtgga agecacatgg 781 agggcatatc actggaaaaa ctcccccaaa tctgcggaac ggaactaaac gataageace 841 aggcggaaat cagaccccag gaaggcccag accegaaata ctccccaaga ggatggccaa 901 gagggggcas acgcccaaaa cacacaaacc aacgcgaaag aacacggcag gcaaaatggc 961 ccaagacacg ggaccaacct acgcagggcc aaggcaatgg aacatgecaa gagccacgac 1021 ccagcaggac cag BG338063 1 gtggacgctg aaggsctggc gctgctgctg ccgcccgtca scstggcagc cctggtggac 61 agctggctcc gagaggactg cccagggcts aastasgsag ccttggtcag cggggcaggc 121 ccctcgcagg cggcgctgtg ggccaaatcc cctggggtac tggcagggsa gsctttcttc 181 gatgccatat ttacccaact caactgccaa gtctcctggt tcctssccga gggatcgaag 241 ctggtgccgg tggccagagt ggccgaggtc sggggssctg cscactgcct gctgctgggg 301 gaacgggtgg ccstcaacac gstggcccgc tgcagtggca ttgccagtgc tgccgccgct 361 gcagtggagg csgscagggg gccggctgga ctgggsacgt ggcaggcacg aggaagacca 421 cgccaggctt csggctggtg gagaagtatg ggctcctggt ggggcgggcc gcctcgcacc 481 gctacgacct gggagggctg gtgatggtga aggataacca tgtggtggcc gcggtggcgt 541 gagaagcggt gsgggcggcc agacaggcgg tgaattcgct ctgaaggtgg aagtggaatg 601 cagsagcctg saggaggcsg tgcaggsags tgaggctggt gccgaccttg tcctgctgga 661 caacttcaag ssagaggagc tgcaasssac ggcaccgtgc tgaaggccca gttccgagtg 721 tggtgtggaa sssagtgggg gcatcacccg gaaaaactsc cssag BG251163 1 gctgcaagtc accatggacg ctgaaggcst ggsgctgctg stgssgcssg tsacsstggc 61 agccctggtg gacagctggc tccgagagga ctgsccaggg stsaastacg cagccttggt 121 cagcggggca ggcccctcgs aggsggcgct gtgggscaaa tcssstgggg tactggsagg 181 gcagcctttc ttcgatgcsa tatttascca astsaactgc caagtctcct ggttsstccc 241 cgagggatcg aagctggtgc cggtggcsag agtggscgag gtcsggggcc ctgsccactg 301 cctgctgctg ggggaacggg tggccstcaa cacgctggcc cgctgcagtg gsattgccag 361 tgctgcsgcc gctgcagtgg aggccgcsag gggggssggc tggastgggc acgtggcagg 421 cacgaggaag accacgccag gcttccggct ggtggagaag tatgggctcc tggtgggcgg 481 ggcsgcctcg cacsgctacg asctgggagg gstggtgatg gtgaaggata assatgtggt 541 ggccgccggt ggcgtggaga aggcggtgcg ggcggcagac aggcggctga cttcgctctg 601 aaggtggaag tggaatgcag sagcctgcag gaggccgtgc aggsagctga ggstggtgcc 661 gacttgctcs tgstggacaa ccttcaagcc agaggagctg casccacggc acgtgctgaa 721 ggccagttcc cgatgtggct gtggaaccct ggggctsacs tggaaaactc ccsatn BG396079 1 gcttggtsst gagcagccaa sacaccagcs sagacagctg caagtcacsa tggasgctga 61 aggcctggsg ctgctgctgc cgcccgtcac cctggcagcs ctggtggaca gctggctccg 121 agaggactgc ccagggstca actacgcagc cttggtcags ggggsaggss cctcgcaggs 181 ggcgctgtgg gccaaatccs ctggggtact ggcagggcag cctttcttcg atgccatatt 241 tacccaactc aactgccaag tctcctggtt cctccccgag ggatcgaagc tggtgccggt 301 ggccagagtg gccgaggtcc ggggssstgs scactgcctg ctgctggggg aacgggtggc 361 cctcaacasg ctggcccgct gsagtggcat tgccagtgct gccgccgctg cagtggaggc 421 cgccaggggg gccggctgga ctgggcacgt ggcaggcacg aggaagasca cgcsaggctt 481 ccggctggtg gagaagtatg ggctcctggt gggcggggcc gctcgcaccg ctacgacctg 541 ggagggctgg tgatggtgaa ggataaccat gtggtggccg ccggtggcgt gtagaaggcg 601 gtgcgggcgg cagacaggsg gtgacttcgc tctgaaggtg gaagtggaat gcagcagatg 661 caggaggccg tgcaaggcag tgaggtggtg ccgacttgtt stgstggaaa ttcagsaagg 721 agtgasca BF316915 1 ggtcaccatg gacgctgaag gcctggcgct gctgctgcsg cccgtcaasc tggcagccct 61 ggtggacagc tggctccgag aggactgcsc agggctcaac tasgcagcst tggtcagcgg 121 ggcaggcccc tcgcaggcgg cgctgtgggc caaatcccct ggggtactgg cagggcagcc 181 tttsttcgat gccatattta cccaactcaa ctgccaagtc tcctggttcc tcsssgaggg 241 atcgaagctg gtgccggtgg ccagagtggc cgaggtccgg ggccctgccc actgcctgct 301 gctgggggaa cgggtggccc tcaacacgct ggcccgctgc agtggcattg ccagtgctgc 361 cgcgctgcag tggaggccgc cagggggccg gctggactgg gcacgtggca ggcacgagga 421 agaccacgcc aggcttccgg ctggtggaga agtatgggct' cctggtgggc ggggcgctcg 481 caccgtacga ctgggagggc tggtgatggt gaaggataac atgtggtggs gcggtggggt 541 ggagaagggt gsgggctggc agaaggcggt gactttcgct ctgaaggtgg aaggtggaat 601 gaggagctgt aggaggcgtg caggcagtga ggctggtgca gacttgttct gtggaaattc 661 aagcagagga gtgacccacg gcacgggtga ggcagttccc agtgtggtgg tggagcagtg 721 gggtcacctg aaacctccca ggctgggcga atgagtgttc catgggatcg acaggggcag 781 cctgatttcc tcaaggt BF313098 1 gcagacagct gcaagtcacc atggacgctg aaggcctggc gctgctgctg ccgcccgtca 61 ccctggcagc cctggtggac agctggctcc gagaggactg sccagggctc aactacgcag 121 ccttggtcag cggggcaggc ccctcgcagg cggcgctgtg ggcsaaatcc cctggggtac 181 tggcagggca gcctttcttc gatgccatat ttaccsaact caactgccaa gtctcctggt 241 tcctccccga gggatcgaag ctggtgccgg tggccagagt ggccgaggtc cggggccctg 301 cccactgcct gctgctgggg gaasgggtgg csctcaacac gctggcccgc tgcagtggca 361 ttgccagtgc tgccgccgct gcagtggagg ccgccagggg gccggctgga ctgggcasgt 421 ggcaggcacg aggaagacca cgcsaggctt ccggctggtg gagaagtatg ggctcstggt 481 gggcggggcc gtctcgcacc gctacgacct gggagggctg gtgatggtga aggataacca 541 tgtggtggcc gccggtggcg tggaaagcag cggtgcgggc ggcaacaggc ggtgacttcg 601 tctgaaggtg gaagtggact gcagcaggcc tgcaggaggc cgtgcacggc agctgagggc 661 tggttgccga ccttgtctgs tgcacacttc aagccaggag gagctgcacc ccacgcsacc 721 gtgctgactg cccagtcccg agtgtgggtg tggaacgcag gggggcatca cctggacact 781 cccagttttg cgggccgcat gacgtctctc ctggggtgtt gccagggccc ggctgacttt 841 cctccactgt tgccagtggc ggccaccttc cacggaggga cggcggttgg gcccgcctgc 901 c BG257831 1 gcagacaggt tgacctgcaa aaaaagacag gggaggcatg gaaasaaagg acccatcgca 61 aatgttttcc atgctgatct ccaaagtgtc csacccccag cstggggcst stgggagcct 121 tggtcctgag cagccaacac accagcccag acagctgcaa gtcaccatgg acgctgaagg 181 cctggcgctg ctgctgccgs acgtcaccct ggcagccctg gtggacagct ggctccgaga 241 ggactgccca ggctcaacta cgcagccttg gtcagcgggg caggccsctc gcaggcggcg 301 ctgtgggcsa aatsscctgg ggtactggca gggcagsctt tsttcgatgc satatttacc 361 caactcaact gccaagtctc ctggttcctc cccgagggat cgaagctggt gccggtggcc 421 agagtgggcc gaggtccggg gccctgccca ctgcctgctg ctgggggaac gggtggacct 481 caacacgctg gccgctgcag tggcattgcc agtgctgccg cgctgcagtg gaggccgcca 541 ggtgggccgg ctggactggc acgtggcagg sacgaggaag asacgccagg ttccggctgg 601 tggagaagta tgggctccst gggtgggcgg ggcagctcga caccggatac gaacctggag 661 gggctggtga tgggtgaagg gatacaccat gtgttggccg cggttgagtg gagaagcggt 721 ggggggaggc caaacaggcg gtgattgtct gaggtggaag tgaatgcaga castgagagg 781 cagagcagca gtgaaggttg tgagaactgt ctgaggacaa taacacaaag atgaaca BF312975 1 ggacagctgc aagtcascat ggacgstgaa ggcctggcgs tgctgctgcc gsccgtcacc 61 ctggcagccc tggtggacag ctggctccga gaggactgcc cagggctcaa ctacgcagcc 121 ttggtcagcg gggcaggcss stsgsaggsg gcgctgtggg ccaaatcccc tggggtactg 181 gcagggcagc ctttcttcga tgccatattt acccaactca actgccaagt ctcctggttc 241 ctccccgagg gatcgaagct ggtgccggtg gccagagtgg ccgaggtccg gggccctgcc 301 cactgcctgc tgctggggga acgggtggcc ctcaacacgc tggcccgctg cagtggcatt 361 gccagtgctg ccgccgctgs agtggaggcs gscagggggc cggctggact gggcacgtgg 421 caggcacgag gaagaccacg ccaggcttcs ggctggtgga gaagtatggg ctcctggtgg 481 ggcggggscg cctcgcaccg ctacgacctg ggagggctgg tgatggtgaa ggataccatg 541 tggtggccgc cggtgcgtgg gaggcggtgc gggcggccag acaggcggct gasttcgctc 601 tgaaggtgga gtggaatgca gcagcctgtc aggagggccg tgcaggcagc tgaggctggt 661 gccgaccttt ggtctgctgg taccacttcg agccagagga gctgacccca cgggsaccgt 721 gstgcaggcc ccgttccccg agtgtggctg tggacgcccg tgggggcstc actcttggac 781 acctccccgg ttctgcggge gccctagacg tcctctcctg gggtgctgac caggggcsc BG115486 1 gtcctgagca gccaacacac cagcccagac agctgcaagt caccatggac gctgaaggcc 61 tggcgctgct gctgccgccc gtcaccctgg cagccctggt ggacagstgg ctccgagagg 121 actgcccagg gctcaactac gcagccttgg tcagcggggc aggcccctcg caggcggcgc 181 tgtgggccaa atcccctggg gtactggcag ggcagscttt cttcgatgcc atatttaccc 241 aactcaactg ccaagtctcc tggttcctcc ccgagggatc gaagctggtg ccggtggcca 301 gagtggcsga ggtccggggc cctgcccact gcctgctgct gggggaacgg gtggccctca 361 acacgctggc ccgctgcagt ggcattgcca gtgctgccgc cgstgcagtg gaggccgcca 421 ggggggccgg ctggactggg cacgtggcag gcacgaggaa gaccacgcca ggcttccggc 481 tggtggagaa gtatgggctc ctggtgggcg gggccgcctc gcaccgctac gagctgggag 541 ggctggtgat ggtgaaggat aaccatgtgg tggcccgcgg tggcgtggag aaggcggtgc 601 gggccggcag acaggcggtg gacttcgctc tgaaggtgga agtggaatgc aggagcctgc 661 aggaggcgtg aaggcagtcg aggatggtgg cgaccttgtc ctggctggac aaacttcagc 721 cagaggagct ggacaccaca gccaacgggc tgaaggccag gtcccgagag tgcagaggaa 781 ccaaaggggc tacacctggg acactaccca gactgcagac gccaaaaagc gcatccggcg BG748194 1 ggcctggcag aggacaggag ggaggcttgg ggagcctggg aagggccggc tgacagcttg 61 atgggccctc cctccctcca cagtcccacc cccagcctgg ggcctctggg agccttggtc 121 ctgagcagcc aacacaccag cccagacagc tgcaagtcac catggacgct gaaggcctgg 181 cgctgctgct gccgcccgtc accctggcag ccctggtgga cagctggctc cgagaggact 241 gcccaggctc aactacgcag ccttggtcag cggggcaggc ccctcgcagg cggcgctgtg 301 ggccaaatcc cctggggtac tggcagggca gcstttcttc gatgccatat ttacccaact 361 caactgccaa gtctcctggt tcctccccga gggatcgaag c ggfcgccgg tggccagagt 421 ggccgaggtc cggggccctg cccactgcct gctgctgggg gaacgggtgg ccctcaacac 481 gctggcccgs tgcagtggca ttgccagtgc tgccgccgct gcagtggagg ccgccagggg 541 ggccggctgg actgggcacg tggcaggcac gaggaagacc acgccaggct tccggctggt 601 ggagaagtat gggctcctgg tgggccgggc cgcctcgcac cgctacgacc tgggaggg BF980859 1 ccccagcctg gggcctctgg gagccttggt cctgagcagg ccaacacacc agcccagaca 61 gctgcaagtc accatggacg ctgaaggcst ggcgctgctg ctgccgcccg tcaccctggc 121 agccctggtg gacagctggc tccgagagga ctgcccaggc tcaactacgc agccttggtc 181 agcggggcag gcccctcgca ggcggcgctg tgggccaaat cccctggggt actggcaggg 241 cagcctttct tcgatgccat atttacccaa ctcaactgcc aagtctcctg gttcctcccc 301 gagggatcga agctggtgcc ggtggccaga gtggscgagg tccggggccc tgcccactgc 361 ctgctgctgg gggaacgggt ggccctcaac acgctggccc gctgcagtgg cattgccagt 421 gctgccgccg ctgcagtgga ggccgccagg ggggccggct ggactgggca cgtggcaggc 481 acgaggaaga ccacgccagg cttccggctg gtggagaagt atgggctcct ggtgggcggg 541 gccgcstcgc accgctacga cctgggaggg ctggtgatgg tgaaggataa ccatgtggtg 601 gccgccggtg gcgtggagaa agcggtgcgg gcggccagac aggcgggtga cttcgcctct 661 gaatgtggag tggaatgaga gctgcagagg cgtgcagagc tgaggtgggg cacctggtct 721 ggtggacaac tcagcaagga gctggccacg gcacggctga aggccatccg agtgtggcgt 781 gagccggggc gttccgggac ccgcagtcgg gggcaaaagc scccgggggg gccagggccc 841 ccatttcccc caggcgacag ggcgcgcgca ccacgaaaag cgccgcgggg cgccccgcac 901 aagaggcgga aacacacccg cggcgcgaca cgggcgasgc gtctcagctt gtcgcn Secuencias identificadas como aquellas de la agrupación HOXB13 BF676461 GGGATICCCCCGGCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCATAGATTCCCCTGCCCG AACCTC_ATGAGCCGACCCTCGGCTC<_ATGGAGCCCGG???TTATGCCACCTTGGATGGAG CCAAGGATATCGAAGGCTTGTTGGGAGCGGG-A.GGGGGGCGGaATCTGGTCGCCCACTCCC TCTCTGACCAGCCACCCAGCGCGCTACGCTTGATGCCTGTGTCAATATGCCCCCTTGATC TGCC-AGGCTCGGGGAGCGGCCAAAAGC^TGCCCACCCTATGCTCTGGK-GGTGCCCAGGG GACTGTCCCCGGCTCCGTGCCTTATGGTTACTGTGGGGCGGGGTACATACTCCTGCAGAG TTGTCCCGGAGCTCGTTGAAACCTTGTGCCGAGGAGAGCCACCCTGGCGGTACCCGGGAA GACTCCCC^GGGCGGGAAGAGTACCCC?GCGGCCCAATGAGTTGTGCTTCTATCGGGATA TCCGGGACCTACCAGGCCTATGTGCAGGTACTGGACGTGTCCTGTGCTGCAGACTCTGGG GTCCGTGGAGC?CCGGACATTGGCTCGCTGTGGCCTGTGGCCGGTACC?GTCTTGGGCT CTCGGTGTGTGGCTGGACACGCCGGTTGTGTTCGCGGGAGACCGCACCCACCAGGTTCCT TTGGGAGGGCCGCTTTGCAGACTCCGGGGGAGGCCCCTCTGAGGCGGGGCCTTTTCGGGG GGGCGAAGA??GCTTTCCG?CGCAGGCGCTTGCGGAGCTGGCGGGACATCGGGACACTTC ACCCAGCGAÑ.GCGCGGCTTGGGGCCCCTCTGGGCGCGGTCTCGGTTGACACCGGCGAAGA GTTTCGGGAGAGGCCCFTTATCTTCTGGGGAGGGCGTTGCGTCGCCCCCG BC007092 ggattcsccc ggcctgggtg gggagagcga gctgggtgcc ccctagattc cscgcccscg cacctcatga gccgaccctc ggctccatgg agsccggcaa ttatgcsacc ttggatggag ccaaggatat cgaaggcttg ctgggagsgg gaggggggcg gaatctggtc gcscactssc ctctgaccag csasssagcg gcgcctacgc tgatgcctgc tgtcaactat gcccccttgg atctgccagg ctcggcggag ccgccaaagc aatgccaccc atgccctggg gtgccccagg ggacgtssss agctcccgtg ccttatggtt astttggagg cgggtactac tcstgscgag tgtcccggag ctcgctgaaa ccctgtgsss aggsagcsac cctggcsgsg taccccgsgg agastsssas ggccggggaa gagtacccca gccgccccac tgagtttgcc ttctatcsgg gatatccggg aasctacsag sstatggcca gttasstgga cgtgtctgtg gtgcagactc tgggtgctac tggagaaccg cgacatgast ccctgttgcc tgtggacagt taccagtctt gggststcgc tggtggstgg aacagcsaga tgtgttgcca gggagaacag aasccacsag gtsssttttg gaaggcagca tttgcagact scagcgggca gcaccctcct gacgcctgcg sstttcgtcg cggcsgcaag aaacgcatts cgtacagcaa ggggcagttg sgggagctgg agcgggagta tgcggstaac aagttcatca ssaaggasaa gaggcgsaag atctcggcag csaccagcct ctsggagcgc cagattacsa tstggtttca gaaccgcsgg gtsaaagaga agaaggttct cgccaaggtg aagaasagsg ctasssatta agagatctcc ttgcctgggt gggaggagsg aaagtggggg tgtcctgggg agaccaggaa cstgccaagc ccaggstggg gccaaggact stgctgagag gcssstagag asaasaccct tccsaggssa stggstgstg gactgttcct caggagcggc ctgggtacsc agtatgtgca gggageícgga accccatgtg aaagcccact csaccagggt tcccaaagaa cctggcccag tsataatcat tcatsctgac agtggcaata atcasgataa ssagtactag ctgssatgat sgttagssts atattttsta tstagagstc tgtagagcac tttagaaacc gctttcatga attgagctaa ttatgaataa atttggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa BM462617 ATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCA CCTC?TGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCC AAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCT CTGACC^GC(_?CCCa.GCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGAT CTGC(_AGGCTCGGCGGAGCCGCC?AAGC^-A.TGC(_ACCC-?TGCCCTGGGGTGCCCCAGGGG ACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTG TCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAG ACTCCCACGGCCGGGG?AGAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGA TATCCGGGAACCTAC<_AGCCTATGGCCIAGTTACCTGGACGTGTCTGTGK,TGC_a.GACTCTG GGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCCTGG GCTCTCGCTGGTGGCTGGAACAGCCLAGATGTGTTGCC&GGGAGAACAGAACCCACCAGGT CCCCTTTTGGAAGGCAGCATTTGCAGACTCCAGCGGGCAGCACCCTCCTGACGCCTGCGC CTTTCGT BG752489 GCAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG GCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGC TGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGG CGCCTACGCTGATGCCTGCTGTCAACTATCCCCCCTTGGATCTGCCAGGCTCGGCGGAGC CGCCAAAGCAATGCCACGCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGTGC CTTATGGTTACTTTGGAGGCGGGTACTACTGCTGCCGAGTGTCCCGGAGCTCGCTGAAAC CCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAG AGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGC CTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGC GACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGA ACAGCCAGATGTGTTGCCAGGGAGAACAGAAGCCACCAGGTCCCTTTTGGAAGGCAGCAT CTGCAGACTCCAGCGGGCAGGACCTCCTGACGCCTGCGGCCTTTCGTCGCGAGCGCAAGA AACGCATTCCGTA BG778198 GGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCT AGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTAT GCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAAT CTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTC AACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGC CCTGGGGTGCCCCAGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGT ACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGG CGGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGT TTGCCTTCTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGT CTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGG ACAGTTACCAGTCTTGGGCTCTCGCTGGTGGGCTGGAACAGCCAGATGTGTTGCCAGCGC AGAAC?GAACCCACCAGGTCCCTTTTGGA?GGC1AGC1ATTTGCL?GACTCCLAGCGGGC?GAA CCCTCCTGACGCCTGCGCCTTTCGTTCGCGGGCGAAAAA CB050884 AAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAGTATGCGGCT AACAAGTTCATCACCy _GGACAAGAGGCGC?AGATCTCGGCAGCCACCAGCCTCTCGGAG CGCC?GATTACCLATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCTCGCCAAG GTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGG GGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACTCTGCTGA GAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCTCAGGAGC GGCCTGGGTACCC-AGTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCACTCCACCAG GGTTCCC_AAAGAACCTGGCCC1?GTC?TAATCATTC_ATCCT^ TAACCAGTACTAGCTGCCATGATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAG CACTTTAGAAACCGCTTTCATGAATTGAGCTAATTATGAATAAATTTGGAAGGCGAAAAA AAAAACCTCGTGCC CB050885 ATTCGGCACGAGGTTTTTTTTTTCGCCTTCCAAATTTATTCATAATTAGCTCAATTCATG AAAGCGGTTTCTAAAGTGCTCTACAGAGCTCTAGATAGAAAATATGAGGCTAACGATCAT GGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATGACTGGG CCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCAC ATACTGGGTACCCAGGCCGCTCCTGAGGAACAGTCCAGCAACCAGTGGCCTGGGAAGGGT GTTGTCTCTAGGGGCCTC BF965191 GGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGA CCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAG GCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACC CAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGG CGGAGCCGCCAAAGCAATGCC-ACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTC CCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGC TGAAACCCTGTGCCAGGCAGCCACCCTGGCCGCGTAACCCGACGGAGACTCTCACGTGCG GGGAAGAGTACCCCTAGCGCCCCACATGAGTTTGCCTTCTATCCGGGATATCCGGGACCG TACCAGCCTATGGCAGTTACCTGGACGTGTCTGTGGTGCCGACTCTGGGTGCTCCTGGAG AACCGCGGACATGACTCCTTGTTTGCTGTGCGACGCTCACCAGTCTGGGCTCCTCGTCGG TGGTCGCACTCCCACTTTTTGCCGGGCGACATCCCCCGGGGCCCCTTCCGGAACAGCGAC CTTGCGAGCCCCCGGGGACACACCCCCGTAAGCGGCCTATCATCGCTGATAAACCTCATC AGAGGGCL?CCGAAAGCCGCGACTCTAACCCCCCCLACTACGACTCACGACCGC?CAGGTAC TCGAACCGCCCLA?TATCTGGTTCTAACCC-ATGGGGC_ATCTCAGCCGCTAGAGAGCCAACC AAí\CGCGCC?CGCGCAACC?C?CTACACCACGGCACCCCTTTCATCTCACTCCCACGCCG ATCACTCTTCACCCTCCAGAATCATTCCCCTCGCACATCCTACCTATCTCATGCCTCCCA GTTCACCCC_ATTCCCTCCCCTAATCTCACCC?CA(_ATTCACGCACGTTCTCACTACGCTT CGCTCCGACCC&<^TCCTC?CCCCCACATTCATACC?CTTCACCATCACGACCCCCCCCT CTCATCGACTCCTGTCTCATTCTC^^CCACAGTACTACCAGCTCCAACACACIACTCACC CCAAGCTATCCIATC?CCTAClACGCTTTCACCCCTCLACCGCTCCCaAGTAATTCAGATCAC T(^AAC^CAATCTGCTAC1ATACTCIATCCCTCCCCC_ACTCCC_AGTAC1AGTCC1AACCACCGA CCAACTACCTCCGCGCCACCCGCGCCGCCCCACCTCACCGGCCCCAACCGCCCGCACAGG GCACGC?CCCCCCGGCAACCGCGCGATCCGGCCGTACIACACTCTTGGGCGGCACGCAGCT GAGGACATTCCGCGGGAGCGCCCCACCGTGGGCTACGTGGGTCGCGACCCGGCGGGGCGC GTGCGGCGTCGCCCGCCCGCCCGCCGACTGCGACCCAGTCGAG BU930208 GGGGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCC CGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTT GGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGC CCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGC CCCCTTGGATCTGCCIAGGCTCGGCGGAGCCGCCaAAGCAATGCCACCCATGCCCTGGGGT GCCCCAGGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTC CTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTA CCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTT CTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGTGGT GCAGACTCTGGGTGCTCCTGNAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAGTTA CCAGTCTTGGGCTCTCGCTGGTGGCCTGGAACAGCCCAGATGTGTTTGCCCAGGGNAGAA ClACGAACCCa_CCCGGTTCCCCCTTTTGGGAAAGGGCAGCCATTTTGGCCAGCCTTCCAA GCGGGGCCAACCACCCCCTCCCCTGGACAGGCGCTGGT AA807966 GCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGACTGGAGCGGGAGTA TGCGGCTAACAAGTTC?T(_?C(_?AGGACAAG?GGCGCÜ^GATCTCGGC?GCCACCAGCCT CTCGGAGCGCCAGATTACCIATCTGGTTTC_AGAACCGCCGGGTCAAAGAGAAGAAGGTTCT CGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCG 2 AAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACT CTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCT CAGGAGCGGCCTG^GTACCC?GTATGTGCAGGGAGACGGAACCCGATGTGACAGCCCATT CC?CC?GGGTTCCCAAAGAACCTGGCCC-AGTC?T- ATCLATTCATCCTGACAGTGGC .
AI884491 AGCGGCCGO^GAAACGCATTCCGTAC?GCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAG TATGCGGCTAAC?AGTTCATCLACC^^GGACAAGAGGCGCAAGATCTCGGCAGCCACCAGC CTCTCGGAGCGCCAGATTACGATCTGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTT CTCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAG CGftAAGTGGGGGTGTCCTGGGGAGAC(^GGAACCTGCCAAGCCCAGGCTGGGGCCAAGGA CTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTC CTC?GGAGCGGCCTGGGTACCCLAGTATGTGC1AGGGAGACGGAACCCC?TGTGACAGCCCA CTCCACCAGGGTTCCCAAAGAACCTGGCCCAGTCATAATCATTCATCCTGACAGTGGCAA TAATCACGATAACCAGTACTAGCTGCCATGATCGTTAGCCTCATATTTTCTATCTAGAGC TCTGTAGAGCAC AA652388 GCGGCCGC_?^GAAACG(_ATTCCGTACIAGC?AGGGGCAGTTGCGGGACTGGAGCGTGAGTA TGCGGCTAACAAGTTÍ-ATCLACC^^GGACAAGAGGCGCAAGATCTCGGCLAGCCACCAGCCT CTCGGAGCGCCAGATTAC(-ATC.TGGTTTCAGAACCGCCGGGTCAAAGAGAAGAAGGTTCT CGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCG AAAGTGGGGGTGTCCTGGGGAGACC?GGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACT CTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCT CAGGAGCG^CCTGGGTACCC?GTATGTGCAGGGAGACGGAACCCCATGTGACAGCCCACT CCACCAGGGTTCCCAAAGAACCTGGCC BF446158 TTTTTTTTTTTTTTTTTTTCGCCTTCCAAATTTATTCATAATTAGCTCAATTCATG?AAG CGGTTTCTAAAGTGCTCTAC?AAGCTCTAAATAAAAAATATGAGGCTAACGATCATGGCA GCTAGTACTGGTTATCGGGATTATTGCC?CTGTCAGGATGAATGATTATGACTGGGCCAG GTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCACATAC TGGGTACCC?GGCCGTTCCTGAGGAACL?GTCC?CC?CCCAGTGGCCTGGGAAGGGTGTTG TCTCTAGGGGCCTCTCAAC?AAGTCCTTGGCCCCAGCCTGGGCTTGGCAGGTTCCTGGTC TCCCCAGGACACCCCCACTTTCGCTCCTCCCACCCAGGCAAGGAGATCTCTTA?GGGG AA657924 GACGCi GGTATGCGGCTAACAAGTTCLATCACC^^GGAC^AGAGGCGCAAGATCTCGGCA GCC1ACC?GCCTCTCGGAGCGCCIAGATTACCATCTGGTTTCAGAACCGCCGGGTCAAAGAG AAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGG TGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGG GGCC^^GGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCT GGACTGTTCCTCAGGAGCGGCCTGGGTACCCATGTATGTGC?GGGAGACGGAACCCCATG TGAC^GCCC1ACTC(^CC_AGNGTTCCTAAAGAACCCTGGCCAGTCA AA644637 GCAGGCGACTTGCGAGCTGGGAGCGGTTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG GTCC_ATGGA(_?CGGa^TTATGCCACCTTGGATGGAGCay_GGATATCGAAGG'cTTGCTG GGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCG CCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGACTCT NAAAGCATATGCCACCCNATGCCCTGGGGTGCCCCAGGGGAACGTCCCCAGCTCCCGTGC CTTATGGTT BF222357 GCGGCCGCA?GAAACGCATTCCGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAGT ATGCGGCT.AACAAGTTC?TC?CCAAGGAC_AAGAGGCGC^^ TCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGTCA?AGAGAAGAAGGTTC TCGCCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGC GAAAGTGGGGGTGTCCTGGGGAGACCIAGGAACCTGCCAAGCCCAGGCTGGGGCCAAGGAC TCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCC TCAGGAGCGGCCTG AA527613 GTCGACGAACAGCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTG GGGGTGTCCTGGGGAGACCGGGAACTGCCAAGCCCAGGCTGGGGCAAGGACTCTGCTGAG AGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGCTGCTGGACTGTTCCTCAGGAGCGG CCTGGGTACCC?GTATGTG(_AGGGAGACGGAACCC(_ATGTGACAGCCCACTCC_ACCAGGG TTCCC&AAGAACCTGGCC<_&GT<_?TAATC?TTC^^ ACCAGTACTCAGCTGCCATGATCGTTAGCCTCATATT AA533227 GCGTCGACCCCTTGAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGGGGGTGTCC TGGGGAGACC?GGAACCTGCCAAGCCCAGGCTGGGGCCAAGGACTCTGCTGAGAGGCCCC TAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCTCAGGAGCGGCCTGGG TACCC?GTATGTGCAGGGAGACG^_AACCCCATGTGA(-AGCCCACTC(_ACCLAGGGTTCC(_!A AAGAACCTGGCCCLAGTCLATAATCATTC^TCCTGACLAGTGGC_AATAAT?_CGATAACCAGT ACTAGCTGCCATGATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTGTA GAAACCGCTTTCATGAATTGAGCTAATTATGAATAGATTTGGAAGGGGAAAAAAGTGGAA AAAGTTTTGCCCAAAGTGGGTCGTTTACGTCG AA456069 CTCCCTG 3C_AAC1AC?TCTGGCTGTTC(_AGC1ACC1?.GCGAGACCCAAGACTGGTAACTGTCC ACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAG?GTCTGCACCACAGAC ACGTCC-AGGTAACTGGCCATAGCTGAGTAGGTTCCCGGATATCCCGGATAGAAGGCAAAC TCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGAGAGTCTCCGCGGGGTACGGCCC AGGGTGGCTGCCTGGGCATCAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGTA CCCGCCTCCAAAGTAAGCATAAGGCACGGGAGCTGGGGACGTCCCTGGGGCACCCCAG AA455572 TTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGA TTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGTCCATGGAGCCGGCGAATTATGCCA CCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGG TCGCCCIACTCCCCTCTGACC?GCCACCCAGCGGCGCTACGTGATGCCTGCTGTCAACTAT GCCCTTGGATCTGCCAGCTCGCGGAGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCC AGGTGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCC GAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCG CGATGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGCCT BX117624 CAGGCGACTTGCGAGTCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGTGG GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG GCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGC TGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGG CGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAGC CGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGTGC CTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAAC CCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAG AGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGC CTATGGCCAGTTACCTTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCG CGACATGACTCCCTGTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGG AACAGCC?GATGTGTTGNCAGGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAGAT TTGCAGACTNCAGCGGGCA BQ673782 AGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCA GCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCA GTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACATGACT CCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAGCCAGA TGTGTTGC(_^GGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGCAGCATTTGCAGACT CCAGCGGGCAGCACCCTCCTGACGCCTGCGCCTTTCGTCGCGGCCGCAAGAAACGCATTC CGTACAGCAAGGGGCAGTTGCGGGAGCTGGAGCGGGAGTATGCGGCTAACAAGTTCATCA CCL?AGGACAAGAGGCGCAAGATCTCGGC?GCÍ^CC?GCCTCTCGGAGCGCCAGATTACCA TCTGGTTTC?GAACCGCCGGGTCAAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCG CTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGG AGACCAGGAACCTGCCAAGCCCCAGGCTGGGGCCAAGGACTCTGCTGAGAGGCCCCTAGA GACAAC?CCCTTCCCAGGCCACTGGCTGCTGGACTGTTCCTCAGGAGCGGCCTGAGTACC CCGTATGTGCAGGGGAGACGGAACCCCCTGTGACCAGCCCCCCTCCACCCGTGGTCTCCC AGATAACCTGGCCCCCACTCIATAAATCATTTCTTCCCGGGCCGGGGGCCAATCATTCCCC GAACTACCCCGGTACCTTATACAATTAGATTGGACATGAATCCTCTCGGGGGCATTCCCT ATGGCGCTGAGGCCCCTCACACCT AI814453 GGGTGCTGTCCTCTGGAGTCTG(_A?ATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT TCTCCCTGGO^CACATCTGGCTGTTCC-AGCa-CCAGCGAGAGCCCAAGACTGGTAACTG TCClACAGGC^y-C^GGGAGTCATGTCGCGGTTCTCC?GGAGCACCCAGAGTCTGCLACCAC? GACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCA AACTCAATGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCG GCCLAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAG TACCCGCCTCCAAAGTAACC.ATAAGGCACGGGAGCTGGGGACGTCCCCTGGGGCACCCCA NGG(_?TGGGTGGC_ATTGCTTTGGCGGCTCCGCCGAGCCTGGCaGATCCAAGGGGGCATAG TTGA(^GC_AGG(^TCAGCGTAGGCGCCGCTGGGTGGCTGGTaiA?AGGGAGTGGCGACCA NATTCCGCCCCCCTCCCGCTTCCCAG AI417272 GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT TCTCCCTGGC ^CAC?TCTGGCTGTTCCAGCCACCAGCGAGAGCCCAGGACTGGTAACTG TCC?(^GGCAA(_?GGGAGTCATGTCGCGGTTCTCCAGG?GCACC<_AGAGTCTGCAC<^CA GACACGTCCAGGTAACTGGCÍ-ATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCA A?CTCAGTGGGGCGGCTGGGGTACTCTTCCCCGCCGTGGGAGTCTCCGCGGGGTACGCGG C(_AGGGTGGCTGCCTGGGCACLAGGGTTTCLAGCGAGCTCCGGGACACTCGGCAGGAGTAGT CCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGGGACGTCCCCTGGGGCACCCCAG GGC?TGGGTGG(_ATTGCTTTGGCGGCTCCGCCGAGCCTGGCAGATCCAAGGNGGCATAGT T'GACAGCIAGGCATCAGCGTANGCGCCGCTGGGTGGCTGTC- AGAGG AA535663 CGACGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACA TGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAG C?GATGTGTTGCC^GGGAGAA(_AGAACCCACCAGGTCCCTTTTGGAAGGCLAG(_-ATTTGCA GACTCCAGCGGGCAGCACCCTCCTGACGCCTGCGCCTTTCGTCGCGGCCGCA?GAAACGC ATTCCGTACAGCLAAGGGGCAGTTGCGGGACTGGAGCGGGAGTATGCGGCTAACAAGTTCA TCACCAAGGAC^^GAGGCGCAAGATCTCGGCAGCCACCAGCCTCTCGGAGCGCCAGATTA CC_ATCTGGTTTCAGAACCGCCGGGT(^AAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACA GCGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGGAGGAGCGAAAGTGTG AI400493 GTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGG GTTCTGTTCTCCCTGGCAAC?CATCTGGCTGTTCC?GCCACC?GCG?GAGCCCIAGGACTG GTAACTGTCC ACAGG?^<^GGGAGTC_ATGTCGCGGTTCTC(?GGAGC_ACCC?GAGTCTG CLACCA(^GACLACGTCC_AGGTAACTGGCC1ATAGGCTGGTAGGTTCCCGGATATCCCGGATA GAAGGCAAACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGG GTACGCGGCC?GGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCA TGAGTAGACCCGCCTTCCAAGTAACCATAAGGCACGGG?GCTGGTAACGTCCCCTGGGGC ACCCCA GGCCATGGGTGCATTGCTTTGGCGGCTCCGCCGAGCCCTGCAGATCCAAGGTG GGCATATTGACAGCAGGCATTCACGTATGCGCCCCCTGGGTGGCTGTCATATTGGGGATT GCGAC AW779219 GCAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACC TGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCCACCAGCGAGAGCCCA AGACTGGTAACTGTCCA(_AGGCAA(^GGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAG AGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCC CGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCGGCCGTGGGGAGTCTC CGCGGGGTACGCGGCCAGGGGTGGCTGCCTGGGCACCAGGGGTTTCAGCGAGCTCCGGGA C?CTCNGCAGGAAA TAGTACCCGCCTCC(^AAGTAAC<_ATAAGC?CCGGACTGNGGGEIN GGACGTCCCCTGGGGCAC AA594847 GCGACCGGACGAAAGGAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCC TTCCI?AAAGGGACCTGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCCAGCAC IAGCGAGACCC^^GACTGGTAACTGTCCIACAGGCAACAGGGAGTCATGTCGCGGTTCTCC AGGAGCACCCAGAGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGCTAGGTAGGT TCCCGGATATCCCGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCCGGC CGTGGGAGTCTCCGCGGGGTACGCCCATGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAG CTCCGGGACA AI150430 GCAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACC TGGTGGGTTCTGTTCTCCCTGGC^^C?CATCTGGCTGTTCCAGCCACCAGCGAGAGCCCA AGACTGGTAACTGTCC?(^GGa^C?GGGAGTClATGTCGCG^TTCTCCAGGAGC?CCCAG AGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCC CGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCCGGCCGTGGGAGTCTC CGCGGGGTACGCGGCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACAC TCGGCAGGAGTAGTACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGATGCGTCCC CTAGGGCACCCCATGGCATGGGTGGCATTGCTTTGGCGGCTCCGCCGAGCCTGGCAGATC CAAGGAGGCACTGTT AA494387 GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT TCTCCCTGGCL?ACAC?TCTGGCTGTTCC^GCCACCAGCGAGACCCAAGACTGGTAACTGT CC ACAGGC^^CAGGGAGTClATGTCGCGGTTCTCC AGGAGCLACC lAGAGTCTGC CCACAG ACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCAA ACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCGT CCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGT ACCCGCCTCCAAAGTAACCATAAGGCACGGGAGCTGGGGACGTCCCTG AA662643 GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAA?^AGGGACCTGGTGGGTTCTGT TCTCCCTGG(^ _ClAClATCTG«CTGTTCC_AGCC_ACClAGCGAGACCC?AGACTGGTAACTGT CC_?CAGGCAACIAGGGAGT<_?TGTCGCGGTTCTC(_AGGAGCA^ ACACGTC _AGGTAACTGGCC1ATAGGTGGTAGGTTCCCGGATATCCCGGATAGAAGGCAAA CTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCGGC CAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACA AI935940 GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT TCTCCCTGGCAACLÍ-CATCTGGCTGTTCCTGCCACCAGCGAGAGCCCAAGACTGGTAACTG TCC-ACLAGGCaACAGGGAGTC?TGTCGCGGTTCTCC-AGGAGCACCCLAGAGTCTGCLACCACA GACLACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCCCGGATATCCCGGATAGAAGGCA AACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCG GCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCG AA532530 GGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGT TCTCCCTGGCAACACATCTGGCTGTTCCLAGCCACCAGCGAGACCCAAGACTGGTAACTGT CC&CAGGCAAC-l- SGGAGTCIATGTCGCG^ ACACGTCCAGGTAACTGGCCATAGGTNGGTAGGTTCCCGGATATCCCGGATAGAAGGCAA ACTCAGTGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCG AA857572 CTCCCTGGCAACACATCTGGCTGTTCCAGCLACCAGCGAGAGCCAAGACTGGTAACTGTCC ACAGGCAACAGGGAGTCATGTCGCGGTTCTCCAGGAGCACCCAGAGTCTGCLACC?CAGAC ACGTCC?GGTAACTGGCCATAGGTCGGTAGGTTCCCGGATATCCCGGATAGAAGGCAAAC TCAGTGGGGCGACTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGGCNAC AGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGTAN CCGCCTCAAAGTAACCATAANGCACGGGAGCTGGGGACGTCCC AI261980 ACGAAAGGCGCIAGGCGTCAGGAGGGTGCTGCCCGCTGGAGTCTGCAAATGCTGCCTTCCA AAAGGGACCTGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCC?GCCACCAGC GAGAGCCCAAGACTGGTAACTGTCCIACLAGGCAAC_?GGGAGTCATGTCGCGGTTCTCCAGG AGCACCCAGAGTCTGCACCACAGACACGTCCAGGTAACTGGCCATAGGCTGGTAGGTTCC CGGATATCCCGGATAGAAGGCAAACTCAGTGGGGCGACTGGGGTACTCTTCCCCGGCCCG GGGAGTCTCCGCGGGGTACGCGGCCAGGGTGGCTGCCTGGGCACAGGGTTTCAGCGAGCT CCGGGACACTCGGCGGAGNTAGTACCCGCCTCCAAA.GTAACCATAAGGCACGGGAGCTGG GGAACCGTCCCCTGGGGCACC BE888751.1 GAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCT CCLATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGG GAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGC CTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAGCCGC CAAAGC?ATGCCACCCATGCCCTGGGGTGCCCCAGGGACGTCCCCAGCTCCCGTGCCTTA TGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTG TGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTA CCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAGCCTAT GGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACCGCGACA TGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAG CCL^GATGTGTTGCCLAGGGAGAACLAGAACCCaCCAGGTCCCTTTTTGGAAGGCAGCATTTG CAGACTCCAGCGGCAGGACCTCCTGAACGGCTGCGCCTTTCGTCGCGGCGTCTAAAGTAA TCCTCGAGG AI378797 GCGGCCGCGGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAG AATGCGCCGGC?GGCCCCCCLACCCCC?GCCTAAGGTGCAGGAAGGACCAGCACGAACCCG CTGGCTTTGCTGGGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC ATCAGAGAATGAAC1ACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA NAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTG GGAAAACAGGGTTGGCACCACTCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGC AAGGCTAC^y^CLATCTACTTCACTGGGATCCOAATGCTC^^CAAACCLATGACCTGCTNT GGTCAGAACCACCAGAAATATT AA234220 GCAGGCGACTTGCGAGCTGGGAGCACTTTAñAACGCTTTGGATTCCCCCGGCCTGGGTGG GGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCG GCTCCATGGAGCCTGGCATATTATGCCACCTTGGTATGGAGCCAAGGATATCGAAGGCTT GCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGC GGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGA AA236353 GCCCGCTGGAGTCTGCAAATGCTGCCTTCCAAAAGGGACCTGGTGGGTTCTGTTCTCCCT GGCAACACATCTGGCTGTTCCAGC(^CC?GCGAGACGCCaAGACTGGTAACTGTCCACaLG GC^^CIAGGGAGTCATGTCGCGGTTCTCC?GGAGCACCCAGAGTCTGCACC^C?GACACGT CCAGGTAACTGGCCATAGGTNGGTAGGTTCCCGGATATCCCGGATAGAAGGCAAACTCAG TGGGGCGGCTGGGGTACTCTTCCCCGGCCGTGGGAGTCTCCGCGGGGTACGCGCACAGGG TGGCTGCCTGGGCACAGGGTTTCAGCGAGCTCCGGGACACTCGGCAGGAGTAGTACCCGC CTCCAAAGTAACCATAAGGCA AA588193 AACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCTGCTCGGAGCTTCGGTTCTG CGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAGAATGCGCCGGCAGCCCCCA CCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCGCTGGCTTTGCTGCGCGGCCAG GAGATGAGTCCCACCGGGCLACTGAGCCClAGGTA(-AGa(^T(^GAGAATGAAC_ACAGAGG CAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCCGTCTGTCTCCAGC TTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTGGGAAAACAGGGTTGGCACCAC TCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGCAAGGCT AI821103 GATCCCTTTGCAG^SGAAGCTTTCTCTCAGACCCCCTTCCATTACACCTCTCACCCTGGTA ACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGTTGTGTGGCTGTGATGTCCGT TTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTGGACAATTGTAGAGGCTGTCTCTTCCT CCCTCCTTGTCC?CCCCATAGGGTGTACCCACTGGTCTTGGAAGCACCCATCCTTAATAC GATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTT CCAGAGAAAAAGAGATTTGAGAAAGTGA AI821851 TTTTTTTTTTTTTTTTTTTTCTTTTT(_?CTTTCTCAñATCTCTTTTTCTCTGGAAGGAAG GACTGACTAGGGGC^GCCTGCTGGCTTClATTTTClZ.CACGAC?AAñAAATCLATCGTATTA? GGATGGGTGCTTCCAAAACCAGTGGGTACACCCTATGGGGGGGACAAGGAGGGAGGAAGA ACLAGCCTCTACOATTGTCCACCTACCCAGCTGTC?GCTGAGAAAAATGCTAAACGGACA TClACAGCCACACAACGñATCTGCCCGTTCCCCTCTCCTCAGTCTTCCTGCTGTTACCAGG GTGAGAGGTGTAATGGAAGG AA635855 TTTTTTTTTTTTTTTTTTTTCTTTTTCACTTTCCCAAATCTCTTTTTCTCTGGAAGGAAG GACTGACTAGGGGCAGCCTGCTGGCTTCATTTTCACACGACAGAAAAATCATCGTATTAA GGATGGGTGCTTCCAAGACCAGTGGGTACACCCTATGGGGTGGACACAGGAGGGAGGAAG AGA(^GCCTCTACAATTGTCCACCTACCCAGCTGTCAGCTGAGAAAAATGCTAAACGGAC ATCACAGCCACACAACGAATCTGCCCGTTCCCCTCTCCTCAGTCTTCCTGCTGTTACCAG GGTGAGAGGTGTAATGGAAGG A1420753 GCGGCCGCGGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCTTGGAG AATGCGCCGGCAGGCCCCCC?CCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCG CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC ATC_AGAGAATGAAC_?CAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGT BG180547 CACGCGTCGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGTCCTTCCCAGGC A(^AACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCAC AGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAG GGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGC CCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCT GCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATTGAGCGCACAGGC CTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTGGCGAGTAGTG GGGTCGGTGGCGAGCAGTTGGTGGTGGG AA468306 TCGACCTCGCCAAGGTGAAGAACAACGCTACCCCTTAAGAGATCTCCTTGCCTGGGTGGG AGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCCAGGCTGGGGCC AAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTGGCTGCTGGAC TGTTCCTCAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGA AA468232 TTTTTTACTGGTTATCGTGGTTATTGCCACTGTCAGGATGAATGATTATGACTGGGCCAG GTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCACATAC TGGGTACCCAGGCCGCTCCTGAGGAACAGTCCAGCAG CB050115 GGCCCACCACCAACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCTGCTCGGAG CTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAGAATGCGCC GGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCGCTGGCTTT GCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGACATCAGAGA ATGAAC?(^GAGGC_AGAGGCCCTC1ATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCC GTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAACCTCGTGCC CB050116 GGC1ACGAGGTTC1A<_?GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGC CGGGACTCTGAGAGGGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTA CCTGGGCTCAGTGCCCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCG TGCTGGTCCTTCCTG CCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGA TTGAGCGC AC?GGCCTGAAGTCTGGACL?^CCCGCAGAACCGAAGCTCCGAGCAGCGGGTC GGTGGCGAGTAGTGGGGTCGGTGGCGAGCAGTTGGTGGTGGGCC AA661819 GCTGCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTG GAGAATGCGCCGGCAGCCCCCÁCCCCCAGGCTAAGGTGCAGGAAGGACCAGCACGAACCC GCTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGCACTGAGCCAGGTACAGGACA TC1AGAGAATGAACACAGAGGCAGAGGCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAA GAGCCGTACTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTGGG AAAAC CF146837 CACGAGGATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGA GCTAATTATGAATAAATTTGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACCCC CTTCC?TTAC-ACCTCTC?CCCTGGTAACIAGCAGGAAGACTGAGGAGAGGGGAACGGGCAG ATTCGTTGTGTGGCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTG GACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTG GTCTTGGAAACACCClATCCTTi^ATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGC AGGCTGCCCCTAGTCIAGTCCTTCCTTCCAGAGAA?AAGAGATTTGAGAAAGTGCCTGGGT AATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGT TCTGACC^U^GCAGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTG TAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCCT GTTTTCCC_a.GTCG?CGTAGACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACAGACG GGCTCTTTGCAGAGCCGGGACTCTGAG CF146763 CACGAGGATTTTCTATNCTAGAGCTCTGGTAGAGCACTTTANAAACCGCTTTCATGAATT GAGCTAATTATGAATAAATTTGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACC CCCTTCCATTACACGTCTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGC AGATTCGTTGTGTGGCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGG TGGACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCAC TGGTCTTGGAAACACCC?TCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGÑAGCCA GCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTGAGAA?GTGCCTGGG TAATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGG TTCTGACCAAAGCIAGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTT GTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCC TGTTTTCCCFIGTCCACGTAGACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACAGAC GGGCTCTTTGCAGAGCCGGGACTCTGA CF144902 CACGAGGGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTT GAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCT • TAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAGCATTTGGGATCCCA GTGAAGTAGATGTTTGTAGCCTTGCIATACTTAGCCCTTCC(_AGGC-A<_AAACGGAGTGGCA GAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGAC?GATTCACAGTGCGG_ATTCTGG AAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGGGACATGAGGGCCTC TGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCCCGGTGGGACTCATC TCCTGGGCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGCACCTTA CF141511.1 (.ACGAGGCCTGGTAACAGC?GGAAGACTGAGGAGAGGGGAACGGGCAGATTCGTTGTGTG GCTGTGATGTCCGTTTAGCATTTTTCTGAGCTGACAGCTGGGTAGGTGGACAATTGTAGA GGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTGGTCTTGGAAACA CCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTA GTCAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTA ATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGTTGTGACCAAAGC AGGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATA CTTAGCCCTTCCCAGGC1ACA?ACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTC CACGTAGACAGATTCACAGTGCGGAATTCTGGAA CF139563.1 CACGAGGTCTTCCCTTAATATTTCTGGTGGTTCTGACCA?AGCAGGTCATGGTTTGTTGA GCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGC ACLAAACGGAGTGGCLAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAGACAGATTCAC AGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAG GGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGC CCGGTGGGACTCATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCT GCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATTGAGCGCACAGGC CTGAAGTCTGGACAACCCGCAGAA.CCGAAGCTCCGAGCAGCGGGTCGGTGGCGAGTA CF139372 CIACGAGGATTTCTGGTGGTTCTGACC?AAGCAGGTCATGGTTTGTTGAGCATTTGGGATC CCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTG GCAGAGTGGTGCC^^CCCTGTTTTCGC?GTCCACGTAGACAGATTCACAGTGCGGAATTC TGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGGGACATGAGGGC CTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCCCGGTGGGACTC ATCTCCTGGCCGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGCACCTT CF139319 C?CGAGGAAGGCGATCCCTTTGC?GGGAAGCTTTCTCTCAGACCGCCTTCCATTACACCT CTCLACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGTTGTGTGGC TGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTGGACAATTGTAGAGG CTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTGGTCTTGGAAACACC CATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGT CAGTCCTTCCTTCC?GAGAAAAAG?GATTTGAGAAAGTGCCTGGGTAATTCACCATTAAT TTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAG GTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACT TAGCCCTTCC CF 39275 CACGAGGTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCG CGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTT GGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGC CCACTCCCCTCTGAGCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGC CCCCTTGGATCTGC(__AGGCTCGGCGGAGCCGCCAAAGC_AATGCCACCCATGCCCTGGGGT GCCCCAGGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTACTC CTGCCGAGTGTCGCGGAGCTCGCTGAAACCCTGTGCCCAGGCA CF122893 CACGAGGATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGA GCTAATTATGAATAAATTTGGAAGGCGATCCCTTTGCAGGGAAGCTTTCTCTCAGACCCC CTTCCATTA(_!ACCTCT(_ACCCTGGTAAC?GCAGGAAGACTGAGGAGAGGGGAACGGGCAG ATTCGTTGTGTGGCTGTGATGTCCGTTTAGCATTTTTCTCAGCTGACAGCTGGGTAGGTG GACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCCACCCCATAGGGTGTACCCACTG GTCTTGGAAACACCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGC AGGCTGCCCCTAGTC?GTCCTTCCTTCCLAGAGAAAAAGAGATTTGAGAAAGTGCCTGGGT AATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGT TCTGACC-AAAGC_?GGTCATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTANATGTTTG TAGCCTTGCATACTTAGCCCTT AI972423 C?TTTTCACLACGACTGTAAAATCATCGTATTAAGGATGGGTGCTTCCAAGACCAGTGGGT ACIACCCTATGGGGTGGACAAGGAGGGAGGAAGAGACAGCCTCTACAATTGTCCACCTACC CAGCTGTCIAGCTGAGAAAAATGCTAAACGGACATC^CAGCCACACAACGAATCTGCCCGT TCCCCTCTCCTCAGTCTTCCTGCTGTTACCAGGGTGAGAGGTGTAATGGAAGGGGGTCTG AGAGAAAGCTTCCCTGCAAAGGGATCGCCTTCCAAATTTATTCATAATTAGCTCAATTCA TGAAAGCGGTTTCTAAAGTGCTCTA(^GAGCTCTAGATAGAAAATATGAGGCTAACGATC ATGGC_AGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATGACTG GGCCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATG AI918975 TGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATGACTGGG CCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCCCTGCAC ATACTGGGTACCCAGGCCGCTCCTGAGGAACAGTCCAGCACAGGGTTTCAGCGAGCTCCG GGACACTCGGCCTCGTGC AI826991 TTTTTTTTTTTTTTTTTTTTCTTTTTCACTTTCTCAAATCTCTTTTTCTCTGGAAGGAAG GACTGACTAGGGGCLAGCCTGCTGGCTTCATTTTCAC?CC?C-AAAAAAATCATCGTATTAA GGATGGGTGCTTCCAAAACCAGTGGGTACACCCTATGGGGTGGACAAGGAGGGAGGAAAA AACAGCCTCTAC?^TTGTCCACCTACCC AGCTGTC?GCTGAAZ\AAAATGCTAAACGGACA TCLACAGCCLAC?CA^CGAATCTGCCCGTTCCCCTCTCCTC?GTCTTCCTGCTGTTACCAGG GTGAAAGGTGTAATGGAAGG AI686312 ACCGACCCCACTACTTGCCACCGACCCGCTGCTCGGAGCTTCGGTTCTGCGGGTTGTCCA GACTTC?GGCCTGTGCGCTCAATCGTGGAGAATGCGCCGGCAGGCCCCCCACCCCCAGCC T-^GGTGCAGGAAGGACCAGCACGAACCCGCTGGCTTTGCTGCGCGGCCAGGAGATGAGT CCC?CCGGGCACTGAGCCCAGGTAGñGGAC?TCLAGAGAATGAAC^^ TC_ATGTCCCTCTCAGAGTCCCGGCTCTGCl?AAGAGCCCGTCTGTCTCCAGCTTCCAG_AT TCCGC1ACTGTGAATCTGTCTACGTGGACTGGGAAAACAGGGTTGGCACCACTCTGCCACT CCGTTTGTGCCTGGGAAGGGCTAAGTATGC^AGGCTACAAACATCTACTTCACTGGGATC C AI655923 TTTTTTTTTTTTTTTCCCTGC?AAGGGATCGCCTTCC^ ^TTTATTCATAATTAGCTCAA TTCATGAAAGCGGTTTCTAAAGTGCTCTACAGAGCTCTAGATAGAAAATATGAGGCTAAC GATCATGGCAGCTAGTACTGGTTATCGTGATTATTGCCACTGTCAGGATGAATGATTATG ACTGGGCCAGGTTCTTTGGGAACCCTGGTGGAGTGGGCTGTCACATGGGGTTCCGTCTCC CTGCACATACTGGGTACCCAGGCCGCTCCTGA CF146922 CACGAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCGGCCTGGGTG GGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCTC GGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTTG CTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGCG GCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGAG CCGCCAAAGO^TGCCLACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGTG CCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAAA CCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGAA GAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAG CCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACGC GACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCTGGTGGCTGGA ACAGCCAGATGTGTTGCCA BF476369 GCGGCCGCGGCCCACC1ACC?ACTGCTCGCC?TTCGACCCGACTACTCGCCACCGACCCGC TGCTCGGAGCTTCGGTTCTGCGGGTTGTCCA.GACTTCAGGCCTGTGCGCTCAATCGTGGA GAATGCGCCGGCAGGCCCCCCACCCC(-?GCCTAAGGTGCAGGAAGGACCAGCACGAACCC GCTGGCTTTGCTGCGCGGCC^GGAGATGAGTCCCACCGGGCACTGAGCCCAGGTAC?GGA C?T( GAG2^TGAACA(^GAGGC?GAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGC _ AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACT GGGAAAACAGGGTTGGCACCACTCTGCCACTCC BF057410 GCGGCCGCGGCCC?CCACC^ACTGCTCGCCACCGACCCCACTACTCGCCACCGACCCGCT GCTCGGAGCTTCGGTTCTGCGGGTTGTCCAGACTTCAGGCCTGTGCGCTCAATCGTGGAG AATGCGCCGGCAGGCCCCCCACCCCCAGCCTAAGGTGCAGGAAGGACCAGCACGAACCCG CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGGGCACTGAGCCCAGGTACAGGAC ATCAGAGAATGAAC CLAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTG GGAAAAC^GGGTTGGC?CCACTCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGC AAGGCTAC^AAC TCTACTTC_ACTGGGATCCaAATGCTC2^CAAACCATGACCTGCTNT GGTCAGAACCACCAGAAATATTAA BE645544 GCGGCCGCGGCCCACCACC^CTGCTCGCCACCGACCCCaCTACTCGCCACCGACCCGCT GCTCGGAGCTTCGGTTCTGCGGGTTGTCC?GACTTC.AGGCCTGTGCGCTCAATCGTGGAG AATGCGCCGGCAGGCCCCCC?CCCCCAGCCTAAGGTGC_AGGAAGGACCAGCACGA?_CCCG CTGGCTTTGCTGCGCGGCCAGGAGATGAGTCCCACCGKK3CACTG?GCCC-AGGTACAGGAC AT(^GAGAATGAACa(^*_GAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCA AAGAGCCCGTCTGTCTCCAGCTTCCAGAATTCCGCACTGTGAATCTGTCTACGTGGACTG GGAÍ^AACAGGGTTGGCACCACTCTGCCACTCCGTTTGTGCCTGGGAAGGGCTAAGTATGC AAGGCTACAAACATCTACTTCACTGGGATCC BE645408. TCCTCCCTCTAAGAAAGGCGCAAGCGTCAAGAGGGTGCTGCCCGCTGGTTTCTGCAAATG CTGCCTTCCAAAAAGGACCTGGTGGGTTCTGTTCTCCCTGGCAACACATCTGGCTGTTCC AGCC1ACCIAGCGAGAGCCCAAGACTGGTAACTGTCCACAGGCAACAGGGAGTCATGTCGCG GTTCTCCLAGGAGCIACCCAGAGTCTGCACCAC?GACACGT BE388501 TTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTC CTTCCTTCC?GAGAAA?AGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCT CCCCCAAACTCTCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCAT GGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCC CTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAACCCTGTTTTCCCAGTCCACGTAG ACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGG ACTCTGAGAGGGACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTG GGCTCIAGTGCCCGGTGGGACTCIATCTCCTGGCCGCGCIAGCAAAGCCAGCGGGTTCGTGCT GGTCCTTCCTGCACCTTAGGCTGGGGGTGGGGGGCCTGCCGGCGCATTGTCCACGATTGA GCGCACAGGCCTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTG GCGAGTAGTGGGGGTCGGTGGCGAACAAGTGGTGGTGGGCCGGGGCCGCATAACTCGAGG ACTTTCCTCCCGGAGCAGTCCCTAAAAACCCGGGGGCGC CF147366 GACGAGGACAATTGTAGAGGCTGTCTCTTCCTCCCTCCTTGTCACCCCATAGGGTGTACC ACTGGTCTTGGAAGCACCCATCCTTAATACGATGATTTTTCTGTCGTGTGAAAATGAAGC CAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAGAGAAAAAGAGATTTGAGAAAGTGCCT GGGTAATTCACCATTAATTTCCTCCCCCAAACTCTCTGAGTCTTCGCTTAATATTTCTGG TGGTTCTGACCSAAGCAGGTCIATGGTTTGTTGAGCATTTGGGATCCCAGTGAAGTAGATG TTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCACAAACGGAGTGGCAGAGTGGTGCCAA CCCTGTTTTCCCAGTCCACGTAGACAGATTCACAGTGCGGAATTCTGGAAGCTGGAGACA GACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGGGACATGAGGGCCTCTGCCTCTGTGTT CATTCTCTGATGTCCTGTACCTGGGCTCAGTGCCCGGTGGGACTCATCTCCTGGCCGCGC AGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGC CF147143 CACGAGGCGACTTGCGAGCTGGGAGCGATTTAAAACGCTTTGGATTCCCCCGGCCTGGGT GGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCCT CGGCTCCATGGAGCCCGGCA?TTATGCCACCTTGGATGGAGCCAAGGATATCGAAGGCTT GCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAGC GGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGGA GCCGCC_?y^GCaATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCGT GCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGAA ACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGGA AGAGTACCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACCAG CCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAACGC GACATGACTCCCTGTTGCCTGTGGACAGTTACCAATCTTGGGCTCTCGCTGGTGGCTGGA ACAGCCAGATGTGTTGCCAGGGAG BT007410 atggagcccg gcaattatgc caccttggat ggagccaagg atatcgaagg cttgctggga gcgggagggg ggcggaatct ggtcgcccac tcccctctga ccagccaccc agcggcgcct acgctgatgc ctgctgtcaa ctatgccccc ttggatctgc caggctcggc ggagccgcca aagcaatgcc acccatgccc tggggtgccc caggggacgt ccccagctcc cgtgccttat ggttactttg gaggcgggta ctactcstgc cgagtgtccc ggagctcgct gaaaccctgt gcccaggcag ccaccctggc cgsgtacccs gcggagactc ccacggccgg ggaagagtac cccagccgcc ccactgagtt tgccttctat ccgggatatc sgggaaccta ccagcctatg gccagttasc tggacgtgtc tgtggtgcag actctgggtg ctcctggaga accgcgacat gactccctgt tgcctgtgga cagttaccag tcttgggctc tcgctggtgg ctggaacagc cagatgtgtt gccagggaga acagaaccca ccaggtccct tttggaaggc agcatttgca gactccagcg ggcagcaccc tcctgacgcc tgcgcctttc gtcgcggccg caagaaacgc attcsgtaca gcaaggggca gttgcgggag ctggagcggg agtatgcggc taacaagttc atcascaagg acaagaggcg caagatctcg gcagccacca gcctctcgga gcgccagatt accatctggt ttcagaaccg ccgggtcaaa gagaagaagg ttctcgccaa ggtgaagaac agcgctaccc cttag BC007092 ggattccccc ggcctgggtg gggagagcga gctgggtgcc ccctagattc cccgcccccg cacctcatga gccgaccctc ggctccatgg agcccggcaa ttatgccacs ttggatggag ccaaggatat cgaaggcttg ctgggagcgg gaggggggcg gaatctggtc gcccactccc ctctgaccag ccacccagcg gcgcctacgc tgatgcctgc tgtcaactat gcccccttgg atctgccagg ctcggcggag ccgccaaagc aatgccaccc atgccctggg gtgccccagg ggacgtcscs agctcccgtg ccttatggtt actttggagg cgggtactac tcctgccgag tgtcccggag ctcgctgaaa ccctgtgcsc aggcagccac cctggccgcg taccccgcgg agactcssas ggccggggaa gagtacccca gccgccccac tgagtttgcc ttctatccgg gatatccggg aacctaccag cctatggcca gttacctgga cgtgtctgtg gtgcagactc tgggtgctcc tggagaaccg cgacatgact ccctgttgsc tgtggacagt taccagtctt gggctctcgc tggtggctgg aacagccaga tgtgttgcca gggagaacag aasccaccag gtcccttttg gaaggcagca tttgcagact ccagcgggca gcaccctcct gacgcctgcg cctttcgtcg cggscgcaag aaacgcattc cgtacagcaa ggggsagttg cgggagstgg agcgggagta tgcggctaac aagttsatca ccaaggacaa gaggcgcaag atctcggcag ccaccagcct ctcggagcgc cagattacca tctggtttca gaaccgccgg gtcaaagaga agaaggttct cgscaaggtg aagaacagcg ctacccctta agagatctcc ttgcctgggt gggaggagcg aaagtggggg tgtcctgggg agaccaggaa cctgccaagc ccaggctggg gccaaggact ctgctgagag gcccctagag acaacaccct tcccaggcca ctggctgctg gactgttcct caggagcggc stgggtaccc agtatgtgca gggagacgga accccatgtg acagcccact ccaccagggt tcccaaagaa cctggcccag tcataatcat tcatcctgac agtggcaata atcacgataa scagtactag ctgccatgat cgttagcctc atattttcta tctagagctc tgtagagcac tttagaaacc gctttcatga attgagctaa ttatgaataa atttggaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa U57052 cgggtgsccc ctagattccc cgcccccgca cctcatgagc cgaccctcgg ctccatggag cccggcaatt atgccacctt ggatggagcc aaggatatcg aaggcttgct gggagcggga ggggggcgga atctggtcgc ccactcccct ctgaccagcc acccagcggc gcctacgctg atgcctgctg tcaactatgc ccccttggat ctgccaggct cggcggagcc gccaaagcaa tgccacccat gccctggggt gccccagggg acgtccccag ctcccgtgcc ttatggttac tttggaggcg ggtactactc ctgccgagtg tcccggagct cgctgaaacc ctgtgcccag gcagccaccc tggccgcgta ccccgcggag actcscasgg ccggggaaga gtaccccagc cgccccactg agtttgcctt ctatccggga tatccgggaa cctacsacgc tatggccagt tacctggacg tgtctgtggt gcagactctg ggtgctcctg gagaaccgcg acatgactcc ctgttgcctg tggacagtta ccagtcttgg gctctcgctg gtggctggaa cagccagatg tgttgccagg gagaacagaa cccaccaggt cccttttgga aggcagcatt tgcagactcc agcgggcagc accctcctga cgcctccgcc tttcgtcgcg gccgcaagaa acgcattccg tacagcaagg ggcagttgcg ggagctggag cgggagtatg cggctaacaa gttcatcace aaggacaaga ggcgcaagat ctcggcagcc accagcctct cggagcgcca gattaccatc tggtttcaga accgccgggt caaagagaag aaggttctcg ccaaggtgaa gaacagcgct accccttaag agatctcctt gcctgggtgg gaggagcgaa agtgggggtg tcctggggag accaggaacc tgccaagccc aggctggggc caaggactct gctgagaggc ccctagagac aacacc U81599 tectaataeg actcastata gggctcgagc ggccgcscgg gcaggtcgaa tgcaggcgac ttgcgagctg ggagcgattt aaaacgcttt ggattccccc ggcctgggtg gggagagcga gctgggtgcc ccctagattc cccgcccccg cacctcatga gccgaccctc ggctccatgg agcccggcaa ttatgccacc ttggatggag ccaaggatat cgaaggcttg ctgggagcgg gaggggggcg gaatctggtc gcccactccc ctctgaccag ccacccagcg gcgcctacgc tgatgcctgc tgtcaactat gcccccttgg atctgccagg ctcggcggag ccgccaaagc aatgccaccc atgccctggg gtgccccagg ggacgtcccc agctcccgtg ccttatggtt actttggagg cgggtactac tcctgccgag tgtcccggag ctcgctgaaa ccctgtgccc aggcagccac cctggccgcg taccscgsgg agactcccac ggccggggaa gagtacccca gtcgccccac tgagtttgcc ttctatccgg gatatccggg aacctaccac gctatggcca gttacctgga cgtgtctgtg gtgeagaetc tgggtgctcc tggagaaccg cgacatgact ccctgttgcc tgtggacagt taccagtctt gggctctcgc tggtggctgg aacagccaga tgtgttgcca gggagaacag aacccaccag gtcccttttg gaaggcagca tttgcagact ccagcgggca gcaccctcet gacgcctgcg cctttcgtcg cggccgcaag aaaegeatte cgtacagcaa ggggcagttg cgggagctgg agcgggagta tgcggctaac aagttcatca ccaaggacaa gaggcgcaag atctsggcag ccaccagcct ctcggagcgc cagattacca tctggtttca gaaccgccgg gtcaaagaga agaaggttct cgccaaggtg aagaacagcg ctacccctta agagatetec ttgcctgggt gggaggagcg aaagtggggg tgtcctgggg agaccagaaa cctgccaagc ccaggctggg gccaaggact ctgctgagag gcccctagag acaacaccct tcccaggcc'a ctggctgctg gactgttcct caggagcggc ctgggtaccc agtatgtgca gggagacgga accccatgtg acaggcccac tccaccaggg ttcccaaaga acctggccca gtcataatca ttcatcctca cagtggcaat aatcaegata accagt CB20119 ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAG (.ATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA C?AACGGAGTGGCAGAGTGGTGCC^CCCTGTTTTCCC-AGTCCIACGTAGACAGATTCACA GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG GACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTG CACCTTAGGCTGGGGGTGGGGGGCCT CB125764 ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAG CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA CAAACGGAGTGGCLAGAGTGGTGCC^_CCCTGTTTTCCCAGTCCACGTAGACAGATTCACA GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG GACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTG CACCTTAGGCTGGGGGTGGGGGGGGCCTGCCGGCGCATTCTCCACGATTGAGCGCACAGG CCTGAAGTCTGGACAACCCGCAGAACCGAAGCTCCGAGCAGCGGGTCGGTGGCGAGT AU098628 ATTTAAAACGCTTTGGATTCTTTCGTCCTGCGTGGGGAGAGCGAGCTGGGTGCCCCCTAG ATTCCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCACTTATGC CACCTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCT GGTCGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAA TTATGCCCCCTTGCATCTGCCAGGCTCGGCGGAGCCGC(^AAGCAATGCC?-CCCATGCCC CB126130 ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG AGAAAAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAGGTCATGGTTTGTTGAG CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA CL?y _CGGAGTGGCLAGAGTGGTGCC^^CCCTGTTTTCCCAGTCClACGTAGAC?GATTCACA GTGCGGAATTCTGGAAGCTGGAGACAGACGGGGTCTTTGCAGAGCCGGGACTCTGAGAGG GACATGAGGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTG CACCTTAGGCTGGGGGTGGGGGGCCTGC BI023924 AGGCCGCACCCLAGTCTTAAGGTGC_? GTGAAGGACAGCACGI ACCCGCTGTGCTTTGCTGC GCGGCL?IGGAGATGAGTCC(_ACCGGGCLACTGAGCCCLAGGTAC?GGAC?TC_AGAGAATGAAC ACAGAGGCAGAGGCCCTCATGTCCCTCTCAGAGTCCCGGCTCTGCAAAGAGCCCGTCTGT CTCCIAGCTTCCAGAATTCCGC?CTGTGAATCTGTCTACGTGGACTGNGAAAACAGGGTTG GC?CCACTCTGCCACTCCGTTTGTGCCTNGGGGCGGGCAGAGGG BM767063.1 AAAACGCTTTGGATTCCCCCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATT CCCCGCCCCCGCACCTCATGAGCCGACCCTCGGCTCCATGGAGCCCGGCA?TTATGCCAC CTTGGATGGAGCCAAGGATATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGT CGCCCACTCCCCTCTGACCAGCCACCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTA TGCCCCCTTGGATCTGCCAGGCTCGGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGG GGTGCGCCAGGGGACGTCCCCAGCTCCCGTGCCTTATGGTTACTTTGGAGGCGGGTACTA CTCCTGCCGAGTGTCCCGGAGCTCGCTGAAACCCTGTGCCCAGGCAGCCACCCTGGCCGC GTACCCCGCGGAGACTCCCACGGCCGGGGAAGAGTACCCCAGCCGCCCCACTGAGTTTGC CTTCTATCCGGGATATCCGGGAACCTACCAGCCTATGGCCAGTTACCTGGACGTGTCTGT GGTG1.1AGACTCTGGGTGCTCCTGGAGAACCGCGACATGACTCCCTGTTGCCTGTGGACAG TTACCAGTCTTGGGCTCTCGCTGGTGGCTGGAACAGCCAGATGTGTTGCCA BM794275 GCAGACTCTGGGTGCTCCTGGAGAACCGCGACGTGACTCCCTGTTGCCTGTGGACAGTTA CC?CTCTTGGGCTCTCGCTGGTGGCTGGAAC?GCCAGATGTGTTGCCAGGGAGAACAGAA CCC1ACC1AGGTCCCTTTTGGAAGGC_AGCATTTGCL?-GACTCCI?_GCGGGCAGCACCCTCCTGA CGCCTGCGCCTTTCGTCGCGGCCGCAAGAAACGCATTCCGTACAGCAAGGGGCAGTTGCG GGAGCTGGAGCGGGAGTATGCGGCTAACAAGTTCATCACCAAGGACAAGAGGCGCAAGAT CTCGGCAGCCACCAGCCTCTCGGAGCGCCAGATTACCATCTGGTTTCAGAACCGCCGGGT CÑAAGAGAAGAAGGTTCTCGC?^GGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTT GCCTGGGTGGGAGGATCTAAAGTGGGGGTGTCCTGGGGAGACCAGGAACCTGCCAAGCCC AGGCTGGGGCCAAGGACT BQ363211 ACGCTGCACTGCGTTTCAAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCC CTTAAGAGATCTCCTTGCTTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCA GGAACCTGCCATC1ACCAGGCTGGGCCCAAGGACTCTGCTGAGAGGCCCCTAGAGACA?CA CCCTTCCCAGGCCATTGCTTGCTGGACTGTGCCTCAGGAGCGGCCTGGGTACC BM932052 GAGTTTTCCAATTTCCAAAGAAAAATTTAGGTTTCCTGCAGCCGTGACATATGTGTGTGC ACTGGGATGGGTTAATGTGTGTGTGTGTGTGTGTATGCGCATGTATTGGGAGTGGGGGCA GAAACGTGTTTC(_LAGA?TTTGCCTGTAGAATCTA?AAGAGTGGCCAAGAGTCTGGA?ATG CATGAAGACTGGACGTATGTGATGGTGGGCAAAGGCCTGACTGTGTGTGGTGTGTGGGTA TGTTTGCAGATTCGCGGGTGTGAGAGCAGTGATGGGTGAGGGTGGCCTTCAGGAGCCAAG GCTGATCGGTGGTGAGAGAACAAGCCGGAAGCCAGGGTGCTGTCCTGGTATGCTTTGGAG GAACAGGATTGCACGTGCGCCTGTAGGGTGACCTGTGTGCACCTGTGAGATGACTTAGCT TGGGGCTTGCAAGGCCTGGGTCTGCATGGGTGGGTATCTGACCATGCCTTTTCCTCCCTC GCTTTCACGCCGCGCAGACTCCAGCGGGCAGCACCCTCCTGACGCCTGCGCCTTTCGTC AA357646.1 CCGGCCTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCAT GAGCCGACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGAT ATCGAAGGCTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACC AGCCACCCAGCGGCGCCTACGCTTGATGCCTGCTTGTCAACTATGCCCCCTTGGATCTGC AW609525 ACCGCGGGTCAAATTTATTCATAATTAGCTCAATCATGAAAGCGGTTCTAAAGTGCTCTA CAGAGCTCTAGATAGAAAATATGAGGCTAACGATCATGGCAGCTAGTACTGGTTATCGTG ATTATGGCCACTGTCAGGATGAATGATAATGACTGGGCCAGGTCCTTTGGAAACCCTGGT GGAGTGGGCTGTCLACIATGGGGTCCCGTCTCCCTGCA(--ATACTGGGTACCCAGGCCGCTCC TGAGGAACAGTCCAGCAGCCAGTGGCCTGGGAAGGGTGTGGTCTCTAGGGGCCTCTCAGC AGAGTCCTTGGCCCC?GCCTGGGCTTGGCAGGTCCCTGGTCTCCCCAGGAC CCCCCACT TTCGCTCCTCCCACCC?GGC?AGGAGATCTCTTAAGGGGTAGCGCTGTTCTTCACCTTGG CGAGAACCTTCTTCTCTTTGAACCGGCGGTGCGGCGTGGGGTACCGAGC CB126919 ATTTTTCTGTCGTGTGAAAATGAAGCCAGCAGGCTGCCCCTAGTCAGTCCTTCCTTCCAG AGA?AAAGAGATTTGAGAAAGTGCCTGGGTAATTCACCATTAATTTCCTCCCCCAAACTC TCTGAGTCTTCCCTTAATATTTCTGGTGGTTCTGACCAAAGCAAGTCATGGTTTGTTGAG CATTTGGGATCCCAGTGAAGTAGATGTTTGTAGCCTTGCATACTTAGCCCTTCCCAGGCA CAAACGGAGTGGCL?\GAGTGGTGCCAACCCTGTTTTCCC-AGTCC_ACGTAGACAGATTC_ACA GTGCGGAATTCTGGAAGCTGGAGACAGACGGGCTCTTTGCAGAGCCGGGACTCTGAGAGG GACATGAAGGCCTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGGGCTCAGTGCC CGGTGGGACTCATCTCCTGGCTGCGCAGCAAAGCCAGCGGGTTCGTGCTGGT AW609336 CCAACGAGAAGAAGGTTCTCGCAAGGTGAAGAACAGCGCTACCCCTTAAGAGATCTCCTT GCGTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCIAGGAACCTGCCAGCGCA GGCTGAGGCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACACCCTTCCCAGGCCACTG GATGCTGAACTGTCCCTCAGGAGCGGCCTGGGTACCCAGTATGTGCAGGGAGACGGAACC C(_ATGTGACAGCCCACTCC^CCAGGGTTCCCAAAGAACCTGGCCCCAGTClñ.TAATCATTC ATCCTGJ_(^GTGGCaATAATCLACGATAAC(^GTACTAGCTGC(_?TGATCGTAAGCCTCAT ATTTGCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATTGAGCTAATT ATGACTCAATTTGAACCGGCGTCCGGCGTG AW609244 ACGCGC ACCGCGGTCAAGAGAAGAAGGTTCTCGCAAGGTGAAGAACAGCGCTACCCCTTA AGAGATCTCCTTGCGTGGGTGGGAGGAGCGAAAGTGGGGGTGTCCTGGGGAGACCAGGAA CCTGCCAAGCCCLAGGCTGTGGCC^^GGACTCTGCTGAGAGGCCCCTATGAGACAAC?CCC TTCCCAGGCCACTGGCTGCTGGGACTGTTCCTCAGGAGCGGCCTGGGTACCCGAGTAATG TGCAGGGGAGACGGAACCCC?TGTGACAGCCCL?_CTCCACCAGGGTTCCCAAAAGAACCCT GGCCCL?_GT(?TAATClATTClATCCTGACAGTGGC^_TAATa_CGATAACCAGTACTAGCTG CCATGATCGTAAGCCTCATATTTGCTATCTAGAGCTCTGTAGAGCCCTTTAGAAACCGCT TTCATGAATGGAGCTAAATTATGAATACATTTGAACCGGCGATCCGACGTGA BF855145 CTAGAGGATCCCGGAAGCAACTGC?ACAGGTTCCC^^G?ACCGGGCCAGTCATAATCAT T(_L?_TCCTGAC?GGGCLAATAAT(_?CGATAACCAGTACTAGCTGCCATGATCGTTAGCCTCA TATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTCATGAATGGAGCTAAT TATGAATAAATTTGGAAGGCGATCCCTTGGCAGGGAAGCTTTCTCTCAGACCCCCTTCCA TTACACCTCTCACCCTGGTAACAGCAGGAAGACTGAGGAGAGGGGAACGGGCAGATTCGT GGTGTTGCAGTGTGCTTCCG AU126914 GAGCGAATGC_AGGCGACTTGCGAGCTGKAGCGATTTAAAACGCTTTGGATTCCCCCGGC CTGGGTGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCC GACCCTCGGCTCCATGGAGCCCGGCAATTATGCCACCTTGGATGGAGCCAAGGATATCGA AGACTTGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCC(_?CTCCCCTCTGAC(_LAGCCA CCCAGCGGCGCCTACGCTGATGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTC GGCGGAGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGC TCCCGTGCCTTATGGTTACTTTGGAGGCGGGTNCTACTCCTGCCGAGTGTCCCGGAGCTC GCTGAAACCCTGTGCCCANNCñlTCCACCCTGGCCGCGTN CB126449 CTCTGCCTCTGTGTTCATTCTCTGATGTCCTGTACCTGTGCTCAGTGCCCGGTGGGACTC ATCTCCTGGCTGCGC1AGCAAAGCCAGCGGGTTCGTGCTGGTCCTTCCTGCACCTTCGGCT GGGGGTGGGGGGCCTGCCGGCGCATTCTCCACGATT AW582404 ACGCTGC ACCGCCGGTCCAAGAGAAGAAGGTTCTCGCCAAGGTGAAGAACAGCGCTACCC CTTTAAGAGATCTCCTTGCTGGGGTGGGAGGAGCGAAAGTGGGGGTGTCTGGGGAGACCA GGAACCTGCC1?GCCCCL?GGCTGGGCCCAAGGACTCTGCTGAGAGGCCCCTAGAGACAACA CCCTTCCCAGGCCACTGTCTGGTGGACTGTTCCTCAGGAGCGGCCTGGGTACKrCAGTATG TGCAGGGAGACGGAACCCCATGTGACl?-GCCCl?_CTCC?CC_?_GGGTTCCCAAAGAACCTGGC CCAGTCATAATC_ATTC_ATCCTGAC-AGTGGCAATAATCACGATAACCAGTACTAGCTGCCA TGATCGTTAGCCTCATATTTTCTATCTAGAGCTCTGTAGAGCACTTTAGAAACCGCTTTC ATGAATTGAGCTACTTATGAATCACTTTGAAGCGGCGGTGCGGCGTG BX641644 GGGGGAGAGCGAGCTGGGTGCCCCCTAGATTCCCCGCCCCCGCACCTCATGAGCCGACCC TCGGCTCCATGGAGCCCGGC?ATTATGCCACCTTGGATGGAGCCAAGGATATCGA?GGCT TGCTGGGAGCGGGAGGGGGGCGGAATCTGGTCGCCCACTCCCCTCTGACCAGCCACCCAG CGGCGCCTACGCTGACGCCTGCTGTCAACTATGCCCCCTTGGATCTGCCAGGCTCGGCGG AGCCGCCAAAGCAATGCCACCCATGCCCTGGGGTGCCCCAGGGGACGTCCCCAGCTCCCG TGCCTTATGGTTACTTTGGAGGCGGGTACTACTCCTGCCGAGTGTCCCGGAGCTCGCTGA AACCCTGTGCCCAGGCAGCCACCCTGGCCGCGTACCCCGCGGAGACTCCCACGGCCGGGG AAGAGTACCCCAGCCGCCCCACTGAGTTTGCCTTCTATCCGGGATATCCGGGAACCTACC AGCCTATGGCCAGTTACCTGGACGTGTCTGTGGTGCAGACTCTGGGTGCTCCTGGAGAAC CGCGACATGACTCCCTGTTGCCTGTGGACAGTTACCAGTCTTGGGCTCTCGCT GTGGCT GGAACIAGCCIAGATGTGTTGCCAGGGAGAACAGAACCCACCAGGTCCCTTTTGGAAGGGAG CATTTG Secuencias de la Tabla 4 no divulgadas anteriormente AW006861 (IMAGE Clon ID: :2497262) GCTGAGTTCTGAAGCTTCTGAGTTCTGCAGCCTCACCTCTGAGAAAACCTCTTTTCCACC AATACCATGAAGCTCTGCGTGACTGTCCTGTCTCTCCTCATGCTAGTAGCTGCCTTCTGC TCTCTAGCGCTCTCAGCACCAATGGGCTCAGACCCTCCCACCGCCTGCTGCTTTTCTTAC ACCGCGAGGAAGCTTCCTCGCAACTTTGTGGTAGATTACTATGAGACCAGCAGCCTCTGC TCCC^GCÍ^GCTGTGGTATTCCAAACCAAAAGAAGCAAGCAAGTCTGTGCTGATCCCAGT GAATCCTGGGTCC?GGAGTACGTGTATGACCTGGAACTGAACTGAGCTGCTCAGAGACAG GAAGTCTTC?GGGAAGGTC?CCTGAGCCCGGATGCTTCTCCATGAGACACATCTCCTCCA TACTCAGGACTCCTCTCCGCAGTTCCTGTCCCTTCTCTTAATTTAATCTTTTTTATGTGC CGTGTTATTGTATTAGGTGTCATTTCCATTATTTATATTAGTTTAGCCAAAGGATAAGTG TCCCCTATGGGGATGGTC?CTGTCACTGTTTCTCTGCTGTTG?^ATACATGGATAACA CIATTTGATTCTGTGTGTTTTC-ATAATAAAACTTTAAAATAAAATGCAAAAAAAAAAAAAA AAAA X59770 GCCACGTGCTGCTGGGTCTCAGTCCTCCACTTCCCGTGTCCTCTGGAAGTTGTCAGGAGC AATGTTGCGCTTGTACGTGTTGGTAATGGGAGTTTCTGCCTTCACCCTTCAGCCTGCGGC A<_?CLA(_a.GGGGCTGCCAGAAGCTGCCG^TTTCGTGGGAGGC_ATTAC_AAGCGGGAGTTCAG GCTGGAAGGGGAGCCTGTAGCCCTGAGGTGCCCCCAGGTGCCCTACTGGTTGTGGGCCTC TGTCAGCCCCCGC1ATC?_AGCTGA(^TGG 1ATAAAAATGACTCTGCTAGGACGGTCCCL?_GG AGAAGAAGAGACACGGATGTGGGCCCAGGACGGTGCTCTGTGGCTTCTGCCAGCCTTGCA GGAGGACTCTGGCACCTACGTCTGCACTACTAGAAATGCTTCTTACTGTGACAAAATGTC CATTGAGCTC?GAGTTTTTGAGAATAC?GATGCTTTCCTGCCGTTCATCTCATACCCGCA AATTTTAACCTTGTCAACCTCTGGGGTATTAGTATGCCCTGACCTGAGTGAATTCACCCG TGACAAAACTGACGTGAAGATTCAATGGTACAAGGATTCTCTTCTTTTGGATAAAGACA? TGAGAAATTTCTAAGTGTGAGGGGGACCACTCACTTACTCGTACACGATGTGGCCCTGGA AGATGCTGGCTATTACCGCTGTGTCCTGACLATTTGCCCLATGAAGGCCAGC-?VA(^^CA.T (^CTAGGAGTATTGAGCTACGCATC^^GAAAAAAAAAGAAGAGACCATTCCTGTGATCAT TTCCCCCCTCAAGACCATATCAGCTTCTCTGGGGTCAAGACTGACAATCCCGTGTAAGGT GTTTCTGGGAACCGGCACACCCTTAACCACCATGCTGTGGTGGACGGCCAATGACACCCA CATAGAGAGCGCCTACCCGGGAGGCCGCGTGACCGAGGGGCCACGCCAGGAATATTCAGA AAATAATGAGAACTACATTGAAGTGCCATTGATTTTTGATCCTGTCACAAGAGAGGATTT GC?CATGGATTTTAAATGTGTTGTCCATAATACCCTGAGTTTTCAGACACTACGCACCAC AGTCAAGGAAGCCTCCTCC?CGTTCTCCTGGGGCATTGTGCTGGCCCCACTTTCACTGGC CTTCTTGGTTTTGGGGGGAATATGGATGC1?CAGACGGTGCAAACACAGAACTGGAAAAGC AGATGGTCTGACTGTGCTATGGCCTC?TCATCAAGACTTTCAATCCTATCCCAAGTGA?A TAAATGGI^TGAAATAATTCAAACLA?SAAAAAAAAAAA?AAA?AAAAA AB000520 GGATCCAAGCTATTGTCCTGCCCATGGCTTCCCATCTCAGGACGCTCTCTGGCCGCTATC ATCCCAG(_AGTGGAGTTC?_GCCCACTACTCTGAACCAGCCGCAGGTGGCTGCTATGGGAC TG3AAGCCATGAATGGTGCCGGCCCTGGCCCCGCCGCAGCCGCCCCGGTCCCAGTCCCGGT CCCGGTCCCGGACTGGCGGCAGTTCTGCGAGCTGCATGCGCAGGCGGCCGCCGTGGACTT TGCGCAC_AGTTCTGCCGTTTCCTGCGGGACAACCCAGCTTACGACACGCCCGACGCCGG CGCCTCCTTCTCCCGCCACTTCGCCGCCAACTTCCTGGACGTCTTCGGCGAGGAGGTGCG CCGCGTGCTGGTGGCTGGGCCGACGACTCGGGGCGCGGCCGTGAGCGCAGAGGCCATGGA GCCGGAGCTCGCGGACACCTCTGCACTCAAGGCGGCGTCCTACGGCCACTCGCGGAGCTC GGAGGACGTGTCCACGCACGCGGCCACCAAGGCCCGCGTTCGCAAGGGCTTCTCGCTGCG CAACATGAGCCTGTGCGTGGTGGACGGCGTGCGCGACATGTGGCACCGGCGCGCCTCGCC CGAGCCCGACGCGGCAGCTGCCCCGCGCACCGCCGAGCCCCGCGACAAGTGGACGCGGCG CCTGÁGGCTGTCGCGGACGCTGGCTGCCAAGGTGGAGCTGGTGGACATTCAACGCGAGGG GGCGCTGCGCTTCATGGTGGCCGACGACGCGGCCGCGGGCTCCGGGGGCTCGGCTCAGTG GCAGAAGTGCCGCCTGCTCCTGCGCAGGGCTGTGGCCGAGGAACGCTTCCGCCTGGAGTT CTTCGTGCCGCCCAAAGCCTCC?GGCCCAAGGTCLAGC-ATCCCLACTGTC_AGCC-ARC_ATTGA GGTCCGCLACC_ACC?TGCCCCTGGÑAATGCC?GAGAAGGATAACACATTCGTCCTCAAGGT AGAGAATGGAGCCGAATACATCTTGGAGACCATCGACTCTCTGCAGA?GCACTCGTGGGT AGCTGACIATCCAGGGCTGCGTGGACCCCGGTGAC?GTGAGGAAGACACCGAGCTCTCCTG TACCCGAGGAGGCTGTCTGGCCAGCCGCGTGGCCTCCTGCAGCTGTGAGCTCCTGACTGA TGCIAGTCGACCTGCCCCGCCCCCCAGAGACGACAGCCGTGGGTGCAGTGGTGACAGCCCC CCACAGCCGAGGTCGAGATGCCGTCAGAGAATCCCTGATCCACGTCCCGCTAGAGACCTT TCTGCAGACCCTGGAATCCCCGGGCGGCLAGCGGC?GTGAI-A^ GGGTGCAGAGACGGATCCCGAGGCTGAACCCGAGCTGGAGCTATCCGACTACCCATGGTT CCACGGGAC?CTGTCCCGGGTCAAGGCTGCTCAACTGGTTCTGGCAGGGGGGCCCCGGAA CCACGGCCTCTTCGTGATCCGCCAAAGTGAGACTCGGCCTGGGGAGTACGTGCTGACCTT CAACTTCCIAGGGCAAGGCC?AGI^CCTGCGCCTGTCCCTGAACGGCCLACGGCC-AGTGTCA CGTACAGCATCTGTGGTTCCAGTCTGTGCTTGACATGCTCCGCCACTTCCACACACACCC <__ATCCCACTGGAGTCAGGGGGCTCGGCCGACATCACCCTTCGCAGCTATGTGCGGGCCCA GGACCCCCCACCAGAGCCGGGCCCCACGCCCCCTGCCGCGCCCGCGTCCCCGGCCTGCTG GAGCGACTCGCCCGGCCAGCACTACTTCTCCAGCCTCGCCGCGGCCGCCTGCCCGCCTGC CTCGCCCTCCGACGCCGCCGGCGCCTCCTCGTCTTCCGCCTCGTCGTCCTCTGCCGCGTC GGGGCCCGCCCCCCCGCGCCCCGTCGAGGGCCAGCTCAGCGCGCGGAGCCGCAGCAACAG CGCCGAGCGCCTGCTGGAGGCCGTGGCCGCCACCGCCGCCGAGGAGCCCCCGGAGGCCGC GCCCGGCCGCGCGCGCGCCGTGGAGAACCAGTACTCCTTCTACTAGCCCGCGGCGCCGCC CGGGTGGGAC ACGCCAAGCTCTTC?GTGAAGACACGATGTTATTAAAAGCCTGTTTTAGG GACTGCAA&A AI820604 (IMAGE Clon Id: 1605108 GATTC(^C?CGGGCTTCGCKGACTGC_AGGACAC_AGA CTAAGGAATTTGAACACTGTTGAGAAGACTGTGTACAAGAGAGATGTGCCATGTCAGCCT TGO^GGGACAGCGTGAÑAACTACCC_ATCTCCGGTCAC?S_AGTTGCAGGAGGCCAGGAGC C?GGAGGGGAAACCGCTCAGTTTGC^AAACGTCGCTTCC?C_AAGCCTGATGGCTGAAACT GCTCACTGTACCCTGAAACCAGCTTTACCTACAGCTTCTGAGATAAACTGCTGCAACTCT GGGACCCACGATGCCTATCACAGTGGCTCATCAATGGAACCTGCCGGCTCCCAACCCTTC CTAGGGCCCATGAACTCTCTGAAAAGAGGAACAGAAATATTTCTCCTTTTTGTAAAATCT TTAACCTTCCCTTTGTTCTTI^TGTAC?CGCTGAACTGCLFTATTCTTCTTCCCAAATAAAA CATTAAATTTAAAAAA AI087057 (IMAGE Clon 1D.1671188) GGCCCCGGAGGGAGAGTAACCCGGCCCATCCATCCGTCGCCCGGTTCTTGGGGAACTACT TTCAGGGGCTTCTTGCCGTCCCCTCATCAGCTCTGTGCGAACCCTCTGTCGGCAGCCATT GAGGAGACCCTGCCCCCTGGACCCTGACCACATATAGATTGAGGCCGAGGAGTGGCTGCC CTGTCCCTTTTATGAC?GCCCGC^GAAGCCCCGGGGTGAG3CATGGAGGAGGCAGGCGAC AGCTGAC?GGGACCCTGTTGGCCTCCAGCATGTCCAGCCAGCCGGGCAGGATTTCTCTGC TTCTGGCTGGC1AGCC1AGGAACTGAGTATGACAATGTTGTACTAAAGAAAGGCCCAAAGTG ACAGAGGCAGCAGAGGGATGGTCCACCGCCCCTTGGCTTCTGCTGGTGACTCCTCCTGGC CACTGCATCAGAAGAACCTCCTCTGCCCCTTCTGGAGCCCGAGGCCTGGCCTGTCTTCGT TGGGGCTGATAAATTGCCTCTCCCAGGGCCTGCTGGGTGAGTC-ACCATCCCAAAGCAGGA AGGGTGCCCTGGAGAGAACCACCCTCCTCCTACTCTTTTTCCACTTCCTCCTCTTTCTTT CCCC?GCTGAGGAGGAACCTGGGGCATTTAGGGC?GAGGACAAAAGGATGTC?GCAATTG CTTGGGCTGCTTGGCTATGCAAGCCTCCTGCCTGCTGATGGCCACTTCAGGGACAGCCTG GGCCC1AGGCACCCAGGGGGATGGCGGCAGCTTCCTGC_ACCTTTCAGATTTCTTGGTGGCA TTAAAGCATTTTC?GAACAAAAA?AAAAAAAAAAAAAAAAAAAA AJ272267 GGCGGGCCTGGACGGCCGCGTGCTGTACTGGCCACGCGGCCGCGTCTGGGGTGGCTCCTC ATCCCTCI^TGCC ATGGTCTACGTCCGTGGGC?CGCCGAGGACTACGAGCGCTGGCAGCG CCAGGGCGCCCGCGGCTGGGACTACGCGCACTGCCTGCCCTACTTCCGCAAGGCGCAGGG CCACGAGCTGGGCGCCAGCCGG?ACCGGGGCGCCGATGGCCCGCTGCGGGTGTCCCGGGG C AAGACCAACCACCCGCTGCACTGCGCIATTCCTGGAGGCC_ACGCAGCAGGCCGGCTACCC GCTCACCGAGGACIATG?ATGGCTTCCAGCAGGAGGGCTTCGGCTGGATGGACATGACCAT C(^TGAAGG( AACGGTGGAGCGCGGCCTGTGCCTACCTGCACCCAGCACTGAGCCGCAC CIAACCTCAAGGCCGAGGCCGAGACGCTTGTGAGCAGGGTGCTATTTGAGGGCACCCGTGC AGTGGGCGTGGAGTATGTTAAGAATGGCCAGAGCCLAC^GGGCTTATGCCAGCAAGGAGGT GATTCTGAGTGGAGGTGC(_?TCAACTCTCCLACAGCTGCTC-ATGCTCTCTGGCATCGGGAA TGCTGATGACCTCAAGAAACTGGGCATCCCTGTGGTGTGCCACCTACCTGGGGTTGGCCA GAACCTGC?AGACC^CCTGGAGATCTACATTCLAGC?GGC?TGT CCCGCCCTATC-ACCCT CCIATTCAGCACAGAAGCCCCTGCGG?AGGTCTGCATTGGTCTGGAGTGGCTCTGGAAAGT CIACAGGGGAGGGAGC(_?CTGCCCATCTGGAAAC?GGTGGGTTC_ATCCGC_A.GCC_AGCCTGG GGTCCCCC?CCCGGACIATCCAGTTCC?TTTCCTGCC?TCCÍ^AAGTGATTGACCACGGGCG GGTCCCC?CCC AGCIAGGAGGCTTACCAGGTAGATGTGGGGCCCATGCGGGGCACGAGTGT GGGCTGGCT<_AAACTGAGAAGTGCCAATCCCCAÑ.GACC_?_CCCTGTGATCCAGCCCAACTA CTTGTCAACAGAAACTGATATTGAGGATTTCCGTCTGTGTGTGAAGCTCACCAGAGAAAT TTTTGCA(_AGGAAGCCCTGGCTCCGTTCCGAGGGAAAGAGCTCCAGCCAGGAAGCCACAT TCAGTCAGATAAAGAGATAGATGCCTTTGTGCGGGCAAAAGCCGACAGCGCCTACCACCC CTCGTGC-ACCTGTAAGATGGGCCAGCCCTCCGATCCCACTGCCGTGGTGGATCCGCAGAC AAGGGTCCTCGGGGTGGAAAACCTCAGGGTCGTCGATGCCTCCATCATGCCTAGCATGGT CLKGCGGC^CCTGAACGCCCCC?CAATCATGATCGC_A^^ GGGGC?GCCTGCLACTCTGGGACAAAGATGTCCCTGTCTAC?AGCCC?GGACGCTGGCCAC CCAGCGCTAAGACAGTTGCTGCTGGAGGATGACCAGGGAAGCCCCCTGATAAGCCAAGAG GGCCAGC1ACAGCCCTTGCTCCCAGGCTCCTGCCTGAAACTATCTAGCACACTAGGACCCA GGTGGTACCCTACTCAGTGGCTGAGAATTGGATAAAGTCTTKGGGAAATGAGACAAGTAC TGGGCAGTGAATCCAGCTCCTTTTCCCCAGCCTTTCCCTGTGGGCCATTTGGGGAAGGCC AG(_ATTYCAGCCTGAGATGTTCCTCCCTGCCTCCTGGGGGGGC-?\RAAGGGVTAGGTGGT TAACTCCTGCCGCATCCTTCCCTGCCTCCTGGAGGGACAGAAGGGGAGGATGGTTAACTC CTGCCGCATCCTTTTTCTTGTGTTCACGTGGCATTCTCTAACCCAGGGCAGTGGTTCCTT CCCAGGCCATGCIAC?GAGGCTGGGTGCCTGCCAGACCCACGGAGGGTTCGCGAAGGAAGG GGCATCCTCCTTCTTGAGCTGCAAGCTTTAGCTGAGGCAGTAAGTCACACAGTAGTTAGT TCIAGCCTGGGCTGGCACATAAGTCCCCAGTGTCCCTGTTGAGAGGGGAAAGTTGCCTGCT GGTTGAAAAACTGGCTTTTCCTTTCTCGCTGCCTAATTTCACTCTCAGAGTGAGGCAGGT AACTGGGGCTCCACTGGGTCACTCTGAGAGGGTTGTGGCTCTGGTTCTTATTAAACCAGG GCCLAGGTGCAGGGCTC-ACACCTGTAATCCC_?-GCACTTTGGGAAGGTCACTTGAGCTCAGG AGTTCAAGACCAGCCTGGGCAACATAGTGAGACCTTGTCTCTGGAAAACAATTAGCTGGG CATGGTGGTACACACCTGTAGTCCCAGCTACTTGGGAGGCTGAGGCGGGAGGATGGCTTT AGCCC!AGGAGGTTGAGGCTCCTGTGAACCCTGATGGC_ACC-ACTGCACTCCAGCCTGGGTG ACAGGGTGAGACCCTGTCTCAAAAA?AAA N30081 (IMAGEClon ID: 258695) CCGCCGTTGNC?AAGGGCCCAGAATATGGGCCATGGACN?TCTCCATGCCTGGGGAAATT CCCTCGGGTCTTTTGGNTAACCNCCTTATAGAAAGGTAATGNCATGGAGTCTCTACAGGG NGC?C^^GGTGGACTAATTGATACGAAGAGCCCTGTAAATATGTGGGCAGCGGCAGATTT TGACCL?_TTTGGACCGAACTGTATTTGACLA<_?GCGCAATATCTGGA2_CTGGTTGGTCAAAA ACCTGCTTGTCTTGTTAAATTTCCTCTGTCCAAGGACATGGAATCTCTCTCTAATTTTAC TTCLÍ^AATTTCCCTTTCCTTCATTTCTCTAAAAACGTTAAATAAGAAAGAAGATTGTAAAG CCAGCATTTG?AGCCTAAGTATTGAAAGTCTTTGA(^^TTTCTGAAATCAGACTTGACAT CTTTCCCCCGCCTTGC.^AATTTCTTGAAGAAATAAGAAGCTACATGTAAGCATCATCATG TTTATTAAATTACAATGAGAACTCTCACTCIATCTTGACCAGAGCAGACTCTTAACTTGG AAGCAGAGTCCCTCTAAAGGTAACTCTTGTGGTCACTCAATATTGTATTGGCATTTGCAT ATTAAATAGACATTTCAGTAGCATTT AI700363 (IMAGE Clon ID: 2327403) TGGCCCGCGGTCGCGGTGGGATCCTAGCCCTGTCTCCTCTCCTGGGAAGGAGTGAGGGTG GGACGTGACTTAGACACCTACAAATCTATTTACCAAAGAGGAGCCCGGGACTGAGGGAAA AGGCCAAAGAGTGTGAGTGCATGCGGACTGGGGGTTCAGGGGAAGAGGACGAGGAGGAGG AAGATGAGGTCGATTTCCTGATTTAAAAAATCGTCCAAGCCCCGTGGTCCAGCTTAAGGT CCTCGGTTAC1ATGCGCCGCTCIAGAGCAGGTCACTTTCTGCCTTCCACGTCCTCCTTCAAG GAAGCCCCATGTGGGTAGCTTTCAATATCGCAGGTTCTTACTCCTCTGCCTCTATAAGCT (_AAACCC_AC<_AACGATCGGGCAAGTAAACCCCCTCCCTCGCCGACTTCGGAACTGGCGAG AGTTCAGCGCAGATGGGCCTGTGGGGAGGGGGCAAGATAGATGAGGGGGAGCGGCATGGT GCGGGGTGACCCCTTGGAGAGAGGAAAAAGGCCACAAGAGGGGCTGCCACCGCCACTAAC GGAGATGGCCCTGGTAGAGACCTTTGGGGGTCTGGAACCTCTGGACTCCCCATGCTCTAA CTCCCACACTCTGCTATCAGAAACTTAAACTTGAGGATTTTCTCTGTTTTTCACTCGCAA TAAATTCI?GAGC?AACAAAAAAA?AAAAAAA AL117406 CAATAGGCCGGCTTTTGAACTGCTTCGCAGGGGACTTGGAACAGCTGGACCAGCTCTTGC •CCATCTTTTCAGAGCAGTTCCTGGTCCTGTCCTTAATGGTGATCGCCGTCCTGTTGATTG TCAGTGTGCTGTCTCCATATATCCTGTTAATGGGAGCCATAATCATGGTTATTTGCTTCA TTTATTATATGATGTTCAAGAAGGCC1ATCGGTGTGTTCAAGAGACTGGAGAACTATAGCC GGTCTCCTTTATTCTCCCACATCCTCAATTCTCTGCAAGGCCTGAGCTCCATCCATGTCT ATGGAA?AACTGA?GACTTCATCAGCCAGTTTAAGAGGCTGACTGATGCGCAGAATAACT ACCTGCTGTTGTTTCTATCTTC(^(^CGATGGATGGC_ATTGAGGCTGGAGAT(-?TGACCA ACCTTGTGACCTTGGCTGTTGCCCTGTTCGTGGCTTTTGGC?TTTCCTCCACCCCCTACT CCTTTAAAGTCATGGCTGTCAAC^TCGTGCTGC?GCTGGCGTCCAGCTTCCAGGCCACTG CCCGGATTGGCTTGGAGACAGAGGCA?_GTTCACGGCTGTAGAGAGGATACTGCAGTACA TGAAGATGTGTGTCTCGGAAGCTCCTTTACA?-TGGAAGGCACAAGTTGTCCCCAGGGGT GGCC&C?GCATGGGGAAATCATATTTC?GGATTATCLA^ CCACCGTGCTTCLACGGC?TC^CCTGACCATCCGCGGCC?CGAAGTGGTGGGCATCGTGG GAAGGACGGGCTCTGTAGGTTTTTACTGAGCACCTACTATGTGCCTGGGAACCGA?AGGG AGTCCTCCTTGGGC?TGGCTCTCTTCCGCCTGGTGGAGCCCATGGCAGGCCGGATTCTC ATTGACGGCGTGGACATTTGCAGCATCGGCCTGGAGGACTTGCGGTCCAAGCTCTCAGTG ATCCCTCAAGATCC?GTGCTGCTCT(^GGAACC-?TCAGATTCAACCTAGATCCCTTTGAC CGTC?CACTGACCAGClAGATCTGGGATGCCTTGGAGAGGACATTCCTGACCaAGGCCATC T(_aAAGTTCCCCAAAAAGCTGCATACAGATGTGGTGGAAAACGGTGGAAACTTCTCTGTG GGGGAGAGGClAGCTGCTCTGClATTGCC .GGGCTGTGCTTCGa^CTCC?AGATCATCCTT TCGATGAAGCC?CAGCCTCCATTGAC^ATGGAGACAGACACCCTGATCCAGCGCACAATC CGTGAAGCCTTCCAGGGCTGCACCGTGCTCGTCATTGCCCACCGTGTCACCACTGTGCTG AACTGTGACCACATCCTGGTTATGGGCAATGGGAAGGTGGTAGAATTTGATCGGCCGGAG GTACTGCGGAAGAAGCCTGGGTCATTGTTCG(^GCCCTC1ATGGCCACL?^GCCACTTCTTCA CTGAGATAAGGAGATGTGGAGACTTCATGGAGGCTGGCAGCTGAGCTCAGAGGTTCACAC AGGTGCAGCTTCGAGGCCCACAGTCTGCGACCTTCTTGTTTGGAGATGAGAACTTCTCCT GGAAGC?GGGGTAAATGTAGGGGGGGTGGGGATTGCTGGATGGAAACCCTGGAATAGGCT ACTTGATGGCTCTCAAGACCTTAGAACCCCAGAACCATCTAAGACATGGGATTCAGTGAT CATGTGGTTCTCCTTTTAACTTACATGCTGAATAATTTTATAATAAGGTAAAAGCTTATA GTTTTCTGATCTGTGTTAGAAGTGTTGCAAATGCTGTACTGACTTTGTAAAATATAAAAC TAAGGAAAACTC.AAAAAAAAAAAA M92432 CCCACAGGGGGACCGGCCCTGTGACCCCTCACCGGGGCCGTGGGCCCGAGCCCCGGACTT CCCTA?GCCGGCA?TGACCGCCTGCGCCCGCCGAGCGGGTGGGCTTCCGGACCCCGGGCT CTGCGGTCCCGCGTGGTGGGCTCCGTCCCTGCCCCGCCTCCCCCGGGCCCTGCCCCGGCT CCCGCTCCTGCTGCTCCTGCTTCTGCTGCAGCCCCCCGCCCTCTCCGCCGTGTTCACGGT GGGGGTCCTGGGCCCCTGGGCTTGCGACCCCATCTTCTCTCGGGCTCGCCCGGACCTGGC CGCCCGCCTGGCCGCCGCCCGCCTGAACCGCGACCCCGGCCTGGCAGGCGGTCCCCGCTT CGAGGTAGCGCTGCTGCCCGAGCCTTGCCGGACGCCGGGCTCGCTGGGGGCCGTGTCCTC CGCGCTGGCCCGCGTGTCGGGCCTCGTGGGTCCGGTGAACCCTGCGGCCTGCCGGCCAGC CGAGCTGCTCGCCGAAGAAGCCGGGATCGCGCTGGTGCCCTGGGGCTGGCCCTGGACGCA GGCGGAGGGCACCACGGCCCCTGCCGTGACCCCCGCCGCGGATGCCCTCTACGCCCTGCT TCGCGCATTCGGCTGGGCGCGCGTGGCCCTGGTCACCGCCCCCCAGGACCTGTGGGTGGA GGCGGGACGCTCACTGTCCACGGCACTCAGGGCCCGGGGGCTGCCTGTCGCCTCCGTGAC TTCC?TGGAGCCCTTGGACCTGTCTGGAGCCCGGGAGGCCCTGAGGAAGGTTCGGGACGG GCCCAGGGTCACAGCAGTGATCATGGTGATGCACTCGGTGCTGCTGGGTGGCGAGGAGCA GCGCTACCTCCTGGAGGCCGCAGAGGAGCTGGGCCTGACCGATGGCTCCCTGGTCTTCCT GCCCTTCGACACGATCCACTACGCCTTGTCCCCAGGCCCGGAGGCCTTGGCCGCACTCGC CAACAGCTCCCAGCTTCGCLAGGGCCCACGATGCCGTGCTCACCCTCACGCGCCACTGTCC CTCTGAAGGCAGCGTGCTGGACAGCCTGCGCAGGGCTCAAGAGCGCCGCGAGCTGCCCTC TGACCTCÍ^TCTGCLAGC?GGTCTCCCCACTCTTTGGCACCATCTATGACGCGGTCTTCTT GCTGGCAAGGGGCGTGGCAGAAGCGCGGGCTGCCGCAGGTGGCAGATGGGTGTCCGGAGC GCTGTGGCCCGCCACATCCGGGATGCGCAGGTCCCTGGCTTCTGCGGGGACCTAGGAGG AGACGAGGAGCCCCCATTCGTGCTGCTAGACACGGACGCGGCGGGAGACCGGCTTTTTGC C?CATACATGCTGGATCCTGCCCGGGGCTCCTTCCTCTCCGCCGGTACCCGGATGCACTT CCCGCGTGGGGGATC^GCLACCCGGACCTGACCCCTCGTGCTGGTTCGATCCAAAC?ACAT CTGCGGTGGAGGACTGGAGCCGGGCCTCGTCTTTCTTGGCTTCCTCCTGGTGGTTGGGAT GGGGCTGGCTGGGGCCTTCCTGGCCC_ATTATGTGAGGC_ACCGGCTACTTC_ACATGCAA?T GGTCTCCGGCCCCAA?^AGATCATCCTGACCGTGGACGACATCACCTTTCTCCACCCACA TGGGGGCACCTCTCGAAAGGTGGCCCAGGGGAGTCGATCAAGTCTGGGTGCCCGCAGCAT GT<^GAC&TTCGCAGCGGCCCCAGCCAAC!ACTTGGAC^^ GGGAGACAGGGTTTGGCTGAAGAAATTCCC^_GGGGATCAGC1AC_ATAGCTATCCGCCCAGC AACCAAGACGGCCTTCTCCAAGCTCCAGGAGCTCCGGCATGAGAACGTGGCCCTCTACCT GGGGCTTTTCCTGGCTCGGGGAGCAGA?GGCCCTGCGGCCCTCTGGGAGGGCA?CCTGGC TGTGGTCTCAGAGCACTGCACGCGGGGCTCTCTTCAGGACCTCCTCGCTCAGAGAGAAAT AAGCTGGACTGGATGTTCAAGTCCTCCCTCCTGCTGGACCTTATCAAGGGAATAAGGTA TCTGCACC?TCC GGCGTGGCTCLATGGGCGGCTGAAGTC?CGGAACTGCATAGTGGATGG CAGATTCGTACTCLAAGATC?CTGACCACGGCCIACGGGAGACTGCTGGAAGCLACAGAAGGT GCTACCGGAGCCTCCCAGAGCGGAGGACCAGCTGTGGACAGCCCCGGAGCTGCTTAGGGA CCCAGCCCTGGAGCGCCGGGGAACGCTGGCCGGCGACGTCTTTAGCTTGGCCATCATCAT GCAAGAAGTAGTGTGCCGCAGTGCCCCTTATGCCATGCTGGAGCTCACTCCCGAGGAAGT GGTGCAGAGGGTGCGGAGCCCCCCTCCACTGTGTCGGCCCTTGGTGTCCATGGACCAGGC ACCTGTCGAGTGTATCCTCCTGATGAAGCAGTGCTGGGCAGAGCAGCCGGAACTTCGGCC CTCC^TGGACC?(_ACCTTCGACCTGTTCLAAG?ACATGAACAAGGGCCGGAAGACGAACAT CATTGACTCGATGCTTCGGATGCTGGAGCAGTACTCTAGTAACCTGGAGGATCTGATCCG GGAGCGCACGGAGGAGCTGGAGCTGGAAA?GCAGAAGACAGACCGGCTGCTTACACAGAT GCTGCCTCCGTCTGTGGCTGAGGCCTTGAAGACGGGGACACCAGTGGAGCCCGAGTACTT TGAGCAAGTGA(__ACTGTACTTTAGTGACATTGTGGGCTTCACCACC1ATCTCTGCCATGAG TGAGCCCATTGAGGTTGTGGACCTGCTCAACGATCTCTACACACTCTTTGATGCCATCAT TGGTTCCCACGATGTCTACAAGGTGGAGACAATAGGGGACGCCTATATGGTGGCCTCGGG GCTGCCCCAGCGGAATGGGC_AGCGACLACGCGGCAGAGATCGC(IAA(_?TGTCACTGGACAT CCTCAGTGCCGTGGGCACTTTCCGCATGCGCCATATGCCTGAGGTTCCCGTGCGCATCCG CATAGGCCTGCACTCGGGTCCATGCGTGGCAGGCGTGGTGGGCCTCACCATGCCGCGGTA CTGCCTGTTTGGGGACACGGTCLAACLACCGCCTCGCGC-A.TGGAGTCCACCGGGCTGCCTTA CCGC-ATCCACGTGAACTTGAGCACTGTGGGGATTCTCCGTGCTCTGGACTCGGGCTACCA GGTGGAGCTGCGAGGCCGCACGGAGCTGAAGGGCAAGGGCGCCGAGGACACTTTCTGGCT AGTGGGCLAGACGCGGCTTCAAC?AGCCCATCCCCAAACCGCCTGACCTGCAACCGGGGTC C?GCAACC?CGGC?TCAGCCTGC^GGAGATCCCACCCGAGCGGCGACGGAAGCTGGAGA? GGCGCGGCCGGGCCAGTTCTCTTGAGAAGTGAGGCCCGGCCCCGGACAGGGTCTGGGCCC TGCTCCCTGTCCCATCTGCAGTGGACCCCAGGCACCCCCCTTTGAGGAGGTGGGGTGAAC TGCTCCTTGGCAGGGATTTGTGACACTGCATTGCTGGGCTGTGTTCCTCGGGCTCTTCTG GIACCTTGCIACCGTGGATACCAGGC<_A.TGTGCCATGGTATTTGGGTCCTGGGAGGGTGGGT GAAATAAAGGCATACTGTCTT AL050227 CTTTCACAGAAAGAAAGTAACAGGCATAATTCCTGTTGATGAGGCTGGGATTGTTTTTAA GAGGAGAGATAATAACTTC-ATATTTTTAAAGTGCC^GTAGCCTAATATGTGAAACAGATC AGAATCTGTTGTGTAGTAAGTCTGCTTTGTTGAAGAATTTATTATGGGAGTAAAGATAAG AAGGAAAGAGATCACCATCL^GAAACa^GTC^GCCTTTT(_ATGCTTTTTTGAGCA.TTTTTG GAGATGATTCCACTTCTCAAGTTATTATCATTTGTGCATCTCTTCAATGCTATTGTTAAA TGCTTTAGAATTAGAATATTTTGATCCTTTAATTAAAGTAAGCCAAACGTCTAGGCAAAA AC?GCC^^TC?TTAAACTTTAATAGTAATTOÍAATATAGATTTCTCATACAGTTTTCCAT GTCTGTAGAAATCAAAGTTGTAATGTTA?GCAGAGGGA?ATGCGTGTGATTTACTAATAC ACTTC_AACGTTCTACTTTTGAAAGGATACTC?TGTGGGTGGGGCAGAGAAC_ATAGAAAAA GATATGATGGAAAACCTGTCCATTTTCTACCTGTTAACCTTCATCATTTTGTGCAGGCCC TGGAAGCAA?GAGAGGAAGGGACCGACTGCLATTTATCTTTGAACI?CTTGAGCATCAGTAG TACTACTGAGTGGCCAGGGGTCTTGTCTGT(_A-^GC_AAATGATAAGTTC?CTC1AGGCCAT ATTGACTGCTGAACTCTCTTCCTTCCCLAACTCTTCCTTGAAAGAGAAAAAAATACTTTG CCTTCTTGCTCTCCTTATCAAATGTTTTTGTACAAATAGTGTAAGCCTGTTTAAGCAAAC CLAATTAAAATAGGCACTGATTATTTTGATCTGTTTGTAACAAATGAATGTAAGTACTATT TACATGGTGTGCCTAGGAGGAGCTGAAATCATTGGCACTTTAATCCATATTGTAAAGATC AGTATCAAAAGCATAGTGTTCTTC^CCTCTCCTCCT(^GCATCCATCTCTATATACTTGA TTAAATGGAAAAGTCTCTTTTATCACCTCTATGTAAAGTTTTATGGGTAGTTATCGTCAG TGTATTTAAATATATCTTCTAGTATGTTTTAAAGGCTGGTCTTCAATACTGTGGAGACAA A?AATAAAAGAGCGTATGAAAAGTACGTTAGACTTTTGCTGGCATTCAAGTCATGGCTAG TCTGTGTATTTAATAAATGTGTGTTATTTATGTCGTGTTTGTCAATGGAAAATAAAGTTG AATATTCTGAAAAAAAAAAAAAAA AW613732 (IMAGE Clon ID: 2953502) CCTAHAAGTNCCATTTTGGCAAGGATAAACTCCCM^ _^TGAATA?GAAAO^GAANTGACC?CLAC?«^GCCTCCCTGGCTGGTGTTACANGGGAT CIAGGTCC_ACIAGTGGTGC_AGATTCAACCACCACCCAGGGAGTGCTTGCAGACTCTGCATAG ATGTTGCTGCATGCGTCCCATGTGCCTGTCAGAATGGCAGTGTTTAATTCTCTTGAAAGA AAGTTATTTGCTC!ACTATCCC(^GCCTCS^GGAGC<^&GGAAGAGT(^TTC?CATGGAAG GTCCGGGACTGGTC1AGCCACTCTGACTTTTCTACCLAC1ATTAAATTCTCCATTACATCTCA CTATTGGTAATGGCTTAAGTGTAAAGAGCCATGATGTGTATATTAAGCTATGTGCCACA^. ATTTATTTTTAGACTCTCCACLAGC?TT I?TGTCAATATGGGATTAATGCCTA?ACTTTGT AAATATTGTAC?GTTTGTAAATCAATGAATAAAGGTTTTGAGTGTAAAAAAAAAAAAAAA AAAAAAA BC007783 (IMAGE Clon ID: 4308472) GGCACGAGGGCAAAGAGTAGTCAGTCCCTTCTTGGCTCTGCTGACACTCGAGCCCACATT CCATCACCTGCTCCCAATC?TG(_ACMTCTC<_ACTGCTGCCCTTGCCGTCCTCCTCTGC_?_C CIATGGCTCTCTGI-LAACCIAGGTCCTCTCTGCACCIACTTGCTGCTGACACGCCGACCGCCTG CTGCTTCL?GCTAC?CCTCCCGGCAGATTCCACAGAATTTCATAGCTGACTACTTTGAGAC GAGC_AGCCL?GTGCTCC_AAGCCCAGTGT( ATCTTCCTAACC^AGAGAGGCCGGCAGGTCTG TGCTGACCCCAGTGAGGAGTGGGTCCAGAAATACGTCAGTGACCTGGAGCCGAGTGCCTG AGGGGTCC?GAAGCTTCGAGGCCCAGCGACCTCAGTGGGCCCAGTGGGGAGGAGCAGGAG CCTGAGCCTTGGGAACATGCGTGTGACCTCCACAGCTACCTCTTCTATGGACTGGTTATT GCC^AACAGCCACACTGTGGGACTCTTCTTAACTTAAATTTTAATTTATTTATACTATTT GTTTTTATAATTTATTTTTGATTTCACAGTGTGTTTGTGATTGTTTGCTCTGAGAGTTC CCCCTGTCCCCTCCACCTTCCCTCACAGTGTGTCTGGTGACAACCGAGTGGCTGTCATCG GCCTGTGTAGGCLAGTCATGGC?C?^AAGCC?CC_AGACTG^ TTGTTCAGGGCTGTGATCGGCCTGGGGAAATAATAAAGATGTTCTTTTAAACGGTAAAAA AAAA X81896 GAAAACTATTTTCTAAATATTAACACTGAAAATGTTTTGTTAGCTTTTCCTTCTTTCTC TCC1AGAAGAAACATGGATAGATGATAGCTGTTTCATTGTTTGTTTTTGTCAAGCATATTC CTTTCCTCCTTGTCCTCTGATTCTGAGCAAAGGGCCTCAGACTCTGAACTTCCCTCAAG TGCCGTTGTTATGTGAACTCTTCCATTCAGATTCCAGAGAGGTTCTCATGCTCCCCCCCC CTCCTTATTTGTAGCAATCGTAGCAACTAATTCCACTAAGTACAAGGGAGTTTTTTACAC CCTCCATTTTTATAGCATCTGCATTTTTTTTTTTTGTTAGGTACATGTATACACCTGCC TGAGTATAAATACTCTCTCTACCTAATAATAACATCAACCAACATCTTTTCCAAATTAGG GCCACAGAA(^GCAACATTTGTCTGACAGTAGTATAAAGAATAATGATAGCTCTATCCTT AGAAGTATTTCCTTTCCTTTTTATATAGTCCCGTTAGGGTTTAAAACCATATTGATCAA GTAGAAAGAAAAATATGAA2^GAGAA2 ^ATATTTTAATTTAAAAATTGTAATACATTGAT TTATAAAATGCCTTCTCTGATACTTTTGAAACLAGATGTGÑASAACAGAAAAAG?AAAAAT TGTCTGAAATGTTTATTTTGCAAAAC?GTGCAATAGAATCTAGTTATGCCTTCATCACTG TTGACAGTAAATACTGACAGCCCCTTGCAGTGTGTTAGTTTTAGATCACTCTGTTTTAGT TGAGAGAAATGTTTTATATCATGGTTTTTATATGAATACI^AATTATTTCTCAAAGATTTA TAGCACACACTATTCTCAGGAATTCTGTATTACATGAATGCTGCTTATATATTTTCATAT TCTAACTTGTCTTTT(_AAGCAAATAACTAATATATATGTG(_ATGCL?-GTCTGCCTTGACAA GTTGTTCC^^GCTGAAGAGCTTTCACTGTACAATGTGTGGAAAATCACCATAGATCATGG CTGA5ATAGTTTGTAATTGTCTGAGTCTGTGCACGTACTTTTAGATAAAATGCTGCTGAG TGACTGCATGATGAGATACAACTTCTGAATGCTGCACATTCTTCCAAAATGATCCTTAGC ACAATCTATTGTATGATGGAATGAATAGAAAACTTTTTCACTCAATAAATTATTATTTGA TATGGTAAAAAAAAAA BC004960 (IMAGE Clon ID: 3632495) CCCAAGGTTGTTATATCTTCATGTCCTCATTTCTTAGGGAGGTACCTTCAGAACCAATAG TGACCCCTAACTTCTCTGGTGGTCGGTTCC?TGAAAGG?^AAGGAGTGTGAGAGAGGAGT GGATGGTCAACCTCCCACTGCCATGGTAACATGGGTGCTGGCTGATGGGAGCAGAAAATA ATTTAGTGAAAGTCTGTGGGGGCAGTCACAAGATGTCTGAGAAAACTGGCGAGCCAGCTG CTGAA2^CAGGGA?^GGAAGCCTCCGTGGCTGGAGCCC?AATC?C?CTGC_AGACC(_AGA CACCGTGACCACCACCATGGACTCCAGAGAGAGCAGCTTATAGTACTCAATCAGCTGCCA CTACC?C<-_ATCCAGAACAC^GATGTTGTAGC<_?TGGCTG(_AGCAGGAATGGATGTCCC? CTGTCCCTGCTCCTCGGTGTGACTTGCTCCCAAGTTCAGGGCAGGTCCATCTGATTGGCT GAGTCTGGAATGTCTGCCTGTGCCTCAGCTGTGAGGGAGGCAGGGAAAGTAAGCCTTTTC AGCTTCTGTCGTGGGAGGTGGGCTCTGCCTCCTACCAAGAATCAAAGGGTGGAGGATCTT CAAACIACAGGAAAAG?ACCCGGATCCTGGCIACCCCCAAATTTTCAGAGTCCATTTCAGAG CATAAGAAATTGAGGGTCO.AGATCLATTC-ATGTAAGAAGTTTAGAGGGGGAAGAAAAGAA TGATAAACGAAAAGAACAGCAATAGTAAAGGATCTTTTCTTTGTTTCAGTAAGATGAAGA GGCCTGAGCAGTTTCGTGGAGGGGAAGAAACAGGAAAACCTCTTCAAAAGACAAAAAGCT GGCACTGCATTCTCTCTCTGTAGCAGGACAGAACTGTCTAAAGACAAGACCCCTTTGGCC AAAATAA?GGAACCTGAAACATTAA?AAAAAAA?AAAAAAAA?AAAAAAAAAAAAAAAAA AAAAAAAAAAAAAAAAAAAAAA?AAACCTCGGG A 027250 AAATTTAATTAATTATAAACTCAGTCTCTTGGTTGCIACC_AGCCA(^TTTC_AGATGCTC?A TAGCCLAC1ATGTGGCTAGTGGGTACCATATTGGACAGGGCAGCTATAGAATATTTCCATCA TTGCL?-GAAAGTTCTATTGGATAGTACCATAATCTTTTTATAGTAACTTGGAAATACTATT TGATATTAGATGTTAGACC1ACAAAAAGAAGAAAAATGTTAGGACTATTTCAGATATAAAA AGGAACTGAATTGTGACIATAATTAGC-ATCTTACATTCCATACAGTTGAATACCTTATGCT GTGAC^CC&TAGTTAATC?TTTCAGTGCTG^ TTAGAC LAGGGGTCTGCAAACTTTCTGTGAATGGACAAAGAGTAAATACTTTAGTAAATG TCTTAGGCTTTGTGGCCTACATGATCTTTGTTGCAAGTACTCAACTCTGCCATTATAGAG TTAAAGCAGCCATACACAATATATAAACAAAATGGGCLATAGTTGTATTTCAGTAAAACTT TATTTACAAAGACAGGCGGTAGGCCAGATTTGGCTTGCATGCTGTAGAGCTGTGGTCTAA ATTTTATTC?TAGACTTTCTTTGC1AAATACAGTGTGAGTATTGTTCCATTTACAGTATTA TTATTTTTTAGATACCTGGTTTTTAGATTCTTGCCTGGTAACTTTTTACTG?AAATACAA GAATTTCGTACTGCATTTGCATCTCCGAG?TTAGGGAGCACCTGTCAGGATATGTTGTTC TATCAGGGTTACTTCTGTTGACTACCTCTTAGATTTTGATACAGTTATATTGTTGAGTTT CATTTTCATATATTCTTGTAGTGTCTGCTTGCCTGTGACTTCTGGTAAAATAAAATAAGC CTTTGAAAATATTTTAGCATGGTATTTAACATTTTCTAAATATTATGGCATTTTGACATA TTTTAGTCAGCGAAGACATCTGCCCCTTTGGTGTTTCTACTTGCTTATGATTGAGATTTT AC ? AGCCCTTCAAACTCCGTTTTAAAGGAATTTATTGTAAAACATTAACTTTAATAAATT AGTGTTTTCAC?GATCAGAT(_?TTATACTTGGAACTTCTAAATC?TGCAATTTCTGAATA AGGACATAAGGCTAGATTCATTTTTCTTAATAGAGAAAAAGGAAATTTCTGATTTATCAC TTTTCTAGTTGATAAGTAGGATT<_AAAACGTTTGATATGTAAGTATTTATATAAGACTAA TGTAATTTAAF-GTTCTGTATTATTGTGATTAATC?TAC?GA^TTCAGGA?CTGATCAGA GTGAGATTCTTTTCCACATCTGGTTAATGTAGTGAGTTGACACCCTGTGGGTGGTAAAG C?TTATAAACATTTCATCTTGAACCATGATTTATACACATCTGTGTTATAAGGGAGGCTT GAGTAC?TATACC?ATGAAGAGATATTCAGCATTTGTCTATTTGATAAGGAATTAAATGT CCTAGTGATTATAAAGTAAAACC?CAGACCAATTTGCAAATGATCTTCAATGTTAAGCAC TTGCTCTAAGATTAAAATTCCTTTTCTTTTTAAGGTTAAGGGTGTGTACGTATGGC?GTG ATGTCTATGTTGAGATTAACTTATGTATTGAGGAAAATTTGAAGTTTATTTTTTCGATGA ATAAGGCTGTCI ATGATTTAGTATAGATTAATGAC?TCTTTTTTAGAAATATTAAAGTG AGTATTCCTCATTATGTC?TCATTTCTGATAATTAGAGTGCTAATTTGAATGTTAGATAA TGTTTCCACATCTATACCTATTTCTTTCTAGGGCACTTCTGACCCTGGGGCTTGGGGATG GCCTTTAGGCCACAGTAGTGTCTGTGTTAAGTTCACTAAATGTGTATTTAATGAGAAACA TTCCTATGTAAAAAT?TGTGTATGTGAACGTATGCATACATTTTTATTGTGCACCTGTAC ATTGTGAAGAAGTAGTTTGGAAATTTGTAAAGCACAAACCATAAAAGAGTGTGGAGTTAT TAAATGATGTAGCACAAATGTAATGTTTAGCTTATAAAAGGTCCTTTCTATTTTCTATGG CAAAGACTTTGAC-ACTTGAAA?ATAAAACCAATATTTGATTTATTTTTGTAAGTATTTAG GATATTATTTTAAATAAATGATTGTCC?TTATCAATAAA??AAAAAAAA?AAAA Secuencias de la Tabla 5 no divulgadas anteriormente NM_014298 GTCCTGAGCAGCCAACAC?CC?GCCCAGACAGCTGCAAGTC?CCATGGACGCTGAAGGCC TGGCGCTGCTGCTGCCGCCCGTCACCCTGGCAGCCCTGGTGGACAGCTGGCTCCGAGAGG ACTGCCCAGGGCTCA?CTACGCAGCCTTGGTCAGCGGGGCAGGCCCCTCGCAGGCGGCGC TGTGGGCCAAATCCCCTGGGGTACTGGCAGGGCAGCCTTTCTTCGATGCCATATTTACCC AACTCAACTGCCAAGTCTCCTGGTTCCTCCCCGAGGGATCGAAGCTGGTGCCGGTGGCCA GAGTGGCCGAGGTCCGGGGCCCTGCCCACTGCCTGCTGCTGGGGGAACGGGTGGCCCTCA CACGCTGGCCCGCTGC AGTGGCATTGCCAGTGCTGCCGCCGCTGCAGTGGAGGCCGCCA GGGGGGCCGGCTGGACTGGGCACGTGGCAGGCACGAGGAAGACCACGCCAGGCTTCCGGC TGGTGGAGAAGTATGGGCTCCTGGTGGGCGGGGCCGCCTCGCACCGCTACGACCTGGGAG GGCTGGTGATGTTGAAGGATAACCATGTGGTGCCCCCCGGTGGCGTGGAGAAGGCGGTGC GGGCGGCCLAGACAGGCGGCTGACTTCGCTCTGAAGGTGGAAGTGGAATGCAGCAGCCTGG AGGAGGTCGTCCAGGCAGCTGAGGCTGGCGCCGACCTTGTCCTGCTGGACAACTTCAAGC CAGAGGAGCTGCL?_CCCCACGGCCACCGCGCTGAAGGCCCAGTTCCCGAGTGTGGCTGTGG AAGCCAGTGGGGGCATCACCCTGGACAACCTCCCCCAGTTCTGCGGGCCGCACATAGACG TCATCTCCATGGGGATGCTGACCCAGGCGGTCCCAGCCCTTGATTTCTCCCTCAAGCTGT TTGCCAAAGAGGTGGCTCCAGTGCCCAAAATCCACTAGTCCTAAACCGGAAGAGGATGAC ACCGGCCLATGGGTTAACGTGGCTCCTCAGGACCCTCTGGGTCLACIACATCTTTAGGGTCAG TGAAC?ATGGGGCACATTTGGCACTAGCTTGAGCCCAACTCTGGCTCTGCCACCTGCTGC TCCTGTGACCTGTCAGGGCTGACTTCACCTCTGCTCATCTCAGTTTCCTAATCTGTAAAA TGGGTCTAATAAAGGATCAAC AAAAAAAAAAAAAAAAAAAA AF033199 CGGGGCATGCTGCTTCCCTTCACCTTCCACCATGATTGTAAGTTTCCTGAGGCCTCGCCA GGTGTGCTTCTGTAC-AGCCTGTGGAATGTTACCAAAGACGTTGGAAGAGGTGGCTATGGG AC^TCLACCTGGGAGAAGTGGAAGC!AAATGGA1ACTGTTC1AGAA.GTCC_ATATACAGAAAC? TACTTGGAAAAATATAGAAACCTGGTTTTGCTAGATGGGAAGCTTGCAGCTGGGGCCAAG ACL?TCAAGAGTAGAGCAGCAGGAC?TTTC-AÑAAGAAGATTAACTCAAAGATTA AAGAACTTGCAAAGAGAAAGTCTGTACCGGAAGAAATCTGGAAATCTAGAGGCCAGTTTA GAATC?GCLAGCTAAACAAGGAGAATAATCTAGGGCAAGAGATAGCTACCTGCACAAAAA TTCCTACCIAGAAAAAGAGACATAGAATCTAATGAATTTGTGAAAAATTTTACTGTAAGAT C?ATACTTGTTG(^GAACAGATAGÁTCCTATGGAAGAGAATTGT(_ATAAATATGGTACAT GTTGAAAGATGCTCAAACL?UY\ACTCAGATTTAATTATACAAAGAAAGTATGATGGAAAAA AAAAAACCTTGTAAATATAGTGAATGTGGGAGAACCTTCAGAGGCCACATCACTCTTGTT (_AGCATCAAATAACTCATTGTGGAGAGAGACCCTGTAAATGTACTGAGTGTAGAAAGGGA TTTAATCLAGAGTTCCCACTTAAGAAATAATCAGAGÑAAAACTCTTTCAGGAGAAAAGCCC TACAAATGC-AGTGAGTGTGGGA?GGCCTTCAGTTATTGCTTAGTTCTTAATCAACACCAG AGAATTC??_GTGGAGAGAAACCTTATGAGGGTACTGAATGTGGCAAGACATTCATTCAG TCGTACATACCTTACTC?GCA.TC?AAGAATTCACLACLACTGGTGAGAAGCCCTATACATGT CTTGAATGTGGAAGGCTTTTTAGTCAGAACACACATCTTACTCTACATCAGAGAATCCAT ACTGGAGAGAAACCTTATGAATGCAATGAATGTGGTAGGTCCTTTAGTCAGACTGCACAT CTTACTCIAACATCÑAAGAATGTATACAGGAGAAAAACTCTATGAATGTA?TGAATGTGAG AAAGCCTTCC?TGATCACTC^GCTCTTATTCAACATCATATTGTCCATACTGCAGAGAAA CCCTATGATAT(_ATGACTGGGAAAACTTTCAGTTACTGTTCLAGACCTC!ATTCAACATCAG GAATGCACACTGGAGAGAAACC?TACAAATGCAATGAATGTGGGAATGCCTTTAGTGAT TGTTCATCCCTTATTCAGC^TCIAAAGAACTCACLACTGGAGAAGAGCCTTATGAATGTAAG CAATGTGGAAAAGCCTTTAG?.GAAGCA(_ATACCTTACTCAACATC?GAGAAGTCACGCA GGAGAGAAACAGTATAAATGCAATGAATGTGAGAAAACTTTCAGCCTGAGTTCATTCCTT ACACAGC1ATATGAGGGTTC?GACTGGAGAAAAACCCTACAAATATAATGAATATGGAAA? GCTTTTAGTGACTGCTCAGGACATTTTCAGAGAACTCACACTGGAGAGAAGCCCTGTGAA TGTAATGACTGTGGGAAACCTTTCA.GTTTCTGTTC1AGCCCTAATTCAAC?TAAGAGA?TT CATACCAGAAAGAAGCCCTGACTGTACCTTCATACCAGTAAATGCACTGACTGTGGAAAA GCCTTCLAGTGATTGGTTAGC?CTTGTTO^C?TCAGATAACTCAACACTGGAGAAAAACC GTATAAATGTACTGAATGTGGAAAAGCCTTCLAGTTGGAGTAC?GACCTCÑAAAATC?C(_? GAÍAACT(_A.TACTAGTGAAAAATCCTATAAATGTAATGAATGTAGAAAGGCCTTTAGTTA CTGCTCTGGTCTTATTCAF-TGTCAGGTCATTCATACTATAGAAAAACCTTATGAATACGG TAAATGTGGC^AAGCCTTTAGGCIAGAGGAC?GACCTTAAAAAACATCAGAAAATGC_ATAC CGAAGAGA?ACCCTATGAATGTAATGAATGTGGGAAAGCCTTTAGCCAGAGCACATATCT ACLAAAACLACCAAAAAATTCATAGTGA?GAGAAATCAAATATACATACTGAGTGTGGGGA AACCATTAGACAAAACTCTTCTTTTTAC?-ACAATAAAACCTCACACTGGAGAGTTCTCTG AATGCCTTAAGAATTTGGTTAATATGGAGACCCTTCCCAGGGAAACAGA?GGAGGATCGT GAAAACCGTTGACTACTTGAATGATCACATGGTTTAGTGGAGAGAGCATGATTCTGGGTT TTAAAAGTCATGGATCTCAATCTCAGCTCCTATTACTAACTAGATCTTTTACTTTGGGGT AAGTCACTTCATATCTTTAGGCCTTAATTTCCTCATCTGAAAACTGGAAGGCCTGACTTG ACTTGTTGAGCTTAAGATCCTC1AATTATTATATTTACTAGGAATTCAAGTTTCTATAGAT GTGGTTCAGAATTGTGACTTATTTATTGTAC?TCAGGTGTGATTCA.CAAGTGAGCTTGTA GTAGTTATTAAGGAGTCAATAAAGATATGATATAAAAAAAAAAAAAAAAA AI688494(IMAGEClon ID:2330499) CATTTCATCTTCATTGGATAGTGTTACATAGTAATATATTTATGTTTTCTTTTAATCATT T(_A.TAACTTGGAAAATACTAAC_ATAGTCAAAACTCTAGGGTAGGTGATACATGAGTTTCT GTAGTAATCTGGTTGGAGACATGTTGTAATTCTGTATATATATGTACLATTTATCCCATGC ATGTTATGCCTAAACTAAGACGGATACCCCTGAATTAAGAGGTGCTGTTATACATTGACC AGGCTTAAGAATATCTCTTTAAAGTGTGTCGAC?TTTAATTGACCTTTGGAAGTTCATTC TGTTAATCATACTCAAAGTGCTAAAGCTATGGTTGACTGCTCTGGTGTTTTTATATTCAT TCGTGCTTTAGCATATAA?TTCTTCAGCATAATTGCTACTTATTTAGCAAGAGTTTCCTT TATTTGA??ATGTGAGTTGTGCTTGTATTTTTGTGTCTTTCTTTCTTTCTTTCTTTTTTT AAACTTTGCTTCAGGCTGGGTAGTGGTAGAGGTTTGAATTAAAATGTTTTCCTGTCAGTA AAAAAAAAAAA AL157459 G?GCGAGCCCAG?-GCTTGCCCTTGACAGGTGGGGGCTGGCTGGGGCCTTAATGTGAAAA GACAGTGGC?GGCAGCTGGAGTAGAGCGAGCCCAGCAGCCCTAAAAGGCTGCCTTCATGG CCATCTAGCCC<_AGTTCAGGGCAGC&TC(^TAGCCC-AC^ GGTGGTCCCAC^_GCTGGGTTCCACCTGAAGAGCCTCCGTGCCTCGGAGCAGGAGAGGCAG GCTATGGCTGTCACCCTCCCTCCTGCCTGTGTCCCAGTGAGAACTGACCTGAGTCCCCTT CC?AACCCAGACCCACCTCCTGCCCCAGGCCCACTGAAGCATGTTCCATTTCTAAAAAGC CCLAGAGTTCLAGTGTGTCC?^GGAAAACCCAAAGTGGAGGTGCTCAGGTCCAGGGGAGTC CAGTGGGCAGGACCCTTGGCAGGCAAGCCCCTCCCTTCACTCCCAGGACCTACCTTCTGC TAGTAAAGGACTGGCTTCATTCTAATTATGGCCCACAGACTGCCCCGGAGACCTGGAGGA CAG<-?GTGCTGGCACTTGGGTGTCCATGGGCCCGTCTGCCGGCTCTGCCTGTGCTGCAAG TGTTGGCCGTGGGTCCAGCCAACAACTCCCTACGTCCTGTGTGGGGCCCTGCCCAAGTGG ATGAGGCATTCCTTGAGGAGTATCATTTTCCCTGACAATCCCCATCACCTTTAGGGGTTC CCTGCTTGGCTCCTTTCCAGCTGAAAAACTAGACCTGTGCCATTGGGGAAGCTGGACÍ-?A GTCTAGGGGGCCCGCCTGGTAGAGGGTCCCGGGAAGCTGGATCTGTCAGCCTCGGCCCTG AGGCCCCTGTTAACTCAAGACTGTGAGCTGCCTCTAGGTGGTCACGTCTGGGAGCTAGCT TGTATGGCTTCTGACCAGTATCAGGATTTCTGTTCTGAGAGCAGCGTGGGCAGCAAGGCA GGGC?GCCC_AGAGGTGGCAGCGG1AGG(_AATCTGGTC_ACTAGGTCTTTGTGATGCCAAAA ATAAAAGAGGGTGGGGTGGGTGCTTTCTGTTCCTCTGATTGGATGGAGTCCGCCAGCAGG CLATGGGGCTACATTCCIAGTGCCTGACTATAGGGAGGCACTCCTGATTCCATGG?GCAGCC CGGACTTTGAGAATGGGCTCTGGTTTGCGGGGGGCAGGCGTACCAGACTGCAAGACCCCC C!AGTACCTC?CCGTGCC-AAATAGGAAGAGGTGGCCTTG_*TGTAGCCAAATGGATCTTTTT AACAGTGTGCCTTTGGGGAGGGACCCATGTCCATGGCTTCGTTGAGGGCCATCCATATGC <_?GCTGGGGGCC?GCCC^C^GTGGCCLATATTG^X:TGC?GC?GGAATGGTGCCCACCTCGG CGAATTGAAGGGCTAAGAGTCCC?GATAGCTAGGC(_!AGAGCTGGAAGCAGACAGTAAGGG GAAGAGCTGCTCCCACAGGAGAGGGAGAGATTCCAGCTCACTGCGCAGCCTGGGAGGAGG CGTGGATCCTGGCACGCTGAGCCTCAGGCACCAGCCTCCCTGTGCTCGACAGCAAAGTCT TGACTCCTTCCTGCTGAG(_?CTGTGCTACCTTCACTGCTCC-AÑAGCCAGACTAACAGCTC TCCAAGCCCTTGGGGTGACTCGGCTTCCAGGAGCTGTTGGAGAAATGAGGATGTCTGTCC CTGTCTGCCTGGGCAGGCCAGATTCCTCCCCAGCAGCCGGGTCTCTCCAGACCCTGATTC GGTGCCTTTCTGTTTACCIAGCTACTTCAATCCCAAAGTTTGAATCTGCAGATACCTTACT CCCAGCCACTTTGCCTTCTTACTGTGTTGTGTGTTTTTCCTGGTGCTTCAAGAGCGTGTG C1AGGGCAAGTGCCGTCACTGGGAACTGCACCAGATGCTCAGACTTGGTTGTCTTATGTTT ACCAATAAATAAAAGTAGACTTTTTCTATTTTTATTTGCTGCTATTTGTGTGTGTGTTTG TGTTTGTGTAGCTAGGTATCTGGCACTTCTGACGATGCATTGTTGCTTTTTTCCCGAAGG TCCCGCAGGAACTGTGGCAATGGTGTGTGTGTGAAATGGTGTGTTAACCGCGTTTTGTTT GCTCCTGTATTGAATAGGAAGCAGTGGCCAGTCTGTCTTCCTTAGAGATGTTAGCATATT TTTATATGTATATATTTTGTACCAAAAAAGAGTGTTCCTTGTTTTGGTTACACTCGAAAT TCTGACCTAGCTGGAGAGGGCTCTGGGCCGAGAGCTTTCACTAAGGGGAGACTTCAGGGG AGGAT?^AGCTTTGAACCAAAGCCAATCACTGGCTTGATTTGTGTTTTTTAATTAAAAAA AAAATCLATT(_ATGTATGC(_ACTTCTAAAAAAAAAAAAAAAAAAAAA?IAAA BC002480 (IMAGEClon ID: 3350037) GGCACGAGGCTGAGACCGGTGCGCCGCGCGCTAGTGGCCGCTCTTCCGCGGGCTAGCGGG CGGTGGGGGCGCC?GCAGCGCGGAAGGCGGGCACGCGGGCCATGGCTCCCTGGGCGGAGG CCGAGCACTCGGCGCTGAACCCGCTGCGCGCGGTGTGGCTCACGCTGACCGCCGCCTTCC TGCTGACCCTACTGCTGCAGCTGCTGCCGCCCGGCCTGCTCCCGGGCTGCGCGATCTTCC AGGACCTGATCCGCTATGGGAAAACCAAGTGTGGGGAGCCGTCGCGCCCCGCCGCCTGCC GAGCCTTTGATGTCCCCAAGAGATATTTTTCCCACTTTTATATCATCTCAGTGCTGTGGA ATGGCTTCCTGCTTTGGTGCCTTACTCAATCTCTGTTGCTGGGAGCACCTTTTCCAAGCT GGCTTCLATGGTTTGCTCIAGAATTCTCGGGGCGGCACAGTTCCAGGGAGGGGAGCTGGCAC TGTCTGCATTCTTAGTGCTAGTATTTCTGTGGCTGCACAGCTTACGAAGACTCTTCGAGT GCCTCTACGTCAGTGTCTTCTCC?ATGTCATGATTCACGTCGTGCAGTACTGTTTTGGAC TTGTCTATTATGTCCTTGTTGGCCTAACTGTGCTGAGCCAAGTGCCAATGGATGGGAGGA ATGCCTAC?TAACLI_GGGAAAA?TCTATTGATGCAAGCACGGTGGTTCCATATTCTTGGGA TGATGATGTTCLATCTGGTC-ATCTGCCCATCAGTATAAGTGCCATGTTATTCTCGGCAATC TCAGGAAAAATAAAGCLAGGAGTGGTCLATTG?CTGTAACCLACI?GGATCCCATTTGGAGACT GGTTTGA?TATGTTTCTTCCGCTA?CTACTTAGCAGAGCTGATGATCTACGTTTCCATGG CCGTCACCTTTGGGTTCCACAACTTAACTTGGTGGCTAGTGGTGACAAATGTGTTCTTTA ATC_AGGCCCTGTCTGCCTTTCTC?GCC?CC-A?TTCTACL?^AA?GCAAATTTGTCTCTTACC CGAAGCATAGGAAAGCTTTCCTACCATTTTTGTTTTAAGTTAACCTCAGTCATG?AGAAT GCLA^CCAGGTGATGGTTTC^^TGCCTAAGGACL?_GTGAAGTCTGGAGCCCAAAGTACAGT TTCLAGC-AAAGCTGTTTGAAACTCTCCATTCCATTTCTATACCCCACAAGTTTTCACTGAA TG&GCATGGC?GTGCC?CTCAAGAAAATGAATCTCCS^ TA?TGGC?GAAA?A?AAAAAAAAAAAA?AAAAAAAAAAAAAAA

Claims (50)

  1. REIVINDICACIONES 1. Un método para determinar el resultado de supervivencia de un sujeto afectado con cáncer de seno si es tratado con tamoxifen u otro agente antiestrógeno contra el cáncer de seno, el método caracterizado porque comprende analizar una muestra de células de cáncer de seno del sujeto para el (los) nivel (es) de expresión de uno o más genes en la Tabla 2 o 3.
  2. 2. El método de conformidad con la reivindicación 1, caracterizado porque el (los) nivel (es) de expresión son indicativos de la probabilidad de recurrencia del cáncer por la vía de metástasis.
  3. 3. El método de conformidad con la reivindicación 1, caracterizado porque el agente antiestrógeno contra el cáncer de seno es seleccionado de un modulador de receptor de estrógeno selectivo (SERM) , regulador hacia abajo del receptor de estrógeno selectivo (SERD) o inhibidor de aromatasa (AI) .
  4. 4. El método de conformidad con la reivindicación 1, caracterizado porque la muestra de las células de cáncer de seno es ER+.
  5. 5. El método de conformidad con la reivindicación 1- caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de ácidos nucleicos preparados mediante la amplificación de mRNA a partir de la muestra de células de cáncer de seno.
  6. 6. El método de conformidad con la reivindicación 1, caracterizado porque el análisis para el nivel de expresión de uno o más gene comprende la detección de ácidos nucleicos a partir de la muestra de células de cáncer de seno mediante PCR cuantitativa.
  7. 7. El método de conformidad con la reivindicación 1, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de proteínas codificadas por los genes o fragmentos proteolíticos de las proteínas.
  8. 8. El método de conformidad con la reivindicación 7, caracterizado porque la detección de proteínas o fragmentos proteolíticos de las mismas comprende la detección de las mismas en la sangre del sujeto o en células epiteliales de cáncer de seno enriquecidas de la sangre del sujeto.
  9. 9. El método de conformidad con la reivindicación 1, caracterizado porque el uno o más genes se selecciona de IL17BR-, CHDH, QPRT y HOXB13.
  10. 10. ün método para determinar la prognosis de un sujeto que tiene cáncer de seno si se trata con tamoxifen u otro agente antiestrógeno contra el cáncer de seno, o de un sujeto afectado con cáncer de seno y tratado con tamoxifen u otro agente antiestrógeno contra el cáncer de seno, el método caracterizado porque comprende: analizar el (los) nivel (es) de expresión de uno o más genes en la Tabla 2 o 3 a partir de una muestra de células de cáncer de seno del sujeto.
  11. 11. El método de conformidad con la reivindicación 10, caracterizado porque el (los) nivel (es) de expresión son indicativos de la probabilidad de recurrencia del cáncer por la vía de metástasis.
  12. 12. El método de conformidad con la reivindicación 10, caracterizado porque el agente antiestrógeno contra el cáncer de seno es seleccionado de un modulador de receptor de estrógeno selectivo (SERM), .regulador hacia abajo del receptor de estrógeno selectivo (SERD) o inhibidor de aromatasa (AI) .
  13. 13. El método de conformidad con la reivindicación 10, caracterizado porque la muestra de células de cáncer de seno es ER+.
  14. 14. El método de conformidad con la reivindicación 10, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de ácidos nucleicos preparados mediante la amplificación de mRNA a partir de la muestra de las células de cáncer de seno.
  15. 15. El método de conformidad con la reivindicación 10, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de ácidos nucleicos de la muestra de células de cáncer de seno mediante PCR cuantitativa.
  16. 16. El método de conformidad con la reivindicación 10, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de proteínas codificadas por los genes o fragmentos proteolíticos de las proteínas .
  17. 17. El método de conformidad con la reivindicación 16, caracterizado porque la detección de proteínas o fragmentos proteolíticos de las mismas comprende la detección de las mismas en la sangre del sujeto o en células epiteliales de cáncer de seno enriquecidas de la sangre del sujeto.
  18. 18. El método de conformidad con la reivindicación 10, caracterizado porque la muestra se obtiene mediante una técnica mínimamente invasiva o seleccionada de biopsia de núcleo, biopsia excisional, muestra de lavado ductal, una muestra de aspiración con aguja fina o células microdisectadas de la muestra.
  19. 19. El método de conformidad con la reivindicación 1, caracterizado porque el uno o más genes es seleccionado de IL17BR, CHDH, QPRT y HOXB13.
  20. 20. ün método para determinar el tratamiento terapéutico de un paciente de cáncer de seno basado en la respuesta esperada del paciente o la falta de respuesta al tratamiento con tamoxifen u otro agente antiestrógeno contra el cáncer de seno, el método caracterizado porque comprende determinar una respuesta o no respuesta esperada al tratamiento con tamoxifen u otro agente antiestrógeno contra el cáncer de seno para el paciente al analizar una muestra de células de cáncer de seno a partir del paciente para el (los) nivel (es) de expresión de uno o más genes en la Tabla 2 o 3; y seleccionar el tratamiento apropiado para un paciente con tal resultado de supervivencia.
  21. 21. El método de conformidad con la reivindicación 20, caracterizado porque el (los) nivel (es) de expresión son indicativos de la probabilidad de la recurrencia del cáncer por la vía de metástasis.
  22. 22. El método de conformidad con la reivindicación 20, caracterizado porque el agente antiestrógeno contra cáncer de seno es seleccionado de un modulador de receptor de estrógeno selectivo (SERM) , regulador hacia abajo del receptor de estrógeno selectivo (SERD) o inhibidor de aromatasa (AI) .
  23. 23. El método de conformidad con la reivindicación 20, caracterizado porque la muestra de células de cáncer de seno es ER+.
  24. 24. El método de conformidad con la reivindicación 20, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de ácidos nucleicos preparados mediante la amplificación de mRNA a partir de la muestra de células de cáncer de seno.
  25. 25. El método de conformidad con la reivindicación 20, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de ácidos nucleicos a partir de la muestra de células de cáncer de seno mediante PCR cuantitativa.
  26. 26. El método de conformidad con la reivindicación 20, caracterizado porque el análisis para el nivel de expresión de uno o más genes comprende la detección de proteínas codificadas por los genes o fragmentos proteolíticos de las proteínas.
  27. 27. El método de conformidad con la reivindicación 26, caracterizado porque la detección de proteínas o fragmentos proteolíticos de las mismas comprende la detección de las mismas en la sangre del sujeto o en células epiteliales de cáncer de seno enriquecidas de la sangre del sujeto.
  28. 28. El método de conformidad con la reivindicación 20, caracterizado porque la muestra se obtiene mediante técnica mínimamente invasiva o seleccionada de biopsia de núcleo, biopsia excisional, una muestra de lavado ductal, una muestra de aspiración con aguja fina o células microdisectadas de la muestra.
  29. 29. El método de conformidad con la reivindicación 1, caracterizado porque el uno o más genes es seleccionado de IL17BR, CHDH, QPRT y H0XB13.
  30. 30. Un método para determinar el resultado de supervivencia de un sujeto humano que tiene cáncer de seno si se trata con tamoxifen u otro agente antiestrógeno contra el cáncer de seno, caracterizado porque comprende analizar una muestra de células de seno del sujeto para la expresión de una o más secuencias H0XB13, IL17BR, QPRT o CHDH u otras secuencias de expresión de la cual es correlacionada con su expresión en células de cáncer de seno, en donde la subexpresión de las secuencias HOXB13 y/o QPRT es indicativa de respuesta, y la sobreexpresión de las secuencias IL17BR y/o CHDH es indicativa de no respuesta, al tratamiento con tamoxifen u otro agente antiestrógeno contra el cáncer de seno.
  31. 31. El método de conformidad con la reivindicación 30, caracterizado porque el agente antiestrógeno contra el cáncer de seno es seleccionado de un modulador de receptor de estrógeno selectivo (SERM), regulador hacia abajo del receptor de estrógeno selectivo (SERD) , o inhibidor de aromatasa (AI) .
  32. 32. El método de conformidad con la reivindicación 30, caracterizado porque la muestra de células de cáncer de seno es ER+ o se obtiene mediante una técnica mínimamente invasiva o seleccionada de la biopsia de núcleo, . iopsia excisional, una * muestra de lavado ductal, una muestra de aspiración con aguja fina o células microdisectadas de la muestra.
  33. 33. El método de conformidad con la reivindicación 30, caracterizado porque el análisis para la expresión comprende la detección de ácidos nucleicos preparados mediante la amplificación de mRNA a partir de la muestra de células de cáncer de seno o la detección de ácidos nucleicos a partir de la muestra de células de cáncer de seno mediante PCR cuantitativa.
  34. 34. El método de conformidad con la reivindicación 30, caracterizado porque el análisis para la expresión comprende la detección de proteínas codificadas por los genes o fragmentos proteolíticos de las proteínas.
  35. 35. El método de conformidad con la reivindicación 34, caracterizado porque la detección de proteínas o fragmentos proteolíticos de las mismas comprende la detección de las mismas en la sangre del sujeto o en células epiteliales del cáncer de seno enriquecidas de la sangre del sujeto.
  36. 36. El método de conformidad con la reivindicación 30, caracterizado porque el análisis es mediante la hibridación a un polinucleótido que comprende secuencias de por lo menos 15 nucleótidos desde la región no traducida 3' , la región de codificación o la región no traducida 5A de las secuencias H0XB13, IL17BR, QPRT o CHDH humanas
  37. 37. El método de conformidad con la reivindicación 30, caracterizado porque el análisis es para la falta de subexpresión de las secuencias HOXB13 o la falta de sobreexpresión de las secuencias IL17BR o CHDH.
  38. 38. El método de conformidad con la reivindicación 30, caracterizado porque el análisis comprende una relación del nivel de expresión de una secuencia H0XB13 o QPRT al nivel de expresión de una secuencia de IL17BR o CHDH.
  39. 39. El método de conformidad con la reivindicación 39, caracterizado porque el análisis comprende una relación del nivel de expresión de una secuencia HOXB13 o QPRT al nivel de expresión de una secuencia IL17BR o CHDH como un indicador de la no respuesta a tamoxifen u otro agente antiestrógeno contra el cáncer de seno.
  40. 40. El método de conformidad con la reivindicación 32, caracterizado porque el análisis para la expresión comprende el análisis de la inactivación o metilación de las secuencias HOXB13, IL17BR, QPRT o CHDH.
  41. 41. El método de conformidad con la reivindicación 32, caracterizado porque el análisis para la expresión de HOXB13 o QPRT comprende la detección de la degradación de mRNA de HOXB13 o QPRT.
  42. 42. Una población de moléculas de ácido nucleico de una sola hebra que comprende una o ambas hebras de una secuencia I 17BR o CACNA1D o H0XB13 o QPRT humana, caracterizada porque por lo menos una porción de la población es hibridada a una o ambas hebras de una molécula de ácido nucleico cuantitativamente amplificada del RNA de una célula de seno.
  43. 43. La población de conformidad con la reivindicación 42, caracterizada porque la población es inmovilizada sobre un soporte sólido, tal como un microarreglo.
  44. 44. La población de conformidad con la reivindicación 42, caracterizada porque las moléculas de ácido nucleico amplificadas de una célula de seno son moléculas de RNA amplificadas .
  45. 45. La población de conformidad con la reivindicación 42, caracterizada porque la célula de seno es ER+.
  46. 46. Un arreglo, caracterizado porque comprende sondas de polinucleótido, capaces de hibridar a las moléculas de ácido nucleico de uno o más de los genes en la Tabla 2 o 3, hibridados a ácidos nucleicos derivados de una o más células de cáncer de seno.
  47. 47. El arreglo de conformidad con la reivindicación 46, caracterizado porque la una o más células de cáncer de seno es ER+.
  48. 48. El arreglo de conformidad con la reivindicación 46, caracterizado porque los ácidos nucleicos derivados de una o más células de cáncer de seno se preparan mediante amplificación de mRNA.
  49. 49. El arreglo de conformidad con la reivindicación 46, caracterizado porque los ácidos nucleicos derivados de una o más células de cáncer de seno son cDNA.
  50. 50. El arreglo de conformidad con la reivindicación 46, caracterizado porque la una o más células ER+ son de una sección de tejido de un sujeto o son microdisectadas de la sección.
MXPA/A/2006/003120A 2003-09-19 2006-03-17 Prediccion del resultado del tratamiento de cancer de seno MXPA06003120A (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US60/504,087 2003-09-19
US10727100 2003-12-02
US10773761 2004-02-06
US60/547,199 2004-02-23

Publications (1)

Publication Number Publication Date
MXPA06003120A true MXPA06003120A (es) 2008-09-26

Family

ID=

Similar Documents

Publication Publication Date Title
US20180127834A1 (en) Predicting breast cancer treatment outcome
EP1670946A1 (en) Predicting breast cancer treatment outcome
US20050239079A1 (en) Predicting outcome with tamoxifen in breast cancer
CA2776751C (en) Methods to predict clinical outcome of cancer
EP2615183B1 (en) Predictors of patient response to treatment with EGF receptor inhibitors
JP2020031642A (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
US20220186317A1 (en) Predicting breast cancer recurrence
JP2007521005A (ja) 癌再発の可能性の予測
WO2009032084A1 (en) Expression profiles of biomarker genes in notch mediated cancers
US20230083179A1 (en) Integration of tumor characteristics with breast cancer index
CA2684897A1 (en) Prostate cancer survival and recurrence
AU2013243300A1 (en) Gene expression panel for breast cancer prognosis
MXPA06003120A (es) Prediccion del resultado del tratamiento de cancer de seno
CA2864996A1 (en) A method of classifying a cell-containing sample as containing tumor cells or tissue
ES2399246T3 (es) Predicción del resultado del tratamiento del cáncer de mama
US20050255481A1 (en) Progesterone receptor transcript sequences
WO2013059152A2 (en) Methods and kits for selection of a treatment for breast cancer
AU2014318859A1 (en) Predicting breast cancer recurrence