ES2366178T3 - DIAGNOSIS AND FORECAST OF BREAST CANCER IN PATIENTS. - Google Patents

DIAGNOSIS AND FORECAST OF BREAST CANCER IN PATIENTS. Download PDF

Info

Publication number
ES2366178T3
ES2366178T3 ES02746538T ES02746538T ES2366178T3 ES 2366178 T3 ES2366178 T3 ES 2366178T3 ES 02746538 T ES02746538 T ES 02746538T ES 02746538 T ES02746538 T ES 02746538T ES 2366178 T3 ES2366178 T3 ES 2366178T3
Authority
ES
Spain
Prior art keywords
seq
expression
template
gene
expression profile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02746538T
Other languages
Spanish (es)
Inventor
Hongyue Dai
Yudong He
Peter S. Linsley
Mao Mao
Christopher J. Roberts
Laura Johanna Van't Veer
Marc J. Van De Vijver
Rene Bernards
A. A. M. Hart
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netherlands Cancer Institute
Merck Sharp and Dohme LLC
Original Assignee
Netherlands Cancer Institute
Merck Sharp and Dohme LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netherlands Cancer Institute, Merck Sharp and Dohme LLC filed Critical Netherlands Cancer Institute
Application granted granted Critical
Publication of ES2366178T3 publication Critical patent/ES2366178T3/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Método para clasificar a un individuo aquejado de cáncer de mama como poseedor de buen pronóstico o pronóstico deficiente, en donde dicho individuo es un humano, en donde dicho pronóstico indica que se espera que dicho individuo no tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama y en donde dicho pronóstico deficiente indica que se espera que dicho individuo tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, que comprende (ia) calcular un primer parámetro clasificador entre un primer perfil de expresión y una plantilla de buen pronóstico, o (ib) calcular un segundo parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico y un tercer parámetro clasificador entre dicho primer perfil de expresión y una plantilla de pronóstico deficiente; comprendiendo dicho primer perfil de expresión los niveles de expresión de una primera pluralidad de genes en una muestra de células tomada del individuo, comprendiendo dicha plantilla de buen pronóstico, para cada gen en dicha primera pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que no tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; y comprendiendo dicha plantilla de pronóstico deficiente, para cada gen en dicha primera pluralidad, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; consistiendo dicha primera pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 5, y (iia) clasificar a dicho individuo como poseedor de buen pronóstico si dicho primer parámetro clasificador está por encima de un umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de buen pronóstico que a dicha plantilla de pronóstico deficiente, o (iib) clasificar a dicho individuo como poseedor de dicho pronóstico deficiente si dicho primer parámetro clasificador está por debajo de dicho umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de pronóstico deficiente que a dicha plantilla de buen pronóstico.Method for classifying an individual suffering from breast cancer as having a good prognosis or poor prognosis, where said individual is a human, where said prognosis indicates that said individual is not expected to have distant metastases within five years after initial diagnosis of breast cancer and where said poor prognosis indicates that said individual is expected to have distant metastases within five years after the initial diagnosis of breast cancer, which comprises (ia) calculating a first classifying parameter between a first profile of expression and a good forecast template, or (ib) calculate a second classifier parameter between said first expression profile and said good forecast template and a third classifier parameter between said first expression profile and a poor forecast template; said first expression profile comprising the expression levels of a first plurality of genes in a sample of cells taken from the individual, said template comprising a good prognosis, for each gene in said first plurality of genes, the average expression level of said gene in a plurality of patients who do not have distant metastases within five years of the initial diagnosis of breast cancer; and said poor prognosis template comprising, for each gene in said first plurality, the average level of expression of said gene in a plurality of patients having distant metastases within five years following the initial diagnosis of breast cancer; said first plurality of genes consisting of at least 5 of the genes whose markers are listed in Table 5, and (iia) classifying said individual as having a good prognosis if said first classifying parameter is above a chosen threshold or if said first expression profile is more similar to said good forecast template than to said poor forecast template, or (iib) classifying said individual as having said poor forecast if said first classifying parameter is below said chosen threshold or if said The first expression profile is more similar to said poor forecast template than to said good forecast template.

Description

1. one.
CAMPO DE APLICACIÓN DE LA INVENCIÓN FIELD OF APPLICATION OF THE INVENTION

[0001] La presente invención se refiere a la identificación de genes marcadores que sirven para el diagnóstico y el pronóstico del cáncer de mama. Más concretamente, la invención se refiere a la identificación de un conjunto de genes marcadores asociados al cáncer de mama, un conjunto de genes marcadores expresados diferenciadamente en tumores de receptor de estrógeno (+) frente a receptor de estrógeno (-), un conjunto de genes marcadores expresados diferenciadamente en el BRCA1 frente a tumores esporádicos y un conjunto de genes marcadores expresados diferenciadamente en tumores esporádicos procedentes de pacientes con buen pronóstico clínico (esto es, sin metástasis ni dolencia durante más de 5 años) frente a pacientes con pronóstico clínico deficiente (esto es, sin metástasis ni dolencia durante menos de 5 años). Para cada uno de los conjuntos marcadores mencionados más arriba la invención se refiere además a métodos para distinguir las afecciones que se dan en el cáncer de mama. También se describen métodos para determinar el curso del tratamiento de las pacientes con cáncer de mama. [0001] The present invention relates to the identification of marker genes that serve for the diagnosis and prognosis of breast cancer. More specifically, the invention relates to the identification of a set of marker genes associated with breast cancer, a set of marker genes expressed differently in estrogen receptor (+) tumors versus estrogen receptor (-), a set of marker genes expressed differently in BRCA1 against sporadic tumors and a set of marker genes expressed differently in sporadic tumors from patients with good clinical prognosis (that is, without metastasis or disease for more than 5 years) versus patients with poor clinical prognosis (that is, without metastasis or medical condition for less than 5 years). For each of the marker sets mentioned above, the invention also relates to methods for distinguishing the conditions that occur in breast cancer. Methods to determine the course of treatment of breast cancer patients are also described.

2. 2.
ANTECEDENTES DE LA INVENCIÓN BACKGROUND OF THE INVENTION

[0002] El número creciente de casos de cáncer declarados en los Estados Unidos, y de hecho en todo el mundo, constituye un grave problema. Actualmente se dispone sólo de unos cuantos tratamientos para tipos específicos de cáncer, pero que no ofrecen garantía alguna de éxito. Para aumentar su eficacia, estos tratamientos tendrían que facilitar no sólo una detección más precoz del carácter maligno del tumor, sino también una valoración fiable de la gravedad de dicho tumor. [0002] The increasing number of cancer cases reported in the United States, and indeed worldwide, is a serious problem. Currently, only a few treatments are available for specific types of cancer, but they offer no guarantee of success. To increase their effectiveness, these treatments would have to facilitate not only a more early detection of the malignant nature of the tumor, but also a reliable assessment of the severity of said tumor.

[0003] La incidencia del cáncer de mama, una de las causas principales de muerte entre las mujeres, ha ido aumentando gradualmente en los Estados Unidos en los treinta últimos años. Su riesgo acumulativo es relativamente alto; se prevé que, en los Estados Unidos, 1 de cada 8 mujeres desarrollará cáncer de mama antes de que cumpla 85 años. De hecho, el cáncer de mama es el cáncer más corriente entre las mujeres y la segunda causa más frecuente de muerte por cáncer en los Estados Unidos. En 1997 se estimó en 181.000 el número de nuevos casos declarados en los Estados Unidos, así como que 44.000 personas morirían de cáncer de mama (Parker et a/., CA Cancer J. Clin. 47:5-27 (1997); Chu et al., J. Nat. Cancer Inst. 88:1571-1579 (1996)). Aunque se conoce en gran medida el mecanismo de oncogénesis de la mayoría de los carcinomas de mama, existen factores genéticos que pueden predisponer a algunas mujeres a desarrollar cáncer de mama ((Miki et al., Science, 266:66-71(1994)). El descubrimiento y la caracterización del BRCA1 y BRCA2 ha ampliado recientemente nuestro conocimiento de los factores genéticos que pueden contribuir al cáncer de mama familiar. Las mutaciones germinales en estos dos loci suponen de un 50 a un 85% del riesgo de cáncer de mama o de ovarios a lo largo de la vida (Casey, Curr. Opin. Oncol. 9:88-93 (1997); Marcus et al., Cancer 77:697-709 (1996)). Solo de un 5% a un 10% de casos de cáncer están relacionados con los genes de susceptibilidad al cáncer de mama, BRCA1 y BRCA2. El riesgo de cáncer acumulado a lo largo de la vida para las mujeres portadoras del BRCA1 mutante se calcula en aproximadamente el 92%, mientras que el riesgo acumulado a lo largo de la vida para la mayoría de no portadoras se estima en aproximadamente un 10%. El BRCA1 es un gen supresor de tumores que interviene en la reparación del ADN y en el control del ciclo celular, ambos de suma importancia para el mantenimiento de la estabilidad genómica. Más del 90% de todas las mutaciones reveladas hasta ahora desembocan en un truncamiento prematuro del producto proteínico con función anormal o suprimida. La histología del cáncer de mama en los portadores de la mutación BRCA1 varía en casos esporádicos, pero el análisis de la mutación es la única manera de hallar a la portadora. [0003] The incidence of breast cancer, one of the leading causes of death among women, has been gradually increasing in the United States over the past thirty years. Its cumulative risk is relatively high; It is expected that, in the United States, 1 in 8 women will develop breast cancer before they turn 85. In fact, breast cancer is the most common cancer among women and the second most frequent cause of cancer death in the United States. In 1997, the number of new cases declared in the United States was estimated at 181,000, as well as 44,000 people would die of breast cancer (Parker et a /., CA Cancer J. Clin. 47: 5-27 (1997); Chu et al., J. Nat. Cancer Inst. 88: 1571-1579 (1996)). Although the oncogenesis mechanism of most breast carcinomas is largely known, there are genetic factors that may predispose some women to develop breast cancer ((Miki et al., Science, 266: 66-71 (1994) The discovery and characterization of BRCA1 and BRCA2 has recently expanded our knowledge of the genetic factors that can contribute to family breast cancer.The germ mutations in these two loci account for 50 to 85% of the risk of breast cancer or ovaries throughout life (Casey, Curr. Opin. Oncol. 9: 88-93 (1997); Marcus et al., Cancer 77: 697-709 (1996)). Only 5% to one 10% of cancer cases are related to breast cancer susceptibility genes, BRCA1 and BRCA2 The risk of accumulated cancer throughout life for women carrying mutant BRCA1 is estimated at approximately 92%, while the risk accumulated throughout life for the majority of the unported Flush is estimated at approximately 10%. BRCA1 is a tumor suppressor gene that is involved in DNA repair and cell cycle control, both of utmost importance for maintaining genomic stability. More than 90% of all mutations revealed so far lead to premature truncation of the protein product with abnormal or suppressed function. The histology of breast cancer in carriers of the BRCA1 mutation varies in sporadic cases, but analysis of the mutation is the only way to find the carrier.

Al igual que el BRCA1, el BRCA2 interviene en el desarrollo del cáncer de mama y, al igual que el BRC41, juega su papel en la reparación del ADN. Sin embargo, a diferencia del BRCA1, no está presente en el cáncer de ovarios Like BRCA1, BRCA2 is involved in the development of breast cancer and, like BRC41, plays its role in DNA repair. However, unlike BRCA1, it is not present in ovarian cancer

[0004] En la técnica se conocen marcadores moleculares para diferenciar los tipos de tumores. [0004] Molecular markers for differentiating tumor types are known in the art.

Perou CM, et al. (Nature 2000 406:747-752) efectúan retratos moleculares de tumores del cáncer de mama humano. Se identificó un subconjunto de genes en el que la variación en expresión era mayor entre tumores diferentes que entre muestras emparejadas del mismo tumor. Alizadeh AA, et al. (Nature 2000 403:503-511) describen dos formas diferentes de linfoma difuso de células B grandes (DLBCL) identificadas sobre la base del patrón de expresión de genes. Se identificó un subconjunto de genes al hallarse expresado de forma selectiva en una de las dos formas de DLBCL. Perou CM, et al. (PNAS 1999 96:9212-9217) describen patrones de expresión de genes diferenciados en las células epiteliales mamarias humanas y cánceres de mama. En respuesta a una serie de perturbaciones experimentales, se identificó un subconjunto de genes en los que se apreciaba claramente una expresión diferenciada en las células epiteliales mamarias humanas. Khan J, et al. (Nature Medicine 2001 7:673-679) describen un criterio de clasificación y predicción diagnóstica de cánceres mediante perfiles de expresión de genes y redes neuronales artificiales. Se usó un subconjunto de genes para clasificar pequeñas muestras de tumores de células redondas y azules en categorías diagnósticas. Hedenfalk I, et al. (New Eng J Med 2001 344:539.548) describen perfiles de expresión de genes en el cáncer de mama hereditario e identificaron un subconjunto de genes que se dividía en tumores mutantes de BRCA1, tumores mutantes de BRCA2 y tumores esporádicos de tejido de cáncer de mama. A diferencia de estos documentos donde se da a conocer métodos para distinguir los tipos de tumores, la presente invención ofrece métodos para determinar si los individuos con cáncer de mama han tenido un pronóstico bueno o deficiente. Perou CM, et al. (Nature 2000 406: 747-752) perform molecular portraits of human breast cancer tumors. A subset of genes was identified in which the variation in expression was greater between different tumors than between paired samples of the same tumor. Alizadeh AA, et al. (Nature 2000 403: 503-511) describe two different forms of diffuse large B-cell lymphoma (DLBCL) identified on the basis of the gene expression pattern. A subset of genes was identified by being expressed selectively in one of two forms of DLBCL. Perou CM, et al. (PNAS 1999 96: 9212-9217) describe patterns of differentiated gene expression in human mammary epithelial cells and breast cancers. In response to a series of experimental disturbances, a subset of genes was identified in which a distinct expression was clearly seen in human mammary epithelial cells. Khan J, et al. (Nature Medicine 2001 7: 673-679) describe a criterion of classification and diagnostic prediction of cancers by means of gene expression profiles and artificial neural networks. A subset of genes was used to classify small samples of round and blue cell tumors into diagnostic categories. Hedenfalk I, et al. (New Eng J Med 2001 344: 539,548) describe gene expression profiles in hereditary breast cancer and identified a subset of genes that were divided into BRCA1 mutant tumors, BRCA2 mutant tumors and sporadic breast cancer tissue tumors . Unlike these documents where methods for distinguishing types of tumors are disclosed, the present invention offers methods for determining whether individuals with breast cancer have had a good or poor prognosis.

[0005] Con el cáncer de mama se ha relacionado también otros genes, por ejemplo el c-erb-2 (HER2) y el p53 (Beenken et al., Ann. Surg. 233(5):630-638 (2001). La superexpresión del c-erb-2 (HER2) y del p53 se ha relacionado con pronósticos deficientes (Rudolph et al., Hum. Pathol. 32(3):311-319 (2001), pues ha sido una expresión aberrante de productos de mdm2 (Lukas et al., Cancer Res. 61(7):3212-3219 (2001) y ciclina 1 y p27 (Porter & Roberts, International Publication WO98/33450, publicado el 6 de agosto de 1998). No obstante, no se han identificado otros marcadores clínicamente útiles y estrechamente asociados al cáncer de mama. [0005] Other genes have also been linked to breast cancer, for example c-erb-2 (HER2) and p53 (Beenken et al., Ann. Surg. 233 (5): 630-638 (2001) The overexpression of c-erb-2 (HER2) and p53 has been associated with poor prognosis (Rudolph et al., Hum. Pathol. 32 (3): 311-319 (2001), as it has been an aberrant expression of mdm2 products (Lukas et al., Cancer Res. 61 (7): 3212-3219 (2001) and cyclin 1 and p27 (Porter & Roberts, International Publication WO98 / 33450, published August 6, 1998). , no other clinically useful and closely associated markers to breast cancer have been identified.

[0006] Los tumores esporádicos, o sea, aquellos no asociados comúnmente a una mutación germinal conocida, constituyen el cáncer de mama en la mayoría de los casos. También es probable que otros factores, no genéticos, influyan de modo significativo en la etiología de la enfermedad. Independientemente del origen del cáncer, la morbilidad y mortalidad del cáncer de mama aumentan de modo significativo si no se detectan en la fase inicial de su progreso. Por consiguiente, se han dedicado muchos esfuerzos a la detección precoz de la transformación celular y la formación de tumores en el tejido mamario. [0006] Sporadic tumors, that is, those not commonly associated with a known germ mutation, constitute breast cancer in most cases. It is also likely that other factors, not genetic, significantly influence the etiology of the disease. Regardless of the origin of the cancer, the morbidity and mortality of breast cancer increase significantly if they are not detected in the initial phase of its progress. Consequently, many efforts have been devoted to the early detection of cell transformation and tumor formation in breast tissue.

[0007] La identificación y caracterización del tumor basándose en marcadores hace esperar una mayor fiabilidad del diagnóstico y del pronóstico. Típicamente, para el diagnóstico del cáncer de mama se requiere una prueba histopatológica de la presencia del tumor. Además del diagnóstico, los exámenes histopatológicos también suministran información sobre el pronóstico y la selección de regímenes de tratamiento. El pronóstico se puede basar también en parámetros clínicos, como el tamaño del tumor, el grado del tumor, la edad de la paciente y la metástasis del ganglio linfático. [0007] The identification and characterization of the tumor based on markers makes the diagnosis and prognosis more reliable. Typically, a histopathological test of the presence of the tumor is required for the diagnosis of breast cancer. In addition to diagnosis, histopathological exams also provide information on the prognosis and selection of treatment regimens. The prognosis can also be based on clinical parameters, such as tumor size, tumor grade, patient age and lymph node metastasis.

[0008] El diagnóstico y/o el pronóstico se puede determinar en diversos grados de eficacia por observación directa del exterior de la mama, mediante mamografía o por otros métodos de imagen por rayos X (Jatoi, Am. J. Surg. 177:518-524 (1999)). Estos últimos, no obstante, tienen un coste elevado. Cada vez que se le hace una mamografía, la paciente corre un leve riesgo de tener un tumor de mama inducido por las propiedades ionizantes de la radiación usada durante la prueba. Además, el proceso es caro y las interpretaciones subjetivas de un técnico pueden llevar a imprecisión. Por ejemplo, un estudio mostró discrepancias clínicas importantes en aproximadamente un tercio de un conjunto de mamografías que fueron interpretadas individualmente por un grupo de radiólogos a que se encuestó. Asimismo, muchas mujeres opinan que someterse a una mamografía es una experiencia dolorosa. En consecuencia, el National Cancer Institute desaconseja las mamografías para mujeres que no hayan cumplido los cincuenta años, ya que este colectivo no es tan propenso a desarrollar cáncer de mama como el de las mujeres de más edad. Hay que tener en cuenta, no obstante, que, aunque sólo el 22% de los casos de cáncer de mama se da en mujeres menores de cincuenta años, los datos muestran que el cáncer de mama es más agresivo en mujeres premenopáusicas. [0008] The diagnosis and / or prognosis can be determined to varying degrees of efficacy by direct observation of the outside of the breast, by mammography or by other X-ray imaging methods (Jatoi, Am. J. Surg. 177: 518 -524 (1999)). The latter, however, have a high cost. Each time a mammogram is done, the patient runs a slight risk of having a breast tumor induced by the ionizing properties of the radiation used during the test. In addition, the process is expensive and the subjective interpretations of a technician can lead to inaccuracy. For example, one study showed significant clinical discrepancies in approximately one third of a set of mammograms that were interpreted individually by a group of radiologists who were surveyed. Also, many women think that having a mammogram is a painful experience. Consequently, the National Cancer Institute advises against mammograms for women who have not turned fifty, since this group is not as prone to developing breast cancer as that of older women. It must be taken into account, however, that although only 22% of breast cancer cases occur in women under fifty, the data shows that breast cancer is more aggressive in premenopausal women.

[0009] En la práctica clínica es importante un diagnóstico exacto de los diversos tipos de cáncer de mama, ya que las opciones de tratamiento, el pronóstico y la probabilidad de la respuesta terapéutica varían todos en función del diagnóstico. Con un pronóstico acertado, o con una determinación de la supervivencia libre de metástasis distante, el oncólogo podrá personalizar la administración de quimioterapia adyuvante, mientras que a las mujeres con peores pronósticos se les aplican los tratamientos más agresivos. Además, la predicción exacta de pronósticos deficientes tendría gran impacto en los ensayos clínicos de nuevas terapias contra el cáncer de mama, ya que entonces las potenciales pacientes de estudio podrían estratificarse según el pronóstico. Así, los ensayos se limitarían a las pacientes con pronósticos deficientes, con lo que a su vez sería más fácil discernir si una terapia experimental es eficaz. [0009] In clinical practice, an accurate diagnosis of the various types of breast cancer is important, since treatment options, prognosis and the likelihood of the therapeutic response all vary depending on the diagnosis. With a successful prognosis, or with a determination of survival free from distant metastases, the oncologist can customize the administration of adjuvant chemotherapy, while the most aggressive treatments are applied to women with worse prognoses. In addition, the exact prediction of poor prognoses would have a great impact on the clinical trials of new therapies against breast cancer, since then the potential study patients could be stratified according to the prognosis. Thus, the trials would be limited to patients with poor prognosis, which in turn would be easier to discern if an experimental therapy is effective.

[0010]Hasta la fecha no se ha identificado ningún conjunto de predictores de pronóstico satisfactorios basados exclusivamente en información clínica. La detección de las mutaciones del BRCA1 o del BRCA2 constituye un paso hacia el diseño de terapias para controlar mejor e impedir la aparición de estos tumores. Sin embargo, no existen medios equivalentes para el diagnóstico de pacientes con tumores esporádicos, que es el tipo más corriente de tumor de cáncer de mama, ni tampoco de dispone de medios para diferenciar los subtipos de cáncer de mama. [0010] To date, no set of satisfactory prognostic predictors based solely on clinical information has been identified. The detection of BRCA1 or BRCA2 mutations constitutes a step towards the design of therapies to better control and prevent the appearance of these tumors. However, there are no equivalent means for the diagnosis of patients with sporadic tumors, which is the most common type of breast cancer tumor, nor does it have the means to differentiate breast cancer subtypes.

3. RESUMEN DE LA INVENCIÓN 3. SUMMARY OF THE INVENTION

[0011] La invención suministra conjuntos de marcadores de genes que distinguen entre diversos tipos y subtipos de cáncer de mama, así como métodos para su uso. La invención suministra un método para determinar si un individuo aquejado de cáncer de mama tiene un pronóstico bueno o deficiente, en donde dicho individuo es un humano, en donde dicho buen pronóstico indica que se espera que el individuo en cuestión no tenga metástasis distantes dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, y en donde dicho pronóstico deficiente indica que se espera que el individuo en cuestión tenga metástasis distantes dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, y que supone: (ia) calcular un primer parámetro clasificador entre un primer perfil de expresión y una plantilla de buenos pronósticos, o (ib) calcular un segundo parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buenos pronósticos y un tercer parámetro clasificador entre dicho primer perfil de expresión y una plantilla de pronósticos deficientes; dicho primer perfil de expresión comprende los niveles de expresión de una primera serie de genes en una muestra de células tomada del individuo, dicha plantilla de buenos pronósticos comprende para cada gen de dicha primera serie de genes el nivel medio de expresión de dicho gen en una serie de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; dicha primera serie de genes consta de al menos 5 de los genes para los que se incluye una lista de marcadores en la Tabla 5, y (iia) determinar si dicho individuo tiene buen pronóstico si dicho primer parámetro de clasificación está por encima de un umbral establecido o si dicho primer perfil de expresión es más parecido a dicha plantilla de buenos pronósticos que a dicha plantilla de pronósticos deficientes, o (iib) determinar si dicho individuo tiene dicho pronóstico deficiente si dicho primer parámetro de clasificación está por debajo de dicho umbral establecido o si dicho primer perfil de expresión es más parecido a dicha plantilla de pronósticos deficientes que a dicha plantilla de buenos pronósticos. En una de las materializaciones se describe un método para clasificar una muestra de células como ER (+) o ER (-) que supone detectar una diferencia en la expresión de una primera serie de genes con respecto a un control, constando dicha primera serie de genes de al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 1. En materializaciones específicas, dicha serie de genes consta de al menos 50, 100, 200, 500, 1.000, hasta 2.460 de los genes enumerados en la Tabla 1. En otra materialización específica, dicha serie de genes consta de cada uno de los genes correspondientes a los 2.460 marcadores enumerados en la Tabla 1. En otra materialización específica, dicha serie consta de los 550 marcadores enumerados en la Tabla 2. En otra materialización específica, dicho control comprende ácidos nucleicos obtenidos de una reserva de tumores de pacientes esporádicas concretas. En otra materialización específica, dicha detección comprende los pasos de: (a) generar una plantilla de ER (+) mediante la hibridación de ácidos nucleicos obtenidos de una serie de pacientes con E (+) dentro de una serie de pacientes esporádicas contra ácidos nucleicos obtenidos de una reserva de tumores de pacientes esporádicas concretas; (b) generar una plantilla de ER (-) mediante la hibridación de ácidos nucleicos obtenidos de una serie de pacientes con ER () dentro de dicha serie de pacientes esporádicas contra ácidos nucleicos obtenidos de dicha reserva de tumores de pacientes esporádicas concretas dentro de dicha serie; (c) hibridar ácidos nucleicos obtenidos de una muestra específica contra dicha reserva; y (d) determinar la semejanza de la expresión de gen marcador en la muestra específica con la plantilla de ER (+) y la plantilla de ER (-), en donde si dicha expresión es más parecida a la plantilla de ER (+), se clasifica la muestra como ER (+), mientras que si dicha expresión es más parecida a la plantilla de ER (-), se clasifica la muestra como ER (-). [0011] The invention provides sets of gene markers that distinguish between various types and subtypes of breast cancer, as well as methods for their use. The invention provides a method for determining whether an individual suffering from breast cancer has a good or poor prognosis, wherein said individual is a human, wherein said good prognosis indicates that the individual in question is expected not to have distant metastases within five years after the initial diagnosis of breast cancer, and where said poor prognosis indicates that the individual in question is expected to have distant metastases within five years after the initial diagnosis of breast cancer, and that it supposes: (ia ) calculating a first classifier parameter between a first expression profile and a good forecast template, or (ib) calculating a second classifier parameter between said first expression profile and said good forecast template and a third classifier parameter between said first profile of poor expression and forecast template; said first expression profile comprises the levels of expression of a first series of genes in a sample of cells taken from the individual, said template of good prognoses comprises for each gene of said first series of genes the average level of expression of said gene in a series of patients who have distant metastases within five years of the initial diagnosis of breast cancer; said first series of genes consists of at least 5 of the genes for which a list of markers is included in Table 5, and (iia) determining whether said individual has a good prognosis if said first classification parameter is above a threshold established or if said first expression profile is more similar to said good forecast template than to said poor forecast template, or (iib) determine if said individual has said poor forecast if said first classification parameter is below said established threshold or if said first expression profile is more similar to said poor forecast template than to said good forecast template. In one of the materializations a method is described for classifying a sample of cells as ER (+) or ER (-) which involves detecting a difference in the expression of a first series of genes with respect to a control, said first series consisting of genes of at least 5 of the genes corresponding to the markers listed in Table 1. In specific embodiments, said series of genes consists of at least 50, 100, 200, 500, 1,000, up to 2,460 of the genes listed in Table 1. In another specific materialization, said series of genes consists of each of the genes corresponding to the 2,460 markers listed in Table 1. In another specific materialization, said series consists of the 550 markers listed in Table 2. In another materialization specifically, said control comprises nucleic acids obtained from a tumor pool of specific sporadic patients. In another specific materialization, said detection comprises the steps of: (a) generating an ER template (+) by hybridizing nucleic acids obtained from a series of patients with E (+) within a series of sporadic patients against nucleic acids obtained from a tumor pool of specific sporadic patients; (b) generate an ER template (-) by hybridizing nucleic acids obtained from a series of patients with ER () within said series of sporadic patients against nucleic acids obtained from said tumor pool of specific sporadic patients within said series Serie; (c) hybridize nucleic acids obtained from a specific sample against said reserve; and (d) determine the similarity of the marker gene expression in the specific sample with the ER template (+) and the ER template (-), where if said expression is more similar to the ER template (+) , the sample is classified as ER (+), while if said expression is more similar to the ER (-) template, the sample is classified as ER (-).

[0012] Ya se han descrito más arriba métodos aplicados a la clasificación como BRCA1 o esporádico. La invención suministra los métodos de más arriba aplicados a la clasificación de pacientes como poseedoras de buen pronóstico o pronóstico deficiente. Para los marcadores de BRCAI/gen esporádico, se puede usar un método en el que la serie de genes es al menos de 5, 20, 50, 100, 200 or 300 de los BRCAI/marcadores esporádicos enumerados en la Tabla 3. En una materialización específica, se usan los 100 marcadores óptimos enumerados en la Tabla 4. Para los marcadores de pronóstico, la invención implica que se pueden usar al menos 5, 20, 50, 100 o 200 marcadores de genes enumerados en la Tabla 5. En una materialización específica, se usan los 70 marcadores óptimos enumerados en la Tabla 6. [0012] Methods applied to classification as BRCA1 or sporadic have already been described above. The invention provides the above methods applied to the classification of patients as having a good prognosis or poor prognosis. For BRCAI / sporadic gene markers, a method can be used in which the gene series is at least 5, 20, 50, 100, 200 or 300 of the BRCAI / sporadic markers listed in Table 3. In a Specific materialization, the 100 optimal markers listed in Table 4 are used. For prognostic markers, the invention implies that at least 5, 20, 50, 100 or 200 gene markers listed in Table 5 can be used. specific materialization, the 70 optimal markers listed in Table 6 are used.

[0013] La invención posibilita además la combinación de los marcadores. En otra materialización se usan al menos 5 marcadores de la Tabla 5 en conjunción con al menos 5 marcadores de la Tabla 3. En otra materialización se usan al menos 5 marcadores de la Tabla 1 en conjunción con al menos 5 marcadores de la Tabla 5. En otra materialización se usan simultáneamente al menos 5 marcadores de cada una de las Tablas 1, 3 y 5. [0013] The invention further enables the combination of the markers. In another embodiment, at least 5 markers in Table 5 are used in conjunction with at least 5 markers in Table 3. In another materialization, at least 5 markers in Table 1 are used in conjunction with at least 5 markers in Table 5. In another materialization, at least 5 markers of each of Tables 1, 3 and 5 are used simultaneously.

[0014] También se describe un método para clasificar una muestra como ER(+) or ER(-) calculando la semejanza entre la expresión de al menos 5 de los marcadores enumerados en la Tabla 1 en la muestra con la expresión de los mismos marcadores en una reserva de ácido nucleico de ER (-) y una reserva de ácido nucleico de ER (+), que comprende los pasos de (a) etiquetar ácidos nucleicos obtenidos de una muestra con un primer fluoróforo para obtener una primera reserva de ácidos nucleicos etiquetados con fluoróforo; (b) etiquetar con un segundo fluoróforo una primera reserva de ácidos nucleicos obtenidos de dos o más muestras de ER(+) y una segunda reserva de ácidos nucleicos obtenidos de dos o más muestras de ER(-); (c) poner en contacto dicho primer ácido nucleico etiquetado con fluoróforo y dicha primera reserva de segundo ácido nucleico etiquetado con fluoróforo con dicho primer biochip en condiciones en que pueda darse dicha hibridación, y poner en contacto dicho primer ácido nucleico etiquetado con fluoróforo y dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo con dicho segundo biochip en condiciones en que pueda darse dicha hibridación, detectando en cada uno de una serie de loci discretos en el primer biochip una primera señal de emisión fluorescente de dicho primer ácido nucleico etiquetado con fluoróforo y una segunda señal de emisión fluorescente de dicha primera reserva de segunda materia genética etiquetada con fluoróforo cuyo destino es dicho primer biochip en dichas condiciones, y detectando en cada uno de los marcadores de loci de dicho segundo biochip dicha primera señal de emisión fluorescente de dicho primer ácido nucleico etiquetado con fluoróforo y una tercera señal de emisión fluorescente de dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo; (d) determinar la semejanza de la muestra con las reservas de ER(-) y ER(+) comparando dichas primeras señales de emisión de fluorescencia y dichas primeras señales de emisión de fluorescencia por una parte, y por otra dichas primeras señales señales de emisión de fluorescencia y dichas terceras señales de emisión de fluorescencia, y clasificar como ER(+)las muestras en que las primeras señales de emisión de fluorescencia sean más parecidas a dichas segundas señales de emisión de fluorescencia que a dichas terceras señales de emisión de fluorescencia y clasificar como ER(-) las muestras en que las primeras señales de emisión sean más parecidas a dichas terceras señales de emisión de fluorescencia que a dichas segundas señales de emisión de fluorescencia, en donde dicha semejanza se define como criterio estadístico. La invención señala además que los demás conjuntos de marcadores que da a conocer pueden usarse en el método de más arriba para distinguir el BRCA1 de los tumores esporádicos, así como las pacientes con diagnóstico deficiente de las pacientes con buen diagnóstico. [0014] A method for classifying a sample as ER (+) or ER (-) is also described by calculating the similarity between the expression of at least 5 of the markers listed in Table 1 in the sample with the expression of the same markers in an ER (-) nucleic acid reserve and an ER (+) nucleic acid reserve, which comprises the steps of (a) labeling nucleic acids obtained from a sample with a first fluorophore to obtain a first nucleic acid reserve labeled with fluorophore; (b) labeling with a second fluorophore a first reserve of nucleic acids obtained from two or more samples of ER (+) and a second reserve of nucleic acids obtained from two or more samples of ER (-); (c) contacting said first fluorophore labeled nucleic acid and said first fluorophore labeled second nucleic acid with said first biochip under conditions where said hybridization can occur, and contacting said first fluorophore labeled nucleic acid and said second pool of second fluorophore-labeled nucleic acid with said second biochip under conditions where said hybridization can occur, detecting in each of a series of discrete loci in the first biochip a first fluorescent emission signal of said first fluorophore-labeled nucleic acid and a second fluorescent emission signal of said first fluorophore-labeled second gene pool whose destination is said first biochip under said conditions, and detecting in each of the loci markers of said second biochip said first fluorescent emission signal of said first nucleic acid labeled c with fluorophore and a third fluorescent emission signal of said second reserve of second fluorophore-labeled nucleic acid; (d) determine the similarity of the sample with the ER (-) and ER (+) reserves by comparing said first fluorescence emission signals and said first fluorescence emission signals on the one hand, and on the other said first signals of fluorescence emission and said third fluorescence emission signals, and classify as ER (+) the samples in which the first fluorescence emission signals are more similar to said second fluorescence emission signals than to said third fluorescence emission signals and classify as ER (-) the samples in which the first emission signals are more similar to said third fluorescence emission signals than to said second fluorescence emission signals, wherein said similarity is defined as statistical criteria. The invention further points out that the other sets of markers it discloses can be used in the above method to distinguish BRCA1 from sporadic tumors, as well as patients with poor diagnosis from patients with good diagnosis.

[0015] En una materialización específica, dicha semejanza se calcula determinando una primera suma de las diferencias de niveles de expresión para cada marcador entre dicho primer ácido nucleico etiquetado con fluoróforo y dicha primera reserva de segundo ácido nucleico etiquetado con fluoróforo y una segunda suma de las diferencias de niveles de expresión para cada marcador entre dicho primer ácido nucleico etiquetado con fluoróforo y dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo, en donde si dicha primera suma es mayor que dicha segunda suma, la muestra se clasifica como ER(-), y si dicha segunda suma es mayor que dicha primera suma, la mezcla se clasifica como ER(+). En otra materialización específica, dicha semejanza se calcula computando un primer parámetro clasificador P1 entre una plantilla de ER(+) y la expresión de dichos marcadores en dicha muestra, y un segundo parámetro clasificador P2 entre una plantilla de ER(-) y la expresión de dichos marcadores en dicha muestra, en donde P1 y P2 se calculan según la fórmula: [0015] In a specific materialization, said similarity is calculated by determining a first sum of differences in expression levels for each marker between said first fluorophore-labeled nucleic acid and said first fluorophore-labeled second nucleic acid reserve and a second sum of the differences in expression levels for each marker between said first fluorophore labeled nucleic acid and said second fluorophore labeled second nucleic acid, wherein if said first sum is greater than said second sum, the sample is classified as ER (- ), and if said second sum is greater than said first sum, the mixture is classified as ER (+). In another specific materialization, said similarity is calculated by computing a first classifier parameter P1 between an ER template (+) and the expression of said markers in said sample, and a second classifier parameter P2 between an ER template (-) and the expression of said markers in said sample, wherein P1 and P2 are calculated according to the formula:

imagen1 Ecuación (1) image 1 Equation (1)

en donde ž1 y ž2 son plantillas de ER(-) y ER(+), respectivamente, y se calculan hallando la media de dicha segunda señal de emisión de fluorescencia para cada uno de dichos marcadores en dicha primera reserva de segundo ácido nucleico etiquetado con fluoróforo y dicha tercera señal de emisión de fluorescencia para cada uno de dichos marcadores en dicha segunda reserva de segundo ácido nucleico etiquetado con fluoróforo, respectivamente, y donde ŷ indica la primera señal de emisión de fluorescencia de cada uno de dichos marcadores en la muestra que se va a clasificar como ER(+) or ER(-), en donde la expresión de los marcadores en la muestra es parecida a ER(+) si P1 < P2, y parecida a ER (-) si P1 > P2. wherein ž1 and ž2 are templates of ER (-) and ER (+), respectively, and are calculated by finding the average of said second fluorescence emission signal for each of said markers in said first reserve of second nucleic acid labeled with fluorophore and said third fluorescence emission signal for each of said markers in said second fluorophore-labeled second nucleic acid reserve, respectively, and where ŷ indicates the first fluorescence emission signal of each of said markers in the sample that it will be classified as ER (+) or ER (-), where the expression of the markers in the sample is similar to ER (+) if P1 <P2, and similar to ER (-) if P1> P2.

[0016] Asimismo se describe un método para identificar genes marcadores cuya expresión esté asociada a un fenotipo en concreto. También se describe un método para determinar un conjunto de genes marcadores cuya expresión esté asociada a un fenotipo en concreto y que comprende los pasos de: (a) seleccionar el fenotipo que tenga dos o más categorías de fenotipo; (b) identificar una serie de genes en donde la expresión de dichos genes esté en correlación o anticorrelación con una de las categorías de fenotipo y en donde el coeficiente de correlación para cada gene se calcula según la ecuación: [0016] A method for identifying marker genes whose expression is associated with a specific phenotype is also described. A method is also described for determining a set of marker genes whose expression is associated with a particular phenotype and comprising the steps of: (a) selecting the phenotype that has two or more phenotype categories; (b) identify a series of genes where the expression of said genes is in correlation or anticorrelation with one of the phenotype categories and where the correlation coefficient for each gene is calculated according to the equation:

imagen1 Ecuación (2) image 1 Equation (2)

en donde č es un número que representa dicha categoría de fenotipo y ř es el cociente de expresión logarítmica en todas las muestras para cada gen en concreto, en donde si el coeficiente de correlación tiene el valor absoluto de un valor umbral o mayor, dicha expresión de dicho gen está asociada a la categoría de fenotipo y en donde dicha serie de genes es un conjunto de genes marcadores cuya expresión está asociada a un fenotipo en concreto. El umbral depende del número de muestras empleadas; el umbral se puede calcular como imagen1 imagen1 3 X where č is a number that represents said category of phenotype and ř is the quotient of logarithmic expression in all samples for each particular gene, where if the correlation coefficient has the absolute value of a threshold value or greater, said expression of said gene is associated with the category of phenotype and where said series of genes is a set of marker genes whose expression is associated with a specific phenotype. The threshold depends on the number of samples used; the threshold can be calculated as image 1 image 1 3 X

en donde es la anchura de distribución y n = el número de muestras. En una materialización específica donde n = 98, dicho valor umbral es 0,3. En una materialización específica, dicho conjunto de genes marcadores se valida mediante: (a) el uso de un criterio estadístico para aleatorizar la asociación entre dichos genes marcadores y dicha categoría de fenotipo, creando de este modo un coeficiente de correlación de control para cada gen marcador; (b) la repetición del paso (a) cien veces o más para desarrollar una distribución de frecuencia de dichos coeficientes de correlación de control para cada gen marcador; (c) la determinación del número de genes marcadores que tengan con coeficiente de correlación de control de un valor umbral o mayor, creando de este modo un conjunto de genes marcadores de control, y (d) la comparación del número de genes marcadores de control identificados como tales con el número de genes marcadores, en donde si el valor p es la diferencia entre el número de genes marcadores y el número de genes de control es menor de 0,01, se valida dicho conjunto de genes marcadores. En otra materialización específica, dicho conjunto de genes marcadores se optimiza con un método que consiste en: (a) ordenación jerarquizada de genes por amplitud de correlación o por relevancia de los coeficientes de correlación, y (b) selección de un número arbitrario de genes marcadores de los puestos más altos de la lista jerarquizada. El valor umbral depende del número de muestras sometidas a prueba. where is the distribution width and n = the number of samples. In a specific materialization where n = 98, said threshold value is 0.3. In a specific materialization, said set of marker genes is validated by: (a) the use of a statistical criterion to randomize the association between said marker genes and said phenotype category, thereby creating a control correlation coefficient for each gene marker; (b) the repetition of step (a) one hundred times or more to develop a frequency distribution of said control correlation coefficients for each marker gene; (c) determining the number of marker genes that have a control correlation coefficient of a threshold value or greater, thereby creating a set of control marker genes, and (d) comparing the number of control marker genes identified as such with the number of marker genes, where if the p-value is the difference between the number of marker genes and the number of control genes is less than 0.01, said set of marker genes is validated. In another specific materialization, said set of marker genes is optimized with a method consisting of: (a) hierarchical ordering of genes by amplitude of correlation or relevance of correlation coefficients, and (b) selection of an arbitrary number of genes markers of the highest positions in the hierarchical list. The threshold value depends on the number of samples tested.

[0017] Asimismo se describe un método para asignar a una persona una serie de categorías en un ensayo clínico, que consiste en determinar para cada persona el nivel de expresión de al menos cinco de los marcadores de pronóstico enumerados en la Tabla 6, determinar a partir de los mismos si la persona tiene un patrón de expresión que se halla en correlación con un buen pronóstico o un pronóstico deficiente, y clasificar a dicha persona en una categoría de un ensayo clínico si se establece que dicha persona tiene un buen pronóstico, o en una categoría diferente si se establece que dicha persona tiene un pronóstico deficiente. También se describe un método para clasificar a una persona en una de una serie de categorías de un ensayo clínico, donde cada una de dichas categorías está asociada a un fenotipo diferente, y que consiste en determinar para cada una de dichas personas el nivel de expresión de al menos cinco marcadores de un conjunto de marcadores, en donde dicho conjunto de marcadores comprende marcadores asociados a cada una de dichas categorías clínicas, determinando a partir de dichos marcadores si la persona tiene un patrón de expresión que se halla en correlación con una de las categorías clínicas y clasificando a dicha persona en una de dichas categorías si se establece que dicha persona tiene un fenotipo asociado a dicha categoría. [0017] A method to assign a person a series of categories in a clinical trial is also described, which consists in determining for each person the level of expression of at least five of the prognostic markers listed in Table 6, determining from them if the person has an expression pattern that correlates with a good prognosis or poor prognosis, and classify said person into a category of a clinical trial if it is established that said person has a good prognosis, or in a different category if it is established that said person has a poor prognosis. A method is also described for classifying a person into one of a series of categories of a clinical trial, where each of these categories is associated with a different phenotype, and which consists in determining for each of said persons the level of expression of at least five markers of a set of markers, wherein said set of markers comprises markers associated with each of said clinical categories, determining from said markers if the person has an expression pattern that correlates with one of the clinical categories and classifying said person into one of said categories if it is established that said person has a phenotype associated with said category.

[0018] Asimismo se describe un método para determinar si la primera célula u organismo tiene uno de al menos dos diferentes fenotipos, consistiendo dichos al menos dos diferentes fenotipos en un primer fenotipo y un segundo fenotipo, método que consiste en: (a) comparar el nivel de expresión de cada uno de una serie de genes en una primera muestra de la primera célula u organismo con el nivel de expresión de cada uno de dichos genes, respectivamente, en una muestra colectiva de una serie de células u organismos, comprendiendo dicha serie de células u organismos diferentes células u organismos cada uno de los cuales muestra los al menos dos diferentes fenotipos, respectivamente, para producir un primer valor comparado; (b) comparar dicho primer valor comparado con un segundo valor comparado, en donde dicho segundo valor comparado es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo caracterizado por tener dicho primer fenotipo al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva; (c) comparar dicho primer valor comparado con un tercer valor comparado, en donde dicho tercer valor comparado es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo caracterizado por tener dicho segundo fenotipo al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva; (d) opcionalmente, llevar a cabo una o más veces el paso de comparar dicho primer valor comparado con uno o más valores comparados adicionales, respectivamente, siendo cada uno de dichos valores comparados adicionales el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo caracterizado por tener un fenotipo diferente de dichos primer y segundo fenotipos, pero incluido en los dichos al menos dos diferentes fenotipos, al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva, y (e) determinar a cuál de dichos segundo, tercero y, si están presentes, a uno o más valores comparados adicionales, es más parecido dicho primer valor comparado adicional, en donde se determina que dicha primera célula u organismo tiene el fenotipo de la célula u organismo usados para producir dicho valor comparado más parecido al primer valor comparado. [0018] A method is also described to determine if the first cell or organism has one of at least two different phenotypes, said at least two different phenotypes consisting of a first phenotype and a second phenotype, a method consisting of: (a) comparing the level of expression of each of a series of genes in a first sample of the first cell or organism with the level of expression of each of said genes, respectively, in a collective sample of a series of cells or organisms, said said comprising series of cells or organisms different cells or organisms each of which shows the at least two different phenotypes, respectively, to produce a first value compared; (b) comparing said first value compared to a second value compared, wherein said second value compared is the product of a method that consists in comparing the level of expression of each of said genes in a sample of a cell or organism characterized by having said first phenotype at the level of expression of each of said genes, respectively, in said collective sample; (c) comparing said first value compared to a third value compared, wherein said third value compared is the product of a method that consists in comparing the level of expression of each of said genes in a sample of a cell or organism characterized by having said second phenotype at the level of expression of each of said genes, respectively, in said collective sample; (d) optionally, performing one or more times the step of comparing said first value compared to one or more additional compared values, respectively, each of said additional comparative values being the product of a method consisting of comparing the level of expression of each of said genes in a sample of a cell or organism characterized by having a different phenotype of said first and second phenotypes, but included in said at least two different phenotypes, at the level of expression of each of said genes, respectively, in said collective sample, and (e) determine which of said second, third and, if present, at one or more additional compared values, said first additional compared value is more similar, where it is determined that said first cell or organism has the phenotype of the cell or organism used to produce said compared value more similar to the first compared value.

[0019] En una materialización específica del método de más arriba, cada uno de dichos valores comparados es el cociente de los niveles de expresión de cada uno de estos genes. En otra materialización específica, cada uno de dichos niveles de expresión de cada uno de dichos genes en dicha muestra colectiva se normaliza antes de proceder a cualquiera de dichos pasos de comparación. En otra materialización específica, la normalización de dichos niveles de expresión se lleva a cabo dividiendo cada uno de dichos niveles de expresión por la mediana o el nivel medio de expresión de uno o más genes constitutivos en dicha muestra colectiva. En una materialización más específica, dichos niveles de expresión normalizados se someten a una transformación logarítmica y dichos pasos de comparación consisten en sustraer dicha transformación logarítmica del logaritmo de dichos niveles de expresión de cada uno de dichos genes en dicha muestra de dicha célula u organismo. En otra materialización específica, dichos al menos dos fenotipos diferentes son etapas diferentes de una enfermedad o desorden. En otra materialización específica, dichos al menos dos fenotipos diferentes son diferentes pronósticos de una enfermedad o desorden. En una materialización específica más, dichos niveles de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva o dichos niveles de expresión de cada uno de dichos genes en una muestra de dicha célula u organismo caracterizada por tener dicho primer fenotipo, dicho segundo fenotipo o dicho fenotipo diferente de dicho primer y segundo fenotipos, respectivamente, se almacenan en un ordenador. [0019] In a specific materialization of the method above, each of said values compared is the quotient of the expression levels of each of these genes. In another specific materialization, each of said expression levels of each of said genes in said collective sample is normalized before proceeding to any of said comparison steps. In another specific materialization, the normalization of said expression levels is carried out by dividing each of said expression levels by the median or the average expression level of one or more constituent genes in said collective sample. In a more specific materialization, said normalized expression levels are subjected to a logarithmic transformation and said comparison steps consist of subtracting said logarithmic transformation of said logarithm levels from each of said genes in said sample of said cell or organism. In another specific materialization, said at least two different phenotypes are different stages of a disease or disorder. In another specific materialization, said at least two different phenotypes are different prognoses of a disease or disorder. In a further specific embodiment, said levels of expression of each of said genes, respectively, in said collective sample or said levels of expression of each of said genes in a sample of said cell or organism characterized by having said first phenotype, said Second phenotype or said different phenotype of said first and second phenotypes, respectively, are stored in a computer.

[0020] Asimismo se describen biochips que comprenden los conjuntos de marcadores que se dan a conocer. Se describe un biochip que comprende al menos 5 marcadores derivados de cualquiera de los de las Tablas 1-6, en donde al menos un 50% de las sondas del biochip están presentes en alguna de las Tablas 1-6. En materializaciones más específicas, al menos un 60%, 70%, 80%, 90%, 95% o 98% de las sondas de dicho biochip están presentes en alguna de las Tablas 1- 6. [0020] Also described are biochips comprising the sets of markers that are disclosed. A biochip comprising at least 5 markers derived from any of Tables 1-6 is described, wherein at least 50% of the biochip probes are present in any of Tables 1-6. In more specific materializations, at least 60%, 70%, 80%, 90%, 95% or 98% of the probes of said biochip are present in any of Tables 1-6.

[0021] Asimismo se describe un biochip para distinguir entre muestras de células ER (+) y ER (-) que comprenden un despliegue de posición direccionable de sondas polinucleótidas conectadas a un soporte, comprendiendo dichas sondas polinucleótidas una serie de sondas polinucleótidas de diferentes secuencias polinucleótidas que comprenden una secuencia complementaria e hibridable con una serie de genes, consistiendo dicha serie en al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 1 o en la Tabla 2, en donde al menos un 50% de las sondas del biochip están presentes en la Tabla 1 o en la Tabla 2. También se describe una selección para distinguir muestras de células afines a Brai y de tipo tumor esporádico que comprenden un despliegue de posición direccionable de sondas polinucleótidas conectadas a un soporte, comprendiendo dichas sondas polinucleótidas una serie de sondas polinucleótidas de diferentes secuencias polinucleótidas, comprendiendo cada una de dichas secuencias polinucleótidas una secuencia complementaria e hibridable con una serie de genes, consistiendo dicha serie en al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 3 o en la Tabla 4, en donde al menos un 50% de las sondas del biochip están presente en la Tabla 3 o en la Tabla 4. Asimismo se describe un biochip para distinguir muestras de células de pacientes que tienen un buen pronóstico y muestras de células de pacientes que tienen un pronóstico deficiente, el cual comprende un despliegue de posición direccionable de sondas polinucleótidas conectadas a un soporte, comprendiendo dichas sondas polinucleótidas una serie de sondas polinucleótidas de diferentes secuencias polinucleótidas, consistiendo cada una de dichas diferentes secuencias polinucleótidas una secuencia complementaria e hibridable con una serie de genes, consistiendo dicha serie en al menos 5 de los genes que corresponden a los marcadores enumerados en la Tabla 5 o en la Tabla 6, en donde al menos un 50% de las sondas del biochip están presentes en la Tabla 5 o en la Tabla 6. También se describen biochips que comprenden al menos 5, 20, 50, 100, 200, 500, 100, 1.250, 1.500, 1.750, o 2.000 de los genes marcadores de categoría ER- enumerados en la Tabla 1, al menos 5, 20, 50, 100, 200 o 300 del los genes marcadores esporádicos del BRCA1 enumerados en la Tabla 3, o al menos 5, 20, 50, 100 o 200 de los genes marcadores de pronóstico enumerados en la Tabla 5, en cualquier combinación, en donde al menos un 50%, 60%, 70%, 80%, 90%, 95% o 98% de las sondas de dichos biochips están presentes en la Tabla 1, la Tabla 3 y/o la Tabla 5. [0021] A biochip is also described to distinguish between ER (+) and ER (-) cell samples comprising an addressable position display of polynucleotide probes connected to a support, said polynucleotide probes comprising a series of polynucleotide probes of different sequences polynucleotides comprising a complementary and hybridizable sequence with a series of genes, said series consisting of at least 5 of the genes corresponding to the markers listed in Table 1 or Table 2, where at least 50% of the probes of the biochip are present in Table 1 or in Table 2. A selection is also described to distinguish samples of Brai-related cells and sporadic tumor type comprising an addressable position display of polynucleotide probes connected to a support, said probes comprising polynucleotides a series of polynucleotide probes of different polynucleotide sequences, comprising each of said polynucleotide sequences a complementary and hybridizable sequence with a series of genes, said series consisting of at least 5 of the genes corresponding to the markers listed in Table 3 or Table 4, where at least 50% of the biochip probes are present in Table 3 or Table 4. A biochip is also described to distinguish cell samples from patients who have a good prognosis and cell samples from patients who have a poor prognosis, which comprises a addressable position display of polynucleotide probes connected to a support, said polynucleotide probes comprising a series of polynucleotide probes of different polynucleotide sequences, each of said different polynucleotide sequences consisting of a complementary and hybridizable sequence with a series of genes, said series consisting of at minus 5 of the genes that correspond to the markers listed in Table 5 or Table 6, where at least 50% of the biochip probes are present in Table 5 or Table 6. Biochips comprising at least 5, 20, 50, 100, 200 are also described. , 500, 100, 1,250, 1,500, 1,750, or 2,000 of the ER-category marker genes listed in Table 1, at least 5, 20, 50, 100, 200 or 300 of the sporadic BRCA1 marker genes listed in the Table 3, or at least 5, 20, 50, 100 or 200 of the prognostic marker genes listed in Table 5, in any combination, where at least 50%, 60%, 70%, 80%, 90% , 95% or 98% of the probes of said biochips are present in Table 1, Table 3 and / or Table 5.

[0022] Se describe un kit para determinar la categoría de ER de una muestra que comprende al menos dos biochips, de los que cada uno comprende 5 de los marcadores enumerados en la Tabla 1, y un sistema informático para determinar la semejanza del nivel de ácido nucleico derivado de los marcadores enumerados en la Tabla 1 en una muestra con el de una reserva de ER (-) y una reserva de ER (+), sistema informático que comprende un procesador y una memoria que lleva codificados uno o más programas acoplados al procesador, en donde dichos uno o más programas hacen que el procesador ejecute un método consistente en computar las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de ER (-) y las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de ER (+), o un método consistente en determinar la correlación calculada según la Ecuación (4). También se describen kits capaces de distinguir entre el BRCA1 y los tumores esporádicos y muestras de pacientes con buen pronóstico de muestras de pacientes con pronóstico deficiente, mediante la inclusión de los conjuntos de genes marcadores apropiados. También se describe un kit para determinar si una muestra procede de una paciente con buen pronóstico o de una con pronóstico deficiente, que comprende al menos un biochip que comprende sondas para al menos 5 de los genes correspondientes a los marcadores enumerados en la Tabla 5, y un soporte informático legible en el que se hayan grabado uno o más programas para determinar la semejanza del nivel de ácido nucleico derivado de los marcadores enumerados en la Tabla 5 en una muestra con el de una reserva de muestras procedentes de individuos con buen pronóstico y una reserva de muestras procedentes de individuos con pronóstico deficiente, en donde dichos uno o más programas hace que un ordenador ejecute un método consistente en computar las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de buen pronóstico y las diferencias agregadas en expresión de cada marcador entre la muestra y la reserva de pronóstico deficiente, o un método consistente en determinar la correlación de expresión de los marcadores de la muestra con la expresión en las reservas de buen pronóstico y pronóstico deficiente, correlación que se calcula según la Ecuación (3). [0022] A kit is described for determining the ER category of a sample comprising at least two biochips, of which each comprises 5 of the markers listed in Table 1, and a computer system for determining the similarity of the level of nucleic acid derived from the markers listed in Table 1 in a sample with that of an ER (-) pool and an ER (+) pool, a computer system comprising a processor and a memory that has one or more coupled programs encoded to the processor, wherein said one or more programs cause the processor to execute a method consisting of computing the aggregate differences in expression of each marker between the sample and the reserve of ER (-) and the aggregate differences in expression of each marker between the sample and ER reserve (+), or a method consisting of determining the correlation calculated according to Equation (4). Kits capable of distinguishing between BRCA1 and sporadic tumors and patient samples with a good prognosis of patient samples with poor prognosis are also described, including the inclusion of appropriate marker gene sets. A kit is also described to determine if a sample comes from a patient with a good prognosis or one with a poor prognosis, which comprises at least one biochip comprising probes for at least 5 of the genes corresponding to the markers listed in Table 5, and a readable computer medium in which one or more programs have been recorded to determine the similarity of the level of nucleic acid derived from the markers listed in Table 5 in a sample with that of a stock of samples from individuals with good prognosis and a reserve of samples from individuals with poor prognosis, where said one or more programs causes a computer to execute a method consisting of computing the aggregate differences in expression of each marker between the sample and the reserve of good prognosis and the aggregate differences in expression of each marker between the sample and the poor prognosis reserve, or a method consists entity in determining the correlation of expression of the markers of the sample with the expression in the reserves of good prognosis and poor prognosis, correlation that is calculated according to Equation (3).

4. BREVE DESCRIPCIÓN DE LAS FIGURAS 4. BRIEF DESCRIPTION OF THE FIGURES

[0023] [0023]

La FIG. 1 es un diagrama de tipo Venn que muestra la superposición entre los conjuntos de marcadores que aquí se dan a conocer, incluidos los 2.460 marcadores de ER, los 430 marcadores de BRCA1/esporádicos y los 231 indicadores de pronóstico. FIG. 1 is a Venn-type diagram that shows the overlap between the sets of markers disclosed here, including the 2,460 ER markers, the 430 BRCA1 / sporadic markers and the 231 prognostic indicators.

La FIG. 2 muestra los procedimientos experimentales para medir diferentes cambios en la densidad de transcripción de ARNm en los tumores de cáncer de mama usados en este estudio. En cada experimento, el ARNc etiquetado como Cy5 de un tumor X se hibrida en un biochip humano de 25k junto con una reserva de ARNc etiquetada como Cy3 hecha de muestras de ARNc de los tumores 1, 2, ... N. Los datos de expresión digital se obtuvieron por escaneo y procesado de imágenes. El error de modelado nos permitió asignar un valor-p a cada medición del cociente de transcripción. FIG. 2 shows the experimental procedures for measuring different changes in mRNA transcription density in breast cancer tumors used in this study. In each experiment, the cRNA labeled as Cy5 of a tumor X is hybridized in a 25k human biochip together with a pool of cRNA labeled as Cy3 made from cRNA samples of tumors 1, 2, ... N. Data Digital expression were obtained by scanning and image processing. The modeling error allowed us to assign a p-value to each measurement of the transcription ratio.

La FIG. 3 El agrupamiento bidimensional revela dos tipos diferenciados de tumores. El agrupamiento se basó en los datos de expresión de genes de 98 tumores de cáncer de mama sobre 4.986 genes relevantes. El gris oscuro (rojo) representa regulación hacia arriba, el gris claro (verde) representa regulación hacia abajo, el negro indica sin cambios en la expresión y el gris indica que los datos no están disponibles. Se seleccionaron 4.986 genes que mostraron un cambio de cociente de más del doble en más de cinco experimentos. Los datos clínicos seleccionados para los resultados de las pruebas de mutaciones del BRCA1, receptor de estrógeno (ER) y receptor de proestrógeno (PR), grado del tumor, infiltrado linfocítico y angioinvasión se muestran a la derecha. El negro indica negativo y el blanco indica positivo. El patrón predominante en la parte inferior consta de 36 pacientes, de las cuales 34 son ER-negativas (total 39), y 16 son portadoras de mutación de BRCA1 (total 18). FIG. 3 Two-dimensional clustering reveals two different types of tumors. Clustering was based on gene expression data from 98 breast cancer tumors on 4,986 relevant genes. Dark gray (red) represents upward regulation, light gray (green) represents downward regulation, black indicates unchanged expression and gray indicates that data is not available. 4,986 genes were selected that showed a more than double ratio change in more than five experiments. The clinical data selected for the results of the BRCA1, estrogen receptor (ER) and proestrogen receptor (PR) mutations, tumor grade, lymphocytic infiltrate and angioinvasion mutations are shown on the right. Black indicates negative and white indicates positive. The predominant pattern in the lower part consists of 36 patients, of which 34 are ER-negative (total 39), and 16 are carriers of BRCA1 mutation (total 18).

FIG. 4 Una porción de resultados agrupados no supervisados, como los de la FIG. 3. ESR1 (el gen receptor de estrógenos) está regulado conjuntamente con un grupo de genes fuertemente regulados entre sí para formar un patrón dominante. FIG. 4 A portion of unmonitored pooled results, such as those in FIG. 3. ESR1 (the estrogen receptor gene) is regulated in conjunction with a group of genes tightly regulated to form a dominant pattern.

FIG. 5A Histograma de coeficientes de correlación de genes relevantes entre sus cocientes de expresión y la categoría del receptor de estrógenos (ER) (esto es, el nivel de ER). El histograma para datos experimentales aparece en línea gris. Los resultados de un ensayo Monte-Carlo aparecen en línea negra gruesa. Hay 2.460 genes cuyos datos de expresión están en correlación con la categoría de ER a un nivel superior a 0,3 o en anticorrelación con la categoría de ER a un nivel inferior a -0.3. FIG. 5A Histogram of correlation coefficients of relevant genes between their expression ratios and the estrogen receptor (ER) category (that is, the ER level). The histogram for experimental data appears in a gray line. The results of a Monte-Carlo trial appear in thick black line. There are 2,460 genes whose expression data are correlated with the ER category at a level greater than 0.3 or in anticorrelation with the ER category at a level less than -0.3.

FIG. 5B La distribución del número de genes que se ajustó a los mismos criterios de selección (amplitud de correlación por encima de 0,3) de entre 10.000 ensayos Monte-Carlo. Se estima que este conjunto de 2.460 genes informa de la categoría de ER a un nivel de fiabilidad de p >99.99%. FIG. 5B The distribution of the number of genes that fit the same selection criteria (amplitude of correlation above 0.3) among 10,000 Monte-Carlo trials. It is estimated that this set of 2,460 genes reports the ER category at a reliability level of p> 99.99%.

FIG. 6 Tasas de error de clasificación para Tipo 1 y Tipo 2 como función del número (excepto 2,460) de genes marcadores usados en el clasificador. La tasa de error combinada más baja se da cuando se usan aproximadamente 550 genes marcadores. FIG. 6 Classification error rates for Type 1 and Type 2 as a function of the number (except 2,460) of marker genes used in the classifier. The lowest combined error rate is given when approximately 550 marker genes are used.

FIG. 7 Clasificación de 98 muestras de tumores como ER(+) o ER(-) basándose en niveles de expresión de los 550 genes marcadores óptimos. Las muestras de ER(+) (por encima de la línea blanca) muestran un patrón de expresión claramente diferente al de las muestras de ER(-) (por debajo de la línea blanca). FIG. 7 Classification of 98 tumor samples as ER (+) or ER (-) based on expression levels of the 550 optimal marker genes. The ER (+) samples (above the white line) show a clearly different expression pattern than the ER (-) samples (below the white line).

FIG. 8 Correlación entre los niveles de expresión en muestras de cada paciente y el perfil medio del grupo de ER(-) con respecto a. la correlación con el grupo de ER(+). Los cuadrados representan muestras de pacientes clínicamente ER(-); los redondeles representan muestras de pacientes clínicamente ER(-). FIG. 8 Correlation between the levels of expression in samples of each patient and the average profile of the ER group (-) with respect to. the correlation with the ER group (+). The squares represent samples of patients clinically ER (-); the rounds represent samples of patients clinically ER (-).

FIG. 9A El histograma de coeficientes de correlación de expresión de genes sobre el cociente de cada gen relevante con la clase de mutación del BRCA1 aparece en línea continua. La línea discontinua indica una distribución de frecuencia a partir de un ensayo Monte-Carlo. 430 genes mostraron una amplitud de correlación o anticorrelación superior a 0,35. FIG. 9A The histogram of gene expression correlation coefficients on the ratio of each relevant gene with the BRCA1 mutation class appears in a continuous line. The dashed line indicates a frequency distribution from a Monte-Carlo test. 430 genes showed an amplitude of correlation or anticorrelation greater than 0.35.

FIG. 9B Distribución de frecuencia del número de genes que muestran una amplitud de correlación o anticorrelación superior a 0,35 para el control de los 10.000 ensayos Monte-Carlo. Media=115.p(n>430)=0.48% y p(>430/2)=9.0%. FIG. 9B Frequency distribution of the number of genes that show an amplitude of correlation or anticorrelation greater than 0.35 for the control of the 10,000 Monte-Carlo trials. Mean = 115.p (n> 430) = 0.48% and p (> 430/2) = 9.0%.

FIG. 10 Tasas de error de clasificación para Tipo 1 y Tipo 2 como función del número de genes discriminantes usados en el clasificador (plantilla). La tasa de error combinada más baja se da cuando se usan aproximadamente 100 genes marcadores discriminantes. FIG. 10 Classification error rates for Type 1 and Type 2 as a function of the number of discriminant genes used in the classifier (template). The lowest combined error rate is given when approximately 100 discriminant marker genes are used.

FIG. 11A La clasificación de 38 tumores del grupo ER(-) en dos subgrupos, BRCA1 y esporádicos, usando el conjunto óptimo de 100 genes marcadores discriminantes. Las pacientes por encima de la línea blanca se caracterizan por patrones asociados al BRCA1. FIG. 11A The classification of 38 tumors of the ER group (-) into two subgroups, BRCA1 and sporadic, using the optimal set of 100 discriminant marker genes. Patients above the white line are characterized by patterns associated with BRCA1.

FIG. 11B Correlación entre niveles de expresión en muestras de cada paciente ER(-) y el perfil medio del grupo BRCA1 frente a correlación con el grupo esporádico. Los cuadrados representan muestras de pacientes con tumores de tipo esporádico; los redondeles representan muestras de pacientes portadoras de la mutación de BRCA1. FIG. 11B Correlation between expression levels in samples of each ER (-) patient and the average profile of the BRCA1 group versus correlation with the sporadic group. The squares represent samples of patients with sporadic tumors; the rounds represent samples of patients carrying the BRCA1 mutation.

FIG. 12A El histograma de los coeficientes de correlación de cociente de expresión de genes de cada gen relevante con la clase de pronóstico (grupo de metástasis distantes y grupo de metástasis no distantes aparece en línea continua. La distribución procedente de un ensayo Monte-Carlo aparece en línea discontinua. La amplitud de correlación o anticorrelación de 231 genes marcadores es superior a 0,3. FIG. 12A The histogram of the correlation coefficients of the gene expression ratio of each relevant gene with the prognosis class (group of distant metastases and group of non-distant metastases appears in a continuous line. The distribution from a Monte-Carlo test appears in dashed line The amplitude of correlation or anticorrelation of 231 marker genes is greater than 0.3.

FIG. 12B Distribución de frecuencia del número de genes cuya amplitud de correlación o anticorrelación fue superior a 0,3 en 10,000 ensayos Monte-Carlo. FIG. 12B Frequency distribution of the number of genes whose amplitude of correlation or anticorrelation was greater than 0.3 in 10,000 Monte-Carlo trials.

FIG. 13 Tasa de error de clasificación del grupo de metástasis distante para Tipo 1 y Tipo 2 como función del número de genes discriminantes usados en el clasificador. La tasa de error combinada más baja se da cuando se usan aproximadamente 70 genes marcadores discriminantes. FIG. 13 Classification error rate of the distant metastasis group for Type 1 and Type 2 as a function of the number of discriminant genes used in the classifier. The lowest combined error rate occurs when approximately 70 discriminant marker genes are used.

FIG. 14 Clasificación de 78 tumores esporádicos en dos grupos de pronóstico, metástasis distante (pronóstico deficiente) y metástasis no distante (buen pronóstico) mediante el conjunto óptimo de 70 genes marcadores discriminantes. Las pacientes por encima de la línea blanca se caracterizan por tener buen pronóstico. Las pacientes por debajo de la línea blanca se caracterizan por tener pronóstico deficiente. FIG. 14 Classification of 78 sporadic tumors in two prognosis groups, distant metastases (poor prognosis) and non-distant metastases (good prognosis) by the optimal set of 70 discriminant marker genes. Patients above the white line are characterized by having a good prognosis. Patients below the white line are characterized by poor prognosis.

FIG. 15 Correlación entre los niveles de expresión en muestras de cada paciente y el perfil medio del grupo de buen pronóstico frente a la correlación con el grupo de pronóstico deficiente. Los cuadrados representan muestras de pacientes que tienen pronóstico deficiente, los redondeles representan muestras de pacientes que tienen pronóstico deficiente. Los cuadrados rojos representan las “recaídas”, mientras que los redondeles azules representan las “no recaídas”. Se clasificó erróneamente a 13 de un total de 78. FIG. 15 Correlation between the levels of expression in samples of each patient and the average profile of the good prognosis group versus the correlation with the poor prognosis group. The squares represent samples of patients who have poor prognosis, the rounds represent samples of patients who have poor prognosis. The red squares represent the "relapses", while the blue rounds represent the "non-relapses". 13 of a total of 78 were wrongly classified.

FIG. 16 Probabilidad de recaída como función de tiempo desde el diagnóstico. La predicción del Grupo A y del grupo B se realizó según el método de “dejar uno fuera” basándose en el conjunto óptimo de 70 genes marcadores discriminantes. Las 43 pacientes del grupo A se dividen en 37 pacientes del grupo de metástasis no distante y 6 pacientes del grupo de metástasis distante. Las 35 pacientes del grupo B se dividen en 28 pacientes del grupo de metástasis distante y 7 pacientes del grupo de metástasis no distante. FIG. 16 Probability of relapse as a function of time since diagnosis. The prediction of Group A and Group B was made according to the "leave one out" method based on the optimal set of 70 discriminant marker genes. The 43 patients in group A are divided into 37 patients in the non-distant metastasis group and 6 patients in the distant metastasis group. The 35 patients in group B are divided into 28 patients in the distant metastasis group and 7 patients in the non-distant metastasis group.

FIG. 17 Probabilidad de metástasis distante como función de tiempo desde el diagnóstico para individuos con receptor de progesterona PR(+) (sí) o PR(-) (no). FIG. 17 Probability of distant metastases as a function of time since diagnosis for individuals with progesterone PR (+) (yes) or PR (-) (no).

FIG. 18 Probabilidad de metástasis distante como función de tiempo desde el diagnóstico para individuos de ER(+) (sí) o ER(-) (no). FIG. 18 Probability of distant metastases as a function of time since diagnosis for individuals of ER (+) (yes) or ER (-) (no).

FIG. 19A, B Probabilidad de metástasis distante como función de tiempo desde el diagnóstico. Los grupos se definieron por grados de tumor. FIG. 19A, B Probability of distant metastases as a function of time since diagnosis. Groups were defined by degrees of tumor.

FIG. 20A Clasificación de 19 tumores esporádicos independientes en dos grupos de pronóstico, metástasis distante y metástasis no distante, mediante los 70 genes marcadores óptimos. Las pacientes por encima de la línea blanca tienen buen pronóstico. Las pacientes por debajo de la línea blanca tienen pronóstico deficiente. FIG. 20A Classification of 19 independent sporadic tumors into two prognosis groups, distant metastases and non-distant metastases, using the 70 optimal marker genes. Patients above the white line have a good prognosis. Patients below the white line have poor prognosis.

FIG. 20B La correlación entre los cocientes de expresión de cada paciente y el cociente medio de expresión del grupo de buen pronóstico se define mediante el conjunto de ensayo con respecto a la correlación entre los cocientes de expresión de cada paciente y el cociente medio de expresión del conjunto de ensayo de pronóstico deficiente. De nueve pacientes en el grupo de buen pronóstico, tres son del "grupo de metástasis distante"; de diez pacientes en el grupo de buen pronóstico, una paciente es del "grupo de metástasis no distante". Esta tasa de error de 4 sobre 19 se corresponde con la de 13 sobre 78 en las 78 pacientes iniciales. FIG. 20B The correlation between the expression quotients of each patient and the average expression quotient of the good prognosis group is defined by the test set with respect to the correlation between the expression quotients of each patient and the average expression quotient of the set. of poor prognosis test. Of nine patients in the good prognosis group, three are from the "distant metastasis group"; Of ten patients in the good prognosis group, one patient is from the "non-distant metastasis group". This error rate of 4 out of 19 corresponds to that of 13 out of 78 in the initial 78 patients.

FIG. 20C Probabilidad de recaída como función de tiempo desde el diagnóstico para dos grupos cuya predicción se hizo basándose en la expresión de los 70 genes marcadores óptimos. FIG. 20C Probability of relapse as a function of time since diagnosis for two groups whose prediction was made based on the expression of the 70 optimal marker genes.

FIG. 21A Sensibilidad frente a 1-especificidad para la clasificación de buen pronóstico. FIG. 21A Sensitivity to 1-specificity for the classification of good prognosis.

FIG. 21B Sensibilidad frente a 1-especificidad para la clasificación de pronóstico deficiente. FIG. 21B Sensitivity to 1-specificity for poor prognosis classification.

FIG. 21C Tasa total de error como función de umbral en la probabilidad modelada. Se usaron seis parámetros clínicos (categoría de ER, categoría de PR, grado de tumor, tamaño de tumor, edad de la paciente y presencia o ausencia de angioinvasión) para realizar el modelado clínico. FIG. 21C Total error rate as a function of threshold in the modeled probability. Six clinical parameters (ER category, PR category, tumor grade, tumor size, patient age and presence or absence of angioinvasion) were used to perform clinical modeling.

FIG. 22 Comparación del cociente logarítmico de muestras individuales mediante la "reserva de muestras de material" frente a la intensidad logarítmica sustraída media mediante la "reserva de muestras matemáticas" para 70 genes indicadores en las 78 muestras de tumores esporádicos. La "reserva de muestras de material" estaba constituida por las 78 muestras de tumores esporádicos. FIG. 22 Comparison of the logarithmic quotient of individual samples by means of the "stock of material samples" versus the average logarithmic intensity subtracted by the "reserve of mathematical samples" for 70 indicator genes in the 78 sporadic tumor samples. The "stock of material samples" consisted of the 78 samples of sporadic tumors.

FIG. 23A Los resultados de la validación cruzada dejando un elemento fuera basándose en los datos de un solo canal. Las muestras se agrupan según el coeficiente de correlación de cada muestra con el perfil medio de "buen pronóstico" y "pronóstico deficiente" en los 70 genes examinados. La línea blanca separa las muestras de los pacientes con pronóstico deficiente (abajo) de las de aquellos con buen pronóstico (arriba). FIG. 23A The results of cross-validation leaving an element out based on data from a single channel. The samples are grouped according to the correlation coefficient of each sample with the average profile of "good prognosis" and "poor prognosis" in the 70 genes examined. The white line separates samples from patients with poor prognosis (below) from those with good prognosis (above).

FIG. 23B Diagrama de dispersión de coeficientes de correlación con la expresión media en muestras de “buen pronóstico” y “pronóstico deficiente”. La falsa tasa positiva (esto es, la tasa de clasificaciones incorrectas de una muestra de una paciente con buen pronóstico como perteneciente a una con pronóstico deficiente) fue de 10 sobre 44, mientras que la falsa tasa negativa fue de 6 sobre 34. FIG. 23B Scatter plot of correlation coefficients with the mean expression in “good prognosis” and “poor prognosis” samples. The false positive rate (that is, the rate of incorrect classifications of a sample of a patient with a good prognosis as belonging to a poor prognosis) was 10 out of 44, while the false negative rate was 6 out of 34.

FIG. 24A Hibridación de datos de un solo canal para muestras ordenadas jerárquicamente por coeficientes de correlación con el clasificador de buen pronóstico. Las muestras clasificadas como “buen pronóstico” se hallan por encima de la línea blanca, mientras que las clasificadas como “pronóstico deficiente” se hallan por debajo de la misma. FIG. 24A Hybridization of single-channel data for samples sorted hierarchically by correlation coefficients with the good forecast classifier. Samples classified as "good prognosis" are above the white line, while those classified as "poor prognosis" are below it.

FIG. 24B Diagrama de dispersión de coeficientes de correlación con tres muestras clasificadas incorrectamente que se hallan a la derecha del valor umbral de coeficiente de correlación. Dicho valor umbral de correlación se fijó en 0,2727 para limitar las falsas muestras negativas a aproximadamente el 10% de las mismas. FIG. 24B Scatter plot of correlation coefficients with three incorrectly classified samples that are to the right of the threshold correlation coefficient value. Said correlation threshold value was set at 0.2727 to limit false negative samples to approximately 10% of them.

DESCRIPCIÓN DETALLADA DE LA INVENCIÓN DETAILED DESCRIPTION OF THE INVENTION

5.1 INTRODUCCIÓN 5.1 INTRODUCTION

[0024] La invención se refiere a conjuntos de marcadores genéticos cuyos patrones de expresión guardan correlación con importantes características del cáncer de mama, esto es, la categoría del receptor de estrógeno (ER), la categoría del BRCA1 y la probabilidad de recaída (esto es, metástasis distante o pronóstico deficiente). Se describen conjuntos marcadores genéticos que pueden distinguir las tres siguientes categorías clínicas. En primer lugar, la invención se refiere a conjuntos de marcadores cuya expresión guarda correlación con la categoría de ER de un paciente y que puede usarse para distinguir los pacientes ER (+) de los pacientes ER (-). La categoría de ER es un indicador de pronóstico muy útil y un indicador de la probabilidad de que un paciente responda a ciertas terapias como el tamoxifeno. [0024] The invention relates to sets of genetic markers whose expression patterns correlate with important characteristics of breast cancer, that is, the category of estrogen receptor (ER), the category of BRCA1 and the probability of relapse (this is, distant metastasis or poor prognosis). Genetic marker sets that can distinguish the following three clinical categories are described. First, the invention relates to sets of markers whose expression correlates with the ER category of a patient and which can be used to distinguish ER (+) patients from ER (-) patients. The ER category is a very useful prognostic indicator and an indicator of the probability that a patient responds to certain therapies such as tamoxifen.

[0025] Igualmente, entre las mujeres que son ER positivas la tasa de respuesta (superior al 50%) a la terapia hormonal es mucho mayor que la tasa de respuesta (inferior al 10%) en pacientes con categoría negativa de ER. En pacientes con tumores de ER positivo la posibilidad de conseguir una respuesta hormonal es directamente proporcional al nivel de ER (P. Calabresi y P. S. Schein, MEDICAL ONCOLOGY (2ND ED.), McGraw-Hill, Inc., New York (1993)). En segundo lugar, la invención se refiere además a conjuntos de marcadores cuya expresión guarda correlación con la presencia de mutaciones de BRCA1 y que pueden usarse para distinguir los tumores de tipo BRCA1 de los tumores esporádicos. En tercer lugar, la invención se refiere a marcadores genéticos cuya expresión guarda correlación con el pronóstico clínico y que puede usarse para distinguir entre las pacientes que tienen buen pronóstico (esto es, que no tengan metástasis distante de un tumor dentro de los cinco años) y las de pronóstico deficiente (esto es, que tengan metástasis distante de un tumor durante cinco años). En cuanto al uso de estos marcadores, se suministran métodos para distinguir entre estos grupos de pacientes y para determinar pautas generales de tratamiento. También se suministran biochips que contienen estos marcadores, así como métodos para elaborar dichos biochips. Cada uno de los marcadores corresponde a un gen del genoma humano, es decir, dicho marcador es identificable como el todo o una porción de un gen. Por último, como cada uno de los marcadores de más arriba está en correlación con ciertas afecciones relacionadas con el cáncer de mama, los marcadores, o las proteínas codificadas en éstos, serán muy probablemente el destino de medicamentos contra el cáncer de mama. [0025] Similarly, among women who are ER positive the response rate (greater than 50%) to hormonal therapy is much higher than the response rate (less than 10%) in patients with a negative ER category. In patients with positive ER tumors the possibility of achieving a hormonal response is directly proportional to the level of ER (P. Calabresi and PS Schein, MEDICAL ONCOLOGY (2ND ED.), McGraw-Hill, Inc., New York (1993)) . Secondly, the invention also relates to sets of markers whose expression correlates with the presence of BRCA1 mutations and that can be used to distinguish BRCA1 type tumors from sporadic tumors. Third, the invention relates to genetic markers whose expression correlates with the clinical prognosis and that can be used to distinguish between patients who have a good prognosis (that is, who do not have distant metastases from a tumor within five years) and those with poor prognosis (that is, having distant metastasis of a tumor for five years). Regarding the use of these markers, methods are provided to distinguish between these groups of patients and to determine general treatment guidelines. Biochips containing these markers are also supplied, as well as methods for making said biochips. Each of the markers corresponds to a gene of the human genome, that is, said marker is identifiable as the whole or a portion of a gene. Finally, since each of the markers above is correlated with certain conditions related to breast cancer, the markers, or the proteins encoded in these, will most likely be the destination of breast cancer medications.

5.2 DEFINICIONES 5.2 DEFINITIONS

[0026] Tal como se usa aquí, “tumor BRCAI” significa tumor que tiene células que contienen una mutación del locus BRCA1. [0026] As used herein, "BRCAI tumor" means a tumor that has cells that contain a mutation of the BRCA1 locus.

[0027] La “amplitud absoluta” de expresiones de correlación significa la distancia, tanto si es positiva como negativa, a un valor cero, es decir, ambos coeficientes, -0,35 y 0,35, tienen una amplitud absoluta de 0,35. [0027] The "absolute amplitude" of correlation expressions means the distance, whether positive or negative, to a zero value, that is, both coefficients, -0.35 and 0.35, have an absolute amplitude of 0, 35

[0028] “Categoría” significa un estado de expresión de genes de un conjunto de marcadores genéticos cuya expresión está en estrecha correlación con un fenotipo concreto. Por ejemplo, “categoría de ER” significa un estado de expresión de genes de un conjunto de marcadores genéticos cuya expresión está en estrecha correlación con la del ESR1 (gen receptor de estrógeno), en donde el patrón de expresión de estos genes varía significativamente entre los tumores que expresan el receptor y los tumores que no expresan el receptor. [0028] "Category" means a state of gene expression of a set of genetic markers whose expression is closely correlated with a particular phenotype. For example, "ER category" means a state of gene expression of a set of genetic markers whose expression is closely correlated with that of ESR1 (estrogen receptor gene), where the expression pattern of these genes varies significantly between tumors that express the receptor and tumors that do not express the receptor.

[0029] “Buen pronóstico” significa que se espera que una paciente no tenga metástasis distantes de un tumor de mama dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama. [0029] "Good prognosis" means that a patient is not expected to have distant metastases from a breast tumor within five years of the initial diagnosis of breast cancer.

[0030] “Pronóstico deficiente” significa que se espera que una paciente tenga metástasis distantes de un tumor de mama dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama. [0030] "Poor prognosis" means that a patient is expected to have distant metastases from a breast tumor within five years of the initial diagnosis of breast cancer.

[0031] “Marcador” significa un gen entero, o un EST derivado de dicho gen, cuyo nivel de expresión cambia en ciertas condiciones. Allí donde la expresión del gen esté en correlación con un estado en concreto, el gen será un marcador para ese estado. [0031] "Marker" means an entire gene, or an EST derived from said gene, whose level of expression changes under certain conditions. Where the expression of the gene correlates with a specific state, the gene will be a marker for that state.

[0032] “Polinucleótidos derivados de marcador” significa el ARN transcrito de un gen marcador, cualquier ADNc 5 o ARNc producido del mismo y cualquier ácido nucleico derivado del mismo, como el ácido nucleico sintético que tenga una secuencia derivada del gen correspondiente al gen marcador. [0032] "Marker derived polynucleotides" means the RNA transcribed from a marker gene, any cDNA 5 or cRNA produced therefrom and any nucleic acid derived therefrom, such as synthetic nucleic acid having a sequence derived from the gene corresponding to the marker gene .

5.3 MARCADORES ÚTILES EN EL DIAGNÓSTICO Y PRONÓSTICO DEL CÁNCER DE MAMA 5.3 USEFUL MARKERS IN THE DIAGNOSIS AND FORECAST OF BREAST CANCER

5.3.1 CONJUNTOS DE MARCADORES 5.3.1 MARKER SETS

[0033] Se describe un conjunto de 4.986 marcadores genéticos cuya expresión está en correlación con la [0033] A set of 4,986 genetic markers is described whose expression correlates with the

10 existencia de cáncer de mama mediante análisis de agrupación. En la SEQ ID Nos: 1-2,699 se enumera un subconjunto de dichos marcadores identificados como útiles para el diagnóstico o el pronóstico. La invención también se refiere a un método de uso de dichos marcadores para distinguir los tipos de tumores en el diagnóstico o el pronóstico. 10 existence of breast cancer through cluster analysis. SEQ ID Nos: 1-2,699 lists a subset of these markers identified as useful for diagnosis or prognosis. The invention also relates to a method of using said markers to distinguish tumor types in diagnosis or prognosis.

[0034] También se describe un conjunto de 2.460 marcadores genéticos que pueden clasificar a las pacientes [0034] A set of 2,460 genetic markers that can classify patients is also described.

15 de cáncer de mama por la categoría del receptor de estrógeno (ER), esto es, distinguir entre pacientes o tumores con ER (+) y ER (-) obtenidos de dichas pacientes. La categoría de ER es un importante indicador de la probabilidad de la respuesta de un paciente a algunas quimioterapias (esto es, al tamoxifeno). Dichos marcadores se enumeran en la Tabla 1. La invención también se refiere a subconjuntos de al menos 5, 10, 25, 50, 100, 200, 300, 400, 500, 750, 1.000, 1.250, 1.500, 1.750 o 2.000 marcadores genéticos, sacados del conjunto 15 of breast cancer by the category of estrogen receptor (ER), that is, distinguish between patients or tumors with ER (+) and ER (-) obtained from said patients. The category of ER is an important indicator of the probability of a patient's response to some chemotherapies (that is, tamoxifen). Such markers are listed in Table 1. The invention also relates to subsets of at least 5, 10, 25, 50, 100, 200, 300, 400, 500, 750, 1,000, 1,250, 1,500, 1,750 or 2,000 genetic markers , taken from the set

20 de 2.460 marcadores, que también pueden distinguir pacientes o tumores con ER (+) y ER (-). Preferiblemente, el número de marcadores será de 550. Se describe además un conjunto de 550 de los 2.460 marcadores que son óptimos para distinguir la categoría de ER (Tabla 2). También se suministra un método de uso de dichos marcadores para distinguir entre pacientes o tumores ER (+) y ER (-) obtenidos de los mismos. 20 of 2,460 markers, which can also distinguish patients or tumors with ER (+) and ER (-). Preferably, the number of markers will be 550. A set of 550 of the 2,460 markers that are optimal for distinguishing the ER category are also described (Table 2). A method of using said markers is also provided to distinguish between patients or ER (+) and ER (-) tumors obtained therefrom.

[0035] En otra materialización se describe un conjunto de 430 marcadores genéticos que pueden clasificar a [0035] In another embodiment a set of 430 genetic markers that can classify a

25 pacientes de cáncer de mama con ER (-) por la categoría del BRCA1, es decir, distinguir entre tumores que contienen una mutación de BRCA1 y tumores esporádicos. Dichos marcadores se enumeran en la Tabla 3. Además, se proporcionan subconjuntos de al menos 5, 10, 20, 30, 40, 50, 75, 100, 150, 200, 250, 300 o 350 marcadores, sacados del conjunto de 430 marcadores, que también distinguen entre tumores que contienen una mutación de BRCA1 y tumores esporádicos. Preferiblemente, el número de marcadores será de 100. En la Tabla 25 breast cancer patients with ER (-) by the BRCA1 category, that is, distinguish between tumors that contain a BRCA1 mutation and sporadic tumors. These markers are listed in Table 3. In addition, subsets of at least 5, 10, 20, 30, 40, 50, 75, 100, 150, 200, 250, 300 or 350 markers are provided, taken from the set of 430 markers , which also distinguish between tumors that contain a BRCA1 mutation and sporadic tumors. Preferably, the number of markers will be 100. In the Table

30 4 se suministra un conjunto preferido de 100 marcadores. También se suministra un método de uso de dichos marcadores para distinguir entre pacientes o tumores BRCA1 y esporádicos obtenidos de los mismos. 30 4 a preferred set of 100 markers is supplied. A method of using said markers is also provided to distinguish between BRCA1 and sporadic patients or tumors obtained therefrom.

[0036] La invención se refiere a un conjunto de 231 marcadores genéticos que pueden distinguir entre las pacientes con un buen pronóstico de cáncer de mama (ausencia de metástasis distantes de tumores de cáncer de mama dentro de los cinco años siguientes) y las pacientes con un pronóstico deficiente de cáncer de mama 35 (presencia de metástasis distantes de tumores de cáncer de mama dentro de los cinco años siguientes). Dichos marcadores se enumeran en la Tabla 5. Se suministran subconjuntos de al menos 5, 10, 20, 30, 40, 50, 75, 100, 150 o 200 marcadores, sacados del conjunto de 231, que también distinguen entre pacientes con buen y con pronóstico deficiente. En la Tabla 6 se suministra un conjunto preferido de 70 marcadores. En una materialización específica, el conjunto de marcadores consta de los doce marcadores relacionados con la [0036] The invention relates to a set of 231 genetic markers that can distinguish between patients with a good prognosis of breast cancer (absence of distant metastases from breast cancer tumors within the next five years) and patients with a poor prognosis of breast cancer 35 (presence of distant metastases from breast cancer tumors within the next five years). These markers are listed in Table 5. Subsets of at least 5, 10, 20, 30, 40, 50, 75, 100, 150 or 200 markers are provided, taken from the set of 231, which also distinguish between patients with good and with poor prognosis. A preferred set of 70 markers is provided in Table 6. In a specific materialization, the set of markers consists of the twelve markers related to the

40 quinasa y los siete marcadores relacionados con la división de células o mitosis. La invención también suministra un método de uso de los marcadores de más arriba para distinguir entre pacientes con buen pronóstico y con pronóstico deficiente. 40 kinase and the seven markers related to cell division or mitosis. The invention also provides a method of using the markers above to distinguish between patients with good prognosis and poor prognosis.

Table 1. 2.460 marcadores de genes que distinguen entre muestras de células ER(+) y ER(-). Table 1. 2,460 gene markers that distinguish between ER (+) and ER (-) cell samples.

Banco de Genes Gene Bank
Bando de Genes Side of Genes

Número de Acceso Access Number
SEQ ID NO Número de Acceso SEQ ID NO SEQ ID NO  Access Number SEQ ID NO

AA555029_RC  AA555029_RC
SEQ ID NO 1 NM_006984 SEQ ID NO 1344  SEQ ID NO 1 NM_006984  SEQ ID NO 1344

AB000509 AB000509
SEQ ID NO 2 NM_007005 SEQ ID NO 1345  SEQ ID NO 2 NM_007005  SEQ ID NO 1345

AB001451 AB001451
SEQ ID NO 3 NM_007006 SEQ ID NO 1346  SEQ ID NO 3 NM_007006  SEQ ID NO 1346

AB002301 AB002301
SEQ ID NO 4 NM_007019 SEQ ID NO 1347  SEQ ID NO 4 NM_007019  SEQ ID NO 1347

AB002308 AB002308
SEQ ID NO 5 NM_007027 SEQ ID NO 1348  SEQ ID NO 5 NM_007027  SEQ ID NO 1348

AB002351 AB002351
SEQ ID NO 6 NM_007044 SEQ ID NO 1350  SEQ ID NO 6 NM_007044  SEQ ID NO 1350

AB002448 AB002448
SEQ ID NO 7 NM_007050 SEQ ID NO 1351  SEQ ID NO 7 NM_007050  SEQ ID NO 1351

AB006628  AB006628
SEQ ID NO 9 NM_007057 SEQ ID NO 1352  SEQ ID NO 9 NM_007057  SEQ ID NO 1352

AB006630 AB006630
SEQ ID NO 10 NM_007069 SEQ ID NO 1353  SEQ ID NO 10 NM_007069  SEQ ID NO 1353

AB006746 AB006746
SEQ ID NO 11 NM_007074 SEQ ID NO 1355  SEQ ID NO 11 NM_007074  SEQ ID NO 1355

AB007458 AB007458
SEQ ID NO 12 NM_007088 SEQ ID NO 1356  SEQ ID NO 12 NM_007088  SEQ ID NO 1356

AB007855 AB007855
SEQ ID NO 13 NMB_007111 SEQ ID NO 1357  SEQ ID NO 13 NMB_007111  SEQ ID NO 1357

AB007857 AB007857
SEQ ID NO 14 NMB_007146 SEQ ID NO 1358  SEQ ID NO 14 NMB_007146  SEQ ID NO 1358

AB007863 AB007863
SEQ ID NO 15 NM_007173 SEQ ID NO 1359  SEQ ID NO 15 NM_007173  SEQ ID NO 1359

AB007883 AB007883
SEQ ID NO 16 NMB_007177 SEQ ID NO 1360  SEQ ID NO 16 NMB_007177  SEQ ID NO 1360

AB007896 AB007896
SEQ ID NO 17 NMB_007196 SEQ ID NO 1361  SEQ ID NO 17 NMB_007196  SEQ ID NO 1361

AB007899 AB007899
SEQ ID NO 18 NM_007203 SEQ ID NO 1362  SEQ ID NO 18 NM_007203  SEQ ID NO 1362

AB007916 AB007916
SEQ ID NO 19 NM_007214 SEQ ID NO 1363  SEQ ID NO 19 NM_007214  SEQ ID NO 1363

AB007950 AB007950
SEQ ID NO 20 NMB_007217 SEQ ID NO 1364  SEQ ID NO 20 NMB_007217  SEQ ID NO 1364

AB011087 AB011087
SEQ ID NO 21 NM_007231 SEQ ID NO 1365  SEQ ID NO 21 NM_007231  SEQ ID NO 1365

AB011089 AB011089
SEQ ID NO 22 NM_007268 SEQ ID NO 1367  SEQ ID NO 22 NM_007268  SEQ ID NO 1367

AB011104 AB011104
SEQ ID NO 23 NM_007274 SEQ ID NO 1368  SEQ ID NO 23 NM_007274  SEQ ID NO 1368

AB011105 AB011105
SEQ ID NO 24 NM_007275 SEQ ID NO 1369  SEQ ID NO 24 NM_007275  SEQ ID NO 1369

AB011121 AB011121
SEQ ID NO 25 NM_007281 SEQ ID NO 1370  SEQ ID NO 25 NM_007281  SEQ ID NO 1370

AB011132 AB011132
SEQ ID NO 26 NM_007309 SEQ ID NO 1371  SEQ ID NO 26 NM_007309  SEQ ID NO 1371

AB011152 AB011152
SEQ ID NO 27 NMB_007315 SEQ ID NO 1372  SEQ ID NO 27 NMB_007315  SEQ ID NO 1372

AB011179 AB011179
SEQ ID NO 28 NM_007334 SEQ ID NO 1373  SEQ ID NO 28 NM_007334  SEQ ID NO 1373

AB014534 AB014534
SEQ ID NO 29 NM_007358 SEQ ID NO 1374  SEQ ID NO 29 NM_007358  SEQ ID NO 1374

AB014568 AB014568
SEQ ID NO 30 NM_009585 SEQ ID NO 1375  SEQ ID NO 30 NM_009585  SEQ ID NO 1375

AB018260 AB018260
SEQ ID NO 31 NM_009587 SEQ ID NO 1376  SEQ ID NO 31 NM_009587  SEQ ID NO 1376

AB018268 AB018268
SEQ ID NO 32 NM_009588 SEQ ID NO 1377  SEQ ID NO 32 NM_009588  SEQ ID NO 1377

AB018289 AB018289
SEQ ID NO 33 NMB_012062 SEQ ID NO 1378  SEQ ID NO 33 NMB_012062  SEQ ID NO 1378

AB018345 AB018345
SEQ ID NO 35 NMB_012067 SEQ ID NO 1379  SEQ ID NO 35 NMB_012067  SEQ ID NO 1379

AB020677 AB020677
SEQ ID NO 36 NMB_012101 SEQ ID NO 1380  SEQ ID NO 36 NMB_012101  SEQ ID NO 1380

AB020689 AB020689
SEQ ID NO 37 NMB_012105 SEQ ID NO 1381  SEQ ID NO 37 NMB_012105  SEQ ID NO 1381

AB020695 AB020695
SEQ ID NO 38 NMB_012108 SEQ ID NO 1382  SEQ ID NO 38 NMB_012108  SEQ ID NO 1382

AB020710 AB020710
SEQ ID NO 39 NM_012110 SEQ ID NO 1383  SEQ ID NO 39 NM_012110  SEQ ID NO 1383

AB023139 AB023139
SEQ ID NO 40 NMB_012124 SEQ ID NO 1384  SEQ ID NO 40 NMB_012124  SEQ ID NO 1384

AB023151 AB023151
SEQ ID NO 41 NM_012142 SEQ ID NO 1386  SEQ ID NO 41 NM_012142  SEQ ID NO 1386

AB023152 AB023152
SEQ ID NO 42 NM_012155 SEQ ID NO 1388  SEQ ID NO 42 NM_012155  SEQ ID NO 1388

AB023163 AB023163
SEQ ID NO 43 NM_012175 SEQ ID NO 1389  SEQ ID NO 43 NM_012175  SEQ ID NO 1389

AB023173 AB023173
SEQ ID NO 44 NMB_012177 SEQ ID NO 1390  SEQ ID NO 44 NMB_012177  SEQ ID NO 1390

AB023211 AB023211
SEQ ID NO 45 NM_012205 SEQ ID NO 1391  SEQ ID NO 45 NM_012205  SEQ ID NO 1391

AB024704 AB024704
SEQ ID NO 46 NM_012219 SEQ ID NO 1393  SEQ ID NO 46 NM_012219  SEQ ID NO 1393

AB028985 AB028985
SEQ ID NO 47 NMB_012242 SEQ ID NO 1394  SEQ ID NO 47 NMB_012242  SEQ ID NO 1394

AB028986 AB028986
SEQ ID NO 48 NMB_012250 SEQ ID NO 1395  SEQ ID NO 48 NMB_012250  SEQ ID NO 1395

AB028998 AB028998
SEQ ID NO 49 NM_012261 SEQ ID NO 1397  SEQ ID NO 49 NM_012261  SEQ ID NO 1397

AB029031 AB029031
SEQ ID NO 51 NM_012286 SEQ ID NO 1398  SEQ ID NO 51 NM_012286  SEQ ID NO 1398

AB032951 AB032951
SEQ ID NO 52 NM_012319 SEQ ID NO 1400  SEQ ID NO 52 NM_012319  SEQ ID NO 1400

AB032966 AB032966
SEQ ID NO 53 NM_012332 SEQ ID NO 1401  SEQ ID NO 53 NM_012332  SEQ ID NO 1401

AB032969 AB032969
SEQ ID NO 54 NM_012336 SEQ ID NO 1402  SEQ ID NO 54 NM_012336  SEQ ID NO 1402

AB032977 AB032977
SEQ ID NO 56 NMB_012339 SEQ ID NO 1404  SEQ ID NO 56 NMB_012339  SEQ ID NO 1404

AB033007 AB033007
SEQ ID NO 58 NMB_012341 SEQ ID NO 1405  SEQ ID NO 58 NMB_012341  SEQ ID NO 1405

AB033034 AB033034
SEQ ID NO 59 NMB_012391 SEQ ID NO 1406  SEQ ID NO 59 NMB_012391  SEQ ID NO 1406

12 12

AB033035  AB033035
SEQ ID NO 60 NM_012394 SEQ ID NO 1407  SEQ ID NO 60 NM_012394  SEQ ID NO 1407

AB033040 AB033040
SEQ ID NO 61 NM_012413 SEQ ID NO 1408  SEQ ID NO 61 NM_012413  SEQ ID NO 1408

AB033049 AB033049
SEQ ID NO 63 NM_012421 SEQ ID NO 1409  SEQ ID NO 63 NM_012421  SEQ ID NO 1409

AB033050 AB033050
SEQ ID NO 64 NMB_012425 SEQ ID NO 1410  SEQ ID NO 64 NMB_012425  SEQ ID NO 1410

AB033053 AB033053
SEQ ID NO 65 NM_012427 SEQ ID NO 1411  SEQ ID NO 65 NM_012427  SEQ ID NO 1411

AB033055 AB033055
SEQ ID NO 66 NM_012429 SEQ ID NO 1413  SEQ ID NO 66 NM_012429  SEQ ID NO 1413

AB033058 AB033058
SEQ ID NO 67 NM_012446 SEQ ID NO 1414  SEQ ID NO 67 NM_012446  SEQ ID NO 1414

AB033073 AB033073
SEQ ID NO 68 NM_012463 SEQ ID NO 1415  SEQ ID NO 68 NM_012463  SEQ ID NO 1415

AB033092 AB033092
SEQ ID NO 69 NM_012474 SEQ ID NO 1416  SEQ ID NO 69 NM_012474  SEQ ID NO 1416

AB033111 AB033111
SEQ ID NO 70 NM_013230 SEQ ID NO 1417  SEQ ID NO 70 NM_013230  SEQ ID NO 1417

AB036063 AB036063
SEQ ID NO 71 NM_013233 SEQ ID NO 1418  SEQ ID NO 71 NM_013233  SEQ ID NO 1418

AB037720 AB037720
SEQ ID NO 72 NM_013238 SEQ ID NO 1419  SEQ ID NO 72 NM_013238  SEQ ID NO 1419

AB037743 AB037743
SEQ ID NO 74 NM_013239 SEQ ID NO 1420  SEQ ID NO 74 NM_013239  SEQ ID NO 1420

AB037745 AB037745
SEQ ID NO 75 NM_013242 SEQ ID NO 1421  SEQ ID NO 75 NM_013242  SEQ ID NO 1421

AB037756 AB037756
SEQ ID NO 76 NM_01 3257 SEQ ID NO 1423  SEQ ID NO 76 NM_01 3257  SEQ ID NO 1423

AB037765 AB037765
SEQ ID NO 77 NM_013261 SEQ ID NO 1424  SEQ ID NO 77 NM_013261  SEQ ID NO 1424

AB037778 AB037778
SEQ ID NO 78 NM_013262 SEQ ID NO 1425  SEQ ID NO 78 NM_013262  SEQ ID NO 1425

AB037791 AB037791
SEQ ID NO 79 NM_013277 SEQ ID NO 1426  SEQ ID NO 79 NM_013277  SEQ ID NO 1426

AB037793 AB037793
SEQ ID NO 80 NM_013296 SEQ ID NO 1427  SEQ ID NO 80 NM_013296  SEQ ID NO 1427

AB037802 AB037802
SEQ ID NO 81 NM_013301 SEQ ID NO 1428  SEQ ID NO 81 NM_013301  SEQ ID NO 1428

AB037806 AB037806
SEQ ID NO 82 NM_013324 SEQ ID NO 1429  SEQ ID NO 82 NM_013324  SEQ ID NO 1429

AB037809 AB037809
SEQ ID NO 83 NM_013327 SEQ ID NO 1430  SEQ ID NO 83 NM_013327  SEQ ID NO 1430

AB037836 AB037836
SEQ ID NO 84 NM_013336 SEQ ID NO 1431  SEQ ID NO 84 NM_013336  SEQ ID NO 1431

AB037844 AB037844
SEQ ID NO 85 NM_013339 SEQ ID NO 1432  SEQ ID NO 85 NM_013339  SEQ ID NO 1432

AB037845 AB037845
SEQ ID NO 86 NM_013363 SEQ ID NO 1433  SEQ ID NO 86 NM_013363  SEQ ID NO 1433

AB037848 AB037848
SEQ ID NO 87 NM_013378 SEQ ID NO 1435  SEQ ID NO 87 NM_013378  SEQ ID NO 1435

AB037863 AB037863
SEQ ID NO 88 NM_013384 SEQ ID NO 1436  SEQ ID NO 88 NM_013384  SEQ ID NO 1436

AB037864 AB037864
SEQ ID NO 89 NM_013385 SEQ ID NO 1437  SEQ ID NO 89 NM_013385  SEQ ID NO 1437

AB040881 AB040881
SEQ ID NO 90 NM_013406 SEQ ID NO 1438  SEQ ID NO 90 NM_013406  SEQ ID NO 1438

AB040900 AB040900
SEQ ID NO 91 NM_013437 SEQ ID NO 1439  SEQ ID NO 91 NM_013437  SEQ ID NO 1439

AB040914 AB040914
SEQ ID NO 92 NM_013451 SEQ ID NO 1440  SEQ ID NO 92 NM_013451  SEQ ID NO 1440

AB040926 AB040926
SEQ ID NO 93 NM_013943 SEQ ID NO 1441  SEQ ID NO 93 NM_013943  SEQ ID NO 1441

AB040955 AB040955
SEQ ID NO 94 NMB_013994 SEQ ID NO 1442  SEQ ID NO 94 NMB_013994  SEQ ID NO 1442

AB040961 AB040961
SEQ ID NO 95 NMB_013995 SEQ ID NO 1443  SEQ ID NO 95 NMB_013995  SEQ ID NO 1443

AF000974 AF000974
SEQ ID NO 97 NMB_014026 SEQ ID NO 1444  SEQ ID NO 97 NMB_014026  SEQ ID NO 1444

AF005487 AF005487
SEQ ID NO 98 NM_014029 SEQ ID NO 1445  SEQ ID NO 98 NM_014029  SEQ ID NO 1445

AF007153 AF007153
SEQ ID NO 99 NM_014036 SEQ ID NO 1446  SEQ ID NO 99 NM_014036  SEQ ID NO 1446

AF007155 AF007155
SEQ ID NO 100 NM_014062 SEQ ID NO 1447  SEQ ID NO 100 NM_014062  SEQ ID NO 1447

AF015041 AF015041
SEQ ID NO 101 NMB_014074 SEQ ID NO 1448  SEQ ID NO 101 NMB_014074  SEQ ID NO 1448

AF016004 AF016004
SEQ ID NO 102 NM_014096 SEQ ID NO 1450  SEQ ID NO 102 NM_014096  SEQ ID NO 1450

AF016495 AF016495
SEQ ID NO 103 NM_014109 SEQ ID NO 1451  SEQ ID NO 103 NM_014109  SEQ ID NO 1451

AF020919 AF020919
SEQ ID NO 104 NM_014112 SEQ ID NO 1452  SEQ ID NO 104 NM_014112  SEQ ID NO 1452

AF026941 AF026941
SEQ ID NO 105 NM_014147 SEQ ID NO 1453  SEQ ID NO 105 NM_014147  SEQ ID NO 1453

AF035191 AF035191
SEQ ID NO 106 NM_014149 SEQ ID NO 1454  SEQ ID NO 106 NM_014149  SEQ ID NO 1454

AF035284 AF035284
SEQ ID NO 107 NMB_014164 SEQ ID NO 1455  SEQ ID NO 107 NMB_014164  SEQ ID NO 1455

AF035318 AF035318
SEQ ID NO 108 NMB_014172 SEQ ID NO 1456  SEQ ID NO 108 NMB_014172  SEQ ID NO 1456

AF038182 AF038182
SEQ ID NO 109 NM_014175 SEQ ID NO 1457  SEQ ID NO 109 NM_014175  SEQ ID NO 1457

13 13

AF038193  AF038193
SEQ ID NO 110 NM_014181 SEQ ID NO 1458  SEQ ID NO 110 NM_014181  SEQ ID NO 1458

AF042838 AF042838
SEQ ID NO 111 NM_014184 SEQ ID NO 1459  SEQ ID NO 111 NM_014184  SEQ ID NO 1459

AF044127 AF044127
SEQ ID NO 112 NM_014211 SEQ ID NO 1460  SEQ ID NO 112 NM_014211  SEQ ID NO 1460

AF045229 AF045229
SEQ ID NO 113 NM_014214 SEQ ID NO 1461  SEQ ID NO 113 NM_014214  SEQ ID NO 1461

AF047002 AF047002
SEQ ID NO 114 NM_014216 SEQ ID NO 1462  SEQ ID NO 114 NM_014216  SEQ ID NO 1462

AF047826 AF047826
SEQ ID NO 115 NM_014241 SEQ ID NO 1463  SEQ ID NO 115 NM_014241  SEQ ID NO 1463

AF049460 AF049460
SEQ ID NO 116 NM_014246 SEQ ID NO 1465  SEQ ID NO 116 NM_014246  SEQ ID NO 1465

AF052101 AF052101
SEQ ID NO 117 NM_014268 SEQ ID NO 1466  SEQ ID NO 117 NM_014268  SEQ ID NO 1466

AF052117 AF052117
SEQ ID NO 118 NM_014272 SEQ ID NO 1467  SEQ ID NO 118 NM_014272  SEQ ID NO 1467

AF052155 AF052155
SEQ ID NO 119 NM_014274 SEQ ID NO 1468  SEQ ID NO 119 NM_014274  SEQ ID NO 1468

AF052159 AF052159
SEQ ID NO 120 NM_014289 SEQ ID NO 1469  SEQ ID NO 120 NM_014289  SEQ ID NO 1469

AF052176 AF052176
SEQ ID NO 122 NM_014298 SEQ ID NO 1470  SEQ ID NO 122 NM_014298  SEQ ID NO 1470

AF052185 AF052185
SEQ ID NO 123 NM_014302 SEQ ID NO 1471  SEQ ID NO 123 NM_014302  SEQ ID NO 1471

AF055270 AF055270
SEQ ID NO 126 NM_014315 SEQ ID NO 1473  SEQ ID NO 126 NM_014315  SEQ ID NO 1473

AF058075 AF058075
SEQ ID NO 127 NM_014316 SEQ ID NO 1474  SEQ ID NO 127 NM_014316  SEQ ID NO 1474

AF061034 AF061034
SEQ ID NO 128 NM_014317 SEQ ID NO 1475  SEQ ID NO 128 NM_014317  SEQ ID NO 1475

AF063725 AF063725
SEQ ID NO 129 NM_014320 SEQ ID NO 1476  SEQ ID NO 129 NM_014320  SEQ ID NO 1476

AF063936 AF063936
SEQ ID NO 130 NM_014321 SEQ ID NO 1477  SEQ ID NO 130 NM_014321  SEQ ID NO 1477

AF065241 AF065241
SEQ ID NO 131 NM_014325 SEQ ID NO 1478  SEQ ID NO 131 NM_014325  SEQ ID NO 1478

AF067972 AF067972
SEQ ID NO 132 NM_014335 SEQ ID NO 1479  SEQ ID NO 132 NM_014335  SEQ ID NO 1479

AF070536 AF070536
SEQ ID NO 133 NM_014363 SEQ ID NO 1480  SEQ ID NO 133 NM_014363  SEQ ID NO 1480

AF070552 AF070552
SEQ ID NO 134 NM_014364 SEQ ID NO 1481  SEQ ID NO 134 NM_014364  SEQ ID NO 1481

AF070617 AF070617
SEQ ID NO 135 NM_014365 SEQ ID NO 1482  SEQ ID NO 135 NM_014365  SEQ ID NO 1482

AF073770 AF073770
SEQ ID NO 138 NM_014373 SEQ ID NO 1483  SEQ ID NO 138 NM_014373  SEQ ID NO 1483

AF076612 AF076612
SEQ ID NO 139 NM_014382 SEQ ID NO 1484  SEQ ID NO 139 NM_014382  SEQ ID NO 1484

AF079529 AF079529
SEQ ID NO 140 NM_014395 SEQ ID NO 1485  SEQ ID NO 140 NM_014395  SEQ ID NO 1485

AF090913 AF090913
SEQ ID NO 142 NM_014398 SEQ ID NO 1486  SEQ ID NO 142 NM_014398  SEQ ID NO 1486

AF095719 AF095719
SEQ ID NO 143 NM_014399 SEQ ID NO 1487  SEQ ID NO 143 NM_014399  SEQ ID NO 1487

AF098641 AF098641
SEQ ID NO 144 NM_014402 SEQ ID NO 1488  SEQ ID NO 144 NM_014402  SEQ ID NO 1488

AF099032 AF099032
SEQ ID NO 145 NM_014428 SEQ ID NO 1489  SEQ ID NO 145 NM_014428  SEQ ID NO 1489

AF100756 AF100756
SEQ ID NO 146 NM_014448 SEQ ID NO 1490  SEQ ID NO 146 NM_014448  SEQ ID NO 1490

AF101051 AF101051
SEQ ID NO 147 NM_014449 SEQ ID NO 1491  SEQ ID NO 147 NM_014449  SEQ ID NO 1491

AF103375 AF103375
SEQ ID NO 148 NM_014450 SEQ ID NO 1492  SEQ ID NO 148 NM_014450  SEQ ID NO 1492

AF103458 AF103458
SEQ ID NO 149 NM_014452 SEQ ID NO 1493  SEQ ID NO 149 NM_014452  SEQ ID NO 1493

AF103530 AF103530
SEQ ID NO 150 NM_014453 SEQ ID NO 1494  SEQ ID NO 150 NM_014453  SEQ ID NO 1494

AF103804 AF103804
SEQ ID NO 151 NM_014456 SEQ ID NO 1495  SEQ ID NO 151 NM_014456  SEQ ID NO 1495

AF111849 AF111849
SEQ ID NO 152 NM_014479 SEQ ID NO 1497  SEQ ID NO 152 NM_014479  SEQ ID NO 1497

AF112213 AF112213
SEQ ID NO 153 NM_014501 SEQ ID NO 1498  SEQ ID NO 153 NM_014501  SEQ ID NO 1498

AF113132 AF113132
SEQ ID NO 154 NM_014552 SEQ ID NO 1500  SEQ ID NO 154 NM_014552  SEQ ID NO 1500

AF116682 AF116682
SEQ ID NO 156 NM_014553 SEQ ID NO 1501  SEQ ID NO 156 NM_014553  SEQ ID NO 1501

AF118224 AF118224
SEQ ID NO 157 NM_014570 SEQ ID NO 1502  SEQ ID NO 157 NM_014570  SEQ ID NO 1502

AF118274 AF118274
SEQ ID NO 158 NM_014575 SEQ ID NO 1503  SEQ ID NO 158 NM_014575  SEQ ID NO 1503

AF119256 AF119256
SEQ ID NO 159 NM_014585 SEQ ID NO 1504  SEQ ID NO 159 NM_014585  SEQ ID NO 1504

AF119665 AF119665
SEQ ID NO 160 NM_014595 SEQ ID NO 1505  SEQ ID NO 160 NM_014595  SEQ ID NO 1505

AF121255 AF121255
SEQ ID NO 161 NM_014624 SEQ ID NO 1507  SEQ ID NO 161 NM_014624  SEQ ID NO 1507

AF131748 AF131748
SEQ ID NO 162 NM_014633 SEQ ID NO 1508  SEQ ID NO 162 NM_014633  SEQ ID NO 1508

AF131753 AF131753
SEQ ID NO 163 NM_014640 SEQ ID NO 1509  SEQ ID NO 163 NM_014640  SEQ ID NO 1509

14 14

AF131760  AF131760
SEQ ID NO 164 NM_014642 SEQ ID NO 1510  SEQ ID NO 164 NM_014642  SEQ ID NO 1510

AF131784 AF131784
SEQ ID NO 165 NM_014643 SEQ ID NO 1511  SEQ ID NO 165 NM_014643  SEQ ID NO 1511

AF131828 AF131828
SEQ ID NO 166 NM_014656 SEQ ID NO 1512  SEQ ID NO 166 NM_014656  SEQ ID NO 1512

AF135168 AF135168
SEQ ID NO 167 NM_014668 SEQ ID NO 1513  SEQ ID NO 167 NM_014668  SEQ ID NO 1513

AF141882 AF141882
SEQ ID NO 168 NM_014669 SEQ ID NO 1514  SEQ ID NO 168 NM_014669  SEQ ID NO 1514

AF148505 AF148505
SEQ ID NO 169 NM_014673 SEQ ID NO 1515  SEQ ID NO 169 NM_014673  SEQ ID NO 1515

AF149785 AF149785
SEQ ID NO 170 NM_014675 SEQ ID NO 1516  SEQ ID NO 170 NM_014675  SEQ ID NO 1516

AF151810 AF151810
SEQ ID NO 171 NM_014679 SEQ ID NO 1517  SEQ ID NO 171 NM_014679  SEQ ID NO 1517

AF152502 AF152502
SEQ ID NO 172 NM_014680 SEQ ID NO 1518  SEQ ID NO 172 NM_014680  SEQ ID NO 1518

AF155120 AF155120
SEQ ID NO 174 NM_014696 SEQ ID NO 1519  SEQ ID NO 174 NM_014696  SEQ ID NO 1519

AF159092 AF159092
SEQ ID NO 175 NM_014700 SEQ ID NO 1520  SEQ ID NO 175 NM_014700  SEQ ID NO 1520

AF161407 AF161407
SEQ ID NO 176 NM_014715 SEQ ID NO 1521  SEQ ID NO 176 NM_014715  SEQ ID NO 1521

AF161553 AF161553
SEQ ID NO 177 NM_014721 SEQ ID NO 1522  SEQ ID NO 177 NM_014721  SEQ ID NO 1522

AF164104 AF164104
SEQ ID NO 178 NM_014737 SEQ ID NO 1524  SEQ ID NO 178 NM_014737  SEQ ID NO 1524

AF167706 AF167706
SEQ ID NO 179 NM_014738 SEQ ID NO 1525  SEQ ID NO 179 NM_014738  SEQ ID NO 1525

AF175387 AF175387
SEQ ID NO 180 NM_014747 SEQ ID NO 1526  SEQ ID NO 180 NM_014747  SEQ ID NO 1526

AF176012 AF176012
SEQ ID NO 181 NM_014750 SEQ ID NO 1527  SEQ ID NO 181 NM_014750  SEQ ID NO 1527

AF186780 AF186780
SEQ ID NO 182 NM_014754 SEQ ID NO 1528  SEQ ID NO 182 NM_014754  SEQ ID NO 1528

AF217508 AF217508
SEQ ID NO 184 NM_014767 SEQ ID NO 1529  SEQ ID NO 184 NM_014767  SEQ ID NO 1529

AF220492 AF220492
SEQ ID NO 185 NM_014770 SEQ ID NO 1530  SEQ ID NO 185 NM_014770  SEQ ID NO 1530

AF224266 AF224266
SEQ ID NO 186 NM_014773 SEQ ID NO 1531  SEQ ID NO 186 NM_014773  SEQ ID NO 1531

AF230904 AF230904
SEQ ID NO 187 NM_014776 SEQ ID NO 1532  SEQ ID NO 187 NM_014776  SEQ ID NO 1532

AF234532 AF234532
SEQ ID NO 188 NM_014782 SEQ ID NO 1533  SEQ ID NO 188 NM_014782  SEQ ID NO 1533

AF257175 AF257175
SEQ ID NO 189 NM_014785 SEQ ID NO 1534  SEQ ID NO 189 NM_014785  SEQ ID NO 1534

AF257659 AF257659
SEQ ID NO 190 NM_014791 SEQ ID NO 1535  SEQ ID NO 190 NM_014791  SEQ ID NO 1535

AF272357 AF272357
SEQ ID NO 191 NM_014808 SEQ ID NO 1536  SEQ ID NO 191 NM_014808  SEQ ID NO 1536

AF279865 AF279865
SEQ ID NO 192 NM_014811 SEQ ID NO 1537  SEQ ID NO 192 NM_014811  SEQ ID NO 1537

AI497657_RC  AI497657_RC
SEQ ID NO 193 NM_014812 SEQ ID NO 1538  SEQ ID NO 193 NM_014812  SEQ ID NO 1538

AJ012755 AJ012755
SEQ ID NO 194 NM_014838 SEQ ID NO 1540  SEQ ID NO 194 NM_014838  SEQ ID NO 1540

AJ223353 AJ223353
SEQ ID NO 195 NM_014862 SEQ ID NO 1542  SEQ ID NO 195 NM_014862  SEQ ID NO 1542

AJ224741 AJ224741
SEQ ID NO 196 NM_014865 SEQ ID NO 1543  SEQ ID NO 196 NM_014865  SEQ ID NO 1543

AJ224864 AJ224864
SEQ ID NO 197 NM_014870 SEQ ID NO 1544  SEQ ID NO 197 NM_014870  SEQ ID NO 1544

AJ225092 AJ225092
SEQ ID NO 198 NM_014875 SEQ ID NO 1545  SEQ ID NO 198 NM_014875  SEQ ID NO 1545

AJ225093 AJ225093
SEQ ID NO 199 NM_014886 SEQ ID NO 1547  SEQ ID NO 199 NM_014886  SEQ ID NO 1547

AJ249377 AJ249377
SEQ ID NO 200 NM_014889 SEQ ID NO 1548  SEQ ID NO 200 NM_014889  SEQ ID NO 1548

AJ270996 AJ270996
SEQ ID NO 202 NM_014905 SEQ ID NO 1549  SEQ ID NO 202 NM_014905  SEQ ID NO 1549

AJ272057 AJ272057
SEQ ID NO 203 NM_014935 SEQ ID NO 1550  SEQ ID NO 203 NM_014935  SEQ ID NO 1550

AJ275978 AJ275978
SEQ ID NO 204 NM_014945 SEQ ID NO 1551  SEQ ID NO 204 NM_014945  SEQ ID NO 1551

AJ276429 AJ276429
SEQ ID NO 205 NM_014965 SEQ ID NO 1552  SEQ ID NO 205 NM_014965  SEQ ID NO 1552

AK000004 AK000004
SEQ ID NO 206 NM_014967 SEQ ID NO 1553  SEQ ID NO 206 NM_014967  SEQ ID NO 1553

AK000005 AK000005
SEQ ID NO 207 NM_014968 SEQ ID NO 1554  SEQ ID NO 207 NM_014968  SEQ ID NO 1554

AK000106 AK000106
SEQ ID NO 208 NM_015032 SEQ ID NO 1555  SEQ ID NO 208 NM_015032  SEQ ID NO 1555

AK000142 AK000142
SEQ ID NO 209 NM_015239 SEQ ID NO 1556  SEQ ID NO 209 NM_015239  SEQ ID NO 1556

AK000168 AK000168
SEQ ID NO 210 NM_015383 SEQ ID NO 1557  SEQ ID NO 210 NM_015383  SEQ ID NO 1557

AK000345 AK000345
SEQ ID NO 212 NM_015392 SEQ ID NO 1558  SEQ ID NO 212 NM_015392  SEQ ID NO 1558

AK000543 AK000543
SEQ ID NO 213 NM_015416 SEQ ID NO 1559  SEQ ID NO 213 NM_015416  SEQ ID NO 1559

AK000552 AK000552
SEQ ID NO 214 NM_015417 SEQ ID NO 1560  SEQ ID NO 214 NM_015417  SEQ ID NO 1560

15 fifteen

AK000643  AK000643
SEQ ID NO 216 NM_015420 SEQ ID NO 1561  SEQ ID NO 216 NM_015420  SEQ ID NO 1561

AK000660 AK000660
SEQ ID NO 217 NM_015434 SEQ ID NO 1562  SEQ ID NO 217 NM_015434  SEQ ID NO 1562

AK000689 AK000689
SEQ ID NO 218 NM_015474 SEQ ID NO 1563  SEQ ID NO 218 NM_015474  SEQ ID NO 1563

AK000770 AK000770
SEQ ID NO 220 NM_015507 SEQ ID NO 1565  SEQ ID NO 220 NM_015507  SEQ ID NO 1565

AK000933 AK000933
SEQ ID NO 221 NM_015513 SEQ ID NO 1566  SEQ ID NO 221 NM_015513  SEQ ID NO 1566

AK001100 AK001100
SEQ ID NO 223 NM_015515 SEQ ID NO 1567  SEQ ID NO 223 NM_015515  SEQ ID NO 1567

AK001164 AK001164
SEQ ID NO 224 NM_015523 SEQ ID NO 1568  SEQ ID NO 224 NM_015523  SEQ ID NO 1568

AK001166 AK001166
SEQ ID NO 225 NM_015524 SEQ ID NO 1569  SEQ ID NO 225 NM_015524  SEQ ID NO 1569

AK001295 AK001295
SEQ ID NO 226 NM_015599 SEQ ID NO 1571  SEQ ID NO 226 NM_015599  SEQ ID NO 1571

AK001380 AK001380
SEQ ID NO 227 NM_015623 SEQ ID NO 1572  SEQ ID NO 227 NM_015623  SEQ ID NO 1572

AK001423 AK001423
SEQ ID NO 228 NM_015640 SEQ ID NO 1573  SEQ ID NO 228 NM_015640  SEQ ID NO 1573

AK001438 AK001438
SEQ ID NO 229 NM_015641 SEQ ID NO 1574  SEQ ID NO 229 NM_015641  SEQ ID NO 1574

AK001492 AK001492
SEQ ID NO 230 NM_015678 SEQ ID NO 1575  SEQ ID NO 230 NM_015678  SEQ ID NO 1575

AK001499 AK001499
SEQ ID NO 231 NM_015721 SEQ ID NO 1576  SEQ ID NO 231 NM_015721  SEQ ID NO 1576

AK001630 AK001630
SEQ ID NO 232 NM_015892 SEQ ID NO 1578  SEQ ID NO 232 NM_015892  SEQ ID NO 1578

AK001872 AK001872
SEQ ID NO 234 NM_015895 SEQ ID NO 1579  SEQ ID NO 234 NM_015895  SEQ ID NO 1579

AK001890 AK001890
SEQ ID NO 235 NM_015907 SEQ ID NO 1580  SEQ ID NO 235 NM_015907  SEQ ID NO 1580

AK002016 AK002016
SEQ ID NO 236 NM_015925 SEQ ID NO 1581  SEQ ID NO 236 NM_015925  SEQ ID NO 1581

AK002088 AK002088
SEQ ID NO 237 NM_015937 SEQ ID NO 1582  SEQ ID NO 237 NM_015937  SEQ ID NO 1582

AK002206 AK002206
SEQ ID NO 240 NM_015954 SEQ ID NO 1583  SEQ ID NO 240 NM_015954  SEQ ID NO 1583

AL035297 AL035297
SEQ ID NO 241 NM_015955 SEQ ID NO 1584  SEQ ID NO 241 NM_015955  SEQ ID NO 1584

AL049265 AL049265
SEQ ID NO 242 NM_015961 SEQ ID NO 1585  SEQ ID NO 242 NM_015961  SEQ ID NO 1585

AL049365 AL049365
SEQ ID NO 244 NM_015984 SEQ ID NO 1587  SEQ ID NO 244 NM_015984  SEQ ID NO 1587

AL049370 AL049370
SEQ ID NO 245 NM_015986 SEQ ID NO 1588  SEQ ID NO 245 NM_015986  SEQ ID NO 1588

AL049381 AL049381
SEQ ID NO 246 NM_015987 SEQ ID NO 1589  SEQ ID NO 246 NM_015987  SEQ ID NO 1589

AL049397 AL049397
SEQ ID NO 247 NM_015991 SEQ ID NO 1590  SEQ ID NO 247 NM_015991  SEQ ID NO 1590

AL049415 AL049415
SEQ ID NO 248 NM_016002 SEQ ID NO 1592  SEQ ID NO 248 NM_016002  SEQ ID NO 1592

AL049667 AL049667
SEQ ID NO 249 NM_016028 SEQ ID NO 1594  SEQ ID NO 249 NM_016028  SEQ ID NO 1594

AL049801 AL049801
SEQ ID NO 250 NM_016029 SEQ ID NO 1595  SEQ ID NO 250 NM_016029  SEQ ID NO 1595

AL049932 AL049932
SEQ ID NO 251 NM_016047 SEQ ID NO 1596  SEQ ID NO 251 NM_016047  SEQ ID NO 1596

AL049935 AL049935
SEQ ID NO 252 NM_016048 SEQ ID NO 1597  SEQ ID NO 252 NM_016048  SEQ ID NO 1597

AL049943 AL049943
SEQ ID NO 253 NM_016050 SEQ ID NO 1598  SEQ ID NO 253 NM_016050  SEQ ID NO 1598

AL049949 AL049949
SEQ ID NO 254 NM_016056 SEQ ID NO 1599  SEQ ID NO 254 NM_016056  SEQ ID NO 1599

AL049963 AL049963
SEQ ID NO 255 NM_016058 SEQ ID NO 1600  SEQ ID NO 255 NM_016058  SEQ ID NO 1600

AL049987 AL049987
SEQ ID NO 256 NM_016066 SEQ ID NO 1601  SEQ ID NO 256 NM_016066  SEQ ID NO 1601

AL050021 AL050021
SEQ ID NO 257 NM_016072 SEQ ID NO 1602  SEQ ID NO 257 NM_016072  SEQ ID NO 1602

AL050024 AL050024
SEQ ID NO 258 NM_016073 SEQ ID NO 1603  SEQ ID NO 258 NM_016073  SEQ ID NO 1603

AL050090 AL050090
SEQ ID NO 259 NM_016108 SEQ ID NO 1605  SEQ ID NO 259 NM_016108  SEQ ID NO 1605

AL050148 AL050148
SEQ ID NO 260 NM_016109 SEQ ID NO 1606  SEQ ID NO 260 NM_016109  SEQ ID NO 1606

AL050151 AL050151
SEQ ID NO 261 NM_016121 SEQ ID NO 1607  SEQ ID NO 261 NM_016121  SEQ ID NO 1607

AL050227 AL050227
SEQ ID NO 262 NM_016126 SEQ ID NO 1608  SEQ ID NO 262 NM_016126  SEQ ID NO 1608

AL050367 AL050367
SEQ ID NO 263 NM_016127 SEQ ID NO 1609  SEQ ID NO 263 NM_016127  SEQ ID NO 1609

AL050370 AL050370
SEQ ID NO 264 NM_016135 SEQ ID NO 1610  SEQ ID NO 264 NM_016135  SEQ ID NO 1610

AL050371 AL050371
SEQ ID NO 265 NM_016142 SEQ ID NO 1612  SEQ ID NO 265 NM_016142  SEQ ID NO 1612

AL050372 AL050372
SEQ ID NO 266 NM_016153 SEQ ID NO 1613  SEQ ID NO 266 NM_016153  SEQ ID NO 1613

AL050388 AL050388
SEQ ID NO 267 NM_016171 SEQ ID NO 1614  SEQ ID NO 267 NM_016171  SEQ ID NO 1614

AL079276 AL079276
SEQ ID NO 268 NM_016175 SEQ ID NO 1615  SEQ ID NO 268 NM_016175  SEQ ID NO 1615

16 16

AL079298  AL079298
SEQ ID NO 269 NM_016184 SEQ ID NO 1616  SEQ ID NO 269 NM_016184  SEQ ID NO 1616

AL080079 AL080079
SEQ ID NO 271 NM_016185 SEQ ID NO 1617  SEQ ID NO 271 NM_016185  SEQ ID NO 1617

AL080192 AL080192
SEQ ID NO 273 NM_016187 SEQ ID NO 1618  SEQ ID NO 273 NM_016187  SEQ ID NO 1618

AL080199 AL080199
SEQ ID NO 274 NM_016199 SEQ ID NO 1619  SEQ ID NO 274 NM_016199  SEQ ID NO 1619

AL080209 AL080209
SEQ ID NO 275 NM_016210 SEQ ID NO 1620  SEQ ID NO 275 NM_016210  SEQ ID NO 1620

AL080234 AL080234
SEQ ID NO 277 NM_016217 SEQ ID NO 1621  SEQ ID NO 277 NM_016217  SEQ ID NO 1621

AL080235 AL080235
SEQ ID NO 278 NM_016228 SEQ ID NO 1623  SEQ ID NO 278 NM_016228  SEQ ID NO 1623

AL096737 AL096737
SEQ ID NO 279 NM_016229 SEQ ID NO 1624  SEQ ID NO 279 NM_016229  SEQ ID NO 1624

AL110126 AL110126
SEQ ID NO 280 NM_016235 SEQ ID NO 1625  SEQ ID NO 280 NM_016235  SEQ ID NO 1625

AL110139 AL110139
SEQ ID NO 281 NM_016240 SEQ ID NO 1626  SEQ ID NO 281 NM_016240  SEQ ID NO 1626

AL110202 AL110202
SEQ ID NO 283 NM_016243 SEQ ID NO 1627  SEQ ID NO 283 NM_016243  SEQ ID NO 1627

AL110212 AL110212
SEQ ID NO 284 NM_016250 SEQ ID NO 1628  SEQ ID NO 284 NM_016250  SEQ ID NO 1628

AL110260 AL110260
SEQ ID NO 285 NM_016267 SEQ ID NO 1629  SEQ ID NO 285 NM_016267  SEQ ID NO 1629

AL117441 AL117441
SEQ ID NO 286 NM_016271 SEQ ID NO 1630  SEQ ID NO 286 NM_016271  SEQ ID NO 1630

AL117452 AL117452
SEQ ID NO 287 NM_016299 SEQ ID NO 1631  SEQ ID NO 287 NM_016299  SEQ ID NO 1631

AL117477 AL117477
SEQ ID NO 288 NM_016306 SEQ ID NO 1632  SEQ ID NO 288 NM_016306  SEQ ID NO 1632

AL117502 AL117502
SEQ ID NO 289 NM_016308 SEQ ID NO 1634  SEQ ID NO 289 NM_016308  SEQ ID NO 1634

AL117523 AL117523
SEQ ID NO 290 NM_016321 SEQ ID NO 1635  SEQ ID NO 290 NM_016321  SEQ ID NO 1635

AL117595 AL117595
SEQ ID NO 291 NM_016337 SEQ ID NO 1636  SEQ ID NO 291 NM_016337  SEQ ID NO 1636

AL117599 AL117599
SEQ ID NO 292 NM_016352 SEQ ID NO 1637  SEQ ID NO 292 NM_016352  SEQ ID NO 1637

AL117600 AL117600
SEQ ID NO 293 NM_016359 SEQ ID NO 1638  SEQ ID NO 293 NM_016359  SEQ ID NO 1638

AL117609 AL117609
SEQ ID NO 294 NM_016401 SEQ ID NO 1641  SEQ ID NO 294 NM_016401  SEQ ID NO 1641

AL117617 AL117617
SEQ ID NO 295 NM_016403 SEQ ID NO 1642  SEQ ID NO 295 NM_016403  SEQ ID NO 1642

AL117666 AL117666
SEQ ID NO 296 NM_016411 SEQ ID NO 1643  SEQ ID NO 296 NM_016411  SEQ ID NO 1643

AL122055 AL122055
SEQ ID NO 297 NM_016423 SEQ ID NO 1644  SEQ ID NO 297 NM_016423  SEQ ID NO 1644

AL133033 AL133033
SEQ ID NO 298 NM_016463 SEQ ID NO 1647  SEQ ID NO 298 NM_016463  SEQ ID NO 1647

AL133035 AL133035
SEQ ID NO 299 NM_016475 SEQ ID NO 1649  SEQ ID NO 299 NM_016475  SEQ ID NO 1649

AL133074 AL133074
SEQ ID NO 301 NM_016477 SEQ ID NO 1650  SEQ ID NO 301 NM_016477  SEQ ID NO 1650

AL133096 AL133096
SEQ ID NO 302 NM_016491 SEQ ID NO 1651  SEQ ID NO 302 NM_016491  SEQ ID NO 1651

AL133105 AL133105
SEQ ID NO 303 NM_016495 SEQ ID NO 1652  SEQ ID NO 303 NM_016495  SEQ ID NO 1652

AL133108 AL133108
SEQ ID NO 304 NM_016542 SEQ ID NO 1653  SEQ ID NO 304 NM_016542  SEQ ID NO 1653

AL133572 AL133572
SEQ ID NO 305 NM_016548 SEQ ID NO 1654  SEQ ID NO 305 NM_016548  SEQ ID NO 1654

AL133619 AL133619
SEQ ID NO 307 NM_016569 SEQ ID NO 1655  SEQ ID NO 307 NM_016569  SEQ ID NO 1655

AL133622 AL133622
SEQ ID NO 308 NM_016577 SEQ ID NO 1656  SEQ ID NO 308 NM_016577  SEQ ID NO 1656

AL133623 AL133623
SEQ ID NO 309 NM_016582 SEQ ID NO 1657  SEQ ID NO 309 NM_016582  SEQ ID NO 1657

AL133624 AL133624
SEQ ID NO 310 NM_016593 SEQ ID NO 1658  SEQ ID NO 310 NM_016593  SEQ ID NO 1658

AL133632 AL133632
SEQ ID NO 311 NM_016603 SEQ ID NO 1659  SEQ ID NO 311 NM_016603  SEQ ID NO 1659

AL133644 AL133644
SEQ ID NO 312 NM_016612 SEQ ID NO 1660  SEQ ID NO 312 NM_016612  SEQ ID NO 1660

AL133645 AL133645
SEQ ID NO 313 NM_016619 SEQ ID NO 1661  SEQ ID NO 313 NM_016619  SEQ ID NO 1661

AL133651 AL133651
SEQ ID NO 314 NM_016623 SEQ ID NO 1663  SEQ ID NO 314 NM_016623  SEQ ID NO 1663

AL137310 AL137310
SEQ ID NO 316 NM_016625 SEQ ID NO 1664  SEQ ID NO 316 NM_016625  SEQ ID NO 1664

AL137316 AL137316
SEQ ID NO 317 NM_016629 SEQ ID NO 1665  SEQ ID NO 317 NM_016629  SEQ ID NO 1665

AL137332 AL137332
SEQ ID NO 318 NM_016640 SEQ ID NO 1666  SEQ ID NO 318 NM_016640  SEQ ID NO 1666

AL137342 AL137342
SEQ ID NO 319 NM_016645 SEQ ID NO 1667  SEQ ID NO 319 NM_016645  SEQ ID NO 1667

AL137362 AL137362
SEQ ID NO 321 NM_016650 SEQ ID NO 1668  SEQ ID NO 321 NM_016650  SEQ ID NO 1668

AL137381 AL137381
SEQ ID NO 322 NM_016657 SEQ ID NO 1669  SEQ ID NO 322 NM_016657  SEQ ID NO 1669

AL137407 AL137407
SEQ ID NO 323 NM_016733 SEQ ID NO 1670  SEQ ID NO 323 NM_016733  SEQ ID NO 1670

17 17

AL137448  AL137448
SEQ ID NO 324 NM_016815 SEQ ID NO 1671  SEQ ID NO 324 NM_016815  SEQ ID NO 1671

AL137502 AL137502
SEQ ID NO 326 NM_016817 SEQ ID NO 1672  SEQ ID NO 326 NM_016817  SEQ ID NO 1672

AL137514 AL137514
SEQ ID NO 327 NM_016818 SEQ ID NO 1673  SEQ ID NO 327 NM_016818  SEQ ID NO 1673

AL137540 AL137540
SEQ ID NO 328 NM_016839 SEQ ID NO 1675  SEQ ID NO 328 NM_016839  SEQ ID NO 1675

AL137566 AL137566
SEQ ID NO 330 NM_017414 SEQ ID NO 1676  SEQ ID NO 330 NM_017414  SEQ ID NO 1676

AL137615 AL137615
SEQ ID NO 331 NM_017422 SEQ ID NO 1677  SEQ ID NO 331 NM_017422  SEQ ID NO 1677

AL137673 AL137673
SEQ ID NO 335 NM_017423 SEQ ID NO 1678  SEQ ID NO 335 NM_017423  SEQ ID NO 1678

AL137718 AL137718
SEQ ID NO 336 NM_017447 SEQ ID NO 1679  SEQ ID NO 336 NM_017447  SEQ ID NO 1679

AL137736 AL137736
SEQ ID NO 337 NM_017518 SEQ ID NO 1680  SEQ ID NO 337 NM_017518  SEQ ID NO 1680

AL137751 AL137751
SEQ ID NO 338 NM_017522 SEQ ID NO 1681  SEQ ID NO 338 NM_017522  SEQ ID NO 1681

AL137761 AL137761
SEQ ID NO 339 NM_017540 SEQ ID NO 1682  SEQ ID NO 339 NM_017540  SEQ ID NO 1682

AL157431 AL157431
SEQ ID NO 340 NM_017555 SEQ ID NO 1683  SEQ ID NO 340 NM_017555  SEQ ID NO 1683

AL157432 AL157432
SEQ ID NO 341 NM_017572 SEQ ID NO 1684  SEQ ID NO 341 NM_017572  SEQ ID NO 1684

AL157454 AL157454
SEQ ID NO 342 NM_017585 SEQ ID NO 1685  SEQ ID NO 342 NM_017585  SEQ ID NO 1685

AL157476 AL157476
SEQ ID NO 343 NM_017586 SEQ ID NO 1686  SEQ ID NO 343 NM_017586  SEQ ID NO 1686

AL157480 AL157480
SEQ ID NO 344 NM_017596 SEQ ID NO 1687  SEQ ID NO 344 NM_017596  SEQ ID NO 1687

AL157482 AL157482
SEQ ID NO 345 NM_017606 SEQ ID NO 1688  SEQ ID NO 345 NM_017606  SEQ ID NO 1688

AL157484 AL157484
SEQ ID NO 346 NM_017617 SEQ ID NO 1689  SEQ ID NO 346 NM_017617  SEQ ID NO 1689

AL157492 AL157492
SEQ ID NO 347 NM_017633 SEQ ID NO 1690  SEQ ID NO 347 NM_017633  SEQ ID NO 1690

AL157505 AL157505
SEQ ID NO 348 NM_017634 SEQ ID NO 1691  SEQ ID NO 348 NM_017634  SEQ ID NO 1691

AL157851 AL157851
SEQ ID NO 349 NM_017646 SEQ ID NO 1692  SEQ ID NO 349 NM_017646  SEQ ID NO 1692

AL160131 AL160131
SEQ ID NO 350 NM_017660 SEQ ID NO 1693  SEQ ID NO 350 NM_017660  SEQ ID NO 1693

AL161960 AL161960
SEQ ID NO 351 NM_017680 SEQ ID NO 1694  SEQ ID NO 351 NM_017680  SEQ ID NO 1694

AL162049 AL162049
SEQ ID NO 352 NM_017691 SEQ ID NO 1695  SEQ ID NO 352 NM_017691  SEQ ID NO 1695

AL355708 AL355708
SEQ ID NO 353 NM_017698 SEQ ID NO 1696  SEQ ID NO 353 NM_017698  SEQ ID NO 1696

D13643 D13643
SEQ ID NO 355 NM_017702 SEQ ID NO 1697  SEQ ID NO 355 NM_017702  SEQ ID NO 1697

D14678 D14678
SEQ ID NO 356 NM_017731 SEQ ID NO 1699  SEQ ID NO 356 NM_017731  SEQ ID NO 1699

D25328D25328
SEQ ID NO 357 NM_017732 SEQ ID NO 1700  SEQ ID NO 357 NM_017732  SEQ ID NO 1700

D26070 D26070
SEQ ID NO 358 NM_017733 SEQ ID NO 1701  SEQ ID NO 358 NM_017733  SEQ ID NO 1701

D26488 D26488
SEQ ID NO 359 NM_017734 SEQ ID NO 1702  SEQ ID NO 359 NM_017734  SEQ ID NO 1702

D31887 D31887
SEQ ID NO 360 NM_017746 SEQ ID NO 1703  SEQ ID NO 360 NM_017746  SEQ ID NO 1703

D38521 D38521
SEQ ID NO 361 NM_017750 SEQ ID NO 1704  SEQ ID NO 361 NM_017750  SEQ ID NO 1704

D38553 D38553
SEQ ID NO 362 NM_017761 SEQ ID NO 1705  SEQ ID NO 362 NM_017761  SEQ ID NO 1705

D42043 D42043
SEQ ID NO 363 NM_017763 SEQ ID NO 1706  SEQ ID NO 363 NM_017763  SEQ ID NO 1706

D42047 D42047
SEQ ID NO 364 NM_017770 SEQ ID NO 1707  SEQ ID NO 364 NM_017770  SEQ ID NO 1707

D43950 D43950
SEQ ID NO 365 NM_017779 SEQ ID NO 1708  SEQ ID NO 365 NM_017779  SEQ ID NO 1708

D50402 D50402
SEQ ID NO 366 NM_017780 SEQ ID NO 1709  SEQ ID NO 366 NM_017780  SEQ ID NO 1709

D50914 D50914
SEQ ID NO 367 NM_017782 SEQ ID NO 1710  SEQ ID NO 367 NM_017782  SEQ ID NO 1710

D55716 D55716
SEQ ID NO 368 NM_017786 SEQ ID NO 1711  SEQ ID NO 368 NM_017786  SEQ ID NO 1711

D80001 D80001
SEQ ID NO 369 NM_017791 SEQ ID NO 1712  SEQ ID NO 369 NM_017791  SEQ ID NO 1712

D80010 D80010
SEQ ID NO 370 NM_017805 SEQ ID NO 1713  SEQ ID NO 370 NM_017805  SEQ ID NO 1713

D82345 D82345
SEQ ID NO 371 NM_017816 SEQ ID NO 1714  SEQ ID NO 371 NM_017816  SEQ ID NO 1714

D83781 D83781
SEQ ID NO 372 NM_017821 SEQ ID NO 1715  SEQ ID NO 372 NM_017821  SEQ ID NO 1715

D86964 D86964
SEQ ID NO 373 NM_017835 SEQ ID NO 1716  SEQ ID NO 373 NM_017835  SEQ ID NO 1716

D86978 D86978
SEQ ID NO 374 NM_017843 SEQ ID NO 1717  SEQ ID NO 374 NM_017843  SEQ ID NO 1717

D86985 D86985
SEQ ID NO 375 NM_017857 SEQ ID NO 1718  SEQ ID NO 375 NM_017857  SEQ ID NO 1718

D87076 D87076
SEQ ID NO 376 NM_017901 SEQ ID NO 1719  SEQ ID NO 376 NM_017901  SEQ ID NO 1719

18 18

D87453  D87453
SEQ ID NO 377 NM_017906 SEQ ID NO 1720  SEQ ID NO 377 NM_017906  SEQ ID NO 1720

D87469 D87469
SEQ ID NO 378 NM_017918 SEQ ID NO 1721  SEQ ID NO 378 NM_017918  SEQ ID NO 1721

D87682 D87682
SEQ ID NO 379 NM_017961 SEQ ID NO 1722  SEQ ID NO 379 NM_017961  SEQ ID NO 1722

G26403  G26403
SEQ ID NO 380 NM_017996 SEQ ID NO 1723  SEQ ID NO 380 NM_017996  SEQ ID NO 1723

J02639 J02639
SEQ ID NO 381 NM_018000 SEQ ID NO 1724  SEQ ID NO 381 NM_018000  SEQ ID NO 1724

J04162 J04162
SEQ ID NO 382 NM_018004 SEQ ID NO 1725  SEQ ID NO 382 NM_018004  SEQ ID NO 1725

K02403 K02403
SEQ ID NO 384 NM_018011 SEQ ID NO 1726  SEQ ID NO 384 NM_018011  SEQ ID NO 1726

L05096 L05096
SEQ ID NO 385 NM_018014 SEQ ID NO 1727  SEQ ID NO 385 NM_018014  SEQ ID NO 1727

L10333 L10333
SEQ ID NO 386 NM_018022 SEQ ID NO 1728  SEQ ID NO 386 NM_018022  SEQ ID NO 1728

L11645 L11645
SEQ ID NO 387 NM_018031 SEQ ID NO 1729  SEQ ID NO 387 NM_018031  SEQ ID NO 1729

L21934 L21934
SEQ ID NO 388 NM_018043 SEQ ID NO 1730  SEQ ID NO 388 NM_018043  SEQ ID NO 1730

L22005 L22005
SEQ ID NO 389 NM_018048 SEQ ID NO 1731  SEQ ID NO 389 NM_018048  SEQ ID NO 1731

L48692 L48692
SEQ ID NO 391 NM_018062 SEQ ID NO 1732  SEQ ID NO 391 NM_018062  SEQ ID NO 1732

M12758 M12758
SEQ ID NO 392 NM_018069 SEQ ID NO 1733  SEQ ID NO 392 NM_018069  SEQ ID NO 1733

M15178 M15178
SEQ ID NO 393 NM_018072 SEQ ID NO 1734  SEQ ID NO 393 NM_018072  SEQ ID NO 1734

M21551 M21551
SEQ ID NO 394 NM_018077 SEQ ID NO 1735  SEQ ID NO 394 NM_018077  SEQ ID NO 1735

M24895 M24895
SEQ ID NO 395 NM_018086 SEQ ID NO 1736  SEQ ID NO 395 NM_018086  SEQ ID NO 1736

M26383 M26383
SEQ ID NO 396 NM_018087 SEQ ID NO 1737  SEQ ID NO 396 NM_018087  SEQ ID NO 1737

M27749 M27749
SEQ ID NO 397 NM_018093 SEQ ID NO 1738  SEQ ID NO 397 NM_018093  SEQ ID NO 1738

M28170 M28170
SEQ ID NO 398 NM_018098 SEQ ID NO 1739  SEQ ID NO 398 NM_018098  SEQ ID NO 1739

M29873 M29873
SEQ ID NO 399 NM_018099 SEQ ID NO 1740  SEQ ID NO 399 NM_018099  SEQ ID NO 1740

M29874 M29874
SEQ ID NO 400 NM_018101 SEQ ID NO 1741  SEQ ID NO 400 NM_018101  SEQ ID NO 1741

M30448 M30448
SEQ ID NO 401 NM_018103 SEQ ID NO 1742  SEQ ID NO 401 NM_018103  SEQ ID NO 1742

M30818 M30818
SEQ ID NO 402 NM_018109 SEQ ID NO 1744  SEQ ID NO 402 NM_018109  SEQ ID NO 1744

M31932 M31932
SEQ ID NO 403 NM_018123 SEQ ID NO 1746  SEQ ID NO 403 NM_018123  SEQ ID NO 1746

M37033 M37033
SEQ ID NO 404 NM_018131 SEQ ID NO 1747  SEQ ID NO 404 NM_018131  SEQ ID NO 1747

M55914 M55914
SEQ ID NO 405 NM_018136 SEQ ID NO 1748  SEQ ID NO 405 NM_018136  SEQ ID NO 1748

M63438 M63438
SEQ ID NO 406 NM_018138 SEQ ID NO 1749  SEQ ID NO 406 NM_018138  SEQ ID NO 1749

M65254 M65254
SEQ ID NO 407 NM_018166 SEQ ID NO 1750  SEQ ID NO 407 NM_018166  SEQ ID NO 1750

M68874 M68874
SEQ ID NO 408 NM_018171 SEQ ID NO 1751  SEQ ID NO 408 NM_018171  SEQ ID NO 1751

M73547 M73547
SEQ ID NO 409 NM_018178 SEQ ID NO 1752  SEQ ID NO 409 NM_018178  SEQ ID NO 1752

M77142 M77142
SEQ ID NO 410 NM_018181 SEQ ID NO 1753  SEQ ID NO 410 NM_018181  SEQ ID NO 1753

M80899 M80899
SEQ ID NO 411 NM_018186 SEQ ID NO 1754  SEQ ID NO 411 NM_018186  SEQ ID NO 1754

M90657 M90657
SEQ ID NO 413 NM_018194 SEQ ID NO 1757  SEQ ID NO 413 NM_018194  SEQ ID NO 1757

M93718 M93718
SEQ ID NO 414 NM_018204 SEQ ID NO 1758  SEQ ID NO 414 NM_018204  SEQ ID NO 1758

M96577 M96577
SEQ ID NO 415 NM_018208 SEQ ID NO 1759  SEQ ID NO 415 NM_018208  SEQ ID NO 1759

NM_000022 NM_000022
SEQ ID NO 417 NM_018212 SEQ ID NO 1760  SEQ ID NO 417 NM_018212  SEQ ID NO 1760

NM_000044 NM_000044
SEQ ID NO 418 NM_018234 SEQ ID NO 1763  SEQ ID NO 418 NM_018234  SEQ ID NO 1763

NM_000050 NM_000050
SEQ ID NO 419 NM_018255 SEQ ID NO 1764  SEQ ID NO 419 NM_018255  SEQ ID NO 1764

NM_000057 NM_000057
SEQ ID NO 420 NM_018257 SEQ ID NO 1765  SEQ ID NO 420 NM_018257  SEQ ID NO 1765

NM_000060 NM_000060
SEQ ID NO 421 NM_018265 SEQ ID NO 1766  SEQ ID NO 421 NM_018265  SEQ ID NO 1766

NM_000064 NM_000064
SEQ ID NO 422 NM_018271 SEQ ID NO 1767  SEQ ID NO 422 NM_018271  SEQ ID NO 1767

NM_000073 NM_000073
SEQ ID NO 424 NM_018290 SEQ ID NO 1768  SEQ ID NO 424 NM_018290  SEQ ID NO 1768

NM_000077 NM_000077
SEQ ID NO 425 NM_018295 SEQ ID NO 1769  SEQ ID NO 425 NM_018295  SEQ ID NO 1769

NM_000086 NM_000086
SEQ ID NO 426 NM_018304 SEQ ID NO 1770  SEQ ID NO 426 NM_018304  SEQ ID NO 1770

NM_000087 NM_000087
SEQ ID NO 427 NM_018306 SEQ ID NO 1771  SEQ ID NO 427 NM_018306  SEQ ID NO 1771

NM_000095 NM_000095
SEQ ID NO 429 NM_018326 SEQ ID NO 1772  SEQ ID NO 429 NM_018326  SEQ ID NO 1772

19 19

NM_000096  NM_000096
SEQ ID NO 430 NM_018346 SEQ ID NO 1773  SEQ ID NO 430 NM_018346  SEQ ID NO 1773

NM_000100 NM_000100
SEQ ID NO 431 NM_018366 SEQ ID NO 1775  SEQ ID NO 431 NM_018366  SEQ ID NO 1775

NM_000101 NM_000101
SEQ ID NO 432 NM_018370 SEQ ID NO 1776  SEQ ID NO 432 NM_018370  SEQ ID NO 1776

NM_000104 NM_000104
SEQ ID NO 433 NM_018373 SEQ ID NO 1777  SEQ ID NO 433 NM_018373  SEQ ID NO 1777

NM_000109 NM_000109
SEQ ID NO 434 NM_018379 SEQ ID NO 1778  SEQ ID NO 434 NM_018379  SEQ ID NO 1778

NM_000125 NM_000125
SEQ ID NO 435 NM_018384 SEQ ID NO 1779  SEQ ID NO 435 NM_018384  SEQ ID NO 1779

NM_000127 NM_000127
SEQ ID NO 436 NM_018389 SEQ ID NO 1780  SEQ ID NO 436 NM_018389  SEQ ID NO 1780

NM_000135 NM_000135
SEQ ID NO 437 NM_018410 SEQ ID NO 1783  SEQ ID NO 437 NM_018410  SEQ ID NO 1783

NM_000137 NM_000137
SEQ ID NO 438 NM_018439 SEQ ID NO 1785  SEQ ID NO 438 NM_018439  SEQ ID NO 1785

NM_000146 NM_000146
SEQ ID NO 439 NM_018454 SEQ ID NO 1786  SEQ ID NO 439 NM_018454  SEQ ID NO 1786

NM_000149 NM_000149
SEQ ID NO 440 NM_018455 SEQ ID NO 1787  SEQ ID NO 440 NM_018455  SEQ ID NO 1787

NM_000154 NM_000154
SEQ ID NO 441 NM_018465 SEQ ID NO 9788  SEQ ID NO 441 NM_018465  SEQ ID NO 9788

NM_000161 NM_000161
SEQ ID NO 443 NM_018471 SEQ ID NO 1789  SEQ ID NO 443 NM_018471  SEQ ID NO 1789

NM_000165 NM_000165
SEQ ID NO 444 NM_018478 SEQ ID NO 1790  SEQ ID NO 444 NM_018478  SEQ ID NO 1790

NM_000168 NM_000168
SEQ ID NO 445 NM_018479 SEQ ID NO 1791  SEQ ID NO 445 NM_018479  SEQ ID NO 1791

NM_000169 NM_000169
SEQ ID NO 446 NM_018529 SEQ ID NO 1793  SEQ ID NO 446 NM_018529  SEQ ID NO 1793

NM_000175 NM_000175
SEQ ID NO 447 NM_018556 SEQ ID NO 1794  SEQ ID NO 447 NM_018556  SEQ ID NO 1794

NM_000191 NM_000191
SEQ ID NO 448 NM_018569 SEQ ID NO 1795  SEQ ID NO 448 NM_018569  SEQ ID NO 1795

NM_000201 NM_000201
SEQ ID NO 450 NM_018584 SEQ ID NO 1796  SEQ ID NO 450 NM_018584  SEQ ID NO 1796

NM_000211 NM_000211
SEQ ID NO 451 NM_018653 SEQ ID NO 1797  SEQ ID NO 451 NM_018653  SEQ ID NO 1797

NM_000213 NM_000213
SEQ ID NO 452 NM_018660 SEQ ID NO 1798  SEQ ID NO 452 NM_018660  SEQ ID NO 1798

NM_000224 NM_000224
SEQ ID NO 453 NM_018683 SEQ ID NO 1799  SEQ ID NO 453 NM_018683  SEQ ID NO 1799

NM_000239 NM_000239
SEQ ID NO 454 NM_018685 SEQ ID NO 1800  SEQ ID NO 454 NM_018685  SEQ ID NO 1800

NM_000251 NM_000251
SEQ ID NO 455 NM_018686 SEQ ID NO 1801  SEQ ID NO 455 NM_018686  SEQ ID NO 1801

NM_000268 NM_000268
SEQ ID NO 456 NM_018695 SEQ ID NO 1802  SEQ ID NO 456 NM_018695  SEQ ID NO 1802

NM_000270 NM_000270
SEQ ID NO 458 NM_018728 SEQ ID NO 1803  SEQ ID NO 458 NM_018728  SEQ ID NO 1803

NM_000271 NM_000271
SEQ ID NO 459 NM_018840 SEQ ID NO 1804  SEQ ID NO 459 NM_018840  SEQ ID NO 1804

NM_000283 NM_000283
SEQ ID NO 460 NM_018842 SEQ ID NO 1805  SEQ ID NO 460 NM_018842  SEQ ID NO 1805

NM_000284 NM_000284
SEQ ID NO 461 NM_018950 SEQ ID NO 1806  SEQ ID NO 461 NM_018950  SEQ ID NO 1806

NM_000286 NM_000286
SEQ ID NO 462 NM_018988 SEQ ID NO 1807  SEQ ID NO 462 NM_018988  SEQ ID NO 1807

NM_000291 NM_000291
SEQ ID NO 463 NM_019000 SEQ ID NO 1808  SEQ ID NO 463 NM_019000  SEQ ID NO 1808

NM_000299 NM_000299
SEQ ID NO 464 NM_019013 SEQ ID NO 1809  SEQ ID NO 464 NM_019013  SEQ ID NO 1809

NM_000300 NM_000300
SEQ ID NO 465 NM_019025 SEQ ID NO 1810  SEQ ID NO 465 NM_019025  SEQ ID NO 1810

NM_000310 NM_000310
SEQ ID NO 466 NM_019027 SEQ ID NO 1811  SEQ ID NO 466 NM_019027  SEQ ID NO 1811

NM_000311 NM_000311
SEQ ID NO 467 NM_019041 SEQ ID NO 1812  SEQ ID NO 467 NM_019041  SEQ ID NO 1812

NM_000317 NM_000317
SEQ ID NO 468 NM_019044 SEQ ID NO 1813  SEQ ID NO 468 NM_019044  SEQ ID NO 1813

NM_000320 NM_000320
SEQ ID NO 469 NM_019063 SEQ ID NO 1815  SEQ ID NO 469 NM_019063  SEQ ID NO 1815

NM_000342 NM_000342
SEQ ID NO 470 NM_019084 SEQ ID NO 1816  SEQ ID NO 470 NM_019084  SEQ ID NO 1816

NM_000346 NM_000346
SEQ ID NO 471 NM_019554 SEQ ID NO 1817  SEQ ID NO 471 NM_019554  SEQ ID NO 1817

NM_000352 NM_000352
SEQ ID NO 472 NM_019845 SEQ ID NO 1818  SEQ ID NO 472 NM_019845  SEQ ID NO 1818

NM_000355 NM_000355
SEQ ID NO 473 NM_019858 SEQ ID NO 1819  SEQ ID NO 473 NM_019858  SEQ ID NO 1819

NM_000358 NM_000358
SEQ ID NO 474 NM_020130 SEQ ID NO 1820  SEQ ID NO 474 NM_020130  SEQ ID NO 1820

NM_000359 NM_000359
SEQ ID NO 475 NM_020133 SEQ ID NO 1821  SEQ ID NO 475 NM_020133  SEQ ID NO 1821

NM_000362 NM_000362
SEQ ID NO 476 NM_020143 SEQ ID NO 1822  SEQ ID NO 476 NM_020143  SEQ ID NO 1822

NM_000365 NM_000365
SEQ ID NO 477 NM_020150 SEQ ID NO 1823  SEQ ID NO 477 NM_020150  SEQ ID NO 1823

NM_000381 NM_000381
SEQ ID NO 478 NM_020163 SEQ ID NO 1824  SEQ ID NO 478 NM_020163  SEQ ID NO 1824

NM_000397 NM_000397
SEQ ID NO 480 NM_020166 SEQ ID NO 1825  SEQ ID NO 480 NM_020166  SEQ ID NO 1825

20 twenty

NM_000399  NM_000399
SEQ ID NO 481 NM_020169 SEQ ID NO 1826  SEQ ID NO 481 NM_020169  SEQ ID NO 1826

NM_000414 NM_000414
SEQ ID NO 482 NM_020179 SEQ ID NO 1827  SEQ ID NO 482 NM_020179  SEQ ID NO 1827

NM_000416 NM_000416
SEQ ID NO 483 NM_020184 SEQ ID NO 1828  SEQ ID NO 483 NM_020184  SEQ ID NO 1828

NM_000422 NM_000422
SEQ ID NO 484 NM_020186 SEQ ID NO 1829  SEQ ID NO 484 NM_020186  SEQ ID NO 1829

NM_000424 NM_000424
SEQ ID NO 485 NM_020188 SEQ ID NO 1830  SEQ ID NO 485 NM_020188  SEQ ID NO 1830

NM_000433 NM_000433
SEQ ID NO 486 NM_020189 SEQ ID NO 1831  SEQ ID NO 486 NM_020189  SEQ ID NO 1831

NM_000436 NM_000436
SEQ ID NO 487 NM_020197 SEQ ID NO 1832  SEQ ID NO 487 NM_020197  SEQ ID NO 1832

NM_000450 NM_000450
SEQ ID NO 488 NM_020199 SEQ ID NO 1833  SEQ ID NO 488 NM_020199  SEQ ID NO 1833

NM_000462 NM_000462
SEQ ID NO 489 NM_020215 SEQ ID NO 1834  SEQ ID NO 489 NM_020215  SEQ ID NO 1834

NM_000495 NM_000495
SEQ ID NO 490 NM_020347 SEQ ID NO 1836  SEQ ID NO 490 NM_020347  SEQ ID NO 1836

NM_000507 NM_000507
SEQ ID NO 491 NM_020365 SEQ ID NO 1837  SEQ ID NO 491 NM_020365  SEQ ID NO 1837

NM_000526 NM_000526
SEQ ID NO 492 NM_020386 SEQ ID NO 1838  SEQ ID NO 492 NM_020386  SEQ ID NO 1838

NM_000557 NM_000557
SEQ ID NO 493 NM_020445 SEQ ID NO 1839  SEQ ID NO 493 NM_020445  SEQ ID NO 1839

NM_000560 NM_000560
SEQ ID NO 494 NM_020639 SEQ ID NO 1840  SEQ ID NO 494 NM_020639  SEQ ID NO 1840

NM_000576 NM_000576
SEQ ID NO 495 NM_020659 SEQ ID NO 1841  SEQ ID NO 495 NM_020659  SEQ ID NO 1841

NM_000579 NM_000579
SEQ ID NO 496 NM_020675 SEQ ID NO 1842  SEQ ID NO 496 NM_020675  SEQ ID NO 1842

NM_000584 NM_000584
SEQ ID NO 497 NM_020686 SEQ ID NO 1843  SEQ ID NO 497 NM_020686  SEQ ID NO 1843

NM_000591 NM_000591
SEQ ID NO 498 NM_020974 SEQ ID NO 1844  SEQ ID NO 498 NM_020974  SEQ ID NO 1844

NM_000592 NM_000592
SEQ ID NO 499 NM_020978 SEQ ID NO 1845  SEQ ID NO 499 NM_020978  SEQ ID NO 1845

NM_000593 NM_000593
SEQ ID NO 500 NM_020979 SEQ ID NO 1846  SEQ ID NO 500 NM_020979  SEQ ID NO 1846

NM_000594 NM_000594
SEQ ID NO 501 NM_020980 SEQ ID NO 1847  SEQ ID NO 501 NM_020980  SEQ ID NO 1847

NM_000597 NM_000597
SEQ ID NO 502 NM_021000 SEQ ID NO 1849  SEQ ID NO 502 NM_021000  SEQ ID NO 1849

NM_000600 NM_000600
SEQ ID NO 504 NM_021004 SEQ ID NO 1850  SEQ ID NO 504 NM_021004  SEQ ID NO 1850

NM_000607 NM_000607
SEQ ID NO 505 NM_021025 SEQ ID NO 1851  SEQ ID NO 505 NM_021025  SEQ ID NO 1851

NM_000612 NM_000612
SEQ ID NO 506 NM_021063 SEQ ID NO 1852  SEQ ID NO 506 NM_021063  SEQ ID NO 1852

NM_000627 NM_000627
SEQ ID NO 507 NM_021065 SEQ ID NO 1853  SEQ ID NO 507 NM_021065  SEQ ID NO 1853

NM_000633 NM_000633
SEQ ID NO 508 NM_021077 SEQ ID NO 1854  SEQ ID NO 508 NM_021077  SEQ ID NO 1854

NM_000636 NM_000636
SEQ ID NO 509 NM_021095 SEQ ID NO 1855  SEQ ID NO 509 NM_021095  SEQ ID NO 1855

NM_000639 NM_000639
SEQ ID NO 510 NM_021101 SEQ ID NO 1856  SEQ ID NO 510 NM_021101  SEQ ID NO 1856

NM_000647 NM_000647
SEQ ID NO 511 NM_021103 SEQ ID NO 1857  SEQ ID NO 511 NM_021103  SEQ ID NO 1857

NM_000655 NM_000655
SEQ ID NO 512 NM_021128 SEQ ID NO 1858  SEQ ID NO 512 NM_021128  SEQ ID NO 1858

NM_000662 NM_000662
SEQ ID NO 513 NM_021147 SEQ ID NO 1859  SEQ ID NO 513 NM_021147  SEQ ID NO 1859

NM_000663 NM_000663
SEQ ID NO 514 NM_021151 SEQ ID NO 1860  SEQ ID NO 514 NM_021151  SEQ ID NO 1860

NM_000666 NM_000666
SEQ ID NO 515 NM_021181 SEQ ID NO 1861  SEQ ID NO 515 NM_021181  SEQ ID NO 1861

NM_000676 NM_000676
SEQ ID NO 516 NM_021190 SEQ ID NO 1862  SEQ ID NO 516 NM_021190  SEQ ID NO 1862

NM_000685 NM_000685
SEQ ID NO 517 NM_021198 SEQ ID NO 1863  SEQ ID NO 517 NM_021198  SEQ ID NO 1863

NM_000693 NM_000693
SEQ ID NO 518 NM_021200 SEQ ID NO 1864  SEQ ID NO 518 NM_021200  SEQ ID NO 1864

NM_000699 NM_000699
SEQ ID NO 519 NM_021203 SEQ ID NO 1865  SEQ ID NO 519 NM_021203  SEQ ID NO 1865

NM_000700 NM_000700
SEQ ID NO 520 NM_021238 SEQ ID NO 1866  SEQ ID NO 520 NM_021238  SEQ ID NO 1866

NM_000712 NM_000712
SEQ ID NO 521 NM_021242 SEQ ID NO 1867  SEQ ID NO 521 NM_021242  SEQ ID NO 1867

NM_000727 NM_000727
SEQ ID NO 522 S40706 SEQ ID NO 1869  SEQ ID NO 522 S40706  SEQ ID NO 1869

NM_000732 NM_000732
SEQ ID NO 523 S53354 SEQ ID NO 1870  SEQ ID NO 523 S53354  SEQ ID NO 1870

NM_000734 NM_000734
SEQ ID NO 524 S59184 SEQ ID NO 1871  SEQ ID NO 524 S59184  SEQ ID NO 1871

NM_000767 NM_000767
SEQ ID NO 525 S62138 SEQ ID NO 1872  SEQ ID NO 525 S62138  SEQ ID NO 1872

NM_000784 NM_000784
SEQ ID NO 526 U09848 SEQ ID NO 1873  SEQ ID NO 526 U09848  SEQ ID NO 1873

NM_000802 NM_000802
SEQ ID NO 528 U10991 SEQ ID NO 1874  SEQ ID NO 528 U10991  SEQ ID NO 1874

NM_000824 NM_000824
SEQ ID NO 529 U17077 SEQ ID NO 1875  SEQ ID NO 529 U17077  SEQ ID NO 1875

21 twenty-one

NM_000849  NM_000849
SEQ ID NO 530 U18919 SEQ ID NO 1876  SEQ ID NO 530 U18919  SEQ ID NO 1876

NM 000852 NM 000852
SEQ ID NO 531 U41387 SEQ ID NO 1877  SEQ ID NO 531 U41387  SEQ ID NO 1877

NM_000874 NM_000874
SEQ ID NO 532 U45975 SEQ ID NO 1878  SEQ ID NO 532 U45975  SEQ ID NO 1878

NM_000878 NM_000878
SEQ ID NO 533 U49835 SEQ ID NO 1879  SEQ ID NO 533 U49835  SEQ ID NO 1879

NM_000884 NM_000884
SEQ ID NO 534 U56725 SEQ ID NO 1880  SEQ ID NO 534 U56725  SEQ ID NO 1880

NM_000908 NM_000908
SEQ ID NO 537 U58033 SEQ ID NO 1881  SEQ ID NO 537 U58033  SEQ ID NO 1881

NM_000909 NM_000909
SEQ ID NO 538 U61167 SEQ ID NO 1882  SEQ ID NO 538 U61167  SEQ ID NO 1882

NM_000926 NM_000926
SEQ ID NO 539 U66042 SEQ ID NO 1883  SEQ ID NO 539 U66042  SEQ ID NO 1883

NM_000930 NM_000930
SEQ lD NO 540 U68385 SEQ ID NO 1885  SEQ lD NO 540 U68385  SEQ ID NO 1885

NM_000931 NM_000931
SEQ ID NO 541 U68494 SEQ ID NO 1886  SEQ ID NO 541 U68494  SEQ ID NO 1886

NM_000947 NM_000947
SEQ ID NO 542 U74612 SEQ ID NO 1887  SEQ ID NO 542 U74612  SEQ ID NO 1887

NM_000949 NM_000949
SEQ ID NO 543 U75968 SEQ ID NO 1888  SEQ ID NO 543 U75968  SEQ ID NO 1888

NM_000950 NM_000950
SEQ ID NO 544 U79293 SEQ ID NO 1889  SEQ ID NO 544 U79293  SEQ ID NO 1889

NM_000954 NM_000954
SEQ ID NO 545 U80736 SEQ ID NO 1890  SEQ ID NO 545 U80736  SEQ ID NO 1890

NM_000964 NM_000964
SEQ ID NO 546 U82987 SEQ ID NO 1891  SEQ ID NO 546 U82987  SEQ ID NO 1891

3 NM_001003 3 NM_001003
SEQ ID NO 549 U83115 SEQ ID NO 1892  SEQ ID NO 549 U83115  SEQ ID NO 1892

NM_001016 NM_001016
SEQ ID NO 551 U89715 SEQ ID NO 1893  SEQ ID NO 551 U89715  SEQ ID NO 1893

NM_001047 NM_001047
SEQ ID NO 553 U90916 SEQ ID NO 1894  SEQ ID NO 553 U90916  SEQ ID NO 1894

NM_001066 NM_001066
SEQ ID NO 555 U92544 SEQ ID NO 1895  SEQ ID NO 555 U92544  SEQ ID NO 1895

NM_001071 NM_001071
SEQ ID NO 556 U96131 SEQ ID NO 1896  SEQ ID NO 556 U96131  SEQ ID NO 1896

NM_001078 NM_001078
SEQ ID NO 557 U96394 SEQ ID NO 1897  SEQ ID NO 557 U96394  SEQ ID NO 1897

NM_001085 NM_001085
SEQ ID NO 558 W61000_RC SEQ ID NO 1898  SEQ ID NO 558 W61000_RC  SEQ ID NO 1898

NM_001089 NM_001089
SEQ ID NO 559 X00437 SEQ ID NO 1899  SEQ ID NO 559 X00437  SEQ ID NO 1899

NM_001109 NM_001109
SEQ ID NO 560 X00497 SEQ ID NO 1900  SEQ ID NO 560 X00497  SEQ ID NO 1900

NM_001122 NM_001122
SEQ ID NO 561 X01394 SEQ ID NO 1901  SEQ ID NO 561 X01394  SEQ ID NO 1901

NM_001124 NM_001124
SEQ ID NO 562 X03084 SEQ ID NO 1902  SEQ ID NO 562 X03084  SEQ ID NO 1902

NM_001161 NM_001161
SEQ ID NO 563 X07834 SEQ ID NO 1905  SEQ ID NO 563 X07834  SEQ ID NO 1905

NM_001165 NM_001165
SEQ ID NO 564 X14356 SEQ ID NO 1906  SEQ ID NO 564 X14356  SEQ ID NO 1906

NM_001166 NM_001166
SEQ ID NO 565 X16302 SEQ ID NO 1907  SEQ ID NO 565 X16302  SEQ ID NO 1907

NM_001168 NM_001168
SEQ ID NO 566 X52486 SEQ ID NO 1909  SEQ ID NO 566 X52486  SEQ ID NO 1909

NM_001179 NM_001179
SEQ ID NO 567 X52882 SEQ ID NO 1910  SEQ ID NO 567 X52882  SEQ ID NO 1910

NM_001185 NM_001185
SEQ ID NO 569 X56807 SEQ ID NO 1911  SEQ ID NO 569 X56807  SEQ ID NO 1911

NM_001203 NM_001203
SEQ ID NO 570 X57809 SEQ ID NO 1912  SEQ ID NO 570 X57809  SEQ ID NO 1912

NM_001207 NM_001207
SEQ ID NO 573 X57819 SEQ ID NO 1913  SEQ ID NO 573 X57819  SEQ ID NO 1913

NM_001216 NM_001216
SEQ ID NO 574 X58529 SEQ ID NO 1914  SEQ ID NO 574 X58529  SEQ ID NO 1914

NM_001218 NM_001218
SEQ ID NO 575 X59405 SEQ ID NO 1915  SEQ ID NO 575 X59405  SEQ ID NO 1915

NM_001223 NM_001223
SEQ ID NO 576 X72475 SEQ ID NO 1918  SEQ ID NO 576 X72475  SEQ ID NO 1918

NM_001225 NM_001225
SEQ ID NO 577 X73617 SEQ ID NO 1919  SEQ ID NO 577 X73617  SEQ ID NO 1919

NM_001233 NM_001233
SEQ ID NO 578 X74794 SEQ ID NO 1920  SEQ ID NO 578 X74794  SEQ ID NO 1920

NM_001236 NM_001236
SEQ ID NO 579 X75315 SEQ ID NO 1921  SEQ ID NO 579 X75315  SEQ ID NO 1921

NM_001237 NM_001237
SEQ ID NO 580 X79782 SEQ ID NO 1922  SEQ ID NO 580 X79782  SEQ ID NO 1922

NM_001251 NM_001251
SEQ ID NO 581 X82693 SEQ ID NO 1923  SEQ ID NO 581 X82693  SEQ ID NO 1923

NM_001255 NM_001255
SEQ ID NO 582 X83301 SEQ ID NO 1924  SEQ ID NO 582 X83301  SEQ ID NO 1924

NM_001262 NM_001262
SEQ ID NO 583 X93006 SEQ ID NO 1926  SEQ ID NO 583 X93006  SEQ ID NO 1926

NM_001263 NM_001263
SEQ ID NO 584 X94232 SEQ ID NO 1927  SEQ ID NO 584 X94232  SEQ ID NO 1927

NM_001267 NM_001267
SEQ ID NO 585 X98834 SEQ ID NO 1929  SEQ ID NO 585 X98834  SEQ ID NO 1929

NM_001276 NM_001276
SEQ ID NO 587 X99142 SEQ ID NO 1930  SEQ ID NO 587 X99142  SEQ ID NO 1930

22 22

NM_001280  NM_001280
SEQ ID NO 588 Y14737 SEQ ID NO 1932  SEQ ID NO 588 Y14737  SEQ ID NO 1932

NM_001282 NM_001282
SEQ ID NO 589 Z11887 SEQ ID NO 1933  SEQ ID NO 589 Z11887  SEQ ID NO 1933

NM_001295 NM_001295
SEQ ID NO 590 Z48633 SEQ ID NO 1935  SEQ ID NO 590 Z48633  SEQ ID NO 1935

NM_001305 NM_001305
SEQ ID NO 591 NM_004222 SEQ ID NO 1936  SEQ ID NO 591 NM_004222  SEQ ID NO 1936

NM_001310 NM_001310
SEQ ID NO 592 NM_016405 SEQ ID NO 1937  SEQ ID NO 592 NM_016405  SEQ ID NO 1937

NM_001312 NM_001312
SEQ ID NO 593 NM_017690 SEQ ID NO 1938  SEQ ID NO 593 NM_017690  SEQ ID NO 1938

NM_001321 NM_001321
SEQ ID NO 594 Contig29 RC SEQ ID NO 1939  SEQ ID NO 594 Contig29 RC  SEQ ID NO 1939

NM_001327 NM_001327
SEQ ID NO 595 Contig237_RC SEQ ID NO 1940  SEQ ID NO 595  Contig237_RC  SEQ ID NO 1940

NM_001329 NM_001329
SEQ ID NO 596 Contig263_RC SEQ ID NO 1941  SEQ ID NO 596  Contig263_RC  SEQ ID NO 1941

NM_001333 NM_001333
SEQ ID NO 597 Contig292_RC SEQ ID NO 1942  SEQ ID NO 597  Contig292_RC  SEQ ID NO 1942

NM_001338 NM_001338
SEQ ID NO 598 Contig382_RC SEQ ID NO 1944  SEQ ID NO 598  Contig382_RC  SEQ ID NO 1944

NM_001360 NM_001360
SEQ ID NO 599 Contig399_RC SEQ ID NO 1945  SEQ ID NO 599  Contig399_RC  SEQ ID NO 1945

NM_001363 NM_001363
SEQ ID NO 600 Contig448_RC SEQ ID NO 1946  SEQ ID NO 600  Contig448_RC  SEQ ID NO 1946

NM_001381 NM_001381
SEQ ID NO 601 Contig569_RC SEQ ID NO 1947  SEQ ID NO 601  Contig569_RC  SEQ ID NO 1947

NM_001394 NM_001394
SEQ ID NO 602 Contig580_RC SEQ ID NO 1948  SEQ ID NO 602  Contig580_RC  SEQ ID NO 1948

NM_001395 NM_001395
SEQ ID NO 603 Contig678_RC SEQ ID NO 1949  SEQ ID NO 603  Contig678_RC  SEQ ID NO 1949

NM_001419 NM_001419
SEQ ID NO 604 Contig706_RC SEQ ID NO 1950  SEQ ID NO 604  Contig706_RC  SEQ ID NO 1950

NM_001424 NM_001424
SEQ ID NO 605 Contig718_RC SEQ ID NO 1951  SEQ ID NO 605  Contig718_RC  SEQ ID NO 1951

NM_001428 NM_001428
SEQ ID NO 606 Contig719_RC SEQ ID NO 1952  SEQ ID NO 606  Contig719_RC  SEQ ID NO 1952

NM_001436 NM_001436
SEQ ID NO 607 Contig742_RC SEQ ID NO 1953  SEQ ID NO 607  Contig742_RC  SEQ ID NO 1953

NM_001444 NM_001444
SEQ ID NO 608 Contig753_RC SEQ ID NO 1954  SEQ ID NO 608  Contig753_RC  SEQ ID NO 1954

NM_001446 NM_001446
SEQ ID NO 609 Contig758_RC SEQ ID NO 1956  SEQ ID NO 609  Contig758_RC  SEQ ID NO 1956

NM_001453 NM_001453
SEQ ID NO 611 Contig760_RC SEQ ID NO 1957  SEQ ID NO 611  Contig760_RC  SEQ ID NO 1957

NM_001456 NM_001456
SEQ ID NO 612 Contig842_RC SEQ ID NO 1958  SEQ ID NO 612  Contig842_RC  SEQ ID NO 1958

NM_001457 NM_001457
SEQ ID NO 613 Contig848_RC SEQ ID NO 1959  SEQ ID NO 613  Contig848_RC  SEQ ID NO 1959

NM_001463 NM_001463
SEQ ID NO 614 Contig924_RC SEQ ID NO 1960  SEQ ID NO 614  Contig924_RC  SEQ ID NO 1960

NM_001465 NM_001465
SEQ ID NO 615 Contig974_RC SEQ ID NO 1961  SEQ ID NO 615  Contig974_RC  SEQ ID NO 1961

NM_001481 NM_001481
SEQ ID NO 616 Contig1018_RC SEQ ID NO 1962  SEQ ID NO 616  Contig1018_RC  SEQ ID NO 1962

NM_001493 NM_001493
SEQ ID NO 617 Contig1056_RC SEQ ID NO 1963  SEQ ID NO 617  Contig1056_RC  SEQ ID NO 1963

NM_001494 NM_001494
SEQ ID NO 618 Contig1061_RC SEQ ID NO 1964  SEQ ID NO 618  Contig1061_RC  SEQ ID NO 1964

NM_001500 NM_001500
SEQ ID NO 619 Contig1129_RC SEQ ID NO 1965  SEQ ID NO 619  Contig1129_RC  SEQ ID NO 1965

NM_001504 NM_001504
SEQ ID NO 620 Contig1148 SEQ ID NO 1966  SEQ ID NO 620 Contig1148  SEQ ID NO 1966

NM_001511 NM_001511
SEQ ID NO 621 Contig1239_RC SEQ ID NO 1967  SEQ ID NO 621  Contig1239_RC  SEQ ID NO 1967

NM_001513 NM_001513
SEQ ID NO 622 Contig1277 SEQ ID NO 1968  SEQ ID NO 622 Contig1277  SEQ ID NO 1968

NM_001527 NM_001527
SEQ ID NO 623 Contig1333_RC SEQ ID NO 1969  SEQ ID NO 623  Contig1333_RC  SEQ ID NO 1969

NM_001529 NM_001529
SEQ ID NO 624 Contig1386_RC SEQ ID NO 1970  SEQ ID NO 624  Contig1386_RC  SEQ ID NO 1970

NM_001530 NM_001530
SEQ ID NO 625 Contig1389_RC SEQ ID NO 1971  SEQ ID NO 625  Contig1389_RC  SEQ ID NO 1971

NM_001540 NM_001540
SEQ ID NO 626 Contig1418_RC SEQ ID NO 1972  SEQ ID NO 626  Contig1418_RC  SEQ ID NO 1972

NM_001550 NM_001550
SEQ ID NO 627 Contig1462_RC SEQ ID NO 1973  SEQ ID NO 627  Contig1462_RC  SEQ ID NO 1973

NM_001551 NM_001551
SEQ ID NO 628 Contig1505_RC SEQ ID NO 1974  SEQ ID NO 628  Contig1505_RC  SEQ ID NO 1974

NM_001552 NM_001552
SEQ ID NO 629 Contig1540_RC SEQ ID NO 1975  SEQ ID NO 629  Contig1540_RC  SEQ ID NO 1975

NM_001554 NM_001554
SEQ ID NO 631 Contig1584_RC SEQ ID NO 1976  SEQ ID NO 631  Contig1584_RC  SEQ ID NO 1976

NM_001558 NM_001558
SEQ ID NO 632 Contig1632_RC SEQ ID NO 1977  SEQ ID NO 632  Contig1632_RC  SEQ ID NO 1977

NM_001560 NM_001560
SEQ ID NO 633 Contig1682_RC SEQ ID NO 1978  SEQ ID NO 633  Contig1682_RC  SEQ ID NO 1978

NM_001565 NM_001565
SEQ ID NO 634 Contig1778_RC SEQ ID NO 1979  SEQ ID NO 634  Contig1778_RC  SEQ ID NO 1979

NM_001569 NM_001569
SEQ ID, NO 635 Contig1829 SEQ ID NO 1981  SEQ ID, NO 635  Contig1829  SEQ ID NO 1981

NM_001605 NM_001605
SEQ ID NO 636 Contig1838_RC SEQ ID NO 1982  SEQ ID NO 636  Contig1838_RC  SEQ ID NO 1982

23 2. 3

NM_001609  NM_001609
SEQ ID NO 637 Contig1938_RC SEQ ID NO 1983  SEQ ID NO 637  Contig1938_RC  SEQ ID NO 1983

NM_001615 NM_001615
SEQ ID NO 638 Contig1970_RC SEQ ID NO 1984  SEQ ID NO 638  Contig1970_RC  SEQ ID NO 1984

NM_001623 NM_001623
SEQ ID NO 639 Contig1998_RC SEQ ID NO 1985  SEQ ID NO 639  Contig1998_RC  SEQ ID NO 1985

NM_001627 NM_001627
SEQ ID NO 640 Contig2099_RC SEQ ID NO 1986  SEQ ID NO 640  Contig2099_RC  SEQ ID NO 1986

NM_001628 NM_001628
SEQ ID NO 641 Contig2143_RC SEQ ID NO 1987  SEQ ID NO 641  Contig2143_RC  SEQ ID NO 1987

NM_001630 NM_001630
SEQ ID NO 642 Contig2237_RC SEQ ID NO 1988  SEQ ID NO 642  Contig2237_RC  SEQ ID NO 1988

NM_001634 NM_001634
SEQ ID NO 643 Contig2429_RC SEQ ID NO 1990  SEQ ID NO 643  Contig2429_RC  SEQ ID NO 1990

NM_001656 NM_001656
SEQ ID NO 644 Contig2504_RC SEQ ID NO 1991  SEQ ID NO 644  Contig2504_RC  SEQ ID NO 1991

NM_001673 NM_001673
SEQ ID NO 645 Contig2512_RC SEQ ID NO 1992  SEQ ID NO 645  Contig2512_RC  SEQ ID NO 1992

NM_001675 NM_001675
SEQ ID NO 647 Contig2575_RC SEQ ID NO 1993  SEQ ID NO 647  Contig2575_RC  SEQ ID NO 1993

NM_001679 NM_001679
SEQ ID NO 648 Contig2578_RC SEQ ID NO 1994  SEQ ID NO 648  Contig2578_RC  SEQ ID NO 1994

NM_001689 NM_001689
SEQ ID NO 649 Contig2639_RC SEQ ID NO 1995  SEQ ID NO 649  Contig2639_RC  SEQ ID NO 1995

NM_001703 NM_001703
SEQ ID NO 650 Contig2647_RC SEQ ID NO 1996  SEQ ID NO 650  Contig2647_RC  SEQ ID NO 1996

NM_001710 NM_001710
SEQ ID NO 651 Contig2657_RC SEQ ID NO 1997  SEQ ID NO 651  Contig2657_RC  SEQ ID NO 1997

NM_001725 NM_001725
SEQ ID NO 652 Contig2728_RC SEQ ID NO 1998  SEQ ID NO 652  Contig2728_RC  SEQ ID NO 1998

NM_001730 NM_001730
SEQ ID NO 653 Contig2745_RC SEQ ID NO 1999  SEQ ID NO 653  Contig2745_RC  SEQ ID NO 1999

NM_001733 NM_001733
SEQ ID NO 654 Contig2811_RC SEQ ID NO 2000  SEQ ID NO 654  Contig2811_RC  SEQ ID NO 2000

NM_001734 NM_001734
SEQ ID NO 655 Contig2873_RC SEQ ID NO 2001  SEQ ID NO 655  Contig2873_RC  SEQ ID NO 2001

NM_001740 NM_001740
SEQ ID NO 656 Contig2883_RC SEQ ID NO 2002  SEQ ID NO 656  Contig2883_RC  SEQ ID NO 2002

NM_001745 NM_001745
SEQ ID NO 657 Contig2915_RC SEQ ID NO 2003  SEQ ID NO 657  Contig2915_RC  SEQ ID NO 2003

NM_001747 NM_001747
SEQ 1D NO 658 Contig2928_RC SEQ ID NO 2004  SEQ 1D NO 658  Contig2928_RC  SEQ ID NO 2004

NM_001756 NM_001756
SEQ ID NO 659 Contig3024_RC SEQ ID NO 2005  SEQ ID NO 659  Contig3024_RC  SEQ ID NO 2005

NM_001757 NM_001757
SEQ ID NO 660 Contig3094_RC SEQ ID NO 2006  SEQ ID NO 660  Contig3094_RC  SEQ ID NO 2006

NM_001758 NM_001758
SEQ ID NO 661 Contig3164_RC SEQ ID NO 2007  SEQ ID NO 661  Contig3164_RC  SEQ ID NO 2007

NM_001762 NM_001762
SEQ ID NO 662 Contig3495_RC SEQ ID NO 2009  SEQ ID NO 662  Contig3495_RC  SEQ ID NO 2009

NM_001767 NM_001767
SEQ ID NO 663 Contig3607_RC SEQ ID NO 2010  SEQ ID NO 663  Contig3607_RC  SEQ ID NO 2010

NM_001770 NM_001770
SEQ ID NO 664 Contig3659_RC SEQ ID NO 2011  SEQ ID NO 664  Contig3659_RC  SEQ ID NO 2011

NM_001777 NM_001777
SEQ ID NO 665 Contig3677_RC SEQ ID NO 2012  SEQ ID NO 665  Contig3677_RC  SEQ ID NO 2012

NM_001778 NM_001778
SEQ ID NO 666 Contig3682_RC SEQ ID NO 2013  SEQ ID NO 666  Contig3682_RC  SEQ ID NO 2013

NM_001781 NM_001781
SEQ ID NO 667 Contig3734_RC SEQ ID NO 2014  SEQ ID NO 667  Contig3734_RC  SEQ ID NO 2014

NM_001786 NM_001786
SEQ ID NO 668 Contig3834_ RC SEQ ID NO 2015  SEQ ID NO 668  Contig3834_ RC  SEQ ID NO 2015

NM_001793 NM_001793
SEQ ID NO 669 Contig3876_RC SEQ ID NO 2016  SEQ ID NO 669  Contig3876_RC  SEQ ID NO 2016

NM_001803 NM_001803
SEQ ID NO 671 Contig3902_RC SEQ ID NO 2017  SEQ ID NO 671  Contig3902_RC  SEQ ID NO 2017

NM_001806 NM_001806
SEQ ID NO 672 Contig3940_RC SEQ ID NO 2018  SEQ ID NO 672  Contig3940_RC  SEQ ID NO 2018

NM_001809 NM_001809
SEQ ID NO 673 Contig4380_RC SEQ ID NO 2019  SEQ ID NO 673  Contig4380_RC  SEQ ID NO 2019

NM_001814 NM_001814
SEQ ID NO 674 Contig4388_RC SEQ ID NO 2020  SEQ ID NO 674  Contig4388_RC  SEQ ID NO 2020

NM_001826 NM_001826
SEQ ID NO 675 Contig4467_RC SEQ ID NO 2021  SEQ ID NO 675  Contig4467_RC  SEQ ID NO 2021

NM_001830 NM_001830
SEQ ID NO 677 Contig4949_RC SEQ ID NO 2023  SEQ ID NO 677  Contig4949_RC  SEQ ID NO 2023

NM_001838 NM_001838
SEQ ID NO 678 Contig5348_RC SEQ ID NO 2024  SEQ ID NO 678  Contig5348_RC  SEQ ID NO 2024

NM_001839 NM_001839
SEQ ID NO 679 Contig5403_RC SEQ ID NO 2025  SEQ ID NO 679  Contig5403_RC  SEQ ID NO 2025

NM_001853 NM_001853
SEQ ID NO 681 Contig5716_RC SEQ ID NO 2026  SEQ ID NO 681  Contig5716_RC  SEQ ID NO 2026

NM_001859 NM_001859
SEQ ID NO 682 Contig6118_RC SEQ ID NO 2027  SEQ ID NO 682  Contig6118_RC  SEQ ID NO 2027

NM_001861 NM_001861
SEQ ID NO 683 Contig6164_RC SEQ ID NO 2028  SEQ ID NO 683  Contig6164_RC  SEQ ID NO 2028

NM_001874 NM_001874
SEQ ID NO 685 Contig6181_RC SEQ ID NO 2029  SEQ ID NO 685  Contig6181_RC  SEQ ID NO 2029

NM_001885 NM_001885
SEQ ID NO 686 Contig6514_RC SEQ ID NO 2030  SEQ ID NO 686  Contig6514_RC  SEQ ID NO 2030

NM_001892 NM_001892
SEQ ID NO 688 Contig6612_RC SEQ ID NO 2031  SEQ ID NO 688  Contig6612_RC  SEQ ID NO 2031

NM_001897 NM_001897
SEQ ID NO 689 Contig6881_RC SEQ ID NO 2032  SEQ ID NO 689  Contig6881_RC  SEQ ID NO 2032

24 24

NM_001899  NM_001899
SEQ ID NO 690 Contig8165_RC SEQ ID NO 2033  SEQ ID NO 690  Contig8165_RC  SEQ ID NO 2033

NM_001905 NM_001905
SEQ ID NO 691 Contig8221_RC SEQ ID NO 2034  SEQ ID NO 691  Contig8221_RC  SEQ ID NO 2034

NM_001912 NM_001912
SEQ ID NO 692 Contig8347_RC SEQ ID NO 2035  SEQ ID NO 692  Contig8347_RC  SEQ ID NO 2035

NM_001914 NM_001914
SEQ ID NO 693 Contig8364_RC SEQ ID NO 2036  SEQ ID NO 693  Contig8364_RC  SEQ ID NO 2036

NM_001919 NM_001919
SEQ ID NO 694 Contig8888_RC SEQ ID NO 2038  SEQ ID NO 694  Contig8888_RC  SEQ ID NO 2038

NM_001941 NM_001941
SEQ ID NO 695 Contig9259_RC SEQ ID NO 2039  SEQ ID NO 695  Contig9259_RC  SEQ ID NO 2039

NM_001943 NM_001943
SEQ ID NO 696 Contig9541_RC SEQ ID NO 2040  SEQ ID NO 696  Contig9541_RC  SEQ ID NO 2040

NM_001944 NM_001944
SEQ ID NO 697 Contig10268_RC SEQ ID NO 2041  SEQ ID NO 697  Contig10268_RC  SEQ ID NO 2041

NM_001953 NM_001953
SEQ ID NO 699 Contig10363_RC SEQ ID NO 2042  SEQ ID NO 699  Contig10363_RC  SEQ ID NO 2042

NM_001954 NM_001954
SEQ ID NO 700 Contig10437_RC SEQ ID NO 2043  SEQ ID NO 700  Contig10437_RC  SEQ ID NO 2043

NMB_001955 NMB_001955
SEQ ID NO 701 Contig11086_RC SEQ ID NO 2045  SEQ ID NO 701  Contig11086_RC  SEQ ID NO 2045

NMB_001956 NMB_001956
SEQ ID NO 702 Contig11275_RC SEQ ID NO 2046  SEQ ID NO 702  Contig11275_RC  SEQ ID NO 2046

NM_001958 NM_001958
SEQ ID NO 703 Contig11648_RC SEQ ID NO 2047  SEQ ID NO 703  Contig11648_RC  SEQ ID NO 2047

NMB_001961 NMB_001961
SEQ ID NO 705 Contig12216_RC SEQ ID NO 2048  SEQ ID NO 705  Contig12216_RC  SEQ ID NO 2048

NMB_001970 NMB_001970
SEQ ID NO 706 Contig12369_RC SEQ ID NO 2049  SEQ ID NO 706  Contig12369_RC  SEQ ID NO 2049

NMB_001979 NMB_001979
SEQ ID NO 707 Contig12814_RC SEQ ID NO 2050  SEQ ID NO 707  Contig12814_RC  SEQ ID NO 2050

NM_001982 NM_001982
SEQ ID NO 708 Contig12951_RC SEQ ID NO 2051  SEQ ID NO 708  Contig12951_RC  SEQ ID NO 2051

NMB_002017 NMB_002017
SEQ ID NO 710 Contig13480_RC SEQ ID NO 2052  SEQ ID NO 710  Contig13480_RC  SEQ ID NO 2052

NM_002033 NM_002033
SEQ ID NO 713 Contig14284_RC SEQ ID NO 2053  SEQ ID NO 713  Contig14284_RC  SEQ ID NO 2053

NM_002046 NM_002046
SEQ ID NO 714 Contig14390_RC SEQ ID NO 2054  SEQ ID NO 714  Contig14390_RC  SEQ ID NO 2054

NM_002047 NM_002047
SEQ ID NO 715 Contig14780_RC SEQ ID NO 2055  SEQ ID NO 715  Contig14780_RC  SEQ ID NO 2055

NM_002051 NM_002051
SEQ ID NO 716 Contig14954_RC SEQ ID NO 2056  SEQ ID NO 716  Contig14954_RC  SEQ ID NO 2056

NM_002053 NM_002053
SEQ ID NO 717 Contig14981_RC SEQ ID NO 2057  SEQ ID NO 717  Contig14981_RC  SEQ ID NO 2057

NM_002061 NM_002061
SEQ ID NO 718 Contig15692_RC SEQ ID NO 2058  SEQ ID NO 718  Contig15692_RC  SEQ ID NO 2058

NM_002065 NM_002065
SEQ ID NO 719 Contig16192_RC SEQ ID NO 2059  SEQ ID NO 719  Contig16192_RC  SEQ ID NO 2059

NM_002068 NM_002068
SEQ ID NO 720 Contig16759_RC SEQ ID NO 2061  SEQ ID NO 720  Contig16759_RC  SEQ ID NO 2061

NM_002077 NM_002077
SEQ ID NO 722 Contig16786_RC SEQ ID NO 2062  SEQ ID NO 722  Contig16786_RC  SEQ ID NO 2062

NM_002091 NM_002091
SEQ ID NO 723 Contig16905_RC SEQ ID NO 2063  SEQ ID NO 723  Contig16905_RC  SEQ ID NO 2063

NMB_002101 NMB_002101
SEQ ID NO 724 Contig17103_RC SEQ ID NO 2064  SEQ ID NO 724  Contig17103_RC  SEQ ID NO 2064

NM_002106 NM_002106
SEQ ID NO 725 Contig17105_RC SEQ ID NO 2065  SEQ ID NO 725  Contig17105_RC  SEQ ID NO 2065

NMB_002110 NMB_002110
SEQ ID NO 726 Contig17248_RC SEQ ID NO 2066  SEQ ID NO 726  Contig17248_RC  SEQ ID NO 2066

NM_002111 NM_002111
SEQ ID NO 727 Contig17345_RC SEQ ID NO 2067  SEQ ID NO 727  Contig17345_RC  SEQ ID NO 2067

NMB_002115 NMB_002115
SEQ ID NO 728 Contig18502_RC SEQ ID NO 2069  SEQ ID NO 728  Contig18502_RC  SEQ ID NO 2069

NMB_002118 NMB_002118
SEQ ID NO 729 Contig20156_RC SEQ ID NO 2071  SEQ ID NO 729  Contig20156_RC  SEQ ID NO 2071

NMB_002123 NMB_002123
SEQ ID NO 730 Contig20302_RC SEQ ID NO 2073  SEQ ID NO 730  Contig20302_RC  SEQ ID NO 2073

NMB_002131 NMB_002131
SEQ ID NO 731 Contig20600_RC SEQ ID NO 2074  SEQ ID NO 731  Contig20600_RC  SEQ ID NO 2074

NMB_002136 NMB_002136
SEQ ID NO 732 Contig20617_RC SEQ ID NO 2075  SEQ ID NO 732  Contig20617_RC  SEQ ID NO 2075

NM_002145 NM_002145
SEQ ID NO 733 Contig20629_RC SEQ ID NO 2076  SEQ ID NO 733  Contig20629_RC  SEQ ID NO 2076

NMB_002164 NMB_002164
SEQ ID NO 734 Contig20651_RC SEQ ID NO 2077  SEQ ID NO 734  Contig20651_RC  SEQ ID NO 2077

NMB_002168 NMB_002168
SEQ ID NO 735 Contig21130_RC SEQ ID NO 2078  SEQ ID NO 735  Contig21130_RC  SEQ ID NO 2078

NM_002184 NM_002184
SEQ ID NO 736 Contig21185_RC SEQ ID NO 2079  SEQ ID NO 736  Contig21185_RC  SEQ ID NO 2079

NM_002185 NM_002185
SEQ ID NO 737 Contig21421_RC SEQ ID NO 2080  SEQ ID NO 737  Contig21421_RC  SEQ ID NO 2080

NM_002189 NM_002189
SEQ ID NO 738 Contig21787_RC SEQ ID NO 2081  SEQ ID NO 738  Contig21787_RC  SEQ ID NO 2081

NM_002200 NM_002200
SEQ ID NO 739 Contig21812_RC SEQ ID NO 2082  SEQ ID NO 739  Contig21812_RC  SEQ ID NO 2082

NM_002201 NM_002201
SEQ ID NO 740 Contig22418_RC SEQ ID NO 2083  SEQ ID NO 740  Contig22418_RC  SEQ ID NO 2083

NM_002213 NM_002213
SEQ ID NO 741 Contig23085_RC SEQ ID NO 2084  SEQ ID NO 741  Contig23085_RC  SEQ ID NO 2084

NMB_002219 NMB_002219
SEQ ID NO 742 Contig23454_RC SEQ ID NO 2085  SEQ ID NO 742  Contig23454_RC  SEQ ID NO 2085

25 25

NM_002222  NM_002222
SEQ ID NO 743 Contig24138_RC SEQ ID NO 2086  SEQ ID NO 743  Contig24138_RC  SEQ ID NO 2086

NM_002239 NM_002239
SEQ ID NO 744 Contig24252_RC SEQ ID NO 2087  SEQ ID NO 744  Contig24252_RC  SEQ ID NO 2087

NM_002243 NM_002243
SEQ ID NO 745 Contig24655_RC SEQ ID NO 2089  SEQ ID NO 745  Contig24655_RC  SEQ ID NO 2089

NM_002245 NM_002245
SEQ ID NO 746 Contig25055_RC SEQ ID NO 2090  SEQ ID NO 746  Contig25055_RC  SEQ ID NO 2090

NM_002250 NM_002250
SEQ ID NO 747 Contig25290_RC SEQ ID NO 2091  SEQ ID NO 747  Contig25290_RC  SEQ ID NO 2091

NM_002254 NM_002254
SEQ ID NO 748 Contig25343_RC SEQ ID NO 2092  SEQ ID NO 748  Contig25343_RC  SEQ ID NO 2092

NM_002266 NM_002266
SEQ ID NO 749 Contig25362_RC SEQ ID NO 2093  SEQ ID NO 749  Contig25362_RC  SEQ ID NO 2093

NM_002273 NM_002273
SEQ ID NO 750 Contig25617_RC SEQ ID NO 2094  SEQ ID NO 750  Contig25617_RC  SEQ ID NO 2094

NM_002281 NM_002281
SEQ ID NO 751 Contig25659_RC SEQ ID NO 2095  SEQ ID NO 751  Contig25659_RC  SEQ ID NO 2095

NM_002292 NM_002292
SEQ ID NO 752 Contig25722_RC SEQ ID NO 2096  SEQ ID NO 752  Contig25722_RC  SEQ ID NO 2096

NM_002298 NM_002298
SEQ ID NO 753 Contig25809_RC SEQ ID NO 2097  SEQ ID NO 753  Contig25809_RC  SEQ ID NO 2097

NM_002300 NM_002300
SEQ ID NO 754 Contig25991 SEQ ID NO 2098  SEQ ID NO 754 Contig25991  SEQ ID NO 2098

NM_002308 NM_002308
SEQ ID NO 755 Contig26022_RC SEQ ID NO 2099  SEQ ID NO 755  Contig26022_RC  SEQ ID NO 2099

NMB_002314 NMB_002314
SEQ ID NO 756 Contig26077_RC SEQ ID NO 2100  SEQ ID NO 756  Contig26077_RC  SEQ ID NO 2100

NM_002337 NM_002337
SEQ ID NO 757 Contig26310_RC SEQ ID NO 2101  SEQ ID NO 757  Contig26310_RC  SEQ ID NO 2101

NM_002341 NM_002341
SEQ ID NO 758 Contig26371_RC SEQ ID NO 2102  SEQ ID NO 758  Contig26371_RC  SEQ ID NO 2102

NM_002342 NM_002342
SEQ ID NO 759 Contig26438_RC SEQ ID NO 2103  SEQ ID NO 759  Contig26438_RC  SEQ ID NO 2103

NM_002346 NM_002346
SEQ ID NO 760 Contig26706_RC SEQ ID NO 2104  SEQ ID NO 760  Contig26706_RC  SEQ ID NO 2104

NM_002349 NM_002349
SEQ ID NO 761 Contig27088_RC SEQ ID NO 2105  SEQ ID NO 761  Contig27088_RC  SEQ ID NO 2105

NM_002350 NM_002350
SEQ ID NO 762 Contig27186_RC SEQ ID NO 2106  SEQ ID NO 762  Contig27186_RC  SEQ ID NO 2106

NM_002356 NM_002356
SEQ ID NO 763 Contig27228_RC SEQ ID NO 2107  SEQ ID NO 763  Contig27228_RC  SEQ ID NO 2107

NM_002358 NM_002358
SEQ ID NO 764 Contig27344_RC SEQ ID NO 2109  SEQ ID NO 764  Contig27344_RC  SEQ ID NO 2109

NM_002370 NM_002370
SEQ ID NO 765 Contig27386_RC SEQ ID NO 2110  SEQ ID NO 765  Contig27386_RC  SEQ ID NO 2110

NM_002395 NM_002395
SEQ ID NO 766 Contig27624_RC SEQ ID NO 2111  SEQ ID NO 766  Contig27624_RC  SEQ ID NO 2111

NMB_002416 NMB_002416
SEQ ID NO 767 Contig27749_RC SEQ ID NO 2112  SEQ ID NO 767  Contig27749_RC  SEQ ID NO 2112

NM_002421 NM_002421
SEQ ID NO 768 Contig27882_RC SEQ ID NO 2113  SEQ ID NO 768  Contig27882_RC  SEQ ID NO 2113

NM_002426 NM_002426
SEQ ID NO 769 Contig27915_RC SEQ ID NO 2114  SEQ ID NO 769  Contig27915_RC  SEQ ID NO 2114

NM_002435 NM_002435
SEQ ID NO 770 Contig28030_RC SEQ ID NO 2115  SEQ ID NO 770  Contig28030_RC  SEQ ID NO 2115

NM_002438 NM_002438
SEQ ID NO 771 Contig28081_RC SEQ ID NO 2116  SEQ ID NO 771  Contig28081_RC  SEQ ID NO 2116

NM_002444 NM_002444
SEQ ID NO 772 Contig28152_RC SEQ ID NO 2117  SEQ ID NO 772  Contig28152_RC  SEQ ID NO 2117

NM_002449 NM_002449
SEQ ID NO 773 Contig28550_RC SEQ ID NO 2119  SEQ ID NO 773  Contig28550_RC  SEQ ID NO 2119

NM_002450 NM_002450
SEQ ID NO 774 Contig28552_RC SEQ ID NO 2120  SEQ ID NO 774  Contig28552_RC  SEQ ID NO 2120

NM_002456 NM_002456
SEQ ID NO 775 Contig28712_RC SEQ ID NO 2121  SEQ ID NO 775  Contig28712_RC  SEQ ID NO 2121

NM_002466 NM_002466
SEQ ID NO 776 Contig28888_RC SEQ ID NO 2122  SEQ ID NO 776  Contig28888_RC  SEQ ID NO 2122

NM_002482 NM_002482
SEQ ID NO 777 Contig28947_RC SEQ ID NO 2123  SEQ ID NO 777  Contig28947_RC  SEQ ID NO 2123

NM_002497 NM_002497
SEQ ID NO 778 Contig29126_RC SEQ ID NO 2124  SEQ ID NO 778  Contig29126_RC  SEQ ID NO 2124

NM_002510 NM_002510
SEQ ID NO 779 Contig29193_RC SEQ ID NO 2125  SEQ ID NO 779  Contig29193_RC  SEQ ID NO 2125

NMB_002515 NMB_002515
SEQ ID NO 781 Contig29369_RC SEQ ID NO 2126  SEQ ID NO 781  Contig29369_RC  SEQ ID NO 2126

NM_002524 NM_002524
SEQ ID NO 782 Contig29639_RC SEQ ID NO 2127  SEQ ID NO 782  Contig29639_RC  SEQ ID NO 2127

NM_002539 NM_002539
SEQ ID NO 783 Contig30047_RC SEQ ID NO 2129  SEQ ID NO 783  Contig30047_RC  SEQ ID NO 2129

NM_002555 NM_002555
SEQ ID NO 785 Contig30154_RC SEQ ID NO 2131  SEQ ID NO 785  Contig30154_RC  SEQ ID NO 2131

NM_002570 NM_002570
SEQ ID NO 787 Contig30209_RC SEQ ID NO 2132  SEQ ID NO 787  Contig30209_RC  SEQ ID NO 2132

NM_002579 NM_002579
SEQ ID NO 788 Contig30213_RC SEQ ID NO 2133  SEQ ID NO 788  Contig30213_RC  SEQ ID NO 2133

NM_002587 NM_002587
SEQ ID NO 789 Contig30230_RC SEQ ID NO 2134  SEQ ID NO 789  Contig30230_RC  SEQ ID NO 2134

NM_002590 NM_002590
SEQ ID NO 790 Contig30267_RC SEQ ID NO 2135  SEQ ID NO 790  Contig30267_RC  SEQ ID NO 2135

NM_002600 NM_002600
SEQ ID NO 791 Contig30390_RC SEQ ID NO 2136  SEQ ID NO 791  Contig30390_RC  SEQ ID NO 2136

NMB_002614 NMB_002614
SEQ ID NO 792 Contig30480_RC SEQ ID NO 2137  SEQ ID NO 792  Contig30480_RC  SEQ ID NO 2137

26 26

NMB_002618  NMB_002618
SEQ ID NO 794 Contig30609_RC SEQ ID NO 2138  SEQ ID NO 794  Contig30609_RC  SEQ ID NO 2138

NM_002626 NM_002626
SEQ ID NO 795 Contig30934_RC SEQ ID NO 2139  SEQ ID NO 795  Contig30934_RC  SEQ ID NO 2139

NM_002633 NM_002633
SEQ ID NO 796 Contig31150_RC SEQ ID NO 2140  SEQ ID NO 796  Contig31150_RC  SEQ ID NO 2140

NM_002639 NM_002639
SEQ ID NO 797 Contig31186_RC SEQ ID NO 2141  SEQ ID NO 797  Contig31186_RC  SEQ ID NO 2141

NM_002648 NM_002648
SEQ ID NO 798 Contig31251_RC SEQ ID NO 2142  SEQ ID NO 798  Contig31251_RC  SEQ ID NO 2142

NM_002659 NM_002659
SEQ ID NO 799 Contig31288_RC SEQ ID NO 2143  SEQ ID NO 799  Contig31288_RC  SEQ ID NO 2143

NM_002661 NM_002661
SEQ ID NO 800 Contig31291_RC SEQ ID NO 2144  SEQ ID NO 800  Contig31291_RC  SEQ ID NO 2144

NM_002662 NM_002662
SEQ ID NO 801 Contig31295_RC SEQ ID NO 2145  SEQ ID NO 801  Contig31295_RC  SEQ ID NO 2145

NM_002664 NM_002664
SEQ ID NO 802 Contig31424_RC SEQ ID NO 2146  SEQ ID NO 802  Contig31424_RC  SEQ ID NO 2146

NM_002689 NM_002689
SEQ ID NO 804 Contig31449_RC SEQ ID NO 2147  SEQ ID NO 804  Contig31449_RC  SEQ ID NO 2147

NM_002690 NM_002690
SEQ ID NO 805 Contig31596_RC SEQ ID NO 2148  SEQ ID NO 805  Contig31596_RC  SEQ ID NO 2148

NM_002709 NM_002709
SEQ ID NO 806 Contig31864_RC SEQ ID NO 2149  SEQ ID NO 806  Contig31864_RC  SEQ ID NO 2149

NM_002727 NM_002727
SEQ ID NO 807 Contig31928_RC SEQ ID NO 2150  SEQ ID NO 807  Contig31928_RC  SEQ ID NO 2150

NM_002729 NM_002729
SEQ ID NO 808 Contig31966_RC SEQ ID NO 2151  SEQ ID NO 808  Contig31966_RC  SEQ ID NO 2151

NM_002734 NM_002734
SEQ ID NO 809 Contig31986_RC SEQ ID NO 2152  SEQ ID NO 809  Contig31986_RC  SEQ ID NO 2152

NM_002736 NM_002736
SEQ ID NO 810 Contig32084_RC SEQ ID NO 2153  SEQ ID NO 810  Contig32084_RC  SEQ ID NO 2153

NM_002740 NM_002740
SEQ ID NO 811 Contig32105_RC SEQ ID NO 2154  SEQ ID NO 811  Contig32105_RC  SEQ ID NO 2154

NM_002748 NM_002748
SEQ ID NO 813 Contig32185_RC SEQ ID NO 2156  SEQ ID NO 813  Contig32185_RC  SEQ ID NO 2156

NM_002774 NM_002774
SEQ ID NO 814 Contig32242_RC SEQ ID NO 2157  SEQ ID NO 814  Contig32242_RC  SEQ ID NO 2157

NM_002775 NM_002775
SEQ ID NO 815 Contig32322_RC SEQ ID NO 2158  SEQ ID NO 815  Contig32322_RC  SEQ ID NO 2158

NM_002776 NM_002776
SEQ ID NO 816 Contig32336_RC SEQ ID NO 2159  SEQ ID NO 816  Contig32336_RC  SEQ ID NO 2159

NM_002789 NM_002789
SEQ ID NO 817 Contig32558_RC SEQ ID NO 2160  SEQ ID NO 817  Contig32558_RC  SEQ ID NO 2160

NM_002794 NM_002794
SEQ ID NO 818 Contig32798_RC SEQ ID NO 2161  SEQ ID NO 818  Contig32798_RC  SEQ ID NO 2161

NM_002796 NM_002796
SEQ ID NO 819 Contig33005_RC SEQ ID NO 2162  SEQ ID NO 819  Contig33005_RC  SEQ ID NO 2162

NM_002800 NM_002800
SEQ ID NO 820 Contig33230_RC SEQ ID NO 2163  SEQ ID NO 820  Contig33230_RC  SEQ ID NO 2163

NM_002801 NM_002801
SEQ ID NO 821 Contig33260_RC SEQ ID NO 2164  SEQ ID NO 821  Contig33260_RC  SEQ ID NO 2164

NM_002808 NM_002808
SEQ ID NO 822 Contig33654_RC SEQ ID NO 2166  SEQ ID NO 822  Contig33654_RC  SEQ ID NO 2166

NM_002821 NM_002821
SEQ ID NO 824 Contig33741_RC SEQ ID NO 2167  SEQ ID NO 824  Contig33741_RC  SEQ ID NO 2167

NM_002826 NM_002826
SEQ ID NO 825 Contig33771_RC SEQ ID NO 2168  SEQ ID NO 825  Contig33771_RC  SEQ ID NO 2168

NM_002827 NM_002827
SEQ ID NO 826 Contig33814_RC SEQ ID NO 2169  SEQ ID NO 826  Contig33814_RC  SEQ ID NO 2169

NM_002838 NM_002838
SEQ ID NO 827 Contig33815_RC SEQ ID NO 2170  SEQ ID NO 827  Contig33815_RC  SEQ ID NO 2170

NM_002852 NM_002852
SEQ ID NO 828 Contig33833 SEQ ID NO 2171  SEQ ID NO 828 Contig33833  SEQ ID NO 2171

NM_002854 NM_002854
SEQ ID NO 829 Contig33998_RC SEQ ID NO 2172  SEQ ID NO 829  Contig33998_RC  SEQ ID NO 2172

NM_002856 NM_002856
SEQ ID NO 830 Contig34079 SEQ ID NO 2173  SEQ ID NO 830 Contig34079  SEQ ID NO 2173

NM_002857 NM_002857
SEQ ID NO 831 Contig34080_RC SEQ ID NO 2174  SEQ ID NO 831  Contig34080_RC  SEQ ID NO 2174

NM_002858 NM_002858
SEQ ID NO 832 Contig34222_RC SEQ ID NO 2175  SEQ ID NO 832  Contig34222_RC  SEQ ID NO 2175

NM_002888 NM_002888
SEQ ID NO 833 Contig34233_RC SEQ ID NO 2176  SEQ ID NO 833  Contig34233_RC  SEQ ID NO 2176

NM_002890 NM_002890
SEQ ID NO 834 Contig34303_RC SEQ ID NO 2177  SEQ ID NO 834  Contig34303_RC  SEQ ID NO 2177

NM_002901 NM_002901
SEQ ID NO 836 Contig34393_RC SEQ ID NO 2178  SEQ ID NO 836  Contig34393_RC  SEQ ID NO 2178

NM_002906 NM_002906
SEQ ID NO 837 Contig34477_RC SEQ ID NO 2179  SEQ ID NO 837  Contig34477_RC  SEQ ID NO 2179

NMB_002916 NMB_002916
SEQ ID NO 838 Contig34766_RC SEQ ID NO 2181  SEQ ID NO 838  Contig34766_RC  SEQ ID NO 2181

NM_002923 NM_002923
SEQ ID NO 839 Contig34952 SEQ ID NO 2182  SEQ ID NO 839 Contig34952  SEQ ID NO 2182

NM_002933 NM_002933
SEQ ID NO 840 Contig34989_RC SEQ ID NO 2183  SEQ ID NO 840  Contig34989_RC  SEQ ID NO 2183

NM_002936 NM_002936
SEQ ID NO 841 Contig35030_RC SEQ ID NO 2184  SEQ ID NO 841  Contig35030_RC  SEQ ID NO 2184

NM_002937 NM_002937
SEQ ID NO 842 Contig35251_RC SEQ ID NO 2185  SEQ ID NO 842  Contig35251_RC  SEQ ID NO 2185

NM_002950 NM_002950
SEQ ID NO 843 Contig35629_RC SEQ ID NO 2186 .  SEQ ID NO 843  Contig35629_RC  SEQ ID NO 2186.

NM_002961 NM_002961
SEQ ID NO 844 Contig35635_RC SEQ ID NO 2187  SEQ ID NO 844  Contig35635_RC  SEQ ID NO 2187

27 27

NM_002964  NM_002964
SEQ ID NO 845 Contig35763_RC SEQ ID NO 2188  SEQ ID NO 845  Contig35763_RC  SEQ ID NO 2188

NM_002965 NM_002965
SEQ ID NO 846 Contig35814_RC SEQ ID NO 2189  SEQ ID NO 846  Contig35814_RC  SEQ ID NO 2189

NM_002966 NM_002966
SEQ ID NO 847 Contig35896_RC SEQ ID NO 2190  SEQ ID NO 847  Contig35896_RC  SEQ ID NO 2190

NM_002982 NM_002982
SEQ ID NO 849 Contig35976_RC SEQ ID NO 2191  SEQ ID NO 849  Contig35976_RC  SEQ ID NO 2191

NM_002983 NM_002983
SEQ ID NO 850 Contig36042_RC SEQ ID NO 2192  SEQ ID NO 850  Contig36042_RC  SEQ ID NO 2192

NM_002984 NM_002984
SEQ ID NO 851 Contig36081_RC SEQ ID NO 2193  SEQ ID NO 851  Contig36081_RC  SEQ ID NO 2193

NM_002985 NM_002985
SEQ ID NO 852 Contig36152_RC SEQ ID NO 2194  SEQ ID NO 852  Contig36152_RC  SEQ ID NO 2194

NM_002988 NM_002988
SEQ ID NO 853 Contig36193_RC SEQ ID NO 2195  SEQ ID NO 853  Contig36193_RC  SEQ ID NO 2195

NM_002996 NM_002996
SEQ ID NO 854 Contig36312_RC SEQ ID NO 2196  SEQ ID NO 854  Contig36312_RC  SEQ ID NO 2196

NM_002997 NM_002997
SEQ ID NO 855 Contig36323_RC SEQ ID NO 2197  SEQ ID NO 855  Contig36323_RC  SEQ ID NO 2197

NM_002999 NM_002999
SEQ ID NO 856 Contig36339_RC SEQ ID NO 2198  SEQ ID NO 856  Contig36339_RC  SEQ ID NO 2198

NMB_003012 NMB_003012
SEQ ID NO 857 Contig36647_RC SEQ ID NO 2199  SEQ ID NO 857  Contig36647_RC  SEQ ID NO 2199

NM_003022 NM_003022
SEQ ID NO 858 Contig36744_RC SEQ ID NO 2200  SEQ ID NO 858  Contig36744_RC  SEQ ID NO 2200

NM_003034 NM_003034
SEQ ID NO 859 Contig36761_RC SEQ ID NO 2201  SEQ ID NO 859  Contig36761_RC  SEQ ID NO 2201

NM_003035 NM_003035
SEQ ID NO 860 Contig36879_RC SEQ ID NO 2202  SEQ ID NO 860  Contig36879_RC  SEQ ID NO 2202

NM_003039 NM_003039
SEQ ID NO 861 Contig36900_RC SEQ ID NO 2203  SEQ ID NO 861  Contig36900_RC  SEQ ID NO 2203

NM_003051 NM_003051
SEQ ID NO 862 Contig37015_RC SEQ ID NO 2204  SEQ ID NO 862  Contig37015_RC  SEQ ID NO 2204

NM_003064 NM_003064
SEQ ID NO 863 Contig37024_RC SEQ ID NO 2205  SEQ ID NO 863  Contig37024_RC  SEQ ID NO 2205

NM_003066 NM_003066
SEQ ID NO 864 Contig37072_RC SEQ ID NO 2207  SEQ ID NO 864  Contig37072_RC  SEQ ID NO 2207

NM_003088 NM_003088
SEQ ID NO 865 Contig37140_RC SEQ ID NO 2208  SEQ ID NO 865  Contig37140_RC  SEQ ID NO 2208

NM_003090 NM_003090
SEQ ID NO 866 Contig37141_RC SEQ ID NO 2209  SEQ ID NO 866  Contig37141_RC  SEQ ID NO 2209

NM_003096 NM_003096
SEQ ID NO 867 Contig37204_RC SEQ ID NO 2210  SEQ ID NO 867  Contig37204_RC  SEQ ID NO 2210

NM_003099 NM_003099
SEQ ID NO 868 Contig37281_RC SEQ ID NO 2211  SEQ ID NO 868  Contig37281_RC  SEQ ID NO 2211

NMB_003102 NMB_003102
SEQ ID NO 869 Contig37287_RC SEQ ID NO 2212  SEQ ID NO 869  Contig37287_RC  SEQ ID NO 2212

NMB_003104 NMB_003104
SEQ ID NO 870 Contig37439_RC SEQ ID NO 2213  SEQ ID NO 870  Contig37439_RC  SEQ ID NO 2213

NMB_003108 NMB_003108
SEQ ID NO 871 Contig37562_RC SEQ ID NO 2214  SEQ ID NO 871  Contig37562_RC  SEQ ID NO 2214

NMB_003121 NMB_003121
SEQ ID NO 873 Contig37571_RC SEQ ID NO 2215  SEQ ID NO 873  Contig37571_RC  SEQ ID NO 2215

NMB_003134 NMB_003134
SEQ ID NO 874 Contig37598 SEQ ID NO 2216  SEQ ID NO 874 Contig37598  SEQ ID NO 2216

NM_003137 NM_003137
SEQ ID NO 875 Contig37758_RC SEQ ID NO 2217  SEQ ID NO 875  Contig37758_RC  SEQ ID NO 2217

NM_003144 NM_003144
SEQ ID NO 876 Contig37778_RC SEQ ID NO 2218  SEQ ID NO 876  Contig37778_RC  SEQ ID NO 2218

NM_003146 NM_003146
SEQ ID NO 877 Contig37884_RC SEQ ID NO 2219  SEQ ID NO 877  Contig37884_RC  SEQ ID NO 2219

NM_003149 NM_003149
SEQ ID NO 878 Contig37946_RC SEQ ID NO 2220  SEQ ID NO 878  Contig37946_RC  SEQ ID NO 2220

NM_003151 NM_003151
SEQ ID NO 879 Contig38170_RC SEQ ID NO 2221  SEQ ID NO 879  Contig38170_RC  SEQ ID NO 2221

NM_003157 NM_003157
SEQ ID NO 880 Contig38288_RC SEQ ID NO 2223  SEQ ID NO 880  Contig38288_RC  SEQ ID NO 2223

NM_003158 NM_003158
SEQ ID NO 881 Contig38398_RC SEQ ID NO 2224  SEQ ID NO 881  Contig38398_RC  SEQ ID NO 2224

NM_003165 NM_003165
SEQ ID NO 882 Contig38580_RC SEQ ID NO 2226  SEQ ID NO 882  Contig38580_RC  SEQ ID NO 2226

NM_003172 NM_003172
SEQ ID NO 883 Contig38630_RC SEQ ID NO 2227  SEQ ID NO 883  Contig38630_RC  SEQ ID NO 2227

NMB_003177 NMB_003177
SEQ ID NO 884 Contig38652_RC SEQ ID NO 2228  SEQ ID NO 884  Contig38652_RC  SEQ ID NO 2228

NM_003197 NM_003197
SEQ ID NO 885 Contig38683_RC SEQ ID NO 2229  SEQ ID NO 885  Contig38683_RC  SEQ ID NO 2229

NM_003202 NM_003202
SEQ ID NO 886 Contig38726_RC SEQ ID NO 2230  SEQ ID NO 886  Contig38726_RC  SEQ ID NO 2230

NM_003213 NM_003213
SEQ ID NO 887 Contig38791_RC SEQ ID NO 2231  SEQ ID NO 887  Contig38791_RC  SEQ ID NO 2231

NMB_003217 NMB_003217
SEQ ID NO 888 Contig38901_RC SEQ ID NO 2232  SEQ ID NO 888  Contig38901_RC  SEQ ID NO 2232

NM_003225 NM_003225
SEQ ID NO 889 Contig38983_RC SEQ ID NO 2233  SEQ ID NO 889  Contig38983_RC  SEQ ID NO 2233

NM_003226 NM_003226
SEQ ID NO 890 Contig39090_RC SEQ ID NO 2234  SEQ ID NO 890  Contig39090_RC  SEQ ID NO 2234

NM_003236 NM_003236
SEQ ID NO 892 Contig39132_RC SEQ ID NO 2235  SEQ ID NO 892  Contig39132_RC  SEQ ID NO 2235

NM_003239 NM_003239
SEQ ID NO 893 Contig39157_RC SEQ ID NO 2236  SEQ ID NO 893  Contig39157_RC  SEQ ID NO 2236

NM_003248 NM_003248
SEQ ID NO 894 Contig39226_RC SEQ ID NO 2237  SEQ ID NO 894  Contig39226_RC  SEQ ID NO 2237

28 28

NM_003255  NM_003255
SEQ ID NO 895 Contig39285_RC SEQ ID NO 2238  SEQ ID NO 895  Contig39285_RC  SEQ ID NO 2238

NM_003258 NM_003258
SEQ ID NO 896 Contig39556_RC SEQ ID NO 2239  SEQ ID NO 896  Contig39556_RC  SEQ ID NO 2239

NM_003264 NM_003264
SEQ ID NO 897 Contig39591_RC SEQ ID NO 2240  SEQ ID NO 897  Contig39591_RC  SEQ ID NO 2240

NM_003283 NM_003283
SEQ ID NO 898 Contig39826_RC SEQ ID NO 2241  SEQ ID NO 898  Contig39826_RC  SEQ ID NO 2241

NM_003318 NM_003318
SEQ ID NO 899 Contig39845_RC SEQ ID NO 2242  SEQ ID NO 899  Contig39845_RC  SEQ ID NO 2242

NM_003329 NM_003329
SEQ ID NO 900 Contig39891_RC SEQ ID NO 2243  SEQ ID NO 900  Contig39891_RC  SEQ ID NO 2243

NM_003332 NM_003332
SEQ ID NO 901 Contig39922_RC SEQ ID NO 2244  SEQ ID NO 901  Contig39922_RC  SEQ ID NO 2244

NM_003358 NM_003358
SEQ ID NO 902 Contig39960_RC SEQ ID NO 2245  SEQ ID NO 902  Contig39960_RC  SEQ ID NO 2245

NM_003359 NM_003359
SEQ ID NO 903 Contig40026_RC SEQ ID NO 2246  SEQ ID NO 903  Contig40026_RC  SEQ ID NO 2246

NM_003360 NM_003360
SEQ ID NO 904 Contig40121_RC SEQ ID NO 2247  SEQ ID NO 904  Contig40121_RC  SEQ ID NO 2247

NM_003368 NM_003368
SEQ ID NO 905 Contig40128_RC SEQ ID NO 2248  SEQ ID NO 905  Contig40128_RC  SEQ ID NO 2248

NM_003376 NM_003376
SEQ ID NO 906 Contig40146 SEQ ID NO 2249  SEQ ID NO 906 Contig40146  SEQ ID NO 2249

NM_003380 NM_003380
SEQ ID NO 907 Contig40208_RC SEQ ID NO 2250  SEQ ID NO 907  Contig40208_RC  SEQ ID NO 2250

NM_003392 NM_003392
SEQ ID NO 908 Contig40212_RC SEQ ID NO 2251  SEQ ID NO 908  Contig40212_RC  SEQ ID NO 2251

NM_003412 NM_003412
SEQ ID NO 909 Contig40238_RC SEQ ID NO 2252  SEQ ID NO 909  Contig40238_RC  SEQ ID NO 2252

NM_003430 NM_003430
SEQ ID NO 910 Contig40434_RC SEQ ID NO 2253  SEQ ID NO 910  Contig40434_RC  SEQ ID NO 2253

NM_003462 NM_003462
SEQ ID NO 911 Contig40446_RC SEQ ID NO 2254  SEQ ID NO 911  Contig40446_RC  SEQ ID NO 2254

NM_003467 NM_003467
SEQ ID NO 912 Contig40500_RC SEQ ID NO 2255  SEQ ID NO 912  Contig40500_RC  SEQ ID NO 2255

NM_003472 NM_003472
SEQ ID NO 913 Contig40573_RC SEQ ID NO 2256  SEQ ID NO 913  Contig40573_RC  SEQ ID NO 2256

NM_003479 NM_003479
SEQ ID NO 914 Contig40813_RC SEQ ID NO 2258  SEQ ID NO 914  Contig40813_RC  SEQ ID NO 2258

NM_003489 NM_003489
SEQ ID NO 915 Contig40816_RC SEQ ID NO 2259  SEQ ID NO 915  Contig40816_RC  SEQ ID NO 2259

NM_003494 NM_003494
SEQ ID NO 918 Contig40845_RC SEQ ID NO 2261  SEQ ID NO 918  Contig40845_RC  SEQ ID NO 2261

NM_003498 NM_003498
SEQ ID NO 917 Contig40889_RC SEQ ID NO 2262  SEQ ID NO 917  Contig40889_RC  SEQ ID NO 2262

NM_003504 NM_003504
SEQ ID NO 919 Contig41035 SEQ ID NO 2263  SEQ ID NO 919 Contig41035  SEQ ID NO 2263

NM_003508 NM_003508
SEQ ID NO 920 Contig41234_RC SEQ ID NO 2264  SEQ ID NO 920  Contig41234_RC  SEQ ID NO 2264

NMB_003510 NMB_003510
SEQ ID NO 921 Contig41413_RC SEQ ID NO 2266  SEQ ID NO 921  Contig41413_RC  SEQ ID NO 2266

NMB_003512 NMB_003512
SEQ ID NO 922 Contig41521_RC SEQ ID NO 2267  SEQ ID NO 922  Contig41521_RC  SEQ ID NO 2267

NM_003528 NM_003528
SEQ ID NO 923 Contig41530 RC SEQ ID NO 2268  SEQ ID NO 923  Contig41530 RC  SEQ ID NO 2268

NM_003544 NM_003544
SEQ ID NO 924 Contig41590 SEQ ID NO 2269  SEQ ID NO 924 Contig41590  SEQ ID NO 2269

NM_003561 NM_003561
SEQ ID NO 925 Contig41618_RC SEQ ID NO 2270  SEQ ID NO 925  Contig41618_RC  SEQ ID NO 2270

NM_003563 NM_003563
SEQ ID NO 926 Contig41624_RC SEQ ID NO 2271  SEQ ID NO 926  Contig41624_RC  SEQ ID NO 2271

NM_003568 NM_003568
SEQ ID NO 927 Contig41635_RC SEQ ID NO 2272  SEQ ID NO 927  Contig41635_RC  SEQ ID NO 2272

NM_003579 NM_003579
SEQ ID NO 928 Contig41676_RC SEQ ID NO 2273  SEQ ID NO 928  Contig41676_RC  SEQ ID NO 2273

NM_003600 NM_003600
SEQ ID NO 929 Contig41689_RC SEQ ID NO 2274  SEQ ID NO 929  Contig41689_RC  SEQ ID NO 2274

NM_003615 NM_003615
SEQ ID NO 931 Contig41804_RC SEQ ID NO 2275  SEQ ID NO 931  Contig41804_RC  SEQ ID NO 2275

NM_003627 NM_003627
SEQ ID NO 932 Contig41887_RC SEQ ID NO 2276  SEQ ID NO 932  Contig41887_RC  SEQ ID NO 2276

NM_003645 NM_003645
SEQ ID NO 935 Contig41905_RC SEQ ID NO 2277  SEQ ID NO 935  Contig41905_RC  SEQ ID NO 2277

NM_003651 NM_003651
SEQ ID NO 936 Contig41954_RC SEQ ID NO 2278  SEQ ID NO 936  Contig41954_RC  SEQ ID NO 2278

NM_003657 NM_003657
SEQ ID NO 937 Contig41983_RC SEQ ID NO 2279  SEQ ID NO 937  Contig41983_RC  SEQ ID NO 2279

NM_003662 NM_003662
SEQ ID NO 938 Contig42006_RC SEQ ID NO 2280  SEQ ID NO 938  Contig42006_RC  SEQ ID NO 2280

NM_003670 NM_003670
SEQ ID NO 939 Contig42014_RC SEQ ID NO 2281  SEQ ID NO 939  Contig42014_RC  SEQ ID NO 2281

NM_003675 NM_003675
SEQ ID NO 940 Contig42036_RC SEQ ID NO 2282  SEQ ID NO 940  Contig42036_RC  SEQ ID NO 2282

NM_003676 NM_003676
SEQ ID NO 941 Contig42041_RC SEQ ID NO 2283  SEQ ID NO 941  Contig42041_RC  SEQ ID NO 2283

NM_003681 NM_003681
SEQ ID NO 942 Contig42139 SEQ ID NO 2284  SEQ ID NO 942 Contig42139  SEQ ID NO 2284

NM_003683 NM_003683
SEQ ID NO 943 Contig42161_RC SEQ ID NO 2285  SEQ ID NO 943  Contig42161_RC  SEQ ID NO 2285

NM_003686 NM_003686
SEQ ID NO 944 Contig42220_RC SEQ ID NO 2286  SEQ ID NO 944  Contig42220_RC  SEQ ID NO 2286

NM_003689 NM_003689
SEQ ID NO 945 Contig42306_RC SEQ ID NO 2287  SEQ ID NO 945  Contig42306_RC  SEQ ID NO 2287

29 29

NM_003714  NM_003714
SEQ ID NO 946 Contig42311_RC SEQ ID NO 2288  SEQ ID NO 946  Contig42311_RC  SEQ ID NO 2288

NM_003720 NM_003720
SEQ ID NO 947 Contig42313_RC SEQ ID NO 2289  SEQ ID NO 947  Contig42313_RC  SEQ ID NO 2289

NM_003726 NM_003726
SEQ ID NO 948 Contig42402_RC SEQ ID NO 2290  SEQ ID NO 948  Contig42402_RC  SEQ ID NO 2290

NM_003729 NM_003729
SEQ ID NO 949 Contig42421_RC SEQ lD NO 2291  SEQ ID NO 949  Contig42421_RC  SEQ ID NO 2291

NM_003740 NM_003740
SEQ ID NO 950 Contig42430_RC SEQ ID NO 2292  SEQ ID NO 950  Contig42430_RC  SEQ ID NO 2292

NM_003772 NM_003772
SEQ ID NO 952 Contig42431_RC SEQ ID NO 2293  SEQ ID NO 952  Contig42431_RC  SEQ ID NO 2293

NM_003791 NM_003791
SEQ ID NO 953 Contig42542_RC SEQ ID NO 2294  SEQ ID NO 953  Contig42542_RC  SEQ ID NO 2294

NM_003793 NM_003793
SEQ ID NO 954 Contig42582 SEQ ID NO 2295  SEQ ID NO 954 Contig42582  SEQ ID NO 2295

NM_003795 NM_003795
SEQ ID NO 955 Contig42631_RC SEQ ID NO 2296  SEQ ID NO 955  Contig42631_RC  SEQ ID NO 2296

NM_003806 NM_003806
SEQ ID NO 956 Contig42751_RC SEQ ID NO 2297  SEQ ID NO 956  Contig42751_RC  SEQ ID NO 2297

NM_003821 NM_003821
SEQ ID NO 957 Contig42759_RC SEQ ID NO 2298  SEQ ID NO 957  Contig42759_RC  SEQ ID NO 2298

NM_003829 NM_003829
SEQ ID NO 958 Contig43054 SEQ ID NO 2299  SEQ ID NO 958 Contig43054  SEQ ID NO 2299

NM_003831 NM_003831
SEQ ID NO 959 Contig43079_RC SEQ ID NO 2300  SEQ ID NO 959  Contig43079_RC  SEQ ID NO 2300

NM_003862 NM_003862
SEQ ID NO 960 Contig43195_RC SEQ ID NO 2301  SEQ ID NO 960  Contig43195_RC  SEQ ID NO 2301

NM_003866 NM_003866
SEQ ID NO 961 Contig43368_RC SEQ ID NO 2302  SEQ ID NO 961  Contig43368_RC  SEQ ID NO 2302

NM_003875 NM_003875
SEQ ID NO 962 Contig43410_RC SEQ ID NO 2303  SEQ ID NO 962  Contig43410_RC  SEQ ID NO 2303

NM_003878 NM_003878
SEQ ID NO 963 Contig43476_RC SEQ ID NO 2304  SEQ ID NO 963  Contig43476_RC  SEQ ID NO 2304

NM_003894 NM_003894
SEQ ID NO 965 Contig43549_RC SEQ ID NO 2305  SEQ ID NO 965  Contig43549_RC  SEQ ID NO 2305

NM_003897 NM_003897
SEQ ID NO 966 Contig43645_RC SEQ ID NO 2306  SEQ ID NO 966  Contig43645_RC  SEQ ID NO 2306

NM_003904 NM_003904
SEQ ID NO 967 Contig43648_RC SEQ ID NO 2307  SEQ ID NO 967  Contig43648_RC  SEQ ID NO 2307

NM_003929 NM_003929
SEQ ID NO 968 Contig43673_RC SEQ ID NO 2308  SEQ ID NO 968  Contig43673_RC  SEQ ID NO 2308

NM_003933 NM_003933
SEQ ID NO 969 Contig43679_RC SEQ ID NO 2309  SEQ ID NO 969  Contig43679_RC  SEQ ID NO 2309

NM_003937 NM_003937
SEQ ID NO 970 Contig43694_RC SEQ ID NO 2310  SEQ ID NO 970  Contig43694_RC  SEQ ID NO 2310

NM_003940 NM_003940
SEQ ID NO 971 Contig43747_RC SEQ ID NO 2311  SEQ ID NO 971  Contig43747_RC  SEQ ID NO 2311

NM_003942 NM_003942
SEQ ID NO 972 Contig43918_RC SEQ ID NO 2312  SEQ ID NO 972  Contig43918_RC  SEQ ID NO 2312

NM_003944 NM_003944
SEQ ID NO 973 Contig43983_RC SEQ ID NO 2313  SEQ ID NO 973  Contig43983_RC  SEQ ID NO 2313

NM_003953 NM_003953
SEQ ID NO 974 Contig44040_RC SEQ ID NO 2314  SEQ ID NO 974  Contig44040_RC  SEQ ID NO 2314

NM_003954 NM_003954
SEQ ID NO 975 Contig44064_RC SEQ ID NO 2315  SEQ ID NO 975  Contig44064_RC  SEQ ID NO 2315

NM_003975 NM_003975
SEQ ID NO 976 Contig44195_RC SEQ ID NO 2316  SEQ ID NO 976  Contig44195_RC  SEQ ID NO 2316

NM_003981 NM_003981
SEQ ID NO 977 Contig44226_RC SEQ ID NO 2317  SEQ ID NO 977  Contig44226_RC  SEQ ID NO 2317

NM_003982 NM_003982
SEQ ID NO 978 Contig44289_RC SEQ ID NO 2320  SEQ ID NO 978  Contig44289_RC  SEQ ID NO 2320

NM_003986 NM_003986
SEQ ID NO 979 Contig44310_RC SEQ ID NO 2321  SEQ ID NO 979  Contig44310_RC  SEQ ID NO 2321

NM_004003 NM_004003
SEQ ID NO 980 Contig44409 SEQ ID NO 2322  SEQ ID NO 980 Contig44409  SEQ ID NO 2322

NM_004010 NM_004010
SEQ ID NO 981 Contig44413_RC SEQ ID NO 2323  SEQ ID NO 981  Contig44413_RC  SEQ ID NO 2323

NM_004024 NM_004024
SEQ ID NO 982 Contig44451_RC SEQ ID NO 2324  SEQ ID NO 982  Contig44451_RC  SEQ ID NO 2324

NM_004038 NM_004038
SEQ ID NO 983 Contig44585_RC SEQ ID NO 2325  SEQ ID NO 983  Contig44585_RC  SEQ ID NO 2325

NM_004049 NM_004049
SEQ ID NO 984 Contig44656_RC SEQ ID NO 2326  SEQ ID NO 984  Contig44656_RC  SEQ ID NO 2326

NM_004052 NM_004052
SEQ ID NO 985 Contig44703_RC SEQ ID NO 2327  SEQ ID NO 985  Contig44703_RC  SEQ ID NO 2327

NM_004053 NM_004053
SEQ ID NO 986 Contig44708_RC SEQ ID NO 2328  SEQ ID NO 986  Contig44708_RC  SEQ ID NO 2328

NM_004079 NM_004079
SEQ ID NO 987 Contig44757_RC SEQ ID NO 2329  SEQ ID NO 987  Contig44757_RC  SEQ ID NO 2329

NM_004104 NM_004104
SEQ ID NO 988 Contig44829_RC SEQ ID NO 2331  SEQ ID NO 988  Contig44829_RC  SEQ ID NO 2331

NM_004109 NM_004109
SEQ ID NO 989 Contig44870 SEQ ID NO 2332  SEQ ID NO 989 Contig44870  SEQ ID NO 2332

NM_004110 NM_004110
SEQ ID NO 990 Contig44893_RC SEQ ID NO 2333  SEQ ID NO 990  Contig44893_RC  SEQ ID NO 2333

NM_004120 NM_004120
SEQ ID NO 991 Contig44909_RC SEQ ID NO 2334  SEQ ID NO 991  Contig44909_RC  SEQ ID NO 2334

NM_004131 NM_004131
SEQ ID NO 992 Contig44939_RC SEQ ID NO 2335  SEQ ID NO 992  Contig44939_RC  SEQ ID NO 2335

NM_004143 NM_004143
SEQ ID NO 993 Contig45022_RC SEQ ID NO 2336  SEQ ID NO 993  Contig45022_RC  SEQ ID NO 2336

NM_004154 NM_004154
SEQ ID NO 994 Contig45032_RC SEQ ID NO 2337  SEQ ID NO 994  Contig45032_RC  SEQ ID NO 2337

NM_004170 NM_004170
SEQ ID NO 996 Contig45041_RC SEQ ID NO 2338  SEQ ID NO 996  Contig45041_RC  SEQ ID NO 2338

30 30

NM_004172  NM_004172
SEQ ID NO 997 Contig45049_RC SEQ ID NO 2339  SEQ ID NO 997  Contig45049_RC  SEQ ID NO 2339

NM_004176 NM_004176
SEQ ID NO 998 Contig45090_RC SEQ ID NO 2340  SEQ ID NO 998  Contig45090_RC  SEQ ID NO 2340

NM_004180 NM_004180
SEQ ID NO 999 Contig45156_RC SEQ ID NO 2341  SEQ ID NO 999  Contig45156_RC  SEQ ID NO 2341

NM_004181 NM_004181
SEQ ID NO 1000 Contig45316_RC SEQ ID NO 2342  SEQ ID NO 1000  Contig45316_RC  SEQ ID NO 2342

NM_004184 NM_004184
SEQ ID NO 1001 Contig45321 SEQ ID NO 2343  SEQ ID NO 1001 Contig45321  SEQ ID NO 2343

NM_004203 NM_004203
SEQ ID NO 1002 Contig45375_RC SEQ ID NO 2345  SEQ ID NO 1002  Contig45375_RC  SEQ ID NO 2345

NM_004207 NM_004207
SEQ ID NO 1003 Contig45443_RC SEQ ID NO 2346  SEQ ID NO 1003  Contig45443_RC  SEQ ID NO 2346

NM_004217 NM_004217
SEQ ID NO 1004 Contig45454_RC SEQ ID NO 2347  SEQ ID NO 1004  Contig45454_RC  SEQ ID NO 2347

NM_004219 NM_004219
SEQ ID NO 1005 Contig45537_RC SEQ ID NO 2348  SEQ ID NO 1005  Contig45537_RC  SEQ ID NO 2348

NM_004221 NM_004221
SEQ ID NO 1006 Contig45588_RC SEQ ID NO 2349  SEQ ID NO 1006  Contig45588_RC  SEQ ID NO 2349

NM_004233 NM_004233
SEQ ID NO 1007 Contig45708_RC SEQ ID NO 2350  SEQ ID NO 1007  Contig45708_RC  SEQ ID NO 2350

NM_004244 NM_004244
SEQ ID NO 1008 Contig45816_RC SEQ ID NO 2351  SEQ ID NO 1008  Contig45816_RC  SEQ ID NO 2351

NM_004252 NM_004252
SEQ ID NO 1009 Contig45847_RC SEQ ID NO 2352  SEQ ID NO 1009  Contig45847_RC  SEQ ID NO 2352

NM_004265 NM_004265
SEQ ID NO 1010 Contig45891_RC SEQ ID NO 2353  SEQ ID NO 1010  Contig45891_RC  SEQ ID NO 2353

NM_004267 NM_004267
SEQ ID NO 1011 Contig46056_RC SEQ ID NO 2354  SEQ ID NO 1011  Contig46056_RC  SEQ ID NO 2354

NM_004281 NM_004281
SEQ ID NO 1012 Contig46062_RC SEQ ID NO 2355  SEQ ID NO 1012  Contig46062_RC  SEQ ID NO 2355

NM_004289 NM_004289
SEQ ID NO 1013 Contig46075_RC SEQ ID NO 2356  SEQ ID NO 1013  Contig46075_RC  SEQ ID NO 2356

NM_004298 NM_004298
SEQ ID NO 1015 Contig46164_RC SEQ ID NO 2357  SEQ ID NO 1015  Contig46164_RC  SEQ ID NO 2357

NM_004301 NM_004301
SEQ ID NO 1016 Contig46218_RC SEQ ID NO 2358  SEQ ID NO 1016  Contig46218_RC  SEQ ID NO 2358

NM_004305 NM_004305
SEQ ID NO 1017 Contig46223_RC SEQ ID NO 2359  SEQ ID NO 1017  Contig46223_RC  SEQ ID NO 2359

NM_004311 NM_004311
SEQ ID NO 1018 Contig46244_RC SEQ ID NO 2360  SEQ ID NO 1018  Contig46244_RC  SEQ ID NO 2360

NM_004315 NM_004315
SEQ ID NO 1019 Contig46262_RC SEQ ID NO 2361  SEQ ID NO 1019  Contig46262_RC  SEQ ID NO 2361

NM_004323 NM_004323
SEQ ID NO 1020 Contig46362_RC SEQ ID NO 2364  SEQ ID NO 1020  Contig46362_RC  SEQ ID NO 2364

NM_004330 NM_004330
SEQ ID NO 1021 Contig46443_RC SEQ ID NO 2365  SEQ ID NO 1021  Contig46443_RC  SEQ ID NO 2365

NM_004336 NM_004336
SEQ ID NO 1022 Contig46553_RC SEQ ID NO 2367  SEQ ID NO 1022  Contig46553_RC  SEQ ID NO 2367

NM_004338 NM_004338
SEQ ID NO 1023 Contig46597_RC SEQ ID NO 2368  SEQ ID NO 1023  Contig46597_RC  SEQ ID NO 2368

NM_004350 NM_004350
SEQ ID NO 1024 Contig46653_RC SEQ ID NO 2369  SEQ ID NO 1024  Contig46653_RC  SEQ ID NO 2369

NM_004354 NM_004354
SEQ ID NO 1025 Contig46709_RC SEQ ID NO 2370  SEQ ID NO 1025  Contig46709_RC  SEQ ID NO 2370

NM_004358 NM_004358
SEQ ID NO 1026 Contig46777_RC SEQ ID NO 2371  SEQ ID NO 1026  Contig46777_RC  SEQ ID NO 2371

NM_004360 NM_004360
SEQ ID NO 1027 Contig46802_RC SEQ ID NO 2372  SEQ ID NO 1027  Contig46802_RC  SEQ ID NO 2372

NM_004362 NM_004362
SEQ ID NO 1028 Contig46890_RC SEQ ID NO 2374  SEQ ID NO 1028  Contig46890_RC  SEQ ID NO 2374

NM_004374 NM_004374
SEQ ID NO 1029 Contig46922_RC SEQ ID NO 2375  SEQ ID NO 1029  Contig46922_RC  SEQ ID NO 2375

NM_004378 NM_004378
SEQ ID NO 1030 Contig46934_RC SEQ ID NO 2376  SEQ ID NO 1030  Contig46934_RC  SEQ ID NO 2376

NM_004392 NM_004392
SEQ ID NO 1031 Contig46937_RC SEQ ID NO 2377  SEQ ID NO 1031  Contig46937_RC  SEQ ID NO 2377

NM_004395 NM_004395
SEQ ID NO 1032 Contig46991_RC SEQ ID NO 2378  SEQ ID NO 1032  Contig46991_RC  SEQ ID NO 2378

NM_004414 NM_004414
SEQ ID NO 1033 Contig47016_RC SEQ ID NO 2379  SEQ ID NO 1033  Contig47016_RC  SEQ ID NO 2379

NM_004418 NM_004418
SEQ ID NO 1034 Contig47045_RC SEQ ID NO 2380  SEQ ID NO 1034  Contig47045_RC  SEQ ID NO 2380

NM_004425 NM_004425
SEQ ID NO 1035 Contig47106_RC SEQ ID NO 2381  SEQ ID NO 1035  Contig47106_RC  SEQ ID NO 2381

NM_004431 NM_004431
SEQ ID NO 1036 Contig47146_RC SEQ ID NO 2382  SEQ ID NO 1036  Contig47146_RC  SEQ ID NO 2382

NM_004436 NM_004436
SEQ ID NO 1037 Contig47230_RC SEQ ID NO 2383  SEQ ID NO 1037  Contig47230_RC  SEQ ID NO 2383

NM_004438 NM_004438
SEQ ID NO 1038 Contig47405_RC SEQ ID NO 2384  SEQ ID NO 1038  Contig47405_RC  SEQ ID NO 2384

NM_004443 NM_004443
SEQ ID NO 1039 Contig47456_RC SEQ ID NO 2385  SEQ ID NO 1039  Contig47456_RC  SEQ ID NO 2385

NM_004446 NM_004446
SEQ ID NO 1040 Contig47465_RC SEQ ID NO 2386  SEQ ID NO 1040  Contig47465_RC  SEQ ID NO 2386

NM_004451 NM_004451
SEQ ID NO 1041 Contig47498_RC SEQ ID NO 2387  SEQ ID NO 1041  Contig47498_RC  SEQ ID NO 2387

NM_004454 NM_004454
SEQ ID NO 1042 Contig47578_RC SEQ ID NO 2388  SEQ ID NO 1042  Contig47578_RC  SEQ ID NO 2388

NM_004456 NM_004456
SEQ ID NO 1043 Contig47645_RC SEQ ID NO 2389  SEQ ID NO 1043  Contig47645_RC  SEQ ID NO 2389

NM_004458 NM_004458
SEQ ID NO 1044 Contig47680_RC SEQ ID NO 2390  SEQ ID NO 1044  Contig47680_RC  SEQ ID NO 2390

31 31

NM_004472  NM_004472
SEQ ID NO 1045 Contig47781_RC SEQ ID NO 2391  SEQ ID NO 1045  Contig47781_RC  SEQ ID NO 2391

NM_004480 NM_004480
SEQ ID NO 1046 Contig47814_RC SEQ ID NO 2392  SEQ ID NO 1046  Contig47814_RC  SEQ ID NO 2392

NM_004482 NM_004482
SEQ ID NO 1047 Contig48004_RC SEQ ID NO 2393  SEQ ID NO 1047  Contig48004_RC  SEQ ID NO 2393

NM_004494 NM_004494
SEQ ID NO 1048 Contig48043_RC SEQ ID NO 2394  SEQ ID NO 1048  Contig48043_RC  SEQ ID NO 2394

NM_004496 NM_004496
SEQ ID NO 1049 Contig48057_RC SEQ ID NO 2395  SEQ ID NO 1049  Contig48057_RC  SEQ ID NO 2395

NM_004503 NM_004503
SEQ ID NO 1050 Contig48076_RC SEQ ID NO 2396  SEQ ID NO 1050  Contig48076_RC  SEQ ID NO 2396

NM_004504 NM_004504
SEQ ID NO 1051 Contig48249_RC SEQ ID NO 2397  SEQ ID NO 1051  Contig48249_RC  SEQ ID NO 2397

NM_004515 NM_004515
SEQ ID NO 1052 Contig48263_RC SEQ ID NO 2398  SEQ ID NO 1052  Contig48263_RC  SEQ ID NO 2398

NM_004522 NM_004522
SEQ ID NO 1053 Contig48270_RC SEQ ID NO 2399  SEQ ID NO 1053  Contig48270_RC  SEQ ID NO 2399

NM_004523 NM_004523
SEQ ID NO 1054 Contig48328_RC SEQ ID NO 2400  SEQ ID NO 1054  Contig48328_RC  SEQ ID NO 2400

NM_004525 NM_004525
SEQ ID NO 1055 Contig48518_RC SEQ ID NO 2401  SEQ ID NO 1055  Contig48518_RC  SEQ ID NO 2401

NM_004556 NM_004556
SEQ ID NO 1056 Contig48572_RC SEQ ID NO 2402  SEQ ID NO 1056  Contig48572_RC  SEQ ID NO 2402

NM_004559 NM_004559
SEQ ID NO 1057 Contig48659_RC SEQ ID NO 2403  SEQ ID NO 1057  Contig48659_RC  SEQ ID NO 2403

NM_004569 NM_004569
SEQ ID NO 1058 Contig48722_RC SEQ ID NO 2404  SEQ ID NO 1058  Contig48722_RC  SEQ ID NO 2404

NM_004577 NM_004577
SEQ ID NO 1059 Contig48774_RC SEQ ID NO 2405  SEQ ID NO 1059  Contig48774_RC  SEQ ID NO 2405

NM_004585 NM_004585
SEQ ID NO 1060 Contig48776_RC SEQ ID NO 2406  SEQ ID NO 1060  Contig48776_RC  SEQ ID NO 2406

NM_004587 NM_004587
SEQ ID NO 1061 Contig48800_RC SEQ ID NO 2407  SEQ ID NO 1061  Contig48800_RC  SEQ ID NO 2407

NM_004594 NM_004594
SEQ ID NO 1062 Contig48806_RC SEQ ID NO 2408  SEQ ID NO 1062  Contig48806_RC  SEQ ID NO 2408

NM_004599 NM_004599
SEQ ID NO 1063 Contig48852_RC SEQ ID NO 2409  SEQ ID NO 1063  Contig48852_RC  SEQ ID NO 2409

NM_004633 NM_004633
SEQ ID NO 1066 Contig48900_RC SEQ ID NO 2410  SEQ ID NO 1066  Contig48900_RC  SEQ ID NO 2410

NM_004642 NM_004642
SEQ ID NO 1067 Contig48913_RC SEQ ID NO 2411  SEQ ID NO 1067  Contig48913_RC  SEQ ID NO 2411

NM_004648 NM_004648
SEQ ID NO 1068 Contig48970_RC SEQ ID NO 2413  SEQ ID NO 1068  Contig48970_RC  SEQ ID NO 2413

NM_004663 NM_004663
SEQ ID NO 1069 Contig49058_RC SEQ ID NO 2414  SEQ ID NO 1069  Contig49058_RC  SEQ ID NO 2414

NM_004664 NM_004664
SEQ ID NO 1070 Contig49063_RC SEQ ID NO 2415  SEQ ID NO 1070  Contig49063_RC  SEQ ID NO 2415

NM_004684 NM_004684
SEQ ID NO 1071 Contig49093 SEQ ID NO 2416  SEQ ID NO 1071 Contig49093  SEQ ID NO 2416

NM_004688 NM_004688
SEQ ID NO 1072 Contig49098_RC SEQ ID NO 2417  SEQ ID NO 1072  Contig49098_RC  SEQ ID NO 2417

NM_004694 NM_004694
SEQ ID NO 1073 Contig49169_RC SEQ ID NO 2418  SEQ ID NO 1073  Contig49169_RC  SEQ ID NO 2418

NM_004695 NM_004695
SEQ ID NO 1074 Contig49233_RC SEQ ID NO 2419  SEQ ID NO 1074  Contig49233_RC  SEQ ID NO 2419

NM_004701 NM_004701
SEQ ID NO 1075 Contig49270_RC SEQ ID NO 2420  SEQ ID NO 1075  Contig49270_RC  SEQ ID NO 2420

NM_004708 NM_004708
SEQ ID NO 1077 Contig49282_RC SEQ ID NO 2421  SEQ ID NO 1077  Contig49282_RC  SEQ ID NO 2421

NM_004711 NM_004711
SEQ ID NO 1078 Contig49289_RC SEQ ID NO 2422  SEQ ID NO 1078  Contig49289_RC  SEQ ID NO 2422

NM_004726 NM_004726
SEQ ID NO 1079 Contig49342_RC SEQ ID NO 2423  SEQ ID NO 1079  Contig49342_RC  SEQ ID NO 2423

NM_004750 NM_004750
SEQ ID NO 1081 Contig49344 SEQ ID NO 2424  SEQ ID NO 1081 Contig49344  SEQ ID NO 2424

NM_004761 NM_004761
SEQ ID NO 1082 Contig49388_RC SEQ ID NO 2425  SEQ ID NO 1082  Contig49388_RC  SEQ ID NO 2425

NM_004762 NM_004762
SEQ ID NO 1083 Contig49405_RC SEQ ID NO 2426  SEQ ID NO 1083  Contig49405_RC  SEQ ID NO 2426

NM_004780 NM_004780
SEQ ID NO 1085 Contig49445_RC SEQ ID NO 2427  SEQ ID NO 1085  Contig49445_RC  SEQ ID NO 2427

NM_004791 NM_004791
SEQ ID NO 1086 Contig49468_RC SEQ ID NO 2428  SEQ ID NO 1086  Contig49468_RC  SEQ ID NO 2428

NM_004798 NM_004798
SEQ ID NO 1087 Contig49509_RC SEQ ID NO 2429  SEQ ID NO 1087  Contig49509_RC  SEQ ID NO 2429

NM_004808 NM_004808
SEQ ID NO 1088 Contig49578_RC SEQ ID NO 2431  SEQ ID NO 1088  Contig49578_RC  SEQ ID NO 2431

NM_004811 NM_004811
SEQ ID NO 1089 Contig49581_RC SEQ ID NO 2432  SEQ ID NO 1089  Contig49581_RC  SEQ ID NO 2432

NM_004833 NM_004833
SEQ ID NO 1090 Contig49631_RC SEQ ID NO 2433  SEQ ID NO 1090  Contig49631_RC  SEQ ID NO 2433

NM_004835 NM_004835
SEQ ID NO 1091 Contig49673_RC SEQ ID NO 2435  SEQ ID NO 1091  Contig49673_RC  SEQ ID NO 2435

NM_004843 NM_004843
SEQ ID NO 1092 Contig49743_RC SEQ ID NO 2436  SEQ ID NO 1092  Contig49743_RC  SEQ ID NO 2436

NM_004847 NM_004847
SEQ ID NO 1093 Contig49790_RC SEQ ID NO 2437  SEQ ID NO 1093  Contig49790_RC  SEQ ID NO 2437

NM_004848 NM_004848
SEQ ID NO 1094 Contig49818_RC SEQ ID NO 2438  SEQ ID NO 1094  Contig49818_RC  SEQ ID NO 2438

NM_004864 NM_004864
SEQ ID NO 1095 Contig49849_RC SEQ ID NO 2439  SEQ ID NO 1095  Contig49849_RC  SEQ ID NO 2439

NM_004865 NM_004865
SEQ ID NO 1096 Contig49855 SEQ ID NO 2440  SEQ ID NO 1096 Contig49855  SEQ ID NO 2440

32 32

NM_004866  NM_004866
SEQ ID NO 1097 Contig49910_RC SEQ ID NO 2441  SEQ ID NO 1097  Contig49910_RC  SEQ ID NO 2441

NM_004877 NM_004877
SEQ ID NO 1098 Contig49948_RC SEQ ID NO 2442  SEQ ID NO 1098  Contig49948_RC  SEQ ID NO 2442

NM_004900 NM_004900
SEQ ID NO 1099 Contig50004_RC SEQ ID NO 2443  SEQ ID NO 1099  Contig50004_RC  SEQ ID NO 2443

NM_004906 NM_004906
SEQ ID NO 1100 Contig50094 SEQ ID NO 2444  SEQ ID NO 1100 Contig50094  SEQ ID NO 2444

NM_004910 NM_004910
SEQ ID NO 1101 Contig50120_RC SEQ ID NO 2446  SEQ ID NO 1101  Contig50120_RC  SEQ ID NO 2446

NM_004918 NM_004918
SEQ ID NO 1103 Contig50153_RC SEQ ID NO 2447  SEQ ID NO 1103  Contig50153_RC  SEQ ID NO 2447

NM_004923 NM_004923
SEQ ID NO 1104 Contig50189_RC SEQ ID NO 2448  SEQ ID NO 1104  Contig50189_RC  SEQ ID NO 2448

NM_004938 NM_004938
SEQ ID NO 1105 Contig50276 RC SEQ ID NO 2449  SEQ ID NO 1105  Contig50276 RC  SEQ ID NO 2449

NM_004951 NM_004951
SEQ ID NO 1106 Contig50288_RC SEQ ID NO 2450  SEQ ID NO 1106  Contig50288_RC  SEQ ID NO 2450

NM_004968 NM_004968
SEQ ID NO 1107 Contig50297_RC SEQ ID NO 2451  SEQ ID NO 1107  Contig50297_RC  SEQ ID NO 2451

NM_004994 NM_004994
SEQ ID NO 1108 Contig50391_RC SEQ ID NO 2452  SEQ ID NO 1108  Contig50391_RC  SEQ ID NO 2452

NM_004999 NM_004999
SEQ ID NO 1109 Contig50410 SEQ ID NO 2453  SEQ ID NO 1109 Contig50410  SEQ ID NO 2453

NM_005001 NM_005001
SEQ ID NO 1110 Contig50523_RC SEQ ID NO 2454  SEQ ID NO 1110  Contig50523_RC  SEQ ID NO 2454

NM_005002 NM_005002
SEQ ID NO 1111 Contig50529 SEQ ID NO 2455  SEQ ID NO 1111 Contig50529  SEQ ID NO 2455

NM_005012 NM_005012
SEQ ID NO 1112 Contig50588_RC SEQ ID NO 2456  SEQ ID NO 1112  Contig50588_RC  SEQ ID NO 2456

NM_005032 NM_005032
SEQ ID NO 1113 Contig50592 SEQ ID NO 2457  SEQ ID NO 1113 Contig50592  SEQ ID NO 2457

NM_005044 NM_005044
SEQ ID NO 1114 Contig50669_RC SEQ ID NO 2458  SEQ ID NO 1114  Contig50669_RC  SEQ ID NO 2458

NM_005046 NM_005046
SEQ ID NO 1115 Contig50719_RC SEQ ID NO 2460  SEQ ID NO 1115  Contig50719_RC  SEQ ID NO 2460

NM_005049 NM_005049
SEQ ID NO 1116 Contig50728_RC SEQ ID NO 2461  SEQ ID NO 1116  Contig50728_RC  SEQ ID NO 2461

NM_005067 NM_005067
SEQ ID NO 1117 Contig50731_RC SEQ ID NO 2462  SEQ ID NO 1117  Contig50731_RC  SEQ ID NO 2462

NM_005077 NM_005077
SEQ ID NO 1118 Contig50802_RC SEQ ID NO 2463  SEQ ID NO 1118  Contig50802_RC  SEQ ID NO 2463

NM_005080 NM_005080
SEQ ID NO 1119 Contig50822_RC SEQ ID NO 2464  SEQ ID NO 1119  Contig50822_RC  SEQ ID NO 2464

NM_005084 NM_005084
SEQ ID NO 1120 Contig50850_RC SEQ ID NO 2466  SEQ ID NO 1120  Contig50850_RC  SEQ ID NO 2466

NM_005130 NM_005130
SEQ ID NO 1122 Contig50860_RC SEQ ID NO 2467  SEQ ID NO 1122  Contig50860_RC  SEQ ID NO 2467

NM_005139 NM_005139
SEQ ID NO 1123 Contig50913_RC SEQ ID NO 2468  SEQ ID NO 1123  Contig50913_RC  SEQ ID NO 2468

NM_005168 NM_005168
SEQ ID NO 1125 Contig50950_RC SEQ ID NO 2469  SEQ ID NO 1125  Contig50950_RC  SEQ ID NO 2469

NM_005190 NM_005190
SEQ ID NO 1126 Contig51066_RC SEQ ID NO 2470  SEQ ID NO 1126  Contig51066_RC  SEQ ID NO 2470

NM_005196 NM_005196
SEQ ID NO 1127 Contig51105_RC SEQ ID NO 2472  SEQ ID NO 1127  Contig51105_RC  SEQ ID NO 2472

NM_005213 NM_005213
SEQ ID NO 1128 Contig51117_RC SEQ ID NO 2473  SEQ ID NO 1128  Contig51117_RC  SEQ ID NO 2473

NM_005218 NM_005218
SEQ ID NO 1129 Contig51196_RC SEQ ID NO 2474  SEQ ID NO 1129  Contig51196_RC  SEQ ID NO 2474

NM_005235 NM_005235
SEQ ID NO 1130 Contig51235_RC SEQ ID NO 2475  SEQ ID NO 1130  Contig51235_RC  SEQ ID NO 2475

NM_005245 NM_005245
SEQ ID NO 1131 Contig51254_RC SEQ ID NO 2476  SEQ ID NO 1131  Contig51254_RC  SEQ ID NO 2476

NM_005249 NM_005249
SEQ ID NO 1132 Contig51352_RC SEQ ID NO 2477  SEQ ID NO 1132  Contig51352_RC  SEQ ID NO 2477

NM_005257 NM_005257
SEQ ID NO 1133 Contig51369_RC SEQ ID NO 2478  SEQ ID NO 1133  Contig51369_RC  SEQ ID NO 2478

NM_005264 NM_005264
SEQ ID NO 1134 Contig51392_RC SEQ ID NO 2479  SEQ ID NO 1134  Contig51392_RC  SEQ ID NO 2479

NM_005271 NM_005271
SEQ ID NO 1135 Contig51403_RC SEQ ID NO 2480  SEQ ID NO 1135  Contig51403_RC  SEQ ID NO 2480

NM_005314 NM_005314
SEQ ID NO 1136 Contig51685_RC SEQ ID NO 2483  SEQ ID NO 1136  Contig51685_RC  SEQ ID NO 2483

NM_005321 NM_005321
SEQ ID NO 1137 Contig51726_RC SEQ ID NO 2484  SEQ ID NO 1137  Contig51726_RC  SEQ ID NO 2484

NM_005322 NM_005322
SEQ ID NO 1138 Contig51742_RC SEQ ID NO 2485  SEQ ID NO 1138  Contig51742_RC  SEQ ID NO 2485

NM_005325 NM_005325
SEQ ID NO 1139 Contig51749_RC SEQ ID NO 2486  SEQ ID NO 1139  Contig51749_RC  SEQ ID NO 2486

NM_005326 NM_005326
SEQ ID NO 1140 Contig51775_RC SEQ ID NO 2487  SEQ ID NO 1140  Contig51775_RC  SEQ ID NO 2487

NM_005335 NM_005335
SEQ ID NO 1141 Contig51800 SEQ ID NO 2488  SEQ ID NO 1141 Contig51800  SEQ ID NO 2488

NM_005337 NM_005337
SEQ ID NO 1142 Contig51809_RC SEQ ID NO 2489  SEQ ID NO 1142  Contig51809_RC  SEQ ID NO 2489

NM_005342 NM_005342
SEQ ID NO 1143 Contig51821_RC SEQ ID NO 2490  SEQ ID NO 1143  Contig51821_RC  SEQ ID NO 2490

NM_005345 NM_005345
SEQ ID NO 1144 Contig51888_RC SEQ ID NO 2491  SEQ ID NO 1144  Contig51888_RC  SEQ ID NO 2491

NM_005357 NM_005357
SEQ ID NO 1145 Contig51953_RC SEQ ID NO 2493  SEQ ID NO 1145  Contig51953_RC  SEQ ID NO 2493

NM_005375 NM_005375
SEQ ID NO 1146 Contig51967_RC SEQ ID NO 2495  SEQ ID NO 1146  Contig51967_RC  SEQ ID NO 2495

33 33

NM_005391  NM_005391
SEQ ID NO 1147 Contig51981_RC SEQ ID NO 2496  SEQ ID NO 1147  Contig51981_RC  SEQ ID NO 2496

NM_005408 NM_005408
SEQ ID NO 1148 Contig51994_RC SEQ ID NO 2497  SEQ ID NO 1148  Contig51994_RC  SEQ ID NO 2497

NM_005409 NM_005409
SEQ ID NO 1149 Contig52082_RC SEQ ID NO 2498  SEQ ID NO 1149  Contig52082_RC  SEQ ID NO 2498

NM_005410 NM_005410
SEQ ID NO 1150 Contig52094_RC SEQ ID NO 2499  SEQ ID NO 1150  Contig52094_RC  SEQ ID NO 2499

NM_005426 NM_005426
SEQ ID NO 1151 Contig52320 SEQ ID NO 2500  SEQ ID NO 1151 Contig52320  SEQ ID NO 2500

NM_005433 NM_005433
SEQ ID NO 1152 Contig52398_RC SEQ ID NO 2501  SEQ ID NO 1152  Contig52398_RC  SEQ ID NO 2501

NM_005441 NM_005441
SEQ ID NO 1153 Contig52425_RC SEQ ID NO 2503  SEQ ID NO 1153  Contig52425_RC  SEQ ID NO 2503

NM_005443 NM_005443
SEQ ID NO 1154 Contig52482_RC SEQ ID NO 2504  SEQ ID NO 1154  Contig52482_RC  SEQ ID NO 2504

NM_005483 NM_005483
SEQ ID NO 1155 Contig52543_RC SEQ ID NO 2505  SEQ ID NO 1155  Contig52543_RC  SEQ ID NO 2505

NM_005486 NM_005486
SEQ ID NO 1156 Contig52553_RC SEQ ID NO 2506  SEQ ID NO 1156  Contig52553_RC  SEQ ID NO 2506

NM_005496 NM_005496
SEQ ID NO 1157 Contig52579_RC SEQ ID NO 2507  SEQ ID NO 1157  Contig52579_RC  SEQ ID NO 2507

NM_005498 NM_005498
SEQ ID NO 1158 Contig52603_RC SEQ ID NO 2508  SEQ ID NO 1158  Contig52603_RC  SEQ ID NO 2508

NM_005499 NM_005499
SEQ ID NO 1159 Contig52639_RC SEQ ID NO 2509  SEQ ID NO 1159  Contig52639_RC  SEQ ID NO 2509

NM_005514 NM_005514
SEQ ID NO 1160 Contig52641_RC SEQ ID NO 2510  SEQ ID NO 1160  Contig52641_RC  SEQ ID NO 2510

NM_005531 NM_005531
SEQ ID NO 1162 Contig52684 SEQ ID NO 2511  SEQ ID NO 1162 Contig52684  SEQ ID NO 2511

NM_005538 NM_005538
SEQ ID NO 1163 Contig52705_RC SEQ ID NO 2512  SEQ ID NO 1163  Contig52705_RC  SEQ ID NO 2512

NM_005541 NM_005541
SEQ ID NO 1164 Contig52720_RC SEQ ID NO 2513  SEQ ID NO 1164  Contig52720_RC  SEQ ID NO 2513

NM_005544 NM_005544
SEQ ID NO 1165 Contig52722_RC SEQ ID NO 2514  SEQ ID NO 1165  Contig52722_RC  SEQ ID NO 2514

NM_005548 NM_005548
SEQ ID NO 1166 Contig52723_RC SEQ ID NO 2515  SEQ ID NO 1166  Contig52723_RC  SEQ ID NO 2515

NM_005554 NM_005554
SEQ ID NO 1167 Contig52740_RC SEQ ID NO 2516  SEQ ID NO 1167  Contig52740_RC  SEQ ID NO 2516

NM_005555 NM_005555
SEQ ID NO 1168 Contig52779_RC SEQ ID NO 2517  SEQ ID NO 1168  Contig52779_RC  SEQ ID NO 2517

NM_005556 NM_005556
SEQ ID NO 1169 Contig52957_RC SEQ ID NO 2518  SEQ ID NO 1169  Contig52957_RC  SEQ ID NO 2518

NM_005557 NM_005557
SEQ ID NO 1170 Contig52994_RC SEQ ID NO 2519  SEQ ID NO 1170  Contig52994_RC  SEQ ID NO 2519

NM_005558 NM_005558
SEQ ID NO 1171 Contig53022_RC SEQ ID NO 2520  SEQ ID NO 1171  Contig53022_RC  SEQ ID NO 2520

NM_005562 NM_005562
SEQ ID NO 1172 Contig53038_RC SEQ ID NO 2521  SEQ ID NO 1172  Contig53038_RC  SEQ ID NO 2521

NM_005563 NM_005563
SEQ ID NO 1173 Contig53047_RC SEQ ID NO 2522  SEQ ID NO 1173  Contig53047_RC  SEQ ID NO 2522

NM_005565 NM_005565
SEQ ID NO 1174 Contig53130 SEQ ID NO 2523  SEQ ID NO 1174 Contig53130  SEQ ID NO 2523

NM_005566 NM_005566
SEQ ID NO 1175 Contig53183_RC SEQ ID NO 2524  SEQ ID NO 1175  Contig53183_RC  SEQ ID NO 2524

NM_005572 NM_005572
SEQ ID NO 1176 Contig53242_RC SEQ ID NO 2526  SEQ ID NO 1176  Contig53242_RC  SEQ ID NO 2526

NM_005582 NM_005582
SEQ ID NO 1177 Contig53248_RC SEQ ID NO 2527  SEQ ID NO 1177  Contig53248_RC  SEQ ID NO 2527

NM_005608 NM_005608
SEQ ID NO 1178 Contig53260_RC SEQ ID NO 2528  SEQ ID NO 1178  Contig53260_RC  SEQ ID NO 2528

NM_005614 NM_005614
SEQ ID NO 1179 Contig53296_RC SEQ ID NO 2531  SEQ ID NO 1179  Contig53296_RC  SEQ ID NO 2531

NM_005617 NM_005617
SEQ ID NO 1180 Contig53307_RC SEQ ID NO 2532  SEQ ID NO 1180  Contig53307_RC  SEQ ID NO 2532

NM_005620 NM_005620
SEQ ID NO 1181 Contig53314_RC SEQ ID NO 2533  SEQ ID NO 1181  Contig53314_RC  SEQ ID NO 2533

NM_005625 NM_005625
SEQ ID NO 1182 Contig53401_RC SEQ ID NO 2534  SEQ ID NO 1182  Contig53401_RC  SEQ ID NO 2534

NM_005651 NM_005651
SEQ ID NO 1183 Contig53550_RC SEQ ID NO 2535  SEQ ID NO 1183  Contig53550_RC  SEQ ID NO 2535

NM_005658 NM_005658
SEQ ID NO 1184 Contig53551_RC SEQ ID NO 2536  SEQ ID NO 1184  Contig53551_RC  SEQ ID NO 2536

NM_005659 NM_005659
SEQ ID NO 1185 Contig53598_RC SEQ ID NO 2537  SEQ ID NO 1185  Contig53598_RC  SEQ ID NO 2537

NM_005667 NM_005667
SEQ ID NO 1186 Contig53646_RC SEQ ID NO 2538  SEQ ID NO 1186  Contig53646_RC  SEQ ID NO 2538

NM_005686 NM_005686
SEQ ID NO 1187 Contig53658_RC SEQ ID NO 2539  SEQ ID NO 1187  Contig53658_RC  SEQ ID NO 2539

NM_005690 NM_005690
SEQ ID NO 1188 Contig53698_RC SEQ ID NO 2540  SEQ ID NO 1188  Contig53698_RC  SEQ ID NO 2540

NM_005720 NM_005720
SEQ ID NO 1190 Contig53719_RC SEQ ID NO 2541  SEQ ID NO 1190  Contig53719_RC  SEQ ID NO 2541

NM_005727 NM_005727
SEQ ID NO 1191 Contig53742_RC SEQ ID NO 2542  SEQ ID NO 1191  Contig53742_RC  SEQ ID NO 2542

NM_005733 NM_005733
SEQ ID NO 1192 Contig53757_RC SEQ ID NO 2543  SEQ ID NO 1192  Contig53757_RC  SEQ ID NO 2543

NM_005737 NM_005737
SEQ ID NO 1193 Contig53870_RC SEQ ID NO 2544  SEQ ID NO 1193  Contig53870_RC  SEQ ID NO 2544

NM_005742 NM_005742
SEQ ID NO 1194 Contig53952_RC SEQ ID NO 2546  SEQ ID NO 1194  Contig53952_RC  SEQ ID NO 2546

NM_005746 NM_005746
SEQ ID NO 1195 Contig53962_RC SEQ ID NO 2547  SEQ ID NO 1195  Contig53962_RC  SEQ ID NO 2547

34 3. 4

NM_005749  NM_005749
SEQ ID NO 1196 Contig53968_RC SEQ ID NO 2548  SEQ ID NO 1196  Contig53968_RC  SEQ ID NO 2548

NM_005760 NM_005760
SEQ ID NO 1197 Contig54113_RC SEQ ID NO 2549  SEQ ID NO 1197  Contig54113_RC  SEQ ID NO 2549

NM_005764 NM_005764
SEQ ID NO 1198 Contig54142_RC SEQ ID NO 2550  SEQ ID NO 1198  Contig54142_RC  SEQ ID NO 2550

NM_005794 NM_005794
SEQ ID NO 1199 Contig54232_RC SEQ ID NO 2551  SEQ ID NO 1199  Contig54232_RC  SEQ ID NO 2551

NM_005796 NM_005796
SEQ ID NO 1200 Contig54242_RC SEQ ID NO 2552  SEQ ID NO 1200  Contig54242_RC  SEQ ID NO 2552

NM_005804 NM_005804
SEQ ID NO 1201 Contig54260_RC SEQ ID NO 2553  SEQ ID NO 1201  Contig54260_RC  SEQ ID NO 2553

NM_005813 NM_005813
SEQ ID NO 1202 Contig54263_RC SEQ ID NO 2554  SEQ ID NO 1202  Contig54263_RC  SEQ ID NO 2554

NM_005824 NM_005824
SEQ ID NO 1203 Contig54295_RC SEQ ID NO 2555  SEQ ID NO 1203  Contig54295_RC  SEQ ID NO 2555

NM_005825 NM_005825
SEQ ID NO 1204 Contig54318_RC SEQ ID NO 2556  SEQ ID NO 1204  Contig54318_RC  SEQ ID NO 2556

NM_005849 NM_005849
SEQ ID NO 1205 Contig54325_RC SEQ ID NO 2557  SEQ ID NO 1205  Contig54325_RC  SEQ ID NO 2557

NM_005853 NM_005853
SEQ ID NO 1206 Contig54389_RC SEQ ID NO 2558  SEQ ID NO 1206  Contig54389_RC  SEQ ID NO 2558

NM_005855 NM_005855
SEQ ID NO 1207 Contig54394_RC SEQ ID NO 2559  SEQ ID NO 1207  Contig54394_RC  SEQ ID NO 2559

NM_005864 NM_005864
SEQ ID NO 1208 Contig54414_RC SEQ ID NO 2560  SEQ ID NO 1208  Contig54414_RC  SEQ ID NO 2560

NM_005874 NM_005874
SEQ ID NO 1209 Contig54425 SEQ ID NO 2561  SEQ ID NO 1209 Contig54425  SEQ ID NO 2561

NM_005876 NM_005876
SEQ ID NO 1210 Contig54477_RC SEQ ID NO 2562  SEQ ID NO 1210  Contig54477_RC  SEQ ID NO 2562

NM_005880 NM_005880
SEQ ID NO 1211 Contig54503_RC SEQ ID NO 2563  SEQ ID NO 1211  Contig54503_RC  SEQ ID NO 2563

NM_005891 NM_005891
SEQ ID NO 1212 Contig54534_RC SEQ ID NO 2564  SEQ ID NO 1212  Contig54534_RC  SEQ ID NO 2564

NM_005892 NM_005892
SEQ ID NO 1213 Contig54560_RC SEQ ID NO 2566  SEQ ID NO 1213  Contig54560_RC  SEQ ID NO 2566

NM_005899 NM_005899
SEQ ID NO 1214 Contig54581_RC SEQ ID NO 2567  SEQ ID NO 1214  Contig54581_RC  SEQ ID NO 2567

NM_005915 NM_005915
SEQ ID NO 1215 Contig54609_RC SEQ ID NO 2568  SEQ ID NO 1215  Contig54609_RC  SEQ ID NO 2568

NM_005919 NM_005919
SEQ ID NO 1216 Contig54666_RC SEQ ID NO 2569  SEQ ID NO 1216  Contig54666_RC  SEQ ID NO 2569

NM_005923 NM_005923
SEQ ID NO 1217 Contig54667_RC SEQ ID NO 2570  SEQ ID NO 1217  Contig54667_RC  SEQ ID NO 2570

NM_005928 NM_005928
SEQ ID NO 1218 Contig54726_RC SEQ ID NO 2571  SEQ ID NO 1218  Contig54726_RC  SEQ ID NO 2571

NM_005932 NM_005932
SEQ ID NO 1219 Contig54742_RC SEQ ID NO 2572  SEQ ID NO 1219  Contig54742_RC  SEQ ID NO 2572

NM_005935 NM_005935
SEQ ID NO 1220 Contig54745_RC SEQ ID NO 2573  SEQ ID NO 1220  Contig54745_RC  SEQ ID NO 2573

NM_005945 NM_005945
SEQ ID NO 1221 Contig54757_RC SEQ ID NO 2574  SEQ ID NO 1221  Contig54757_RC  SEQ ID NO 2574

NM_005953 NM_005953
SEQ ID NO 1222 Contig54761_RC SEQ ID NO 2575  SEQ ID NO 1222  Contig54761_RC  SEQ ID NO 2575

NM_005978 NM_005978
SEQ ID NO 1223 Contig54813_RC SEQ ID NO 2576  SEQ ID NO 1223  Contig54813_RC  SEQ ID NO 2576

NM_005990 NM_005990
SEQ ID NO 1224 Contig54867_RC SEQ ID NO 2577  SEQ ID NO 1224  Contig54867_RC  SEQ ID NO 2577

NM_006002 NM_006002
SEQ ID NO 1225 Contig54895_RC SEQ ID NO 2578  SEQ ID NO 1225  Contig54895_RC  SEQ ID NO 2578

NM_006004 NM_006004
SEQ ID NO 1226 Contig54898_RC SEQ ID NO 2579  SEQ ID NO 1226  Contig54898_RC  SEQ ID NO 2579

NM_006005 NM_006005
SEQ ID NO 1227 Contig54913_RC SEQ ID NO 2580  SEQ ID NO 1227  Contig54913_RC  SEQ ID NO 2580

NM_006006 NM_006006
SEQ ID NO 1228 Contig54965_RC SEQ ID NO 2582  SEQ ID NO 1228  Contig54965_RC  SEQ ID NO 2582

NM_006017 NM_006017
SEQ ID NO 1229 Contig54968_RC SEQ ID NO 2583  SEQ ID NO 1229  Contig54968_RC  SEQ ID NO 2583

NM_006018 NM_006018
SEQ ID NO 1230 Contig55069_RC SEQ ID NO 2584  SEQ ID NO 1230  Contig55069_RC  SEQ ID NO 2584

NM_006023 NM_006023
SEQ ID NO 1231 Contig55181_RC SEQ ID NO 2585  SEQ ID NO 1231  Contig55181_RC  SEQ ID NO 2585

NM_006027 NM_006027
SEQ ID NO 1232 Contig55188_RC SEQ ID NO 2586  SEQ ID NO 1232  Contig55188_RC  SEQ ID NO 2586

NM_006029 NM_006029
SEQ ID NO 1233 Contig55221_RC SEQ ID NO 2587  SEQ ID NO 1233  Contig55221_RC  SEQ ID NO 2587

NM_006033 NM_006033
SEQ ID NO 1234 Contig55254_RC SEQ ID NO 2588  SEQ ID NO 1234  Contig55254_RC  SEQ ID NO 2588

NM_006051 NM_006051
SEQ ID NO 1235 Contig55265_RC SEQ ID NO 2589  SEQ ID NO 1235  Contig55265_RC  SEQ ID NO 2589

NM_006055 NM_006055
SEQ ID NO 1236 Contig55377_RC SEQ ID NO 2591  SEQ ID NO 1236  Contig55377_RC  SEQ ID NO 2591

NM_006074 NM_006074
SEQ ID NO 1237 Contig55397_RC SEQ ID NO 2592  SEQ ID NO 1237  Contig55397_RC  SEQ ID NO 2592

NM_006086 NM_006086
SEQ ID NO 1238 Contig55448_RC SEQ ID NO 2593  SEQ ID NO 1238  Contig55448_RC  SEQ ID NO 2593

NM_006087 NM_006087
SEQ ID NO 1239 Contig55468_RC SEQ ID NO 2594  SEQ ID NO 1239  Contig55468_RC  SEQ ID NO 2594

NM_006096 NM_006096
SEQ ID NO 1240 Contig55500_RC SEQ ID NO 2595  SEQ ID NO 1240  Contig55500_RC  SEQ ID NO 2595

NM_006101 NM_006101
SEQ ID NO 1241 Contig55538_RC SEQ ID NO 2596  SEQ ID NO 1241  Contig55538_RC  SEQ ID NO 2596

NM_006103 NM_006103
SEQ ID NO 1242 Contig55558_RC SEQ ID NO 2597  SEQ ID NO 1242  Contig55558_RC  SEQ ID NO 2597

35 35

NM_006111  NM_006111
SEQ ID NO 1243 Contig55606_RC SEQ ID NO 2598  SEQ ID NO 1243  Contig55606_RC  SEQ ID NO 2598

NM_006113 NM_006113
SEQ ID NO 1244 Contig55674_RC SEQ ID NO 2599  SEQ ID NO 1244  Contig55674_RC  SEQ ID NO 2599

NM_006115 NM_006115
SEQ ID NO 1245 Contig55725_RC SEQ ID NO 2600  SEQ ID NO 1245  Contig55725_RC  SEQ ID NO 2600

NM_006117 NM_006117
SEQ ID NO 1246 Contig55728_RC SEQ ID NO 2601  SEQ ID NO 1246  Contig55728_RC  SEQ ID NO 2601

NM_006142 NM_006142
SEQ ID NO 1247 Contig55756_RC SEQ ID NO 2602  SEQ ID NO 1247  Contig55756_RC  SEQ ID NO 2602

NM_006144 NM_006144
SEQ ID NO 1248 Contig55769_RC SEQ ID NO 2603  SEQ ID NO 1248  Contig55769_RC  SEQ ID NO 2603

NM_006148 NM_006148
SEQ ID NO 1249 Contig55771_RC SEQ ID NO 2605  SEQ ID NO 1249  Contig55771_RC  SEQ ID NO 2605

NM_006153 NM_006153
SEQ ID NO 1250 Contig55813_RC SEQ ID NO 2607  SEQ ID NO 1250  Contig55813_RC  SEQ ID NO 2607

NM_006159 NM_006159
SEQ ID NO 1251 Contig55829_RC SEQ ID NO 2608  SEQ ID NO 1251  Contig55829_RC  SEQ ID NO 2608

NM_006170 NM_006170
SEQ ID NO 1252 Contig55852_RC SEQ ID NO 2609  SEQ ID NO 1252  Contig55852_RC  SEQ ID NO 2609

NM_006197 NM_006197
SEQ ID NO 1253 Contig55883_RC SEQ ID NO 2610  SEQ ID NO 1253  Contig55883_RC  SEQ ID NO 2610

NM_006224 NM_006224
SEQ ID NO 1255 Contig55920_RC SEQ ID NO 2611  SEQ ID NO 1255  Contig55920_RC  SEQ ID NO 2611

NM_006227 NM_006227
SEQ ID NO 1256 Contig55940_RC SEQ iD NO 2612  SEQ ID NO 1256  Contig55940_RC  SEQ iD NO 2612

NM_006235 NM_006235
SEQ ID NO 1257 Contig55950_RC SEQ ID NO 2613  SEQ ID NO 1257  Contig55950_RC  SEQ ID NO 2613

NM_006243 NM_006243
SEQ ID NO 1258 Contig55991_RC SEQ ID NO 2614  SEQ ID NO 1258  Contig55991_RC  SEQ ID NO 2614

NM_006264 NM_006264
SEQ ID NO 1259 Contig55997_RC SEQ ID NO 2615  SEQ ID NO 1259  Contig55997_RC  SEQ ID NO 2615

NM_006271 NM_006271
SEQ ID NO 1261 Contig56023_RC SEQ ID NO 2616  SEQ ID NO 1261  Contig56023_RC  SEQ ID NO 2616

NM_006274 NM_006274
SEQ ID NO 1262 Contig56030_RC SEQ ID NO 2617  SEQ ID NO 1262  Contig56030_RC  SEQ ID NO 2617

NM_006290 NM_006290
SEQ ID NO 1265 Contig56093_RC SEQ ID NO 2618  SEQ ID NO 1265  Contig56093_RC  SEQ ID NO 2618

NM_006291 NM_006291
SEQ ID NO 1266 Contig56205_RC SEQ ID NO 2621  SEQ ID NO 1266  Contig56205_RC  SEQ ID NO 2621

NM_006296 NM_006296
SEQ ID NO 1267 Contig56270_RC SEQ ID NO 2622  SEQ ID NO 1267  Contig56270_RC  SEQ ID NO 2622

NM_006304 NM_006304
SEQ ID NO 1268 Contig56276_RC SEQ ID NO 2623  SEQ ID NO 1268  Contig56276_RC  SEQ ID NO 2623

NM_006314 NM_006314
SEQ ID NO 1269 Contig56291-RC SEQ ID NO 2624  SEQ ID NO 1269  Contig56291-RC  SEQ ID NO 2624

NM_006332 NM_006332
SEQ ID NO 1270 Contig56298_RC SEQ ID NO 2625  SEQ ID NO 1270  Contig56298_RC  SEQ ID NO 2625

NM_006357 NM_006357
SEQ ID NO 1271 Contig56307 SEQ ID NO 2627  SEQ ID NO 1271 Contig56307  SEQ ID NO 2627

NM_006366 NM_006366
SEQ ID NO 1272 Contig56390_RC SEQ ID NO 2628  SEQ ID NO 1272  Contig56390_RC  SEQ ID NO 2628

NM_006372 NM_006372
SEQ ID NO 1273 Contig56434_RC SEQ ID NO 2629  SEQ ID NO 1273  Contig56434_RC  SEQ ID NO 2629

NM_006377 NM_006377
SEQ ID NO 1274 Contig56457 RC SEQ ID NO 2630  SEQ ID NO 1274  Contig56457 RC  SEQ ID NO 2630

NM_006378 NM_006378
SEQ ID NO 1275 Contig56534_RC SEQ ID NO 2631  SEQ ID NO 1275  Contig56534_RC  SEQ ID NO 2631

NM_006383 NM_006383
SEQ ID NO 1276 Contig56670_RC SEQ ID NO 2632  SEQ ID NO 1276  Contig56670_RC  SEQ ID NO 2632

NM_006389 NM_006389
SEQ ID NO 1277 Contig56678_RC SEQ ID NO 2633  SEQ ID NO 1277  Contig56678_RC  SEQ ID NO 2633

NM_006393 NM_006393
SEQ ID NO 1278 Contig56742_RC SEQ ID NO 2634  SEQ ID NO 1278  Contig56742_RC  SEQ ID NO 2634

NM_006398 NM_006398
SEQ ID NO 1279 Contig56759_RC SEQ ID NO 2635  SEQ ID NO 1279  Contig56759_RC  SEQ ID NO 2635

NM_006406 NM_006406
SEQ ID NO 1280 Contig56765_RC SEQ ID NO 2636  SEQ ID NO 1280  Contig56765_RC  SEQ ID NO 2636

NM_006408 NM_006408
SEQ ID NO 1281 Contig56843_RC SEQ ID NO 2637  SEQ ID NO 1281  Contig56843_RC  SEQ ID NO 2637

NM_006410 NM_006410
SEQ ID NO 1282 Contig57011_RC SEQ ID NO 2638  SEQ ID NO 1282  Contig57011_RC  SEQ ID NO 2638

NM_006414 NM_006414
SEQ ID NO 1283 Contig57023_RC SEQ ID NO 2639  SEQ ID NO 1283  Contig57023_RC  SEQ ID NO 2639

NM_006417 NM_006417
SEQ ID NO 1284 Contig57057_RC SEQ ID NO 2640  SEQ ID NO 1284  Contig57057_RC  SEQ ID NO 2640

NM_006430 NM_006430
SEQ ID NO 1285 Contig57076_RC SEQ ID NO 2641  SEQ ID NO 1285  Contig57076_RC  SEQ ID NO 2641

NM_006460 NM_006460
SEQ ID NO 1286 Contig57081_RC SEQ ID NO 2642  SEQ ID NO 1286  Contig57081_RC  SEQ ID NO 2642

NM_006461 NM_006461
SEQ ID NO 1287 Contig57091_RC SEQ ID NO 2643  SEQ ID NO 1287  Contig57091_RC  SEQ ID NO 2643

NM_006469 NM_006469
SEQ ID NO 1288 Contig57138_RC SEQ ID NO 2644  SEQ ID NO 1288  Contig57138_RC  SEQ ID NO 2644

NM_006470 NM_006470
SEQ ID NO 1289 Contig57173_RC SEQ ID NO 2645  SEQ ID NO 1289  Contig57173_RC  SEQ ID NO 2645

NM_006491 NM_006491
SEQ ID NO 1290 Contig57230_RC SEQ ID NO 2646  SEQ ID NO 1290  Contig57230_RC  SEQ ID NO 2646

NM_006495 NM_006495
SEQ ID NO 1291 Contig57258_RC SEQ ID NO 2647  SEQ ID NO 1291  Contig57258_RC  SEQ ID NO 2647

NM_006500 NM_006500
SEQ ID NO 1292 Contig57270_RC SEQ ID NO 2648  SEQ ID NO 1292  Contig57270_RC  SEQ ID NO 2648

NM_006509 NM_006509
SEQ ID NO 1293 Contig57272_RC SEQ ID NO 2649  SEQ ID NO 1293  Contig57272_RC  SEQ ID NO 2649

36 36

NMB_006516  NMB_006516
SEQ ID NO 1294 Contig57344_RC SEQ ID NO 2650  SEQ ID NO 1294  Contig57344_RC  SEQ ID NO 2650

NM_006533 NM_006533
SEQ ID NO 1295 Contig57430_RC SEQ ID NO 2651  SEQ ID NO 1295  Contig57430_RC  SEQ ID NO 2651

NM_006551 NM_006551
SEQ ID NO 1296 Contig57458_RC SEQ ID NO 2652  SEQ ID NO 1296  Contig57458_RC  SEQ ID NO 2652

NM_006556 NM_006556
SEQ ID NO 1297 Contig57493_RC SEQ ID NO 2653  SEQ ID NO 1297  Contig57493_RC  SEQ ID NO 2653

NM_006558 NM_006558
SEQ ID NO 1298 Contig57584_RC SEQ ID NO 2654  SEQ ID NO 1298  Contig57584_RC  SEQ ID NO 2654

NM_006564 NM_006564
SEQ ID NO 1299 Contig57595 SEQ ID NO 2655  SEQ ID NO 1299 Contig57595  SEQ ID NO 2655

NM_006573 NM_006573
SEQ ID NO 1300 Contig57602_RC SEQ ID NO 2656  SEQ ID NO 1300  Contig57602_RC  SEQ ID NO 2656

NM_006607 NM_006607
SEQ ID NO 1301 Contig57609_RC SEQ ID NO 2657  SEQ ID NO 1301  Contig57609_RC  SEQ ID NO 2657

NM_006622 NM_006622
SEQ ID NO 1302 Contig57610 RC SEQ ID NO 2658  SEQ ID NO 1302  Contig57610 RC  SEQ ID NO 2658

NM_006623 NM_006623
SEQ ID NO 1303 Contig57644_RC SEQ ID NO 2659  SEQ ID NO 1303  Contig57644_RC  SEQ ID NO 2659

NM_006636 NM_006636
SEQ ID NO 1304 Contig57725_RC SEQ ID NO 2660  SEQ ID NO 1304  Contig57725_RC  SEQ ID NO 2660

NM_006670 NM_006670
SEQ ID NO 1305 Contig57739_RC SEQ ID NO 2661  SEQ ID NO 1305  Contig57739_RC  SEQ ID NO 2661

NM_006681 NM_006681
SEQ ID NO 1306 Contig57825_RC SEQ ID NO 2662  SEQ ID NO 1306  Contig57825_RC  SEQ ID NO 2662

NM_006682 NM_006682
SEQ ID NO 1307 Contig57864_RC SEQ ID NO 2663  SEQ ID NO 1307  Contig57864_RC  SEQ ID NO 2663

NM_006696 NM_006696
SEQ ID NO 1308 Contig57940_RC SEQ ID NO 2664  SEQ ID NO 1308  Contig57940_RC  SEQ ID NO 2664

NM_006698 NM_006698
SEQ ID NO 1309 Contig58260_RC SEQ ID NO 2665  SEQ ID NO 1309  Contig58260_RC  SEQ ID NO 2665

NM_006705 NM_006705
SEQ ID NO 1310 Contig58272_RC SEQ ID NO 2666  SEQ ID NO 1310  Contig58272_RC  SEQ ID NO 2666

NM_006739 NM_006739
SEQ ID NO 1311 Contig58301_RC SEQ ID NO 2667  SEQ ID NO 1311  Contig58301_RC  SEQ ID NO 2667

NM_006748 NM_006748
SEQ ID NO 1312 Contig58368_RC SEQ ID NO 2668  SEQ ID NO 1312  Contig58368_RC  SEQ ID NO 2668

NM_006759 NM_006759
SEQ ID NO 1313 Contig58471_RC SEQ ID NO 2669  SEQ ID NO 1313  Contig58471_RC  SEQ ID NO 2669

NM_006762 NM_006762
SEQ ID NO 1314 Contig58755_RC SEQ ID NO 2671  SEQ ID NO 1314  Contig58755_RC  SEQ ID NO 2671

NM_006763 NM_006763
SEQ ID NO 1315 Contig59120-RC SEQ ID NO 2672  SEQ ID NO 1315  Contig59120-RC  SEQ ID NO 2672

NM_006769 NM_006769
SEQ ID NO 1316 Contig60157 RC SEQ ID NO 2673  SEQ ID NO 1316  Contig60157 RC  SEQ ID NO 2673

NM_006770 NM_006770
SEQ ID NO 1317 Contig60864_RC SEQ ID NO 2676  SEQ ID NO 1317  Contig60864_RC  SEQ ID NO 2676

NM_006780 NM_006780
SEQ ID NO 1318 Contig61254_RC SEQ ID NO 2677  SEQ ID NO 1318  Contig61254_RC  SEQ ID NO 2677

NM_006787 NM_006787
SEQ ID NO 1319 Contig61815 SEQ ID NO 2678  SEQ ID NO 1319 Contig61815  SEQ ID NO 2678

NM_006806 NM_006806
SEQ ID NO 1320 Contig61975 SEQ ID NO 2679  SEQ ID NO 1320 Contig61975  SEQ ID NO 2679

NMB_006813 NMB_006813
SEQ ID NO 1321 Contig62306 SEQ ID NO 2680  SEQ ID NO 1321 Contig62306  SEQ ID NO 2680

NM_006825 NM_006825
SEQ ID NO 1322 Contig62568_RC SEQ ID NO 2681  SEQ ID NO 1322  Contig62568_RC  SEQ ID NO 2681

NM_006826 NM_006826
SEQ ID NO 1323 Contig62922_RC SEQ ID NO 2682  SEQ ID NO 1323  Contig62922_RC  SEQ ID NO 2682

NM_006829 NM_006829
SEQ ID NO 1324 Contig62964_RC SEQ ID NO 2683  SEQ ID NO 1324  Contig62964_RC  SEQ ID NO 2683

NM_006834 NM_006834
SEQ ID NO 1325 Contig63520_RC SEQ ID NO 2685  SEQ ID NO 1325  Contig63520_RC  SEQ ID NO 2685

NM_006835 NM_006835
SEQ ID NO 1326 Contig63649_RC SEQ ID NO 2686  SEQ ID NO 1326  Contig63649_RC  SEQ ID NO 2686

NM_006840 NM_006840
SEQ ID NO 1327 Contig63683_RC SEQ ID NO 2687  SEQ ID NO 1327  Contig63683_RC  SEQ ID NO 2687

NM_006845 NM_006845
SEQ ID NO 1328 Contig63748_RC SEQ ID NO 2688  SEQ ID NO 1328  Contig63748_RC  SEQ ID NO 2688

NM_006847 NM_006847
SEQ ID NO 1329 Contig64502 SEQ ID NO 2689  SEQ ID NO 1329 Contig64502  SEQ ID NO 2689

NM_006851 NM_006851
SEQ ID NO 1330 Contig64688 SEQ ID NO 2690  SEQ ID NO 1330 Contig64688  SEQ ID NO 2690

NM_006855 NM_006855
SEQ ID NO 1331 Contig64775_RC SEQ ID NO 2691  SEQ ID NO 1331  Contig64775_RC  SEQ ID NO 2691

NM_006864 NM_006864
SEQ ID NO 1332 Contig65227 SEQ ID NO 2692  SEQ ID NO 1332 Contig65227  SEQ ID NO 2692

NM_006868 NM_006868
SEQ ID NO 1333 Contig65663 SEQ ID NO 2693  SEQ ID NO 1333 Contig65663  SEQ ID NO 2693

NM_006875 NM_006875
SEQ ID NO 1334 Contig65785_RC SEQ ID NO 2694  SEQ ID NO 1334  Contig65785_RC  SEQ ID NO 2694

NM_006889 NM_006889
SEQ ID NO 1336 Contig65900 SEQ ID NO 2695  SEQ ID NO 1336 Contig65900  SEQ ID NO 2695

NM_006892 NM_006892
SEQ ID NO 1337 Contig66219 RC SEQ ID NO 2696  SEQ ID NO 1337  Contig66219 RC  SEQ ID NO 2696

NMB_006912 NMB_006912
SEQ ID NO 1338 Contig66705_RC SEQ ID NO 2697  SEQ ID NO 1338  Contig66705_RC  SEQ ID NO 2697

NM_006931 NM_006931
SEQ ID NO 1341 Contig66759_RC SEQ ID NO 2698  SEQ ID NO 1341  Contig66759_RC  SEQ ID NO 2698

NM_006941 NM_006941
SEQ ID NO 1342 Contig67182_RC SEQ ID NO 2699  SEQ ID NO 1342  Contig67182_RC  SEQ ID NO 2699

NM_006943 NM_006943
SEQ ID NO 1343  SEQ ID NO 1343

37 37

Tabla 2. 550 marcadores de categoría de ER preferidos sacados de la Tabla 1 Table 2. 550 preferred ER category markers taken from Table 1

Identificador Identifier
correlación Nombre Descripción  correlation  Name Description

NM_002051 NM_002051
0.763977 GATA3 Proteína 3 de enlace con GATA 0.763977 CAT3  Link protein 3 with GATA

AB020689 AB020689
0.753592 KIAA0882 Proteína KIAA0882 0.753592 KIAA0882  KIAA0882 protein

NM_001218 NM_001218
0.753225 CA12 Anhidrasa carbónica XII 0.753225 CA12  Carbonic Anhydrase XII

NM_000125 NM_000125
0.748421 ESR1 Receptor de estrógeno 1 0.748421 ESR1  Estrogen receptor 1

Contig56678_RCContig56678_RC
0.747816 ESTs  0.747816 ESTs

NM_004496 NM_004496
0.729116 HNF3A factor nuclear 3 de hepatocitos, alfa 0.729116 HNF3A  hepatocyte nuclear factor 3, alpha

NM_017732 NM_017732
0.713398 FLJ20262 Proteína hipotética FLJ20262 0.713398 FLJ20262  Hypothetical protein FLJ20262

NM_006806 NM_006806
-0.712678 BTG3 Familia BTG, miembro 3  -0.712678  BTG3  BTG family, member 3

Contig56390_RCContig56390_RC
0.705940 ESTs  0.705940 ESTs

Contig37571_RCContig37571_RC
0.704468 ESTs  0.704468 ESTs

NM_004559 NM_004559
-0.701617 NSEP1 Proteína 1 de enlace con elemento sensible a la nucleasa  -0.701617 NSEP1  1 binding protein with nuclease sensitive element

Contig50153_RCContig50153_RC
-0.696652 ESTs, ligeramente parecidos al precursor de proteína de enlace proteoglicano [H.sapiens]  -0.696652  ESTs, slightly similar to the proteoglycan binding protein precursor [H.sapiens]

NMB_012155 NMB_012155
0.694332 EMAP-2 Proteína asociada a microtubulo como EMAP equinodermo 0.694332 EMAP-2  Microtubule associated protein such as EMAP echinoderm

Contig237_RC  Contig237_RC
0.687485 FLJ21127 Proteína hipotética FLJ21127 0.687485 FLJ21127  Hypothetical protein FLJ21127

NMB_01 9063 NMB_01 9063
-0.686064 C2ORF2 Marco de lectura abierta 2 del cromosoma 2  -0.686064  C2ORF2  Chromosome 2 open reading frame 2

NMB_012219 NMB_012219
-0.680900 MRAS Homólogo de oncógeno RAS de músculo  -0.680900 MRAS  Muscle RAS oncogene homolog

NM_001982 NM_001982
0.676114 ERBB3 Homólogo 3 de oncógeno viral de leucemia eritoblástica aviar v-erb-b 2 0.676114 ERBB3  Viral erythroblastic leukemia viral homolog 3 3 homologue v-erb-b 2

NM_006623 NM_006623
-0.675090 PHGDH Fosfogliceratodehidrogenasa  -0.675090  PHGDH  Phosphoglycerate dehydrogenase

NMB_000636 NMB_000636
-0.674282 SOD2 Superóxido dismutasa 2, mitocondrial  -0.674282 SOD2  Superoxide dismutase 2, mitochondrial

NMB_006017 NMB_006017
-0.670353 PROML1 Prominina 1 similar a (ratón)  -0.670353 PROML1  Prominin 1 similar to (mouse)

Contig57940_RCContig57940_RC
0.667915 MAP-1 Proteína MAP-1  0.667915 MAP-1  MAP-1 protein

Contig46934_RCContig46934_RC
0.666908 ESTs, ligeramente parecidos a gradiente 2 Anterior JE0350 [H.sapiens]  0.666908  ESTs, slightly similar to gradient 2 Previous JE0350 [H.sapiens]

NM_005080 NM_005080
0.665772 XBP1 Proteína 1 de enlace con X-caja 0.665772 XBP1  Link protein 1 with X-box

NM_014246 NM_014246
0.665725 CELSR1 Cadherina, receptor 1 de tipo G de siete pases EGF LAG, homólogo de flamingo (Drosophila) 0.665725 CELSR1  Cadherin, seven-pass G-type receptor 1, EGF LAG, flamingo counterpart (Drosophila)

Contig54667_RCContig54667_RC
-0.663727 Secuencia de ADN humano del clon RP1-187J11 en cromosoma 6q11.1-22.33. Contiene el gen para una nueva proteína parecida a las proteínas previstas S. pombe y S. cerevisiae, el gen para una nueva proteína parecida a los inhibidores C de quinasa proteínica, el extremo de 3’ del gen para una nueva proteínal parecida a Drosophila L82 y proteínas de gusanos previstas, ESTs, STSs, GSSs y dos islas CpG putativas  -0.663727 Human DNA sequence of clone RP1-187J11 on chromosome 6q11.1-22.33. It contains the gene for a new protein similar to the expected proteins S. pombe and S. cerevisiae, the gene for a new protein similar to protein kinase C inhibitors, the 3 'end of the gene for a new protein similar to Drosophila L82 and expected worm proteins, ESTs, STSs, GSSs and two putative CpG islands

Contig51994_RCContig51994_RC
0.663715 ESTs, ligeramente parecido a B0416.1 [C.elegans]  0.663715  ESTs, slightly similar to B0416.1 [C.elegans]

NM_016337 NM_016337
0.663006 RNB6 RNB6 0.663006 RNB6 RNB6

NMB_015640 NMB_015640
-0.660165 PAI-RBP1 Proteína de enlace con PAI-1 ARNm  -0.660165 PAI-RBP1  PAI-1 mRNA binding protein

X07834 X07834
-0.657798 SOD2 Superóxido dismutasa 2, mitocondrial  -0.657798 SOD2  Superoxide dismutase 2, mitochondrial

NMB_012319 NMB_012319
0.657666 LIV-1 Proteína LIV-1, regulada por estrógeno 0.657666 LIV-1  Estrogen-regulated LIV-1 protein

Contig41887_RCContig41887_RC
0.656042 ESTs, ligeramente parecidos al homólogo de la proteína de la membrana del corpúsculo de zimógeno de rata [H.sapiens]  0.656042  ESTs, slightly similar to the rat zymogen corpuscle membrane protein homolog [H.sapiens]

NM_003462 NM_003462
0.655349 P28 dineina, axonemal, polipéptido intermedio ligero 0.655349 P28  dynein, axonemal, light intermediate polypeptide

38 38

Contig58301_RCContig58301_RC
0.654268 ARNm de Homo sapiens; ADNc DKFZp667D095 (del clon DKFZp667D095)  0.654268  MRNA from Homo sapiens; DKFZp667D095 cDNA (from clone DKFZp667D095)

NM_005375  NM_005375
0.653783 MYB Homólogo de oncógeno viral de mieloblastosis aviar v-myb 0.653783  MY B  Viral myeloblastosis avian myeloblastosis homolog v-myb

NMB_017447 NMB_017447
-0.652445 YG81 Proteína hipotética LOC54149  -0.652445 YG81  Hypothetical protein LOC54149

Contig924_RC  Contig924_RC
-0.650658 ESTs  -0.650658 ESTs

M55914 M55914
-0.650181 MPB1 Proteína 1 de enlace con el promotor MYC  -0.650181 MPB1  Protein 1 binding with the MYC promoter

NM_006004 NM_006004
-0.649819 UQCRH Proteína bisagra con ubiquinol-citocromo c reductasa  -0.649819  UQCRH  Protein hinge with ubiquinol-cytochrome c reductase

NM_000964 NM_000964
0.649072 RARA Receptor de ácido retinoico, alfa 0.649072 WEIRD  Retinoic acid receptor, alpha

NM_013301 NM_013301
0.647583 HSU79303 Proteína prevista por el clon 23882 0.647583 HSU79303  Protein provided by clone 23882

AB023211 AB023211
-0.647403 PDI2 Peptidil arginina deiminasa, tipo II  -0.647403 POI2 Peptidyl arginine deiminase, type II

NM_016629 NM_016629
-0.646412 LOC51323 Proteína hipotética  -0.646412  LOC51323  Hypothetical protein

K02403 K02403
0.645532 C4A Componente de complemento 4A 0.645532 C4A  4A complement component

NM_016405 NM_016405
-0.642201 HSU93243 Homólogo de Ubc6p  -0.642201 HSU93243  Ubc6p counterpart

Contig46597_RCContig46597_RC
0.641733 ESTs  0.641733 ESTs

Contig55377_RCContig55377_RC
0.640310 ESTs  0.640310 ESTs

NM_001207 NM_001207
0.637800 BTF3 Factor 3 de transcripción básica 0.637800 BTF3  Basic transcription factor 3

NM_018166 NM_018166
0.636422 FLJ10647 Proteína hipotética FLJ10647 0.636422 FLJ10647  Hypothetical protein FLJ10647

AL110202 AL110202
-0.635398 ARNm de Homo sapiens; ADNc DKFZp586I2022 (del clon DKFZp586I2022)  -0.635398  MRNA from Homo sapiens; DKFZp586I2022 cDNA (from clone DKFZp586I2022)

AL133105  AL133105
-0.635201 DKFZp434F 2322 Proteína hipotética DKFZp434F2322  -0.635201  DKFZp434F 2322  Hypothetical protein DKFZp434F2322

NMB_016839 NMB_016839
-0.635169 RBMS1 Motivo de enlace con ARN, proteína 1 interactuante monocatenaria  -0.635169 RBMS1  Reason for binding with RNA, single-chain interacting protein 1

Contig53130 Contig53130
-0.634812 ESTs, ligeramente parecidos al canal controlado por nucleótido cíclico activado por hiperpolarización hHCN2 [H.sapiens]  -0.634812  ESTs, slightly similar to the hHCN2 hyperpolarization-activated cyclic nucleotide controlled channel [H.sapiens]

NM_018014 NM_018014
-0.634460 BCL11A CLUlinfoma 11A de célula B (proteína de dedo de cinc)  -0.634460 BCL11A  CLUlinfoma 11A B cell (zinc finger protein)

NM_006769 NM_006769
-0.632197 LMO4 Dominio LIM solo 4  -0.632197 LMO4 LIM domain only 4

U92544 U92544
0.631170 JCL-1 Proteína asociada al carcinoma hepatocelular; gen 1 asociado al cáncer de mama 0.631170 JCL-1  Protein associated with hepatocellular carcinoma; gene 1 associated with breast cancer

Contig49233_RCContig49233_RC
-0.631047 Homo sapiens, parecido al factor 2 de enlace con receptor nuclear, clon IMAGE:3463191, ARNm, cds parcial  -0.631047  Homo sapiens, similar to nuclear receptor binding factor 2, clone IMAGE: 3463191, mRNA, partial cds

AL133033 AL133033
0.629690 KIAA1025 KIAA1025 protein 0.629690 KIAA1025  KIAA1025 protein

AL049265 AL049265
0.629414 ARN de Homo sapiens; ADNc DKFZp564F053 (del clon DKFZp564F053) 0.629414  RNA from Homo sapiens; DKFZp564F053 cDNA (from clone DKFZp564F053)

NM_018728  NM_018728
0.627989 MYO5C Miosina 5C 0.627989  MYO5C Myosin 5C

NM_004780 NM_004780
0.627856 TCEAL1 Factor A de alargamiento de transcripción de tipo 1(SII) 0.627856 TCEAL1  Type 1 transcription elongation factor A (SII)

Contig760_RC  Contig760_RC
0.627132 ESTs 0.627132 ESTs

Contig399_RC  Contig399_RC
0.626543 FLJ12538 Proteína hipotética FLJ12538 parecida a la proteína relacionada con ras RAB17 0.626543 FLJ12538  Hypothetical protein FLJ12538 similar to ras-related protein RAB17

M83822 M83822
0.625092 CDC4L Ciclo de división de célula de tipo 4 0.625092 CDC4L  Type 4 cell division cycle

NM_001255 NM_001255
-0.625089 CDC20 CDC20 (ciclo de división de célula 20, S. cerevisiae, homólogo)  -0.625089 CDC20 CDC20 (cell division cycle 20, S. cerevisiae, homologue)

NM_006739  NM_006739
-0.624903 MCM5 Deficiente mantenimiento de minicromosomas (S. cerevisiae) 5 (ciclo de división celular 46)  -0.624903 MCM5  Poor maintenance of minichromosomes (S. cerevisiae) 5 (cell division cycle 46)

NM_002888 NM_002888
-0.624664 RARRES1 Respondedor 1 a receptor de ácido retinoico (inducido por tazaroteno)  -0.624664 RARRES1  Respondent 1 to retinoic acid receptor (induced by tazarotene)

39 39

NM_003197  NM_003197
0.623850 TCEB1L Factor B de alargamiento de transcripción (SIII), afín a polipéptido 1 0.623850 TCEB1L  Transcription elongation factor B (SIII), related to polypeptide 1

NM_006787 NM_006787
0.623625 JCL-1 Proteína asociada al carcinoma hepatocelular; gen 1 asociado al cáncer de mama 0.623625 JCL-1  Protein associated with hepatocellular carcinoma; gene 1 associated with breast cancer

Contig49342_RCContig49342_RC
0.622179 ESTs  0.622179 ESTs

AL133619 AL133619
0.621719 ARNm de Homo sapiens: ADNc DKFZp434E2321 (del clon DKFZp434E2321); cds parcial 0.621719  Homo sapiens mRNA: DKFZp434E2321 cDNA (from clone DKFZp434E2321); partial cds

AL133622 AL133622
0.621577 KIAA0876 Proteína KIAA0876 0.621577 KIAA0876  KIAA0876 protein

NM_004648 NM_004648
-0.621532 PTPNS1 Tirosina fosfatasa proteínica, sustrato 1 de tipo no- receptor  -0.621532 PTPNS1  Tyrosine protein phosphatase, substrate 1 of non-receptor type

NM_001793 NM_001793
-0.621530 CDH3 Cadherina 3, tipo 1, P-caderina (placentaria)  -0.621530 CDH3  Cadherin 3, type 1, P-caderina (placental)

NM_003217 NM_003217
0.620915 TEGT Trascripción mejorada de genes de testículos (inhibidor 1 de BAX) 0.620915 TEGT  Enhanced transcription of testis genes (BAX inhibitor 1)

NM_001551 NM_001551
0.620832 IGBP1 Proteína 1 asociada a la inmunoglobulina (CD79A) 0.620832 IGBP1  Protein 1 associated with immunoglobulin (CD79A)

NM_002539  NM_002539
-0.620683 ODC1 Ornitina decarboxilasa 1  -0.620683 ODC1  Ornithine Decarboxylase 1

Contig55997_RC Contig55997_RC
-0.619932 ESTs  -0.619932 ESTs

NM_000633 NM_000633
0.619547 BCL2 CLL/linfoma 2 de célula B 0.619547 BCL2  CLL / B cell lymphoma 2

NMB_016267 NMB_016267
-0.619096 TONDU TONDU  -0.619096  TONDU  TONDU

Contig3659_RC  Contig3659_RC
0.618048 FLJ21174 Proteína hipotética FLJ21174 0.618048 FLJ21174  Hypothetical protein FLJ21174

NM_000191 NM_000191
0.617250 HMGCL 3-hidroximetil-3-metilglutaril-Coenzima A liasa (hydroximetilglutaricaciduria) 0.617250  HMGCL  3-hydroxymethyl-3-methylglutaryl-Coenzyme A lyase (hydroxymethylglutaricaciduria)

NM_001267 NM_001267
0.616890 CHAD Condroadherina 0.616890 CHAD  Condroadherina

Contig39090_RC Contig39090_RC
0.616385 ESTs  0.616385 ESTs

AF055270 AF055270
-0.616268 HSSG1 Proteína 1 suprimida de choque de calor  -0.616268 HSSG1  Protein 1 suppressed from heat shock

Contig43054 Contig43054
0.616015 FLJ21603 Proteína hipotética FLJ21603 0.616015 FLJ21603  Hypothetical protein FLJ21603

NM_001428 NM_001428
-0.615855 ENO1 Enolasa 1, (alfa)  -0.615855 ENO1 Enolase 1, (alpha)

Contig51369_RC Contig51369_RC
0.615466 ESTs  0.615466 ESTs

Contig36647_RC Contig36647_RC
0.615310 GFRA1 Alfa 1 de receptor de familia GDNF  0.615310  GFRA1  GDNF Family Receiver Alpha 1

NM_014096 NM_014096
-0.614832 PRO1659 Proteína PRO1659  -0.614832  PRO1659  PRO1659 protein

NM_015937 NM_015937
0.614735 LOC51604 Proteína CGI-06 0.614735  LOC51604  CGI-06 protein

Contig49790_RC Contig49790_RC
-0.614463 ESTs  -0.614463 ESTs

NM_006759 NM_006759
-0.614279 UGP2 UDP-glucosa pirofosforilasa 2  -0.614279 UGP2  UDP-glucose pyrophosphorylase 2

Contig53598_RC Contig53598_RC
-0.613787 FLJ11413 Proteína hipotética FLJ11413  -0.613787 FLJ11413  Hypothetical protein FLJ11413

AF113132 AF113132
-0.613561 PSA Fosfoserina aminotransferasa  -0.613561 PSA  Phosphoserine aminotransferase

AK000004 AK000004
0.613001 ARNm de Homo sapiens para proteína FLJ00004, cds parcial 0.613001  Homo sapiens mRNA for FLJ00004 protein, partial cds

Contig52543_RC  Contig52543_RC
0.612960 ADNc de Homo sapiens, fis FLJ13945, clon Y79AA1000969 0.612960  CDNA from Homo sapiens, fis FLJ13945, clone Y79AA1000969

AB032966 AB032966
-0.611917 KIAA1140 Proteína KIAA1140  -0.611917 KIAA1140  KIAA1140 protein

AL080192AL080192
0.611544 ADNc de Homo sapiens; FLJ21238 fis, clon COL01115  0.611544  CDNA from Homo sapiens; FLJ21238 fis, clone COL01115

X56807  X56807
-0.610654 DSC2 Desmocolina 2  -0.610654 DSC2 Desmocolin 2

Contig30390_RC Contig30390_RC
0.609614 ESTs  0.609614 ESTs

AL137362 AL137362
0.609121 FLJ22237 Proteína hipotética FLJ22237 0.609121 FLJ22237  Hypothetical protein FLJ22237

NM_014211 NM_014211
-0.608585 GABRP Ácido gamma-aminobutírico acid (GABA) receptor A, pi  -0.608585 GABRP  Gamma-aminobutyric acid (GABA) receptor A, pi

NM_006696 NM_006696
0.608474 SMAP Proteína coactivadora del receptor de hormonas de la tiroides 0.608474 SMAP  Thyroid hormone receptor coactivating protein

Contig45588_RCContig45588_RC
-0.608273 ADN de Homo sapiens; FLJ22610 fis, clon HSI04930  -0.608273  Homo sapiens DNA; FLJ22610 fis, clone HSI04930

NM_003358 NM_003358
0.608244 UGCG UDP-glucosa ceramida glucosiltransferasa 0.608244  UGCG  UDP-glucose ceramide glucosyltransferase

NMB_006153 NMB_006153
-0.608129 NCK1 Proteína 1 del adaptador de NCK  -0.608129 NCK1  NCK adapter protein 1

40 40

NMB_001453  NMB_001453
-0.606939 FOXC1 Forkhead box C1  -0.606939  FOXC1  Forkhead box C1

Contig54666_RCContig54666_RC
0.606475 oy65e02.x1 NCl_CGAP_CLL1 ADNC de Homo sapiens clon IMAGE: 1670714 3’ parecido a TR:Q29168 PROTEINA DESCONOCIDA Q29168; secuencia de ARNm.  0.606475  oy65e02.x1 NCl_CGAP_CLL1 cDNA from Homo sapiens clone IMAGE: 1670714 3 ’similar to TR: Q29168 UNKNOWN PROTEIN Q29168; mRNA sequence

NM_005945 NM_005945
-0.605945 MPB1 Proteína 1 de enlace con promotor MYC  -0.605945 MPB1  MYC promoter binding protein 1

Contig55725_RCContig55725_RC
-0.605841 ESTs, ligeramente parecido a T50635 proteína hipotética DKFZp762L0311.1 [H.sapiens]  -0.605841  ESTs, slightly similar to T50635 hypothetical protein DKFZp762L0311.1 [H.sapiens]

Contig37015_RC Contig37015_RC
-0.605780 ESTs, ligeramente parecidos a UAS3_PROTEÍNA HUMANA UBASH3A PROTEIN [H.sapiens]  -0.605780  ESTs, slightly similar to UAS3_PROTEÍNA HUMANA UBASH3A PROTEIN [H.sapiens]

AL157480 AL157480
-0.604362 SH3BP1 Proteína 1 de enlace con dominio SH3  -0.604362 SH3BP1  Link protein 1 with SH3 domain

NM_005325 NM_005325
-0.604310 H1F1 Familia de histona H1, miembro 1  -0.604310 H1F1  Histone H1 family, member 1

NM_001446 NM_001446
-0.604061 FABP7 Proteína 7 de enlace con el ácido graso, cerebro  -0.604061 FABP7  Protein 7 binding with fatty acid, brain

Contig263_RC  Contig263_RC
0.603318 ADNc de Homo sapiens cDNA: fis FLJ23000, clon LNG00194 0.603318  CDNA from Homo sapiens cDNA: fis FLJ23000, clone LNG00194

Contig8347_RC  Contig8347_RC
-0.603311 ESTs  -0.603311 ESTs

NM_002988 NM_002988
-0.603279 SCYA18 Pequeña subfamilia A inducible por citoquina (Cys- Cys), miembro 18, pulmonar y regulada por activación -0.603279 SCYA18  Small subfamily A induced by cytokine (Cys-Cys), member 18, pulmonary and regulated by activation

AF111849 AF111849
0.603157 HELO1 Enzima 2 de alargamiento de ácido graso poliinsaturado de cadena larga homólogo de levadura 0.603157 HELO1  Enzyme 2 elongation of long chain polyunsaturated fatty acid yeast counterpart

NM_014700  NM_014700
0.603042 KIAA0665 Producto del gen KIAA0665 0.603042 KIAA0665  Product of the KIAA0665 gene

NM_001814 NM_001814
-0.602988 CTSC Catepsia C  -0.602988 CTSC Cathepsis C

AF116682 AF116682
-0.602350 PRO2013 Proteína hipotética PRO2013  -0.602350  PRO2013  Hypothetical PRO2013 protein

AB037836 AB037836
0.602024 KIAA1415 Proteína KIAA1415 0.602024 KIAA1415  KIAA1415 protein

AB002301 AB002301
0.602005 KIAA0303 Proteína KIAA0303 0.602005 KIAA0303  KIAA0303 protein

NM_002996 NM_002996
-0.601841 SCYD1 Pequeña subfamilia D (Cys-X3-Cys), miembro 1, (fractalina, neurotactina)  -0.601841  SCYD1  Small subfamily D (Cys-X3-Cys), member 1, (fractalin, neurotactin)

NM_018410 NM_018410
-0.601765 KFZp762E1312 Proteína hipotética DKFZp762E1312  -0.601765  KFZp762E1312  Hypothetical protein DKFZp762E1312

Contig49581_RCContig49581_RC
-0.601571 KIAA1350 Proteína KIAA1350  -0.601571 KIAA1350  KIAA1350 protein

NM_003088 NM_003088
-0.601458 SNL Gaseado (afín a Drosophila) (tipo de homólogo de fascina de erizo de mar)  -0.601458 SNL  Gaseous (similar to Drosophila) (homologue type of sea urchin fascina)

Contig47045_RCContig47045_RC
0.601088 ESTs, ligeramente parecido a DP1 PROTEÍNA HUMANA 1 DE POLIPOSIS DE LOCUS [H.sapiens]  0.601088  ESTs, slightly similar to DP1 HUMAN PROTEIN 1 OF LOCUS POLYPOSIS [H.sapiens]

NM_001806 NM_001806
-0.600954 CEBPG Proteína (C/EBP) de enlace con CCAAT/potenciador, gamma  -0.600954 CEBPG  Protein (C / EBP) binding with CCAAT / enhancer, gamma

NM_004374 NM_004374
0.600766 COX6C Subunidad Vlc de citocromo c oxidasa 0.600766 COX6C Vlc cytochrome c oxidase subunit

Contig52641_RC Contig52641_RC
0.600132 MOUSE ESTs, ligeramente parecidos a AUTOANTIGENO B CENTRÓMERO CENB PRINCIPAL [M.musculus]  0.600132 MOUSE  ESTs, slightly similar to AUTOANTIGEN B CENTRÓMERO CENB MAIN [M.musculus]

NM_000100 NM_000100
-0.600127 CSTB Cistatina B (estefina B)  -0.600127 CSTB Cystatin B (Stephine B)

NM_002250 NM_002250
-0.600004 KCNN4 Intermediario de potasio/pequeño canal de conductancia activado por calcio, subfamilia N, miembro 4  -0.600004 KCNN4  Potassium intermediate / small calcium activated conductance channel, subfamily N, member 4

AB033035 AB033035
-0.599423 KIAA1209 Proteína KIAA1209 -0.599423  KIAA1209  KIAA1209 protein

Contig53968_RCContig53968_RC
0.599077 ESTs  0.599077 ESTs

NM_002300 NM_002300
-0.598246 LDHB Lactato dehidrogenasa B  -0.598246 LDHB Dehydrogenase B lactate

NM_000507 NM_000507
0.598110 FBP1 Fructosa-1,6-bisfosfatasa 1 0.598110 FBP1  Fructose-1,6-bisphosphatase 1

NM_002053 NM_002053
-0.597756 GBP1 Proteína 1 de enlace con guanilato, inducible por interferón, 67kD  -0.597756 GBP1  Guanylate-binding protein 1, interferon-inducible, 67kD

AB007883 AB007883
0.597043 KIAA0423 Proteína KIAA0423 0.597043 KIAA0423  KIAA0423 protein

41 41

NM_004900  NM_004900
-0.597010 DJ742C19.2 Forbolina (parecida a la proteína editora de ARNm apolipoproteína B)  -0.597010 DJ742C19.2  Forboline (similar to apolipoprotein B mRNA editor protein)

NM_004480 NM_004480
0.596321 FUT8 Fucosiltransferasa 8 (alfa (1,6) fucosiltransferasa) 0.596321 FUT8  Fucosyltransferase 8 (alpha (1,6) fucosyltransferase)

Contig35896_RCContig35896_RC
0.596281 ESTs  0.596281 ESTs

NM_020974 NM_020974
0.595173 CEGP1 Proteína CEGP1 0.595173 CEGP1  CEGP1 protein

NM_000662 NM_000662
0.595114 NAT1 N-acetiltransferasa 1 (arilamina N-acetiltransferasa) 0.595114 NAT1  N-acetyltransferase 1 (arylamine N-acetyltransferase)

NMB_006113 NMB_006113
0.595017 VAV3 oncógeno vav 3 0.595017 VAV3 oncogenic vav 3

NM_014865 NM_014865
-0.594928 KIAA0159 Proteína 1 asociada a SMC de condensación de cromosoma  -0.594928 KIAA0159  Protein 1 associated with SMC chromosome condensation

Contig55538_RCContig55538_RC
-0.594573 BA395L14.2 Proteína hipotética bA395L14.2  -0.594573 BA395L14.2  Hypothetical protein bA395L14.2

NM_016056 NM_016056
0.594084 LOC51643 Proteina CGI-119 0.594084  LOC51643  CGI-119 protein

NM_003579 NM_003579
-0.594063 RAD54L RAD54 (afín a S.cerevisiae)  -0.594063 RAD54L  RAD54 (related to S.cerevisiae)

NM_014214 NM_014214
-0.593860 IMPA2 Inositol(mio)-1 (o 4)- monofosfatasa 2  -0.593860 IMPA2  Inositol (mine) -1 (or 4) - monophosphatase 2

U79293 U79293
0.593793 Secuencia de ARNm del clon humano 23948 0.593793  MRNA sequence of human clone 23948

NM_005557 NM_005557
-0.593746 KRT16 queratina 16 (queratoderma palmoplantar focla no epidermolítico)  -0.593746 KRT16  keratin 16 (palmoplantar keratoderma non epidermolytic focla)

NM_002444 NM_002444
-0.592405 MSN Moesina  -0.592405 MSN Moesina

NM_003681 NM_003681
-0.592155 PDXK piridoxal (pyridoxina, vitamina B6) quinasa  -0.592155 PDXK  pyridoxal (pyridoxine, vitamin B6) kinase

NM_006372 NM_006372
-0.591711 NSAP1 Proteína 1 asociada a NS1  -0.591711 NSAP1  Protein 1 associated with NS1

NM_005218 NM_005218
-0.591192 DEFB1 Defensina, beta 1  -0.591192 DEFB1  Defensin, beta 1

NM_004642 NM_004642
-0.591081 DOC1 Borrado en cáncer oral (ratón, homólogo) 1  -0.591081 DOC1  Deleted in oral cancer (mouse, homologue) 1

AL133074 AL133074
0.590359 ADNC de Homo sapiens; fis FLJ22139, clon HEP20959 0.590359  Homo sapiens cDNA; fis FLJ22139, clone HEP20959

M73547 M73547
0.590317 D5S346 Segmento de ADN, sonda de una sola copia LNS- CAI/LNS-CAII (borrada en poliposis) 0.590317 D5S346  DNA segment, single copy probe LNS-CAI / LNS-CAII (deleted in polyposis)

Contig65663 Contig65663
0.590312 ESTs 0.590312 ESTs

AL035297 AL035297
-0.589728 Gen de H.sapiens de PAC 747L4  -0.589728  H.sapiens gene from PAC 747L4

Contig35629_RCContig35629_RC
0.589383 ESTs  0.589383 ESTs

NM_019027 NM_019027
0.588862 FLJ20273 Proteína hipotética 0.588862 FLJ20273  Hypothetical protein

NM_012425 NM_012425
-0.588804 Proteína 1 del supresor del Ras de Homo sapiens (RSU1), ARNm  -0.588804  Homo sapiens Ras suppressor protein 1 (RSU1), mRNA

NM_020179  NM_020179
-0.588326 FN5 Proteína FN5  -0.588326 FN5  FN5 protein

AF090913 AF090913
-0.587275 TMSB10 Timosina, beta 10  -0.587275 TMSB10  Thymosin, beta 10

NM_004176 NM_004176
0.587190 SREBF1 Factor 1 de transcripción de enlace con el elemento regulatorio de esterol 0.587190 SREBF1  Transcription factor 1 binding with the sterol regulatory element

NM_016121 NM_016121
0.586941 LOC51133 Antígeno NY-REN-45 0.586941  LOC51133  NY-REN-45 antigen

NM_014773 NM_014773
0.586871 KIAA0141 Producto del gen KIAA0141 0.586871 KIAA0141  Product of the KIAA0141 gene

NM_019000 NM_019000
0.586677 FLJ20152 Proteína hipotética 0.586677 FLJ20152  Hypothetical protein

NM_016243 NM_016243
0.585942 LOC51706 Citocromo b5 reductasa 1 (B5R.1) 0.585942  LOC51706  Cytochrome b5 reductase 1 (B5R.1)

NM_014274 NM_014274
-0.585815 ABP/ZF Proteína de enlace Alu con dominio de dedo de cinc  -0.585815 ABP / ZF  Alu binding protein with zinc finger domain

NM_018379  NM_018379
0.585497 FLJ11280 Proteína hipotética FLJ11280 0.585497 FLJ11280  Hypothetical protein FLJ11280

AL157431 AL157431
-0.585077 DKFZp762A227 Proteína hipotética DKFZp762A227 -0.585077 DKFZp762A227 Hypothetical protein DKFZp762A227

D38521 D38521
-0.584684 KIAA0077 Proteína KIAA0077  -0.584684 KIAA0077  KIAA0077 protein

NM_002570 NM_002570
0.584272 PACE4 Sistema 4 apareado de exfoliado de aminoácido básico 0.584272 PACE4  Basic Amino Acid Exfoliate System 4

42 42

NM_001809  NM_001809
-0.584252 CENPA Proteína centrómera A (17kD)  -0.584252 CENPA Centromere protein A (17kD)

NM_003318  NM_003318
-0.583556 TTK Proteína quinasa TTK  -0.583556 TTK  TTK protein kinase

NM_014325 NM_014325
-0.583555 CORO1C Coronina, proteína de enlace con actina, 1C  -0.583555  CHOIR1C  Coronin, actin binding protein, 1C

NM_005667 NM_005667
0.583376 ZFP103 Proteína homóloga de cinc homóloga de Zfp103 en ratón 0.583376 ZFP103  Homologous zinc homologous protein of Zfp103 in mice

NM_004354 NM_004354
0.582420 CCNG2 Ciclina G2 0.582420  CCNG2 Cyclin G2

NM_003670 NM_003670
0.582235 BHLHB2 Contenido de helix básico-bucle-dominio de helix domain, class B, 2 0.582235 BHLHB2  Basic helix content-loop-domain of helix domain, class B, 2

NM_001673 NM_001673
-0.581902 ASNS Asparagina sintetasa  -0.581902 ASNS Asparagine synthetase

NM_001333 NM_001333
-0.581402 CTSL2 Catepsina L2  -0.581402 CTSL2 Cathepsin L2

Contig54295_RCContig54295_RC
0.581256 ESTs  0.581256 ESTs

Contig33998_RCContig33998_RC
0.581018 ESTs  0.581018 ESTs

NM_006002 NM_006002
-0.580592 UCHL3 Ubiquitina carboiyl-terminal esterasa L3 (ubiquitin tiolesterasa)  -0.580592 UCHL3  Ubiquitin carboiyl-terminal esterase L3 (ubiquitin thiolesterase)

NM_015392 NM_015392
0.580568 NPDC1 Proliferación, dfferenciación y control neural, 1 0.580568 NPDC1  Proliferation, differentiation and neural control, 1

NM_004866 NM_004866
0.580138 SCAMP1 Proteína 1 de la membrana portadora secretora 1 0.580138 SCAMP1  Protein 1 of the secretory carrier membrane 1

Contig50391_RCContig50391_RC
0.580071 ESTs  0.580071 ESTs

NM_000592 NM_000592
0.579965 C4B Componente de complemento 4B 0.579965 C4B  4B complement component

Contig50802_RCContig50802_RC
0.579881 ESTs  0.579881 ESTs

Contig41635_RCContig41635_RC
-0.579468 ESTs  -0.579468 ESTs

NM_006845 NM_006845
-0.579339 KNSL6 Tipo 6 de quinesina (quinesina asociada a centrómero mitótico)  -0.579339 KNSL6  Type 6 kinesin (mitotic centromere-associated kinesin)

NM_003720 NM_003720
-0.579296 DSCR2 Gen 2 de la región crítica del síndrome de Down  -0.579296 DSCR2  Gen 2 of the critical region of Down syndrome

NM_000060  NM_000060
0.578967 BTD Biotinidasa 0.578967 BTD Biotinidase

AL050388 AL050388
-0.578736 ARNm de Homo sapiens; ADNc DKFZp564M2422 (de clon DKFZp564M2422); cds parcial  -0.578736  MRNA from Homo sapiens; DKFZp564M2422 cDNA (from clone DKFZp564M2422); partial cds

NM_003772 NM_003772
-0.578395 JRKL Homólogo afín a jerky (ratón)  -0.578395 JRKL  Jerky-related counterpart (mouse)

NM_014398 NM_014398
-0.578388 TSC403 Parecido a glicoproteína de membrana asociada a lisosoma  -0.578388 TSC403  Lysosome-associated membrane glycoprotein-like

NM_001280 NM_001280
0.578213 CIRBP Proteína de enlace con ARN inducible por frío 0.578213 CIRBP  Cold-inducible RNA binding protein

NM_001395 NM_001395
-0.577369 DUSP9 Fosfatasa 9 de especificidad dual  -0.577369 DUSP9  Phosphatase 9 of dual specificity

NM_016229 NM_016229
-0.576290 LOC51700 Citocromo b5 reductasa b5R.2  -0.576290  LOC51700  Cytochrome b5 reductase b5R.2

NM_006096 NM_006096
-0.575615 NDRG1 N-myc regulado corriente abajo  -0.575615  NDRG1  N-myc regulated downstream

NM_001552 NM_001552
0.575438 IGFBP4 Proteína 4 de enlace con el factor de crecimiento afín a insulina 0.575438 IGFBP4 Protein 4 binding to insulin-like growth factor

NM_005558 NM_005558
-0.574818 LAD1 Ladinina 1  -0.574818 LAD1 Ladinina 1

Contig54534_RCContig54534_RC
0.574784 Pseudogen transportador de glucosa humana  0.574784  Pseudogen human glucose transporter

Contig1239_RC  Contig1239_RC
0.573822 Cromosoma humano 16 BAC clon CIT987SK-A-362G6 0.573822  Human chromosome 16 BAC clone CIT987SK-A-362G6

Contig57173_RCContig57173_RC
0.573807 ARNm de Homo sapiens para proteína KIAA1737, cds parcial  0.573807  Homo sapiens mRNA for KIAA1737 protein, partial cds

NM_004414 NM_004414
-0.573538 DSCR1 Gen1 de la región crítica del síndrome de Down  -0.573538 DSCR1  Gen1 of the critical region of Down syndrome

NM_021103  NM_021103
-0.572722 TMSB10 Timosina, beta 10  -0.572722 TMSB10  Thymosin, beta 10

NM_002350 NM_002350
-0.571917 LYN Homólogo del oncógeno relacionado con el sarcoma viral Yamaguchi v-sí-1  -0.571917  LYN  Homologous oncogene related to viral sarcoma Yamaguchi v-yes-1

Contig51235_RC Contig51235_RC
0.571049 ADNc de Homo sapiens: fis FLJ23388, clon HEP17008  0.571049  Homo sapiens cDNA: fis FLJ23388, clone HEP17008

NM_013384 NM_013384
0.570987 TMSG1 Supresor de metástasis tumoral 0.570987 TMSG1  Tumor Metastasis Suppressor

NM_014399 NM_014399
0.570936 NET-6 Proteína tetraspan NET-6 0.570936 NET-6  Tetraspan NET-6 protein

Contig26022_RC Contig26022_RC
-0.570851 ESTs -0.570851 ESTs

43 43

AB023152  AB023152
0.570561 KIAA0935 Proteína KIAA0935 0.570561 KIAA0935  KIAA0935 protein

NM_021077 NM_021077
-0.569944 NMB Neuromedina B  -0.569944 NMB  Neuromedin B

NM_003498 NM_003498
-0.569129 SNN Estannina  -0.569129 SNN Stannina

U17077 U17077
-0.568979 BENE Proteína BENE  -0.568979 BENE BENE protein

D86985 D86985
0.567698 KIAA0232 Producto del gen KIAA0232 0.567698 KIAA0232  Product of the KIAA0232 gene

NM_006357 NM_006357
-0.567513 UBE2E3 Enzima E2E 3 conjugadora con ubiquitina (homólogo de levadura UBC4/5)  -0.567513 UBE2E3  Enzyme E2E 3 conjugate with ubiquitin (yeast homologue UBC4 / 5)

AL049397 AL049397
-0.567434 ARNm de Homo sapiens; ADNc DKFZp586C1019 (de clon DKFZp586C1019)  -0.567434  MRNA from Homo sapiens; DKFZp586C1019 cDNA (from clone DKFZp586C1019)

Contig64502 Contig64502
0.567433 ESTs, ligeramente parecidos a [M.musculus] desconocido 0.567433 ESTs, slightly similar to [M.musculus] unknown

Contig56298_RCContig56298_RC
-0.566892 FLJ13154 Proteína hipotética FLJ13154  -0.566892 FLJ13154  Hypothetical protein FLJ13154

Contig46056_RCContig46056_RC
0.566634 ESTs, ligeramente parecidos a YZ28 PROTEÍNA HIPOTÉTICA HUMANA ZAP128 [H.sapiens]  0.566634  ESTs, slightly similar to YZ28 HUMAN HYPOTHETIC PROTEIN ZAP128 [H.sapiens]

AF007153 AF007153
0.566044 Clon de Homo sapiens 23736 de secuencia de ARNm 0.566044  Clone of Homo sapiens 23736 mRNA sequence

Contig1778_RC  Contig1778_RC
-0.565789 ESTs  -0.565789 ESTs

NM_017702 NM_017702
-0.565789 FLJ20186 Proteína hipotética FLJ20186  -0.565789 FLJ20186  Hypothetical protein FLJ20186

Contig39226_RC Contig39226_RC
0.565761 Fis FLJ12187 de ADNc de Homo sapiens, clon MAMMA1000831  0.565761  Fis FLJ12187 cDNA from Homo sapiens, clone MAMMA1000831

NM_000168 NM_000168
0.564879 GLI3 Miembro GL13 de familia GLI-Kruppel (Síndrome de Greig) 0.564879  GLI3  GL13 member of family GLI-Kruppel (Greig syndrome)

Contig57609_RC Contig57609_RC
0.564751 ESTs, ligeramente parecido a SUBUNIDAD TFIID 135 KDA T2D3_DE FACTOR de INITIACIÓN DE TRANSCRIPCiÓN HUMANA [H.sapiens]  0.564751  ESTs, slightly similar to TFIID SUBUNITY 135 KDA T2D3_DE HUMAN TRANSCRIPTION INITIATION FACTOR [H.sapiens]

U45975 U45975
0.564602 PIB5PA Fosfatidilinositol (4,5) bisfosfato 5-fosfatasa, A 0.564602 GDP5PA  Phosphatidylinositol (4,5) bisphosphate 5-phosphatase, A

AF038182 AF038182
0.564596 Clon 23860 de Homo sapiens secuencia de ARNm 0.564596  Clone 23860 of Homo sapiens mRNA sequence

Contig5348_RC  Contig5348_RC
0.564480 ESTs, ligeramente parecidos al factor de transcripción 1607338A BTF3a [H.sapiens] 0.564480  ESTs, slightly similar to the transcription factor 1607338A BTF3a [H.sapiens]

NM_001321 NM_001321
-0.564459 CSRP2 Proteína 2 rica en cisteína y glicina  -0.564459 CSRP2  Protein 2 rich in cysteine and glycine

Contig25362_RC Contig25362_RC
-0.563801 ESTs  -0.563801 ESTs

NM_001609 NM_001609
0.563782 ACADSB Acil-Coenzima A dehidrogenasa, cadena ramificada corta 0.563782 ACADSB  Acyl-Coenzyme A dehydrogenase, short branched chain

Contig40146 Contig40146
0.563731 ADNc de Homo sapiens wi84e12.x1 NCl_CGAP_Kid12 clon IMAGE: 2400046 3’ parecido a PROTEÍNA RAS DE TIPO RAS SW:RASD_DICDI P03967; secuencia de ARNm 0.563731  CDNA of Homo sapiens wi84e12.x1 NCl_CGAP_Kid12 clone IMAGE: 2400046 3 ’similar to RAS PROTEIN RAS SW TYPE: RASD_DICDI P03967; mRNA sequence

NMB_016002 NMB_016002
0.563403 LOC51097 Proteína CGI-49 0.563403  LOC51097  CGI-49 protein

Contig34303_RCContig34303_RC
0.563157 ADNc de Homo sapiens; fis FLJ21517, clon COL05829  0.563157  CDNA from Homo sapiens; fis FLJ21517, clone COL05829

Contig55883_RCContig55883_RC
0.563141 ESTs  0.563141 ESTs

NM_017961 NM_017961
0.562479 FLJ20813 Proteína hipotética FLJ20813 0.562479 FLJ20813  Hypothetical protein FLJ20813

M21551 M21551
-0.562340 NMB Neuromedina B  -0.562340 NMB  Neuromedin B

Contig3940_RC  Contig3940_RC
-0.561956 YWHAH Proteína de activación de tirosina 3- Monooxigena-sa/triptofano 5monooxigenasa, polipéptido eta  -0.561956 YWHAH  Tyrosine 3- protein activation Monooxigena-sa / tryptophan 5monooxygenase, eta polypeptide

AB033111 AB033111
-0.561746 KIAA1285 Proteína KIAA1285  -0.561746 KIAA1285  KIAA1285 protein

Contig43410_RCContig43410_RC
0.561678 ESTs  0.561678 ESTs

Contig42006_RCContig42006_RC
-0.561677 ESTs  -0.561677 ESTs

Contig57272_RCContig57272_RC
0.561228 ESTs  0.561228 ESTs

G26403  G26403
-0.561068 YWHAH Proteína de activación de tirosina 3-monooxigenasa/triptofano 5monooxygenasa, polipéptido eta  -0.561068 YWHAH  3-monooxygenase / tryptophan 5monooxygenase tyrosine activation protein, eta polypeptide

44 44

NM_005915  NM_005915
-0.560813 MCM6 Deficiente en mantenimiento de minicromosoma (mis5, S. pombe) 6  -0.560813 MCM6  Deficient in maintenance of minichromosome (mis5, S. pombe) 6

NM_003875 NM_003875
-0.560668 GMPS Monofosfato sintetasa de guanina -0.560668 GMPS Guanine monophosphate synthetase

AK000142  AK000142
0.559651 AK000142 ADNc de Homo sapiens fis FLJ20135 fis, clon COL06818. 0.559651 AK000142  CDNA from Homo sapiens fis FLJ20135 fis, clone COL06818.

NM_002709 NM_002709
-0.559621 PPP1CB Fosfatasa proteínica 1, subunidad catalítica, isoforma beta  -0.559621 PPP1CB  Protein phosphatase 1, catalytic subunit, beta isoform

NM_001276 NM_001276
-0.558868 CHI3L1 Tipo 1 de quitinasa 3 (glicoproteína de cartílago-39)  -0.558868 CHI3L1  Type 1 chitinase 3 (cartilage glycoprotein-39)

NM_002857  NM_002857
0.558862 PXF Proteína farnesilatada de peroxisomal 0.558862 PXF  Farnesylated peroxisomal protein

Contig33815_RCContig33815_RC
-0.558741 FLJ22833 Proteína hipotética FLJ22833  -0.558741 FLJ22833  Hypothetical protein FLJ22833

NM_003740 NM_003740
-0.558491 KCNK5 Canal de potasio, subfamilia K, miembro 5 (TASK-2)  -0.558491 KCNK5 Potassium channel, subfamily K, member 5 (TASK-2)

Contig53646_RCContig53646_RC
0.558455 ESTs  0.558455 ESTs

NM_005538 NM_005538
-0.558350 INHBC Inhibina, beta C  -0.558350 INHBC Inhibin, beta C

NM_002111 NM_002111
0.557860 HD Huntingtina (enfermedad de Huntington) 0.557860 HD  Huntingtin (Huntington's disease)

NM_003683 NM_003683
-0.557807 D21S2056E Segmento de ADN en cromosoma 21 (único) secuencia expresada 2056  -0.557807 D21S2056E  DNA segment on chromosome 21 (single) sequence expressed 2056

NM_003035  NM_003035
-0.557380 SIL TAL1 (SCL) interrupting locus  -0.557380 SIL  TAL1 (SCL) interrupting locus

Contig4388_RC  Contig4388_RC
-0.557216 Homo sapiens, parecida a proteína integral 3 de membrana, clon MGC:3011, ARNm, cds completo  -0.557216  Homo sapiens, similar to integral membrane protein 3, clone MGC: 3011, mRNA, complete cds

Contig38288_RCContig38288_RC
-0.556426 ESTs, ligeramente parecido a proteína ISHUSS disulfuro-isomerasa [H.sapiens]  -0.556426  ESTs, slightly similar to ISHUSS disulfide-isomerase protein [H.sapiens]

NM_015417 NM_015417
0.556184 DKFZP434I114 Proteína DKFZP434I114 0.556184  DKFZP434I114  DKFZP434I114 protein

NM_015507 NM_015507
-0.556138 EGFL6 Dominio afín a EGF, múltiple 6  -0.556138 EGFL6  Domain related to EGF, multiple 6

AF279865 AF279865
0.555951 KIF13B Miembro de la familia de la quinesia 13B 0.555951 KIF13B  Family member of kinesia 13B

Contig31288_RC Contig31288_RC
-0.555754 ESTs  -0.555754 ESTs

NM_002966 NM_002966
-0.555620 S100A10 Proteína A10 de enlace con calcio S100 (ligando de anexina II, calpactina I, polipéptido ligero (p11))  -0.555620 S100A10  A10 calcium binding protein S100 (annexin II ligand, calpactin I, light polypeptide (p11))

NM_017585 NM_017585
-0.555476 SLC2A6 Familia 2 del portador de soluto 2 (transportador de glucosa facilitado), miembro 6  -0.555476 SLC2A6  Family 2 of the solute 2 carrier (facilitated glucose transporter), member 6

NM_013296 NM_013296
-0.555367 HSU54999 Proteina LGN  -0.555367 HSU54999  LGN protein

NM_000224  NM_000224
0.554838 KRT18 Queratina 18 0.554838 KRT18  Keratin 18

Contig49270_RCContig49270_RC
-0.554593 KIAA1553 Proteina KIAA1553  -0.554593 KIAA1553  KIAA1553 protein

NM_004848 NM_004848
-0.554538 ICB-1 Gen inducido por mebrana basal  -0.554538 ICB-1  Basal Mebrana Induced Gene

NM_007275 NM_007275
0.554278 FUS1 Candidato de cáncer de pulmón 0.554278 FUS1  Lung Cancer Candidate

NM_007044 NM_007044
-0.553550 KATNA1 Katanina p60 (contenedora de ATPasa) subunidad A 1  -0.553550 KATNA1  Katanina p60 (ATPase container) subunit A 1

Contig1829 Contig1829
0.553317 ESTs 0.553317 ESTs

AF272357 AF272357
0.553286 NPDC1 Proliferación, dfferenciación y control neural, 1 0.553286 NPDC1  Proliferation, differentiation and neural control, 1

Contig57584_RC Contig57584_RC
-0.553080 Homo sapiens, parecido a agrupamiento rico en, gen C8, clon MGC:2577, ARNm, cds completo  -0.553080  Homo sapiens, similar to cluster rich in, gene C8, clone MGC: 2577, mRNA, complete cds

NM_003039 NM_003039
-0.552747 SLC2A5 Familia 2 del portador de soluto 2 (transportador de glucosa facilitado), miembro 5  -0.552747 SLC2A5  Family 2 of the solute 2 carrier (facilitated glucose transporter), member 5

NM_014216 NM_014216
0.552321 ITPK1 inositol 1,3,4-trifosfato 5/6 quinasa 0.552321 ITPK1  inositol 1,3,4-triphosphate 5/6 kinase

NM_007027 NM_007027
-0.552064 TOPBP1 Proteína de enlace con topoisomerasa (ADN) II  -0.552064 TOPBP1  Topoisomerase (DNA) II binding protein

AF118224 AF118224
-0.551916 ST14 Supresión de tumorigenicidad 14 (carcinoma de colon, matriptasa, epitina)  -0.551916 ST14  Tumorigenicity suppression 14 (colon carcinoma, matriptase, epitine)

X75315 X75315
-0.551853 HSRNASEB Seb4D  -0.551853 HSRNASEB Seb4D

NM_012101 NM_012101
-0.551824 ATDC Proteína asociada al grupo D de ataxia-telangiectasia  -0.551824 ATDC  Protein associated with group D of ataxia-telangiectasia

45 Four. Five

AL157482  AL157482
-0.551329 FLJ23399 Proteína hipotética FLJ23399  -0.551329 FLJ23399  Hypothetical protein FLJ23399

NM_012474 NM_012474
-0.551150 UMPK Uridina monofosfato quinasa  -0.551150 UMPK  Uridine monophosphate kinase

Contig57081_RCContig57081_RC
0.551103 ESTs  0.551103 ESTs

NM_006941 NM_006941
-0.551069 SOX10 SRY (región Y de determinación de sexo)-caja 10  -0.551069 SOX10  SRY (sex determination region Y) - box 10

NM_004694 NM_004694
0.550932 SLC16A6 Familia 2 del portador de soluto 16 (transportadores de ácido monocarboxílico), miembro 6 0.550932 SLC16A6  Family 2 of the solute carrier 16 (monocarboxylic acid transporters), member 6

Contig9541_RC  Contig9541_RC
0.550680 ESTs 0.550680 ESTs

Contig20617_RCContig20617_RC
0.550546 ESTs  0.550546 ESTs

NM_004252 NM_004252
0.550365 SLC9A3R1 Familia 9 del portadointercambiador de sodio/hidrógeno), isoforma 3 factor regulador 1 0.550365 SLC9A3R1  Family 9 of the carrier sodium / hydrogen exchanger), isoform 3 regulatory factor 1

NM_015641 NM_015641
-0.550200 KFZP586B2022 Testina  -0.550200  KFZP586B2022 Testine

NM_004336 NM_004336
-0.550164 BUB1 Injerto desinhibido por benzimidazoles 1 (homólogo de levadura)  -0.550164 BUB1  Graft disinhibited by benzimidazoles 1 (yeast counterpart)

Contig39960_RCContig39960_RC
-0.549951 FLJ21079 Proteína hipotética FLJ21079  -0.549951 FLJ21079  Hypothetical protein FLJ21079

NM_020686 NM_020686
0.549659 NPD009 Proteína NPD009 0.549659 NPD009  NPD009 protein

NM_002633 NM_002633
-0.549647 PGM1 Fosfoglucomutasa 1  -0.549647 PGM1  Phosphoglucomutase 1

Contig30480_RCContig30480_RC
0.548932 ESTs  0.548932 ESTs

NM_003479 NM_003479
0.548896 PTP4A2 proteína tirosina fosfatasa typo IVA, miembro 2 0.548896 PTP4A2  tyrosine phosphatase typo IVA protein, member 2

NM_001679 NM_001679
-0.548768 ATP1 B3 ATPasa, Na+/K+ transportador, polipéptido beta 3  -0.548768 ATP1 B3  ATPase, Na + / K + transporter, beta 3 polypeptide

NM_001124 NM_001124
-0.548601 ADM Adrenomedulina  -0.548601 ADM Adrenomedulin

NM_001216  NM_001216
-0.548375 CA9 Anhidrasa carbónica IX  -0.548375 CA9  Carbonic Anhydrase IX

U58033 U58033
-0.548354 MTMR2 Proteína 2 relacionada con miotubularina  -0.548354 MTMR2  Myotubularin-related protein 2

NM_018389 NM_018389
-0.547875 FLJ11320 Proteína hipotética FLJ11320  -0.547875 FLJ11320  Hypothetical protein FLJ11320

AF176012 AF176012
0.547867 JDP1 Dominio J qe contiene proteína 1 0.547867 JDP1  Domain J qe contains protein 1

Contig66705_RC Contig66705_RC
-0.546926 ST5 Supresión de tumorigenicidad 5  -0.546926 ST5  Tumorigenicity suppression 5

NMB_018194 NMB_018194
0.546878 FLJ10724 Proteína hipotética FLJ10724 0.546878 FLJ10724  Hypothetical protein FLJ10724

NM_006851 NM_006851
-0.546823 RTVP1 Proteína relacionada con la patogénesis de glioma  -0.546823 RTVP1  Protein related to the pathogenesis of glioma

Contig53870_RCContig53870_RC
0.546756 ESTs  0.546756 ESTs

NM_002482 NM_002482
-0.546012 NASP Proteína del esperma autoanígeno nuclear (de enlace con histona)  -0.546012 NASP  Nuclear autogenous sperm protein (histone binding)

NM_002292 NM_002292
0.545949 LAMB2 Laminina, beta 2 (laminina S) 0.545949 LAMB2  Laminin, beta 2 (laminin S)

NMB_014696 NMB_014696
-0.545758 KIAA0514 Producto del gen KlAA0514  -0.545758 KIAA0514  Product of the KlAA0514 gene

Contig49855 Contig49855
0.545517 ESTs 0.545517 ESTs

AL117666 AL117666
0.545203 DKFZP586 DKFZP58601624 Proteína O1624 0.545203  DKFZP586  DKFZP58601624 Protein O1624

NM_004701 NM_004701
-0.545185 CCNB2 Ciclina B2  -0.545185 CCNB2 B2 Cyclin

NM_007050 NM_007050
0.544890 PTPRT Proteína tirosina fosfatasa, tipo receptor, T 0.544890 PTPRT  Tyrosine phosphatase protein, receptor type, T

NMB_000414 NMB_000414
0.544778 HSD17B4 Hidroxisteroide (17-beta) dehidrogenasa 4 0.544778 HSD17B4  Hydroxysteroid (17-beta) dehydrogenase 4

Contig52398_RC Contig52398_RC
-0.544775 ADNc de Homo sapiens: fis FLJ21950, clon HEP04949  -0.544775  Homo sapiens cDNA: fis FLJ21950, clone HEP04949

AB007916 AB007916
0.544496 KlAA0447 Producto del gen KIAA0447 0.544496 KlAA0447  Product of the KIAA0447 gene

Contig66219_RC Contig66219_RC
0.544467 FLJ22402 Proteína hipotética FLJ22402  0.544467 FLJ22402  Hypothetical protein FLJ22402

D87453 D87453
0.544145 KlAA0264 Proteína KIAA0264 0.544145 KlAA0264  KIAA0264 protein

NM_015515 NM_015515
-0.543929 DKFZP434G032 Proteína DKFZP434G032  -0.543929  DKFZP434G032  DKFZP434G032 protein

NM_001530 NM_001530
-0.543898 HIF1A Factor 1 inducible por hipoxia, subunidad alfa (factor de transcripción helix básico-bucle-helix)  -0.543898 HIF1A  Hypoxia-inducible factor 1, alpha subunit (basic helix-loop-helix transcription factor)

NM_004109 NM_004109
-0.543893 FDX1 Ferredoxina 1  -0.543893 FDX1  Ferredoxin 1

NM_000381 NM_000381
-0.543871 MID1 Midlina 1 (síndrome de Opitz/BBB)  -0.543871 MID1  Midlina 1 (Opitz / BBB syndrome)

Contig43983_RC Contig43983_RC
0.543523 CS2 Calsintenina-2  0.543523 CS2 Calsintenin-2

46 46

AL137761  AL137761
0.543371 ARNm de Homo sapiens; ADNc DKFZp586L2424 (del clon DKFZp586L2424) 0.543371  MRNA from Homo sapiens; DKFZp586L2424 cDNA (from clone DKFZp586L2424)

NM_005764 NM_005764
-0.543175 DD96 Proteína epitelial aumentada en carcinoma, proteína 17 asociada a membrana  -0.543175 DD96  Increased epithelial protein in carcinoma, membrane-associated protein 17

Contig1838_RC  Contig1838_RC
0.542996 ADNc de Homo sapiens: fis FLJ22722, clon HSI14444 0.542996  Homo sapiens cDNA: fis FLJ22722, clone HSI14444

NM_006670 NM_006670
0.542932 5T4 Oncofetal trofoblasto glicoproteina 0.542932 5T4  Oncofetal trophoblast glycoprotein

Contig28552_RC Contig28552_RC
-0.542617 ARN de Homo sapiens; ADNc DKFZp434C0931 (del clon DKFZp434C0931); cds parcial  -0.542617  RNA from Homo sapiens; DKFZp434C0931 cDNA (from clone DKFZp434C0931); partial cds

Contig14284_RC Contig14284_RC
0.542224 ESTs 0.542224 ESTs

NM_006290 NM_006290
-0.542115 TNFAIP3 Factor de necrosis tumoral, proteína 3 inducida por alfa  -0.542115 TNFAIP3 Tumor necrosis factor, alpha-induced protein 3

AL050372 AL050372
0.541463 ARNm de Homo sapiens; ADNc DKFZp434A091 (del clon DKFZp434A091); cds parcial 0.541463  MRNA from Homo sapiens; DKFZp434A091 cDNA (from clone DKFZp434A091); partial cds

NM_014181 NM_014181
-0.541095 HSPC159 Proteína HSPC159  -0.541095 HSPC159  HSPC159 protein

Contig37141_RCContig37141_RC
0.540990 ADNc de Homo sapiens: fis FLJ23582, clon LNG13759  0.540990  Homo sapiens cDNA: fis FLJ23582, clone LNG13759

NM_000947 NM_000947
-0.540621 PRIM2A Primasa, polipéptido 2A (58kD)  -0.540621 PRIM2A Primasa, polypeptide 2A (58kD)

NMB_002136 NMB_002136
0.540572 HNRPA1 Ribonucleoproteína A1 nuclear heterogénea 0.540572 HNRPA1  Heterogeneous nuclear A1 ribonucleoprotein

NM_004494  NM_004494
-0.540543 HDGF Factor del crecimiento derivado de hepatoma (proteína de tipo 1 del grupo de alta movilidad)  -0.540543 HDGF  Growth factor derived from hepatoma (high mobility group type 1 protein)

Contig38983_RCContig38983_RC
0.540526 ESTs  0.540526 ESTs

Contig27882_RCContig27882_RC
-0.540506 ESTs  -0.540506 ESTs

Z11887 Z11887
-0.540020 MMP7 Metaloproteinasa 7 de matriz (matrilisina, uterina)  -0.540020 MMP7  Matrix metalloproteinase 7 (matrilysin, uterine)

NM_014575 NM_014575
-0.539725 SCHIP-1 Proteína 1 interactuante con schwannomina  -0.539725 SCHIP-1  Protein 1 interacting with schwannomina

Contig38170_RC Contig38170_RC
0.539708 ESTs  0.539708 ESTs

Contig44064_RC Contig44064_RC
0.539403 ESTs  0.539403 ESTs

U68385 U68385
0.539395 MEIS3 Homólogo 3 de Meis (ratón) 0.539395 MEIS3  Meis counterpart 3 (mouse)

Contig51967_RCContig51967_RC
0.538952 ESTs  0.538952 ESTs

Contig37562_RCContig37562_RC
0.538657 ESTs, ligeramente parecidos a la proteína relacionada con transformación [H.sapiens]  0.538657  ESTs, slightly similar to the transformation-related protein [H.sapiens]

Contig40500_RCContig40500_RC
0.538582 ESTs, ligeramente parecidos a producto proteínico sin nombre [H.sapiens]  0.538582  ESTs, slightly similar to unnamed protein product [H.sapiens]

Contig1129_RC  Contig1129_RC
0.538339 ESTs 0.538339 ESTs

NM_002184 NM_002184
0.538185 IL6ST Transductor de señal de interleuquina 6 (gp130, receptor de oncostatina M) 0.538185 IL6ST  Interleukin 6 signal transducer (gp130, M oncostatin receptor)

AL049381 AL049381
0.538041 ADNc de Homo sapiens fis FLJ12900, clon NT2RP2004321 0.538041  CDNA from Homo sapiens fis FLJ12900, clone NT2RP2004321

NM_002189  NM_002189
-0.537867 IL15RA Receptor de interleuquina 15, alfa  -0.537867 IL15RA  Interleukin 15 receptor, alpha

NM_012110  NM_012110
-0.537562 CHIC2 Dominio hidrófobo 2 rico en cisteína  -0.537562 CHIC2  Hydrophobic domain 2 rich in cysteine

AB040881 AB040881
-0.537473 KIAA1448 Proteína KIAA1448  -0.537473 KIAA1448  KIAA1448 protein

NM_016577 NM_016577
-0.537430 RAB6B RAB6B, miembro de la familia del oncógeno RAS  -0.537430 RAB6B RAB6B, member of the RAS oncogene family

NM_001745 NM_001745
0.536940 CAMLG Ligando modulador de calcio 0.536940 CAMLG  Ligand calcium modulator

NM_005742 NM_005742
-0.536738 P5 Proteína relacionada con proteína disulfuro isomerasa  -0.536738 P5  Protein related to disulphide isomerase protein

AB011132 AB011132
0.536345 KIAA0560 Producto del gen KIAA0560 0.536345 KIAA0560  Product of the KIAA0560 gene

Contig54898_RCContig54898_RC
0.536094 PNN protein Pinina, asociada a desmosoma  0.536094 PNN protein  Pinina, associated with desmosoma

Contig45049_RCContig45049_RC
-0.536043 FUT4 Fucosiltransferasa 4 (alfa (1,3) fucosiltransferasa, específico de mieloide  -0.536043 FUT4  Fucosyltransferase 4 (alpha (1,3) fucosyltransferase, myeloid specific

47 47

NM_006864  NM_006864
-0.535924 LILRB3 Receptor afín a inmunoglobulina de leucocitos, subfamilia B (con dominios TM e ITIM), miembro 3  -0.535924 LILRB3  Leukocyte-related immunoglobulin receptor, subfamily B (with TM and ITIM domains), member 3

Contig53242_RCContig53242_RC
-0.535909 ADNc de Homo sapiens fis FLJ11436, clon HEMBA1001213  -0.535909  CDNA from Homo sapiens fis FLJ11436, clone HEMBA1001213

NM_005544 NM_005544
0.535712 IRS1 Sustrato 1 del receptor de insulina 0.535712 IRS1  Insulin receptor substrate 1

Contig47456_RCContig47456_RC
0.535493 CACNA1D Canal de calcio, dependiente del voltaje, tipo L, subunidad alfa 1 D  0.535493 CACNA1D  Calcium channel, voltage dependent, type L, subunit alpha 1 D

Contig42751_RCContig42751_RC
-0.535469 ESTs  -0.535469 ESTs

Contig29126_RCContig29126_RC
-0.535186 ESTs  -0.535186 ESTs

NM_012391 NM_012391
0.535067 PDEF Factor de transcripción de Ets específico del epitelio de la próstata 0.535067 PDEF  Ets transcription factor specific for prostate epithelium

NMB_012429 NMB_012429
0.534974 SEC14L2 SEC14 tipo 2 de (S. cerevisiae) 0.534974 SEC14L2  SEC14 type 2 of (S. cerevisiae)

NMB_018171 NMB_018171
0.534898 FLJ10659 Proteína hipotética FLJ10659 0.534898 FLJ10659  Hypothetical protein FLJ10659

Contig53047_RCContig53047_RC
-0.534773 TTYH1 Homólogo 1 de tweety (Drosophila)  -0.534773  TTYH1  Tweety Homologue 1 (Drosophila)

Contig54968_RCContig54968_RC
0.534754 ADNc de Homo sapiens fis FLJ13558, clon PLACE1007743  0.534754  CDNA from Homo sapiens fis FLJ13558, clone PLACE1007743

Contig2099_RC  Contig2099_RC
-0.534694 KIAA1691 Proteína KIAA9691  -0.534694 KIAA1691  KIAA9691 protein

NM_005264 NM_005264
0.534057 GFRA1 Alfa 1 de receptor de familia GDNF 0.534057  GFRA1 GDNF Family Receiver Alpha 1

NM_014036 NM_014036
-0.533638 SBBI42 Precursor de proteína de membrana de tipo BCM  -0.533638 SBBI42  BCM type membrane protein precursor

NMB_018101  NMB_018101
-0.533473 FLJ10468 Proteína hipotética FLJ10468  -0.533473 FLJ10468  Hypothetical protein FLJ10468

Contig56765_RCContig56765_RC
0.533442 K02E10.2 ESTs, moderadamente parecidos a [C.elegans]  0.533442 K02E10.2  ESTs, moderately similar to [C.elegans]

AB006746 AB006746
-0.533400 PLSCR1 Fosfolípido escramblasa 1  -0.533400 PLSCR1 Phospholipid Scramblase 1

NMB_001089 NMB_001089
0.533350 ABCA3 Casete de enlace con ATP, subfamilia A (ABC1), miembro 3 0.533350 ABCA3  ATP link cassette, subfamily A (ABC1), member 3

NMB_018188 NMB_018188
-0.533132 FLJ10709 Proteína hipotética FLJ10709  -0.533132 FLJ10709  Hypothetical protein FLJ10709

X94232 X94232
-0.532925 MAPRE2 Proteína asociada a microtúbulo, familia RP/EB, miembro 2  -0.532925 MAPRE2 Microtubule associated protein, RP / EB family, member 2

AF234532 AF234532
-0.532910 MYO10 Miosina X  -0.532910  MYO10 Myosin X

Contig292_RC  Contig292_RC
0.532853 FLJ22386 Proteína hipotética FLJ22386 0.532853 FLJ22386  Hypothetical protein FLJ22386

NMB_000101 NMB_000101
-0.532767 CYBA Citocromo b-245, polipéptido alfa  -0.532767  CYBA  Cytochrome b-245, alpha polypeptide

Contig47814_RCContig47814_RC
-0.532656 HHGP Proteína HHGP  -0.532656 HHGP  HHGP protein

NM_014320 NM_014320
-0.532430 SOUL Proteína de enlace con heme putativo  -0.532430 SOUL  Putative heme binding protein

NM_020347 NM_020347
0.531976 LZTFL1 Tipo 1 de factor de transcripción de cremallera de Leucina 0.531976  LZTFL1  Type 1 Leucine zipper transcription factor

NM_004323 NM_004323
0.531936 BAG1 Atanógeno asociado a BCL2 0.531936 BAG1  Atangen associated with BCL2

Contig50850_RCContig50850_RC
-0.531914 ESTs  -0.531914 ESTs

Contig11648_RCContig11648_RC
0.531704 ESTs  0.531704 ESTs

NMB_018131 NMB_018131
-0.531559 FLJ10540 Proteína hipotética FLJ10540  -0.531559 FLJ10540  Hypothetical protein FLJ10540

NM_004688 NM_004688
-0.531329 NMI Interactor N-myc (y STAT)  -0.531329 NMI  N-myc (and STAT) Interactor

NM_014870 NM_014870
0.531101 KIAA0478 Producto del gen KIAA0478 0.531101 KIAA0478  Product of the KIAA0478 gene

Contig31424_RC Contig31424_RC
0.530720 ESTs  0.530720 ESTs

NM_000874 NM_000874
-0.530545 IFNAR2 Receptor 2 de interferón (alfa, beta y omega)  -0.530545 IFNAR2  Interferon receptor 2 (alpha, beta and omega)

Contig50588_RCContig50588_RC
0.530145 ESTs  0.530145 ESTs

NMB_016463 NMB_016463
0.529998 HSPC195 Proteína hipotética 0.529998 HSPC195  Hypothetical protein

NMB_013324 NMB_013324
0.529966 CISH Proteína contenedora de SH2 inducible por citoquina 0.529966 CISH  Cytokine-inducible SH2 containing protein

NM_006705 NM_006705
0.529840 GADD45G Paro de crecimiento e inducible a daño de ADN, gamma 0.529840  GADD45G  Growth stop and inducible to DNA damage, gamma

Contig38901_RCContig38901_RC
-0.529747 ESTs  -0.529747 ESTs

NM_004184 NM_004184
-0.529635 WARS Triptofanil-ARNt sintetasa  -0.529635 WARS  Tryptophanil-tRNA synthetase

NM_015955 NM_015955
-0.529538 LOC51072 Proteína CGI-27  -0.529538  LOC51072  CGI-27 protein

AF151810  AF151810
0.529416 CGI-52 Parecido a proteína 2 de transferencia de 0.529416  CGI-52  Similar to protein 2 transfer

48 48

fosfatidilcolina  phosphatidylcholine

NMB_002164 NMB_002164
-0.529117 INDO Indoleamina-pirrol 2,3 dioxigenasa  -0.529117 INDO  Indoleamine-pyrrole 2,3 dioxygenase

NM_004267 NM_004267
-0.528679 CHST2 Carbohidrato (condroitina 6/queratano) sulfotransferasa 2  -0.528679 CHST2  Carbohydrate (chondroitin 6 / queratane) sulfotransferase 2

Contig32185_RCContig32185_RC
-0.528529 ADNc de Homo sapiens fis FJ13997, clon Y79AA1002220  -0.528529  CDNA from Homo sapiens fis FJ13997, clone Y79AA1002220

NM_004154 NM_004154
-0.528343 P2RY6 Receptor pirimidinérgico P2Y, acoplado a proteiína G, 6  -0.528343  P2RY6 P2Y pyrimidinergic receptor, coupled to protein G, 6

NM_005235 NM_005235
0.528294 ERBB4 Tipo 4 de homólogo de oncógeno viral de leucemia eritoblástica aviar v-erb-a 0.528294 ERBB4  Type 4 of viral oncogene homolog of avian eritoblastic leukemia v-erb-a

Contig40208_RCContig40208_RC
-0.528062 LOC56938 Factor de transcripción BMAL2  -0.528062  LOC56938  BMAL2 transcription factor

NMB_013262 NMB_013262
0.527297 MIR Proteína interactuante con la cadena ligera reguladora de miosina 0.527297 Look  Interactive protein with the myosin regulatory light chain

NM_003034 NM_003034
-0.527148 SIAT8A Sialiltransferasa 8 (alfa-N-acetilneuraminato: alfa-2,8- sialitransferasa, sintasa GD3) A  -0.527148 SIAT8A  Sialyltransferase 8 (alpha-N-acetylneuraminate: alpha-2,8-sialitransferase, GD3 synthase) A

NM_004556 NM_004556
-0.527146 NFKBIE Factor nuclear de potenciador del gen polipéptido ligero kappa en inhibidor de células B, epsilon  -0.527146 NFKBIE  Nuclear enhancer factor of the kappa light polypeptide gene in B cell inhibitor, epsilon

NM_002046 NM_002046
-0.527051 GAPD Gliceraldehído-3-fosfato dehidrogenasa  -0.527051 GAPD  Glyceraldehyde-3-phosphate dehydrogenase

NMB_001905 NMB_001905
-0.526986 CTPS Sintasa CTP  -0.526986 CTPS CTP synthase

Contig42402_RCContig42402_RC
0.526852 ESTs  0.526852 ESTs

NM_014272 NM_014272
-0.526283 ADAMTS7 Tipo A de disintegrina y metaloproteasa (afín a reprolisina) con motivo de tipo 1 de trombospondina, 7  -0.526283 ADAMTS7  Type A of disintegrin and metalloprotease (related to reprolysin) with type 1 thrombospondin motif, 7

AF076612 AF076612
0.526205 CHRD Cordina 0.526205 CHRD Cordina

Contig57725_RCContig57725_RC
-0.526122 ARNm de Homo sapiens para factor de transcripción TCF-3 de caja HMG, cds completo  -0.526122  Homo sapiens mRNA for TCF-3 transcription factor of HMG box, complete cds

Contig42041_RCContig42041_RC
-0.525877 ESTs  -0.525877 ESTs

Contig44656_RCContig44656_RC
-0.525868 ESTs, muy parecido al precursor del receptor de S02392 alfa-2-macroglobulina [H.sapiens]  -0.525868  ESTs, very similar to the precursor of the S02392 alpha-2-macroglobulin receptor [H.sapiens]

NMB_018004 NMB_018004
-0.525610 FLJ10134 Proteína hipotética FLJ10134  -0.525610 FLJ10134  Hypothetical protein FLJ10134

Contig56434_RCContig56434_RC
0.525510 ADNc de Homo sapiens fis FLJ13603, clon PLACE1010270  0.525510  CDNA from Homo sapiens fis FLJ13603, clone PLACE1010270

D25328  D25328
-0.525504 PFKP Fosfofructoquinasa, plaqueta  -0.525504 PFKP  Phosphofructokinase, platelet

Contig55950_RCContig55950_RC
-0.525358 FLJ22329 Proteína hipotética FLJ22329  -0.525358 FLJ22329  Hypothetical protein FLJ22329

NM_002648 NM_002648
-0.525211 PIM1 Oncógeno pim-1  -0.525211 PIM1  Pim-1 oncogene

AL157505  AL157505
0.525186 ARNm de Homo sapiens; ADNc DKFZp586P1124 (del clon DKFZp586P1124) 0.525186  MRNA from Homo sapiens; DKFZp586P1124 cDNA (from clone DKFZp586P1124)

AF061034 AF061034
-0.525185 FIP2 ARNm de Homo sapiens alternativamente convertido a FIP2, cds completo  -0.525185 FIP2  Homo sapiens mRNA alternately converted to FIP2, complete cds

NMB_014721 NMB_014721
-0.525102 KIAA0680 Producto del gen KIAA0680  -0.525102 KIAA0680  Product of the KIAA0680 gene

NMB_001634 NMB_001634
-0.525030 AMD1 S-adenosilmetionina decarboxilasa 1  -0.525030 AMD1  S-adenosylmethionine decarboxylase 1

NM_006304 NM_006304
-0.524911 DSS1 Borrado en región 1 de mano hendida-pie hendido  -0.524911 DSS1  Deletion in region 1 of cleft hand-cleft foot

Contig37778_RCContig37778_RC
0.524667 ESTs, muy parecidos a HLHUSB MHC clase II antígeno de histocompatibilidad precursor de cadena HLA-DP alfa-1 [H.sapiens]  0.524667 ESTs, very similar to HLHUSB MHC class II histocompatibility antigen chain precursor HLA-DP alpha-1 [H.sapiens]

NM_003099 NM_003099
0.524339 SNX1 Nexina 1 de clasificación 0.524339 SNX1  Nexin 1 classification

AL079298 AL079298
0.523774 MCCC2 Metilcrotonoil-Coenzima A carboxilasa 2 (beta) 0.523774 MCCC2  Methylcrotonoyl-Coenzyme A carboxylase 2 (beta)

NM_019013 NM_019013
-0.523663 FLJ10156 Proteína hipotética  -0.523663 FLJ10156  Hypothetical protein

NM_000397 NM_000397
-0.523293 CYBB Citocromo b-245, polipéptido beta (enfermedad granulomatosa crónica)  -0.523293  CYBB  Cytochrome b-245, beta polypeptide (chronic granulomatous disease)

49 49

NM_014811  NM_014811
0.523132 KIAA0649 Producto del gen KIAA0649 0.523132 KIAA0649  Product of the KIAA0649 gene

Contig20600_RCContig20600_RC
0.523072 ESTs  0.523072 ESTs

NMB_005190 NMB_005190
-0.522710 CCNC Ciclina C  -0.522710 CCNC Cyclin C

AL161960 AL161960
-0.522574 FLJ21324 Proteína hipotética FLJ21324  -0.522574 FLJ21324  Hypothetical protein FLJ21324

AL117502 AL117502
0.522280 ARNm de Homo sapiens; ADNc DKFZp434D0935 (del clon DKFZp434D0935) 0.522280  MRNA from Homo sapiens; DKFZp434D0935 cDNA (from clone DKFZp434D0935)

AF131753 AF131753
-0.522245 Secuencia de ARNm del clon 24859 de Homo sapiens  -0.522245  Homo sapiens clone 24859 mRNA sequence

NM_000320 NM_000320
0.521974 QDPR Dihidropteridina reductasa quinoide 0.521974 QDPR  Quinoid Dihydropteridine Reductase

NMB_002115 NMB_002115
-0.521870 HK3 Hexoquinasa 3 (célula blanca)  -0.521870 HK3  Hexokinase 3 (white cell)

NM_006460 NM_006460
0.521696 HIS1 Inducible por HMBA 0.521696 HIS1  Inducible by HMBA

NMB_018683 NMB_018683
-0.521679 ZNF313 Proteína de dedo de cinc 313  -0.521679  ZNF313  Zinc finger protein 313

NM_004305 NM_004305
-0.521539 BIN1 Integrador puente 1  -0.521539 BIN1  Bridge Integrator 1

NM_006770 NM_006770
-0.521538 MARCO Receptor macrófago con estructura colágena  -0.521538 FRAMEWORK  Macrophage receptor with collagen structure

NM_001166 NM_001166
-0.521530 BIRC2 Contendedor de reptición 2 del baculoviral IAP  -0.521530 BIRC2  IAP Baculoviral Repetition Container 2

D42047  D42047
0.521522 KIAA0089 Proteína KIAA0089 0.521522 KIAA0089  KIAA0089 protein

NMB_016235 NMB_016235
-0.521298 GPRC5B Receptor acoplado a la proteína G, familia C, grupo 5, miembro B  -0.521298  GPRC5B  G protein-coupled receptor, family C, group 5, member B

NM_004504 NM_004504
-0.521189 HRB Proteína de enlace con VIH-1 Rev  -0.521189 HRB  HIV-1 Rev binding protein

NM_002727 NM_002727
-0.521146 PRG1 Proteoglicano 1, gránulo secretor  -0.521146 PRG1  Proteoglycan 1, secretory granule

AB029031  AB029031
-0.520761 KIAA1108 Proteína KIAA1108  -0.520761 KIAA1108  KIAA1108 protein

NM_005556 NM_005556
-0.520692 KRT7 Queratina 7  -0.520692 KRT7  Keratin 7

NMB_018031 NMB_018031
0.520600 WDR6 Dominio 6 de repetición de WD 0.520600 WDR6  WD Repeat Domain 6

AL117523 AL117523
-0.520579 KIAA1053 Proteína KIAA1053  -0.520579 KIAA1053  KIAA1053 protein

NMB_004515 NMB_004515
-0.520363 ILF2 Factor 2 de enlace con el potenciador de interleuquina, 45kD  -0.520363 ILF2  Link factor 2 with the interleukin enhancer, 45kD

NM_004708 NM_004708
-0.519935 PDCD5 Muerte programada de célula 5  -0.519935 PDCD5  Scheduled death of cell 5

NM_005935 NM_005935
0.519765 MLLT2 Leucemia mieloide/linfoide o de trazado mixto (homólogo de tritórax (Drosophila); trasladado a 2 0.519765 MLLT2  Myeloid / lymphoid or mixed-pathway leukemia (trithorax homologue (Drosophila); transferred to 2

Contig49289_RCContig49289_RC
-0.519546 ARNm de Homo sapiens; ADNc DKFZp586J1119 (del clon DKFZp586J1119); cds completo  -0.519546  MRNA from Homo sapiens; DKFZp586J1119 cDNA (from clone DKFZp586J1119); full cds

NMB_000211 NMB_000211
-0.519342 ITGB2 Integrina, beta 2 (antígeno CD18 (p95), antígeno 1 asociado a la función de linfocito; antígeno macrófago 1 (mac-1) subunidad beta)  -0.519342 ITGB2  Integrin, beta 2 (CD18 antigen (p95), lymphocyte-associated antigen 1; macrophage 1 antigen (mac-1) beta subunit)

AL079276  AL079276
0.519207 LOC58495 Proteína putativa de dedo de cinc procedente de EUROIMAGE 566589 0.519207  LOC58495  Putative zinc finger protein from EUROIMAGE 566589

Contig57825_RCContig57825_RC
0.519041 ESTs  0.519041 ESTs

NM_002466 NM_002466
-0.518911 MYBL2 Tipo 2 de homólogo de oncógeno viral de leucemia eritoblástica aviar v-erb-a  -0.518911  MYBL2  Type 2 of viral oncogene homolog of avian eritoblastic leukemia v-erb-a

NMB_016072 NMB_016072
-0.518802 LOC51026 Proteína CGI-141  -0.518802  LOC51026  CGI-141 protein

AB007950 AB007950
-0.518699 KIAA0481 Producto del gen KIAA0481  -0.518699 KIAA0481  Product of the KIAA0481 gene

NMB_001550 NMB_001550
-0.518549 IFRD1 Regulador de desarrollo 1 relacionado con el interferón  -0.518549 IFRD1  Interferon-related development regulator 1

AF155120 AF155120
-0.518221 UBE2V1 Variante 1 de la enzima E que conjuga con ubiquitina  -0.518221 UBE2V1  Variant 1 of enzyme E that conjugates with ubiquitin

Contig49849_RCContig49849_RC
0.517983 ESTs, ligeramente parecidos a laproteína AF188706 1 g20 [H.sapiens]  0.517983  ESTs, slightly similar to protein AF188706 1 g20 [H.sapiens]

NMB_016625 NMB_016625
-0.517936 LOC51319 Proteína hipotética  -0.517936  LOC51319  Hypothetical protein

NM_004049 NM_004049
-0.517862 BCL2A1 Proteína A1 relacionada con BCL2  -0.517862 BCL2A1  A1 protein related to BCL2

Contig50719_RCContig50719_RC
0.517740 ESTs  0.517740 ESTs

D80010 D80010
-0.517620 LPIN1 Lipina 1  -0.517620 LPIN1 Lipina 1

50 fifty

NM_000299  NM_000299
-0.517405 PKP1 Placofilina 1 (síndrome de displasia ectodérmica/fragilidad epidérmica)  -0.517405 PKP1  Placophilin 1 (ectodermal dysplasia syndrome / epidermal fragility)

AL049365  AL049365
0.517080 FTL Ferritina, polipéptido ligero 0.517080 FTL  Ferritin, light polypeptide

Contig65227 Contig65227
0.517003 ESTs 0.517003 ESTs

NM_004865 NM_004865
-0.516808 TBPL1 Tipo 1 de TBP  -0.516808 TBPL1 Type 1 of TBP

Contig54813_RC Contig54813_RC
0.516246 FLJ13962 Proteína hipotética FLJ13962  0.516246 FLJ13962  Hypothetical protein FLJ13962

NM_003494 NM_003494
-0.516221 DYSF Disferlina, distrofia de miopatía muscular de miembros 2B (autosómico recesivo)  -0.516221  DYSF  Dysferlin, muscular myopathy dystrophy of 2B members (autosomal recessive)

NM_004431 NM_004431
-0.516212 EPHA2 EphA2  -0.516212 EPHA2 EphA2

AL117600 AL117600
-0.516067 DKFZP564 J0863 Proteína DKFZP564J0863  -0.516067  DKFZP564 J0863  DKFZP564J0863 protein

AL080209  AL080209
-0.516037 DKFZP586 F2423 Proteína hipotética DKFZp586F2423  -0.516037  DKFZP586 F2423  Hypothetical protein DKFZp586F2423

NM_000135 NM_000135
-0.515613 FANCA Anemia de Fanconi, grupo de complementación A  -0.515613 FANCA  Anemia of Fanconi, complementation group A

NM_000050 NM_000050
-0.515494 ASS Argininosuccinato sintetasa  -0.515494 ASS  Argininosuccinate synthetase

NMB_001830 NMB_001830
-0.515439 CLCN4 Canal de cloruro 4  -0.515439 CLCN4  Chloride Channel 4

NMB_018234 NMB_018234
-0.515365 FLJ10829 Proteína hipotética FLJ10829  -0.515365 FLJ10829  Hypothetical protein FLJ10829

Contig53307_RCContig53307_RC
0.515328 ESTs, ligeramente parecidos a la proteína KIAA1437 [H.sapiens]  0.515328  ESTs, slightly similar to the KIAA1437 protein [H.sapiens]

AL117617 AL117617
-0.515141 ARNm de Homo sapiens; ADNc DKFZp564H0764 (del clon DKFZp564H0764)  -0.515141  MRNA from Homo sapiens; DKFZp564H0764 cDNA (from clone DKFZp564H0764)

NM_002906 NM_002906
-0.515098 RDX Radixina  -0.515098 RDX Radixin

NMB_003360 NMB_003360
-0.514427 UGT8 UDP glicosiltransferasa 8 (UDP-galactosa ceramida galactosiltransferasa)  -0.514427  UGT8  UDP glycosyltransferase 8 (UDP-galactose ceramide galactosyltransferase)

NM_018478 NM_018478
0.514332 HSMNP1 Proteína del hipotálamo no caracterizada HSMNP1 0.514332 HSMNP1  HSMNP1 uncharacterized hypothalamus protein

M90657 M90657
-0.513908 TM4SF1 Miembro 1 de la superfamilia de la transmembrana 4  -0.513908 TM4SF1  Member 1 of the transmembrane superfamily 4

NM_014967 NM_014967
0.513793 KIAA1018 Proteína KIAA1018 0.513793 KIAA1018 KIAA1018 protein

Contig1462_RC  Contig1462_RC
0.513604 C11ORF15 Marco de lectura abierta 15 del cromosoma 11 0.513604 C11ORF15  Open reading frame 15 of chromosome 11

ontig37287_RC  ontig37287_RC
-0.513324 ESTs  -0.513324 ESTs

NM_000355 NM_000355
-0.513225 TCN2 Transcobalamina II; anemia macrocítica anemia  -0.513225 TCN2  Transcobalamin II; macrocytic anemia anemia

AB037756 AB037756
0.512914 KIAA1335 hypothetical protein KIAA1335 0.512914 KIAA1335  hypothetical protein KIAA1335

Contig842_RC  Contig842_RC
-0.512880 ESTs  -0.512880 ESTs

NMB_018186 NMB_018186
-0.512878 FLJ10706 Proteína hipotética FLJ10706  -0.512878 FLJ10706  Hypothetical protein FLJ10706

NM_014668 NM_014668
0.512746 KIAA0575 Producto del gen KIAA0575 0.512746 KIAA0575  Product of the KIAA0575 gene

NM_003226 NM_003226
0.512611 TFF3 Factor de trébol 3 (intestinal) 0.512611  TFF3  Clover factor 3 (intestinal)

Contig56457_RCContig56457_RC
-0.512548 TMEFF1 Proteína de transmembrana con afín a EGF y dos dominios 1 afines a la folistatina  -0.512548  TMEFF1  Transmembrane protein related to EGF and two domains 1 related to folistatin

AL050367 AL050367
-0.511999 ARNm de Homo sapiens; ADNc DKFZp564A026 (del clon DKFZp564A026)  -0.511999  MRNA from Homo sapiens; DKFZp564A026 cDNA (from clone DKFZp564A026)

NM_014791 NM_014791
-0.511963 KIAA0175 Producto del gen KIAA0175  -0.511963 KIAA0175 Product of the KIAA0175 gene

Contig36312_RCContig36312_RC
0.511794 ESTs  0.511794 ESTs

NM_004811 NM_004811
-0.511447 LPXN Leupaxina  -0.511447 LPXN Leupaxin

Contig67182_RCContig67182_RC
-0.511416 ESTs, muy parecidos al precursor del antígeno epitelial de tipo V [H.sapiens]  -0.511416  ESTs, very similar to the precursor of type V epithelial antigen [H.sapiens]

Contig52723_RCContig52723_RC
-0.511134 ESTs  -0.511134 ESTs

Contigl 7105_RC  Contigl 7105_RC
-0.511072 ARNm de Homo sapiens para proteína citoplasmática putativa (ORF1-FL21)  -0.511072  Homo sapiens mRNA for putative cytoplasmic protein (ORF1-FL21)

NMB_014449 NMB_014449
0.511023 A Proteína "A" 0.511023 TO  Protein "A"

51 51

Contig52957_RCContig52957_RC
0.510815 ESTs  0.510815 ESTs

Contig49388_RCContig49388_RC
0.510582 FLJ13322 Proteína hipotética FLJ13322  0.510582 FLJ13322  Hypothetical protein FLJ13322

NM_017786 NM_017786
0.510557 FLJ20366 Proteína hipotética FLJ20366 0.510557 FLJ20366  Hypothetical protein FLJ20366

AL157476 AL157476
0.510478 ARNm de Homo sapiens; ADNc DKFZp761 C082 (del clon DKFZp761 C082) 0.510478  MRNA from Homo sapiens; DKFZp761 C082 cDNA (from clone DKFZp761 C082)

NMB_001919 NMB_001919
0.510242 DCl Dodecenoil-Coenzima A delta isomerasa (3,2 transenoil-Coenzima A isomerasa) 0.510242 DCl  Dodecenoyl-Coenzyme A delta isomerase (3,2 transenoyl-Coenzyme A isomerase)

NM_000268 NM_000268
-0.510165 NF2 Neurofibromina 2 (neuroma acústico bilateral)  -0.510165 NF2  Neurofibromin 2 (bilateral acoustic neuroma)

NMB_016210 NMB_016210
0.510018 LOC51161 Proteína g20 0.510018  LOC51161  G20 protein

Contig45816_RCContig45816_RC
-0.509977 ESTs  -0.509977 ESTs

NM_003953 NM_003953
-0.509969 MPZL1 Proteína de la mielina 1 de tipo cero  -0.509969 MPZL1  Myelin 1 protein type zero

NM_000057 NM_000057
-0.509669 BLM Síndrome de Bloom  -0.509669 BLM  Bloom syndrome

NM_014452 NM_014452
-0.509473 DR6 Receptor de muerte 6  -0.509473 DR6  Death Receiver 6

Contig45156_RCContig45156_RC
0.509284 ESTs, moderadamente parecidos al dominio motor de KIF12 [M.musculus]  0.509284  ESTs, moderately similar to the motor domain of KIF12 [M.musculus]

NM_006943 NM_006943
0.509149 SOX22 SRY (región determinante del sexo Y)-caja 22 0.509149 SOX22  SRY (sex determining region Y) - box 22

NM_000594 NM_000594
-0.509012 TNF Factor de necrosis tumoral (superfamilia TNF, miembro 2)  -0.509012 TNF  Tumor necrosis factor (TNF superfamily, member 2)

AL137316 AL137316
-0.508353 KIAA1609 Proteína KIAA1609  -0.508353 KIAA1609  KIAA1609 protein

NM_000557 NM_000557
-0.508325 GDF5 Factor de diferenciación del crecimiento 5 (proteína morfogénica 1 derivada de cartílago)  -0.508325  GDF5  Growth differentiation factor 5 (morphogenic protein 1 derived from cartilage)

NMB_018685 NMB_018685
-0.508307 ANLN Anilina (homólogo de Detritus de Drosophila), proteína de enlace con actina  -0.508307 ANLN  Aniline (Drosophila Detritus homolog), actin binding protein

Contig53401_RCContig53401_RC
0.508189 ESTs  0.508189 ESTs

NM_014364 NM_014364
-0.508170 GAPDS Gliceraldehído-3-fosfato dehidrogenasa, específica de los testículos  -0.508170 GAPDS  Gliceraldehyde-3-phosphate dehydrogenase, specific to the testicles

Contig50297_RCContig50297_RC
0.508137 ESTs, moderadamente parecidos a ALU8_ALU HUMANO SUBFAMILIA SX ENTRADA DE AVISO DE CONTAMINACIÓN DE SECUENCIA [H.sapiens]  0.508137  ESTs, moderately similar to ALU8_ALU HUMAN SUBFAMILIA SX SEQUENCE POLLUTION NOTICE ENTRY [H.sapiens]

Contig51800 Contig51800
0.507891 ESTs, moderadamente parecidos a ALU6_ALU HUMANO SUBFAMILIA SP ENTRADA DE AVISO DE CONTAMINACIÓN DE SECUENCIA [H.sapiens] 0.507891  ESTs, moderately similar to ALU6_ALU HUMANO SUBFAMILIA SP SEQUENCE POLLUTION NOTICE ENTRY [H.sapiens]

Contig49098_RCContig49098_RC
-0.507716 MGC4090 Proteína hipotética MGC4090  -0.507716  MGC4090  Hypothetical protein MGC4090

NM_002985 NM_002985
-0.507554 SCYA5 Citoquina inducible pequeña A5 (RANTES)  -0.507554  SCYA5  Small inducible cytokine A5 (RANTES)

AB007899 AB007899
0.507439 KIAA0439 Proteína KIAA0439; homólogo de ubiquitina-proteína ligasa de levadura Rsp5 0.507439 KIAA0439  KIAA0439 protein; yeast ubiquitin-protein ligase homolog Rsp5

AL110139 AL110139
0.507145 ARNm de Homo sapiens; ADNc DKFZp56401763 (del clon DKFZp56401763) 0.507145  MRNA from Homo sapiens; DKFZp56401763 cDNA (from clone DKFZp56401763)

Contig51117_RCContig51117_RC
0.507001 ESTs  0.507001 ESTs

NMB_017660 NMB_017660
-0.506768 FLJ20085 Proteína hipotética FLJ20085  -0.506768 FLJ20085  Hypothetical protein FLJ20085

NM_018000 NM_018000
0.506686 FLJ10116 Proteína hipotética FLJ10116 0.506686 FLJ10116  Hypothetical protein FLJ10116

NM_005555 NM_005555
-0.506516 KRT6B Queratina 6B  -0.506516 KRT6B  Keratin 6B

NM_005582 NM_005582
-0.506462 LY64 Homólogo de antígeno de linfocito 64 (ratón homolog, radioprotector, 105kD -0.506462 LY64  Lymphocyte antigen homolog 64 (mouse homolog, radioprotective, 105kD

Contig47405_RCContig47405_RC
0.506202 ESTs  0.506202 ESTs

NM_014808 NM_014808
0.506173 KIAA0793 Producto del gen KIAA0793 0.506173 KIAA0793  Product of the KIAA0793 gene

NM_004938 NM_004938
-0.506121 DAPK1 Proteína quinasa 1 asociada a la muerte  -0.506121 DAPK1  Protein kinase 1 associated with death

NM_020659  NM_020659
-0.505793 TTYH1 Homólogo 1 de tweety (Drosophila)  -0.505793  TTYH1  Tweety Homologue 1 (Drosophila)

NM_006227 NM_006227
-0.505604 PLTP Proteína de transferencia de fosfolípidos  -0.505604 PLTP  Phospholipid Transfer Protein

52 52

NMB_014268  NMB_014268
-0.505412 MAPRE2 Proteína asociada a microtúbulo, fammilia RP/EB, miembro 2  -0.505412 MAPRE2  Microtubule associated protein, RP / EB fammilia, member 2

NM_004711  NM_004711
0.504849 SYNGR1 Sinaptogirina 1 0.504849  SYNGR1 Synaptogirine 1

NMB_004418 NMB_004418
-0.504497 DUSP2 Fosfatasa 2 de especificidad dual  -0.504497 DUSP2  Dual specific phosphatase 2

NM_003508 NM_003508
-0.504475 FZD9 Homólogo 9 (Drosophila) rizado  -0.504475 FZD9 Homologous 9 (Drosophila) curly

Tabla 3. 430 marcadores de genes que distinguen entre muestras tumorales relacionadas con BRCA1-1 y muestras tumorales esporádicas Table 3. 430 gene markers that distinguish between tumor samples related to BRCA1-1 and sporadic tumor samples

Bando de Genes Número de Acceso SEQ ID NO Band of Genes Access Number SEQ ID NO
Bando de Genes Número de Acceso SEQ ID NO Band of Genes Access Number SEQ ID NO

AB002301 SEQ ID NO 4  AB002301 SEQ ID NO 4
NM_012391 SEQ ID NO 1406 NM_012391 SEQ ID NO 1406

AB004857 SEQ ID NO 8 AB004857 SEQ ID NO 8
NM_012428 SEQ ID NO 1412 NM_012428 SEQ ID NO 1412

AB007458 SEQ ID NO 12 AB007458 SEQ ID NO 12
NM_013233 SEQ ID NO 1418 NM_013233 SEQ ID NO 1418

AB014534 SEQ ID NO 29 AB014534 SEQ ID NO 29
NM_013253 SEQ ID NO 1422 NM_013253 SEQ ID NO 1422

AB018305 SEQ ID NO 34 AB018305 SEQ ID NO 34
NM_013262 SEQ ID NO 1425 NM_013262 SEQ ID NO 1425

AB020677 SEQ ID NO 36 AB020677 SEQ ID NO 36
NM_013372 SEQ ID NO 1434 NM_013372 SEQ ID NO 1434

AB020689 SEQ ID NO 37 AB020689 SEQ ID NO 37
NM_013378 SEQ ID NO 1435 NM_013378 SEQ ID NO 1435

AB023151 SEQ ID NO 41 AB023151 SEQ ID NO 41
NM_014096 SEQ ID NO 1450 NM_014096 SEQ ID NO 1450

AB023163 SEQ ID NO 43 AB023163 SEQ ID NO 43
NM_014242 SEQ ID NO 1464 NM_014242 SEQ ID NO 1464

AB028986 SEQ ID NO 48 AB028986 SEQ ID NO 48
NM_014314 SEQ ID NO 1472 NM_014314 SEQ ID NO 1472

AB029025 SEQ ID NO 50 AB029025 SEQ ID NO 50
NM_014398 SEQ ID NO 1486 NM_014398 SEQ ID NO 1486

AB032966 SEQ ID NO 53 AB032966 SEQ ID NO 53
NM_014402 SEQ ID NO 1488 NM_014402 SEQ ID NO 1488

AB032988 SEQ ID NO 57 AB032988 SEQ ID NO 57
NM_014476 SEQ ID NO 1496 NM_014476 SEQ ID NO 1496

AB033049 SEQ ID NO 63 AB033049 SEQ ID NO 63
NM_014521 SEQ ID NO 1499 NM_014521 SEQ ID NO 1499

AB033055 SEQ ID NO 66 AB033055 SEQ ID NO 66
NM_014585 SEQ ID NO 1504 NM_014585 SEQ ID NO 1504

AB037742 SEQ ID NO 73 AB037742 SEQ ID NO 73
NM_014597 SEQ ID NO 1506 NM_014597 SEQ ID NO 1506

AB041269 SEQ ID NO 96 AB041269 SEQ ID NO 96
NM_014642 SEQ ID NO 1510 NM_014642 SEQ ID NO 1510

AF000974 SEQ ID NO 97 AF000974 SEQ ID NO 97
NM_014679 SEQ ID NO 1517 NM_014679 SEQ ID NO 1517

AF042838 SEQ ID NO 111AF042838 SEQ ID NO 111
NM_014680 SEQ ID NO 1518  NM_014680 SEQ ID NO 1518

AF052155 SEQ ID NO 119AF052155 SEQ ID NO 119
NM_014700 SEQ ID NO 1520  NM_014700 SEQ ID NO 1520

AF055084 SEQ ID NO 125AF055084 SEQ ID NO 125
NM_014723 SEQ ID NO 1523  NM_014723 SEQ ID NO 1523

AF063725 SEQ ID NO 129AF063725 SEQ ID NO 129
NM_014770 SEQ ID NO 1530  NM_014770 SEQ ID NO 1530

AF070536 SEQ ID NO 133AF070536 SEQ ID NO 133
NM_014785 SEQ ID NO 1534  NM_014785 SEQ ID NO 1534

AF070617 SEQ ID NO 135AF070617 SEQ ID NO 135
NM_014817 SEQ ID NO 1539  NM_014817 SEQ ID NO 1539

AF073299 SEQ ID NO 136AF073299 SEQ ID NO 136
NM_014840 SEQ ID NO 1541  NM_014840 SEQ ID NO 1541

AF079529 SEQ ID NO 140AF079529 SEQ ID NO 140
NM_014878 SEQ ID NO 1546  NM_014878 SEQ ID NO 1546

AF090353 SEQ ID NO 141AF090353 SEQ ID NO 141
NM_015493 SEQ ID NO 1564  NM_015493 SEQ ID NO 1564

AF116238 SEQ ID NO 155AF116238 SEQ ID NO 155
NM_015523 SEQ ID NO 1568  NM_015523 SEQ ID NO 1568

AF151810 SEQ ID NO 171AF151810 SEQ ID NO 171
NM_015544 SEQ ID NO 1570  NM_015544 SEQ ID NO 1570

AF220492 SEQ ID NO 185AF220492 SEQ ID NO 185
NM_015623 SEQ ID NO 1572  NM_015623 SEQ ID NO 1572

AJ224741 SEQ ID NO 196AJ224741 SEQ ID NO 196
NM_015640 SEQ ID NO 1573  NM_015640 SEQ ID NO 1573

AJ250475 SEQ ID NO 201AJ250475 SEQ ID NO 201
NM_015721 SEQ ID NO 1576  NM_015721 SEQ ID NO 1576

AJ270996 SEQ ID NO 202AJ270996 SEQ ID NO 202
NM_015881 SEQ ID NO 1577  NM_015881 SEQ ID NO 1577

AJ272057 SEQ ID NO 203AJ272057 SEQ ID NO 203
NM_015937 SEQ ID NO 1582  NM_015937 SEQ ID NO 1582

AK000174 SEQ ID NO 211AK000174 SEQ ID NO 211
NM_015964 SEQ ID NO 1586  NM_015964 SEQ ID NO 1586

AK000617 SEQ ID NO 215AK000617 SEQ ID NO 215
NM_015984 SEQ ID NO 1587  NM_015984 SEQ ID NO 1587

53 53

AK000959  AK000959
SEQ ID NO 222 NM_016000 SEQ ID NO 1591               SEQ ID NO 222  NM_016000                       SEQ ID NO 1591

AK001438 AK001438
SEQ ID NO 229 NM_016018 SEQ ID NO 1593               SEQ ID NO 229  NM_016018                       SEQ ID NO 1593

AK001838 AK001838
SEQ ID NO 233 NM_016066 SEQ ID NO 1601               SEQ ID NO 233  NM_016066                       SEQ ID NO 1601

AK002107 AK002107
SEQ ID NO 238 NM_016073 SEQ ID NO 1603               SEQ ID NO 238  NM_016073                       SEQ ID NO 1603

AK002197 AK002197
SEQ ID NO 239 NM_016081 SEQ ID NO 1604               SEQ ID NO 239  NM_016081                       SEQ ID NO 1604

AL035297 AL035297
SEQ ID NO 241 NM_016140 SEQ ID NO 1611              SEQ ID NO 241  NM_016140                       SEQ ID NO 1611

AL049346 AL049346
SEQ ID NO 243 NM_016223 SEQ ID NO 1622              SEQ ID NO 243  NM_016223                       SEQ ID NO 1622

AL049370 AL049370
SEQ ID NO 245 NM_016267 SEQ ID NO 1629              SEQ ID NO 245  NM_016267                       SEQ ID NO 1629

AL049667 AL049667
SEQ ID NO 249 NM_016307 SEQ ID NO 1633              SEQ ID NO 249  NM_016307                       SEQ ID NO 1633

AL080222 AL080222
SEQ ID NO 276 NM_016364 SEQ ID NO 1639              SEQ ID NO 276  NM_016364                       SEQ ID NO 1639

AL096737 AL096737
SEQ ID NO 279 NM_016373 SEQ ID NO 1640              SEQ ID NO 279  NM_016373                       SEQ ID NO 1640

AL110163 AL110163
SEQ ID NO 282 NM_016459 SEQ ID NO 1646              SEQ ID NO 282  NM_016459                       SEQ ID NO 1646

AL133057 AL133057
SEQ ID NO 300 NM_016471 SEQ ID NO 1648              SEQ ID NO 300  NM_016471                       SEQ ID NO 1648

AL133096 AL133096
SEQ ID NO 302 NM_016548 SEQ ID NO 1654              SEQ ID NO 302  NM_016548                       SEQ ID NO 1654

AL133572 AL133572
SEQ ID NO 305 NM_016620 SEQ ID NO 1662              SEQ ID NO 305  NM_016620                       SEQ ID NO 1662

AL133619 AL133619
SEQ ID NO 307 NM_016820 SEQ ID NO 1674              SEQ ID NO 307  NM_016820                       SEQ ID NO 1674

AL133623 AL133623
SEQ ID NO 309 NM_017423 SEQ ID NO 1678              SEQ ID NO 309  NM_017423                       SEQ ID NO 1678

AL137347 AL137347
SEQ ID NO 320 NM_017709 SEQ ID NO 1698              SEQ ID NO 320  NM_017709                       SEQ ID NO 1698

AL137381 AL137381
SEQ ID NO 322 NM_017732 SEQ ID NO 1700              SEQ ID NO 322  NM_017732                       SEQ ID NO 1700

AL137461 AL137461
SEQ ID NO 325 NM_017734 SEQ ID NO 1702              SEQ ID NO 325  NM_017734                       SEQ ID NO 1702

AL137540 AL137540
SEQ ID NO 328 NM_017750 SEQ ID NO 1704              SEQ ID NO 328  NM_017750                       SEQ ID NO 1704

AL137555 AL137555
SEQ ID NO 329 NM_017763 SEQ ID NO 1706              SEQ ID NO 329  NM_017763                       SEQ ID NO 1706

AL137638 AL137638
SEQ ID NO 332 NM_017782 SEQ ID NO 1710              SEQ ID NO 332  NM_017782                       SEQ ID NO 1710

AL137639 AL137639
SEQ ID NO 333 NM_017816 SEQ ID NO 1714              SEQ ID NO 333  NM_017816                       SEQ ID NO 1714

AL137663 AL137663
SEQ ID NO 334 NM_018043 SEQ ID NO 1730              SEQ ID NO 334  NM_018043                       SEQ ID NO 1730

AL137761 AL137761
SEQ ID NO 339 NM_018072 SEQ ID NO 1734              SEQ ID NO 339  NM_018072                       SEQ ID NO 1734

AL157431 AL157431
SEQ ID NO 340 NM_018093 SEQ ID NO 1738              SEQ ID NO 340  NM_018093                       SEQ ID NO 1738

AL161960 AL161960
SEQ ID NO 351 NM_018103 SEQ ID NO 1742              SEQ ID NO 351  NM_018103                        SEQ ID NO 1742

AL355708 AL355708
SEQ ID NO 353 NM_018171 SEQ ID NO 1751              SEQ ID NO 353  NM_018171                        SEQ ID NO 1751

AL359053 AL359053
SEQ ID NO 354 NM_018187 SEQ ID NO 1755              SEQ ID NO 354  NM_018187                        SEQ ID NO 1755

D26488 D26488
SEQ ID NO 359 NM_018188 SEQ ID NO 1756              SEQ ID NO 359  NM_018188                       SEQ ID NO 1756

D38521 D38521
SEQ ID NO 361 NM_018222 SEQ ID NO 1761              SEQ ID NO 361  NM_018222                       SEQ ID NO 1761

D50914 D50914
SEQ ID NO 367 NM_018228 SEQ ID NO 1762              SEQ ID NO 367  NM_018228                       SEQ ID NO 1762

D80001 D80001
SEQ ID NO 369 NM_018373 SEQ ID NO 1777              SEQ ID NO 369  NM_018373                       SEQ ID NO 1777

G26403  G26403
SEQ ID NO 380 NM_018390 SEQ ID NO 1781               SEQ ID NO 380  NM_018390                       SEQ ID NO 1781

K02276 K02276
SEQ ID NO 383 NM_018422 SEQ ID NO 1784              SEQ ID NO 383  NM_018422                       SEQ ID NO 1784

M21551 M21551
SEQ ID NO 394 NM_018509 SEQ ID NO 1792              SEQ ID NO 394  NM_018509                       SEQ ID NO 1792

M27749 M27749
SEQ ID NO 397 NM_018584 SEQ ID NO 1796              SEQ ID NO 397  NM_018584                       SEQ ID NO 1796

M28170 M28170
SEQ ID NO 398 NM_018653 SEQ ID NO 1797              SEQ ID NO 398  NM_018653                       SEQ ID NO 1797

M73547 M73547
SEQ ID NO 409 NM_018660 SEQ ID NO 1798              SEQ ID NO 409  NM_018660                       SEQ ID NO 1798

M80899 M80899
SEQ ID NO 411 NM_018683 SEQ ID NO 1799              SEQ ID NO 411  NM_018683                       SEQ ID NO 1799

NM_000067 NM_000067
SEQ ID NO 423 NM_019049 SEQ ID NO 1814             SEQ ID NO 423  NM_019049                       SEQ ID NO 1814

NM_000087 NM_000087
SEQ ID NO 427 NM_019063 SEQ ID NO 1815             SEQ ID NO 427  NM_019063                       SEQ ID NO 1815

NM_000090 NM_000090
SEQ ID NO 428 NM_020150 SEQ ID NO 1823             SEQ ID NO 428  NM_020150                       SEQ ID NO 1823

NMB_000165 NMB_000165
SEQ ID NO 444 NM_020987 SEQ ID NO 1848              SEQ ID NO 444  NM_020987                       SEQ ID NO 1848

NM_000168 NM_000168
SEQ ID NO 445 NM_021095 SEQ ID NO 1855             SEQ ID NO 445  NM_021095                       SEQ ID NO 1855

NM_000196 NM_000196
SEQ ID NO 449 NM_021242 SEQ ID NO 1867             SEQ ID NO 449  NM_021242                       SEQ ID NO 1867

54 54

NM_000269  NM_000269
SEQ ID NO 457 U41387 SEQ ID NO 1877             SEQ ID NO 457  U41387                       SEQ ID NO 1877

NM_000310 NM_000310
SEQ ID NO 466 U45975 SEQ ID NO 1878             SEQ ID NO 466  U45975                       SEQ ID NO 1878

NM_000396 NM_000396
SEQ ID NO 479 U58033 SEQ ID NO 1881            SEQ ID NO 479 U58033                       SEQ ID NO 1881

NM_000397 NM_000397
SEQ ID NO 480 U67784 SEQ ID NO 1884             SEQ ID NO 480  U67784                       SEQ ID NO 1884

NM_000597 NM_000597
SEQ ID NO 502 U68385 SEQ ID NO 1885             SEQ ID NO 502  U68385                       SEQ ID NO 1885

NM_000636 NM_000636
SEQ ID NO 509 U80736 SEQ ID NO 1890             SEQ ID NO 509  U80736                       SEQ ID NO 1890

NM_000888 NM_000888
SEQ ID NO 535 X00437 SEQ ID NO 1899             SEQ ID NO 535  X00437                       SEQ ID NO 1899

NM_000903 NM_000903
SEQ ID NO 536 X07203 SEQ ID NO 1904              SEQ ID NO 536  X07203                       SEQ ID NO 1904

NM_000930 NM_000930
SEQ ID NO 540 X16302 SEQ ID NO 1907              SEQ ID NO 540  X16302                       SEQ ID NO 1907

NM_000931 NM_000931
SEQ ID NO 541 X51630 SEQ ID NO 1908              SEQ ID NO 541  X51630                       SEQ ID NO 1908

NM_000969 NM_000969
SEQ ID NO 547 X57809 SEQ ID NO 1912              SEQ ID NO 547  X57809                       SEQ ID NO 1912

NM_000984 NM_000984
SEQ ID NO 548 X57819 SEQ ID NO 1913              SEQ ID NO 548  X57819                       SEQ ID NO 1913

NM_001026 NM_001026
SEQ ID NO 552 X58529 SEQ ID NO 1914              SEQ ID NO 552  X58529                       SEQ ID NO 1914

NM_001054 NM_001054
SEQ ID NO 554 X66087 SEQ ID NO 1916              SEQ ID NO 554  X66087                       SEQ ID NO 1916

NM_001179 NM_001179
SEQ ID NO 567 X69150 SEQ ID NO 1917              SEQ ID NO 567  X69150                       SEQ ID NO 1917

NM_001184 NM_001184
SEQ ID NO 568 X72475 SEQ ID NO 1918             SEQ ID NO 568  X72475                       SEQ ID NO 1918

NM_001204 NM_001204
SEQ ID NO 571 X74794 SEQ ID NO 1920             SEQ ID NO 571  X74794                       SEQ ID NO 1920

NM_001206 NM_001206
SEQ ID NO 572 X75315 SEQ ID NO 1921             SEQ ID NO 572  X75315                       SEQ ID NO 1921

NM_001218 NM_001218
SEQ ID NO 575 X84340 SEQ ID NO 1925             SEQ ID NO 575  X84340                       SEQ ID NO 1925

NM_001275 NM_001275
SEQ ID NO 586 X98260 SEQ ID NO 1928             SEQ ID NO 586  X98260                       SEQ ID NO 1928

NM_001394 NM_001394
SEQ ID NO 602 Y07512 SEQ ID NO 1931             SEQ ID NO 602 Y07512                       SEQ ID NO 1931

NM_001424 NM_001424
SEQ ID NO 605 Y14737 SEQ ID NO 1932             SEQ ID NO 605 Y14737                       SEQ ID NO 1932

NM_001448 NM_001448
SEQ ID NO 610 Z34893 SEQ ID NO 1934             SEQ ID NO 610  Z34893                        SEQ ID NO 1934

NM_001504 NM_001504
SEQ ID NO 620 Contig237_RC SEQ ID NO 1940             SEQ ID NO 620  Contig237_RC                       SEQ ID NO 1940

NM_001553 NM_001553
SEQ ID NO 630 Contig292_RC SEQ ID NO 1942             SEQ ID NO 630  Contig292_RC                       SEQ ID NO 1942

NM_001674 NM_001674
SEQ ID NO 646 Contig372_RC SEQ ID NO 1943             SEQ ID NO 646  Contig372_RC                       SEQ ID NO 1943

NM_001675 NM_001675
SEQ ID NO 647 Contig756_RC SEQ ID NO 1955             SEQ ID NO 647  Contig756_RC                       SEQ ID NO 1955

NM_001725 NM_001725
SEQ ID NO 652 Contig842_RC SEQ ID NO 1958             SEQ ID NO 652  Contig842_RC                       SEQ ID NO 1958

NM_001740 NM_001740
SEQ ID NO 656 Contig1632_RC SEQ ID NO 1977             SEQ ID NO 656  Contig1632_RC                       SEQ ID NO 1977

NM_001756 NM_001756
SEQ ID NO 659 Contig1826 RC SEQ ID NO 1980             SEQ ID NO 659  Contig1826 RC                       SEQ ID NO 1980

NM_001770 NM_001770
SEQ ID NO 664 Contig2237_RC SEQ ID NO 1988             SEQ ID NO 664  Contig2237_RC                       SEQ ID NO 1988

NM_001797 NM_001797
SEQ ID NO 670 Contig2915 RC SEQ ID NO 2003             SEQ ID NO 670  Contig2915 RC                       SEQ ID NO 2003

NM_001845 NM_001845
SEQ ID NO 680 Contig3164 RC SEQ ID NO 2007             SEQ ID NO 680  Contig3164 RC                       SEQ ID NO 2007

NM_001873 NM_001873
SEQ ID NO 684 Contig3252_RC SEQ ID NO 2008             SEQ ID NO 684  Contig3252_RC                       SEQ ID NO 2008

NM_001888 NM_001888
SEQ ID NO 687 Contig3940_RC SEQ ID NO 2018              SEQ ID NO 687  Contig3940_RC                         SEQ ID NO 2018

NM_001892 NM_001892
SEQ ID NO 688 Contig9259_RC SEQ ID NO 2039              SEQ ID NO 688  Contig9259_RC                          SEQ ID NO 2039

NM_001919 NM_001919
SEQ ID NO 694 Contig10268_RC SEQ ID NO 2041              SEQ ID NO 694  Contig10268_RC SEQ ID NO 2041

NM_001946  NM_001946
SEQ ID NO 698 Contig10437_RC SEQ ID NO 2043              SEQ ID NO 698  Contig10437_RC SEQ ID NO 2043

NM_001953  NM_001953
SEQ ID NO 699 Contig10973_RC SEQ ID NO 2044              SEQ ID NO 699  Contig10973_RC SEQ ID NO 2044

NM_001960  NM_001960
SEQ ID NO 704 Contig14390_RC SEQ ID NO 2054              SEQ ID NO 704  Contig14390_RC SEQ ID NO 2054

NM_001985  NM_001985
SEQ ID NO 709 Contig16453_RC SEQ ID NO 2060              SEQ ID NO 709  Contig16453_RC SEQ ID NO 2060

NM_002023  NM_002023
SEQ ID NO 712 Contig16759 RC SEQ ID NO 2061              SEQ ID NO 712  Contig16759 RC                          SEQ ID NO 2061

NM_002051 NM_002051
SEQ ID NO 716 Contig19551 SEQ ID NO 2070              SEQ ID NO 716  Contig19551 SEQ ID NO 2070

NM_002053  NM_002053
SEQ ID NO 717 Contig24541_RC SEQ ID NO 2088              SEQ ID NO 717  Contig24541_RC SEQ ID NO 2088

NM_002164  NM_002164
SEQ ID NO 734 Contig25362 RC SEQ ID NO 2093              SEQ ID NO 734  Contig25362 RC SEQ ID NO 2093

NM_002200  NM_002200
SEQ ID NO 739 Contig25617 RC SEQ ID NO 2094              SEQ ID NO 739  Contig25617 RC SEQ ID NO 2094

NM_002201  NM_002201
SEQ ID NO 740 Contig25722 RC SEQ ID NO 2096              SEQ ID NO 740  Contig25722 RC SEQ ID NO 2096

55 55

NM_002213  NM_002213
SEQ ID NO 741 Contig26022 RC SEQ ID NO 2099              SEQ ID NO 741  Contig26022 RC SEQ ID NO 2099

NM_002250  NM_002250
SEQ ID NO 747 Contig27915 RC SEQ ID NO 2114              SEQ ID NO 747  Contig27915 RC SEQ ID NO 2114

NM_002512  NM_002512
SEQ ID NO 780 Contig28081_RC SEQ ID NO 2116              SEQ ID NO 780  Contig28081_RC SEQ ID NO 2116

NM_002542  NM_002542
SEQ ID NO 784 Contig28179 RC SEQ ID NO 2118              SEQ ID NO 784  Contig28179 RC SEQ ID NO 2118

NM_002561  NM_002561
SEQ ID NO 786 Contig28550_RC SEQ ID NO 2119 D              SEQ ID NO 786 Contig28550_RC SEQ ID NO 2119 D

NM_002615 NM_002615
SEQ ID NO 793 Contig29639 RC SEQ ID NO 2127  SEQ ID NO 793  Contig29639 RC  SEQ ID NO 2127

NM_002686 NM_002686
SEQ ID NO 803 Contig29647 RC SEQ ID NO 2128  SEQ ID NO 803  Contig29647 RC  SEQ ID NO 2128

NM_002709 NM_002709
SEQ ID NO 806 Contig30092 RC SEQ ID NO 2130  SEQ ID NO 806  Contig30092 RC  SEQ ID NO 2130

NM_002742 NM_002742
SEQ ID NO 812 Contig30209_RC SEQ ID NO 2132  SEQ ID NO 812  Contig30209_RC  SEQ ID NO 2132

NM_002775 NM_002775
SEQ ID NO 815 Contig32185_RC SEQ ID NO 2156  SEQ ID NO 815  Contig32185_RC  SEQ ID NO 2156

NM_002975 NM_002975
SEQ ID NO 848 Contig32798_RC SEQ ID NO 2161  SEQ ID NO 848  Contig32798_RC  SEQ ID NO 2161

NM_002982 NM_002982
SEQ ID NO 849 Contig33230_RC SEQ ID NO 2163  SEQ ID NO 849  Contig33230_RC  SEQ ID NO 2163

NM_003104 NM_003104
SEQ ID NO 870 Contig33394_RC SEQ ID NO 2165  SEQ ID NO 870  Contig33394_RC  SEQ ID NO 2165

NM_003118 NM_003118
SEQ ID NO 872 Contig36323_RC SEQ ID NO 2197  SEQ ID NO 872  Contig36323_RC  SEQ ID NO 2197

NM_003144 NM_003144
SEQ ID NO 876 Contig36761_RC SEQ ID NO 2201  SEQ ID NO 876  Contig36761_RC  SEQ ID NO 2201

NM_003165 NM_003165
SEQ ID NO 882 Contig37141_RC SEQ ID NO 2209  SEQ ID NO 882  Contig37141_RC  SEQ ID NO 2209

NM_003197 NM_003197
SEQ ID NO 885 Contig37778_RC SEQ ID NO 2218  SEQ ID NO 885  Contig37778_RC  SEQ ID NO 2218

NM_003202 NM_003202
SEQ ID NO 886 Contig38285_RC SEQ ID NO 2222  SEQ ID NO 886  Contig38285_RC  SEQ ID NO 2222

NM_003462 NM_003462
SEQ ID NO 911 Contig39826_RC SEQ ID NO 2241 SEQ ID NO 911  Contig39826_RC  SEQ ID NO 2241

NM_003500 NM_003500
SEQ ID NO 918 Contig40212_RC SEQ ID NO 2251 SEQ ID NO 918  Contig40212_RC  SEQ ID NO 2251

NM_003561 NM_003561
SEQ ID NO 925 Contig40712_RC SEQ ID NO 2257 SEQ ID NO 925  Contig40712_RC  SEQ ID NO 2257

NM_003607 NM_003607
SEQ ID NO 930 Contig41402_RC SEQ ID NO 2265 SEQ ID NO 930  Contig41402_RC SEQ ID NO 2265

NM_003633  NM_003633
SEQ ID NO 933 Contig41635_RC SEQ ID NO 2272 SEQ ID NO 933  Contig41635_RC  SEQ ID NO 2272

NM_003641NM_003641
SEQ ID NO 934 Contig42006_RC SEQ ID NO 2280  SEQ ID NO 934  Contig42006_RC  SEQ ID NO 2280

NM_003683 NM_003683
SEQ ID NO 943 Contig42220_RC SEQ ID NO 2286  SEQ ID NO 943  Contig42220_RC  SEQ ID NO 2286

NM_003729 NM_003729
SEQ ID NO 949 Contig42306_RC SEQ ID NO 2287  SEQ ID NO 949  Contig42306_RC  SEQ ID NO 2287

NM_003793 NM_003793
SEQ ID NO 954 Contig43918_RC SEQ ID NO 2312  SEQ ID NO 954  Contig43918_RC  SEQ ID NO 2312

NM_003829 NM_003829
SEQ ID NO 958 Contig44195_RC SEQ ID NO 2316  SEQ ID NO 958  Contig44195_RC  SEQ ID NO 2316

NM_003866 NM_003866
SEQ ID NO 961 Contig44265_RC SEQ ID NO 2318  SEQ ID NO 961  Contig44265_RC  SEQ ID NO 2318

NM_003904 NM_003904
SEQ ID NO 967 Contig44278_RC SEQ ID NO 2319  SEQ ID NO 967  Contig44278_RC  SEQ ID NO 2319

NM_003953 NM_003953
SEQ ID NO 974 Contig44757_RC SEQ ID NO 2329  SEQ ID NO 974  Contig44757_RC  SEQ ID NO 2329

NM_004024 NM_004024
SEQ ID NO 982 Contig45588_RC SEQ ID NO 2349  SEQ ID NO 982  Contig45588_RC  SEQ ID NO 2349

NM_004053 NM_004053
SEQ ID NO 986 Contig46262_RC SEQ ID NO 2361  SEQ ID NO 986  Contig46262_RC  SEQ ID NO 2361

NM_004295 NM_004295
SEQ ID NO 1014 Contig46288_RC SEQ ID NO 2362  SEQ ID NO 1014  Contig46288_RC  SEQ ID NO 2362

NM_004438 NM_004438
SEQ ID NO 1038 Contig46343_RC SEQ ID NO 2363  SEQ ID NO 1038  Contig46343_RC  SEQ ID NO 2363

NM_004559 NM_004559
SEQ ID NO 1057 Contig46452_RC SEQ ID NO 2366  SEQ ID NO 1057  Contig46452_RC  SEQ ID NO 2366

NM_004616 NM_004616
SEQ ID NO 1065 Contig46868_RC SEQ ID NO 2373  SEQ ID NO 1065  Contig46868_RC  SEQ ID NO 2373

NM_004741 NM_004741
SEQ ID NO 1080 Contig46937_RC SEQ ID NO 2377  SEQ ID NO 1080  Contig46937_RC  SEQ ID NO 2377

NM_004772 NM_004772
SEQ ID NO 1084 Contig48004_RC SEQ ID NO 2393  SEQ ID NO 1084  Contig48004_RC  SEQ ID NO 2393

NM_004791 NM_004791
SEQ ID NO 1086 Contig48249_RC SEQ ID NO 2397  SEQ ID NO 1086  Contig48249_RC  SEQ ID NO 2397

NM_004848 NM_004848
SEQ ID NO 1094 Contig48774_RC SEQ ID NO 2405  SEQ ID NO 1094  Contig48774_RC  SEQ ID NO 2405

NM_004866 NM_004866
SEQ ID NO 1097 Contig48913_RC SEQ ID NO 2411  SEQ ID NO 1097  Contig48913_RC  SEQ ID NO 2411

NM_005128 NM_005128
SEQ ID NO 1121 Contig48945_RC SEQ ID NO 2412  SEQ ID NO 1121  Contig48945_RC  SEQ ID NO 2412

NM_005148 NM_005148
SEQ ID NO 1124 Contig48970_RC SEQ ID NO 2413  SEQ ID NO 1124  Contig48970_RC  SEQ ID NO 2413

NM_005196 NM_005196
SEQ ID NO 1127 Contig49233_RC SEQ ID NO 2419  SEQ ID NO 1127  Contig49233_RC  SEQ ID NO 2419

NM_005326 NM_005326
SEQ ID NO 1140 Contig49289_RC SEQ ID NO 2422  SEQ ID NO 1140  Contig49289_RC  SEQ ID NO 2422

NM_005518 NM_005518
SEQ ID NO 1161 Contig49342_RC SEQ ID NO 2423  SEQ ID NO 1161  Contig49342_RC  SEQ ID NO 2423

56 56

NM_005538 SEQ ID NO 1163  NM_005538 SEQ ID NO 1163
Contig49510_RC SEQ ID NO 2430  Contig49510_RC SEQ ID NO 2430

NM_005557 SEQ ID NO 1170 NM_005557 SEQ ID NO 1170
Contig49855_RC SEQ ID NO 2440  Contig49855_RC SEQ ID NO 2440

NM_005718 SEQ ID NO 1189 NM_005718 SEQ ID NO 1189
Contig49948_RC SEQ ID NO 2442  Contig49948_RC SEQ ID NO 2442

NM_005804 SEQ ID NO 1201 NM_005804 SEQ ID NO 1201
Contig50297_RC SEQ ID NO 2451  Contig50297_RC SEQ ID NO 2451

NM_005824 SEQ ID NO 1203 NM_005824 SEQ ID NO 1203
Contig50669_RC SEQ ID NO 2458  Contig50669_RC SEQ ID NO 2458

NM_005935 SEQ ID NO 1220 NM_005935 SEQ ID NO 1220
Contig50673_RC SEQ ID NO 2459  Contig50673_RC SEQ ID NO 2459

NM_006002 SEQ ID NO 1225 NM_006002 SEQ ID NO 1225
Contig50838_RC SEQ ID NO 2465  Contig50838_RC SEQ ID NO 2465

NM_006148 SEQ ID NO 1249 NM_006148 SEQ ID NO 1249
Contig51068_RC SEQ ID NO 2471  Contig51068_RC SEQ ID NO 2471

NM_006235 SEQ ID NO 1257 NM_006235 SEQ ID NO 1257
Contig51929 SEQ ID NO 2492 Contig51929 SEQ ID NO 2492

NM_006271 SEQ ID NO 1261 NM_006271 SEQ ID NO 1261
Contig51953_RC SEQ ID NO 2493  Contig51953_RC SEQ ID NO 2493

NM_006287 SEQ ID NO 1264 NM_006287 SEQ ID NO 1264
Contig52405_RC SEQ ID NO 2502  Contig52405_RC SEQ ID NO 2502

NM_006296 SEQ ID NO 1267 NM_006296 SEQ ID NO 1267
Contig52543_RC SEQ ID NO 2505  Contig52543_RC SEQ ID NO 2505

NM_006378 SEQ ID NO 1275 NM_006378 SEQ ID NO 1275
Contig52720_RC SEQ ID NO 2513  Contig52720_RC SEQ ID NO 2513

NM_006461 SEQ ID NO 1287 NM_006461 SEQ ID NO 1287
Contig53281_RC SEQ ID NO 2530  Contig53281_RC SEQ ID NO 2530

NM_006573 SEQ ID NO 1300 NM_006573 SEQ ID NO 1300
Contig53598_RC SEQ ID NO 2537  Contig53598_RC SEQ ID NO 2537

NM_006622 SEQ ID NO 1302 NM_006622 SEQ ID NO 1302
Contig53757_RC SEQ ID NO 2543  Contig53757_RC SEQ ID NO 2543

NM_006696 SEQ ID NO 1308 NM_006696 SEQ ID NO 1308
Contig53944_RC SEQ ID NO 2545  Contig53944_RC SEQ ID NO 2545

NM_006769 SEQ ID NO 1316 NM_006769 SEQ ID NO 1316
Contig54425 SEQ ID NO 2561 Contig54425 SEQ ID NO 2561

NM_006787 SEQ ID NO 1319 NM_006787 SEQ ID NO 1319
Contig54547_RC SEQ ID NO 2565  Contig54547_RC SEQ ID NO 2565

NM_006875 SEQ ID NO 1334 NM_006875 SEQ ID NO 1334
Contig54757_RC SEQ ID NO 2574  Contig54757_RC SEQ ID NO 2574

NM_006885 SEQ ID NO 1335 NM_006885 SEQ ID NO 1335
Contig54916_RC SEQ ID NO 2581  Contig54916_RC SEQ ID NO 2581

NM_006918 SEQ ID NO 1339 NM_006918 SEQ ID NO 1339
Contig55770_RC SEQ ID NO 2604  Contig55770_RC SEQ ID NO 2604

NM_006923 SEQ ID NO 1340 NM_006923 SEQ ID NO 1340
Contig55801_RC SEQ ID NO 2606  Contig55801_RC SEQ ID NO 2606

NM_006941 SEQ ID NO 1342 NM_006941 SEQ ID NO 1342
Contig56143_RC SEQ ID NO 2619  Contig56143_RC SEQ ID NO 2619

NM_007070 SEQ ID NO 1354 NM_007070 SEQ ID NO 1354
Contig56160_RC SEQ ID NO 2620  Contig56160_RC SEQ ID NO 2620

NM_007088 SEQ ID NO 1356 NM_007088 SEQ ID NO 1356
Contig56303_RC SEQ ID NO 2626  Contig56303_RC SEQ ID NO 2626

NM_007146 SEQ ID NO 1358 NM_007146 SEQ ID NO 1358
Contig57023_RC SEQ ID NO 2639  Contig57023_RC SEQ ID NO 2639

NM_007173 SEQ ID NO 1359 NM_007173 SEQ ID NO 1359
Contig57138_RC SEQ ID NO 2644  Contig57138_RC SEQ ID NO 2644

NM_007246 SEQ ID NO 1366NM_007246 SEQ ID NO 1366
Contig57609_RC SEQ ID NO 2657  Contig57609_RC SEQ ID NO 2657

NM_007358 SEQ ID NO 1374  NM_007358 SEQ ID NO 1374
Contig58301_RC SEQ ID NO 2667  Contig58301_RC SEQ ID NO 2667

NM_012135 SEQ ID NO 1385 NM_012135 SEQ ID NO 1385
Contig58512_RC SEQ ID NO 2670  Contig58512_RC SEQ ID NO 2670

NM_012151 SEQ ID NO 1387 NM_012151 SEQ ID NO 1387
Contig60393 SEQ ID NO 2674 Contig60393 SEQ ID NO 2674

NM_012258 SEQ ID NO 1396 NM_012258 SEQ ID NO 1396
Contig60509_RC SEQ ID NO 2675  Contig60509_RC SEQ ID NO 2675

NM_012317 SEQ ID NO 1399 NM_012317 SEQ ID NO 1399
Contig61254_RC SEQ ID NO 2677  Contig61254_RC SEQ ID NO 2677

NM_012337 SEQ ID NO 1403 NM_012337 SEQ ID NO 1403
Contig62306 SEQ ID NO 2680 Contig62306 SEQ ID NO 2680

NM_012339 SEQ ID NO 1404 NM_012339 SEQ ID NO 1404
Contig64502 SEQ ID NO 2689 Contig64502 SEQ ID NO 2689

Tabla 4. 100 marcadores preferidos de la Tabla 3 que distinguen entre tumores relacionados con BRCA1 y tumores esporádicos. Table 4. 100 preferred markers of Table 3 that distinguish between BRCA1-related tumors and sporadic tumors.

Identificador Identifier
Correlación Nombre de secuencia Descripción Correlation  Sequence name  Description

NM_001892 NM_001892
-0.651689 CSNK1A1 Caseína quinasa 1, alfa 1  -0.651689 CSNK1A1  Casein kinase 1, alpha 1

NM_018171 NM_018171
-0.637696 FLJ10659 Proteína hipotética FLJ10659  -0.637696 FLJ10659  Hypothetical protein FLJ10659

Contig40712_RC Contig40712_RC
-0.612509 ESTs  -0.612509 ESTs

NM_001204 NM_001204
-0.608470 BMPR2 Receptor de proteína morfogenética de los huesos, tipo II (serina/treonina quinasa)  -0.608470 BMPR2  Bone morphogenetic protein receptor, type II (serine / threonine kinase)

57 57

NM_005148  NM_005148
-0.598612 UNC119 Homólogo de unc119 (C.elegans)  -0.598612 UNC119  Homologue of unc119 (C.elegans)

G26403  G26403
0.585054 YWHAH Proteína de activación de tirosina 3- monooxigenasa/triptofano 5monooxigenasa, polipéptido eta 0.585054 YWHAH  Tyrosine 3- monooxygenase / tryptophan 5monooxygenase activation protein, eta polypeptide

NM_015640 NM_015640
0.583397 PAI-RBP1 Proteína de enlace con PAI-1 ARNm 0.583397 PAI-RBP1  PAI-1 mRNA binding protein

Contig9259_RC  Contig9259_RC
0.581362 ESTs 0.581362 ESTs

AB033049 AB033049
-0.578750 KIAA1223 Proteína KIAA1223  -0.578750 KIAA1223  KIAA1223 protein

NM_015523 NM_015523
0.576029 DKFZP566E144 Pequeño fragmento de nucleasa 0.576029  DKFZP566E144  Small nuclease fragment

Contig41402_RC  Contig41402_RC
-0.571650 Secuencia de ADN humano del clon RP11-16L21 en el cromosoma 9. Contiene el gen para leucotrieno B4 12-hidroxidehidrogenasa dependiente de NDAP, el gen para una nueva proteína de dominio DnaJ parecida a Drosophila, C. elegans y a las proteínas previstas por Arabidopsis, el gen GNG10 para la proteína gene de enlace con nucleótido de guanina 10, un nuevo gen, ESTs, STSs, GSSs y seis islas CpG -0.571650 Human DNA sequence of clone RP11-16L21 on chromosome 9. Contains the N4AP-dependent leukotriene B4 12-hydroxidehydrogenase gene, the gene for a new DnaJ domain protein similar to Drosophila, C. elegans and the proteins provided by Arabidopsis, the GNG10 gene for guanine 10 nucleotide binding gene protein, a new gene, ESTs, STSs, GSSs and six CpG islands

NM_004791  NM_004791
-0.564819 ITGBL1 Integrina, tipo 1 beta (con dominios de repetición afines a EGF)  -0.564819 ITGBL1  Integrin, type 1 beta (with repeat domains related to EGF)

NM_007070  NM_007070
0.561173 FAP48 Proteína asociada a FKBP 0.561173 FAP48  FKBP associated protein

NM_014597 NM_014597
0.555907 HSU15552 ARNm ácido de proteína 82 kDa 0.555907 HSU15552  82 kDa protein acid mRNA

AF000974 AF000974
0.547194 TRIP6 Interactor 6 del receptor de hormonas de la tiroides 0.547194 TRIP6  Thyroid Hormone Receptor Interactor 6

NM_016073 NM_016073
-0.547072 CGI-142 CGI-142  -0.547072  CGI-142  CGI-142

Contig3940_RC  Contig3940_RC
0.544073 YWHAH Proteína de activación de tirosina 3-mono-oxygenasa/triptofano 5monooxygenasa, polipépeptido eta 0.544073 YWHAH  3-mono-oxygenase / tryptophan 5monooxygenase tyrosine activation protein, eta polypeptide

NM_003683 NM_003683
0.542219 D2152056E Segmento de AND en cromosoma 21 (único) secuencia expresada 2056 0.542219 D2152056E  AND segment on chromosome 21 (single) sequence expressed 2056

Contig58512_RC Contig58512_RC
-0.528458 ARNm de proteína relacionada con el tumor de páncreas de Homo sapiens (FKSG12), cds 21completo  -0.528458  Protein mRNA related to the pancreatic tumor of Homo sapiens (FKSG12), cds 21completo

NM_003904 NM_003904
0.521223 ZNF259 Proteína de dedo de cinc 259 0.521223  ZNF259  Zinc Finger Protein 259

Contig26022_RC Contig26022_RC
0.517351 ESTs  0.517351 ESTs

Contig48970_RC Contig48970_RC
-0.516953 KIAA0892 Proteína KIAA0892  -0.516953 KIAA0892  KIAA0892 protein

NM_016307 NM_016307
-0.515398 PRX2 Proteína de caja homeo relacionada apareada  -0.515398 PRX2  Paired Homeo Box Protein Paired

AL137761 AL137761
-0.514891 ARNm de Homo sapiens; ADNc DKFZp586L2424 (del clon DKFZp586L2424)  -0.514891  MRNA from Homo sapiens; DKFZp586L2424 cDNA (from clone DKFZp586L2424)

NM_001919 NM_001919
-0.514799 DCI Dodecenoil-Coenzima A delta isomerasa (3,2 transenoil-Coenzima A isomerasa)  -0.514799 ICD  Dodecenoyl-Coenzyme A delta isomerase (3,2 transenoyl-Coenzyme A isomerase)

NM_000196 NM_000196
-0.514004 HSD11B2 Hidroxiesteroide (11-beta) dehidrogenasa 2  -0.514004 HSD11B2  Hydroxysteroid (11-beta) dehydrogenase 2

NM_002200 NM_002200
0.513149 IRF5 Factor 5 regulador del interferón 0.513149 IRF5  Factor 5 interferon regulator

AL133572 AL133572
0.511340 ARNm de Homo sapiens; ADNc DKFZp43410535 (del clon DKFZp43410535); cds parcial 0.511340  MRNA from Homo sapiens; DKFZp43410535 cDNA (from clone DKFZp43410535); partial cds

NM_019063 NM_019063
0.511127 C2ORF2 Marco de lectura abierta 2 del cromosoma 2 0.511127  C2ORF2  Chromosome 2 open reading frame 2

Contig25617_RC Contig25617_RC
0.509506 ESTs  0.509506 ESTs

NM_007358 NM_007358
0.508145 M96 Proteína putativa de enlace con ADN 0.508145 M96  Putative DNA binding protein

NM_014785 NM_014785
-0.507114 KIAA0258 Producto del gen KIAA0258  -0.507114 KIAA0258  Product of the KIAA0258 gene

NM_006235 NM_006235
0.506585 POU2AF1 Dominio POU, clase 2, factor asociador 1 0.506585  POU2AF1  POU domain, class 2, associated factor 1

NM_014680 NM_014680
-0.505779 KIAA0100 Producto del gen KIAA0100  -0.505779 KIAA0100  KIAA0100 gene product

X66087 X66087
0.500842 MYBL1 Tipo 1 del homólogo del oncógeno viral de la mieloblastosis aviar v-myb 0.500842  MYBL1  Type 1 of the viral oncogen homolog of avian myeloblastosis v-myb

Y07512 Y07512
-0.500686 PRKG1 Proteína quinasa, dependiente de cGMP, tipo I  -0.500686 PRKG1  CGMP-dependent protein kinase type I

58 58

NM_006296  NM_006296
0.500344 VRK2 Quinasa 2 relacionada con la vaccinia 0.500344 VRK2 Vaccine-related kinase 2

Contig44278_RC Contig44278_RC
0.498260 DKFZP434K114 Proteína DKFZP434K114  0.498260  DKFZP434K114  DKFZP434K114 protein

Contig56160_RC Contig56160_RC
-0.497695 ESTs  -0.497695 ESTs

NM_002023 NM_002023
-0.497570 FMOD Fibromodulina  -0.497570 FMOD Fibromodulin

M28170 M28170
0.497095 CD19 Antígeno CD19 0.497095 CD19  CD19 antigen

D26488 D26488
0.496511 KIAA0007 Proteína KIAA0007 0.496511 KIAA0007  KIAA0007 protein

X72475 X72475
0.496125 ARNm de H.sapiens para región variable de cadena ligera kappa lg reorganizada (I.114) 0.496125  H.sapiens mRNA for reorganized kappa lg light chain variable region (I.114)

K02276 K02276
0.496068 MYC Homólogo del oncógeno viral de la mieloblastosis aviar v-myc 0.496068  MYC  Homologue of the viral oncogene of avian myeloblastosis v-myc

NM_013378 NM_013378
0.495648 VPREB3 Gen 3 de pre-B linfocito 0.495648 VPREB3  Gen 3 of pre-B lymphocyte

X58529 X58529
0.495608 IGHM Mu constante pesado de inmunoglobulina 0.495608 IGHM  Immunoglobulin heavy constant mu

NM_000168 NM_000168
-0.494260 GLI3 Miembro GL13 de la familia GLI-Kruppel (síndrome de Greig)  -0.494260 GLI3 GL13 member of the GLI-Kruppel family (Greig syndrome)

NM_004866 NM_004866
-0.492967 SCAMP1 Proteína 1 de la mebrana portadora secretora  -0.492967 SCAMP1  Protein 1 of the secretory carrier mebrana

NM_003729 NM_003729
0.488971 RPC Fosfato ciclasa del terminal 3’ de ARN 0.488971 CPR  Phosphate cyclase of the 3 ’terminal of RNA

NM_006875 NM_006875
0.487407 PIM2 Oncógeno pim-2 0.487407 PIM2  Pim-2 oncogene

NM_018188  NM_018188
0.487126 FLJ10709 Proteína hipotética FLJ10709 0.487126 FLJ10709  Hypothetical protein FLJ10709

NM_004848 NM_004848
0.485408 ICB-1 Gen inducico por la membrana basal 0.485408 ICB-1  Basal membrane inductive gene

NM_001179 NM_001179
0.483253 ART3 ADP-ribosiltransferasa 3 0.483253 ART3 ADP-ribosyltransferase 3

NM_016548 NM_016548
-0.482329 LOC51280 Proteína GP73 de la membrana de Golgi  -0.482329  LOC51280  Golgi membrane GP73 protein

NM_007146  NM_007146
-0.481994 ZNF161 Proteína de dedo de cinc 161  -0.481994  ZNF161  Zinc Finger Protein 161

NM_021242 NM_021242
-0.481754 STRAIT11499 Proteína hipotética STRAIT11499  -0.481754  STRAIT11499  Hypothetical protein STRAIT11499

NM_016223  NM_016223
0.481710 PACSIN3 Sustrato de proteína quinasa C y caseína quinasa en neuronas 3 0.481710 PACSIN3  Protein kinase C and casein kinase substrate in neurons 3

NM_003197  NM_003197
-0.481526 TCEB1L Factor B de alargamiento de transcripción (SIII), afín a polipéptido 1  -0.481526 TCEB1L  Transcription elongation factor B (SIII), related to polypeptide 1

NM_000067 NM_000067
-0.481003 CA2 Anhidrasa carbónica II  -0.481003 CA2  Carbonic Anhydrase II

NM_006885 NM_006885
-0.479705 ATBF1 Factor 1 de transcripción de enlace con AT  -0.479705 ATBF1  Link transcription factor 1 with AT

NM_002542 NM_002542
0.478282 OGG1 8-oxoguanina ADN glicosilasa 0.478282 OGG1  8-oxoguanin DNA glycosylase

AL133619 AL133619
-0.476596 ARNm de Homo sapiens mRNA; ADNc DKFZp434E2321 (del clon DKFZp434E2321); cds parcial cds  -0.476596  MRNA from Homo sapiens mRNA; DKFZp434E2321 cDNA (from clone DKFZp434E2321); partial cds cds

D80001 D80001
0.476130 KIAA0179 Proteína KIAA0179 0.476130 KIAA0179  KIAA0179 protein

NM_018660 NM_018660
-0.475548 LOC55893 Factor regulador del virus del papiloma PRF-1  -0.475548  LOC55893  PRF-1 papillomavirus regulatory factor

AB004857 AB004857
0.473440 SLC11A2 Familia 11 del portador de soluto (transportadores de iones de metal divalente acoplados a protones), miembro 2 0.473440 SLC11A2 Family 11 of the solute carrier (proton-coupled divalent metal ion transporters), member 2

NM_002250 NM_002250
0.472900 KCNN4 Canal activado por calcio de intermedia/pequeña conductancia de potasio, subfamilia N, miembro 4 0.472900 KCNN4  Calcium-activated channel of intermediate / small potassium conductance, subfamily N, member 4

Contig56143_RC Contig56143_RC
-0.472611 ESTs, ligeramente parecidos al precursor de cadena del colágeno A54849 alfa 1 (VII) [H.sapiens]  -0.472611  ESTs, slightly similar to the A54849 alpha 1 (VII) collagen chain precursor [H.sapiens]

NM_001960 NM_001960
0.471502 EEF1D Factor 1 delta de alargamiento de conversión eucariótica (proteína de intercambio con nucleótido de guanina) 0.471502 EEF1D  Delta factor elongation of eukaryotic conversion (guanine nucleotide exchange protein)

Contig52405_RC Contig52405_RC
-0.470705 ESTs, moderadamente parecidos a ALU8_ALU HUMANO SUBFAMILIA SX ENTRADA DE AVISO DE CONTAMINACIÓN DE SECUENCIA [H.sapiens]  -0.470705 ESTs, moderately similar to ALU8_ALU HUMAN SUBFAMILIA SX SEQUENCE POLLUTION NOTICE ENTRY [H.sapiens]

Contig30092_RC Contig30092_RC
-0.469977 ARNm de isoforma B (PRDM6) de proteína 6 de dedo de cinc del dominio PR de Homo sapiens, cds partial; alternativamente empalmado  -0.469977  Isoform B mRNA (PRDM6) of zinc finger protein 6 from the PR domain of Homo sapiens, partial cds; alternately spliced

NM_003462 NM_003462
-0.468753 P28 Dineína, axonemal, polipéptido intermedio ligero  -0.468753 P28  Dynein, axonemal, light intermediate polypeptide

Contig60393 Contig60393
0.468475 ESTs 0.468475 ESTs

59 59

Contig842_RC  Contig842_RC
0.468158 ESTs 0.468158 ESTs

NM_002982 NM_002982
0.466362 SCYA2 Citoquina inducible pequeña A2 (proteína 1 quemotáctica de monocito, homólogo de ratón Sig-je) 0.466362  SCYA2  Small inducible cytokine A2 (monocyte quemototactic protein 1, Sig-je mouse homologue)

Contig14390_RC Contig14390_RC
0.464150 ESTs  0.464150 ESTs

NM_001770 NM_001770
0.463847 CD19 Antígeno CD19 0.463847 CD19  CD19 antigen

AK000617 AK000617
-0.463158 ARNm de Homo sapiens; ADNc DKFZp434L235 (del clon DKFZp434L235)  -0.463158  MRNA from Homo sapiens; DKFZp434L235 cDNA (from clone DKFZp434L235)

AF073299 AF073299
-0.463007 SLC9A2 Familia 9 del portador de soluto (intercambiador de sodio/hidrógeno), isoforma 2  -0.463007 SLC9A2  Family 9 of the solute carrier (sodium / hydrogen exchanger), isoform 2

NM_019049 NM_019049
0.461990 FLJ20054 Proteína hipotética 0.461990 FLJ20054  Hypothetical protein

AL137347 AL137347
-0.460778 DKFZP761M1511 Proteína hipotética  -0.460778 DKFZP761M1511  Hypothetical protein

NM_000396 NM_000396
-0.460263 CTSK Catepsina K (picnodisostosis)  -0.460263 CTSK Cathepsin K (pycnodysostosis)

NM_018373 NM_018373
-0.459268 FLJ11271 Proteína hipotética FLJ11271  -0.459268 FLJ11271  Hypothetical protein FLJ11271

NM_002709 NM_002709
0.458500 PPP1CB Proteína fosfatasa 1, subunidad catalítica, isoforma beta 0.458500 PPP1CB  Protein phosphatase 1, catalytic subunit, beta isoform

NM_016820 NM_016820
0.457516 OGG1 8-oxoguanina ADN glicosilasa 0.457516 OGG1  8-oxoguanin DNA glycosylase

Contig10268_RCContig10268_RC
0.456933 Secuencia de ADN humano del clon RP11-196N14 en el cromosoma 20. Contiene ESTs, STSs, GSSs e islas CpG. Contiene tres nuevos genes, parte de un gen para una nueva proteína parecida a la proteína serina/treonina fosfatasa 4 subunidad reguladora 1 (PP4R1) y un gen para una nueva proteína con una dominio de anquirina.  0.456933 Human DNA sequence of clone RP11-196N14 on chromosome 20. Contains ESTs, STSs, GSSs and CpG islands. It contains three new genes, part of a gene for a new protein similar to serine protein / threonine phosphatase 4 regulatory subunit 1 (PP4R1) and a gene for a new protein with an anchyrine domain.

NM_014521  NM_014521
-0.456733 SH3BP4 Proteína 4 de enlace con el dominio SH3  -0.456733 SH3BP4  Protein 4 binding to the SH3 domain

AJ272057 AJ272057
-0.456548 STRAIT11499 Proteína hipotética STRAIT11499  -0.456548  STRAIT11499  Hypothetical protein STRAIT11499

NM_015964  NM_015964
-0.456187 LOC51673 Proteína específica del cerebro  -0.456187  LOC51673  Brain specific protein

Contig16759_RC Contig16759_RC
-0.456169 ESTs  -0.456169 ESTs

NM_015937 NM_015937
-0.455954 LOC51604 Proteína CGI-06  -0.455954  LOC51604  CGI-06 protein

NM_007246  NM_007246
-0.455500 KLHL2 Kelch 2 afín a (Drosophila) (Mayven)  -0.455500 KLHL2  Kelch 2 related to (Drosophila) (Mayven)

NM_001985 NM_001985
-0.453024 ETFB Flavoproteína de transferencia de electrones, polipéptido beta  -0.453024 ETFB  Flavoprotein electron transfer, beta polypeptide

NM_000984 NM_000984
-0.452935 RPL23A Proteína ribosomal L23a  -0.452935 RPL23A  L23a ribosomal protein

Contig51953_RC Contig51953_RC
-0.451695 ESTs  -0.451695 ESTs

NM_015984 NM_015984
0.450491 UCH37 Ubiquitina C-terminal hidrolasa UCH37 0.450491 UCH37  Ubiquitin C-terminal hydrolase UCH37

NM_000903 NM_000903
-0.450371 DIA4 Diaforasa (NADH/NADPH) (citocromo b-5 reductasa)  -0.450371 DAY 4  Diaphorase (NADH / NADPH) (cytochrome b-5 reductase)

NM_001797 NM_001797
-0.449862 CDH11 Cadherina 11, tipo 2, OB-cadherina (osteoblasto)  -0.449862 CDH11  Cadherin 11, type 2, OB-cadherin (osteoblast)

NM_014878 NM_014878
0.449818 KIAA0020 Producto del gen KIAA0020 0.449818 KIAA0020  Product of the KIAA0020 gene

NM_002742 NM_002742
-0.449590 PRKCM Proteína quinasa C, mu  -0.449590 PRKCM  Protein kinase C, mu

Tabla 5. 231 marcadores de genes que distinguen entre pacientes con buen pronóstico y pacientes con pronostico deficiente.  Table 5. 231 gene markers that distinguish between patients with good prognosis and patients with poor prognosis.

Banco de Genes Gene Bank
SEQ ID NO Bando de Genes SEQ ID NO SEQ ID NO Side of Genes SEQ ID NO

Número de Acceso Access Number
Número de Acceso Access Number

AA555029_RCAA555029_RC
SEQ ID NO 1 NM_013296 SEQ ID NO 1427   SEQ ID NO 1 NM_013296 SEQ ID NO 1427

AB020689  AB020689
SEQ ID NO 37 NM_013437 SEQ ID NO 1439   SEQ ID NO 37 NM_013437 SEQ ID NO 1439

AB032973  AB032973
SEQ ID NO 55 NM_014078 SEQ ID NO 1449   SEQ ID NO 55 NM_014078 SEQ ID NO 1449

AB033007  AB033007
SEQ ID NO 58 NM_014109 SEQ ID NO 1451   SEQ ID NO 58 NM_014109 SEQ ID NO 1451

AB033043  AB033043
SEQ ID NO 62 NM_014321 SEQ ID NO 1477   SEQ ID NO 62 NM_014321  SEQ ID NO 1477

AB037745 AB037745
SEQ ID NO 75 NM_014363 SEQ ID NO 1480   SEQ ID NO 75 NM_014363 SEQ ID NO 1480

AB037863  AB037863
SEQ ID NO 88 NM_014750 SEQ ID NO 1527   SEQ ID NO 88 NM_014750 SEQ ID NO 1527

60 60

AF052159  AF052159
SEQ ID NO 120 NM_014754 SEQ ID NO 1528   SEQ ID NO 120  NM_014754 SEQ ID NO 1528

AF052162  AF052162
SEQ ID NO 121 NM_014791 SEQ ID NO 1535   SEQ ID NO 121  NM_014791  SEQ ID NO 1535

AF055033 AF055033
SEQ ID NO 124 NM_014875 SEQ ID NO 1545   SEQ ID NO 124  NM_014875 SEQ ID NO 1545

AF073519  AF073519
SEQ ID NO 137 NM_014889 SEQ ID NO 1548   SEQ ID NO 137  NM_014889 SEQ ID NO 1548

AF148505  AF148505
SEQ ID NO 169 NM_014968 SEQ ID NO 1554   SEQ ID NO 169  NM_014968 SEQ ID NO 1554

AF155117  AF155117
SEQ ID NO 173 NM_015416 SEQ ID NO 1559   SEQ ID NO 173  NM_015416 SEQ ID NO 1559

AF161553  AF161553
SEQ ID NO 177 NM_015417 SEQ ID NO 1560   SEQ ID NO 177  NM_015417 SEQ ID NO 1560

AF201951  AF201951
SEQ ID NO 183 NM_015434 SEQ ID NO 1562   SEQ ID NO 183  NM_015434 SEQ ID NO 1562

AF257175  AF257175
SEQ ID NO 189 NM_015984 S SEQ ID NO 1587   SEQ ID NO 189  NM_015984 S  SEQ ID NO 1587

AJ224741 AJ224741
SEQ ID NO 196 NM_016337 SEQ ID NO 1636   SEQ ID NO 196  NM_016337  SEQ ID NO 1636

AK000745 AK000745
SEQ ID NO 219 NM_016359 SEQ ID NO 1638   SEQ ID NO 219  NM_016359 SEQ ID NO 1638

AL050021  AL050021
SEQ ID NO 257 NM_016448 SEQ ID NO 1645   SEQ ID NO 257  NM_016448  SEQ ID NO 1645

AL050090 AL050090
SEQ ID NO 259 NM_016569 SEQ ID NO 1655   SEQ ID NO 259  NM_016569  SEQ ID NO 1655

AL080059 AL080059
SEQ ID NO 270 NM_016577 SEQ ID NO 1656   SEQ ID NO 270  NM_016577  SEQ ID NO 1656

AL080079 AL080079
SEQ ID NO 271 NM_017779 SEQ ID NO 1708   SEQ ID NO 271  NM_017779 SEQ ID NO 1708

AL080110  AL080110
SEQ ID NO 272 NM_018004 SEQ ID NO 1725   SEQ ID NO 272  NM_018004 SEQ ID NO 1725

AL133603  AL133603
SEQ ID NO 306 NM_018098 SEQ ID NO 1739   SEQ ID NO 306  NM_018098 SEQ ID NO 1739

AL133619 AL133619
SEQ ID NO 307 NM_018104 SEQ ID NO 1743   SEQ ID NO 307  NM_018104  SEQ ID NO 1743

AL137295AL137295
SEQ ID NO 315 NM_018120 SEQ ID NO 1745   SEQ ID NO 315  NM_018120  SEQ ID NO 1745

AL137502 AL137502
SEQ ID NO 326 NM_018136 SEQ ID NO 1748   SEQ ID NO 326  NM_018136  SEQ ID NO 1748

AL137514 AL137514
SEQ ID NO 327 NM_018265 SEQ ID NO 1766   SEQ ID NO 327  NM_018265  SEQ ID NO 1766

AL137718AL137718
SEQ ID NO 336 NM_018354 SEQ ID NO 1774   SEQ ID NO 336  NM_018354 SEQ ID NO 1774

AL355708  AL355708
SEQ ID NO 353 NM_018401 SEQ ID NO 1782   SEQ ID NO 353  NM_018401  SEQ ID NO 1782

D25328 D25328
SEQ ID NO 357 NM_018410 SEQ ID NO 1783  SEQ ID NO 357 NM_018410  SEQ ID NO 1783

L27560 L27560
SEQ ID NO 390 NM_018454 SEQ ID NO 1786  SEQ ID NO 390 NM_018454  SEQ ID NO 1786

M21551 M21551
SEQ 10 NO 394 NM_018455 SEQ ID NO 1787  SEQ 10 NO 394  NM_018455  SEQ ID NO 1787

NM_000017 NM_000017
SEQ ID NO 416 NM_019013 SEQ ID NO 1809  SEQ ID NO 416 NM_019013  SEQ ID NO 1809

NM_000096 NM_000096
SEQ ID NO 430 NM_020166 SEQ ID NO 1825  SEQ ID NO 430 NM_020166  SEQ ID NO 1825

NM_000127 NM_000127
SEQ ID NO 436 NM_020188 SEQ ID NO 1830  SEQ ID NO 436 NM_020188  SEQ ID NO 1830

NM_000158 NM_000158
SEQ ID NO 442 NM_020244 SEQ ID NO 1835  SEQ ID NO 442 NM_020244  SEQ ID NO 1835

NM_000224 NM_000224
SEQ ID NO 453 NM_020386 SEQ ID NO 1838  SEQ ID NO 453 NM_020386  SEQ ID NO 1838

NM_000286 NM_000286
SEQ ID NO 462 NM_020675 SEQ ID NO 1842  SEQ ID NO 462 NM_020675  SEQ ID NO 1842

NM_000291 NM_000291
SEQ ID NO 463 NM_020974 SEQ ID NO 1844  SEQ ID NO 463 NM_020974  SEQ ID NO 1844

NM_000320 NM_000320
SEQ ID NO 469 R70506_RC SEQ ID NO 1868  SEQ ID NO 469  R70506_RC  SEQ ID NO 1868

NM_000436 NM_000436
SEQ ID NO 487 U45975 SEQ ID NO 1878  SEQ ID NO 487 U45975  SEQ ID NO 1878

NM_000507 NM_000507
SEQ ID NO 491 U58033 SEQ ID NO 1881  SEQ ID NO 491 U58033  SEQ ID NO 1881

NM_000599 NM_000599
SEQ ID NO 503 U82987 SEQ ID NO 1891  SEQ ID NO 503 U82987  SEQ ID NO 1891

NM_000788 NM_000788
SEQ ID NO 527 U96131 SEQ ID NO 1896  SEQ ID NO 527 U96131  SEQ ID NO 1896

NM_000849 NM_000849
SEQ ID NO 530 X05610 SEQ ID NO 1903  SEQ ID NO 530 X05610  SEQ ID NO 1903

NM_001007 NM_001007
SEQ ID NO 550 X94232 SEQ ID NO 1927  SEQ ID NO 550 X94232  SEQ ID NO 1927

NM_001124 NM_001124
SEQ ID NO 562 Contig753_RC SEQ ID NO 1954  SEQ ID NO 562  Contig753_RC  SEQ ID NO 1954

NM_001168 NM_001168
SEQ ID NO 566 Contig1778_RC SEQ ID NO 1979  SEQ ID NO 566  Contig1778_RC  SEQ ID NO 1979

NM_001216 NM_001216
SEQ ID NO 574 Contig2399_RC SEQ ID NO 1989  SEQ ID NO 574  Contig2399_RC  SEQ ID NO 1989

NM_001280 NM_001280
SEQ ID NO 588 Contig2504_RC SEQ ID NO 1991  SEQ ID NO 588  Contig2504_RC  SEQ ID NO 1991

NM_001282 NM_001282
SEQ ID NO 589 Contig3902_RC SEQ ID NO 2017  SEQ ID NO 589  Contig3902_RC  SEQ ID NO 2017

NM_001333 NM_001333
SEQ ID NO 597 Contig4595 SEQ ID NO 2022  SEQ ID NO 597 Contig4595  SEQ ID NO 2022

NM_001673 NM_001673
SEQ ID NO 645 Contig8581_RC SEQ ID NO 2037  SEQ ID NO 645  Contig8581_RC  SEQ ID NO 2037

61 61

NM_001809  NM_001809
SEQ ID NO 673 Contig13480_RC SEQ ID NO 2052  SEQ ID NO 673  Contig13480_RC  SEQ ID NO 2052

NM_001827 NM_001827
SEQ ID NO 676 Contig17359_RC SEQ ID NO 2068  SEQ ID NO 676  Contig17359_RC  SEQ ID NO 2068

NM_001905 NM_001905
SEQ ID NO 691 Contig20217_RC SEQ ID NO 2072  SEQ ID NO 691  Contig20217_RC  SEQ ID NO 2072

NM_002019 NM_002019
SEQ ID NO 711 Contig21812_RC SEQ ID NO 2082  SEQ ID NO 711  Contig21812_RC  SEQ ID NO 2082

NM_002073 NM_002073
SEQ ID NO 721 Contig24252_RC SEQ ID NO 2087  SEQ ID NO 721  Contig24252_RC  SEQ ID NO 2087

NM_002358 NM_002358
SEQ ID NO 764 Contig25055_RC SEQ ID NO 2090  SEQ ID NO 764  Contig25055_RC  SEQ ID NO 2090

NM_002570 NM_002570
SEQ ID NO 787 Contig25343_RC SEQ ID NO 2092  SEQ ID NO 787  Contig25343_RC  SEQ ID NO 2092

NM_002808 NM_002808
SEQ ID NO 822 Contig25991 SEQ ID NO 2098  SEQ ID NO 822 Contig25991  SEQ ID NO 2098

NM_002811 NM_002811
SEQ ID NO 823 Contig27312_RC SEQ ID NO 2108  SEQ ID NO 823  Contig27312_RC  SEQ ID NO 2108

NM_002900 NM_002900
SEQ ID NO 835 Contig28552_RC SEQ ID NO 2120  SEQ ID NO 835  Contig28552_RC  SEQ ID NO 2120

NM_002916 NM_002916
SEQ ID NO 838 Contig32125_RC SEQ ID NO 2155  SEQ ID NO 838  Contig32125_RC  SEQ ID NO 2155

NM_003158 NM_003158
SEQ ID NO 881 Contig32185_RC SEQ ID NO 2156  SEQ ID NO 881  Contig32185_RC  SEQ ID NO 2156

NM_003234 NM_003234
SEQ ID NO 891 Contig33814_RC SEQ ID NO 2169  SEQ ID NO 891  Contig33814_RC  SEQ ID NO 2169

NM_003239 NM_003239
SEQ ID NO 893 Contig34634_RC SEQ ID NO 2180  SEQ ID NO 893  Contig34634_RC  SEQ ID NO 2180

NM_003258 NM_003258
SEQ ID NO 896 Contig35251_RC SEQ ID NO 2185  SEQ ID NO 896  Contig35251_RC  SEQ ID NO 2185

NM_003376 NM_003376
SEQ ID NO 906 Contig37063_RC SEQ ID NO 2206  SEQ ID NO 906  Contig37063_RC  SEQ ID NO 2206

NM_003600 NM_003600
SEQ ID NO 929 Contig37598 SEQ ID NO 2216  SEQ ID NO 929 Contig37598  SEQ ID NO 2216

NM_003607 NM_003607
SEQ ID NO 930 Contig38288_RC SEQ ID NO 2223  SEQ ID NO 930  Contig38288_RC  SEQ ID NO 2223

NM_003662 NM_003662
SEQ ID NO 938 Contig40128_RC SEQ ID NO 2248  SEQ ID NO 938  Contig40128_RC  SEQ ID NO 2248

NM_003676 NM_003676
SEQ ID NO 941 Contig40831_RC SEQ ID NO 2260  SEQ ID NO 941  Contig40831_RC  SEQ ID NO 2260

NM_003748 NM_003748
SEQ ID NO 951 Contig41413_RC SEQ ID NO 2266  SEQ ID NO 951  Contig41413_RC  SEQ ID NO 2266

NM_003862 NM_003862
SEQ ID NO 960 Contig41887_RC SEQ ID NO 2276  SEQ ID NO 960  Contig41887_RC  SEQ ID NO 2276

NM_003875 NM_003875
SEQ ID NO 962 Contig42421_RC SEQ ID NO 2291  SEQ ID NO 962  Contig42421_RC  SEQ ID NO 2291

NM_003878 NM_003878
SEQ ID NO 963 Contig43747_RC SEQ ID NO 2311  SEQ ID NO 963  Contig43747_RC  SEQ ID NO 2311

NM_003882 NM_003882
SEQ ID NO 964 Contig44064_RC SEQ ID NO 2315  SEQ ID NO 964  Contig44064_RC  SEQ ID NO 2315

NM_003981 NM_003981
SEQ ID NO 977 Contig44289_RC SEQ ID NO 2320  SEQ ID NO 977  Contig44289_RC  SEQ ID NO 2320

NM_004052 NM_004052
SEQ ID NO 985 Contig44799_RC SEQ ID NO 2330  SEQ ID NO 985  Contig44799_RC  SEQ ID NO 2330

NM_004163 NM_004163
SEQ ID NO 995 Contig45347_RC SEQ ID NO 2344  SEQ ID NO 995  Contig45347_RC  SEQ ID NO 2344

NM_004336 NM_004336
SEQ ID NO 1022 Contig45816_RC SEQ ID NO 2351 SEQ ID NO 1022  Contig45816_RC SEQ ID NO 2351

NM_004358  NM_004358
SEQ ID NO 1026 Contig46218_RC SEQ ID NO 2358 SEQ ID NO 1026  Contig46218_RC SEQ ID NO 2358

NM_004456  NM_004456
SEQ ID NO 1043 Contig46223_RC SEQ ID NO 2359 SEQ ID NO 1043  Contig46223_RC SEQ ID NO 2359

NM_004480  NM_004480
SEQ ID NO 1046 Contig46653_RC SEQ ID NO 2369 SEQ ID NO 1046  Contig46653_RC SEQ ID NO 2369

NM_004504  NM_004504
SEQ ID NO 1051 Contig46802_RC SEQ ID NO 2372 SEQ ID NO 1051  Contig46802_RC  SEQ ID NO 2372

NM_004603 NM_004603
SEQ ID NO 1064 Contig47405_RC SEQ ID NO 2384  SEQ ID NO 1064  Contig47405_RC  SEQ ID NO 2384

NM_004701 NM_004701
SEQ ID NO 1075 Contig48328_RC SEQ ID NO 2400  SEQ ID NO 1075  Contig48328_RC  SEQ ID NO 2400

NM_004702 NM_004702
SEQ ID NO 1076 Contig49670_RC SEQ ID NO 2434  SEQ ID NO 1076  Contig49670_RC  SEQ ID NO 2434

NM_004798 NM_004798
SEQ ID NO 1087 Contig50106_RC SEQ ID NO 2445  SEQ ID NO 1087  Contig50106_RC  SEQ ID NO 2445

NM_004911 NM_004911
SEQ ID NO 1102 Contig50410 SEQ ID NO 2453  SEQ ID NO 1102 Contig50410  SEQ ID NO 2453

NM_004994 NM_004994
SEQ ID NO 1108 Contig50802_RC SEQ ID NO 2463  SEQ ID NO 1108  Contig50802_RC  SEQ ID NO 2463

NM_005196 NM_005196
SEQ ID NO 1127 Contig51464_RC SEQ ID NO 2481  SEQ ID NO 1127  Contig51464_RC  SEQ ID NO 2481

NM_005342 NM_005342
SEQ ID NO 1143 Contig51519_RC SEQ ID NO 2482  SEQ ID NO 1143  Contig51519_RC  SEQ ID NO 2482

NM_005496 NM_005496
SEQ ID NO 1157 Contig51749_RC SEQ ID NO 2486  SEQ ID NO 1157  Contig51749_RC  SEQ ID NO 2486

NM_005563 NM_005563
SEQ ID NO 1173 Contig51963 SEQ ID NO 2494  SEQ ID NO 1173 Contig51963  SEQ ID NO 2494

NM_005915 NM_005915
SEQ ID NO 1215 Contig53226_RC SEQ ID NO 2525  SEQ ID NO 1215  Contig53226_RC  SEQ ID NO 2525

NM_006096 NM_006096
SEQ ID NO 1240 Contig53268_RC SEQ ID NO 2529  SEQ ID NO 1240  Contig53268_RC  SEQ ID NO 2529

NM_006101 NM_006101
SEQ ID NO 1241 Contig53646_RC SEQ ID NO 2538  SEQ ID NO 1241  Contig53646_RC  SEQ ID NO 2538

NM_006115 NM_006115
SEQ ID NO 1245 Contig53742_RC SEQ ID NO 2542  SEQ ID NO 1245  Contig53742_RC  SEQ ID NO 2542

62 62

NM_006117  NM_006117
SEQ ID NO 1246 Contig55188_RC SEQ ID NO 2586  SEQ ID NO 1246  Contig55188_RC  SEQ ID NO 2586

NM_006201 NM_006201
SEQ ID NO 1254 Contig55313_RC SEQ ID NO 2590  SEQ ID NO 1254  Contig55313_RC  SEQ ID NO 2590

NM_006265 NM_006265
SEQ ID NO 1260 Contig55377_RC SEQ ID NO 2591  SEQ ID NO 1260  Contig55377_RC  SEQ ID NO 2591

NM_006281 NM_006281
SEQ ID NO 1263 Contig55725_RC SEQ ID NO 2600  SEQ ID NO 1263  Contig55725_RC  SEQ ID NO 2600

NM_006372 NM_006372
SEQ ID NO 1273 Contig55813_RC SEQ ID NO 2607  SEQ ID NO 1273  Contig55813_RC  SEQ ID NO 2607

NM_006681 NM_006681
SEQ ID NO 1306 Contig55829_RC SEQ ID NO 2608  SEQ ID NO 1306  Contig55829_RC  SEQ ID NO 2608

NM_006763 NM_006763
SEQ ID NO 1315 Contig56457_RC SEQ ID NO 2630  SEQ ID NO 1315  Contig56457_RC  SEQ ID NO 2630

NM_006931 NM_006931
SEQ ID NO 1341 Contig57595 SEQ ID NO 2655  SEQ ID NO 1341 Contig57595  SEQ ID NO 2655

NM_007036 NM_007036
SEQ ID NO 1349 Contig57864_RC SEQ ID NO 2663  SEQ ID NO 1349  Contig57864_RC  SEQ ID NO 2663

NM_007203 NM_007203
SEQ ID NO 1362 Contig58368_RC SEQ ID NO 2668  SEQ ID NO 1362  Contig58368_RC  SEQ ID NO 2668

NM_012177 NM_012177
SEQ ID NO 1390 Contig60864_RC SEQ ID NO 2676  SEQ ID NO 1390  Contig60864_RC  SEQ ID NO 2676

NM_012214 NM_012214
SEQ ID NO 1392 Contig63102_RC SEQ ID NO 2684  SEQ ID NO 1392  Contig63102_RC  SEQ ID NO 2684

NM_012261 NM_012261
SEQ ID NO 1397 Contig63649_RC SEQ ID NO 2686  SEQ ID NO 1397  Contig63649_RC  SEQ ID NO 2686

NM_012429 NM_012429
SEQ ID NO 1413 Contig64688 SEQ ID NO 2690  SEQ ID NO 1413 Contig64688  SEQ ID NO 2690

NM_013262 NM_013262
SEQ ID NO 1425  SEQ ID NO 1425

Tabla 6. 70 marcadores de pronóstico preferidos sacados de la Tabla 5. Table 6. 70 preferred prognostic markers taken from Table 5.

AL080059 AL080059
-0.527150 ARNm de Homo sapiens para proteína KIAA1750, cds parcial  -0.527150  Homo sapiens mRNA for KIAA1750 protein, partial cds

Contig63649_ RC Contig63649_ RC
-0.468130 ESTs  -0.468130 ESTs

Contig46218_ RC Contig46218_ RC
-0.432540 ESTs  -0.432540 ESTs

NM_016359 NM_016359
-0.424930 LOC51203 Clon HQ0310 PRO0310p1  -0.424930  LOC51203  Clone HQ0310 PRO0310p1

AA555029_RC  AA555029_RC
-0.424120 ESTs -0.424120 ESTs

NM_003748 NM_003748
0.420671 ALDH4 Aldehído dehidrogenasa 4 (glutamato gamma semialdehído dehidrogenasa; pirrolina-5-carboxilato dehidrogenasa) 0.420671 ALDH4  Aldehyde dehydrogenase 4 (glutamate gamma semialdehyde dehydrogenase; pyrroline-5-carboxylate dehydrogenase)

Contig38288_ RC Contig38288_ RC
-0.414970 ESTs, ligeramente parecidos a ISHUSS proteína disulfuroisomerasa [H.sapiens]  -0.414970  ESTs, slightly similar to ISHUSS protein disulfuroisomerase [H.sapiens]

NM_003862 NM_003862
0.410964 FGF18 Factor del crecimiento fibroblasto 18 0.410964 FGF18  Fibroblast growth factor 18

Contig28552_ RC  Contig28552_ RC
-0.409260 ARNm de Homo sapiens; ADNc DKFZp434C0931 (de clon DKFZp434C0931); cds parcial -0.409260  MRNA from Homo sapiens; DKFZp434C0931 cDNA (from clone DKFZp434C0931); partial cds

Contig32125_RC  Contig32125_RC
0.409054 ESTs 0.409054 ESTs

U82987 U82987
0.407002 BBC3 Componente 3 de enlace con Bcl-2 0.407002 BBC3  Bcl-2 link component 3

AL137718AL137718
-0.404980 ARN de Homo sapiens; ADNc DKFZp434C0931 (del clon DKFZp434C0931); cds parcial  -0.404980 RNA from Homo sapiens; DKFZp434C0931 cDNA (from clone DKFZp434C0931); partial cds

AB037863 AB037863
0.402335 KIAA1442 Proteína KIAA1442 0.402335 KIAA1442  KIAA1442 protein

NM_020188 NM_020188
-0.400070 DC13 Proteína DC13 -0.400070  DC13  DC13 protein

NM_020974 NM_020974
0.399987 CEGP1 Proteína CEGP1 0.399987 CEGP1  CEGP1 protein

NM_000127 NM_000127
-0.399520 EXT1 Exostosis (múltiple) 1 -0.399520  EXT1 Exostosis (multiple) 1

NM_002019 NM_002019
-0.398070 FLT1 Tirosina quinasa 1 relacionada con fms (factor de crecimiento endotelial vascular/receptor de factor de permeabilidad vascular) -0.398070  FLT1  Tyrosine kinase 1 related to fms (vascular endothelial growth factor / vascular permeability factor receptor)

NM_002073 NM_002073
-0.395460 GNAZ Proteína de enlace con nucleótido de guanina (proteína G), polipéptido alfa z -0.395460  GNAZ  Guanine nucleotide binding protein (G protein), alpha z polypeptide

NM_000436 NM_000436
-0.392120 OXCT 3-oxoácido CoA transferasa -0.392120  OXCT  3-oxoacid CoA transferase

NM_004994 NM_004994
-0.391690 MMP9 Metaloproteinasa 9 de matriz (gelatinasa B, 92kD gelatinasa, 92kD -0.391690  MMP9  Matrix metalloproteinase 9 (gelatinase B, 92kD gelatinase, 92kD

63 63

tipo IV colagenasa) type IV collagenase)

Contig55377_RC  Contig55377_RC
0.390600 ESTs 0.390600 ESTs

Contig35251_RC  Contig35251_RC
-0.390410 ADNc de Homo sapiens: fis FLJ22719, clon HSI14307 -0.390410  Homo sapiens cDNA: fis FLJ22719, clone HSI14307

Contig25991 Contig25991
-0.390370 ECT2 Oncógeno de secuencia transformadora 2 de célula epitelial -0.390370  ECT2  Epithelial cell transforming sequence 2 oncogene

NM_003875 NM_003875
-0.386520 GMPS Guanina monofosfato sintetasa -0.386520  GMPS  Guanine monophosphate synthetase

NM_006101 NM_006101
-0.385890 HEC Altamente expresado en cáncer, rico en repeticiones de heptadas de leucina -0.385890  HEC  Highly expressed in cancer, rich in repetitions of leucine heptates

NM_003882 NM_003882
0.384479 WISP1 WNT1 procedimiento de señalización inducible proteína 1 0.384479 WISP1  WNT1 inducible protein 1 signaling procedure

NM_003607 NM_003607
-0.384390 PK428 Proteína quinasa Ser-Thr relacionada con la proteína quinasa de distrofia miotónica -0.384390  PK428  Ser-Thr protein kinase related to myotonic dystrophy protein kinase

AF073519 AF073519
-0.383340 SERF1A Pequeño factor 1A rico enl EDRK (telomérico) -0.383340  SERF1A  Small factor 1A rich in EDRK (telomeric)

AF052162 AF052162
-0.380830 FLJ12443 Proteína hipotética FLJ12443 -0.380830  FLJ12443  Hypothetical protein FLJ12443

NM_000849 NM_000849
0.380831 GSTM3 Glutationa S-transferasa M3 (cerebro) 0.380831 GSTM3  Glutathione S-transferase M3 (brain)

Contig32185_ RC  Contig32185_ RC
-0.379170 ADNc de Homo sapiens fis FLJ13997, clon Y79AA1002220 -0.379170  CDNA from Homo sapiens fis FLJ13997, clone Y79AA1002220

NM_016577 NM_016577
-0.376230 RAB6B RAB6B, miembro de familia de oncógeno RAS -0.376230  RAB6B RAB6B, RAS oncogene family member

Contig48328_ RC  Contig48328_ RC
0.375252 ESTs, ligeramente parecidos a T17248 proteína hipotética DKFZp586G1122.1 [H.sapiens] 0.375252  ESTs, slightly similar to T17248 hypothetical protein DKFZp586G1122.1 [H.sapiens]

Contig46223_ RC  Contig46223_ RC
0.374289 ESTs 0.374289 ESTs

NM_015984 NM_015984
-0.373880 UCH37 Ubiquitina C-terminal hidrolasa UCH37 -0.373880  UCH37  Ubiquitin C-terminal hydrolase UCH37

NM_006117 NM_006117
0.373290 PECI Peroxisomal D3,D2-enoil-CoA isomerasa 0.373290 PECI  Peroxisomal D3, D2-enoyl-CoA isomerase

AK000745 AK000745
-0.373060 ADNc de Homo sapiens fis FLJ20738, clon HEP08257 -0.373060  CDNA from Homo sapiens fis FLJ20738, clone HEP08257

Contig40831_ RC  Contig40831_ RC
-0.372930 ESTs -0.372930  ESTs

NM_003239 NM_003239
0.371524 TGFB3 Factor transformador del crecimiento, beta 3 0.371524 TGFB3  Growth transforming factor, beta 3

NM_014791 NM_014791
-0.370860 KIAA0175 Producto del gen KIAA0175 -0.370860  KIAA0175  Product of the KIAA0175 gene

X05610 X05610
-0.370860 COL4A2 Colágeno, tipo IV, alfa 2 -0.370860  COL4A2  Collagen, type IV, alpha 2

NM_016448 NM_016448
-0.369420 L2DTL Proteína L2DTL -0.369420  L2DTL  L2DTL protein

NM_018401 NM_018401
0.368349 HSA250839 Gen para serina/treonina proteína quinasa 0.368349 HSA250839  Gene for serine / threonine protein kinase

NM_000788 NM_000788
-0.367700 DCK Deoxicitidina quinasa -0.367700 DCK Deoxycytidine Kinase

Contig51464_ RC  Contig51464_ RC
-0.367450 FLJ22477 Proteína hipotética FLJ22477 -0.367450  FLJ22477  Hypothetical protein FLJ22477

AL080079 AL080079
-0.367390 DKFZP564D0462 Proteína hipotética DKFZp564D0462 -0.367390 DKFZP564D0462  Hypothetical protein DKFZp564D0462

NM_006931 NM_006931
-0.366490 SLC2A3 Familia 2 del portador de soluto (trnsportador de glucosa facilitado), miembro 3 -0.366490  SLC2A3  Family 2 of the solute carrier (facilitated glucose transporter), member 3

AF257175 AF257175
-0.365900 ARN (HCA64) de Homo sapiens del antígeno 64 asociado al carcinoma hepatocelular 64, cds completo -0.365900  Homo sapiens RNA (HCA64) of antigen 64 associated with hepatocellular carcinoma 64, complete cds

NM_014321 NM_014321
-0.365810 ORC6L Complejo de reconocimiento de origen, subunidad 6 afín a (homólogo de levadura) -0.365810  ORC6L  Origin recognition complex, subunit 6 related to (yeast counterpart)

NM_002916 NM_002916
-0.365590 RFC4 Factor de replicación C (activador 1) 4 (37kD) -0.365590  RFC4  Replication factor C (activator 1) 4 (37kD)

Contig55725_ RC  Contig55725_ RC
-0.365350 ESTs, moderadamente parecidos a T50635 proteína hipotética DKFZp762L0311.1 [H.sapiens] -0.365350  ESTs, moderately similar to T50635 hypothetical protein DKFZp762L0311.1 [H.sapiens]

Contig24252_ RC  Contig24252_ RC
-0.364990 ESTs -0.364990  ESTs

AF201951 AF201951
0.363953 CFFM4 Subunidad beta de receptor epsilon de inmunoglobulina de alta afinidad 0.363953 CFFM4  High affinity immunoglobulin epsilon receptor beta subunit

NM_005915 NM_005915
-0.363850 MCM6 Deficiente en mantenimiento de minicromosoma (mis5, S. pombe) 6 -0.363850  MCM6  Deficient in maintenance of minichromosome (mis5, S. pombe) 6

NM_001282 NM_001282
0.363326 AP2B1 Complejo 2 de proteína relacionada con adaptador, subunidad beta 1 0.363326 AP2B1  Adapter-related protein complex 2, beta 1 subunit

64 64

Contig56457_ RC  Contig56457_ RC
-0.361650 TMEFF1 Proteína de transmembrana con afín a EGF y dos dominios 1 afines a folistatina -0.361650  TMEFF1  Transmembrane protein related to EGF and two domains 1 related to folistatin

NM_000599  NM_000599
-0.361290 IGFBP5 Proteína 5 de enlace con factor de crecimiento afín a insulina -0.361290  IGFBP5  Binding protein 5 with insulin-like growth factor

NM_020386 NM_020386
-0.360780 LOC57110 Proteína relacionada con proteína H-REV107 -0.360780  LOC57110  H-REV107 protein related protein

NM_014889  NM_014889
-0.360040 MP1 Metaloproteasa 1 (familia de pitrilisina) -0.360040  MP1  Metalloprotease 1 (pitrilisin family)

AF055033 AF055033
-0.359940 IGFBP5 Proteína 5 de enlace con factor de crecimiento afín a insulina -0.359940  IGFBP5  Binding protein 5 with insulin-like growth factor

NM_006681 NM_006681
-0.359700 NMU Neuromedina U -0.359700  NMU  Neuromedin U

NM_007203 NM_007203
-0.359570 AKAP2 A Proteína 2 de amarre a quinasa (PRKA) -0.359570  AKAP2  A Mooring protein kinase 2 (PRKA)

Contig63102_ RC  Contig63102_ RC
0.359255 FLJ11354 Proteína hipotética FLJ11354 0.359255 FLJ11354  Hypothetical protein FLJ11354

NM_003981 NM_003981
-0.358260 PRC1 Regulador proteínico de la citoquinesis 1 -0.358260  PRC1  Protein regulator of cytokinesis 1

Contig20217_ RC  Contig20217_ RC
-0.357880 ESTs -0.357880  ESTs

NM_001809 NM_001809
-0.357720 CENPA Proteína A (17kD) de centrómero -0.357720  CENPA  Centromer protein (17kD)

Contig2399_RC  Contig2399_RC
-0.356600 SM-20 Similar a la proteína SM-20 de músculo liso de rata -0.356600  SM-20  Similar to rat smooth muscle SM-20 protein

NM_004702 NM_004702
-0.356600 CCNE2 Ciclina E2 -0.356600  CCNE2 Cyclin E2

NM_007036 NM_007036
-0.356540 ESM1 Molécula 1 específica de célula endotelial -0.356540  ESM1  Endothelial cell specific molecule 1

NM_018354 NM_018354
-0.356000 FLJ11190 Proteina hipotelial FLJ11190 -0.356000 FLJ11190 FLJ11190 hypothelial protein

[0037] Los conjuntos de marcadores enumerados en las Tablas 1-6 están parcialmente superpuestos; en otras palabras, algunos marcadores están presentes en múltiples conjuntos, mientras que otros son exclusivos de un conjunto en concreto (FIG. 1). [0037] The sets of markers listed in Tables 1-6 are partially overlapping; In other words, some markers are present in multiple sets, while others are unique to a particular set (FIG. 1).

5 [0038] Así pues, en una materialización se describe un conjunto de 256 marcadores genéticos que pueden distinguir entre ER (+) y ER (-) y también entre tumores de BRCA1 y tumores esporádicos (es decir, clasificar un tumor como ER (-) o ER (-) y relacionado con BRCA1 o esporádico). En una materialización más específica, se describen subconjuntos de al menos 20, al menos 50, al menos 100 o al menos 150 del conjunto de 256 marcadores que pueden clasificar un tumor como ER (-) o ER (-) y relacionado con BRCA1 o esporádico. En otra [0038] Thus, in a materialization a set of 256 genetic markers that can distinguish between ER (+) and ER (-) and also between BRCA1 tumors and sporadic tumors (ie, classify a tumor as ER () is described. -) or ER (-) and related to BRCA1 or sporadic). In a more specific materialization, subsets of at least 20, at least 50, at least 100 or at least 150 of the set of 256 markers that can classify a tumor as ER (-) or ER (-) and related to BRCA1 or are described sporadic. In other

10 materialización se describen 165 marcadores que pueden distinguir entre ER (+) y ER (-) y también entre pacientes con buen pronóstico frente a pronóstico deficiente (es decir, clasificar un tumor como ER (-) o como ER (+) y como que tenga que ser extirpado de una paciente con buen pronóstico o con pronóstico deficiente). Se describen asimismo subconjuntos de al menos 20, 50, 100 o 125 del conjunto completo de 165 marcadores, que también pueden clasificar un tumor como ER (-) o como ER (+) y como que tenga que ser extirpado de una 10 materialization describes 165 markers that can distinguish between ER (+) and ER (-) and also among patients with good prognosis versus poor prognosis (that is, classify a tumor as ER (-) or as ER (+) and as that has to be removed from a patient with a good prognosis or with a poor prognosis). Subsets of at least 20, 50, 100 or 125 of the complete set of 165 markers are also described, which can also classify a tumor as ER (-) or as ER (+) and as having to be removed from a

15 paciente con buen pronóstico o con pronóstico deficiente. Además, se describe un conjunto de doce marcadores que pueden distinguir entre tumores de BRCA1 y tumores esporádicos, y entre pacientes con buen pronóstico frente a pronóstico deficiente. Por último, se describen once marcadores que son capaces de diferenciar las tres categorías. Y a la inversa, se describen 2.050 de los 2.460 marcadores con categoría de ER que pueden determinar solo la categoría de ER, 173 de los 430 marcadores ARC47 frente a marcadores esporádicos que 15 patient with good prognosis or poor prognosis. In addition, a set of twelve markers that can distinguish between BRCA1 tumors and sporadic tumors, and between patients with good prognosis versus poor prognosis is described. Finally, eleven markers are described that are able to differentiate the three categories. Conversely, 2050 of the 2,460 markers with ER category are described that can determine only the ER category, 173 of the 430 ARC47 markers versus sporadic markers that

20 solo pueden determinar el BRCA1 frente a la categoría esporádica y 65 de los 231 marcadores de pronóstico que solo pueden determinar el pronóstico. En materializaciones más específicas se describen subconjuntos de al menos 20, 50, 100, 200, 500, 1.000, 1.500 o 2.000 de los 2,050 marcadores con categoría de ER que igualmente solo pueden determinar la categoría de ER. También se describen subconjuntos de al menos 20, 50, 100 o 150 de los 173 marcadores que también determinan solo el BRCA1 frente a tumores esporádicos. Asimismo, se 20 can only determine the BRCA1 versus the sporadic category and 65 of the 231 prognostic markers that can only determine the prognosis. In more specific embodiments, subsets of at least 20, 50, 100, 200, 500, 1,000, 1,500 or 2,000 of the 2,050 markers with ER category are described, which can also only determine the ER category. Subsets of at least 20, 50, 100 or 150 of the 173 markers that also determine only BRCA1 against sporadic tumors are also described. It also

25 describen subconjuntos de al menos 20, 30, 40, o 50 de los 65 marcadores de pronóstico que igualmente solo pueden determinar la categoría del pronóstico. 25 describe subsets of at least 20, 30, 40, or 50 of the 65 forecast markers that can also only determine the forecast category.

[0039] Cualquiera de los conjuntos de marcadores suministrados más arriba puede usarse solo específicamente o en combinación con otros marcadores que no sean del conjunto. Por ejemplo, los marcadores que distinguen la categoría de ER pueden usarse en combinación con los marcadores de BRCA1 frente a los 30 esporádicos, o con los marcadores de pronóstico, o ambos. Cualquiera de los conjuntos de marcadores suministrados más arriba puede usarse también en combinación con otros marcadores para el cáncer de mama, [0039] Any of the marker sets provided above may be used only specifically or in combination with other markers that are not of the set. For example, markers that distinguish the ER category can be used in combination with the BRCA1 markers versus the 30 sporadic ones, or with the prognostic markers, or both. Any of the marker sets provided above may also be used in combination with other markers for breast cancer,

o para cualquier otra afección clínica o fisiológica. or for any other clinical or physiological condition.

[0040] La relación entre los conjuntos de marcadores se muestra en el diagrama de la FIG. 1. [0040] The relationship between the sets of markers is shown in the diagram of FIG. one.

5.3.2 IDENTIFICACIÓN DE MARCADORES 5.3.2 MARKER IDENTIFICATION

35 [0041] Se describen conjuntos de marcadores para la identificación de condiciones o indicaciones relacionadas con el cáncer de mama. De modo general, los conjuntos de marcadores se identificaron determinando cuáles de entre -25.000 marcadores humanos tenían patrones de expresión que se hallaran en correlación con las condiciones o indicaciones. [0041] Sets of markers for the identification of conditions or indications related to breast cancer are described. In general, the sets of markers were identified by determining which of between -25,000 human markers had expression patterns that correlated with the conditions or indications.

[0042] En una materialización, el método para identificar conjuntos de marcadores es como sigue. Tras la extracción y el etiquetado de polinucleótidos destino, se compara la expresión de todos los marcadores (genes) en una muestra X con la expresión de todos los marcadores (genes) en un patrón o control. En una materialización, el patrón o control comprende moléculas polinucleótidas destino obtenidas de una muestra de un individuo normal (es decir, de un individuo no aquejado de cáncer de mama). En una materialización preferida, el patrón o control es una reserva de moléculas polinucleótidas destino. La reserva puede obtenerse de muestras recogidas de una serie de individuos normales. En una materialización preferida, la reserva comprende muestras tomadas de una serie de individuos que tienen tumores de tipo esporádico. En otra materialización preferida, la reserva comprende una población de ácidos nucleicos generados artificialmente y destinados a aproximar el nivel de ácido nucleico derivado de cada marcador hallado en una reserva de marcadores derivados de ácidos nucleicos obtenidos de muestras de tumores. En una materialización preferida más, la reserva se obtiene de líneas celulares o de muestras de líneas de células normales o de cáncer de mama. [0042] In a materialization, the method of identifying marker sets is as follows. After extraction and labeling of target polynucleotides, the expression of all markers (genes) in an X sample is compared with the expression of all markers (genes) in a pattern or control. In a materialization, the pattern or control comprises target polynucleotide molecules obtained from a sample of a normal individual (that is, from an individual not suffering from breast cancer). In a preferred embodiment, the pattern or control is a reserve of target polynucleotide molecules. The reserve can be obtained from samples collected from a series of normal individuals. In a preferred embodiment, the pool comprises samples taken from a series of individuals who have sporadic tumors. In another preferred embodiment, the pool comprises a population of artificially generated nucleic acids and intended to approximate the level of nucleic acid derived from each marker found in a pool of nucleic acid derived markers obtained from tumor samples. In a further preferred embodiment, the reserve is obtained from cell lines or from samples of normal cell lines or breast cancer.

[0043] La comparación puede realizarse por cualquiera de los medios conocidos en la técnica. Por ejemplo, los niveles de expresión de marcadores diversos pueden calcularse mediante la separación de moléculas polinucleótidas destino (por ej., ARN o ADNc), derivadas de los marcadores en geles de agarosa o poliacrilamida, seguida por la hibridación con sondas oligonucleótidas específicas de marcadores. Como alternativa, la comparación puede realizarse mediante el etiquetado de moléculas polinucleótidas destino seguidas por la separación en un gel secuenciador. Se colocan muestras polinucleótidas en el gel de modo que paciente y control o patrón se hallen en corredores adyacentes. La comparación de niveles de expresión se realiza visualmente o por medio de densitómetro. En una materialización preferida, la expresión de todos los marcadores se calcula simultáneamente por hibridación a un biochip. En cada aproximación, los marcadores que reúnen determinados requisitos se identifican como asociados al cáncer de mama. [0043] The comparison can be made by any means known in the art. For example, expression levels of various markers can be calculated by separating target polynucleotide molecules (e.g., RNA or cDNA), derived from the markers in agarose or polyacrylamide gels, followed by hybridization with specific oligonucleotide probe probes. . Alternatively, the comparison can be made by labeling target polynucleotide molecules followed by separation in a sequencer gel. Polynucleotide samples are placed in the gel so that patient and control or pattern are in adjacent corridors. The comparison of expression levels is performed visually or by means of a densitometer. In a preferred embodiment, the expression of all markers is calculated simultaneously by hybridization to a biochip. In each approach, markers that meet certain requirements are identified as associated with breast cancer.

[0044] El marcador se selecciona basándose en alguna diferencia significativa de expresión en una muestra al compararla con una condición de patrón o control. Se puede hacer la selección basándose bien en una regulación significativa hacia arriba o hacia abajo del marcador en la muestra de la paciente. También se puede hacer la selección calculando la relevancia estadística (esto es, el valor-p) de la correlación entre la expresión del marcador y la condición o indicación. A ser posible, deben usarse ambos criterios de selección. De este modo, en una materialización de la presente invención, los marcadores asociados al cáncer de mama se seleccionan si cumplen estas dos condiciones: que muestren un cambio de más del doble (aumento o disminución) en expresión en comparación con un patrón y que el valor-p para la correlación entre la existencia del cáncer de mama y el cambio en el marcador de expresión no sea superior a 0,01 (es decir, que sea significativo estadísticamente). [0044] The marker is selected based on some significant difference in expression in a sample when compared to a pattern or control condition. The selection can be made based on a significant up or down regulation of the marker in the patient sample. The selection can also be made by calculating the statistical relevance (that is, the p-value) of the correlation between the expression of the marker and the condition or indication. If possible, both selection criteria should be used. Thus, in a embodiment of the present invention, the markers associated with breast cancer are selected if they meet these two conditions: that they show a change of more than double (increase or decrease) in expression compared to a pattern and that the p-value for the correlation between the existence of breast cancer and the change in the expression marker does not exceed 0.01 (that is, it is statistically significant).

[0045] La expresión de los marcadores identificados en relación con el cáncer de mama se usa entonces para identificar marcadores que puedan diferenciar tumores en tipos clínicos. En una materialización específica que usa una serie de muestras de tumores, los marcadores se identifican mediante el cálculo de correlación de coeficientes entre la categoría clínica o parámetro(s) clínico(s) y el cociente de expresión lineal, logarítmico o cualquier transformación del mismo en todas las muestras de cada gen por separado. Concretamente, el coeficiente de correlación se calcula como [0045] The expression of the markers identified in relation to breast cancer is then used to identify markers that can differentiate tumors into clinical types. In a specific materialization using a series of tumor samples, the markers are identified by calculating the correlation of coefficients between the clinical category or clinical parameter (s) and the ratio of linear, logarithmic expression or any transformation thereof. in all samples of each gene separately. Specifically, the correlation coefficient is calculated as

imagen1 Ecuación (2) image 1 Equation (2)

en donde č representa los parámetros o categorías clínicos y ř representa el cociente de expresión lineal, logarítmico o cualquier transformación del mismo entre muestra y control. Los marcadores en los que el coeficiente de correlación exceda de un límite se clasifican como marcadores en relación con el cáncer de mama específicos para un determinado tipo clínico. Dicho límite o umbral coincide con una cierta relevancia de los genes diferenciadores obtenidos mediante simulaciones Monte-Carlo. El umbral depende del imagen1 número de where č represents the clinical parameters or categories and ř represents the quotient of linear, logarithmic expression or any transformation thereof between sample and control. Markers in which the correlation coefficient exceeds a limit are classified as markers in relation to breast cancer specific to a particular clinical type. This limit or threshold coincides with a certain relevance of the differentiating genes obtained by Monte-Carlo simulations. The threshold depends on the image 1 number of

muestras usadas; el umbral puede calcularse como 3 Ximagen1 donde used samples; The threshold can be calculated as 3 X image 1 where

es la anchura de distribución y n = el número de muestras. En una materialización específica, los marcadores se eligen si el coeficiente de correlación es superior a 0,3, aproximadamente, o inferior a 0.3, aproximadamente.   It is the distribution width and n = the number of samples. In a specific materialization, the markers are chosen if the correlation coefficient is greater than 0.3, approximately, or less than 0.3, approximately.

[0046] A continuación se calcula la relevancia de la correlación. Dicha relevancia puede calcularse por cualquier medio estadístico con el que se calcule dicha relevancia. En un ejemplo concreto, se genera un conjunto de datos ordenados mediante una técnica Monte-Carlo para aleatorizar la asociación entre la diferencia de expresión de un marcador en particular y la categoría clínica. La distribución de frecuencia de los marcadores que reúnen los requisitos mediante el cálculo de coeficientes correlación se compara con el número de marcadores que reúnen los requisitos en los datos generados mediante la técnica Monte-Carlo. La distribución de frecuencia de los marcadores que reúnen los requisitos en los ensayos Monte-Carlo se usa para determinar si el número de marcadores seleccionados por correlación con los datos clínicos es significativo. Véase el Ejemplo [0046] Next, the relevance of the correlation is calculated. Said relevance can be calculated by any statistical means with which this relevance is calculated. In a specific example, a set of data is generated using a Monte-Carlo technique to randomize the association between the difference in expression of a particular marker and the clinical category. The frequency distribution of the markers that meet the requirements by calculating correlation coefficients is compared with the number of markers that meet the requirements in the data generated by the Monte-Carlo technique. The frequency distribution of the markers that meet the requirements in the Monte-Carlo trials is used to determine whether the number of markers selected by correlation with the clinical data is significant. See example

4. Four.

[0047] Una vez identificado un marcador, los marcadores pueden ordenarse jerárquicamente por su relevancia de diferenciación. Una forma de ordenación jerárquica es por la amplitud de correlación entre el cambio en la expresión y la condición específica que se está diferenciando. Otro medio también muy utilizado es usar una métrica estadística. En una materialización específica, la métrica es una estadística de tipo Fisher:[0047] Once a marker has been identified, the markers can be sorted hierarchically by their relevance of differentiation. One form of hierarchical ordering is by the breadth of correlation between the change in the expression and the specific condition that is being differentiated. Another also widely used means is to use a statistical metric. In a specific materialization, the metric is a Fisher-type statistic:

imagen1image 1

Ecuación (3)     Equation (3)

[0048] En esta ecuación, (x1) es la media ponderada de error del cociente logarítmico de las mediciones de expresión de transcripción dentro de un primer grupo de diagnóstico (por ej., ER(-), x-2) es la media ponderada 10 del cociente logarítmico dentro de un segundo grupo de diagnóstico relacionado con el primero (por ej., ER(+)), σ1 es la varianza del logaritmo del cociente dentro del grupo ER(-) y n1 es el número de muestras para las que se dispone de mediciones válidas de logaritmos del cociente. σ2 es la varianza del cociente logarítmico dentro de un segundo grupo de diagnóstico (por ej., ER(+)), y n2 es el número de muestras para las que se dispone de mediciones válidas de cocientes logarítmicos. El valor-t representa la diferencia de compensación de varianza [0048] In this equation, (x1) is the weighted mean error of the log ratio of the transcription expression measurements within a first diagnostic group (eg, ER (-), x-2) is the mean weighted 10 of the logarithmic quotient within a second diagnostic group related to the first (e.g., ER (+)), σ1 is the variance of the log of the quotient within the ER (-) group and n1 is the number of samples for which have valid measurements of logarithms of the quotient. σ2 is the variance of the logarithmic quotient within a second diagnostic group (e.g., ER (+)), and n2 is the number of samples for which valid measurements of logarithmic ratios are available. The t-value represents the variance compensation difference

15 entre dos medias. 15 between two socks.

[0049] El conjunto jerarquizado de marcadores puede usarse para optimizar el número de marcadores en el conjunto usado para la diferenciación. Esto se lleva a cabo generalmente en un método de “dejar uno fuera” de la forma siguiente: en un primer ensayo, se usa un subconjunto, por ejemplo 5, de los marcadores de los primeros puestos de la lista jerarquizada para generar una plantilla, donde de X muestras se usan X-1 para generar la 20 plantilla y se predice la categoría de la muestra restante. Este proceso se repite para cada muestra hasta que cada una de las muestras X se haya previsto una vez. En un segundo ensayo, se añaden marcadores adicionales, por ejemplo 5, de modo que ahora se genera una plantilla a partir de 10 marcadores, y se predice el resultado de la muestra restante. Este proceso se repite hasta que se haya usado todo el conjunto de marcadores para generar una plantilla. Para cada uno de los ensayos se cuentan los errores de tipo 1 (falso [0049] The hierarchical set of markers can be used to optimize the number of markers in the set used for differentiation. This is generally carried out in a method of "leaving one out" as follows: in a first trial, a subset, for example 5, of the markers of the top positions of the hierarchical list is used to generate a template, where from X samples X-1 is used to generate the template and the category of the remaining sample is predicted. This process is repeated for each sample until each of the X samples has been planned once. In a second trial, additional markers are added, for example 5, so that a template is now generated from 10 markers, and the result of the remaining sample is predicted. This process is repeated until the entire set of bookmarks has been used to generate a template. Type 1 errors (false) are counted for each of the tests

25 positivo) y los errores de tipo 2 (falso negativo): el número óptimo de marcadores es aquel número donde la tasa de error 1 o la tasa de error 2, o preferiblemente la tasa total de error 1 y de error 2 sea más baja. 25 positive) and type 2 errors (false negative): the optimal number of markers is that number where the error rate 1 or the error rate 2, or preferably the total error rate 1 and error 2 is lower .

[0050] Para los marcadores de pronóstico, la validación del conjunto de marcadores puede llevarse a cabo mediante una estadística adicional, un modelo de supervivencia. Esta estadística genera la probabilidad de metástasis distantes de tumor como función de tiempo desde el diagnóstico inicial. Se puede usar una serie de [0050] For prognostic markers, validation of the set of markers can be carried out by means of an additional statistic, a survival model. This statistic generates the probability of distant tumor metastases as a function of time since the initial diagnosis. You can use a series of

30 modelos, como el Weibull, el normal, el normal logarítmico, el logístico logarítmico, el exponencial logarítmico o el Rayleigh logarítmico (Capítulo 12 de "Life Testing", S-PLUS 2000 GUIDE TO STATISTICS, Vol. 2, p. 368 (2000)). Para el modelo "normal", la probabilidad de metástasis distante P en un tiempo t se calcula como 30 models, such as Weibull, normal, logarithmic normal, logarithmic logistic, logarithmic exponent or logarithmic Rayleigh (Chapter 12 of "Life Testing", S-PLUS 2000 GUIDE TO STATISTICS, Vol. 2, p. 368 ( 2000)). For the "normal" model, the probability of distant metastasis P at a time t is calculated as

imagen1 Ecuación (4) image 1 Equation (4)

[0051] donde α es fijo e igual a 1 y τ es un parámetro que hay que ajustar y que mide la “previsión de vida”. [0051] where α is fixed and equal to 1 and τ is a parameter that must be adjusted and measures the "life forecast".

35 [0052] Para todos aquellos experimentados en la técnica resultará evidente que los métodos de más arriba, especialmente los métodos estadísticos, descritos más arriba, no están limitados a la identificación de marcadores asociados al cáncer de mama, sino que pueden usarse para identificar conjuntos de genes marcadores asociados a cualquier fenotipo. El fenotipo puede ser la presencia o ausencia de una enfermedad como el cáncer, o la presencia o ausencia de cualquier categoría clínica de identificación asociado a ese cáncer. [0052] For all those skilled in the art it will be apparent that the above methods, especially the statistical methods, described above, are not limited to the identification of markers associated with breast cancer, but can be used to identify sets of marker genes associated with any phenotype. The phenotype may be the presence or absence of a disease such as cancer, or the presence or absence of any clinical category of identification associated with that cancer.

40 En el contexto de las enfermedades, el fenotipo puede ser un pronóstico como el tiempo de supervivencia, la probabilidad de metástasis distante de un estado de enfermedad o la probabilidad de una respuesta específica a un régimen terapéutico o profiláctico. El fenotipo no tiene por qué ser un cáncer o una enfermedad; el fenotipo puede ser una característica nominal asociada a un individuo sano. 40 In the context of diseases, the phenotype can be a prognosis such as survival time, the probability of distant metastases from a disease state or the probability of a specific response to a therapeutic or prophylactic regimen. The phenotype does not have to be a cancer or a disease; The phenotype can be a nominal characteristic associated with a healthy individual.

5.3.3 RECOGIDA DE MUESTRAS 5.3.3 SAMPLE COLLECTION

45 [0053] En la presente invención, se extraen moléculas polinucleótidas destino de una muestra tomada de un individuo aquejado de cáncer de mama. La muestra puede recogerse de cualquier manera clínicamente aceptable, pero siempre de forma que se conserven los polinucleótidos derivados de marcadores (por ej., ARN). A ser posible, el ANRm o los ácidos nucleicos derivados del mismo (esto es, el ADNc o el ADN amplificado) deben etiquetarse de forma que se distingan de las moléculas polinucleótidas de control o patrón y ambos se [0053] In the present invention, target polynucleotide molecules are extracted from a sample taken from an individual suffering from breast cancer. The sample may be collected in any clinically acceptable manner, but always in a manner that conserves marker derived polynucleotides (eg, RNA). If possible, the ANRm or nucleic acids derived from it (i.e., the cDNA or the amplified DNA) should be labeled so that they differ from the control or standard polynucleotide molecules and both are

50 hibridarán simultánea o independientemente con un biochip que comprenda algunos o todos los marcadores o conjuntos o subconjuntos de marcadores descritos más arriba. Como alternativa, el ANRm o los ácidos nucleicos derivados del mismo pueden etiquetarse con la misma etiqueta que las moléculas polinucleótidas de control o patrón, en las que se compara la intensidad de hibridación de cada uno en una sonda en concreto. La muestra puede consistir en cualquier muestra de tejido clínicamente relevante, como una biopsia tumoral o un aspirado con aguja fina, o una muestra de fluido corporal, como sangre, plasma, suero, linfa, fluido ascítico, fluido cístico, orina o exudado de pezón. La muestra puede tomarse de un ser humano o, en un contexto veterinario, de animales no humanos como rumiantes, equinos, porcinos u ovinos, o de animales domésticos de compañía como felinos y caninos. 50 will hybridize simultaneously or independently with a biochip comprising some or all of the markers or sets or subsets of markers described above. Alternatively, the ANRm or nucleic acids derived therefrom can be labeled with the same label as the control or standard polynucleotide molecules, in which the intensity of hybridization of each in a particular probe is compared. The sample may consist of any clinically relevant tissue sample, such as a tumor biopsy or a fine needle aspirate, or a sample of body fluid, such as blood, plasma, serum, lymph, ascites fluid, cystic fluid, urine or nipple exudate . The sample can be taken from a human being or, in a veterinary context, from non-human animals such as ruminants, horses, pigs or sheep, or from domestic pets such as felines and canines.

[0054] Los métodos para preparar ARN total y poli(A) + son bien conocidos y se describen de modo general en Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)) y Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)). [0054] The methods for preparing total RNA and poly (A) + are well known and are generally described in Sambrook et al., MOLECULAR CLONING - A MANUAL LABORATORY (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)) and Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)).

[0055] El ARN puede aislarse de las células eucarióticas mediante procesos que implican la lisis de las células y la desnaturalización de las proteínas contenidas en las mismas. Las células de interés consisten en las células de tipo natural (esto es, no cancerosas), las células de tipo natural expuestas a medicamentos, las células tumorales u procedentes de tumores, las células modificadas, las células de línea celular normal o tumoral y las células modificadas expuestas a medicamentos. [0055] RNA can be isolated from eukaryotic cells by processes that involve cell lysis and denaturation of the proteins contained therein. The cells of interest consist of wild-type cells (that is, non-cancerous), wild-type cells exposed to drugs, tumor or tumor-derived cells, modified cells, normal or tumor cell line cells and modified cells exposed to medications.

[0056] Se pueden ejecutar pasos adicionales para eliminar el ADN. Se puede llevar a cabo una lisis celular con un detergente no iónico seguida de microcentrifugado para eliminar los núcleos y por ende la masa del ADN celular. En una materialización, el ARN se extrae de las células de los diversos tipos de interés mediante lisis de tiocianato de guanidina seguida de centrifugado de CsCl para separar el ARN del ADN (Chirgwin et al., Biochemistry 18:5294-5299 (1979)). El Poli(A)+ ARN se selecciona mediante selección con celulosa oligo-dT (véase Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). Como alternativa, la separación del ARN del ADN se puede llevar a cabo mediante extracción orgánica, por ejemplo, con fenol caliente o fenol/cloroformo/alcohol isoamílico. [0056] Additional steps can be taken to remove the DNA. A cell lysis can be carried out with a non-ionic detergent followed by microcentrifugation to remove the nuclei and hence the mass of the cellular DNA. In one embodiment, the RNA is extracted from the cells of the various types of interest by guanidine thiocyanate lysis followed by CsCl centrifugation to separate the RNA from the DNA (Chirgwin et al., Biochemistry 18: 5294-5299 (1979)) . Poly (A) + RNA is selected by selection with oligo-dT cellulose (see Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989) Alternatively, the separation of RNA from DNA can be carried out by organic extraction, for example, with hot phenol or phenol / chloroform / isoamyl alcohol.

[0057] Si se desea, se puede añadir inhibidores de RNasa al tampón de lisis. Igualmente, para ciertos tipos de células, puede ser aconsejable añadir al protocolo un paso de desnaturalización/digestión de proteína. [0057] If desired, RNase inhibitors can be added to the lysis buffer. Likewise, for certain types of cells, it may be advisable to add a protein denaturation / digestion step to the protocol.

[0058] Para muchas aplicaciones, es deseable ante todo enriquecer el ARNm con respecto a otros ARNs celulares, como ARN de transferencia (ARNt) y ARN ribosómico (ARNr). La mayoría de los ARNm contienen una cola de poli(A) en su extremo 3’. Con esto es posible enriquecerlos por afinidad cromatográfica, por ejemplo, mediante oligo(dT) or poly(U) acoplado a un soporte sólido, como celulosa o Sephadex™ (véase Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994). Una vez ligado el poly(A)+ ARNm, se lo eluye de la columna de afinidad mediante 2 mM EDTA/0.1% SDS. [0058] For many applications, it is desirable first of all to enrich mRNA with respect to other cellular RNAs, such as transfer RNA (tRNA) and ribosomal RNA (rRNA). Most mRNAs contain a poly (A) tail at its 3 ’end. With this it is possible to enrich them by chromatographic affinity, for example, by oligo (dT) or poly (U) coupled to a solid support, such as cellulose or Sephadex ™ (see Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994) Once bound the poly (A) + mRNA, it is eluted from the affinity column by 2 mM EDTA / 0.1% SDS.

[0059] La muestra de ARN comprende una pluralidad de diferentes moléculas de ARNm, cada una de las cuales tiene una secuencia nucleótida diferente. En una materialización específica, las moléculas de ARNm en la muestra de ARN comprenden al menos 100 secuencias nucleótidas diferentes. Más preferiblemente, las moléculas de ARNm en la muestra de ARN comprenden moléculas de ARNm correspondientes a cada uno de los genes marcadores. En otra materialización específica, la muestra de ARN es una muestra de ARN de mamífero. [0059] The RNA sample comprises a plurality of different mRNA molecules, each of which has a different nucleotide sequence. In a specific embodiment, the mRNA molecules in the RNA sample comprise at least 100 different nucleotide sequences. More preferably, the mRNA molecules in the RNA sample comprise mRNA molecules corresponding to each of the marker genes. In another specific embodiment, the RNA sample is a mammalian RNA sample.

[0060] En una materialización específica, se usan ARN o ARNm totales de las células en los métodos de la invención. La fuente de ARN puede ser células de una planta o animal, humano, mamífero, primate, animal no humano, perro, gato, ratón, ave, levadura, eucariota, procariota, etc. En materializaciones específicas, el método de la invención se usa con una muestra que contiene ARNm o ARN total de 1x106 células o menos. En otra materialización se puede aislar las proteínas de las fuentes anteriores con métodos conocidos en la técnica para usarlas en análisis de expresión a nivel proteínico. [0060] In a specific embodiment, total RNA or mRNA of the cells are used in the methods of the invention. The source of RNA can be cells of a plant or animal, human, mammal, primate, non-human animal, dog, cat, mouse, bird, yeast, eukaryotic, prokaryotic, etc. In specific embodiments, the method of the invention is used with a sample containing mRNA or total RNA of 1x106 cells or less. In another embodiment, proteins can be isolated from previous sources with methods known in the art for use in protein level expression analysis.

[0061] Las sondas a los homólogos de las secuencias de marcadores que aquí se dan a conocer pueden emplearse preferiblemente allí donde se analice ácido nucleico no humano. [0061] Probes to homologs of the marker sequences disclosed herein may preferably be used where non-human nucleic acid is analyzed.

5.4 MÉTODOS DE EMPLEO DE LOS CONJUNTOS DE MARCADORES DE CÁNCER DE MAMA 5.4 EMPLOYMENT METHODS OF BREAST CANCER MARKER SETS

5.4.1 MÉTODOS DE DIAGNÓSTICO 5.4.1 DIAGNOSTIC METHODS

[0062] A continuación se describen métodos de empleo de los conjuntos de marcadores para analizar una muestra de un individuo con el fin de determinar el tipo o subtipo de tumor del individuo a nivel molecular, tanto si es un tumor de tipo ER(+) o ER(-) y tanto si es un tumor asociado a BRCA1 o esporádico. En realidad no es preciso que el individuo esté aquejado de cáncer de mama. Esencialmente, consiste en comparar la expresión de genes de marcadores específicos en el individuo, o una muestra tomada de los mismos, con un patrón o control. Por ejemplo, supongamos dos condiciones en relación con el cáncer de mama, X e Y. Podemos comparar el nivel de expresión de los marcadores de pronóstico de cáncer de mama para la condición X en un [0062] The following describes methods of using the marker sets to analyze a sample of an individual in order to determine the type or subtype of the individual's tumor at the molecular level, whether it is an ER (+) type tumor. or ER (-) and whether it is a tumor associated with BRCA1 or sporadic. It is not really necessary for the individual to suffer from breast cancer. Essentially, it involves comparing the expression of specific marker genes in the individual, or a sample taken from them, with a pattern or control. For example, suppose two conditions in relation to breast cancer, X and Y. We can compare the level of expression of breast cancer prognosis markers for condition X in a

individuo con el nivel de los polinucleótidos derivados del marcador en un control, en donde el nivel representa el nivel de expresión indicado por las muestras que tienen la condición X. En este caso, si la expresión de los marcadores en la muestra del individuo es sustancialmente (esto es, estadísticamente) diferente de la del control, entonces el individuo no tiene condición X. Donde, como aquí, la opción es bimodal (esto es, una muestra es o X 5 o Y), se puede decir adicionalmente que el individuo tiene la condición Y. Por supuesto que también se puede realizar la comparación con un control que represente la condición Y. Preferiblemente, las dos se llevarán a cabo simultáneamente, de modo que cada control actúe a la vez como control positivo y como negativo. Así, el resultado típico puede ser bien una diferencia demostrable respecto a los niveles de expresión (esto es, la cantidad de ARN derivado del marcador, o los polinucleótidos derivados del mismo) representados por el control, individual with the level of polynucleotides derived from the marker in a control, wherein the level represents the level of expression indicated by the samples having the condition X. In this case, if the expression of the markers in the individual's sample is substantially (that is, statistically) different from that of the control, then the individual has no condition X. Where, as here, the option is bimodal (that is, a sample is either X 5 or Y), it can additionally be said that the individual it has the Y condition. Of course, the comparison can also be made with a control that represents the Y condition. Preferably, the two will be carried out simultaneously, so that each control acts both as a positive and a negative control. Thus, the typical result may well be a demonstrable difference with respect to expression levels (that is, the amount of RNA derived from the marker, or polynucleotides derived therefrom) represented by the control,

10 o bien ninguna diferencia significativa. 10 or no significant difference.

[0063] Así pues, en una materialización, el método para determinar el estado concreto de un individuo en relación con un tumor comprende los pasos de (1) hibridar los nucleótidos destino etiquetados de un individuo con un biochip que contenga uno de los conjuntos de marcadores de más arriba; (2) hibridar las moléculas polinucleótidas de patrón o control con el biochip, en donde las moléculas de patrón o control se etiquetan de 15 forma diferenciada a partir de las moléculas destino, y (3) determinar la diferencia en los niveles de transcripción, [0063] Thus, in a materialization, the method for determining the specific state of an individual in relation to a tumor comprises the steps of (1) hybridizing the labeled target nucleotides of an individual with a biochip containing one of the sets of markers above; (2) hybridize the standard or control polynucleotide molecules with the biochip, where the standard or control molecules are labeled differently from the target molecules, and (3) determine the difference in transcription levels,

o la ausencia de la misma, entre el destino y el patrón o control, en donde la diferencia, o la ausencia de la misma, determina el estado del individuo en relación con el tumor. En una materialización más específica, las moléculas de patrón o control comprenden polinucleótidos obtenidos de marcadores a partir de una reserva de muestras de individuos normales, o una reserva de muestras de tumores de individuos con tumores de tipo 20 esporádico. En una materialización preferida, el patrón o control es una reserva de polinucleótidos derivados de marcadores generada artificialmente, reserva que está destinada a mimetizar el nivel de expresión de marcadores apreciado en las muestras clínicas de tejido normal o de cáncer de mama que tenga una indicación clínica específica (esto es, canceroso o no canceroso); tumor de ER(+) o ER(-); tumor de BRCA1- o de tipo esporádico. En otra materialización específica, las moléculas de control comprenden una reserva obtenida de or the absence thereof, between the destination and the pattern or control, where the difference, or the absence thereof, determines the individual's status in relation to the tumor. In a more specific materialization, the pattern or control molecules comprise polynucleotides obtained from markers from a sample pool of normal individuals, or a tumor sample pool from individuals with sporadic type 20 tumors. In a preferred embodiment, the pattern or control is a reserve of artificially generated markers derived polynucleotides, a reserve that is intended to mimic the level of expression of markers appreciated in clinical samples of normal or breast cancer tissue that has a clinical indication. specific (that is, cancerous or non-cancerous); ER (+) or ER (-) tumor; BRCA1- or sporadic tumor. In another specific materialization, the control molecules comprise a reserve obtained from

25 líneas celulares normales o de cáncer de mama. 25 normal or breast cancer cell lines.

[0064] A continuación se describen conjuntos de marcadores que sirven para distinguir tipos de tumores ER(+) de los de ER(-). Así, en una materialización del método de más arriba, el nivel de polinucleótidos (esto es, ARNm [0064] The following describes sets of markers that serve to distinguish types of ER (+) from ER (-) tumors. Thus, in a materialization of the method above, the level of polynucleotides (that is, mRNA

o polinucleótidos derivados del mismo) en una muestra de un individuo, expresada a partir de los marcadores suministrados en la Tabla 1, se compara con el nivel de expresión de los mismos marcadores a partir de un 30 control, en donde el control comprende polinucleótidos en relación con marcadores obtenidos de muestras de ER(+), de ER (-) o de ambos. Preferiblemente, la comparación será tanto con ER(+) como con ER(-) y preferiblemente la comparación será con reservas de polinucleótidos procedentes de una serie de muestras de ER(+) y ER(-), respectivamente. Allí donde la expresión de marcadores del individuo se parezca más o esté en correspondencia más estrecha con el control de ER(+) y no se parezca o corresponda con el control de ER(-), al or polynucleotides derived therefrom) in a sample of an individual, expressed from the markers provided in Table 1, is compared with the level of expression of the same markers from a control, wherein the control comprises polynucleotides in relationship with markers obtained from samples of ER (+), ER (-) or both. Preferably, the comparison will be with both ER (+) and ER (-) and preferably the comparison will be with polynucleotide reserves from a series of ER (+) and ER (-) samples, respectively. Where the expression of individual markers is more similar or in closer correspondence with the ER (+) control and does not resemble or correspond to the ER (-) control, the

35 individuo se le clasificará como ER(+). Allí donde la reserva no sea ER(+) o ER(-) puros, por ejemplo, se usará una reserva esporádica. Se debe hibridar contra la reserva un conjunto de experimentos que usen individuos con categoría de ER conocida, con el fin de definir las plantillas de expresión para el grupo de ER(+) y de ER(-). A cada individuo con categoría de ER desconocida se lo hibridará contra la misma reserva y se comparará el perfil de expresión con las plantillas (s) para determinar la categoría de ER del individuo. 35 individual will be classified as ER (+). Where the reservation is not pure ER (+) or ER (-), for example, a sporadic reservation will be used. A set of experiments that use individuals with a known ER category should be hybridized against the reserve, in order to define the expression templates for the ER (+) and ER (-) group. Each individual with an unknown ER category will be hybridized against the same reserve and the expression profile will be compared with the templates (s) to determine the individual's ER category.

40 [0065] Lo que se describe a continuación son conjuntos de marcadores que sirven para distinguir los tumores relacionados con BRCA1 de los tumores esporádicos. Por lo tanto, el método puede ejecutarse sustancialmente igual que para la determinación de ER(+/-), con la excepción de que los marcadores son los enumerados en las Tablas 3 y 4 y que los marcadores de control son una reserva de muestras de tumores de BRCA1 de polinucleótidos derivados de marcadores y una reserva de polinucleótidos derivados de marcadores procedente [0065] What is described below are sets of markers that serve to distinguish BRCA1-related tumors from sporadic tumors. Therefore, the method can be executed substantially the same as for the determination of ER (+/-), with the exception that the markers are those listed in Tables 3 and 4 and that the control markers are a stock of samples of BRCA1 tumors of marker-derived polynucleotides and a pool of marker-derived polynucleotides from

45 de tumores esporádicos. Se considera que una paciente tiene una mutación germinal de BRCA1 allí donde la expresión de los polinucleótidos derivados de marcador del individuo se parezca más, o donde esté en correspondencia más estrecha, a la del control del BRCA1. Cuando el control no sea BRCA1 o esporádico puros, se pueden definir dos plantillas de manera parecida a la usada para hallar la categoría de ER, como se explica más arriba. 45 sporadic tumors. A patient is considered to have a germline mutation of BRCA1 where the expression of the individual marker-derived polynucleotides is more similar, or where it is in closer correspondence, to that of the BRCA1 control. When the control is not pure BRCA1 or sporadic, two templates can be defined in a manner similar to that used to find the ER category, as explained above.

50 [0066] Para las dos anteriores materializaciones del método se puede usar todo el conjunto de marcadores (esto es, el conjunto completo de marcadores para las Tablas 1 o 3). En otras materializaciones se pueden usar subconjuntos de los marcadores. En una materialización preferida se usan los marcadores preferidos enumerados las Tablas 2 o 4. [0066] For the previous two materializations of the method, the entire set of markers can be used (that is, the complete set of markers for Tables 1 or 3). In other embodiments, subsets of the markers can be used. In a preferred embodiment, the preferred markers listed in Tables 2 or 4 are used.

[0067] La semejanza entre el perfil de expresión de marcadores de un individuo y el de un control puede [0067] The similarity between the marker expression profile of an individual and that of a control can

55 calcularse de varias maneras. En el caso más simple, los perfiles pueden compararse visualmente en una lista impresa de datos de diferencia de expresión. Como alternativa, la semejanza puede calcularse matemáticamente. 55 calculated in several ways. In the simplest case, profiles can be visually compared on a printed list of expression difference data. Alternatively, similarity can be calculated mathematically.

[0068] En una materialización, la medida de la semejanza entre dos pacientes x e y, o una paciente x y una plantilla y, puede calcularse mediante la siguiente ecuación: [0068] In a materialization, the measure of similarity between two patients x and y, or one patient x and a template y, can be calculated using the following equation:

imagen1image 1

Ecuación (5)    Equation (5)

En esa ecuación, x e y son dos pacientes con componentes de cociente logarítmico xi e yi, i =1,...,N = 4.986. A va asociado el error σxi. Cuanto menor es el valor σxi, más fiable es la medición xiIn that equation, x e y are two patients with components of logarithmic quotient xi and yi, i = 1, ..., N = 4,986. A is associated with the error σxi. The lower the σxi value, the more reliable the measurement xi

imagen2image2

es la media aritmética ponderada de error. is the weighted arithmetic mean of error.

[0069] En una materialización preferida, se desarrolla las plantillas por comparación de muestras. Se define la plantilla como la media ponderada de error del cociente logarítmico de la diferencia de expresión para el grupo de genes marcadores capaces de diferenciar la condición específica de la relacionada con el cáncer de mama. Por ejemplo, se definen plantillas para muestras de ER(+) y para muestras de ER(-). A continuación se calcula un parámetro clasificador. Este parámetro puede calcularse mediante diferencias de nivel de expresión entre la muestra y la plantilla o bien hallando un coeficiente de correlación. Dicho coeficiente, Pi, puede calcularse mediante la siguiente ecuación: [0069] In a preferred embodiment, templates are developed by comparison of samples. The template is defined as the weighted mean error of the logarithmic quotient of the difference in expression for the group of marker genes capable of differentiating the specific condition from that related to breast cancer. For example, templates are defined for ER (+) samples and for ER (-) samples. Next, a classifier parameter is calculated. This parameter can be calculated by differences in expression level between the sample and the template or by finding a correlation coefficient. This coefficient, Pi, can be calculated using the following equation:

imagen1 Ecuación (1) image 1 Equation (1)

donde Zi es la plantilla de expresión i, e y es el perfil de expresión de una paciente. where Zi is the expression template i, e and is the expression profile of a patient.

[0070] De este modo, en una materialización más específica, el método de más arriba para determinar la categoría concreta de un individuo en relación con el tumor comprende los pasos de (1) hibridar los polinucleótidos destino etiquetados de un individuo con un biochip que contenga uno de los conjuntos de marcadores de más arriba; (2) hibridar moléculas polinucleótidas de patrón o control con el biochip, en donde las moléculas de patrón o control están etiquetadas de forma diferenciada con respecto a las moléculas destino; (3) determinar el cociente (o diferencia) de niveles de transcripción entre dos canales (individual y de control), o simplemente los niveles de transcripción del individuo, y (4) comparar los resultados de (3) con las plantillas predefinidas, en donde dicha determinación se lleva a cabo mediante la estadística de la Ecuación 1 o de la Ecuación 5 y en donde la diferencia, o la ausencia de la misma, determina la categoría del individuo en relación con el tumor. [0070] Thus, in a more specific materialization, the above method for determining the specific category of an individual in relation to the tumor comprises the steps of (1) hybridizing the labeled target polynucleotides of an individual with a biochip that contain one of the marker sets above; (2) hybridize standard or control polynucleotide molecules with the biochip, wherein the standard or control molecules are labeled differently from the target molecules; (3) determine the ratio (or difference) of transcription levels between two channels (individual and control), or simply the individual's transcription levels, and (4) compare the results of (3) with the predefined templates, in where said determination is carried out through the statistics of Equation 1 or Equation 5 and where the difference, or the absence thereof, determines the category of the individual in relation to the tumor.

5.4.2 MÉTODOS DE PRONÓSTICO 5.4.2 FORECAST METHODS

[0071] La presente invención se refiere a conjuntos de marcadores que sirven para distinguir las muestras de pacientes con buen pronóstico de las muestras de pacientes con pronóstico deficiente. Así pues, la invención suministra un método de uso de estos marcadores para determinar si un individuo aquejado de cáncer de mama tendrá un pronóstico clínico bueno o deficiente. En una materialización, la invención suministra un método para determinar si un individuo aquejado de cáncer de mama tiene probabilidades de experimentar una recaída dentro de los cinco años siguientes al diagnóstico inicial (eso es, si un individuo tiene pronóstico deficiente) que comprende (1) comparar el nivel de expresión de los marcadores enumerados en la Tabla 5 en una muestra tomada del individuo al nivel de los mismos marcadores en un patrón o control, donde los niveles del patrón o control representan los hallados en un individuo con pronóstico deficiente, y (2) determinar si el nivel de los nucleótidos relacionados con marcadores en la muestra del individuo se diferencia significativamente del nivel del control, en donde si no se aprecia una diferencia sustancial, la paciente tiene pronóstico deficiente, mientras que si hay una diferencia sustancial, la paciente tiene buen pronóstico. Los experimentados en la técnica advertirán en seguida que los marcadores asociados al buen pronóstico también pueden usarse como controles. En una materialización más específica se prueban ambos controles. En caso de que la reserva no sea “buen pronóstico” o “pronóstico deficiente” puros, debe hibridarse contra la reserva un conjunto de experimentos con individuos con resultado conocido, para definir las plantillas de expresión para los grupos de buen diagnóstico y diagnóstico deficiente. A cada individuo con resultado desconocido se lo hibrida contra la misma reserva y el perfil de expresión resultante se compara con las plantillas para predecir el resultado del mismo. [0071] The present invention relates to sets of markers that serve to distinguish patient samples with good prognosis from patient samples with poor prognosis. Thus, the invention provides a method of using these markers to determine whether an individual suffering from breast cancer will have a good or poor clinical prognosis. In one embodiment, the invention provides a method to determine if an individual suffering from breast cancer is likely to experience a relapse within five years after the initial diagnosis (that is, if an individual has poor prognosis) comprising (1) compare the level of expression of the markers listed in Table 5 in a sample taken from the individual at the level of the same markers in a pattern or control, where the levels of the pattern or control represent those found in an individual with poor prognosis, and ( 2) determine if the level of nucleotides related to markers in the individual's sample differs significantly from the level of control, where if a substantial difference is not appreciated, the patient has poor prognosis, while if there is a substantial difference, the Patient has a good prognosis. Those skilled in the art will immediately notice that the markers associated with the good prognosis can also be used as controls. In a more specific materialization both controls are tested. In case the reserve is not "good prognosis" or "poor prognosis" pure, a set of experiments with individuals with known results should be hybridized against the reserve, to define the expression templates for the groups of good diagnosis and poor diagnosis. Each individual with an unknown result is hybridized against the same reserve and the resulting expression profile is compared with the templates to predict its outcome.

[0072] El pronóstico deficiente del cáncer de mama puede indicar que un tumor es relativamente agresivo, mientras que el buen pronóstico puede indicar que un tumor es relativamente no agresivo. Existe un método para determinar el curso del tratamiento de una paciente de cáncer de mama, que consiste en determinar si el nivel de expresión de los 231 marcadores de la Tabla 5, o un subconjunto de los mismos, se corresponde con el nivel de dichos marcadores en una muestra que representa un patrón de expresión de buen pronóstico o un patrón de pronóstico deficiente, y determinar una duración de tratamiento, en donde si la expresión se corresponde con el patrón de pronóstico deficiente, el tumor es tratado como tumor agresivo. [0072] The poor prognosis of breast cancer may indicate that a tumor is relatively aggressive, while the good prognosis may indicate that a tumor is relatively non-aggressive. There is a method to determine the course of treatment of a breast cancer patient, which consists in determining whether the level of expression of the 231 markers in Table 5, or a subset thereof, corresponds to the level of said markers. in a sample that represents a good prognostic expression pattern or a poor prognosis pattern, and determine a duration of treatment, where if the expression corresponds to the poor prognosis pattern, the tumor is treated as an aggressive tumor.

[0073] Al igual que con los marcadores de diagnóstico, el método puede usar el conjunto completo de marcadores enumerados en la Tabla 5. Sin embargo, también pueden usarse subconjuntos de los marcadores. En una materialización preferida, se usa el subconjunto enumerado en la Tabla 6. [0073] As with diagnostic markers, the method can use the complete set of markers listed in Table 5. However, subsets of the markers can also be used. In a preferred embodiment, the subset listed in Table 6 is used.

[0074] La clasificación de una muestra como “buen pronóstico” o “pronóstico deficiente” se lleva a cabo de manera sustancialmente igual que para los marcadores de diagnóstico descritos más arriba, en donde se genera una plantilla con la que se comparan los niveles de expresión de marcadores en la muestra. [0074] The classification of a sample as "good prognosis" or "poor prognosis" is carried out in substantially the same way as for the diagnostic markers described above, where a template is generated with which the levels of expression of markers in the sample.

[0075] El uso de conjuntos de marcadores no está limitado a los estados referentes al pronóstico del cáncer de mama, por lo que puede aplicarse en una variedad de fenotipos o estados, clínicos o experimentales, donde juegue algún papel la expresión de genes. Allí donde se haya identificado un conjunto de marcadores que corresponda a dos o más fenotipos puede usarse los conjuntos de marcadores para distinguir dichos fenotipos. Por ejemplo, los fenotipos pueden ser el diagnóstico y/o el pronóstico de categorías clínicas o fenotipos asociados a otros cánceres, otros estados de enfermedad u otros estados fisiológicos, en donde los datos de nivel de expresión proceden de un conjunto de genes en correlación con el estado de enfermedad o fisiológico concreto. [0075] The use of marker sets is not limited to the states related to breast cancer prognosis, so it can be applied in a variety of clinical or experimental phenotypes or states, where gene expression plays a role. Where a set of markers corresponding to two or more phenotypes has been identified, the marker sets can be used to distinguish said phenotypes. For example, the phenotypes can be the diagnosis and / or prognosis of clinical categories or phenotypes associated with other cancers, other disease states or other physiological states, where the level of expression data comes from a set of genes in correlation with the specific disease or physiological state.

5.4.3 MEJORA DE LA SENSIBILIDAD A LAS DIFERENCIAS DE NIVEL DE EXPRESIÓN 5.4.3 IMPROVING SENSITIVITY TO EXPRESSION LEVEL DIFFERENCES

[0076] Al usar los marcadores que aquí se dan a conocer y, de hecho, al usar cualquier conjunto de marcadores para diferenciar a un individuo con un fenotipo de otro individuo con un segundo fenotipo, podemos comparar la expresión absoluta de cada uno de los marcadores de una muestra con un control; por ejemplo, el control puede ser el del nivel medio de expresión de cada uno de los marcadores, respectivamente, en una reserva de individuos. Para aumentar la sensibilidad de la comparación, no obstante, los valores del nivel de expresión deben transformarse preferentemente de una serie de maneras. [0076] By using the markers disclosed herein and, in fact, by using any set of markers to differentiate an individual with a phenotype of another individual with a second phenotype, we can compare the absolute expression of each of the markers of a sample with a control; for example, the control may be that of the average level of expression of each of the markers, respectively, in a reserve of individuals. To increase the sensitivity of the comparison, however, the expression level values should preferably be transformed in a number of ways.

[0077] Por ejemplo, el nivel de expresión de cada uno de los marcadores puede normalizarse por el nivel medio de expresión de todos los marcadores cuyo nivel de expresión se determina, o por el nivel medio de expresión de un conjunto de genes de control. Así, en una materialización, los marcadores se representan con sondas en un biochip y el nivel de expresión de cada uno de los marcadores se normaliza mediante la media o la mediana del nivel de expresión en todos los genes representados en el biochip, incluido cualquier gen no marcador. En una materialización específica, la normalización se lleva a cabo dividiendo la mediana o media del nivel de expresión de todos los genes del biochip. En otra materialización, el nivel de expresión de los marcadores se normaliza mediante la media o la mediana del nivel de expresión de un conjunto de marcadores de control. En una materialización específica, los marcadores de control comprenden un conjunto de genes constitutivos. En otra materialización específica, la normalización se lleva a cabo dividiendo por la mediana o media del nivel de expresión de los genes de control. [0077] For example, the expression level of each of the markers can be normalized by the average level of expression of all markers whose expression level is determined, or by the average level of expression of a set of control genes. Thus, in a materialization, the markers are represented with probes in a biochip and the expression level of each of the markers is normalized by means of the mean or the median level of expression in all the genes represented in the biochip, including any gene. no marker In a specific materialization, normalization is carried out by dividing the median or average level of expression of all biochip genes. In another embodiment, the level of expression of the markers is normalized by means of the mean or the median level of expression of a set of control markers. In a specific materialization, the control markers comprise a set of constitutive genes. In another specific materialization, normalization is carried out by dividing by the median or average level of expression of the control genes.

[0078] La sensibilidad de un ensayo basado en marcadores aumentará también si los niveles de expresión de marcadores individuales se comparan con la expresión de esos mismos marcadores en una reserva de muestras. Preferiblemente, la comparación se hará con la media o la mediana del nivel de expresión de cada uno de los genes marcadores en la reserva de muestras. Dicha comparación puede realizarse, por ejemplo, dividiendo por la media o la mediana del nivel de expresión de la reserva para cada uno de los marcadores del nivel de expresión cada uno de los marcadores de la muestra. Esto produce el efecto de acentuar las diferencias relativas de expresión entre los marcadores de la muestra y los marcadores de la reserva en conjunto, haciendo las comparaciones más sensibles y con más probabilidades de que produzcan resultados significativos que si solo se usan niveles de expresión absolutos. Los datos del nivel de expresión pueden transformarse de la forma que más convenga; preferiblemente, los datos del nivel de expresión para todos se transforman a logaritmo antes de tomar las medias o las medianas. [0078] The sensitivity of a marker-based assay will also increase if the expression levels of individual markers are compared with the expression of those same markers in a sample pool. Preferably, the comparison will be made with the mean or median level of expression of each of the marker genes in the sample pool. Such comparison can be made, for example, by dividing by the mean or median the level of expression of the reserve for each of the markers of the level of expression each of the markers of the sample. This has the effect of accentuating the relative differences in expression between the markers in the sample and the markers in the pool as a whole, making comparisons more sensitive and more likely to produce significant results than if only absolute expression levels are used. Expression level data can be transformed in the most convenient way; preferably, the expression level data for all is transformed into logarithm before taking the means or the medians.

[0079] Para realizar comparaciones con una reserva pueden usarse dos métodos. Primero, los niveles de expresión de los marcadores de la muestra pueden compararse con el nivel de expresión de aquellos marcadores de la reserva donde el ácido nucleico procedente de la muestra y el ácido nucleico procedente de la reserva se hibridan en el curso de un único experimento. Dicho método exige que se genere nuevo ácido nucleico en la reserva para cada comparación o números limitados de comparaciones, por lo que se halla limitado por la cantidad de ácido nucleico disponible. Como alternativa, y preferiblemente, los niveles de expresión en una reserva, ya estén normalizados y/o transformados o no, se almacenarán en un ordenador, o en soportes informáticos, para usarlos en comparaciones con los datos individuales de nivel de expresión de la muestra (esto es, datos de un solo canal). [0079] Two methods can be used to make comparisons with a reservation. First, the expression levels of the sample markers can be compared with the expression level of those reserve markers where the nucleic acid from the sample and the nucleic acid from the reserve hybridize in the course of a single experiment. . Said method requires that new nucleic acid be generated in the reserve for each comparison or limited numbers of comparisons, so it is limited by the amount of nucleic acid available. Alternatively, and preferably, the expression levels in a reservation, whether normalized and / or transformed or not, will be stored on a computer, or on computer media, for use in comparisons with the individual expression level data of the sample (that is, single channel data).

[0080] Así pues, la presente invención suministra el siguiente método para clasificar una primera célula u organismo como poseedor de uno de al menos dos diferentes fenotipos, donde los diferentes fenotipos comprenden un primer fenotipo y un segundo fenotipo. El nivel de expresión de cada gen de una pluralidad de ellos en una primera muestra procedente de la primera célula u organismo se compara con el nivel de expresión de cada uno de dichos genes, respectivamente, en una muestra colectiva de una pluralidad de células u organismos, pluralidad de células u organismos que comprende diferentes células u organismos que muestran al menos dos diferentes fenotipos, respectivamente, como se dice más arriba, para producir un primer valor comparado. El primer valor comparado se compara a continuación con un segundo valor comparado, en donde dicho segundo valor comparado es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo que se caracteriza por tener el segundo fenotipo al nivel de expresión de cada uno de dichos genes, respectivamente, en la muestra colectiva. Opcionalmente, se puede comparar el primer valor comparado con valores comparados adicionales, respectivamente, donde cada valor comparado adicional es el producto de un método que consiste en comparar el nivel de expresión de cada uno de dichos genes en una muestra de una célula u organismo que se caracteriza por tener un fenotipo diferente de dichos primer y segundos fenotipos, pero incluido entre al menos dos diferentes fenotipos, al nivel de expresión de cada uno de dichos genes, respectivamente, en dicha muestra colectiva. Por último, se determina a cuál de dichos segundo, tercer y, si está presente, uno o más valores comparados adicionales se parece más dicho primer valor comparado, en donde se clasifica la primera célula u organismo como poseedor del fenotipo de la célula u organismo usado para producir dicho valor comparado más parecido a dicho primer valor comparado. [0080] Thus, the present invention provides the following method for classifying a first cell or organism as having one of at least two different phenotypes, where the different phenotypes comprise a first phenotype and a second phenotype. The level of expression of each gene of a plurality of them in a first sample from the first cell or organism is compared with the level of expression of each of said genes, respectively, in a collective sample of a plurality of cells or organisms. , plurality of cells or organisms comprising different cells or organisms that show at least two different phenotypes, respectively, as stated above, to produce a first compared value. The first compared value is then compared with a second compared value, wherein said second compared value is the product of a method that consists in comparing the level of expression of each of said genes in a sample of a cell or organism that is characterized by having the second phenotype at the level of expression of each of said genes, respectively, in the collective sample. Optionally, the first value can be compared compared to additional compared values, respectively, where each additional compared value is the product of a method that consists in comparing the level of expression of each of said genes in a sample of a cell or organism that It is characterized by having a different phenotype of said first and second phenotypes, but included between at least two different phenotypes, at the level of expression of each of said genes, respectively, in said collective sample. Finally, it is determined to which of said second, third and, if present, one or more additional compared values resembles said first compared value, where the first cell or organism is classified as having the phenotype of the cell or organism used to produce said compared value more similar to said first compared value.

[0081] En una materialización específica de este método, cada uno de los valores comparados es un cociente de los niveles de expresión de cada uno de dichos genes. En otra materialización específica, se normaliza cada uno de los niveles de expresión de cada uno de los genes de la muestra colectiva antes de proceder a cualquier paso de la comparación. En una materialización más específica, la normalización de los niveles de expresión se lleva a cabo dividiendo por la mediana o media del nivel de expresión de cada uno de los genes o dividiendo por la media o mediana del nivel de expresión de uno o más genes constitutivos de la muestra colectiva de dicha célula u organismo. En otra materialización específica, los niveles de expresión normalizados se someten a una transformación logarítmica y los pasos de la comparación consisten en restar la transformación logarítmica del logaritmo de los niveles de expresión de cada uno de los genes de la muestra. En otra materialización específica, los dos o más diferentes fenotipos son diferentes etapas de una enfermedad o trastorno. En otra materialización específica, los dos o más diferentes fenotipos son diferentes pronósticos de una enfermedad o trastorno. En otra materialización específica más, los niveles de expresión de cada uno de los genes, respectivamente, de la muestra colectiva o de dichos niveles de expresión de cada uno de dichos genes de una muestra de la célula u organismo que se caracteriza por tener el primer fenotipo, segundo fenotipo o dicho fenotipo diferente de dichos primer y segundo fenotipos, respectivamente, se almacenan en un ordenador o en un soporte informático. [0081] In a specific embodiment of this method, each of the values compared is a quotient of the expression levels of each of said genes. In another specific materialization, each of the expression levels of each of the genes in the collective sample is normalized before proceeding with any step of the comparison. In a more specific materialization, the normalization of expression levels is carried out by dividing by the median or average level of expression of each of the genes or dividing by the average or median level of expression of one or more constitutive genes of the collective sample of said cell or organism. In another specific materialization, the normalized expression levels undergo a logarithmic transformation and the steps of the comparison consist in subtracting the logarithmic transformation of the logarithm from the expression levels of each of the genes in the sample. In another specific materialization, the two or more different phenotypes are different stages of a disease or disorder. In another specific materialization, the two or more different phenotypes are different prognoses of a disease or disorder. In another specific materialization, the expression levels of each of the genes, respectively, of the collective sample or of said expression levels of each of said genes of a sample of the cell or organism that is characterized by having the first phenotype, second phenotype or said different phenotype of said first and second phenotypes, respectively, are stored on a computer or on a computer medium.

[0082] En otra materialización específica, los dos fenotipos tienen categoría de ER(+) o ER(-). En otra materialización específica, los dos fenotipos tienen categoría de BRCA1 o de tumor esporádico. En otra materialización específica más, los dos fenotipos son de buen pronóstico y de pronóstico deficiente. [0082] In another specific materialization, the two phenotypes have the category of ER (+) or ER (-). In another specific materialization, the two phenotypes have the category of BRCA1 or sporadic tumor. In another specific materialization, the two phenotypes are of good prognosis and poor prognosis.

[0083] Se pueden usar también, por supuesto, datos de un solo canal sin comparación específica con una reserva de muestras matemática. Por ejemplo, se puede clasificar una muestra como poseedora de un primer o un segundo fenotipo, en donde el primer y el segundo fenotipos están relacionados, calculando la semejanza de la expresión de al menos 5 marcadores en la muestra, donde los marcadores están en correlación con el primer [0083] Of course, single channel data can also be used without specific comparison with a mathematical sample pool. For example, a sample can be classified as having a first or second phenotype, where the first and second phenotypes are related, calculating the similarity of the expression of at least 5 markers in the sample, where the markers are correlated with the first

o el segundo fenotipo, con la expresión de los mismos marcadores en una primera plantilla de fenotipos y una segunda plantilla de fenotipos, (a) etiquetando ácidos nucleicos procedentes de una muestra con un fluoróforo para obtener una reserva de ácidos nucleicos etiquetados con fluoróforo; (b) poniendo en contacto dicho ácido nucleico etiquetado con fluoróforo con un biochip en condiciones en las que pueda darse la hibridación, detectando en cada uno de una pluralidad de diferentes loci del biochip una señal de emisión fluorescente procedente de dicho ácido nucleico etiquetado con fluoróforo que está ligado a dicho biochip en dichas condiciones, y (c) determinando la semejanza de expresión de genes marcadores de la muestra individual con la primera y segunda plantillas, en donde si dicha expresión es más parecida a la primera plantilla, se clasifica la muestra como poseedora del primer fenotipo, mientras que si dicha expresión es más parecida a la segunda plantilla, se clasifica la muestra como poseedora del segundo fenotipo. or the second phenotype, with the expression of the same markers in a first phenotype template and a second phenotype template, (a) labeling nucleic acids from a sample with a fluorophore to obtain a pool of fluorophore-labeled nucleic acids; (b) contacting said fluorophore-labeled nucleic acid with a biochip in conditions where hybridization can occur, detecting in each of a plurality of different biochip loci a fluorescent emission signal from said fluorophore-labeled nucleic acid which is linked to said biochip under said conditions, and (c) determining the similarity of expression of marker genes of the individual sample with the first and second templates, where if said expression is more similar to the first template, the sample is classified as the holder of the first phenotype, while if said expression is more similar to the second template, the sample is classified as having the second phenotype.

5.5 DETERMINACIÓN DE LOS NIVELES DE EXPRESIÓN DE GENES MARCADORES 5.5 DETERMINATION OF EXPRESSION LEVELS OF MARKER GENES

5.5.1 MÉTODOS 5.5.1 METHODS

[0084] Los niveles de expresión de los genes marcadores de una muestra pueden determinarse por cualquier medio conocido en la técnica. El nivel de expresión puede determinarse aislando y determinando el nivel (esto es, la cantidad) de ácido nucleico transcrito de cada gen marcador. Como alternativa, o adicionalmente, se puede determinar el nivel de proteínas específicas convertidas desde el ARNm transcrito de un gen marcador. [0084] Expression levels of the marker genes of a sample can be determined by any means known in the art. The level of expression can be determined by isolating and determining the level (that is, the amount) of transcribed nucleic acid from each marker gene. Alternatively, or additionally, the level of specific proteins converted from the transcribed mRNA of a marker gene can be determined.

[0085] El nivel de expresión de genes marcadores específicos puede hallarse determinando la cantidad de ARNm, o de polinucleótidos derivados del mismo, presente en una muestra. Puede usarse cualquier método para determinar los niveles de ARN. Por ejemplo, se aísla el ARN de una muestra y se lo separa en un gel de agarosa. A continuación el ARN separado se transfiere a un soporte sólido, como puede ser un filtro. Luego se hibridan con el filtro mediante hibridación northern sondas de ácido nucleico que representan uno o más marcadores y se determina la cantidad de ARN procedente del marcador. Dicha determinación puede ser visual o asistida por ordenador, por ejemplo, mediante un densitómetro. Otro método de determinar los niveles de ARN consiste en el uso de un dot-blot (borrón de puntos) o un slot-blot (borrón de ranura). En este método se etiqueta el ARN de una muestra, o el ácido nucleico derivado del mismo. A continuación el ARN o el ácido nucleico derivado del mismo se hibrida con un filtro que contiene oligonucleótidos procedentes de uno o más genes marcadores, en donde los oligonucleótidos se colocan sobre el filtro en posiciones diferenciadas y fácilmente identificables. La hibridación, o la ausencia de la misma, del ARN etiquetado con los oligonucleótidos ligados al filtro se determina visualmente o mediante densitómetro. Los polinucleótidos se pueden etiquetar mediante radiomarcaje o con una etiqueta fluorescente (esto es, visible). [0085] The level of expression of specific marker genes can be found by determining the amount of mRNA, or polynucleotides derived therefrom, present in a sample. Any method can be used to determine RNA levels. For example, RNA is isolated from a sample and separated into an agarose gel. The separated RNA is then transferred to a solid support, such as a filter. They are then hybridized with the filter by hybridization northern nucleic acid probes representing one or more markers and the amount of RNA from the label is determined. Said determination can be visual or computer-assisted, for example, by a densitometer. Another method of determining RNA levels is the use of a dot-blot (dot blur) or a slot-blot (slot blur). In this method the RNA of a sample, or the nucleic acid derived from it, is labeled. The RNA or nucleic acid derived therefrom is then hybridized with a filter containing oligonucleotides from one or more marker genes, wherein the oligonucleotides are placed on the filter in differentiated and easily identifiable positions. The hybridization, or the absence thereof, of the RNA labeled with the oligonucleotides bound to the filter is determined visually or by densitometer. The polynucleotides can be labeled by radiolabeling or with a fluorescent tag (that is, visible).

[0086] Estos ejemplos no pretenden ser restrictivos; en la técnica se conocen otros métodos para determinar la abundancia de ARN. [0086] These examples are not intended to be restrictive; Other methods for determining the abundance of RNA are known in the art.

[0087] El nivel de expresión de genes marcadores concretos puede calcularse también determinando el nivel de la proteína específica expresado a partir de los genes marcadores. Esto puede realizarse, por ejemplo, mediante la separación de proteínas de una muestra en un gel de poliacrilamida, seguida de la identificación de proteínas específicas derivadas de marcador mediante anticuerpos en un borrón de western. Como alternativa, las proteínas se pueden separar mediante sistemas de electroforesis bidimensional en gel. La electroforesis bidimensional en gel es bien conocida en la técnica y normalmente consiste en un enfoque isoeléctrico a lo largo de una primera dimensión seguido de electroforesis de SDS-PAGE (sistema de dilución simple-electroforesis en gel de poliacrilamida) a lo largo de una segunda dimensión. Véase, por ej., Hames et al, 1990, GEL ELECTROPHORESIS OF PROTEINS: A PRACTICAL APPROACH, IRL Press, New York; Shevchenko et al., Proc. Nat’l Acad. Sci. USA 93: 1440-1445 (1996); Sagliocco et al., Yeast 12:1519-1533 (1996); Lander, Science 274:536-539 (1996). Los electroferogramas resultantes pueden analizarse con numerosas técnicas, incluidas las técnicas de espectrometría de masas, los borrones de western y el análisis de inmunotransferencia mediante anticuerpos policlonales y monoclonales. [0087] The level of expression of specific marker genes can also be calculated by determining the level of the specific protein expressed from the marker genes. This can be done, for example, by separating proteins from a sample in a polyacrylamide gel, followed by the identification of specific marker-derived proteins by antibodies in a western blot. Alternatively, the proteins can be separated by two-dimensional gel electrophoresis systems. Two-dimensional gel electrophoresis is well known in the art and usually consists of an isoelectric approach along a first dimension followed by SDS-PAGE electrophoresis (simple dilution system-polyacrylamide gel electrophoresis) along a second dimension. See, eg, Hames et al, 1990, GEL ELECTROPHORESIS OF PROTEINS: A PRACTICAL APPROACH, IRL Press, New York; Shevchenko et al., Proc. Nat’l Acad. Sci. USA 93: 1440-1445 (1996); Sagliocco et al., Yeast 12: 1519-1533 (1996); Lander, Science 274: 536-539 (1996). The resulting electropherograms can be analyzed with numerous techniques, including mass spectrometry techniques, western blots and immunoblot analysis by polyclonal and monoclonal antibodies.

[0088] Como alternativa, los niveles de proteínas derivadas de marcadores pueden determinarse construyendo un biochip de anticuerpos en el que los centros de unión comprenden anticuerpos específicos, inmovilizados y preferiblemente monoclonales, a una pluralidad de especies proteínicas codificadas por el genoma de la célula. Preferiblemente, los anticuerpos estarán presentes en una fracción sustancial de las proteínas derivadas de marcadores que interesen. Los métodos para hacer anticuerpos monoclonales son bien conocidos (véase, por ej., Harlow and Lane, 1988, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor, New York). En una materialización, se crían anticuerpos monoclonales contra fragmentos de péptido sintético diseñados sobre la base de la secuencia genómica de la célula. Con dicho despliegue de anticuerpos, las proteínas procedentes de la célula se ponen en contacto con el despliegue y su unión se somete a prueba con ensayos conocidos en la técnica. [0088] Alternatively, protein levels derived from markers can be determined by constructing an antibody biochip in which the binding centers comprise specific, immobilized and preferably monoclonal antibodies, to a plurality of protein species encoded by the cell genome. Preferably, the antibodies will be present in a substantial fraction of the proteins derived from markers of interest. Methods for making monoclonal antibodies are well known (see, eg, Harlow and Lane, 1988, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor, New York). In one embodiment, monoclonal antibodies are raised against synthetic peptide fragments designed on the basis of the genomic sequence of the cell. With said antibody deployment, proteins from the cell are contacted with the deployment and their binding is tested with assays known in the art.

De modo general, la expresión, y el nivel de expresión, de proteínas de diagnóstico o pronóstico de interés pueden detectarse por tinción inmunohistoquímica de rodajas o secciones de tejido. In general, the expression, and level of expression, of diagnostic or prognostic proteins of interest can be detected by immunohistochemical staining of slices or sections of tissue.

[0089] Por último, la expresión de genes marcadores en una serie de especímenes de tejido puede caracterizarse mediante un “despliegue de tejidos” (Kononen et al., Nat. Med 4 (7): 844-7 (1998)). En un despliegue de tejidos se calculan múltiples muestras de tejidos en el mismo biochip. Los despliegues permiten la detección in situ de los niveles de ARN y proteínas; las secciones consecutivas permiten el análisis de múltiples muestras simultáneamente. [0089] Finally, the expression of marker genes in a series of tissue specimens can be characterized by "tissue deployment" (Kononen et al., Nat. Med 4 (7): 844-7 (1998)). In a tissue deployment, multiple tissue samples are calculated in the same biochip. The deployments allow in situ detection of RNA and protein levels; Consecutive sections allow the analysis of multiple samples simultaneously.

5.5.2 BIOCHIPS 5.5.2 BIOCHIPS

[0090] En materializaciones preferidas, se usan biochips para medir la expresión a fin de que la categoría de expresión de cada uno de los marcadores de más arriba se calcule simultáneamente. Se describen despliegues de oligonucleótidos y ADNc que comprenden sondas hibridables con los genes correspondientes a cada uno de los conjuntos de marcadores descritos más arriba (esto es, marcadores para distinguir la categoría de ER; marcadores para distinguir tumores de BRCA1 de tumores esporádicos; marcadores para distinguir pacientes con buen pronóstico de pacientes con pronóstico deficiente; marcadores para distinguir tanto ER (+) de ER (-) como tumores de BRCA1 de tumores esporádicos; marcadores para distinguir ER (+) de ER (-) y pacientes con buen pronóstico de pacientes con pronóstico deficiente; marcadores para distinguir tumores de BRCAI de tumores esporádicos y pacientes con buen pronóstico de pacientes con pronóstico deficiente; marcadores capaces de distinguir ER (+) de ER (-), tumores de BRCA1 de tumores esporádicos y pacientes con buen pronóstico de pacientes con pronóstico deficiente, y marcadores únicos para cada categoría). [0090] In preferred embodiments, biochips are used to measure the expression so that the expression category of each of the above markers is calculated simultaneously. Oligonucleotide and cDNA deployments comprising hybridizable probes with the genes corresponding to each of the sets of markers described above are described (ie, markers to distinguish the ER category; markers to distinguish BRCA1 tumors from sporadic tumors; markers for distinguish patients with good prognosis from patients with poor prognosis; markers to distinguish both ER (+) from ER (-) and BRCA1 tumors from sporadic tumors; markers to distinguish ER (+) from ER (-) and patients with good prognosis of patients with poor prognosis; markers to distinguish BRCAI tumors from sporadic tumors and patients with a good prognosis of patients with poor prognosis; markers capable of distinguishing ER (+) from ER (-), BRCA1 tumors from sporadic tumors and patients with good prognosis of patients with poor prognosis, and unique markers for each category).

[0091] Los biochips pueden comprender sondas hibridables con los genes con marcadores capaces de distinguir la categoría de una, dos o hasta las tres categorías clínicas indicados más arriba. Se suministran despliegues polinucleótidos que comprenden sondas a un subconjunto o subconjuntos de al menos 50, 100, 200, 300, 400, 500, 750, 1.000, 1.250, 1.500, 1.750, 2.000 o 2.250 marcadores genéticos, hasta el conjunto total de [0091] Biochips may comprise hybridizable probes with genes with markers capable of distinguishing the category of one, two or even the three clinical categories indicated above. Polynucleotide displays comprising probes to a subset or subset of at least 50, 100, 200, 300, 400, 500, 750, 1,000, 1,250, 1,500, 1,750, 2,000 or 2,250 genetic markers are provided, up to the total set of

2.460 marcadores, que distinguen entre ER (+) y ER (-) pacientes o tumores. También se suministran sondas a subconjuntos de al menos 20,30, 40, 50, 75, 100, 150, 200, 250, 300, 350 o 400 marcadores, hasta el conjunto total de 430 marcadores, que distinguen entre tumores que contienen una mutación de BRCA1 y tumores esporádicos dentro de un grupo de tumores ER (-). Además, se suministran sondas a subconjuntos de al menos 20, 30, 40, 50, 75, 100, 150 o 200 marcadores, hasta el conjunto total de 231 marcadores, que distinguen entre pacientes con buen pronóstico y pronóstico deficiente dentro de los tumores esporádicos. En una materialización específica, el despliegue comprende sondas a conjuntos o subconjuntos de marcadores dirigidos a las tres categorías clínicas. 2,460 markers, which distinguish between ER (+) and ER (-) patients or tumors. Probes are also supplied to subsets of at least 20,30, 40, 50, 75, 100, 150, 200, 250, 300, 350 or 400 markers, up to the total set of 430 markers, which distinguish between tumors that contain a mutation of BRCA1 and sporadic tumors within a group of ER (-) tumors. In addition, probes are supplied to subsets of at least 20, 30, 40, 50, 75, 100, 150 or 200 markers, up to the total set of 231 markers, which distinguish between patients with good prognosis and poor prognosis within sporadic tumors . In a specific materialization, the deployment comprises probes to sets or subsets of markers directed to the three clinical categories.

[0092] En otra materialización específica, los biochips que se usan en los métodos que aquí se muestran poseen marcadores adicionales a al menos algunos de los marcadores enumerados en las Tablas 1-6. Por ejemplo, en una materialización específica, el biochip es un despliegue de cribado o escaneo como el que se describe en Altschuler et al., International Pub. WO 02/18646, de 7 Marrzo de 2002 y Scherer et al., International Pub. WO 02/16650, del 28 de febrero de 2002. Los despliegues de cribado y escaneo comprenden sondas de posición direccionable situadas a intervalos regulares y derivadas de la secuencia del ácido nucleico genómico, tanto expresa como no. También pueden comprender sondas en un subconjunto, o la totalidad de marcadores enumerados en las Tablas 1-6, o un subconjunto de los mismos, como se explica más arriba, y se puede usar para monitorizar la expresión de marcadores de la misma forma que un biochip que contenga sólo los marcadores enumerados en las Tablas 1-6. [0092] In another specific materialization, the biochips used in the methods shown here possess additional markers to at least some of the markers listed in Tables 1-6. For example, in a specific materialization, the biochip is a screening or scanning display such as that described in Altschuler et al., International Pub. WO 02/18646, of 7 Marrzo of 2002 and Scherer et al., International Pub. WO 02/16650, of February 28, 2002. Screening and scanning deployments comprise addressable position probes located at regular intervals and derived from the genomic nucleic acid sequence, both express and non-expressed. They can also comprise probes in a subset, or all of the markers listed in Tables 1-6, or a subset thereof, as explained above, and can be used to monitor the expression of markers in the same way as a biochip containing only the markers listed in Tables 1-6.

[0093] En otra materialización específica más, el biochip es un biochip de ADNc disponible en el mercado que comprende al menos cinco de los marcadores enumerados en las Tablas 1-6. Preferiblemente, dicho biochip de ADNc disponible en el mercado comprenderá todos los marcadores enumerados en las Tablas 1-6. No obstante, dicho biochip puede comprender 5, 10, 15, 25, 50, 100, 150, 250, 500, 1.000 o más marcadores en cualquiera de las Tablas 1-6, hasta el número máximo de marcadores de una Tabla, y puede comprender todos los marcadores de cualquier Tablas 1 a 6 y un subconjunto de otra de las Tablas 1-6, o subconjuntos de cada una, como se explica más arriba. En una materialización específica de los métodos en este documento, los marcadores que son todas o parte de Tablas 1-6 constituyen al menos el 50%, 60%, 70%, 80%, 90%, 95% o 98% de las sondas del biochip. [0093] In yet another specific materialization, the biochip is a commercially available cDNA biochip comprising at least five of the markers listed in Tables 1-6. Preferably, said commercially available cDNA biochip will comprise all the markers listed in Tables 1-6. However, said biochip may comprise 5, 10, 15, 25, 50, 100, 150, 250, 500, 1,000 or more markers in any of Tables 1-6, up to the maximum number of markers in a Table, and may comprise all the markers of any Tables 1 to 6 and a subset of another of Tables 1-6, or subsets of each, as explained above. In a specific materialization of the methods in this document, the markers that are all or part of Tables 1-6 constitute at least 50%, 60%, 70%, 80%, 90%, 95% or 98% of the probes of the biochip.

[0094] En las siguientes secciones se describen métodos generales concernientes a la construcción de biochips y que comprenden los conjuntos y/o subconjuntos de más arriba. [0094] In the following sections, general methods concerning the construction of biochips and comprising the assemblies and / or subsets above are described.

5.5.2.1 CONSTRUCCIÓN DE BIOCHIPS 5.5.2.1 BIOCHIPS CONSTRUCTION

[0095] Los biochips se preparan seleccionando sondas que comprenden una secuencia de polinucleótidos, para a continuación inmovilizar dichas sondas en un soporte o una superficie sólidos. Por ejemplo, las sondas pueden comprender secuencias de ADN, secuencias de ARN o secuencias de copolímeros de ADN y ARN. Las secuencias de polinucleótidos de las sondas pueden comprender también análogos de ADN y/o ARN, o combinaciones de los mismos. Por ejemplo, las secuencias de polinucleótidos de las sondas pueden estar llenas de fragmentos parciales de ADN genómico. Las secuencias de polinucleótidos de las sondas pueden ser también secuencias sintetizadas de nucleótidos, como las secuencias sintéticas de oligonucleótidos. Las secuencias de sondas pueden sintetizarse bien de manera enzimática, in vivo, enzimática in vitro (por ej., por PCR) o no enzimática in vitro. [0095] Biochips are prepared by selecting probes comprising a polynucleotide sequence, then immobilizing said probes on a solid support or surface. For example, the probes may comprise DNA sequences, RNA sequences or DNA and RNA copolymer sequences. The polynucleotide sequences of the probes may also comprise analogs of DNA and / or RNA, or combinations thereof. For example, the polynucleotide sequences of the probes may be full of partial fragments of genomic DNA. The polynucleotide sequences of the probes may also be synthesized sequences of nucleotides, such as synthetic oligonucleotide sequences. Probe sequences can be synthesized either enzymatically, in vivo, enzymatically in vitro (eg, by PCR) or non-enzymatically in vitro.

[0096] La sonda o sondas usadas en los métodos de la invención estarán preferiblemente inmovilizadas en un soporte sólido que puede ser tanto poroso como no poroso. Por ejemplo, las sondas de la invención pueden ser secuencias de polinucleótidos que están sujetas a una membrana o filtro de nitrocelulosa o nailon por unión covalente por cualquiera de los dos extremos, 3’ o 5’, del polinucleótido. Tales sondas de hibridación son bien conocidas en la técnica (véase, por ej., Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). Como alternativa, el soporte o superficie sólidos pueden ser una superficie de cristal o plástico. En una materialización especialmente preferida, los niveles de hibridación se miden con respecto a biochips de sondas que constan de una fase sólida en cuya superficie se halla inmovilizada una población de polinucleótidos, como una población de ADN o mímicos de ADN o, como alternativa, una población de ARN o mímicos de ARN. La fase sólida puede ser un material no poroso u opcionalmente poroso, como un gel [0096] The probe or probes used in the methods of the invention will preferably be immobilized on a solid support that can be both porous and non-porous. For example, the probes of the invention may be polynucleotide sequences that are attached to a nitrocellulose or nylon membrane or filter by covalent bonding at either end, 3 'or 5', of the polynucleotide. Such hybridization probes are well known in the art (see, eg, Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989) Alternatively, the solid support or surface may be a glass or plastic surface.In a particularly preferred embodiment, hybridization levels are measured with respect to probe biochips consisting of a solid phase on whose surface they are a population of polynucleotides, such as a population of DNA or DNA mimics or, alternatively, a population of RNA or RNA mimics, is immobilized.The solid phase can be a non-porous or optionally porous material, such as a gel

[0097] En la materializaciones preferidas, el biochip comprende un soporte o superficie con un despliegue ordenado de centros de unión (por ej., por hibridación) o “sondas”, cada una de las cuales representa uno de los marcadores descritos en este documento. Preferiblemente, los biochips serán despliegues direccionables y, más preferiblemente, despliegues de posición direccionable. Más concretamente, cada sonda del despliegue estará situada preferiblemente en una ubicación conocida y predeterminada en el soporte sólido de modo que la identidad (esto es, la secuencia) de cada sonda pueda determinarse a partir de su posición en el despliegue (esto es, en el soporte o superficie). En las materializaciones preferidas, cada prueba está fijada al soporte sólido por unión covalente por un solo punto. [0097] In preferred embodiments, the biochip comprises a support or surface with an orderly deployment of binding centers (eg, by hybridization) or "probes", each of which represents one of the markers described herein. . Preferably, the biochips will be addressable displays and, more preferably, addressable position displays. More specifically, each probe of the deployment will preferably be located in a known and predetermined location on the solid support so that the identity (that is, the sequence) of each probe can be determined from its position in the deployment (that is, in the support or surface). In preferred embodiments, each test is fixed to the solid support by covalent bonding by a single point.

[0098] Los biochips pueden hacerse de varias maneras, algunas de las cuales se describen a continuación. Independientemente de la forma en que se produzcan, los biochips comparten ciertas características. Los biochips son reproducibles, por lo que se puede producir múltiples copias de un biochip concreto y compararlas una con otra. Preferiblemente, los biochips estarán hechos de materiales que sean estables en condiciones de unión (por ej., hibridación del ácido nucleico). Los biochips serán preferiblemente pequeños, por ej., entre 1 cm2 y 25 cm2, entre 12 cm2 y 13 cm2, o 3 cm2. Sin embargo, también se contemplan biochips de mayor tamaño, que hasta pueden ser preferibles, por ej. para usarlos en despliegues de cribado. Preferiblemente, un centro de unión concreto o un único conjunto de centros de unión en el biochip se unirá (por ej., hibridará) específicamente al producto de un único gen en una célula (por ej., a un ARNm específico, o a un ADNm específico derivado del mismo). No obstante, en general, otras secuencias relacionadas o parecidas se vincularán a un determinado centro de unión por hibridación cruzada. [0098] Biochips can be made in several ways, some of which are described below. Regardless of the way they occur, biochips share certain characteristics. Biochips are reproducible, so you can produce multiple copies of a specific biochip and compare them with each other. Preferably, the biochips will be made of materials that are stable under binding conditions (eg, nucleic acid hybridization). The biochips will preferably be small, e.g., between 1 cm2 and 25 cm2, between 12 cm2 and 13 cm2, or 3 cm2. However, larger biochips are also contemplated, which may even be preferable, eg. for use in screening displays. Preferably, a specific binding center or a single set of binding centers in the biochip will specifically bind (e.g., hybridize) to the product of a single gene in a cell (e.g., to a specific mRNA, or to a mDNA specific derivative thereof). However, in general, other related or similar sequences will be linked to a specific cross-hybridization junction center.

[0099] Los biochips de la presente invención incluyen una o más sondas de ensayo, cada una de las cuales tiene una secuencia polinucleótida que es complementaria con una subsecuencia de ARN o ADN que hay que detectar. Preferiblemente, se conocerá la ubicación de cada sonda en la superficie sólida. De hecho, los biochips serán preferiblemente despliegues de posición direccionable. En concreto, cada sonda del despliegue estará situada preferiblemente en una ubicación conocida y predeterminada del soporte sólido, de modo que la identidad (esto es, la secuencia) de cada sonda pueda determinarse a partir de su posición en el despliegue (esto es, en el soporte o superficie). [0099] The biochips of the present invention include one or more test probes, each of which has a polynucleotide sequence that is complementary to a sub-sequence of RNA or DNA to be detected. Preferably, the location of each probe on the solid surface will be known. In fact, the biochips will preferably be addressable position displays. In particular, each probe of the deployment will preferably be located in a known and predetermined location of the solid support, so that the identity (that is, the sequence) of each probe can be determined from its position in the deployment (that is, in the support or surface).

[0100] Según la invención, el biochip es un despliegue (esto es, una matriz) en el que cada posición representa uno de los marcadores descritos en este documento. Por ejemplo, cada posición puede contener un ADN o un análogo de ADN basado en el ADN genómico con el que puede hibridar específicamente un ARN o ADNc concretos transcritos del marcador genético. El ADN o análogo de ADN puede ser, por ej., un oligómero sintético [0100] According to the invention, the biochip is a display (that is, a matrix) in which each position represents one of the markers described in this document. For example, each position may contain a DNA or a DNA analog based on the genomic DNA with which it can specifically hybridize a specific RNA or cDNA transcribed from the genetic marker. The DNA or DNA analog can be, for example, a synthetic oligomer

o un fragmento de gen. En una materialización, las sondas que representan cada uno de los marcadores están presentes en el despliegue. En una materialización preferida, el despliegue comprende los 550 de los 2.460 marcadores de categoría ER-, 70 de los marcadores BRCA1/esporádicos y el total de los 231 marcadores de pronóstico. or a gene fragment. In a materialization, the probes that represent each of the markers are present in the deployment. In a preferred embodiment, the deployment comprises 550 of the 2,460 ER- category markers, 70 of the BRCA1 / sporadic markers and the total of 231 prognostic markers.

5.5.2.2 PREPARACIÓN DE SONDAS PARA BIOCHIPS 5.5.2.2 PREPARATION OF PROBES FOR BIOCHIPS

[0101] Como se indica más arriba, la “sonda” con la que según la invención se hibrida específicamente una molécula polinucleótida concreta contiene una secuencia polinucleótida genómica complementaria. Las sondas del biochip consistirán preferiblemente en secuencias nucleótidas de no más de 1.000 nucleótidos. En algunas materializaciones, las sondas deI despliegue consisten en secuencias nucleótidas de 10 a 1.000 nucleótidos. En una materialización preferida, las secuencias nucleótidas de las sondas son del orden de 10-200 nucleótidos de longitud y son secuencias genómicas de una especie de organismo, de modo que se halla presente una pluralidad de diferentes sondas, con secuencias complementarias y por lo tanto capaces de hibridar con el genoma de dicha especie u organismo, superpuestas en secuencia por todo o parte de dicho genoma. En otras materializaciones específicas, las sondas son del orden de 10-30 nucleótidos de longitud, del orden de 10-40 nucleótidos de longitud, del orden de 20-50 nucleótidos de longitud, del orden de 40-80 nucleótidos de longitud, del orden de 50-150 nucleótidos de longitud, del orden de 80-120 nucleótidos de longitud y, más preferiblemente, de 60 nucleótidos de longitud. [0101] As indicated above, the "probe" with which a specific polynucleotide molecule specifically hybridizes contains a complementary genomic polynucleotide sequence according to the invention. The biochip probes will preferably consist of nucleotide sequences of no more than 1,000 nucleotides. In some embodiments, the deployment probes consist of nucleotide sequences of 10 to 1,000 nucleotides. In a preferred embodiment, the nucleotide sequences of the probes are of the order of 10-200 nucleotides in length and are genomic sequences of a kind of organism, so that a plurality of different probes are present, with complementary sequences and therefore capable of hybridizing with the genome of said species or organism, superimposed in sequence on all or part of said genome. In other specific embodiments, the probes are of the order of 10-30 nucleotides in length, of the order of 10-40 nucleotides in length, of the order of 20-50 nucleotides in length, of the order of 40-80 nucleotides in length, of the order 50-150 nucleotides in length, on the order of 80-120 nucleotides in length and, more preferably, 60 nucleotides in length.

[0102] Las pruebas pueden comprender ADN o “mímicos” de ADN (por ej., derivados y análogos) correspondientes a una porción del genoma de un organismo. En otra materialización, las sondas del biochip son complementarios de ARN o mímicos de ARN. Los mímicos de ADN son polímeros compuestos de subunidades capaces de hibridación específica de tipo Watson-Crick con ADN, o de hibridación específica con ARN. Los ácidos nucleicos pueden modificarse en la fracción de base, en la fracción de azúcar o en el esqueleto del fosfato. Como ejemplo de mímicos de ADN se puede citar, por ej. los fosforotioatos. [0102] The tests may comprise DNA or "mimics" of DNA (eg, derivatives and analogs) corresponding to a portion of the genome of an organism. In another embodiment, the biochip probes are complementary to RNA or mimic RNA. DNA mimics are polymers composed of subunits capable of specific hybridization of the Watson-Crick type with DNA, or specific hybridization with RNA. The nucleic acids can be modified in the base fraction, in the sugar fraction or in the phosphate skeleton. As an example of DNA mimics, one can cite, for example. Phosphorothioates

[0103] El ADN se puede obtener, por ej., por reacción en cadena de polimerasa (PCR), por amplificación del ADN genómico o por secuencias clonadas. Los cebadores de PCR se elegirán preferiblemente sobre la base de una secuencia conocida del genoma, que resultará en la amplificación de fragmentos específicos de ADN genómico. Hay programas informáticos bien conocidos en la técnica que sirven para diseñar cebadores con la especificidad requerida y las propiedades óptimas de amplificación, como la versión 5.0 de Oligo (National Biosciences). Típicamente, cada sonda del despliegue estará entre 10 bases y 50.000 bases, normalmente entre 300 bases y 1.000 bases de longitud. Los métodos de PCR son bien conocidos en la técnica y se describen, por ejemplo, en Innis et al., eds., PCR PROTOCOLS: A GUIDE TO METHODS AND APPLICATIONS, Academic Press Inc., San Diego, CA (1990). Para los experimentados en la técnica resultará evidente que los sistemas robóticos de control son útiles para aislar y amplificar los ácidos nucleicos. [0103] DNA can be obtained, for example, by polymerase chain reaction (PCR), by amplification of genomic DNA or by cloned sequences. PCR primers will preferably be chosen on the basis of a known genome sequence, which will result in the amplification of specific fragments of genomic DNA. There are computer programs well known in the art that serve to design primers with the required specificity and optimal amplification properties, such as Oligo version 5.0 (National Biosciences). Typically, each probe in the deployment will be between 10 bases and 50,000 bases, usually between 300 bases and 1,000 bases in length. PCR methods are well known in the art and are described, for example, in Innis et al., Eds., PCR PROTOCOLS: A GUIDE TO METHODS AND APPLICATIONS, Academic Press Inc., San Diego, CA (1990). It will be apparent to those skilled in the art that robotic control systems are useful for isolating and amplifying nucleic acids.

[0104] Un medio preferido alternativo para generar las sondas polinucleótidas del biochip lo constituye la síntesis de polinucleótidos u oligonucleótidos sintéticos, por ej., mediante químicas de N-fosfonato o fosforamidita (Froehler et al., Nucleic Acid Res. 14:5399-5407 (1986); McBride et al., Tetrahedron Lett. 24:246-248 (1983)). [0104] An alternative preferred means of generating the polynucleotide probes of the biochip is the synthesis of synthetic polynucleotides or oligonucleotides, eg, by chemical N-phosphonate or phosphoramidite (Froehler et al., Nucleic Acid Res. 14: 5399- 5407 (1986); McBride et al., Tetrahedron Lett. 24: 246-248 (1983)).

Las secuencias sintéticas tienen típicamente de unas 10 a unas 500 bases de longitud, y más preferiblemente de unas 40 a unas 70 bases de longitud. En algunas materializaciones, los ácidos nucleicos sintéticos incluyen bases no naturales, como por ejemplo, pero en modo alguno limitadas a ella, la inosina. Como se indica más arriba, se pueden usar análogos de ácido nucleico como centros de unión para hibridación. Un ejemplo de ácido nucleico adecuado es el ácido nucleico péptido (véase por ej., Egholm et al., Nature 363:566-568 (1993); U.S. Patent No. 5,539,083). Las sondas se seleccionarán preferiblemente mediante un algoritmo que tiene en cuenta las energías de unión, la composición de la base, la complejidad de la secuencia, las energías de unión de la hibridación cruzada y la estructura secundaria (véase Friend et al., International Patent Publication WO 01/05935, publicado el 25 de enero de 2001; Hughes et al., Nat. Biotech. 19:342-7 (2001)). Synthetic sequences are typically about 10 to about 500 bases in length, and more preferably about 40 to about 70 bases in length. In some embodiments, synthetic nucleic acids include unnatural bases, such as, but not limited to, inosine. As indicated above, nucleic acid analogs can be used as binding centers for hybridization. An example of a suitable nucleic acid is the peptide nucleic acid (see, eg, Egholm et al., Nature 363: 566-568 (1993); U.S. Patent No. 5,539,083). The probes will preferably be selected by an algorithm that takes into account binding energies, base composition, sequence complexity, cross-hybridization binding energies and secondary structure (see Friend et al., International Patent Publication WO 01/05935, published January 25, 2001; Hughes et al., Nat. Biotech. 19: 342-7 (2001)).

[0105] Un operario experimentado advertirá también que las sondas de control positivo, por ej., las sondas de las que se sabe que son complementarias e hibridables con secuencias en las moléculas del polinucleótido destino y las sondas de control negativo, por ej. las sondas de las que se sabe que no son complementarias e hibridables con secuencias en las moléculas del polinucleótido destino, deben incluirse en el despliegue. En una materialización, los controles positivos se sintetizan a lo largo del perímetro del despliegue. En otra materialización, los controles positivos se sintetizan en franjas diagonales a través del despliegue. En otra materialización más, el complemento inverso para cada sonda se sintetiza junto a la posición de la sonda para que sirva de control negativo. Y en otra materialización más, se usan secuencias de otras especies de organismo como controles negativos y como controles “enclavados”. [0105] An experienced operator will also note that positive control probes, eg, probes known to be complementary and hybridizable with sequences in the target polynucleotide molecules and negative control probes, e.g. probes known to be non-complementary and hybridizable with sequences in the target polynucleotide molecules must be included in the deployment. In a materialization, the positive controls are synthesized along the perimeter of the deployment. In another materialization, positive controls are synthesized in diagonal stripes through deployment. In yet another embodiment, the reverse complement for each probe is synthesized next to the position of the probe to serve as a negative control. And in yet another materialization, sequences from other organism species are used as negative controls and as "locked" controls.

5.5.2.3 SUJECCIÓN DE SONDAS A LA SUPERFICIE SÓLIDA 5.5.2.3 SUBJECTION OF PROBES TO THE SOLID SURFACE

[0106] Las sondas se sujetan a un soporte o superficie sólidos, que pueden estar hechos por ej. de vidrio, de plástico (por ej. polipropileno, nailon), poliacrilamida, nitrocelulosa, gel u otro material poroso o no poroso. Un método preferido para sujetar los ácidos nucleicos a una superficie es imprimiendo en placas de vidrio, como se explica de modo general en Schena et al, Science 270:467-470 (1995). Este método es especialmente útil para preparar biochips de ADNc (véase también DeRisi et al, Nature Genetics 14:457-460 (1996); Shalon et al., Genome Res. 6:639-645 (1996); and Schena et al., Proc. Natl. Acad. Sci. U.S.A. 93:10539-11286 (1995)). [0106] The probes are attached to a solid support or surface, which can be made for example. glass, plastic (eg polypropylene, nylon), polyacrylamide, nitrocellulose, gel or other porous or non-porous material. A preferred method of attaching nucleic acids to a surface is by printing on glass plates, as generally explained in Schena et al, Science 270: 467-470 (1995). This method is especially useful for preparing cDNA biochips (see also DeRisi et al, Nature Genetics 14: 457-460 (1996); Shalon et al., Genome Res. 6: 639-645 (1996); and Schena et al. , Proc. Natl. Acad. Sci. USA 93: 10539-11286 (1995)).

[0107] Un segundo método preferido para hacer biochips es hacer despliegues de alta densidad. Se conocen técnicas para producir despliegues que contienen miles de oligonucleótidos complementarios para secuencias definidas en ubicaciones definidas en una superficie mediante técnicas fotolitográficas para síntesis in situ (véase Fodor et al., 1991, Science 251:767-773; Pease et al., 1994, Proc. Natl. Acad. Sci. U.S.A. 91:5022-5026; Lockhart et al., 1996, Nature Biotechnology 14:1675; Patentes U.S. Nos. 5,578,832, 5,556,752 y 5,510,270) u otros métodos para síntesis y deposición rápidas de oligonucleótidos definidos (Blanchard et al., Biosensors & Bioelectronics 11:687-690). Cuando se usan estos métodos, los oligonucleótidos (por ej., 60-meros) de secuencia conocida se sintetizan directamente sobre una superficie tal como un portaobjeto de cristal derivatizado. Por lo general, el despliegue producido es redundante, con varias moléculas oligonucleótidas por cada ARN. [0107] A second preferred method for making biochips is to make high density deployments. Techniques for producing deployments containing thousands of complementary oligonucleotides are known for sequences defined at defined locations on a surface by photolithographic techniques for in situ synthesis (see Fodor et al., 1991, Science 251: 767-773; Pease et al., 1994 , Proc. Natl. Acad. Sci. USA 91: 5022-5026; Lockhart et al., 1996, Nature Biotechnology 14: 1675; US Patent Nos. 5,578,832, 5,556,752 and 5,510,270) or other methods for rapid synthesis and deposition of defined oligonucleotides (Blanchard et al., Biosensors & Bioelectronics 11: 687-690). When these methods are used, oligonucleotides (eg, 60-mer) of known sequence are synthesized directly on a surface such as a derivatized glass slide. Usually, the display produced is redundant, with several oligonucleotide molecules per RNA.

[0108] Se pueden usar otros métodos para hacer biochips, por ej. por enmascaramiento (Maskos and Southern, 1992, Nuc. Acids. Res. 20: 1679-1684). En principio, y como se indica más arriba, se puede usar cualquier tipo de despliegue, por ejemplo, borrones de puntos (dot blots) en una membrana de hibridación de nailon (véase Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)). No obstante, como advertirán los experimentados en la técnica, muchas veces son preferibles despliegues muy pequeños, ya que los volúmenes de hibridación serán menores. [0108] Other methods can be used to make biochips, eg. by masking (Maskos and Southern, 1992, Nuc. Acids. Res. 20: 1679-1684). In principle, and as indicated above, any type of deployment can be used, for example, dot blots on a nylon hybridization membrane (see Sambrook et al., MOLECULAR CLONING - A MANUAL LABORATORY (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)). However, as those skilled in the art will notice, very small deployments are often preferable, since hybridization volumes will be smaller.

[0109] En una materialización, los despliegues de la presente invención se preparan sintetizando sondas polinucleótidas en un soporte. En dicha materialización, las sondas polinucleótidas van sujetas al soporte por unión covalente por cualquiera de los dos extremos, 3’ o 5’, del polinucleótido. [0109] In one embodiment, the deployments of the present invention are prepared by synthesizing polynucleotide probes on a support. In said materialization, the polynucleotide probes are attached to the support by covalent bonding at either end, 3 'or 5', of the polynucleotide.

[0110] En una materialización especialmente preferida, se fabrican biochips de la invención mediante un dispositivo de impresión por chorro de tinta para síntesis de oligonucleótidos, por ej. con los métodos y sistemas descritos por Blanchard en U.S. Pat. No. 6,028,189; Blanchard et al., 1996, Biosensors and Bioelectronics 11:687-690; Blanchard, 1998, in SYNTHETIC DNA ARRAY IN GENETIC ENGINEERING, Vol. 20, J.K. Setlow, Ed., Plenum Press, New York, páginas 111-123. Concretamente, las sondas polinucleótidas de dichos biochips se sintetizarán preferiblemente en despliegues, por ej. en un portaobjeto de cristal, depositando en serie bases nucleótidas individuales en “microgotitas” de un disolvente de alta tensión superficial, como el carbonato de propileno. Las microgotitas tienen un volumen muy pequeño (por ej. 100 pL o menos, más preferiblemente 50 pL [0110] In a particularly preferred embodiment, biochips of the invention are manufactured by an inkjet printing device for oligonucleotide synthesis, eg. with the methods and systems described by Blanchard in U.S. Pat. No. 6,028,189; Blanchard et al., 1996, Biosensors and Bioelectronics 11: 687-690; Blanchard, 1998, in SYNTHETIC DNA ARRAY IN GENETIC ENGINEERING, Vol. 20, J.K. Setlow, Ed., Plenum Press, New York, pages 111-123. Specifically, polynucleotide probes of said biochips will preferably be synthesized in deployments, e.g. on a glass slide, serially depositing individual nucleotide bases in "microdroplets" of a solvent of high surface tension, such as propylene carbonate. The microdroplets have a very small volume (eg 100 pL or less, more preferably 50 pL

o menos) y están separadas unas de otras en el biochip (por ej. por dominios hidrófobos) para formar pozos de tensión de superficie circular que definen las posiciones de los elementos del despliegue (esto es, las diferentes sondas). Los biochips fabricados con este método de chorro de tinta suelen ser de alta densidad, preferiblemente con una densidad de al menos 2,500 diferentes sondas por cm2. Las sondas poliucleótidas están sujetas al soporte por unión covalente por cualquiera de los dos extremos, 3’ o 5’, del polinucleótido. or less) and are separated from each other in the biochip (eg by hydrophobic domains) to form circular surface tension wells that define the positions of the deployment elements (that is, the different probes). Biochips made with this inkjet method are usually of high density, preferably with a density of at least 2,500 different probes per cm2. Poliucleotide probes are attached to the support by covalent bonding at either end, 3 'or 5', of the polynucleotide.

5.5.2.4 MOLÉCULAS POLINUCLEÓTIDAS DESTINO 5.5.2.4 DESTINATION POLYNUCLEOTIC MOLECULES

[0111] Las moléculas polinucleótidas que pueden analizarse mediante la presente invención (las “moléculas polinucleótidas destino”) pueden ser de cualquier origen clínicamente relevante, pero se expresan como ARN o como un ácido nucleico derivado del mismo (por ej. ADNc o ARN amplificado derivado de ADNc que lleva incorporado un promotor de polimerasa de ARN), incluidas moléculas de ácido nucleico de generación natural, así como moléculas de ácido nucleico sintético. En una materialización, las moléculas polinucleótidas destino comprender ARN, incluyendo, pero sin limitarse en absoluto a ellos, ARN celular total, ARN mensajero poli(A)+ (ARNm) o fracción del mismo, ARNm citoplásmico o ARN transcrito de ADNc (esto es, ARNc, véase, por ej., Linsley & Schelter, U.S. Patent Application No. 09/411,074, registrada el 4 de octubre de 1999, o las Patentes [0111] The polynucleotide molecules that can be analyzed by the present invention (the "target polynucleotide molecules") can be of any clinically relevant origin, but are expressed as RNA or as a nucleic acid derived therefrom (eg cDNA or amplified RNA cDNA derivative that incorporates an RNA polymerase promoter), including naturally-generated nucleic acid molecules, as well as synthetic nucleic acid molecules. In one embodiment, the target polynucleotide molecules comprise RNA, including, but not limited to, total cellular RNA, poly (A) + (mRNA) messenger RNA or fraction thereof, cytoplasmic mRNA or cDNA transcribed RNA (i.e. , CRNA, see, e.g., Linsley & Schelter, US Patent Application No. 09 / 411,074, registered October 4, 1999, or Patents

U.S. Nos. 5,545,522, 5,891,636, o 5,716,785). Los métodos para preparer ARN total y poli(A)+ son bien conocidos en la técnica y se describen de modo general en, por ej., Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). En una materialización, se extrae ARN de células de los diversos tipos de interés de esta invención por lisis de tiocianato de guanidina seguida de centrifugado CsCl (Chirgwin et al., 1979, Biochemistry 18: 5294-5299). En otra materialización, se extrae ARN total mediante una columna de silicio con base de gel, comercializada por RNeasy (Qiagen, Valencia, California) y StrataPrep (Stratagene, La Jolla, California). En una materialización alternativa, que es preferida para S. cerevisiae, se extrae ARN de células mediante fenol y cloroformo, como se explica en Ausubel et al., eds., 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Vol III, Green Publishing Associates, Inc., John Wiley & Sons, Inc., New York, págs. 13.12.1-13.12.5). El ARN Poli(A)+ puede seleccionarse, por ej., por selección con celulosa oligo-dT o, como alternativa, por transcripción inversa cebada de oligo-dT del ARN celular total. En una materialización, se puede fragmentar el ARN con métodos conocidos en la técnica, por ej., por incubación con ZnCl2, para generar fragmentos de ARN. En otra materialzación, las moléculas polinucleótidas analizadas por la invención comprenden ADNc, o productos PCR de ARN o ADNc amplificados. U.S. Nos. 5,545,522, 5,891,636, or 5,716,785). Methods for preparing total RNA and poly (A) + are well known in the art and are generally described in, eg, Sambrook et al., MOLECULAR CLONING - A MANUAL LABORATORY (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989). In one embodiment, RNA is extracted from cells of the various types of interest of this invention by guanidine thiocyanate lysis followed by CsCl centrifugation (Chirgwin et al., 1979, Biochemistry 18: 5294-5299). In another embodiment, total RNA is extracted using a gel-based silicon column, marketed by RNeasy (Qiagen, Valencia, California) and StrataPrep (Stratagene, La Jolla, California). In an alternate embodiment, which is preferred for S. cerevisiae, RNA is extracted from cells by phenol and chloroform, as explained in Ausubel et al., Eds., 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Vol III, Green Publishing Associates, Inc., John Wiley & Sons, Inc., New York, p. 13.12.1-13.12.5). Poly (A) + RNA can be selected, for example, by selection with oligo-dT cellulose or, alternatively, by reverse transcription of oligo-dT barley from total cellular RNA. In one embodiment, the RNA can be fragmented with methods known in the art, eg, by incubation with ZnCl2, to generate RNA fragments. In another embodiment, the polynucleotide molecules analyzed by the invention comprise cDNA, or amplified RNA or cDNA PCR products.

[0112] En una materialización, el ARN total, el ARNm o los ácidos nucleicos derivados de los mismos son aislados de una muestra tomada de una persona aquejada de cáncer de mama. Las moléculas polinucleótidas destino que están pobremente expresadas en células concretas pueden enriquecerse mediante técnicas de normalización (Bonaldo et al., 1996, Genome Res. 6:791-806). [0112] In one embodiment, total RNA, mRNA or nucleic acids derived therefrom are isolated from a sample taken from a person suffering from breast cancer. Target polynucleotide molecules that are poorly expressed in specific cells can be enriched by standardization techniques (Bonaldo et al., 1996, Genome Res. 6: 791-806).

[0113] Como se explica más arriba, los polinucleótidos destino se etiquetan de forma detectable en uno o más nucleótidos. Cualquier método conocido en la técnica sirve para etiquetar de forma detectable los polinucleótidos destino. Preferiblemente, este etiquetado llevará incorporada uniformemente la etiqueta todo a lo largo del ARN y, más preferiblemente, el etiquetado se llevará a cabo con el mayor grado posible de eficacia. Una materialización usa para este etiquetado transcripción inversa cebada de oligo-dT para incorporar la etiqueta; sin embargo, los métodos convencionales de este método tienden a generar fragmentos con extremo de 3’. Por consiguiente, en una materialización preferida, se usan cebadores aleatorios (por ej. 9-meros) en transcripción inversa para incorporar uniformemente nucleótidos etiquetados todo a lo largo de los polinucleótidos destino. Como alternativa, los cebadores aleatorios pueden usarse en conjunción con métodos de PCR o métodos de transcripción in vitro basados en el promotor T7 para amplificar los polinucleótidos destino. [0113] As explained above, the target polynucleotides are detectably labeled in one or more nucleotides. Any method known in the art serves to detectably label the target polynucleotides. Preferably, this labeling will uniformly incorporate the label all along the RNA and, more preferably, the labeling will be carried out as effectively as possible. A materialization uses oligo-dT barley reverse transcription for this label to incorporate the label; however, the conventional methods of this method tend to generate fragments with a 3 ’end. Accordingly, in a preferred embodiment, random primers (eg 9-mer) are used in reverse transcription to uniformly incorporate labeled nucleotides all along the target polynucleotides. Alternatively, random primers can be used in conjunction with PCR methods or in vitro transcription methods based on the T7 promoter to amplify the target polynucleotides.

[0114] En una materialización preferida, la etiqueta detectable es una etiqueta luminiscente. En la presente invención se pueden usar, por ejemplo, etiquetas fluorescentes, etiquetas bioluminiscentes, etiquetas quimioluminiscentes y etiquetas colorimétricas. En una materialización particularmente preferida, la etiqueta es una etiqueta fluorescente, como una fluoresceína, un fósforo, una rodamina o un derivado de tintura de polimetina. Como ejemplos de etiquetas fluorescentes disponibles en el mercado están, entre otras, las fosforamiditas fluorescentes como FluorePrime (Amersham Pharmacia, Piscataway, N.J.), Fluoredite (Millipore, Bedford, Mass.), FAM (ABI, Foster City, Calif.), y Cy3 o Cy5 (Amersham Pharmacia, Piscataway, N.J.). En otra materialización, la etiqueta detectable es un nucleótido radiomarcado. [0114] In a preferred embodiment, the detectable label is a luminescent label. In the present invention, for example, fluorescent labels, bioluminescent labels, chemiluminescent labels and colorimetric labels can be used. In a particularly preferred embodiment, the tag is a fluorescent tag, such as a fluorescein, a phosphorus, a rhodamine or a polymetin dye derivative. Examples of commercially available fluorescent labels include, among others, fluorescent phosphoramidites such as FluorePrime (Amersham Pharmacia, Piscataway, NJ), Fluoredite (Millipore, Bedford, Mass.), FAM (ABI, Foster City, Calif.), And Cy3 or Cy5 (Amersham Pharmacia, Piscataway, NJ). In another embodiment, the detectable label is a radiolabeled nucleotide.

[0115] En otra materialización preferida, las moléculas polinucleótidas destino de la muestra de una paciente se etiquetan de modo diferente a las moléculas polinucleótidas destino de un patrón. El patrón puede comprender moléculas polinucleótidas destino de individuos normales (esto es, no aquejados de cáncer de mama). En una materialización especialmente preferida, el patrón comprende moléculas polinucleótidas destino reunidas a partir de muestras de individuos normales o muestras de tumores de individuos con tumores cancerosos de tipo esporádico. En otra materialización, las moléculas polinucleótidas destino proceden del mismo individuo, pero se toman en diferentes puntos temporales y de este modo indican la eficacia de un tratamiento por el cambio de expresión en los marcadores, o la ausencia del mismo, durante y después del curso del tratamiento (esto es, quimioterapia, radioterapia o crioterapia), en donde el paso en la expresión de los marcadores de un patrón de pronóstico deficiente a un patrón de buen pronóstico indica que el tratamiento es eficaz. En esta materialización, puntos temporales diferentes se etiquetan de forma diferente. [0115] In another preferred embodiment, the target polynucleotide molecules of a patient's sample are labeled differently than the target polynucleotide molecules of a standard. The pattern may comprise target polynucleotide molecules of normal individuals (that is, not suffering from breast cancer). In a particularly preferred embodiment, the pattern comprises target polynucleotide molecules collected from samples from normal individuals or tumor samples from individuals with sporadic cancerous tumors. In another embodiment, the target polynucleotide molecules come from the same individual, but are taken at different time points and thus indicate the effectiveness of a treatment by the change in expression in the markers, or the absence thereof, during and after the course. of the treatment (that is, chemotherapy, radiotherapy or cryotherapy), where the step in the expression of the markers of a poor prognostic pattern to a good prognostic pattern indicates that the treatment is effective. In this materialization, different time points are labeled differently.

5.5.2.5 HIBRIDACIÓN CON BIOCHIPS 5.5.2.5 HYBRIDIZATION WITH BIOCHIPS

[0116] La hibridación del ácido nucleico y las condiciones de lavado se eligen de forma que las moléculas polinucleótidas destino se unan o hibriden específicamente con las secuencias polinucleótidas complementarias del despliegue, preferiblemente con un lugar de despliegue concreto donde esté situado su ADN complementario. [0116] Nucleic acid hybridization and washing conditions are chosen such that the target polynucleotide molecules specifically bind or hybridize with the complementary polynucleotide sequences of the deployment, preferably with a particular deployment site where their complementary DNA is located.

[0117] Los despliegues que contienen sondas de ADN de doble cadena situadas en los mismos se someterán preferiblemente a condiciones de desnaturalización para hacer el ADN de cadena simple antes de que entre en contacto con las moléculas polinucleótidas destino, por ej., eliminar estructuras en horquilla o dímeros que forman cuota con la secuencias autocomplementarias. [0117] Deploys containing double-stranded DNA probes located therein will preferably be subjected to denaturation conditions to make the single-stranded DNA before it comes into contact with the target polynucleotide molecules, eg, removing structures in hairpin or dimers that form quota with the autocomplementary sequences.

[0118] Las condiciones de hibridación óptimas dependerán de la longitud (por ej., oligómeros frente a polinucleótidos mayores de 200 bases) y del tipo (por ej., ARN o ADN) de los ácidos nucleicos destino y de sonda. Los experimentados en la materia advertirán que a medida que los oligonucleótidos se van haciendo más cortos, puede que sea necesario ajustar su longitud para conseguir una temperatura de fusión relativamente uniforme y por tanto unos resultados de hibridación satisfactorios. Los parámetros generales para las condiciones de hibridación específicas (esto es, rigurosas) de los ácidos nucleicos se describen en Sambrook et al., MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989), y en Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994). Las condiciones de hibridación típicas para los biochips de ADNc de Schena et al. son la hibridación en 5 X SSC más 0,2% SDS a 65˚C durante cuatro horas, seguida de lavados a 25˚ C en tampón de lavado de baja dureza (1 X SSC más 0,2% SDS), seguidos de 10 minutos a 25˚ C en tampón de lavado de mayor dureza (0,1 X SSC más 0.2% SDS) (Schena et al., Proc. Natl. Acad. Sci. U.S.A. 93:10614 (1993)). También son de gran utilidad las condiciones de hibridación suministradas en, por ej., Tijessen, 1993, HYBRIDIZATION WITH NUCLEIC ACID PROBES, Elsevier Science Publishers B.V.; y Kricka, 1992, NONISOTOPIC DNA PROBE TECHNIQUES, Academic Press, San Diego, CA. [0118] Optimal hybridization conditions will depend on the length (eg, oligomers against polynucleotides greater than 200 bases) and the type (eg, RNA or DNA) of the target and probe nucleic acids. Those skilled in the art will note that as the oligonucleotides become shorter, it may be necessary to adjust their length to achieve a relatively uniform melting temperature and therefore satisfactory hybridization results. The general parameters for the specific hybridization conditions (ie, rigorous) of nucleic acids are described in Sambrook et al., MOLECULAR CLONING - A MANUAL LABORATORY (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989), and in Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994). Typical hybridization conditions for cDNA biochips from Schena et al. they are hybridization in 5 X SSC plus 0.2% SDS at 65˚C for four hours, followed by washing at 25˚C in a low hardness wash buffer (1 X SSC plus 0.2% SDS), followed by 10 minutes at 25 ° C in a wash buffer of greater hardness (0.1 X SSC plus 0.2% SDS) (Schena et al., Proc. Natl. Acad. Sci. USA 93: 10614 (1993)). Hybridization conditions provided in, for example, Tijessen, 1993, HYBRIDIZATION WITH NUCLEIC ACID PROBES, Elsevier Science Publishers B.V .; and Kricka, 1992, NONISOTOPIC DNA PROBE TECHNIQUES, Academic Press, San Diego, CA.

[0119] Condiciones de hibridación especialmente preferidas son la hibridación de las sondas a la temperatura media de fusión, o cercana a ella (por ej., a no más de 5 ˚C, más preferiblemente a no más de 2 ˚C) en 1 M NaCl, 50 mM de tampón MES (pH 6.5), 0.5% de sarcosina de sodio y 30% de formamida. [0119] Especially preferred hybridization conditions are the hybridization of the probes at or near the average melting temperature (eg, not more than 5 ˚C, more preferably no more than 2 ˚C) at 1 M NaCl, 50 mM MES buffer (pH 6.5), 0.5% sodium sarcosine and 30% formamide.

5.5.2.6 SEÑAL DE DETECCION Y ANALISIS DE DATOS 5.5.2.6 SIGNAL OF DETECTION AND DATA ANALYSIS

[0120] Cuando se usan sondas con etiqueta fluorescente, las emisiones de fluorescencia en cada lugar de un biochip podrán detectarse, preferiblemente, mediante microscopia confocal de barrido láser. En una materalización se efectúa un barrido por separado, mediante la adecuada línea de excitación, para cada uno de los dos fluoróforos usados. Como alternativa, se puede usar un láser que permita iluminación de espécimen simultánea a longitudes de onda específicas a los dos fluoróforos y que las emisiones de los dos fluoróforos se puedan analizar simultáneamente (véase Shalon et al., 1996, "A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization", Genome Research 6:639-645. En una materialización preferida, los despliegues se escanean con un escáner de láser fluorescente con una fase X-Y controlada por ordenador y con objetivo microscópico. La excitación secuencial de los dos fluoróforos se lleva a cabo con un láser de gas mixto multilínea y la luz emitida se fracciona por longitud de onda y se detecta mediante dos tubos fotomultiplicadores. En Schena et al., Genome Res. 6:639-645 (1996), y en otras referencias citadas en el presente documento, se describen dispositivos de escaneo por láser fluorescente. Como alternativa, se puede usar el haz de fibra óptica descrito por Ferguson et al., Nature Biotech. 14:1681-1684 (1996), para monitorizar la abundancia de los niveles de mRNA en un gran número de lugares a la vez. [0120] When fluorescent-labeled probes are used, fluorescence emissions at each location of a biochip can be detected, preferably, by confocal laser scanning microscopy. In a materalization a sweep is carried out separately, by means of the appropriate excitation line, for each of the two fluorophores used. Alternatively, a laser that allows simultaneous specimen illumination at specific wavelengths to the two fluorophores and that the emissions of the two fluorophores can be analyzed simultaneously can be used (see Shalon et al., 1996, "A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization ", Genome Research 6: 639-645. In a preferred embodiment, the displays are scanned with a fluorescent laser scanner with a computer-controlled XY phase and microscopic objective. Sequence of the two fluorophores is carried out with a multi-line mixed gas laser and the emitted light is fractionated by wavelength and is detected by two photomultiplier tubes.In Schena et al., Genome Res. 6: 639-645 (1996 ), and other references cited herein, fluorescent laser scanning devices are described. Alternatively, the fiber optic beam can be used described by Ferguson et al., Nature Biotech. 14: 1681-1684 (1996), to monitor the abundance of mRNA levels in a large number of places at once.

[0121] Las señales se graban y, en una materialización preferida, se analizan por ordenador, por ej. mediante una placa análoga a digital de 12 o 16 bits. En una materialización, se eliminan las intermitencias de la imagen escaneada mediante un programa de gráficos (por ej., Hijaak Graphics Suite) y a continuación se analiza mediante un programa de ploteado de imágenes que crea una hoja de cálculo de la hibridación media por cada longitud de onda en cada lugar. Si es necesario, se puede hacer una determinada corrección experimental para “producir diafonía” (superponer) entre los canales para los dos fluores. Para cualquier lugar concreto de hibridación del despliegue de transcripción se puede calcular un cociente de la emisión de los dos fluoróforos. El cociente es independiente de la expresión absoluta del gen afín, pero es útil para los genes cuya expresión se modula significativamente en asociación con los diferentes estados relacionados con el cáncer de mama. [0121] The signals are recorded and, in a preferred embodiment, analyzed by computer, eg. by means of a digital analogue board of 12 or 16 bits. In a materialization, the intermittences of the scanned image are eliminated by means of a graphics program (e.g., Hijaak Graphics Suite) and then analyzed by an image plotting program that creates a spreadsheet of the average hybridization for each length Wave in each place. If necessary, a certain experimental correction can be made to "produce crosstalk" (superimpose) between the channels for the two fluorescents. For any specific place of hybridization of the transcription display, a quotient of the emission of the two fluorophores can be calculated. The quotient is independent of the absolute expression of the related gene, but is useful for genes whose expression is significantly modulated in association with the different states related to breast cancer.

5.6 ANÁLISIS ASISTIDO POR ORDENADOR 5.6 COMPUTER ASSISTED ANALYSIS

[0122] A continuación se describen kits que comprenden los conjuntos de marcadores de más arriba. En una materialización preferida, el kit contiene un biochip listo para hibridarse con moléculas polinucleótidas destino, más el software para los análisis de datos explicados más arriba. [0122] The following describes kits that comprise the marker sets above. In a preferred embodiment, the kit contains a biochip ready to hybridize with target polynucleotide molecules, plus the software for data analysis explained above.

[0123] Los métodos analíticos explicados en las anteriores secciones pueden ponerse en práctica mediante los siguientes sistemas informáticos y según los siguientes programas y métodos. El sistema informático comprende componentes internos conectados a componentes externos. Los componentes internos de un sistema informático típico incluyen un elemento procesador interconectado a una memoria principal. Por ejemplo, el sistema informático puede ser un Intel 8086-, 80386-, 80486-, Pentium™ o procesador basado en Pentium™ preferiblemente con 32 MB o más de memoria principal. [0123] The analytical methods explained in the previous sections can be implemented using the following computer systems and according to the following programs and methods. The computer system comprises internal components connected to external components. The internal components of a typical computer system include a processor element interconnected to a main memory. For example, the computer system may be an Intel 8086-, 80386-, 80486-, Pentium ™ or Pentium ™ based processor preferably with 32 MB or more of main memory.

[0124] Los componentes externos pueden incluir almacenamiento masivo. Este almacenamiento masivo puede ser uno o más discos duros (que suele ir incluido en el mismo paquete que el procesador y la memoria). Dichos discos duros tendrán preferiblemente una capacidad de 1 GB o más de memoria. Los demás componentes externos son un dispositivo de interfaz de usuario, que puede ser un monitor, junto con un dispositivo de entrada, que puede ser un “ratón”, u otros dispositivos de entrada gráfica, y/o un teclado. También se le puede conectar al ordenador un dispositivo de impresión. [0124] External components may include mass storage. This mass storage can be one or more hard drives (which is usually included in the same package as the processor and memory). Such hard drives will preferably have a capacity of 1 GB or more of memory. The other external components are a user interface device, which can be a monitor, together with an input device, which can be a "mouse", or other graphic input devices, and / or a keyboard. You can also connect a printing device to the computer.

[0125] Típicamente, el sistema informático está conectado también a un enlace de red, que puede ser parte de un enlace de Ethernet con otros sistemas informáticos locales, sistemas informáticos remotos o redes de comunicación de gran amplitud, como Internet. Este enlace de red permite que el sistema informático comparta datos y tareas de procesado con otros sistemas informáticos. [0125] Typically, the computer system is also connected to a network link, which may be part of an Ethernet link with other local computer systems, remote computer systems or large-scale communication networks, such as the Internet. This network link allows the computer system to share data and processing tasks with other computer systems.

[0126] Durante el funcionamiento de este sistema se cargan en la memoria varios componentes de software, que son a la vez estándares en la técnica y especiales en la presente invención. Estos componentes de software hacen colectivamente que el sistema informático funcione según los métodos de esta invención. Estos componentes de software están almacenados típicamente en el dispositivo de almacenamiento masivo. Un componente de software comprende el sistema operativo, que es responsable de la dirección del sistema informático y sus interconexiones. Este sistema operativo puede ser, por ejemplo, de la familia de Microsoft Windows®, como Windows 3.1, Windows 95, Windows 98, Windows 2000 o Windows NT. El componente de software representa lenguajes y funciones comunes convenientemente presentes en este sistema para ayudar a los programas a poner en práctica los métodos específicos de esta invención. Se pueden usar muchos lenguajes informáticos de nivel alto o bajo para programar los métodos analíticos de esta invención. Las instrucciones pueden interpretarse durante el periodo de funcionamiento o resumirse. Entre los lenguajes preferidos están C/ C++, FORTRAN y JAVA. Lo más preferible es que los métodos de esta invención se programen en paquetes de software matemático que permiten la entrada simbólica de ecuaciones y especificación de proceso de alto nivel, incluyendo algunos o todos los algoritmos que van a usarse, liberando de este modo al usuario de la necesidad de programar procesalmente ecuaciones individuales o algoritmos. Dentro de dichos paquetes están Mathlab de Mathworks (Natick, MA), Mathematica® de Wolfram Research (Champaign, IL), o S-Plus® de Math Soft (Cambridge, MA). Concretamente, el componente de software incluye los métodos analíticos de la invención tal como se programan en un lenguaje procesal o paquete simbólico. [0126] During the operation of this system, several software components are loaded into memory, which are both standard in the art and special in the present invention. These software components collectively make the computer system work according to the methods of this invention. These software components are typically stored in the mass storage device. A software component comprises the operating system, which is responsible for the management of the computer system and its interconnections. This operating system can be, for example, from the Microsoft Windows® family, such as Windows 3.1, Windows 95, Windows 98, Windows 2000 or Windows NT. The software component represents common languages and functions conveniently present in this system to help programs implement the specific methods of this invention. Many high or low level computer languages can be used to program the analytical methods of this invention. The instructions can be interpreted during the period of operation or summarized. Among the preferred languages are C / C ++, FORTRAN and JAVA. Most preferably, the methods of this invention are programmed in mathematical software packages that allow the symbolic entry of equations and high-level process specification, including some or all of the algorithms to be used, thereby releasing the user from the need to programmatically process individual equations or algorithms. These packages include Mathlab from Mathworks (Natick, MA), Mathematica® from Wolfram Research (Champaign, IL), or S-Plus® from Math Soft (Cambridge, MA). Specifically, the software component includes the analytical methods of the invention as programmed in a procedural language or symbolic package.

[0127] El software que debe incluirse con el kit comprende los métodos de análisis de datos de la invención tal como se dan a conocer en el presente documento. Concretamente, el software puede incluir rutinas matemáticas para descubrimiento de marcadores, incluido el cálculo de coeficientes de correlación entre categorías clínicas (esto es, la categoría de ER) y la expresión de marcadores. El software también puede incluir rutinas matemáticas para calcular ña correlación entre expresión de marcadores de muestra y expresión de marcadores de control, mediante datos de la fluorescencia generada por el despliegue, para determinar la clasificación clínica de una muestra. [0127] The software to be included with the kit comprises the methods of data analysis of the invention as disclosed herein. Specifically, the software may include mathematical routines for marker discovery, including the calculation of correlation coefficients between clinical categories (that is, the ER category) and the expression of markers. The software can also include mathematical routines to calculate the correlation between expression of sample markers and expression of control markers, using data from the fluorescence generated by the display, to determine the clinical classification of a sample.

[0128] En una materialización modelo, para poner en práctica los métodos de la presente invención, primero el usuario carga datos experimentales en el sistema informático. Estos datos puede introducirlos directamente el usuario desde un monitor, un teclado u cualquier otro sistema informático conectado por conexión de red, o en un medio de almacenamiento amovible como un CD-ROM, un disquete (que no se muestra en las ilustraciones), una unidad de cinta magnética (que tampoco se muestra), una unidad de ZIP® drive (que tampoco se muestra) o a través de la red. A continuación el usuario procede a la ejecución del software de análisis del perfil de expresión que lleva a cabo los pasos de la presente invención. [0128] In a model materialization, to implement the methods of the present invention, the user first loads experimental data into the computer system. This data can be entered directly by the user from a monitor, a keyboard or any other computer system connected by network connection, or in a removable storage medium such as a CD-ROM, a floppy disk (not shown in the illustrations), a magnetic tape drive (not shown), a ZIP® drive (not shown) or over the network. The user then proceeds to the execution of the expression profile analysis software that performs the steps of the present invention.

[0129] En otra materialización modelo, primero el usuario carga datos experimentales y/o bases de datos en el sistema informático. Estos datos se cargan en la memoria desde los medios de almacenamiento o desde un ordenador remoto, preferiblemente desde un sistema dinámico de bases de datos de conjuntos de genes, a través de la red. A continuación el usuario procede a la ejecución del software que lleva a cabo los pasos de la presente invención. [0129] In another model materialization, the user first loads experimental data and / or databases into the computer system. This data is loaded into memory from storage media or from a remote computer, preferably from a dynamic system of gene set databases, over the network. The user then proceeds to the execution of the software that carries out the steps of the present invention.

[0130] A los experimentados en la técnica les resultarán evidentes sistemas informáticos y software alternativos para llevar a cabo los métodos analíticos de esta invención, que deben entenderse incluidos en las reivindicaciones anexas. Concretamente, es propósito de las reivindicaciones incluir las estructuras de programa alternativo para llevar a cabo los métodos de esta invención, cuya evidencia advertirán sin dificultad los experimentados en la técnica. [0130] Those skilled in the art will find evident alternative computer systems and software for carrying out the analytical methods of this invention, which should be understood as included in the appended claims. Specifically, it is the purpose of the claims to include the alternative program structures for carrying out the methods of this invention, the evidence of which will be readily apparent to those experienced in the art.

6. EJEMPLOS 6. EXAMPLES

Materiales y Métodos Materials and methods

[0131] Se recogieron 117 muestras de tumores de pacientes de cáncer de mama. A continuación se prepararon muestras de ARN y se trazó el perfil de cada una de dichas muestras mediante biochips impresos por chorro de tinta. Después se identificaron genes marcadores basándose en patrones de expresión; estos genes se usaron luego para las prácticas con clasificadores, que usaron estos genes marcadores para clasificar tumores en categorías de diagnóstico y pronóstico. Por último, estos genes marcadores se usaron para predecir el resultado del diagnóstico y del pronóstico en un grupo de individuos. [0131] 117 tumor samples were collected from breast cancer patients. RNA samples were then prepared and the profile of each of said samples was drawn by inkjet printed biochips. Then marker genes were identified based on expression patterns; These genes were then used for practices with classifiers, which used these marker genes to classify tumors into diagnostic and prognostic categories. Finally, these marker genes were used to predict the outcome of diagnosis and prognosis in a group of individuals.

1. Recogida de muestras 1. Sample collection

[0132] Se seleccionó a 117 pacientes de cáncer de mama en tratamiento en el Instituto de Cáncer de los Países Bajos / Antoni van Leeuwenhoek Hospital, Amsterdam, Países Bajos, ateniéndose a los siguientes métodos clínicos (datos extraídos de las historias clínicas del Registro de Tumores NKI/AvL, Departamento de Biométrica). [0132] A total of 117 breast cancer patients under treatment at the Netherlands Cancer Institute / Antoni van Leeuwenhoek Hospital, Amsterdam, The Netherlands were selected, following the following clinical methods (data extracted from the medical records of the Registry of Tumors NKI / AvL, Department of Biometrics).

[0133] El grupo 1 (n=97, 78 para prácticas, 19 para ensayos independientes) se clasificó según el método de: [0133] Group 1 (n = 97, 78 for practices, 19 for independent trials) was classified according to the method of:

(1) carcinoma de mama invasor primario <5 cm (T1 o T2); (2) ausencia de metástasis axilar (N0); (3) edad de diagnóstico <55 años; (4) periodo del diagnóstico 1983-1996, y (5) sin tumores malignos con anterioridad (excluyendo tumor cervical maligno in situ o carcinoma basocelular de la piel). A todas las pacientes se las trató con mastectomía radical modificada (n=34) o con tratamiento conservador de la mama (n=64) incluida la disección del ganglio linfático axilar. El tratamiento conservador de la mama consistió en la extirpación del tumor, seguida de la radiación de toda la mama en una dosis de 50 Gy, seguida de un refuerzo de 15 a 25 Gy. Cinco pacientes recibieron terapia sistémica coadyuvante consistente en quimioterapia (n=3) o terapia hormonal (n=2), ninguna de las demás pacientes recibió tratamiento adicional. Todas las pacientes tuvieron como mínimo un seguimiento anual durante un período de al menos 5 años. La investigación de las pacientes se extrajo del Registro de Tumores del Departamento de Biométrica. (1) primary invasive breast carcinoma <5 cm (T1 or T2); (2) absence of axillary metastasis (N0); (3) age of diagnosis <55 years; (4) diagnosis period 1983-1996, and (5) without previously malignant tumors (excluding malignant cervical tumor in situ or basal cell carcinoma of the skin). All patients were treated with modified radical mastectomy (n = 34) or with conservative treatment of the breast (n = 64) including axillary lymph node dissection. Conservative treatment of the breast consisted of the removal of the tumor, followed by radiation of the entire breast at a dose of 50 Gy, followed by a reinforcement of 15 to 25 Gy. Five patients received adjuvant systemic therapy consisting of chemotherapy (n = 3) or hormonal therapy (n = 2), none of the other patients received additional treatment. All patients had at least one annual follow-up for a period of at least 5 years. Patient investigation was extracted from the Tumor Registry of the Biometrics Department.

[0134] Las integrantes del grupo 2 (n=20) se clasificaron en: (1) portadoras de una mutación germinal en BRCA1 o BRCA2; y (2) aquejadas de un carcinoma de mama invasor primario. No se hizo selección o exclusión alguna basándose en el tamaño del tumor, la categoría del ganglio linfático, la edad de diagnóstico, el año de la realización del diagnóstico ni otros tumores malignos. La clase de mutación germinal ya se conocía antes de realizar este protocolo de investigación. [0134] The members of group 2 (n = 20) were classified as: (1) carriers of a germline mutation in BRCA1 or BRCA2; and (2) suffering from a primary invasive breast carcinoma. No selection or exclusion was made based on tumor size, lymph node category, age of diagnosis, year of diagnosis or other malignant tumors. The germline mutation class was already known before performing this research protocol.

[0135] La información sobre el individuo de quien se recogió muestras tumorales comprende: año de nacimiento; sexo; si el individuo es pre-menopáusico o pos-menopáusico; año del diagnóstico; número de ganglios linfáticos positivos y número total de ganglios; si hubo cirugía y, si fue así, si la cirugía fue conservadora de la mama o radical; si hubo radioterapia, quimioterapia o terapia hormonal. El tumor se graduó según la fórmula P=TNM, donde T es el tamaño del tumor (en una escala de 0-5); N es el número de ganglios que son positivos (en una escala de 0-4) y M es metástasis (0 = ausente, 1 = presente). El tumor también se clasificó según la fase, el tipo de tumor (in situ o invasor; lobular o ductal; el grado) y la presencia o ausencia de los receptores de estrógeno y progesterona. La progresión del cáncer se describió (donde correspondía) por: metástasis distante, año de la metástasis distante, año de fallecimiento, año del último seguimiento y genotipo de BRCA1. [0135] Information about the individual from whom tumor samples were collected includes: year of birth; sex; if the individual is pre-menopausal or post-menopausal; year of diagnosis; number of positive lymph nodes and total number of nodes; if there was surgery and, if so, if the surgery was conservative of the breast or radical; if there was radiotherapy, chemotherapy or hormonal therapy. The tumor was graduated according to the formula P = TNM, where T is the size of the tumor (on a scale of 0-5); N is the number of nodes that are positive (on a scale of 0-4) and M is metastatic (0 = absent, 1 = present). The tumor was also classified according to the phase, the type of tumor (in situ or invasive; lobular or ductal; grade) and the presence or absence of estrogen and progesterone receptors. Cancer progression was described (where appropriate) by: distant metastasis, year of distant metastasis, year of death, year of last follow-up and BRCA1 genotype.

2. Tumores 2. Tumors

[0136] El ensayo de mutación germinal de BRCA1 y BRCA2 en el ADN aislado de linfocitos sanguíneos periféricos comprende un cribado de mutación mediante un Ensayo de Truncamiento de Proteínas (Protein Truncation Test, PTT) del exón 11 de BRCA1 y exon 10 y 11 de BRCA2, deleción PCR de BRCA1, deleción genómica de los exones 13 y 22, así como Electroforesis de Gel por Gradiente de Desnaturalización (Denaturing Gradient Gel Electrophoresis, DGGE) de los exones restantes. Todas las bandas aberrantes se confirmaron mediante secuenciación genómica analizada en un secuenciador automático ABI3700 y se confirmaron en una muestra independiente. De todo ello, el material tumoral material se sometió a congelación instantánea en nitrógeno líquido en la hora siguiente a la cirugía. Del material tumoral congelado se preparó una sección coloreada con H&E (hematoxilina-eosina) antes y después de cortar rodajas para el aislamiento del ARN. Se calcularon estas secciones de H&E congeladas para hallar el porcentaje de células tumorales; sólo se seleccionaron las muestras con >50% de células tumorales para su posterior estudio. [0136] The BRCA1 and BRCA2 germ mutation assay in DNA isolated from peripheral blood lymphocytes comprises a mutation screening using a Protein Truncation Test (PTT) of exon 11 of BRCA1 and exon 10 and 11 of BRCA2, PCR deletion of BRCA1, genomic deletion of exons 13 and 22, as well as Denaturing Gradient Gel Electrophoresis (DGGE) of the remaining exons. All aberrant bands were confirmed by genomic sequencing analyzed in an ABI3700 automatic sequencer and confirmed in a separate sample. Of all this, the material tumor material was subjected to instant freezing in liquid nitrogen in the hour following the surgery. From the frozen tumor material, a section colored with H&E (hematoxylin-eosin) was prepared before and after cutting slices for RNA isolation. These frozen H&E sections were calculated to find the percentage of tumor cells; Only samples with> 50% of tumor cells were selected for further study.

[0137] Para todos los tumores especímenes quirúrgicos fijados en formaldehído y recibidos con parafina se evaluaron con procedimientos histopatológicos estándar. Las secciones de parafina coloreadas con H&E se examinaron para calcular el tipo de tumor (por ej., ductal o lobular, según la clasificación WHO); para calcular el grado histológico según el método descrito por Elston y Ellis (grado 1-3); y para calcular la presencia de crecimiento linfangio-invasivo y la presencia de una infiltración linfocítica extensiva. Todos los factores histológicos fueron calculados independientemente por dos histólogos (MV y JL); se alcanzó un consenso sobre las diferencias examinando conjuntamente los portaobjetos. Se usó un portaobjeto representativo de cada tumor para coloreado inmunohistoquímico con anticuerpos dirigidos contra el receptor de estrógenos y progesterona con procedimientos estándar. El resultado del coloreado se registró como porcentaje de núcleos de coloración positiva (0%, 10%, 20%, etc., y así hasta 100%). [0137] For all tumors specimens fixed in formaldehyde and received with paraffin were evaluated with standard histopathological procedures. Paraffin sections colored with H&E were examined to calculate the type of tumor (eg, ductal or lobular, according to WHO classification); to calculate the histological grade according to the method described by Elston and Ellis (grade 1-3); and to calculate the presence of lymphangio-invasive growth and the presence of extensive lymphocytic infiltration. All histological factors were independently calculated by two histologists (MV and JL); consensus was reached on the differences by jointly examining the slides. A representative slide of each tumor was used for immunohistochemical staining with antibodies directed against the estrogen receptor and progesterone with standard procedures. The result of coloring was recorded as a percentage of nuclei of positive coloration (0%, 10%, 20%, etc., and thus up to 100%).

3. Amplificación, etiquetado e hibridación 3. Amplification, labeling and hybridization

[0138] El perfil de la producción de ácidos nucleicos derivados de marcadores y de la hibridación de los ácidos nucleicos con un biochip se muestra en la FIG. 2. Se usó un total de 30 secciones congeladas de 30 μM de grosor para el aislamiento total del ARN de cada espécimen tumoral sometido a congelación instantánea. El ARN total se aisló con RNAzol™ B (Campro Scientific, Veenendaal, Países Bajos) según el protocolo del fabricante, que incluye la homogeneización del tejido mediante un Polytron PT-MR2100 (Merck, Amsterdam, Países Bajos) y por último se disolvió en H2O sin ARNasa. Se calculó la calidad del ARN total mediante el cociente A260/A280 que tenía que estar entre 1,7 y 2,1, así como inspección visual del ARN en gel de agarosa, que debería indicar una banda de ARN de ribosomal 28S más fuerte en comparación con la banda de ARN de ribosomal 18S, posteriormente se trataron 25 μg de ARN total con DNasa mediante el kit Qiagen de DNasa sin RNasa y columnas de centrifugación (Qiagen Inc, GmbH, Germany) según el protocolo del fabricante. El ARN total tratado con DNasa se disolvió en H2O sin RNasa hasta llegar a una concentración final de 0,2 μg/μl. [0138] The profile of the production of nucleic acids derived from markers and the hybridization of nucleic acids with a biochip is shown in FIG. 2. A total of 30 frozen sections 30 µM thick were used for total RNA isolation of each tumor specimen subjected to instant freezing. Total RNA was isolated with RNAzol ™ B (Campro Scientific, Veenendaal, The Netherlands) according to the manufacturer's protocol, which includes tissue homogenization using a Polytron PT-MR2100 (Merck, Amsterdam, The Netherlands) and finally dissolved in H2O without RNase. The quality of the total RNA was calculated using the ratio A260 / A280 that had to be between 1.7 and 2.1, as well as visual inspection of the agarose gel RNA, which should indicate a stronger 28S ribosomal RNA band in Compared to the 18S ribosomal RNA band, 25 μg of total RNA was subsequently treated with DNase using the Qiagen DNase kit without RNase and centrifugal columns (Qiagen Inc, GmbH, Germany) according to the manufacturer's protocol. The total RNA treated with DNase was dissolved in H2O without RNase until reaching a final concentration of 0.2 μg / μl.

[0139] Se usaron 5 μg de ARN total como entrada para síntesis de ARNc. Se usó un cebador oligo-dT que contenía una secuencia promotora de polimerasa de ARN T7 para cebar una síntesis de ADN de primera cadena y se usaron cebadores aleatorios (pdN6) para cebar una síntesis de ADNc mediante transcriptasa inversa de MMLV. Esta reacción produjo un ADN de doble cadena que contenía el promotor de polimerasa de ARN T7 (T7RNAP). A continuación el ADNc de doble cadena se transcribió a ARNc mediante el T7RNAP. [0139] 5 μg of total RNA was used as input for cRNA synthesis. An oligo-dT primer containing a T7 RNA polymerase promoter sequence was used to prime a first strand DNA synthesis and random primers (pdN6) were used to prime a cDNA synthesis by MMLV reverse transcriptase. This reaction produced a double stranded DNA containing the T7 RNA polymerase promoter (T7RNAP). The double stranded cDNA was then transcribed to cRNA by T7RNAP.

[0140] Se etiquetó ARNc con colorantes Cy3 o Cy5 mediante un proceso de dos fases. primero, se incorporaron enzimáticamente nucleótidos derivativos de alilamina a productos de ARNc. Para el etiquetado del ARNc, se sustituyó el UTP por una mezcla de 3:1 de 5-(3-aminoali)uridina 5’- trifosfato (Sigma) y UTP en la reacción de la transcripción in vitro (IVT). A continuación se hizo reaccionar los productos de ARNc derivados de alilamina con ésteres de N-hidroxi succinimida de Cy3 o Cy5 (CyDye, Amersham Pharmacia Biotech). Se mezcló 5mg de ARNc etiquetado con Cy5 de una paciente con cáncer de mama con la misma cantidad de producto etiquetado con Cy3 de una reserva de igual cantidad de ARNc de cada paciente esporádico individual. [0140] cRNA was labeled with Cy3 or Cy5 dyes by a two phase process. First, allylamine-derived nucleotides were enzymatically incorporated into cRNA products. For the cRNA labeling, the UTP was replaced by a 3: 1 mixture of 5- (3-aminoali) uridine 5'-triphosphate (Sigma) and UTP in the in vitro transcription reaction (IVT). The allylamine-derived cRNA products were then reacted with Cy3 or Cy5 N-hydroxy succinimide esters (CyDye, Amersham Pharmacia Biotech). 5mg of Cy5-labeled cRNA from a breast cancer patient was mixed with the same amount of Cy3-labeled product from a stockpile of the same amount of cRNA from each individual sporadic patient.

[0141] Se hicieron por duplicado hibridaciones de biochip con inversiones de flúor. Antes de la hibridación, se fragmentaron los ARNc a un tamaño medio de -50-100nt calentándolos a 60 ˚C en presencia de 10 mM de ZnCl2. Se añadieron los ARNc fragmentados a un tampón de hibridación que contenía 1 M de NaCl, 0.5% de sarcosian de sodio y 50 mM de MES, pH 6.5, cuya dureza se reguló con la adición de formamida hasta una concentración final de 30%. Se llevaron a cabo hibridaciones en un volumen final de mls a 40 ˚C en la plataforma giratoria de un horno de hibridación (Robbins Scientific) durante 48 h. Tras la hibridación, se lavaron los portaobjetos y se escanearon mediante un barrido confocal de láser (Agilent Technologies). Las intensidades de fluorescencia de las imágenes escaneadas se cuantificaron, normalizaron y corrigieron. [0141] Biochip hybridizations with fluorine inversions were performed in duplicate. Prior to hybridization, the cRNAs were fragmented to an average size of -50-100nt by heating them at 60 ° C in the presence of 10 mM ZnCl2. The fragmented cRNAs were added to a hybridization buffer containing 1 M NaCl, 0.5% sodium sarcosian and 50 mM MES, pH 6.5, whose hardness was regulated with the addition of formamide to a final concentration of 30%. Hybridizations were carried out in a final volume of mls at 40 ° C on the rotating platform of a hybridization oven (Robbins Scientific) for 48 h. After hybridization, the slides were washed and scanned using a confocal laser scan (Agilent Technologies). The fluorescence intensities of the scanned images were quantified, normalized and corrected.

4. Combinación de las muestras 4. Sample combination

[0142] Se formó una reserva de referencia de ARNc combinando igual cantidad de ARNc de cada paciente esporádica individual. [0142] A reference pool of cRNA was formed by combining the same amount of cRNA from each individual sporadic patient.

5.25K Biochip humano 5.25K Human Biochip

[0143] Se sintetizaron oligonucleótidos unidos a la superficie siguiendo esencialmente lo propuesto por Blanchard et al., Biosens. Bioelectron. 6(7):687-690 (1996); véase también Hughes et al., Nature Biotech. 19(4):342-347 (2000). Como sustratos para síntesis de nucleótidos se usaron superficies hidrófobas de cristal (3 pulgadas x 3 pulgadas) que contenían grupos de hidroxilo expuestos. En las superficies de cristal se introdujeron monómeros de fosforamidita en posiciones definidas por ordenador mediante impresión por chorro de tinta. A continuación se eliminaron por lavado los monómeros no reaccionados y se les quitó la protección a los extremos de los oligonucleótidos extendidos. Para cada síntesis de nucleótidos que se deseaba se repitió este ciclo de acoplamiento, lavado y desprotección de los monómeros. Las secuencias de oligonucleótidos que debían imprimirse se especificaron mediante archivos informáticos. [0143] Surface bound oligonucleotides were synthesized following essentially what was proposed by Blanchard et al., Biosens. Bioelectron 6 (7): 687-690 (1996); see also Hughes et al., Nature Biotech. 19 (4): 342-347 (2000). Hydrophobic glass surfaces (3 inches x 3 inches) containing exposed hydroxyl groups were used as nucleotide synthesis substrates. On the glass surfaces, phosphoramidite monomers were introduced at computer-defined positions by inkjet printing. The unreacted monomers were then washed off and the ends of the extended oligonucleotides were removed. For each nucleotide synthesis desired, this cycle of coupling, washing and deprotection of the monomers was repeated. The oligonucleotide sequences to be printed were specified by computer files.

[0144] Para este estudio se usaron biochips que contenían aproximadamente 25.000 secuencias de genes humanos (biochips Hu25K). Se seleccionaron secuencias para biochips de RefSeq (una colección de secuencias de ARNm no redundantes situadas en el sitio de Internet nlm.nih.gov/LocusLink/refseq.html) y Phil Green EST contigs, que es una colección de secuencias contiguas de EST reunida por el Dr. Phil Green et al en la Universidad de Washington (Ewing and Green, Nat. Genet. 25(2):232-4 (2000)), disponible en el sitio de Internet phrap.org/est_assembly/ index.html. Cada secuencia contigua de ARN o EST se representó en biochip Hu25K mediante un solo oligonucleótido 60-mero siguiendo esencialmente las explicaciones de Hughes et al., Nature Biotech. 19(4):342-347 y de la Publicación International WO01/06013, publicada el 25 de enero de 2001, y en la Publicación International WO01/05935, publicada el 25 de enero de 2001, con la diferencia de que se modificaron las reglas de oligocribado para eliminar los oligonucleótidos con más del 30% de C o con 6 o más [0144] Biochips containing approximately 25,000 human gene sequences (Hu25K biochips) were used for this study. Sequences were selected for RefSeq biochips (a collection of non-redundant mRNA sequences located on the Internet site nlm.nih.gov/LocusLink/refseq.html) and Phil Green EST contigs, which is a collection of contiguous EST sequences gathered by Dr. Phil Green et al at the University of Washington (Ewing and Green, Nat. Genet. 25 (2): 232-4 (2000)), available at phrap.org/est_assembly/ index.html . Each contiguous sequence of RNA or EST was represented in Hu25K biochip by a single 60-mer oligonucleotide essentially following the explanations of Hughes et al., Nature Biotech. 19 (4): 342-347 and International Publication WO01 / 06013, published on January 25, 2001, and in International Publication WO01 / 05935, published on January 25, 2001, with the difference that the oligo-writing rules to eliminate oligonucleotides with more than 30% C or with 6 or more

5 residuos contiguos de C. 5 contiguous residues of C.

Ejemplo 1: Conjuntos de genes regulados diferenciadamente y patrones generales de expresión de tumores de cáncer de mama Example 1: Differentially regulated gene sets and general patterns of breast cancer tumor expression

[0145] De las aproximadamente 25.000 secuencias representadas en el biochip se seleccionó un grupo de aproximadamente 5.000 genes que estaban significativamente regulados por todo el grupo de muestras. Se [0145] From the approximately 25,000 sequences represented in the biochip, a group of approximately 5,000 genes was selected that were significantly regulated throughout the sample group. Be

10 determinó que un gen estaba regulado de manera significativamente diferenciada con el cáncer de mama si mostraba más del doble de cambios de transcripción en comparación con una reserva de tumores esporádicos y si el valor-p para la regulación (Hughes et al., Cell 102:109-126 (2000)) era inferior a 0,01, tanto hacia arriba como hacia abajo, en al menos cinco sobre 98 muestras tumorales. 10 determined that a gene was regulated significantly differentiated with breast cancer if it showed more than twice as many transcription changes compared to a pool of sporadic tumors and if the p-value for regulation (Hughes et al., Cell 102 : 109-126 (2000)) was less than 0.01, both up and down, in at least five out of 98 tumor samples.

[0146] Un logaritmo de agrupamiento no supervisado nos permitió agrupar pacientes sobre la base de sus [0146] An unsupervised clustering logarithm allowed us to group patients based on their

15 semejanzas medidas en este conjunto de -5.000 genes significativos. La medida de semejanza entre dos pacientes x e y se define como 15 similarities measured in this set of -5,000 significant genes. The measure of similarity between two patients x and y is defined as

imagen1image 1

Ecuación (5) Equation (5)

En la Ecuación (5), x e y son dos pacientes con componentes de cociente logarítmico xi yi , i= 1,..., N=5,100. A cada valor xi va asociado el error σxy . Cuanto menor sea el valor σxy más fiable será la medición. In Equation (5), x and y are two patients with logarithmic ratio components xi and i, i = 1, ..., N = 5,100. The error σxy is associated with each value xi. The lower the σx value and the more reliable the measurement will be.

es la media aritmética ponderada de error. El uso de la correlación como métrica de semejanza pone de relieve la importancia de la corregulación en el agrupamiento, más que la amplitud de las    is the weighted arithmetic mean of error. The use of correlation as a similarity metric highlights the importance of corregulation in clustering, rather than the breadth of

[0147] El conjunto de aproximadamente 5.000 genes puede agruparse según sus semejanzas medidas en la totalidad del grupo de 98 muestras tumorales. La medida de semejanza entre dos genes se definió de la misma [0147] The set of approximately 5,000 genes can be grouped according to their similarities measured in the entire group of 98 tumor samples. The measure of similarity between two genes was defined in the same

25 forma que en la Ecuación (1), con la diferencia de que ahora por cada gen hay 98 componentes de mediciones de cociente logarítmico. 25 so that in Equation (1), with the difference that there are now 98 components of logarithmic quotient measurements for each gene.

[0148] El resultado de dicho agrupamiento bidimensional aparece representado en la FIG.3. Del agrupamiento emergen dos patrones característicos. El primer patrón consiste en un grupo de pacientes en la parte inferior del diagrama cuyas regulaciones son muy diferentes de la reserva esporádica. El otro patrón lo constituye un grupo [0148] The result of said two-dimensional grouping is represented in FIG. 3. Two characteristic patterns emerge from the grouping. The first pattern consists of a group of patients at the bottom of the diagram whose regulations are very different from the sporadic reserve. The other pattern is a group

30 de pacientes en la parte superior del diagrama cuyas expresiones están solo moderadamente reguladas en comparación con la reserva esporádica. Estos patrones dominantes sugieren que los tumores pueden dividirse de modo inequívoco en dos grupos tipos diferenciados basándose en dicho conjunto de -5.000 genes significativos. 30 of patients at the top of the diagram whose expressions are only moderately regulated compared to the sporadic reserve. These dominant patterns suggest that tumors can be unequivocally divided into two distinct type groups based on said set of -5,000 significant genes.

[0149] Para facilitar la identificación de estos patrones, se asociaron los mismos a receptor de estrógeno (ER), [0149] To facilitate the identification of these patterns, they were associated with estrogen receptor (ER),

35 receptor de proestrógeno (PR), grado de tumor, presencia de infiltrado linfocítico y angioinvasión (FIG. 3). El grupo inferior de la FIG. 3, que constituye el patrón dominante, consta de 36 pacientes. De las 30 pacientes con ER negativo, 34 pacientes se concentran en este grupo. A partir de la FIG. 4 se observó que la expresión del gen alfa receptor de estrógeno ESR1 y un grupo numeroso de genes corregulados se ajustan a este patrón de expresión. Proestrogen receptor (PR), tumor grade, presence of lymphocytic infiltrate and angioinvasion (FIG. 3). The lower group of FIG. 3, which constitutes the dominant pattern, consists of 36 patients. Of the 30 patients with negative ER, 34 patients are concentrated in this group. From FIG. 4 it was observed that the expression of the ESR1 estrogen receptor alpha gene and a large group of corregulated genes conform to this expression pattern.

40 [0150] De la FIG. 3 y la FIG. 4 se sacó en conclusión que se pueden usar patrones de expresión para clasificar muestras tumorales en subgrupos de interés diagnóstico. Así pues, genes corregulados en un total de 98 muestras tumorales contienen información sobre la base molecular de cánceres de mama. La combinación de datos clínicos y abundancia de genes, medida en biochip, de ESR1 demuestra que los distintos tipos están relacionados con, o al menos indicados por, la categoría de ER. 40 [0150] From FIG. 3 and FIG. 4 it was concluded that expression patterns can be used to classify tumor samples into subgroups of diagnostic interest. Thus, genes corregulated in a total of 98 tumor samples contain information on the molecular basis of breast cancers. The combination of clinical data and gene abundance, measured in biochip, of ESR1 demonstrates that the different types are related to, or at least indicated by, the ER category.

45 Ejemplo 2: Identificación de marcadores genéticos que distinguen entre pacientes receptoras de estrógeno (+) y pacientes receptoras de estrógeno (-) 45 Example 2: Identification of genetic markers that distinguish between estrogen receptor patients (+) and estrogen receptor patients (-)

imagen3image3

[0151] Los resultados descritos en este Ejemplo permiten la identificación de genes marcadores de expresión con los que se diferencian dos grupos principales de células tumorales: grupo “ER-negativo” y grupo “ERpositivo”. La diferenciación de muestras por categoría de ER(+) se realizó en tres etapas: (1) identificación de un conjunto de genes marcadores candidatos que se hallan en correlación con el nivel de ER; (2) ordenación jerárquica de estos genes candidatos por fuerza de correlación; (3) optimización del número de genes marcadores y (4) clasificación de muestras basándose en dichos genes marcadores. [0151] The results described in this Example allow the identification of expression marker genes with which two main groups of tumor cells are differentiated: "ER-negative" group and "ERpositive" group. The differentiation of samples by ER category (+) was carried out in three stages: (1) identification of a set of candidate marker genes that correlate with the ER level; (2) hierarchical ordering of these candidate genes by correlation force; (3) optimization of the number of marker genes and (4) classification of samples based on said marker genes.

1. Selección de genes discriminantes candidatos 1. Selection of candidate discriminant genes

[0152] En la primera etapa se identificó un conjunto de genes discriminantes candidatos basándose en los datos de expresión de genes de muestras para las prácticas. En concreto, se calcularon los coeficientes de correlación ρ entre los números de categoría o relación de nivel de ER y expresión logarítmica ř en la totalidad de las muestras para cada gen por separado. [0152] In the first stage a set of candidate discriminant genes was identified based on the gene expression data of samples for the practices. Specifically, the correlation coefficients ρ between the category or relationship level numbers of ER and logarithmic expression ř in all samples for each gene were calculated separately.

imagen1 Ecuación (2) image 1 Equation (2)

El histograma de los coeficientes de correlación resultantes se representa en la FIG. 5A con línea gris. Aunque para la mayoría de los genes la amplitud de correlación o anticorrelación es pequeña, para algunos llega a 0,5. Los genes cuyos cocientes de expresión tengan buena correlación o buena anticorrelación con la categoría de diagnóstico de interés se usan como genes indicadores para la categoría. The histogram of the resulting correlation coefficients is represented in FIG. 5A with gray line. Although for most genes the amplitude of correlation or anticorrelation is small, for some it reaches 0.5. Genes whose expression quotients have good correlation or good anti-correlation with the diagnostic category of interest are used as indicator genes for the category.

[0153] Los genes con un coeficiente de correlación superior a 0,3 (“genes correlacionados”) o inferior a -0,3 (“genes anti-correlacionados”) se seleccionaron como genes indicadores. Se seleccionó el umbral de 0,3 basándose en la distribución de correlación para los casos en los que no se da una correlación real (se pueden usar las permutaciones para determinar esta distribución). Estadísticamente, esta anchura de distribución depende del número de muestras usadas en el cálculo de correlación. La anchura de distribución para casos de imagen1 [0153] Genes with a correlation coefficient greater than 0.3 ("correlated genes") or less than -0.3 ("anti-correlated genes") were selected as indicator genes. The threshold of 0.3 was selected based on the correlation distribution for cases where there is no real correlation (permutations can be used to determine this distribution). Statistically, this distribution width depends on the number of samples used in the correlation calculation. The distribution width for cases of image 1

control (sin correlación real) es aproximadamente control (no real correlation) is approximately

donde n = el número de muestras. En nuestro caso, n = 98. Por lo tanto, un umbral de 0,3 corresponde más o menos a 3 -σ en la distribución  where n = the number of samples. In our case, n = 98. Therefore, a threshold of 0.3 corresponds roughly to 3 -σ in the distribution

[0154] Se descubrió que 2.460 de dichos genes reunían dichas condiciones. A fin de evaluar la relevancia del coeficiente de correlación de cada gen con el nivel de ER, se usó una técnica de remuestreo para generar datos Monte-Carlo que aleatorizaran la asociación entre los datos de expresión de genes de las muestras y sus categorías. La distribución de los coeficientes de correlación obtenidos de un ensayo Monte-Carlo aparece con línea discontinua en la FIG 5A. Para estimar la relevancia de los 2.460 genes marcadores como grupo, se generaron 10.000 ensayos Monte-Carlo. La colección de estos 10.000 ensayos Monte-Carlo forma la hipótesis nula. El número de genes que reúnen las mismas condiciones para los datos Monte-Carlo varía de un ensayo a otro. La distribución de frecuencia a partir de los 10.000 ensayos Monte-Carlo del número de genes con coeficientes de >0,3 o <-0,3 se muestra en la FIG. 5B. Tanto el valor máximo como el mínimo son mucho menores de 2.460. Por lo tanto, se estima que la relevancia de este grupo de genes como conjunto de genes discriminantes entre muestras de ER(+) y ER(-) es superior al 99,99%. [0154] It was discovered that 2,460 of these genes met those conditions. In order to assess the relevance of the correlation coefficient of each gene with the ER level, a resampling technique was used to generate Monte-Carlo data that randomized the association between the gene expression data of the samples and their categories. The distribution of the correlation coefficients obtained from a Monte-Carlo test appears with a broken line in FIG 5A. To estimate the relevance of 2,460 marker genes as a group, 10,000 Monte-Carlo trials were generated. The collection of these 10,000 Monte-Carlo trials forms the null hypothesis. The number of genes that meet the same conditions for Monte-Carlo data varies from one trial to another. The frequency distribution from 10,000 Monte-Carlo assays of the number of genes with coefficients of> 0.3 or <-0.3 is shown in FIG. 5B. Both the maximum and the minimum value are much less than 2,460. Therefore, it is estimated that the relevance of this group of genes as a set of discriminant genes between ER (+) and ER (-) samples is greater than 99.99%.

2. Ordenación jerárquica de los genes discriminantes candidatos 2. Hierarchical ordering of candidate discriminant genes

[0155] En la segunda etapa, se ordenaron jerárquicamente los genes de la lista de candidatos basándose en la relevancia de cada gen como gen discriminante. Los marcadores se ordenaron jerárquicamente bien por amplitud de correlación o bien usando una métrica similar a una estadística Fisher: [0155] In the second stage, the candidate list genes were ordered hierarchically based on the relevance of each gene as a discriminant gene. The markers were ordered hierarchically either by amplitude of correlation or by using a metric similar to a Fisher statistic:

imagen4image4

imagen5image5

En la Ecuación (3), (x1) es la media ponderada de error del cociente logarítmico dentro del grupo de ER (-) y (x2) es la media ponderada de error del cociente logarítmico dentro del grupo de ER (+). σ1 es la varianza de cociente logarítmico dentro del grupo ER(-) y n1 es el número de muestras que tuvieron mediciones válidas de cocientes logarítmicos. σ2 es la varianza de cociente logarítmico dentro del grupo ER(+) y n2 es el número de muestras que tuvieron mediciones válidas de cocientes logarítmicos. El valor-t en la Ecuación (3) representa la diferencia de varianza compensada entre dos medios. El nivel de fiabilidad de cada gen en la lista de candidatos se estipuló con respecto a una hipótesis nula derivada del conjunto de datos reales mediante una técnica de remuestreo; esto es, se generaron muchos conjuntos de datos artificiales aleatorizando la asociación entre los datos clínicos y los datos de expresión de genes. In Equation (3), (x1) is the weighted mean error of the logarithmic quotient within the ER group (-) and (x2) is the weighted average error of the logarithmic quotient within the ER group (+). σ1 is the variance of logarithmic quotient within the ER group (-) and n1 is the number of samples that had valid measurements of logarithmic quotients. σ2 is the variance of logarithmic quotient within the ER (+) group and n2 is the number of samples that had valid measurements of logarithmic quotients. The t-value in Equation (3) represents the difference in compensated variance between two means. The level of reliability of each gene in the list of candidates was stipulated with respect to a null hypothesis derived from the set of real data by means of a resampling technique; that is, many artificial data sets were generated by randomizing the association between clinical data and gene expression data.

3. Optimización del número de genes marcadores 3. Optimization of the number of marker genes

[0156] Para la validación cruzada se usó el método de “dejar uno fuera” a fin de optimizar los genes discriminantes. Un clasificador practicó con 97 ejemplos de un conjunto de genes marcadores extraído de la lista de candidatos por orden jerárquico y luego predijo la categoría de la muestra restante. Ese mismo procedimiento se repitió para cada uno de los ejemplos de la reserva y se contó el número de casos en que la predicción del que se había dejado fuera resultó errónea. [0156] For the cross-validation method of "leaving one out" was used in order to optimize the discriminant genes. One classifier practiced 97 examples of a set of marker genes extracted from the list of candidates in hierarchical order and then predicted the category of the remaining sample. That same procedure was repeated for each of the examples in the reservation and the number of cases in which the prediction of the one left out was erroneous was counted.

[0157] La evaluación del rendimiento de la validación cruzada de dejar uno fuera que se acaba de mencionar se repitió añadiendo sucesivamente más genes marcadores de la lista de candidatos. El rendimiento como función del número de genes marcadores se muestra en la FIG. 6. Las tasas de error para el tipo 1 y el tipo 2 variaron con el número de genes marcadores usados, pero las dos fueron mínimas mientras el número de genes marcadores se mantuvo en el orden de 550. Por lo tanto, estimamos que este conjunto de 550 genes debe considerarse el conjunto óptimo de genes marcadores que pueden usarse para clasificar los tumores de cáncer de mama en grupo “ER-negativo” y grupo “ER-positivo”. La FIG. 7 muestra la clasificación de pacientes en ER(+) [0157] The evaluation of the cross-validation performance of leaving one out just mentioned was repeated by successively adding more marker genes from the candidate list. Performance as a function of the number of marker genes is shown in FIG. 6. The error rates for type 1 and type 2 varied with the number of marker genes used, but both were minimal while the number of marker genes remained in the order of 550. Therefore, we estimate that this set out of 550 genes, the optimal set of marker genes that can be used to classify breast cancer tumors into the "ER-negative" group and "ER-positive" group should be considered. FIG. 7 shows the classification of patients in ER (+)

o ER(-) basándose en este conjunto de 550 marcadores. La FIG. 8 muestra la correlación de cada tumor con cada plantilla ER-negativa frente a la correlación de cada tumor con la plantilla ER-positiva. or ER (-) based on this set of 550 markers. FIG. 8 shows the correlation of each tumor with each ER-negative template versus the correlation of each tumor with the ER-positive template.

4. Clasificación basada en genes marcadores 4. Classification based on marker genes

[0158] En la tercera etapa se calculó un conjunto de parámetros clasificadores para cada tipo de conjunto de datos de prácticas basándose en cualquiera de los métodos de ordenación de más arriba. Se generó una plantilla para el grupo ER(-) (ž1) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Igualmente, se generó una plantilla para el grupo ER(+) (llamada ž2) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Se definieron dos parámetros clasificadores (P1 y P12) basándose en la correlación o en la distancia. P1 mide la semejanza entre una muestra y la plantilla ER(-) ž1 en ese grupo de genes seleccionado. P2 mide la semejanza entre una muestra y la plantilla ER(+) ž2 en ese grupo de genes seleccionado. La correlación Pi se define como: [0158] In the third stage, a set of classifier parameters for each type of practice data set was calculated based on any of the above sorting methods. A template for the ER group (-) (ž1) was generated using the weighted mean error of the logarithmic quotient of the selected gene group. Likewise, a template for the ER (+) group (called ž2) was generated using the weighted mean error of the logarithmic quotient of the selected gene group. Two classifier parameters (P1 and P12) were defined based on correlation or distance. P1 measures the similarity between a sample and the ER (-) template ž1 in that selected gene group. P2 measures the similarity between a sample and the ER (+) template ž2 in that selected gene group. The Pi correlation is defined as:

imagen1 Ecuación (1) image 1 Equation (1)

[0159] Se usó un método de "dejar uno fuera" para la validación cruzada basándose en los genes marcadores. En este método se reservó una muestra para la validación cruzada cada vez que actuaba un clasificador de prácticas. De un conjunto de 550 genes marcadores óptimos, el clasificador practicó con 97 de las 98 muestras y luego predijo la categoría de la muestra restante. Este procedimiento se repitió con cada una de las 98 pacientes. Se contó el número de casos en los que la predicción resultó errónea o acertada. Se determinó además que con subconjuntos de sólo -50 del total de 2.460 genes se pueden clasificar tumores en ER(+) o ER(-) casi igual de bien que usando el conjunto total. [0159] A "leave one out" method was used for cross-validation based on marker genes. In this method, a sample was reserved for cross-validation each time a practice classifier acted. From a set of 550 optimal marker genes, the classifier practiced with 97 of the 98 samples and then predicted the category of the remaining sample. This procedure was repeated with each of the 98 patients. The number of cases in which the prediction was wrong or correct was counted. It was also determined that with subsets of only -50 of the total 2,460 genes tumors can be classified into ER (+) or ER (-) almost as well as using the total set.

[0160] En un pequeño número de casos hubo discordancia entre la clasificación mediante el conjunto de los 550 marcadores y la clasificación clínica. Al comparar el cociente logarítmico de expresión de ESR1 medida por biochip con la decisión binaria clínica (negativa o positiva) de la categoría de ER para cada paciente, se vio que la expresión medida concordaba con la categoría cualitativa de mediciones clínicas (mezcla de dos métodos) para la mayoría de tumores. Por ejemplo, dos pacientes a las que se diagnosticó clínicamente como ER(+) mostraron en realidad una baja expresión de ESR1 a partir de las mediciones con biochip y se las clasificó como ER negativas según los 550 genes marcadores. Asimismo, 3 pacientes a las que se diagnosticó clínicamente como ER(-) mostraron una alta expresión de ESR1 a partir de las mediciones con biochip y se las clasificó como ER(+) según los mismos 550 genes marcadores. Estadísticamente, sin embargo, la expresión de genes de ESR1 medida con biochip se ajusta más a los patrones dominantes que a la categoría de ER determinada clínicamente. [0160] In a small number of cases there was disagreement between the classification using the 550 markers and the clinical classification. When comparing the logarithmic expression ratio of ESR1 measured by biochip with the clinical binary decision (negative or positive) of the ER category for each patient, it was seen that the measured expression matched the qualitative category of clinical measurements (mixture of two methods ) for most tumors. For example, two patients who were clinically diagnosed as ER (+) actually showed low ESR1 expression from biochip measurements and were classified as negative ER according to the 550 marker genes. Likewise, 3 patients who were clinically diagnosed as ER (-) showed high ESR1 expression from biochip measurements and were classified as ER (+) according to the same 550 marker genes. Statistically, however, the expression of ESR1 genes measured with biochip conforms more to the dominant patterns than to the clinically determined ER category.

Ejemplo 3: Identificación de marcadores genéticos que distinguen entre tumores de BRCA1 y tumores esporádicos en pacientes de receptor de estrógeno (-) Example 3: Identification of genetic markers that distinguish between BRCA1 tumors and sporadic tumors in estrogen receptor patients (-)

[0161] La mutación del BRCA1 es una de las principales categorías clínicas en los tumores del cáncer de mama. Se determinó que, de los tumores de 38 pacientes del grupo ER(-), 17 mostraban la mutación del BRCA1, mientras que 21 eran tumores esporádicos. Por consiguiente, se desarrolló un método que hizo posible la diferenciación de los tumores de la mutación del BRCA1 a partir de los 21 tumores esporádicos del grupo ER(-). [0161] The BRCA1 mutation is one of the main clinical categories in breast cancer tumors. It was determined that, of the tumors of 38 patients of the ER (-) group, 17 showed the BRCA1 mutation, while 21 were sporadic tumors. Therefore, a method was developed that made possible the differentiation of tumors from the BRCA1 mutation from the 21 sporadic tumors of the ER (-) group.

1. Selección de genes discriminantes candidatos 1. Selection of candidate discriminant genes

[0162] En el primer paso, se identificó una serie de genes candidatos basándose en los patrones de expresión de genes de los dichos 38 ejemplos. En primer lugar calculamos la correlación entre el número de categoría de mutación de BRCA1 y el cociente de expresión en la totalidad de los 38 ejemplos para cada gen por separado mediante la Ecuación (2). La distribución de los coeficientes de correlación se representa como un histograma definido por línea continua en la FIG. 9A. Se observó que, aunque la mayoría de los genes no se hallaban en correlación con la categoría de la mutación de BRCA1, un pequeño grupo de los mismos sí se correspondían a niveles significativos. Es probable que los genes con mayores coeficientes de correlación sirvan como indicadores para distinguir a las portadoras de tumores de la mutación de BRCA1 de las de tumores esporádicos dentro del grupo ER(-). [0162] In the first step, a series of candidate genes were identified based on the gene expression patterns of said 38 examples. First we calculate the correlation between the BRCA1 mutation category number and the expression quotient in all 38 examples for each gene separately using Equation (2). The distribution of correlation coefficients is represented as a histogram defined by continuous line in FIG. 9A. It was observed that, although most of the genes were not correlated with the category of the BRCA1 mutation, a small group of them did correspond to significant levels. It is likely that genes with higher correlation coefficients serve as indicators to distinguish tumor carriers from the BRCA1 mutation from those of sporadic tumors within the ER (-) group.

[0163] A fin de evaluar la relevancia de cada coeficiente de correlación frente a una hipótesis nula de que dicho coeficiente de correlación pudiera hallarse de manera aleatoria, se usó una técnica de remuestreo para generar datos Monte-Carlo que aleatorizaran la asociación entre los datos de expresión de genes de las muestras y sus categorías. Se generaron 10.000 de dichos ensayos Monte-Carlo como control con el fin de estimar la relevancia de los genes marcadores como grupo. Se aplicó un umbral de 0,35 en la amplitud absoluta de coeficientes de correlación (o correlación o anticorrelación) tanto a los datos reales como a los datos Monte-Carlo. Siguiendo este método, se hallaron 430 genes que reunían estas condiciones para los datos experimentales. El valor-p de la relevancia, medido contra los 10.000 ensayos Monte-Carlo, es aproximadamente 0,0048 (FIG. 9B). Esto es, la probabilidad de que este conjunto de 430 genes contenga información útil sobre tumores de tipo BRCA1 frente a tumores esporádicos es de más del 99%. [0163] In order to assess the relevance of each correlation coefficient against a null hypothesis that said correlation coefficient could be found randomly, a resampling technique was used to generate Monte-Carlo data that would randomize the association between the data of gene expression of the samples and their categories. 10,000 of these Monte-Carlo trials were generated as a control in order to estimate the relevance of the marker genes as a group. A threshold of 0.35 was applied in the absolute amplitude of correlation coefficients (or correlation or anticorrelation) to both real data and Monte-Carlo data. Following this method, 430 genes were found that met these conditions for experimental data. The p-value of the relevance, measured against the 10,000 Monte-Carlo trials, is approximately 0.0048 (FIG. 9B). That is, the probability that this set of 430 genes contains useful information about BRCA1 type tumors against sporadic tumors is more than 99%.

2. Ordenación jerárquica de genes discriminantes candidatos 2. Hierarchical ordering of discriminant candidate genes

[0164] En el segundo paso, se ordenaron jerárquicamente los genes de la lista de candidatos basándose en la relevancia de cada gen como gen discriminador. Aquí se usó la amplitud absoluta de coeficientes de correlación para ordenar jerárquicamente los genes marcadores. [0164] In the second step, the candidate list genes were ordered hierarchically based on the relevance of each gene as a discriminant gene. Here the absolute amplitude of correlation coefficients was used to hierarchically order the marker genes.

[0165] En el tercer paso, se usó para la clasificación un subconjunto de genes de los puestos más altos de la lista jerarquizada. Se definió una plantilla del grupo BRCA1 (llamada ž1) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Igualmente, se definió una plantilla del grupo noBRCA1 (llamada ž2) mediante la media ponderada de error del cociente logarítmico del grupo de genes seleccionado. Se definieron dos parámetros clasificadores (P1 y P2) basándose o en la correlación o en la distancia. P1 mide la semejanza entre una muestra y y la plantilla de BRCA1 ž1 en la totalidad del grupo de genes seleccionado. P2 mide la semejanza entre una muestra y y la plantilla de no-BRCA1 ž2 en la totalidad del grupo de genes seleccionado. Para la correlación, P1 y P2 se definieron de la misma forma que en la Ecuación (4). [0165] In the third step, a subset of genes from the highest positions of the hierarchical list was used for classification. A template of the BRCA1 group (called ž1) was defined by the weighted mean error of the logarithmic quotient of the selected gene group. Likewise, a template of group noBRCA1 (called ž2) was defined by the weighted mean error of the logarithmic quotient of the selected gene group. Two classifier parameters (P1 and P2) were defined based on either correlation or distance. P1 measures the similarity between a sample and and the BRCA1 template ž1 in the entire selected gene group. P2 measures the similarity between a sample and the non-BRCA1 ž2 template in the entire selected gene group. For the correlation, P1 and P2 were defined in the same way as in Equation (4).

[0166] Se usó el método de dejar uno fuera para validación cruzada a fin de optimizar los genes discriminantes como se explica en el Ejemplo 2. Para un conjunto de genes marcadores de la lista jerárquica de candidatos, el clasificador practicó con 37 ejemplos y predijo el restante. El procedimiento se repitió para todas las muestras de la reserva y se contó el número de casos en los que la predicción resultó errónea o acertada. [0166] The method of leaving one out for cross validation was used to optimize discriminant genes as explained in Example 2. For a set of marker genes from the hierarchical list of candidates, the classifier practiced with 37 examples and predicted the remaining. The procedure was repeated for all the samples in the reserve and the number of cases in which the prediction proved erroneous or accurate was counted.

[0167] Para determinar el número de marcadores que constituyen un subconjunto viable, se repitió la ejecución de la anterior validación cruzada añadiendo acumulativamente más genes marcadores de la lista de candidatos. La ejecución como función del número de genes marcadores se muestra en la FIG. 10. Las tasas de error para el tipo 1 (falso negativo) y el tipo 2 (falso positivo) (Bendat & Piersol, RANDOM DATA ANALYSIS AND MEASUREMENT PROCEDURES, 2D ED., Wiley Interscience, p. 89) alcanzaron niveles óptimos cuando el número de los genes marcadores fue de aproximadamente 100. Por consiguiente, se considera que un conjunto de unos 100 genes es el conjunto óptimo de genes marcadores que pueden usarse para clasificar tumores en el grupo ER(-) tanto en tumores relacionados con BRCA1 como en tumores esporádicos. [0167] To determine the number of markers that constitute a viable subset, the execution of the previous cross-validation was repeated by cumulatively adding more marker genes from the candidate list. Execution as a function of the number of marker genes is shown in FIG. 10. Error rates for type 1 (false negative) and type 2 (false positive) (Bendat & Piersol, RANDOM DATA ANALYSIS AND MEASUREMENT PROCEDURES, 2D ED., Wiley Interscience, p. 89) reached optimal levels when the number of marker genes was approximately 100. Therefore, a set of about 100 genes is considered to be the optimal set of marker genes that can be used to classify tumors in the ER group (-) in both BRCA1-related tumors and in sporadic tumors

[0168] Los resultados de clasificación usando los 100 genes óptimos se muestran en las FIGS. 11A y 11B. Como se ve en la FIG 11A, los patrones de corregulación de las pacientes esporádicas difieren de los de las pacientes BRCA1 sobre todo en la amplitud de regulación. Sólo se clasificó un tumor esporádico en el grupo de BRCA1. Las pacientes del grupo esporádico no son necesariamente negativas a la mutación de BRCA1; sin embargo, se estima que sólo un 5% aproximadamente de tumores esporádicos son portadores reales de mutación de BRCA1. [0168] The classification results using the 100 optimal genes are shown in FIGS. 11A and 11B. As seen in FIG 11A, the corregulation patterns of sporadic patients differ from those of BRCA1 patients, especially in the extent of regulation. Only one sporadic tumor was classified in the BRCA1 group. Sporadic group patients are not necessarily negative for the BRCA1 mutation; however, it is estimated that only approximately 5% of sporadic tumors are real carriers of BRCA1 mutation.

Ejemplo 4: Identificación de marcadores genéticos que distinguen las pacientes con tumor esporádico con >5 años de supervivencia frente a las de <5 años de supervivencia Example 4: Identification of genetic markers that distinguish patients with sporadic tumor with> 5 years survival versus those with <5 years survival

[0169] Se usaron 78 tumores de pacientes de cáncer de mama para explorar predictores de pronóstico de datos de expresión de genes. De los 78 ejemplos de este grupo de cáncer de mama esporádico, se tenía constancia clínica de que 44 muestras no habían tenido metástasis distante dentro de los 5 años siguientes al diagnóstico inicial (“grupo sin metástasis distante”) y de que 34 muestras habían tenido metástasis distante dentro de los 5 años siguientes al diagnóstico inicial (“grupo con metástasis distante”). Se identificó un grupo de 231 marcadores, y dentro de él un grupo óptimo de 70 marcadores, que permitía la diferenciación entre los dos grupos de pacientes mencionados. [0169] 78 tumors of breast cancer patients were used to explore predictors of gene expression data prognosis. Of the 78 examples of this group of sporadic breast cancer, there was clinical evidence that 44 samples had not had distant metastases within 5 years after the initial diagnosis (“group without distant metastases”) and that 34 samples had had distant metastasis within 5 years after the initial diagnosis ("group with distant metastasis"). A group of 231 markers was identified, and within it an optimal group of 70 markers, which allowed differentiation between the two groups of patients mentioned.

1. Selección de genes discriminantes candidatos 1. Selection of candidate discriminant genes

[0170] En el primer paso, se identificó un grupo de genes discriminantes candidatos basándose en los datos de expresión de genes de las dichas 78 muestras. Se calculó la correlación entre el número de categoría de pronóstico (metástasis distante frente a metástasis no distante) y el cociente de expresión logarítmica en todas las muestras para cada gen por separado mediante la Ecuación (2). La distribución de los coeficientes de correlación se representa con línea continua en la FIG. 12A. La FIG. 12A muestra también el resultado de un ensayo Monte-Carlo en línea discontinua. Se observó que aunque la mayoría de genes no están en correlación con las categorías de pronóstico, un pequeño grupo de genes sí lo está. Es probable que genes con mayores coeficientes de correlación sean más útiles como indicadores del pronóstico de interés – grupo de metástasis distante y grupo de metástasis no distante. [0170] In the first step, a group of candidate discriminant genes was identified based on the gene expression data of said 78 samples. The correlation between the prognostic category number (distant metastasis versus non-distant metastasis) and the log expression ratio in all samples for each gene were calculated separately using Equation (2). The distribution of correlation coefficients is represented by a continuous line in FIG. 12A. FIG. 12A also shows the result of a Monte-Carlo discontinuous line test. It was observed that although the majority of genes are not correlated with the prognosis categories, a small group of genes is. It is likely that genes with higher correlation coefficients are more useful as indicators of the prognosis of interest - distant metastases group and non-distant metastases group.

[0171] A fin de evaluar la relevancia de cada coeficiente de correlación frente a una hipótesis nula de que dicha correlación pueda hallarse de manera aleatoria, se usó una técnica de remuestreo para generar datos a partir de [0171] In order to assess the relevance of each correlation coefficient against a null hypothesis that such correlation can be found randomly, a resampling technique was used to generate data from

10.000 ensayos Monte-Carlo como control (FIG. 12B). Luego se seleccionaron genes que o tenían un coeficiente de correlación mayor de 0,3 ("genes correlacionados") o menor de -0.3 ("genes anti-correlacionados"). Ese mismo criterio de selección se aplicó tanto a los datos reales como a los datos Monte-Carlo. Por medio de esta comparación se identificaron 231 marcadores que cumplían con ese requisito. La probabilidad de que dicho conjunto de genes para diferenciar pacientes del grupo de metástasis distante del grupo de metástasis no distante sea elegido por fluctuación aleatoria es aproximadamente de 0,003. 10,000 Monte-Carlo trials as a control (FIG. 12B). Then genes were selected that had a correlation coefficient greater than 0.3 ("correlated genes") or less than -0.3 ("anti-correlated genes"). That same selection criterion was applied to both real data and Monte-Carlo data. Through this comparison, 231 markers were identified that met that requirement. The probability that said set of genes to differentiate patients from the distant metastasis group from the non-distant metastasis group is chosen by random fluctuation is approximately 0.003.

2. 2.
Ordenación jerárquica de genes discriminantes candidatos Hierarchical ordering of discriminant candidate genes

[0172] En el segundo paso, se ordenaron los genes de la lista de candidatos basándose en la relevancia de cada gen como gen discriminante. Concretamente, se usó una métrica similar a una estadística “Fisher”, definida en la Ecuación (3), para la ordenación jerárquica. El nivel de fiabilidad de cada gen en la lista de candidatos se estimó frente a una hipótesis nula derivada del conjunto de datos reales mediante la técnica de remuestreo. Los genes de la lista de candidatos también pueden ordenarse por la amplitud de coeficientes de correlación. [0172] In the second step, the candidate list genes were ordered based on the relevance of each gene as a discriminant gene. Specifically, a metric similar to a “Fisher” statistic, defined in Equation (3), was used for hierarchical ordering. The level of reliability of each gene in the list of candidates was estimated against a null hypothesis derived from the set of real data using the resampling technique. Candidate list genes can also be sorted by the amplitude of correlation coefficients.

3. 3.
Optimización de genes discriminantes Optimization of discriminant genes

[0173] En el tercer paso, se seleccionó un subconjunto de 5 genes de los puestos más altos de esta lista jerarquizada para usarlos como genes discriminantes en la clasificación de 78 tumores como “grupo de metástasis distante” o “grupo de metástasis no distante”. Para la validación cruzada se usó el método de dejar uno fuera. Concretamente, 77 muestras definieron un clasificador basado en el conjunto de genes discriminantes seleccionados, los cuales se usaron para predecir la muestra restante. Se repitió este procedimiento hasta que se predijo cada una de las 78 muestras. Se contó el número de casos en los que las predicciones resultaron correctas o incorrectas. El rendimiento del clasificador se midió por las tasas de error del tipo 1 y del tipo 2 para este conjunto de genes seleccionado. [0173] In the third step, a subset of 5 genes from the highest positions of this hierarchical list was selected for use as discriminant genes in the classification of 78 tumors as a "distant metastasis group" or "non-distant metastasis group" . The method of leaving one out was used for cross validation. Specifically, 77 samples defined a classifier based on the set of selected discriminant genes, which were used to predict the remaining sample. This procedure was repeated until each of the 78 samples was predicted. The number of cases in which the predictions were correct or incorrect was counted. The performance of the classifier was measured by the error rates of type 1 and type 2 for this selected gene set.

[0174] Se repitió el anterior procedimiento de evaluación del rendimiento añadiendo cada vez 5 genes marcadores más de los puestos más altos de la lista jerarquizada, hasta que se hubo usado el total de los 231 genes. Como se ve en la FIG. 13, el número de predicciones erróneas de errores de tipo 2 y tipo 2 cambia radicalmente según el número de genes marcadores empleados. La tasa combinada de error bajó al mínimo cuando no se usaron nunca los 70 genes de los puestos más altos de nuestra lista de candidatos. Por lo tanto, este conjunto de 70 genes es el conjunto de genes marcadores óptimo y preferido, que sirve para la clasificación de pacientes con tumores esporádicos en grupo de metástasis distante y grupo de metástasis no distante. Un número mayor o menor de marcadores también actúa como predictor, pero es menos eficiente, bien por las tasas de error más altas o bien por la introducción de ruido estadístico. [0174] The previous performance evaluation procedure was repeated adding 5 more marker genes each time to the highest positions in the hierarchical list, until the total of 231 genes had been used. As seen in FIG. 13, the number of erroneous predictions of type 2 and type 2 errors changes radically according to the number of marker genes used. The combined error rate was reduced to a minimum when the 70 genes of the highest positions on our list of candidates were never used. Therefore, this set of 70 genes is the set of optimal and preferred marker genes, which is used for the classification of patients with sporadic tumors in a group of distant metastases and a group of non-distant metastases. A larger or smaller number of markers also acts as a predictor, but is less efficient, either because of higher error rates or because of the introduction of statistical noise.

4. Curvas de probabilidad de recaída 4. Relapse probability curves

[0175] Se predijo la clasificación de pronóstico de 78 pacientes con tumores esporádicos de cáncer de mama en dos subgrupos diferenciados basándose en su expresión de 70 genes marcadores óptimos (FIGS. 14 y 15). [0175] The prognostic classification of 78 patients with sporadic breast cancer tumors in two differentiated subgroups was predicted based on their expression of 70 optimal marker genes (FIGS. 14 and 15).

[0176] Para evaluar la clasificación de pronóstico de pacientes esporádicas, se predijo el resultado de cada paciente por medio de un clasificador que practicó con los 77 pacientes restantes basándose en los 70 genes marcadores óptimos. En la FIG. 16 se muestra en diagrama la probabilidad de las metástasis distantes como función de tiempo desde el diagnóstico inicial para los dos grupos previstos. Hay una diferencia significativa entre estas dos curvas de recaída. Mediante la prueba χ2 (S-PLUS 2000 Guide to Statistics, vol. 2, MathSoft, p. 44), se estimó el valor-p en ~10-9. También se comparó la probabilidad de metástasis distante como función de tiempo desde el diagnóstico inicial entre individuos con ER(+) y ER(-) (FIG. 17), individuos con PR(+) y PR(-) (FIG. 18) y entre individuos con diferentes grados de tumor (FIGS. 19A, 19B). En comparación, los valores-p para las diferencias entre dos grupos de pronóstico basadas en datos clínicos son mucho menos significativas que las que se basan en datos de expresión de genes, que van de 10-3 a 1. [0176] To assess the prognostic classification of sporadic patients, the outcome of each patient was predicted by means of a classifier that practiced with the remaining 77 patients based on the 70 optimal marker genes. In FIG. 16 the probability of distant metastases as a function of time since the initial diagnosis for the two planned groups is shown in the diagram. There is a significant difference between these two relapse curves. Using the χ2 test (S-PLUS 2000 Guide to Statistics, vol. 2, MathSoft, p. 44), the p-value was estimated at ~ 10-9. The probability of distant metastasis was also compared as a function of time since the initial diagnosis between individuals with ER (+) and ER (-) (FIG. 17), individuals with PR (+) and PR (-) (FIG. 18) and among individuals with different degrees of tumor (FIGS. 19A, 19B). In comparison, p-values for the differences between two prognostic groups based on clinical data are much less significant than those based on gene expression data, ranging from 10-3 to 1.

[0177] Para fijar los parámetros de la probabilidad de recaída como función de tiempo desde el diagnóstico inicial, se ajustó la curva a un tipo de modelo de supervivencia “normal”: [0177] To set the relapse probability parameters as a function of time since the initial diagnosis, the curve was adjusted to a type of “normal” survival model:

imagen1 (4) image 1 (4)

Para un α =1 fijado, hallamos que τ =125 meses para las pacientes del grupo de metástasis no distante y τ = 36 For a fixed α = 1, we found that τ = 125 months for patients in the non-distant metastasis group and τ = 36

5 meses para las pacientes del grupo de metástasis distante. Usando grados de tumor, hallamos que τ = 100 meses para las pacientes con grados de tumor 1 y 2 y τ = 60 para las pacientes con grado de tumor 3. En la práctica clínica se admite que los grados de tumor son el mejor predictor de pronóstico de que se dispone. No obstante, la diferencia entre los dos grupos de pronóstico clasificados sobre la base de los 70 genes marcadores es mucho más significativa que la de los grupos clasificados mediante la mejor información clínica disponible. 5 months for patients in the distant metastasis group. Using tumor grades, we found that τ = 100 months for patients with tumor grades 1 and 2 and τ = 60 for patients with tumor grade 3. In clinical practice it is recognized that tumor grades are the best predictor of Prognosis available. However, the difference between the two prognostic groups classified on the basis of the 70 marker genes is much more significant than that of the groups classified by the best available clinical information.

10 5. Predicción de pronóstico para 19 tumores esporádicos independientes 10 5. Prognosis prediction for 19 independent sporadic tumors

[0178] Para confirmar el método de clasificación de pronóstico propuesto y para asegurar la reproducibilidad, robustez y potencia de predicción de los 70 genes marcadores de pronóstico, se aplicó el mismo clasificador a 19 muestras tumorales independientes tomadas de pacientes con cáncer de mama esporádico, preparadas por separado en el Instituto de Cáncer de los Países Bajos (NKI). Se usó la misma reserve de referencia. [0178] To confirm the proposed prognostic classification method and to ensure the reproducibility, robustness and prediction power of the 70 prognostic marker genes, the same classifier was applied to 19 independent tumor samples taken from patients with sporadic breast cancer, prepared separately at the Netherlands Cancer Institute (NKI). The same reference reserve was used.

15 [0179] Los resultados de la clasificación de 19 tumores esporádicos independientes se muestran en la Figura [0179] The results of the classification of 19 independent sporadic tumors are shown in Figure

20. La FIG. 20A muestra el cociente logarítmico de regulación de expresión de esos mismos 70 genes marcadores óptimos. Basándonos en nuestro modelo clasificador, esperábamos la clasificación errónea de 19*(6+7)/78 = 3,2 tumores. En consecuencia, (1+3) = 4 de 19 tumores se clasificaron erróneamente. 20. FIG. 20A shows the logarithmic expression regulation ratio of those same 70 optimal marker genes. Based on our classification model, we expected the wrong classification of 19 * (6 + 7) / 78 = 3.2 tumors. Consequently, (1 + 3) = 4 of 19 tumors were misclassified.

6. Parámetros clinicos como grupo frente a datos de biochip - Resultados de la regresión logística 6. Clinical parameters as a group versus biochip data - Logistic regression results

20 [0180] En la sección anterior, la potencia de predicción de cada parámetro clínico por separado se comparó con la de los datos de expresión. Sin embargo, tiene más sentido combinar todos los parámetros clínicos como grupo y luego compararlos con los datos de expresión. Para ello se requiere una modelización multivariante; el método elegido fue la regresión logística. Este enfoque demuestra también la mejora que aporta el método de biochip a los resultados de los datos clínicos. [0180] In the previous section, the predictive power of each clinical parameter separately was compared with that of the expression data. However, it makes more sense to combine all clinical parameters as a group and then compare them with the expression data. This requires a multivariate modeling; The method chosen was logistic regression. This approach also demonstrates the improvement that the biochip method brings to the results of the clinical data.

25 [0181] Los parámetros clínicos usados para la modelización multivariante fueron: (1) grado de tumor; (2) categoría de ER; (3) presencia o ausencia del receptor progestativo (PR); (4) tamaño del tumor; (5) edad de la paciente, y (6) presencia o ausencia de angionvasión. Para los datos de biochip se usaron dos coeficientes de correlación. Uno es la correlación con la media del grupo de buen pronóstico (C1) y el otro es la correlación con la media del grupo de pronóstico deficiente (C2). Cuando se calculan los coeficientes de correlación para una [0181] The clinical parameters used for multivariate modeling were: (1) tumor grade; (2) ER category; (3) presence or absence of the progestative receptor (PR); (4) tumor size; (5) age of the patient, and (6) presence or absence of angionvasion. For the biochip data two correlation coefficients were used. One is the correlation with the mean of the good prognosis group (C1) and the other is the correlation with the mean of the poor prognosis group (C2). When the correlation coefficients for a

30 paciente dada, a dicha paciente se la excluye de cualquiera de las dos medias. 30 given patient, said patient is excluded from either of the two means.

[0182] La regresión logística optimiza el coeficiente de cada parámetro de entrada para predecir óptimamente el resultado de cada paciente. Una manera de juzgar la potencia de predicción de cada parámetro de entrada es cuánta desviación (parecida a ji-cuadrado en la regresión lineal, véase, por ejemplo, Hasomer & Lemeshow, APPLIED LOGISTIC REGRESSION, John Wiley & Sons, (2000)) es causante el parámetro. El mejor predictor [0182] Logistic regression optimizes the coefficient of each input parameter to optimally predict the outcome of each patient. One way to judge the prediction power of each input parameter is how much deviation (similar to chi-square in linear regression, see, for example, Hasomer & Lemeshow, APPLIED LOGISTIC REGRESSION, John Wiley & Sons, (2000)) is causing the parameter. The best predictor

35 debería ser el causante de la mayoría de la desviación. Para calcular con precisión la potencia de predicción, se modeló cada parámetro por separado. Los parámetros del biochip explican la mayoría de la desviación y por consiguiente son predictores potentes. 35 should be the cause of most of the deviation. To accurately calculate the prediction power, each parameter was modeled separately. The biochip parameters explain most of the deviation and therefore are powerful predictors.

[0183] A continuación los parámetros clínicos, y los dos parámetros del biochip, se monitorizaron como grupo. La desviación total explicada por los seis parámetros clínicos fue de [0183] Next the clinical parameters, and the two parameters of the biochip, were monitored as a group. The total deviation explained by the six clinical parameters was of

40 31,5 y la desviación total explicada por los parámetros del biochip fue de 39,4. No obstante, cuando se modelizaron primero los datos clínicos y luego se añadieron los dos parámetros del biochip, la desviación final fue causante del 57,0. 40 31.5 and the total deviation explained by the biochip parameters was 39.4. However, when the clinical data were first modeled and then the two biochip parameters were added, the final deviation was the cause of 57.0.

[0184] La regresión logística computa la probabilidad de que una paciente pertenezca al grupo de buen pronóstico o al del deficiente. Las FIGS. 21A y 21B muestran la sensibilidad frente a la (1-especificidad). Se 45 generaron diagramas variando el umbral en la probabilidad prevista del modelo. La curva que atraviesa la esquina superior izquierda es la mejor sensibilidad (alta sensibilidad con alta especificidad). El biochip superó los datos clínicos por un amplio margen. Por ejemplo, a una sensibilidad establecida de alrededor del 80%, la especificidad fue de ~80% de los datos del biochip y de ~65% de los datos clínicos para el grupo de buen pronóstico. Para el grupo de pronóstico deficiente, las especificidades correspondientes fueron ~80% y ~70%, 50 también a una sensibilidad establecida del 80%. La combinación de los datos del biochip con los datos clínicos mejoró los resultados. El resultado se puede mostrar también como la tasa total de error como función del umbral [0184] Logistic regression computes the probability that a patient belongs to the group with a good prognosis or to the deficient group. FIGS. 21A and 21B show sensitivity to (1-specificity). Diagrams were generated by varying the threshold in the expected probability of the model. The curve that crosses the upper left corner is the best sensitivity (high sensitivity with high specificity). The biochip exceeded clinical data by a wide margin. For example, at an established sensitivity of about 80%, the specificity was ~ 80% of the biochip data and ~ 65% of the clinical data for the good prognosis group. For the poor prognosis group, the corresponding specificities were ~ 80% and ~ 70%, 50 also at an established sensitivity of 80%. The combination of the biochip data with the clinical data improved the results. The result can also be shown as the total error rate as a function of the threshold

en la FIG. 21C. En todos los umbrales posibles, la tasa de error del biochip fue siempre más pequeña que la de los datos clínicos. Al añadir los datos del biochip a los datos clínicos, la tasa de error se reduce más aún, como se puede ver en la Figura 21C. in FIG. 21C. At all possible thresholds, the error rate of the biochip was always smaller than that of the clinical data. By adding the biochip data to the clinical data, the error rate is further reduced, as can be seen in Figure 21C.

[0185] Se pueden crear tablas de cocientes impares a partir de la predicción de la regresión logística. La [0185] Odd quotient tables can be created from the logistic regression prediction. The

5 probabilidad de que una paciente esté en el grupo de buen pronóstico se calcula mediante la regresión logística basándose en diferentes combinaciones de parámetros de entrada (clínicos y/o de biochip). Las pacientes se dividen en los cuatro grupos siguientes según la predicción el resultado real: (1) predicción buena y en realidad buena; (2) predicción buena pero en realidad deficiente; (3) predicción deficiente pero en realidad buena y (4) predicción deficiente y en realidad deficiente. Los grupos (1) & (4) representan predicciones correctas, mientras The probability that a patient is in the group with a good prognosis is calculated by logistic regression based on different combinations of input parameters (clinical and / or biochip). The patients are divided into the following four groups according to the prediction the actual result: (1) good and actually good prediction; (2) good but really poor prediction; (3) poor but really good prediction and (4) poor and actually poor prediction. Groups (1) & (4) represent correct predictions, while

10 que los grupos (2) & (3) representan predicciones erróneas. La división para la predicción se establece en una probabilidad del 50%, aunque se pueden usar otros umbrales. Los resultados se enumeran en la Tabla 7. En la tabla 7 se ve claramente que el perfil de biochip (Tabla 7.3 & 7.10) supera a cualquier dato clínico simple (Tabla 7.4-7.9) y la combinación de los datos clínicos (Tabla 7.2). La añadidura del perfil de biochip, junto con los datos clínicos, da los mejores resultados (Tabla 7.1). 10 that groups (2) & (3) represent erroneous predictions. The division for prediction is set to a 50% probability, although other thresholds can be used. The results are listed in Table 7. Table 7 clearly shows that the biochip profile (Table 7.3 & 7.10) exceeds any simple clinical data (Table 7.4-7.9) and the combination of clinical data (Table 7.2) . The addition of the biochip profile, together with the clinical data, gives the best results (Table 7.1).

15 [0186] Para el perfil de biochip se puede hacer también una tabla parecida (Tabla 7.11) sin usar la regresión logística. En este caso, la predicción se basó simplemente en C1-C2 (mayor que 0 significa buen pronóstico, menor que 0 significa deficiente [0186] For the biochip profile, a similar table can also be made (Table 7.11) without using logistic regression. In this case, the prediction was simply based on C1-C2 (greater than 0 means good prognosis, less than 0 means poor

. Ejemplo 5. Concepto de biochip a efectos diagnósticos. . Example 5. Concept of biochip for diagnostic purposes.

Tabla 7.1 Predicción por clínico+biochip Table 7.1 Clinical prediction + biochip

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
39 5 39 5

en realidad deficiente actually deficient
4 30 4 30

Tabla 7.2 Predicción solo por clínico Table 7.2 Prediction only by clinician

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
34 10 3. 4 10

en realidad deficiente actually deficient
12 22 12 22

Tabla 7.3 Predicción por biochip Table 7.3 Biochip Prediction

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
39 5 39 5

en realidad deficiente actually deficient
10 24 10 24

Tabla 7.4 Predicción por grado Table 7.4 Prediction by degree

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
23 21 2. 3 twenty-one

en realidad deficiente actually deficient
5 29 5 29

Tabla 7.5 Predicción por ER Table 7.5 Prediction by ER

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
35 9 35 9

en realidad deficiente actually deficient
21 13 twenty-one 13

Tabla 7.6 Predicción por PR Table 7.6 PR prediction

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
35 9 35 9

Tabla 7.1 Predicción por clínico+biochip Table 7.1 Clinical prediction + biochip

Predicción buena Good prediction
Predicción buena Good prediction

en realidad deficiente actually deficient
18 16 18 16

Tabla 7.7 Predicción por tamaño Table 7.7 Size prediction

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
35 9 35 9

en realidad deficiente actually deficient
13 21 13 twenty-one

Tabla 7.8 Predicción por edad Table 7.8 Age prediction

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
33 11 33 eleven

en realidad deficiente actually deficient
15 19 fifteen 19

Tabla 7.9 Predicción por angioinvasión Table 7.9 Prediction by angioinvasion

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
37 7 37 7

en realidad deficiente actually deficient
19 15 19 fifteen

Tabla 7.10 Predicción por dC (C1-C2) Table 7.10 Prediction by dC (C1-C2)

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
36 8 36 8

en realidad deficiente actually deficient
6 28 6 28

Tabla 7.11 Sin regresión logística, simplemente juzgada por dC (C1-C2) Table 7.11 Without logistic regression, simply judged by dC (C1-C2)

Predicción buena Good prediction
Predicción deficiente Poor prediction

en realidad buena really good
37 7 37 7

en realidad deficiente actually deficient
6 28 6 28

[0187] Todos los genes de la lista de genes marcadores a efectos de diagnóstico y pronóstico pueden sintetizarse en un biochip a pequeña escala mediante tecnología por chorro de tinta. Se puede hacer un biochip [0187] All genes in the list of marker genes for diagnostic and prognostic purposes can be synthesized in a small-scale biochip using inkjet technology. You can do a biochip

5 con genes para diagnóstico y pronóstico respectiva o colectivamente. Cada gen de la lista está representado por sondas oligonucleótidas sencillas o múltiples, dependiendo de la unicidad de su secuencia en todo el genoma. Este biochip diseñado a medida, en combinación con el protocolo de preparación de muestras, puede usarse en clínicas como kit de diagnóstico/pronóstico. 5 with genes for diagnosis and prognosis respectively or collectively. Each gene in the list is represented by single or multiple oligonucleotide probes, depending on the uniqueness of its sequence throughout the genome. This custom designed biochip, in combination with the sample preparation protocol, can be used in clinics as a diagnostic / prognostic kit.

Ejemplo 6. Relevancia biológica de los genes marcadores de diagnóstico Example 6. Biological relevance of diagnostic marker genes

10 [0188] Se registró el dominio en busca de anotaciones funcionales disponibles para los 430 genes marcadores para la diagnosis de BRCA1 de la Tabla 3. Los 430 genes de la Tabla 3 pueden dividirse en dos grupos: (1) 196 genes cuyas expresiones están claramente expresadas en el grupo de tipo BRCA1, y (2) 234 genes cuyas expresiones están altamente expresadas como grupo esporádico. De los 196 genes del grupo BRCA1, 94 están anotados. De los 234 genes del grupo esporádico, 100 están anotados. Los términos "célula-T", "célula-B" o 10 [0188] The domain was searched for functional annotations available for the 430 marker genes for the diagnosis of BRCA1 in Table 3. The 430 genes in Table 3 can be divided into two groups: (1) 196 genes whose expressions are clearly expressed in the BRCA1 type group, and (2) 234 genes whose expressions are highly expressed as sporadic group. Of the 196 genes of the BRCA1 group, 94 are annotated. Of the 234 genes of the sporadic group, 100 are annotated. The terms "T-cell", "B-cell" or

15 "inmunoglobulina" están implicados en 13 de los 94 genes anotados y en 1 de los 100 genes anotados, respectivamente. De 24.479 genes representados en los biochips, hay hasta la fecha 7.586 genes con anotaciones. "Célula-T", "célula-B" e "inmunoglobulina" están presentes en 207 de estos 7.586 genes. En vista de ello, el valor-p de los 13 genes de "célula-T", "célula-B" o "inmunoglobulina" del grupo BRCA1 es muy relevante (valor-p =1,1x10-6). En comparación, la observación de 1 gen relacionado con "célula-T", "célula-B" o "inmunoglobulina" en el grupo esporádico no es relevante (valor-p = 0,18). 15 "immunoglobulins" are involved in 13 of the 94 genes scored and in 1 of the 100 genes scored, respectively. Of 24,479 genes represented in the biochips, there are 7,586 genes with annotations to date. "T-cell", "B-cell" and "immunoglobulin" are present in 207 of these 7,586 genes. In view of this, the p-value of the 13 genes of "T-cell", "B-cell" or "immunoglobulin" of the BRCA1 group is very relevant (p-value = 1.1x10-6). In comparison, the observation of 1 gene related to "T-cell", "B-cell" or "immunoglobulin" in the sporadic group is not relevant (p-value = 0.18).

[0189] La observación de que las pacientes con BRCA1 tienen genes linfocitos altamente expresados (célula-T y célula-B) concuerda con lo que se ha visto en la patología, es decir, que el tumor de mama de BRCA1 está asociado a la alta infiltración linfocítica más a menudo que los casos esporádicos (Chappuis et al., 2000, Semin Surg Oncol 18:287-295). [0189] The observation that patients with BRCA1 have highly expressed lymphocyte genes (T-cell and B-cell) is consistent with what has been seen in the pathology, that is, that the BRCA1 breast tumor is associated with high lymphocytic infiltration more often than sporadic cases (Chappuis et al., 2000, Semin Surg Oncol 18: 287-295).

Ejemplo 7. Relevancia biológica de los genes marcadores de pronóstico Example 7. Biological relevance of prognostic marker genes

[0190] Se realizó una búsqueda de anotaciones funcionales disponibles para los 231 genes marcadores de pronóstico (Tabla 5). Los marcadores se dividen en dos grupos: (1) 156 marcadores cuyas expresiones están altamente expresadas en el grupo de pronóstico deficiente, y (2) 75 genes cuyas expresiones están altamente expresadas en el grupo de buen pronóstico. De los 156 marcadores, 72 genes están anotados; de los 75 genes, 28 genes están anotados. [0190] A search of available functional annotations was performed for the 231 prognostic marker genes (Table 5). The markers are divided into two groups: (1) 156 markers whose expressions are highly expressed in the poor prognosis group, and (2) 75 genes whose expressions are highly expressed in the good prognosis group. Of the 156 markers, 72 genes are annotated; Of the 75 genes, 28 genes are annotated.

[0191] Doce de los 72 marcadores, pero ninguno de los 28 marcadores, son, o están asociados a, quinasas. Por contraste, de los 7.586 genes del biochip que hasta la fecha tienen anotaciones, sólo 471 tienen quinasas. Partiendo de esta base, es significativo el valor-p de que doce marcadores relacionados con la quinasa se hallen en el grupo de pronóstico (valor-p = 0,001). Las quinasas son importantes reguladores de los procedimientos de transducción por señal intracelular que intervienen en la proliferación, diferenciación y apoptosis de células. Normalmente, su actividad se controla y vigila estrechamente. La sobreexpresión de ciertas quinasas es bien conocida y está implicada en la oncogénesis, como receptor1 del factor de crecimiento endotelial vascular (VEGFR1 o FLT1), una quinasa de tirosina del grupo de pronóstico deficiente, que juega un papel muy importante en la angiogénesis tumoral. Curiosamente, el factor de crecimiento endotelial vascular (VEGF), ligando de VEGFR, se halla también en el grupo de pronóstico, lo que significa que tanto el ligando como el receptor son sobrerregulados en individuos con pronóstico deficiente por un mecanismo desconocido. [0191] Twelve of the 72 markers, but none of the 28 markers, are, or are associated with, kinases. By contrast, of the 7,586 biochip genes that have annotations to date, only 471 have kinases. Based on this basis, the p-value of twelve kinase-related markers is in the prognosis group (p-value = 0.001) is significant. Kinases are important regulators of intracellular signal transduction procedures that are involved in cell proliferation, differentiation and apoptosis. Normally, their activity is closely monitored and monitored. Overexpression of certain kinases is well known and is implicated in oncogenesis, as a receptor1 of vascular endothelial growth factor (VEGFR1 or FLT1), a tyrosine kinase of the poor prognosis group, which plays a very important role in tumor angiogenesis. Interestingly, vascular endothelial growth factor (VEGF), a VEGFR ligand, is also in the prognosis group, which means that both the ligand and the receptor are over-regulated in individuals with poor prognosis by an unknown mechanism.

[0192] Igualmente, 16 de los 72 marcadores, y solo 2 de los 28 marcadores, son, o están asociados a, proteínas de enlace de ATP o de enlace de GTP. Por contraste, de los 7.586 genes del biochip que hasta la fecha tienen anotaciones, solo 714 y 153 implican enlace de ATP y enlace de GTP, respectivamente. Partiendo de esta base, es significativo el valor-p de que 16 marcadores relacionados con el enlace de GTP o de ATP se hallen en el grupo de pronóstico deficiente (valor-p 0,001 y 0,0038). Así pues, los marcadores relacionados con el enlace de GTP o de ATP dentro de los 72 marcadores pueden usarse como indicadores de pronóstico. [0192] Similarly, 16 of the 72 markers, and only 2 of the 28 markers, are, or are associated with, ATP binding proteins or GTP binding. By contrast, of the 7,586 biochip genes that have annotations to date, only 714 and 153 involve ATP binding and GTP binding, respectively. Based on this basis, the p-value of 16 markers related to the GTP or ATP link is significant in the poor prognosis group (p-value 0.001 and 0.0038). Thus, markers related to the GTP or ATP link within the 72 markers can be used as prognostic indicators.

[0193] El cáncer se caracteriza por la proliferación desregulada de células. Al nivel más simple, esto requiere la división de la célula o mitosis. Buscando por palabra clave, hallamos “división de células” o “mitosis” incluida en las anotaciones de 7 genes respectivamente en los 72 marcadores anotados del total de los 156 marcadores de pronóstico deficiente, pero en ninguno de los 28 genes anotados del total de los 75 marcadores de buen pronóstico. De los 7.586 marcadores de biochip con anotaciones, hallamos "división de célula" en 62 anotaciones y "mitosis" en in 37 anotaciones. Basándose en estos hallazgos, se considera altamente significativo el valor-p de que siete marcadores relacionados con la división de célula o la mitosis se hallen en el grupo de buen pronóstico (valor-p = 3.5x10-5). En comparación, la ausencia de marcadores relacionados con la división de célula o la mitosis en el grupo de buen pronóstico no es significativa (valor-p = 0.69). Así pues, los siete marcadores relacionados con la división de célula o la mitosis pueden usarse como marcadores para el diagnóstico deficiente. [0193] Cancer is characterized by deregulated cell proliferation. At the simplest level, this requires cell division or mitosis. Searching by keyword, we find “cell division” or “mitosis” included in the annotations of 7 genes respectively in the 72 markers scored from the total of 156 markers of poor prognosis, but in none of the 28 genes scored from the total of the 75 markers of good prognosis. Of the 7,586 biochip markers with annotations, we found "cell division" in 62 annotations and "mitosis" in 37 annotations. Based on these findings, the p-value of seven markers related to cell division or mitosis is found to be in the good prognosis group (p-value = 3.5x10-5). In comparison, the absence of markers related to cell division or mitosis in the good prognosis group is not significant (p-value = 0.69). Thus, the seven markers related to cell division or mitosis can be used as markers for poor diagnosis.

Ejemplo 8: Elaboración de una reserva de referencia artificial Example 8: Development of an artificial reference reserve

[0194] La reserva de referencia para el perfil de expresión en los Ejemplos de más arriba se hizo usando igual cantidad de ARNcs de cada paciente individual del grupo esporádico. Para tener una gran cantidad de reserva de referencia fiable y fácil de hacer, se puede elaborar una reserva de referencia para el diagnóstico y el pronóstico de cáncer de mama mediante ácido nucleico sintético que represente, o que se derive de, cada gen marcador. La expresión de genes marcadores para muestra de paciente individual se monitoriza solo contra la reserva de referencia, no contra una reserva derivada de otras pacientes. [0194] The reference reservation for the expression profile in the Examples above was made using the same amount of cRNA from each individual patient in the sporadic group. In order to have a large number of reliable and easy-to-make reference reserve, a reference reserve for the diagnosis and prognosis of breast cancer can be developed by synthetic nucleic acid that represents, or is derived from, each marker gene. The expression of marker genes for individual patient samples is monitored only against the reference pool, not against a pool derived from other patients.

[0195] Para hacer la reserva de referencia, se sintetizan oligonucleótidos 60-meros según la secuencia 60mera de sonda de biochip por chorro de tinta para cada uno de los genes indicadores de diagnóstico/pronóstico, luego se bicatenan y clonan al vector pBluescript SK (Stratagene, La Jolla, CA), adyacente a la secuencia del promotor T7. Se aíslan los clones por separado y se verifican las secuencias de sus insertos mediante secuenciación de ADN. Para generar ARNs sintéticos, se linealizan con EcoRI y se lleva a cabo una reacción de transcripción in vitro (IVT) de T7 según el kit MegaScript kit (Ambion, Austin, TX). La IVT va seguida del tratamiento del producto con ADNasa. Se purifican ARNs sintéticos en columnas RNeasy (Qiagen, Valencia, CA). Dichos ARNs sintéticos se transcriben, amplifican, etiquetan y mezclan unos con otros para elaborar la reserva de referencia. La abundancia de esos ARNs sintéticos se ajusta a aproximadamente la abundancia de las correspondientes transcripciones derivadas de marcadores en la reserva de tumores reales. [0195] To make the reference reservation, 60-mer oligonucleotides are synthesized according to the 60th sequence of inkjet biochip probe for each of the diagnostic / prognostic indicator genes, then double-stranded and cloned into the pBluescript SK vector ( Stratagene, La Jolla, CA), adjacent to the T7 promoter sequence. The clones are isolated separately and the sequences of their inserts are verified by DNA sequencing. To generate synthetic RNAs, they are linearized with EcoRI and an in vitro transcription reaction (IVT) of T7 is carried out according to the MegaScript kit (Ambion, Austin, TX). IVT is followed by treatment of the product with DNase. Synthetic RNAs are purified on RNeasy columns (Qiagen, Valencia, CA). These synthetic RNAs are transcribed, amplified, labeled and mixed with each other to develop the reference pool. The abundance of these synthetic RNAs is adjusted to approximately the abundance of the corresponding transcripts derived from markers in the stock of real tumors.

Ejemplo 9: Uso de datos de un solo canal y una reserva de muestras representada por valores almacenados Example 9: Use of single channel data and a sample pool represented by stored values

1. Creación de una reserva de referencia de valores almacenados ("reserva matemática de muestras") 1. Creation of a reference reserve of stored values ("mathematical sample reserve")

[0196] El uso de datos basados en cocientes en los Ejemplos 1-7 de más arriba requiere una muestra física de referencia. En dichos Ejemplos se usó una muestra de tumores esporádicos como referencia. El uso de dicha referencia, aunque permite predicciones de pronóstico y diagnóstico sólidas, puede causar problemas, ya que la reserva es típicamente un recurso limitado. Por lo tanto, se desarrolló un método clasificador que no requiere una reserva física de muestras, haciendo así la aplicación de esta técnica predictiva y de diagnóstico mucho más sencilla para las aplicaciones clínicas. [0196] The use of quotient-based data in Examples 1-7 above requires a physical reference sample. In these Examples, a sample of sporadic tumors was used as a reference. The use of such a reference, although it allows for solid prognosis and diagnosis predictions, can cause problems, since the reserve is typically a limited resource. Therefore, a classification method was developed that does not require a physical stock of samples, thus making the application of this predictive and diagnostic technique much easier for clinical applications.

[0197] Para comprobar si se podían usar los datos de un solo canal, se desarrolló el siguiente procedimiento. Primero, se seleccionaron los datos de intensidad del canal único para los 70 genes óptimos, descrito en el Ejemplo 4, de las 78 muestras esporádicas para prácticas, descritas en los Materiales y Métodos, de los datos de muestra esporádica frente a los datos de hibridación de reserva de tumores. Las 78 muestras consistían en 44 muestras de pacientes con buen pronóstico y 34 muestras de pacientes con pronóstico deficiente. A continuación se normalizaron las intensidades de hibridación para estas muestras dividiendo por la mediana de intensidad de todas las manchas biológicas del mismo biochip. Allí donde se usaron múltiples biochips por muestra, se halló la media en todos los biochips. Se realizó una transformación logarítmica en los datos de intensidad para cada uno de los 70 genes, o para la intensidad media para cada uno de los 70 genes donde se hibrida más de un biochip, y se calculó una intensidad logarítmica media para cada gen en todas las 78 muestras esporádicas. Para cada muestra, las intensidades logarítmicas medias calculadas de este modo se restaron de la intensidad logarítmica de la muestra individual. Esta cifra, la media de intensidad logarítmica sustraída, se trató a continuación como el cociente logarítmico de dos colores para el clasificador por sustitución por la Ecuación (5). Para nuevas muestras, la intensidad logarítmica media se resta de la misma forma que se indica más arriba y se calcula una intensidad logarítmica sustraída media. [0197] To check if data from a single channel could be used, the following procedure was developed. First, the single channel intensity data for the 70 optimal genes, described in Example 4, was selected from the 78 sporadic samples for practices, described in the Materials and Methods, of the sporadic sample data versus hybridization data of tumor reserve. The 78 samples consisted of 44 samples of patients with good prognosis and 34 samples of patients with poor prognosis. The hybridization intensities for these samples were then normalized by dividing by the median intensity of all the biological stains of the same biochip. Where multiple biochips were used per sample, the average was found in all biochips. A logarithmic transformation was performed in the intensity data for each of the 70 genes, or for the average intensity for each of the 70 genes where more than one biochip is hybridized, and a mean logarithmic intensity for each gene was calculated in all The 78 sporadic samples. For each sample, the mean logarithmic intensities calculated in this way were subtracted from the logarithmic intensity of the individual sample. This figure, the average of subtracted logarithmic intensity, was then treated as the two-color logarithmic quotient for the substitution classifier by Equation (5). For new samples, the average logarithmic intensity is subtracted in the same manner as indicated above and an average subtracted logarithmic intensity is calculated.

[0198] La creación de un conjunto de intensidades logarítmicas medias para cada gen hibridado crea a su vez una “reserva matemática de muestras” que sustituye la “reserva material de muestras”. Esta reserva matemática de muestras puede aplicarse entonces a cualquier muestra, incluidas las muestras actualmente disponibles y las que se obtengan en el futuro. Esta “reserva matemática de muestras” puede actualizarse a medida que se va disponiendo de más muestras. [0198] The creation of a set of mean logarithmic intensities for each hybridized gene creates a “mathematical sample reserve” that replaces the “material sample reserve”. This mathematical reserve of samples can then be applied to any sample, including currently available samples and those obtained in the future. This “mathematical sample reserve” can be updated as more samples become available.

2. Resultados 2. Results

[0199] Para demostrar que la reserva matemática de muestras desempeña una función equivalente a la reserva de muestras de referencia, se ploteó la intensidad logarítmica sustraída media (datos de un solo canal relativos a la reserva matemática) frente al cociente logarítmico (hibridaciones relativas a la reserva de muestras) para los 70 genes marcadores óptimos en la totalidad de las 78 muestras esporádicas, como se ve en la FIG. 22. El cociente y las cantidades de un solo canal están en estrecha correlación, lo que indica que ambos tienen capacidad para informar de cambios relativos en la expresión de genes. A continuación se construyó un clasificador mediante la intensidad logarítmica sustraída media, siguiendo exactamente el mismo procedimiento que se usó para los datos de cociente, como en el Ejemplo 4. [0199] To demonstrate that the mathematical reserve of samples performs an equivalent function to the reference sample reserve, the average subtracted logarithmic intensity (single-channel data relative to the mathematical reserve) was plotted against the logarithmic quotient (hybridizations relative to sample pool) for the 70 optimal marker genes in all 78 sporadic samples, as seen in FIG. 22. The ratio and quantities of a single channel are closely correlated, indicating that both have the capacity to report relative changes in gene expression. A classifier was then constructed using the average subtracted logarithmic intensity, following exactly the same procedure that was used for the quotient data, as in Example 4.

[0200] Como se ve en las FIGS. 23A y 23B, con los datos de un solo canal se consiguió clasificar muestras basadas en patrones de expresión de genes. En la FIG. 23A se ven muestras agrupadas según el pronóstico mediante datos de hibridación de un solo canal. La línea blanca separa muestras de pacientes clasificados como de pronóstico deficiente (abajo) y de buen pronóstico (arriba). En la FIG. 23B se hace un diagrama de cada muestra según sus datos de expresión se hallen en correlación con el parámetro clasificador de pronóstico bueno (círculos abiertos) o deficiente (cuadrados rellenos). Mediante el método de validación cruzada de dejar uno fuera, el clasificador predijo 10 falsas positivas de un total de 44 muestras de pacientes con buen pronóstico y 6 falsas negativas de un total de 34 muestras de pacientes con pronóstico deficiente, donde un pronóstico deficiente se considera un “positivo”. Este resultado es comparable al uso del clasificador basado en cociente, que predijo 7 de 44 y 6 de 34, respectivamente. [0200] As seen in FIGS. 23A and 23B, with the data of a single channel it was possible to classify samples based on gene expression patterns. In FIG. 23A, samples are grouped according to the prognosis using single channel hybridization data. The white line separates samples of patients classified as poor prognosis (below) and good prognosis (above). In FIG. 23B, a diagram of each sample is made according to its expression data correlated with the forecast prognostic parameter good (open circles) or deficient (filled squares). Using the cross-validation method of leaving one out, the classifier predicted 10 false positives from a total of 44 patient samples with a good prognosis and 6 false negatives from a total of 34 patient samples with a poor prognosis, where a poor prognosis is considered a positive". This result is comparable to the use of the quotient based classifier, which predicted 7 of 44 and 6 of 34, respectively.

[0201] En aplicaciones clínicas, es muy preferible tener pocos falsos positivos, lo que resulta en menos pacientes con infratratamiento. Para adecuar los resultados a esta preferencia, se construyó un clasificador ordenando jerárquicamente la muestra del paciente según su coeficiente de correlación con la plantilla de “buen pronóstico” y se eligió un umbral para este coeficiente de correlación que permitiera aproximadamente un 10% de falsos negativos, esto es, la clasificación de una muestra de un paciente con pronóstico deficiente como la de un paciente con buen pronóstico. De las 34 muestras de pronóstico deficiente usadas aquí, ello representa una tolerancia de 3 sobre 34 pacientes con pronóstico deficiente clasificadas incorrectamente. Este límite de tolerancia corresponde a un umbral de coeficiente umbral de 0,2727 de correlación con la plantilla de "buen pronóstico". Los resultados que usan este umbral se muestran en las FIGS. 24A y 24B. La FIG. 24A muestra datos de hibridación de un solo canal para muestras ordenadas jerárquicamente según los coeficientes de correlación con el clasificador de buen pronostico; las mezclas clasificadas como de “buen pronostico” se hallan por encima de la línea blanca, mientras que las clasificadas como de “mal pronostico” se hallan por debajo de la misma. La FIG. 24B muestra un diagrama de dispersión de coeficientes de correlación, con tres muestras clasificadas incorrectamente situadas a la derecha del valor del coeficiente de correlación umbral. Usando este umbral, el clasificador tuvo una tasa de falso positivo de 15 sobre 44 muestras de buen pronóstico. Este [0201] In clinical applications, it is very preferable to have few false positives, resulting in fewer patients with under-treatment. To adapt the results to this preference, a classifier was constructed by hierarchically ordering the patient sample according to its correlation coefficient with the “good prognosis” template and a threshold was chosen for this correlation coefficient that allowed approximately 10% of false negatives , that is, the classification of a sample of a patient with poor prognosis as that of a patient with a good prognosis. Of the 34 poor prognosis samples used here, this represents a tolerance of 3 over 34 patients with poor prognosis incorrectly classified. This tolerance limit corresponds to a threshold coefficient threshold of 0.2727 correlation with the "good forecast" template. The results using this threshold are shown in FIGS. 24A and 24B. FIG. 24A shows single channel hybridization data for hierarchically ordered samples according to correlation coefficients with the good forecast classifier; mixtures classified as "good prognosis" are above the white line, while mixtures classified as "poor prognosis" are below it. FIG. 24B shows a scatter plot of correlation coefficients, with three samples classified incorrectly located to the right of the threshold correlation coefficient value. Using this threshold, the classifier had a false positive rate of 15 out of 44 samples with a good prognosis. This

5 resultado no es muy diferente si se compara con la tasa de error de 12 sobre 44 para el clasificador basado en el cociente. 5 result is not very different when compared to the error rate of 12 out of 44 for the quotient based on the quotient.

[0202] En resumen, los 70 genes indicadores transmiten información consistente sobre el pronóstico; los datos de un solo canal pueden predecir el resultado del tumor casi tan bien como los datos basados en el cociente y a la vez son más convenientes en un entorno clínico. [0202] In summary, the 70 indicator genes convey consistent prognostic information; Single-channel data can predict tumor outcome almost as well as quotient-based data and at the same time are more convenient in a clinical setting.

10 10

Claims (40)

REIVINDICACIONES 1. Método para clasificar a un individuo aquejado de cáncer de mama como poseedor de buen pronóstico 1. Method for classifying an individual suffering from breast cancer as having a good prognosis o pronóstico deficiente, en donde dicho individuo es un humano, en donde dicho pronóstico indica que se espera que dicho individuo no tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama y en donde dicho pronóstico deficiente indica que se espera que dicho individuo tenga metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama, que comprende or poor prognosis, where said individual is a human, where said prognosis indicates that said individual is expected not to have distant metastases within five years after the initial diagnosis of breast cancer and where said poor prognosis indicates that it is expected that said individual has distant metastases within five years after the initial diagnosis of breast cancer, which includes (ia) calcular un primer parámetro clasificador entre un primer perfil de expresión y una plantilla de buen pronóstico, o (ia) calculate a first classifier parameter between a first expression profile and a good forecast template, or (ib) calcular un segundo parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico y un tercer parámetro clasificador entre dicho primer perfil de expresión y una plantilla de pronóstico deficiente; (ib) calculate a second classifier parameter between said first expression profile and said good forecast template and a third classifier parameter between said first expression profile and a poor forecast template; comprendiendo dicho primer perfil de expresión los niveles de expresión de una primera pluralidad de genes en una muestra de células tomada del individuo, said first expression profile comprising the expression levels of a first plurality of genes in a sample of cells taken from the individual, comprendiendo dicha plantilla de buen pronóstico, para cada gen en dicha primera pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que no tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; said template comprising a good prognosis, for each gene in said first plurality of genes, the average level of expression of said gene in a plurality of patients who do not have distant metastases within five years after the initial diagnosis of breast cancer; y comprendiendo dicha plantilla de pronóstico deficiente, para cada gen en dicha primera pluralidad, el nivel medio de expresión de dicho gen en una pluralidad de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama; and said poor prognosis template comprising, for each gene in said first plurality, the average level of expression of said gene in a plurality of patients having distant metastases within five years following the initial diagnosis of breast cancer; consistiendo dicha primera pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 5, y said first plurality of genes consisting of at least 5 of the genes whose markers are listed in Table 5, and (iia) clasificar a dicho individuo como poseedor de buen pronóstico si dicho primer parámetro clasificador está por encima de un umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de buen pronóstico que a dicha plantilla de pronóstico deficiente, o (iia) classify said individual as having a good prognosis if said first classifying parameter is above a chosen threshold or if said first expression profile is more similar to said good prognosis template than to said poor prognosis template, or (iib) clasificar a dicho individuo como poseedor de dicho pronóstico deficiente si dicho primer parámetro clasificador está por debajo de dicho umbral elegido o si dicho primer perfil de expresión es más parecido a dicha plantilla de pronóstico deficiente que a dicha plantilla de buen pronóstico. (iib) classifying said individual as having said poor forecast if said first classifying parameter is below said chosen threshold or if said first expression profile is more similar to said poor forecasting template than to said good forecasting template.
2. 2.
El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 20 de los genes cuyos marcadores se enumeran en la lista de la Tabla 5. The method of claim 1, wherein said first plurality consists of at least 20 of the genes whose markers are listed in the list in Table 5.
3. 3.
El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 100 de los genes cuyos marcadores se enumeran en la lista de la Tabla 5. The method of claim 1, wherein said first plurality consists of at least 100 of the genes whose markers are listed in the list in Table 5.
4. Four.
El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 150 de los genes cuyos marcadores se enumeran en la lista de la Tabla 5. The method of claim 1, wherein said first plurality consists of at least 150 of the genes whose markers are listed in the list in Table 5.
5. 5.
El método de la reivindicación 1, en donde dicha primera pluralidad consiste en cada uno de los genes cuyos marcadores se enumeran en la lista de la Tabla 5. The method of claim 1, wherein said first plurality consists of each of the genes whose markers are listed in the list in Table 5.
6. 6.
El método de la reivindicación 1, en donde dicha primera pluralidad consiste en al menos 70 de los genes cuyos marcadores se enumeran en la lista de la Tabla 6. The method of claim 1, wherein said first plurality consists of at least 70 of the genes whose markers are listed in the list in Table 6.
7. 7.
El método de la reivindicación 1, que además comprende los pasos de: The method of claim 1, further comprising the steps of:
(a)(to)
generar dicha plantilla de buen pronóstico por hibridación de ácidos nucleicos derivados de dicha pluralidad de pacientes que no tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama contra ácidos nucleicos derivados de una reserva de tumores de una pluralidad de pacientes que tengan cáncer de mama;  generate said template of good prognosis by hybridization of nucleic acids derived from said plurality of patients who do not have distant metastases within five years after the initial diagnosis of breast cancer against nucleic acids derived from a tumor pool of a plurality of patients who have breast cancer;
(b)(b)
generar dicha plantilla de buen pronóstico por hibridación de ácidos nucleicos derivados de dicha pluralidad de pacientes que tengan metástasis distante dentro de los cinco años siguientes al diagnóstico inicial de cáncer de mama contra ácidos nucleicos derivados de una reserva de tumores de dicha pluralidad de pacientes;  generate said template of good prognosis by hybridization of nucleic acids derived from said plurality of patients having distant metastases within five years following the initial diagnosis of breast cancer against nucleic acids derived from a tumor pool of said plurality of patients;
(c)(C)
generar dicho primer perfil de expresión hibridando ácidos nucleicos derivados de dicha muestra de células tomada dicho individuo contra dicha reserva, y  generating said first expression profile by hybridizing nucleic acids derived from said sample of cells taken said individual against said reserve, and
(d)(d)
calcular (d1) dicho segundo parámetro clasificador entre dicho primer perfil de expresión y la plantilla de buen pronóstico y (d2) dicho tercer parámetro clasificador entre dicho primer perfil de expresión y la plantilla de pronóstico deficiente, en donde si dicho primer perfil de expresión es más parecido a la plantilla de buen pronóstico que a la plantilla de pronóstico deficiente, se clasifica al individuo como poseedor de buen pronóstico, y si dicho perfil de expresión es más parecido a la plantilla de pronóstico deficiente que a la plantilla de buen pronóstico, se clasifica al individuo como poseedor de pronóstico deficiente.  calculate (d1) said second classifier parameter between said first expression profile and the good forecast template and (d2) said third classifier parameter between said first expression profile and the poor forecast template, wherein if said first expression profile is more similar to the good forecast template than to the poor forecast template, the individual is classified as having a good forecast, and if said expression profile is more similar to the poor forecast template than to the good forecast template, classifies the individual as having a poor prognosis.
8. 8.
El método de la reivindicación 1, que comprende además: The method of claim 1, further comprising:
iv) clasificar a dicho individuo como ER(+) (receptor positivo de estrógeno) o ER(-) (receptor negativo de estrógeno) basándose en un segundo perfil de expresión que comprende los niveles de expresión de una segunda pluralidad de genes en una muestra de células tomada del individuo, consistiendo dicha segunda pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 1, en donde dicha clasificación de dicho individuo como ER(+) o como ER(-) se lleva a cabo con un método que comprende: iv) classifying said individual as ER (+) (estrogen positive receptor) or ER (-) (estrogen negative receptor) based on a second expression profile comprising the expression levels of a second plurality of genes in a sample of cells taken from the individual, said second plurality of genes consisting of at least 5 of the genes whose markers are listed in Table 1, wherein said classification of said individual as ER (+) or as ER (-) is carried out with a method that comprises: a) calcular una primera medida de semejanza entre dicho segundo perfil de expresión y una plantilla de ER(+) y una segunda medida de semejanza entre dicho segundo perfil de expresión y una plantilla de ER (-); a) calculate a first measure of similarity between said second expression profile and an ER (+) template and a second measure of similarity between said second expression profile and an ER (-) template;
(b)(b)
comprendiendo dicha plantilla de ER(+), para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes ER(+);  said ER (+) template comprising, for each gene in said second plurality of genes, the average level of expression of said gene in a plurality of ER (+) patients;
comprendiendo dicha plantilla de ER(-), para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes ER(-), y said ER (-) template comprising, for each gene in said second plurality of genes, the average level of expression of said gene in a plurality of ER (-) patients, and
(b)(b)
clasificar (b1) a dicho individuo como ER(+) si dicho segundo perfil de expresión tiene una mayor semejanza con dicha plantilla de ER(+) que con dicha plantilla de ER(-),  classify (b1) said individual as ER (+) if said second expression profile has a greater similarity with said ER (+) template than with said ER (-) template,
o (b2) como ER(-) si dicho segundo perfil de expresión tiene una menor semejanza con dicha plantilla de ER(+) que con dicha plantilla de ER(-). or (b2) as ER (-) if said second expression profile has a lower similarity with said ER (+) template than with said ER (-) template.
9. El método de la reivindicación 1, que comprende además: 9. The method of claim 1, further comprising: (iv) clasificar a dicho individuo como BRCA1 o esporádico basándose en un segundo perfil de expresión que comprende los niveles de expresión de una segunda pluralidad de genes en una muestra de células tomada del individuo, consistiendo dicha segunda pluralidad de genes en al menos 5 de los genes cuyos marcadores se enumeran en la Tabla 3, en donde dicha clasificación de dicho individuo como BRCA1 o esporádico se lleva a cabo con un método que comprende: (iv) classifying said individual as BRCA1 or sporadic based on a second expression profile comprising the expression levels of a second plurality of genes in a sample of cells taken from the individual, said second plurality of genes consisting of at least 5 of the genes whose markers are listed in Table 3, wherein said classification of said individual as BRCA1 or sporadic is carried out with a method comprising: (a) calcular una primera medida de semejanza entre dicho segundo perfil de expresión y una plantilla de BRCA1 y una segunda medida de semejanza entre dicho segundo perfil de expresión y una plantilla de no-BRCA1; (a) calculate a first measure of similarity between said second expression profile and a BRCA1 template and a second measure of similarity between said second expression profile and a non-BRCA1 template; comprendiendo dicha plantilla de BRCA1, para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes BRCA1; said BRCA1 template comprising, for each gene in said second plurality of genes, the average level of expression of said gene in a plurality of BRCA1 patients; comprendiendo dicha plantilla de no-BRCA1, para cada gen en dicha segunda pluralidad de genes, el nivel medio de expresión de dicho gen en una pluralidad de pacientes no-BRCA1,y said non-BRCA1 template comprising, for each gene in said second plurality of genes, the average level of expression of said gene in a plurality of non-BRCA1 patients, and (b) clasificar (b1) a dicho individuo como BRCA1 si dicho segundo perfil de expresión tiene una mayor semejanza con dicha plantilla de BRCA1 que con dicha plantilla de no-BRCA1 , o (b2) como esporádico si dicho segundo perfil de expresión tiene una menor semejanza con dicha plantilla de BRCA1 que con dicha plantilla de no-BRCA1. (b) classify (b1) said individual as BRCA1 if said second expression profile has a greater similarity with said BRCA1 template than with said non-BRCA1 template, or (b2) as sporadic if said second expression profile has a less similarity with said BRCA1 template than with said non-BRCA1 template.
10. 10.
El método de la reivindicación 1, en donde dicho nivel de expresión de cada gen de dicho primer perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia. The method of claim 1, wherein said expression level of each gene of said first expression profile is a relative level of expression of said gene in said cell sample versus the expression level of said gene in a reference pool.
11. eleven.
El método de la reivindicación 10, en donde dicha reserva de referencia procede de una línea celular de cáncer de mama.  The method of claim 10, wherein said reference pool is derived from a breast cancer cell line.
12. 12.
El método de la reivindicación 10, en donde dicha reserva de referencia procede de una línea celular de una mama normal. The method of claim 10, wherein said reference pool is derived from a normal breast cell line.
13. 13.
El método de la reivindicación 10, en donde dicho nivel relativo de expresión se representa como cociente logarítmico. The method of claim 10, wherein said relative level of expression is represented as a logarithmic quotient.
14. 14.
El método de la reivindicación 1, en donde dicho paso (i) comprende calcular dicho primer parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico, y dicho paso (ii) comprende clasificar a dicho individuo como poseedor de buen pronóstico si dicho primer parámetro clasificador se halla por encima de un umbral elegido. The method of claim 1, wherein said step (i) comprises calculating said first classifying parameter between said first expression profile and said good prognosis template, and said step (ii) comprises classifying said individual as having a good prognosis if said first classifier parameter is above a chosen threshold.
15. fifteen.
El método de la reivindicación 14, en donde dicha media es una media ponderada de error del cociente logarítmico. The method of claim 14, wherein said mean is a weighted average error of the logarithmic quotient.
16. 16.
El método de la reivindicación 14, en donde dicho nivel de expresión de cada gen en dicho primer perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico, y en donde el nivel medio de expresión de cada gen en dicha primera pluralidad de genes en dicha plantilla de buen pronóstico es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una de dicha pluralidad de pacientes que no tienen metástasis distante en los cinco años siguientes al diagnóstico inicial de cáncer de mama frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico que es una media de los cocientes logarítmicos para dicho gen en dicha pluralidad de pacientes que no tienen metástasis distante en los cinco años siguientes al diagnóstico inicial de cáncer de mama. The method of claim 14, wherein said level of expression of each gene in said first expression profile is a relative level of expression of said gene in said cell sample versus the level of expression of said gene in a reference pool, represented as a logarithmic quotient, and wherein the average level of expression of each gene in said first plurality of genes in said template of good prognosis is an average of relative levels of expression, each relative level of expression being the level of expression of said gene in one of said plurality of patients who do not have distant metastases in the five years following the initial diagnosis of breast cancer against the level of expression of said gene in a reference pool, represented as a logarithmic quotient that is an average of the logarithmic quotients for said gene in said plurality of patients who do not have distant metastases in the five years following diagnosis. initial ico of breast cancer.
17. 17.
El método de la reivindicación 14, en donde dicho primer parámetro clasificador es un coeficiente de correlación entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico. The method of claim 14, wherein said first classifier parameter is a correlation coefficient between said first expression profile and said good forecast template.
18. 18.
El método de la reivindicación 1, que comprende además determinar dicho primer perfil de expresión midiendo los niveles de expresión de dicha primera pluralidad de genes en dicha muestra de células de dicho individuo. The method of claim 1, further comprising determining said first expression profile by measuring the expression levels of said first plurality of genes in said cell sample of said individual.
19. 19.
El método de la reivindicación 8, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen frente al nivel de expresión de dicho gen en una reserva de referencia. The method of claim 8, wherein said level of expression of each gene in said second expression profile is a relative level of expression of said gene versus the level of expression of said gene in a reference pool.
20. twenty.
El método de la reivindicación 19, en donde dicha reserva de referencia procede de una línea celular de una mama normal. The method of claim 19, wherein said reference pool is derived from a normal breast cell line.
21. twenty-one.
El método de la reivindicación 19, en donde dicha reserva de referencia procede de una línea celular de un cáncer de mama. The method of claim 19, wherein said reference pool is derived from a breast cancer cell line.
22. 22
El método de la reivindicación 19, en donde dicho nivel relativo de expresión se representa como cociente logarítmico. The method of claim 19, wherein said relative level of expression is represented as a logarithmic quotient.
23. 2. 3.
El método de la reivindicación 8, en donde dicha media es una media ponderada de error del cociente logarítmico. The method of claim 8, wherein said mean is a weighted average error of the logarithmic quotient.
24. 24.
El método de la reivindicación 8, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico; en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en dicha plantilla de ER (+) es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una paciente de dicha pluralidad de pacientes ER(+) frente al nivel de expresión de dicho gen en una reserva de referencia, representada como cociente logarítmico que es una media de los cocientes logarítmicos para dicho gen en dicha pluralidad de pacientes ER/+), y en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en ficha plantilla de ER(-) es una media de los niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una de dicha pluralidad de pacientes ER(-) con respecto al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico que es una media de los cocientes logarítmicos para dicho gen en dicha pluralidad de pacientes ER(-). The method of claim 8, wherein said expression level of each gene in said second expression profile is a relative level of expression of said gene in said cell sample versus the expression level of said gene in a reference pool, represented as logarithmic quotient; wherein the average level of expression of each gene in said second plurality of genes in said ER template (+) is a mean of relative levels of expression, each relative level of expression being the level of expression of said gene in a patient of said plurality of ER (+) patients versus the level of expression of said gene in a reference pool, represented as a logarithmic quotient which is an average of the logarithmic ratios for said gene in said plurality of ER / + patients), and wherein the average level of expression of each gene in said second plurality of genes in ER template template (-) is a mean of the relative levels of expression, each relative level of expression being the level of expression of said gene in one of said plurality of ER (-) patients with respect to the level of expression of said gene in a reference pool, represented as a logarithmic quotient which is an average of the logarithmic ratios for said gene in said plu rality of ER patients (-).
25. 25.
El método de la reivindicación 8, en donde dicha primera medida de semejanza entre dicho segundo perfil de expresión y dicha plantilla de ER(+) es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(+), en donde dicha segunda medida de semejanza entre dicho segundo perfil de expresión y dicha plantilla de ER(-) es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(-) y en donde de dicho segundo perfil de expresión se dice que tiene una semejanza mayor con dicha plantilla de ER(+) que con dicha plantilla de ER(-) si The method of claim 8, wherein said first measure of similarity between said second expression profile and said ER (+) template is a correlation coefficient between said second expression profile and said ER (+) template, wherein said second measure of similarity between said second expression profile and said ER template (-) is a correlation coefficient between said second expression profile and said ER template (-) and wherein said second expression profile says that it has a greater similarity with said ER template (+) than with said ER template (-) if
dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(+) es mayor que dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(-), o del que se dice que tiene una semejanza menor con dicha plantilla de ER(+) que con dicha plantilla de ER(-) si dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(+) es menor que dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de ER(-). said correlation coefficient between said second expression profile and said ER (+) template is greater than said correlation coefficient between said second expression profile and said ER (-) template, or which is said to have a lower similarity with said ER (+) template than with said ER (-) template if said correlation coefficient between said second expression profile and said ER (+) template is less than said correlation coefficient between said second expression profile and said ER template (-).
26. 26.
El método de la reivindicación 8, que comprende además determinar dicho segundo perfil de expresión midiendo los niveles de expresión de dicha segunda pluralidad de genes en dicha muestra de células de dicho individuo. The method of claim 8, further comprising determining said second expression profile by measuring the expression levels of said second plurality of genes in said cell sample of said individual.
27. 27.
El método de la reivindicación 9, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia. The method of claim 9, wherein said level of expression of each gene in said second expression profile is a relative level of expression of said gene in said cell sample versus the level of expression of said gene in a reference pool.
28. 28.
El método de la reivindicación 27, en donde dicha reserva de referencia procede de una línea celular de una mama normal. The method of claim 27, wherein said reference pool is derived from a normal breast cell line.
29. 29.
El método de la reivindicación 27, en donde dicha reserva de referencia procede de una línea celular de cáncer de mama. The method of claim 27, wherein said reference pool is derived from a breast cancer cell line.
30. 30
El método de la reivindicación 27, en donde dicho nivel relativo de expresión se representa como cociente logarítmico. The method of claim 27, wherein said relative level of expression is represented as a logarithmic quotient.
31. 31.
El método de la reivindicación 9, en donde cada una de dichas medias es una media ponderada de error del cociente logarítmico. The method of claim 9, wherein each of said means is a weighted average error of the logarithmic quotient.
32. El método de la reivindicación 9, en donde dicho nivel de expresión de cada gen en dicho segundo perfil de expresión es un nivel relativo de expresión de dicho gen en dicha muestra de células frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico; en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en dicha plantilla de BRCA1 es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una paciente de dicha pluralidad de pacientes BRCA1 frente al nivel de expresión de dicho gen en una reserva de referencia, representado como cociente logarítmico que es una media de cocientes logarítmicos de dicho gen en dicha pluralidad de pacientes BRCA1 y en donde el nivel medio de expresión de cada gen en dicha segunda pluralidad de genes en dicha plantilla de no BRCA1 es una media de niveles relativos de expresión, siendo cada nivel relativo de expresión el nivel de expresión de dicho gen en una paciente de dicha pluralidad de pacientes no-BRCA1 frente al nivel de expresión de dicho gen en una reserva de referencia, representado como un cociente logarítmico que es una media de cocientes logarítmicos de dicho gen en dicha pluralidad de pacientes no-BRCA1. 32. The method of claim 9, wherein said level of expression of each gene in said second expression profile is a relative level of expression of said gene in said cell sample versus the level of expression of said gene in a reservoir of reference, represented as logarithmic quotient; wherein the average level of expression of each gene in said second plurality of genes in said BRCA1 template is a mean of relative levels of expression, each relative level of expression being the level of expression of said gene in a patient of said plurality of BRCA1 patients versus the level of expression of said gene in a reference pool, represented as a logarithmic quotient that is an average of logarithmic ratios of said gene in said plurality of BRCA1 patients and where the average level of expression of each gene in said second plurality of genes in said non-BRCA1 template is an average of relative levels of expression, each relative level of expression being the level of expression of said gene in a patient of said plurality of non-BRCA1 patients versus the level of expression of said gene in a reference reserve, represented as a logarithmic quotient that is an average of logarithmic quotients of said gene in said plurality ad of non-BRCA1 patients.
33. 33.
El método de la reivindicación 32, en donde dicha primera medida de semejanza entre dicho segundo perfil de expresión y dicha plantilla de BRCA1 es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de BRCA1, en donde dicha segunda medida de semejanza entre segundo perfil de expresión y dicha plantilla de no-BRCA1 es un coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de no-BRCA1 y en donde de dicho segundo perfil de expresión se dice que tiene una semejanza mayor con dicha plantilla de BRCA1 que con dicha plantilla de no-BRCA1 si dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de de BRCA1 es mayor que dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de no-BRCA1, o del que se dice que tiene una semejanza menor con dicha plantilla de no-BRCA1 que con dicha plantilla de BRCA1 si dicho coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de BRCA1 es menor que el coeficiente de correlación entre dicho segundo perfil de expresión y dicha plantilla de no-BRCA1. The method of claim 32, wherein said first measure of similarity between said second expression profile and said BRCA1 template is a correlation coefficient between said second expression profile and said BRCA1 template, wherein said second similarity measure between second expression profile and said non-BRCA1 template is a correlation coefficient between said second expression profile and said non-BRCA1 template and where said second expression profile is said to have a greater similarity with said BRCA1 template that with said non-BRCA1 template if said correlation coefficient between said second expression profile and said BRCA1 template is greater than said correlation coefficient between said second expression profile and said non-BRCA1 template, or of which says that it has a lower similarity with said non-BRCA1 template than with said BRCA1 template if said correlation coefficient between d said second expression profile and said BRCA1 template is less than the correlation coefficient between said second expression profile and said non-BRCA1 template.
34. 3. 4.
El método de la reivindicación 9, que comprende además determinar dicho segundo perfil de expresión midiendo los niveles de expresión de dicha segunda pluralidad de genes en dicha muestra de células de dicho individuo. The method of claim 9, further comprising determining said second expression profile by measuring the expression levels of said second plurality of genes in said cell sample of said individual.
35. 35
El método de cualquiera de las reivindicaciones 10-14, 15 y 16, en donde dicha pluralidad consiste en al menos 20 de los genes cuyos marcadores se enumeran en la Tabla 5. The method of any of claims 10-14, 15 and 16, wherein said plurality consists of at least 20 of the genes whose markers are listed in Table 5.
36. 36.
El método de cualquiera de las reivindicaciones 10-14, 15 y 16, en donde dicha pluralidad consiste en al menos 50 de los genes cuyos marcadores se enumeran en la Tabla 5. The method of any of claims 10-14, 15 and 16, wherein said plurality consists of at least 50 of the genes whose markers are listed in Table 5.
37. 37.
El método de cualquiera de las reivindicaciones 10-14, 15 y 16, en donde dicha pluralidad consiste en al menos 75 de los genes cuyos marcadores se enumeran en la Tabla 5. The method of any of claims 10-14, 15 and 16, wherein said plurality consists of at least 75 of the genes whose markers are listed in Table 5.
38. 38.
El método de cualquiera de las reivindicaciones 1-6, en donde dicho paso (i) comprende calcular dicho segundo parámetro clasificador entre dicho segundo perfil de expresión y dicha plantilla de buen pronóstico y dicho tercer parámetro clasificador entre dicho primer perfil de expresión y dicha plantilla de pronóstico deficiente, consistente dicho paso (ii) en clasificar a dicho individuo como poseedor de buen The method of any of claims 1-6, wherein said step (i) comprises calculating said second classifier parameter between said second expression profile and said good forecast template and said third classifier parameter between said first expression profile and said template of poor prognosis, consisting of said step (ii) in classifying said individual as having good
5 pronóstico si dicho primer perfil de expresión es más parecido a dicha plantilla de buen pronóstico que a dicha plantilla de pronóstico deficiente, o clasificar a dicho individuo como poseedor de pronóstico deficiente si dicho primer perfil de expresión es más parecido a dicha plantilla de pronóstico deficiente que a dicha plantilla de buen pronóstico. 5 prognosis if said first expression profile is more similar to said good prognostic template than to said poor prognostic template, or classify said individual as having poor prognosis if said first expression profile is more similar to said poor prognosis template than to said good forecast template.
39. El método de la reivindicación 38, en donde dicho segundo parámetro clasificador es un coeficiente de 39. The method of claim 38, wherein said second classifier parameter is a coefficient of 10 correlación entre dicho primer perfil de expresión y dicha plantilla de buen pronóstico y en donde dicho tercer parámetro clasificador es un coeficiente de correlación entre dicho primer perfil de expresión y dicha plantilla de pronóstico deficiente. 10 correlation between said first expression profile and said good forecast template and wherein said third classifier parameter is a correlation coefficient between said first expression profile and said poor forecast template. 40. El método de cualquiera de las reivindicaciones 1-6 y 14, en donde dicho cáncer de mama es cáncer de mama esporádico. 40. The method of any of claims 1-6 and 14, wherein said breast cancer is sporadic breast cancer. 15 41. El método de la reivindicación 38, en donde dicho cáncer de mama es cáncer de mama esporádico. The method of claim 38, wherein said breast cancer is sporadic breast cancer.
ES02746538T 2001-06-18 2002-06-14 DIAGNOSIS AND FORECAST OF BREAST CANCER IN PATIENTS. Expired - Lifetime ES2366178T3 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US29891801P 2001-06-18 2001-06-18
US298918P 2001-06-18
US380710P 2002-05-14

Publications (1)

Publication Number Publication Date
ES2366178T3 true ES2366178T3 (en) 2011-10-18

Family

ID=44681548

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02746538T Expired - Lifetime ES2366178T3 (en) 2001-06-18 2002-06-14 DIAGNOSIS AND FORECAST OF BREAST CANCER IN PATIENTS.

Country Status (1)

Country Link
ES (1) ES2366178T3 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190287644A1 (en) * 2018-02-15 2019-09-19 Northeastern University Correlation Method To Identify Relevant Genes For Personalized Treatment Of Complex Disease

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190287644A1 (en) * 2018-02-15 2019-09-19 Northeastern University Correlation Method To Identify Relevant Genes For Personalized Treatment Of Complex Disease

Similar Documents

Publication Publication Date Title
US20180305768A1 (en) Diagnosis and prognosis of breast cancer patients
US7171311B2 (en) Methods of assigning treatment to breast cancer patients
US8019552B2 (en) Classification of breast cancer patients using a combination of clinical criteria and informative genesets
JP6140202B2 (en) Gene expression profiles to predict breast cancer prognosis
JP6351112B2 (en) Gene expression profile algorithms and tests to quantify the prognosis of prostate cancer
ES2504242T3 (en) Breast Cancer Prognosis
EP2333112B1 (en) Breast cancer prognostics
WO2017215230A1 (en) Use of a group of gastric cancer genes
AU2005267756A1 (en) Prognosis of breast cancer patients
JP2008536094A (en) Methods for predicting chemotherapy responsiveness in breast cancer patients
US20150344962A1 (en) Methods for evaluating breast cancer prognosis
TW201741915A (en) Gene expression profiles and uses thereof in breast cancer treatment predicting the likelihood of locoregional recurrence and/or distant metastasis in a subject with breast cancer following mastectomy and/or breast conserving surgery
WO2015154715A1 (en) A method of diagnosis, prognosis or treatment of a cancer
WO2011009908A2 (en) A method for predicting clinical outcome of patients with breast carcinoma
ES2366178T3 (en) DIAGNOSIS AND FORECAST OF BREAST CANCER IN PATIENTS.
WO2019215394A1 (en) Arpp19 as biomarker for haematological cancers
EP1682896A2 (en) Method for distinguishing aml subtypes with aberrant and prognostically intermediate karyotypes