MXPA05005283A - Metodos para diagnostico de rcc y otros tumores solidos. - Google Patents

Metodos para diagnostico de rcc y otros tumores solidos.

Info

Publication number
MXPA05005283A
MXPA05005283A MXPA05005283A MXPA05005283A MXPA05005283A MX PA05005283 A MXPA05005283 A MX PA05005283A MX PA05005283 A MXPA05005283 A MX PA05005283A MX PA05005283 A MXPA05005283 A MX PA05005283A MX PA05005283 A MXPA05005283 A MX PA05005283A
Authority
MX
Mexico
Prior art keywords
seq
gene
cps
protein
chromosome
Prior art date
Application number
MXPA05005283A
Other languages
English (en)
Inventor
A Stover Jennifer
Original Assignee
Wyeth Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wyeth Corp filed Critical Wyeth Corp
Publication of MXPA05005283A publication Critical patent/MXPA05005283A/es

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57438Specifically defined cancers of liver, pancreas or kidney
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

Se describen metodos, sistemas y equipos para diagnostico de carcinoma de celula renal (RCC) y otros tumores solidos. Esta invencion identifica numerosos genes de enfermedad que se expresan diferencialmente en la sangre periferica de pacientes que tienen RCC u otros tumores solidos con relacion a humanos sin enfermedad. Estos genes de enfermedad pueden usarse como marcadores circundantes para detectar la presencia o ausencia de RCC u otos tumores solidos.

Description

1 METODOS PARA DIAGNOSTICO DE RCC Y OTROS TUMORES SOLIDOS Campo de la Invención Esta invención se refiere a métodos, sistemas, y equipo para el diagnóstico de RCC y otros tumores sólidos.
Antecedentes de la Invención El carcinoma de célula renal (RCC por sus siglas en inglés) comprende la mayoría de todos los casos de cáncer de riñon y es uno de los cánceres más comunes en los países industrializados. Cuando se detecta temprano, la nefrectomía radical puede resultar en una tasa de supervivencia excelente para los pacientes con RCC. Sin embargo, la tasa de supervivencia para los pacientes con tumores con metástasis de RCC se reduce dramáticamente. Por lo tanto existe la necesidad de suministrar metodologías, sistemas y equipo para el diagnóstico temprano de RCC. Los pacientes con RCC frecuentemente no tienen un síntomas específico o son completamente asintomáticos . De hecho un porcentaje importante de las lesiones renales se detectan incidentalmente por técnicas de formación de imágenes no Están disponibles métodos de selección generales para RCC, pero estos métodos carecen de sensibilidad y especificidad suficientes para una aplicación amplia. La patente reciente de E.Ü.A. No. 6,087,098 describe Ref. : 163774 generalmente un método basado en RT-PCR para la detección de la expresión de gen MN en muestras de sangre periférica. La proteína de MN se cree que es un marcador de células renales malignas . Por lo tanto la detección de la expresión del gen MN en. la sangre periférica sugiere la presencia de RCC. La presente invención representa un avance importante en el diagnóstico de RCC y/u otros tumores sólidos tales como el cáncer de próstata y el cáncer de cabeza y cuello. La prueba de diagnóstico de la presente invención se basa en la detección de patrones de expresión de genes en células de sangre periférica más que en las células de tumor mismas. Como tal la presente invención permite una selección amplia de las etapas tempranas del avance de tumores sólidos.
Breve Descripción de la Invención La presente invención identifica numerosos genes de enfermedades que se expresan diferencialmente en la sangre periférica de pacientes que tienen RCC u otros tumores sólidos, en comparación con los humanos libres de enfermedades. Estos genes de enfermedades se pueden usar como marcadores substitutos para detectar la presencia o ausencia de RCC u otros tumores sólidos. De acuerdo con un aspecto de la presente invención, se proporciona un método que es útil para el diagnóstico de RCC y otros tumores sólidos. El método comprende las etapas de proporcionar al menos una muestra de sangre periférica de un humano y comparar el perfil de expresión de uno o más genes en al menos una muestra de sangre periférica con al menos un perfil de expresión de referencia de uno o más genes . Uno o más de cada gen se expresa diferencialmente en los PBMC de un paciente que tiene un tumor sólido en comparación con PBMC de los humanos libres de enfermedad, con tal de que uno o más genes consistan de solamente un gen, el gen no se selecciona del grupo que consiste de IL1B, IL6, MMP-9 y FCGR3B, y con la condición de que además de que si uno o más genes consisten de dos genes, los dos genes no son ILlb y IL6. La muestra de sangre periférica puede ser una muestra de sangre entera o una muestra que comprende células mononucleares de sangre periférica enriquecida (PBMC) . También se pueden usar otras muestras de sangre periféricas. El tumor sólido puede ser por ejemplo, RCC, cáncer de próstata o cáncer de cabeza o cuello. El humano que se investiga puede tener el tumor sólido o está libre del tumor sólido u otras enfermedades. Los perfiles de expresión de referencia pueden incluir un perfil de expresión del uno o más genes en muestras de sangre periférica en humanos libres de enfermedad. Los perfiles de expresión de referencia también pueden incluir un perfil de expresión del uno o más genes en muestras de sangre periférica de pacientes que tienen el tumor sólido. Además los perfiles de expresión de referencia pueden incluir además un perfil de expresión del uno o más genes en muestras de sangre periféricas de pacientes que tiene otro tumor sólido.' El perfil de expresión del humano que es investigado se puede comparar con diferentes perfiles de expresión de referencia usando un algoritmo de votación ponderado. El perfil de expresión del humano investigado y los perfiles de expresión de referencia se pueden determinar usando RT-PCR cuantitativa, inmunotransferencia Northern, hibridación in si tu, inmunotransferencia Southern, inmunotransferencia de ranura, ensayo de protección de nucleasa o configuraciones de ácidos nucleicos. Los perfiles de expresión también se pueden determinar usando inmunoensayos tales como ELISA (ensayo inmunosorbente ligado a enzimas) , RIA (radioinmunoensayo) , FACS (clasificador de células activadas por fluorescencia) , o inmunotransferencia Western. Además los métodos basados en electroforesis de gel de poliacrilamida SDS 2-dimensional se pueden usar. En una modalidad preferida, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes seleccionados de la Tabla de Genes 4. En otra modalidad preferida, el uno o más genes incluyen al menos 1, 2, 3, 4, 6, 8, 10, 12, 14, 16, 18, 20, o más genes seleccionados de la Tabla 6. Todavía en otra modalidad preferida el uno o más genes incluye un clasificador que se identifica usando un algoritmo métrico de correlación de dos clases o clase múltiple. Todavía en otra modalidad el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o 20 genes seleccionados del grupo que consiste de: EEF1A2, TLR2, BRF2, LGALS3, SNRPG, DKFZP586E1621, NUMA1, SOD2 , AR1B1, DUSP6, SMARCE1, KIAA0669, MSF, IL1R , PTMA, IAA0410, PS D3 , T54, C1QBP, y OSR1. En una modalidad adicional el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o 20 genes seleccionados del grupo que consiste de: CD44, KIAA0410, MARCO, MAP3K8, NSP-CL, PIP5K1C, NRG1, RAB31, LGALS3, MEF2D, ITGA7, LHFPL2 , ETS2 , KHSRP^ ENIGMA, U K_AF038187, RAB13, TLR2 ,. T54 y DUSP6. Todavía en otra modalidad el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o 20 genes seleccionados del grupo que consiste de: CD44, CRADD, CCRL2, IAA0837, KIAA0707, KIAA1113 , EREG, U K_AL050119, PPARD, CTSL, ATP2B1, UNK_AF052115 , MITF, STAT3, KIAA0410, TPD52L2, UNKAI732885, MARCO, LOC64116, y PDMP2. Todavía en otra modalidad el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes seleccionados del grupo que consiste de: FABP5, SCYA20, ADM, COPEB, FCGR3B, U _M62896, FN1, HM0X1, ITGA7, DGCR5, CBP2 , SLC1A4 , ???9, SLC16A3, LILRB3 , FCGR1A, LHFPL2 , PLEC1, S100A11, SPOP, CCR1, TLR2 y ???0750. En otra modalidad, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes seleccionados del grupo que consiste de: ADM, COPEB, AQP9, PTGS2, STIP1, SOD2, PDXK, IL1RN, AXA5, IFIT4, IL1B, GROl, PLAÚR, NP, MMP9, SLC16A3, LILRB3 , FCGR1A, LHFPL2 , PLEC1, S100A11, SPOP, CCR1 , TLR2 , KIAA0750, CDC34, POLR2J, ETS2, MAD, GPR3, PIP5K1C, PRF1, PSMA7 , INPP4A, TCFL1 , DGAT, S100P, DOC-1R, C8F , PDI2, GEF-2, TNNT1, BSG, IL17R, HK3 , RALBPl , R ASE2, TPM1, BLVRB, APS, PPARD, NFE2 , IL1RAP, S100A12, CD9, ENIGMA, HAGH, NCF1, FLOT1, ITGA2B, KIAA0750, FKBP8 , DUSP6 y CBFA2T3. Todavía en otra modalidad, el uno o más genes incluyen · al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o más genes seleccionados del grupo que consiste de: NUMA1, CXCR4, IL10RA, M9, FAU, BRF2 , RPS6, EEF1A2 , BAG5 , A R1B1, UNK_AL022721, C1QBP, DKZP586E0820 , NONO, PSMD3 , UNK_N74607, UNK_AI743507, MAPKAPK5 , y UNK_U79297. En otra modalidad preferida el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizar bajo condiciones severas a una secuencia de sonda de clasificación respectiva diferente (CPS) seleccionada de la Tabla 2 CPS. En un ejemplo específico, si el uno o más genes consisten de solamente un gen, los transcritos de ARN del gen no se pueden hibridizar bajo condiciones severas a una CPS seleccionado del grupo que consiste de CPSs 58, 211, 221 y 241. En otro ejemplo específico si el uno o más genes consisten de dos genes, los transcritos de ARN de los dos genes no se pueden hibridizar bajo condiciones severas a CPSs 211 y 241. En una modalidad, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o 20 genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizar bajo condiciones severas a un CPS respectivo diferente seleccionado del grupo que consiste de: CPS 1, CPS 3, CPS 4, CPS 6, CPS 18, CPS 38, CPS 53, CPS 255, CPS 256, CPS 257, CPS 258, CPS 259, CPS 260, CPS 261, CPS 262, CPS 263, CPS 264, CPS 265, CPS 266, y CPS 267. En otra modalidad, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o 20 genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizarse bajo condiciones de severidad a un CPS respectivo diferente seleccionado del grupo que consiste de: CPSs 1, 3, 4, 5, 6, 7, 9, 10, 11, 16, 28, 31, 268, 264, 279, 280, 281, 282, 283 y 284. Todavía en otra modalidad, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o 20 genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizarse bajo condiciones de severidad a un CPS respectivo diferente seleccionado del grupo que consiste de: CPSs 17, 31, 37, 50, 59, 64, 69, 71, 264, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277 y 278. Todavía aun en otra modalidad, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes, cada uno de los cuales tiene un transcrito de AR capaz de hibridizarse bajo condiciones de severidad a un CPS respectivo diferente seleccionado del grupo que consiste de: CPSs 1, 2, 8, 16, 19, 26, 28, 57, 58, 61, 91, 92, 99, 138, 143, 148, 152, 191, 192, 207, 221, 229, 236 y 245. Todavía en otra modalidad, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizarse bajo condiciones de severidad a un CPS respectivo diferente seleccionado del grupo que consiste de: CPSs 1, 4, 9, 10, 11, 12, 14, 17, 18, 19, 21, 25, 28, 34, 35, 40, 47, 52, 53, 58, 61, 62, 84, 87, 91, 92, 94, 99, 104, 105, 109, 111, 115, 125, 128, 130, 133, 135, 138, 143, 146, 147, 148, 151, 154, 157, 158, 165, 173, 174, 178, 191, 192, 194, 195, 201, 211, 220, 222, 227, 244, 247 y 250. En una modalidad adicional el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, o más genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizarse bajo condiciones de severidad a un CPS respectivo diferente seleccionado del grupo que consiste de: CPSs 107, 131, 255, 256, 258, 259, 265, 266, 285, 286, 287, 288, 289, 290, 291, 292, 293, 294, y 295. Todavía en otra modalidad preferida, el uno o más genes incluyen al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes, cada uno de los cuales tiene un transcrito de ARN capaz de hibridizarse bajo condiciones de hibridación severa o de configuración de ácido nucleico a un calificador respectivo diferente seleccionado del anexo A. En un ejemplo específico, si el uno o más genes consisten de solamente un gen, los transcritos del ARN del gen no se pueden hibridizar bajo condiciones de hibridación de configuración de ácido nucleico o severa a un calificador seleccionado del grupo que consiste de 37148_at, 39402_at, 31859_at y 38299_at. En otro ejemplo específico, si el uno o más genes consisten de dos genes, los transcritos de ARN de los dos genes no se pueden hibridizar bajo condiciones de hibridación de configuración de ácido nucleico o severas a los calificadores 39402_at y 38299_at. De acuerdo con otro aspecto de la presente invención, se proporciona un método que es útil para el diagnóstico o confirmación de una enfermedad no sanguínea. La enfermedad no sanguínea puede ser un tumor no sólido tal como RCC, cáncer de próstata o cáncer de cabeza o cuello. La enfermedad no sanguínea también puede ser una enfermedad que no es tumor que incluyen enfermedades capaces de provocar insuficiencia renal . El método incluye las etapas de proporcionar al menos una muestra de sangre periférica de un humano que tiene la enfermedad no sanguínea y comparar un perfil de expresión de uno o más' genes en al menos una muestra de sangre periférica con al menos una perfil de expresión de referencia de uno o más genes, en donde cada uno del uno o más genes se expresa diferencialmente en el PBMCs de los pacientes que tiene la enfermedad no sanguínea en comparación con el PBMCs de los humanos libres de enfermedad. En una modalidad, el uno o más genes comprenden al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, o más genes seleccionados de la Tabla 4 de Genes, y la muestra de sangre periférica es una muestra de sangre entera o una muestra que comprende PBMCs enriquecido. En otra modalidad el perfil de expresión de referencia incluye un perfil de expresión del uno o más genes en las muestras de sangre periféricas de humanos que no tienen la enfermedad no sanguínea o están libres de enfermedades. Todavía en otra modalidad el nivel de expresión promedio de cada uno del uno o más genes PBMCs de los pacientes que tiene la enfermedad no sanguínea es substancialmente superior o substancialmente inferior a aquel de PBMCs de humanos que no tienen la enfermedad no sanguínea o están libres de enfermedad.
De acuerdo con todavía otro aspecto de la presente invención, se proporciona un método que es útil para identificar un gen que se expresa diferencialmente en muestras de sangre periféricas de pacientes con enfermedad no sanguínea en comparación con las muestras de sangre periférica de los humanos de referencia. El método comprende las etapas de proporcionar un perfil de expresión de uno o más genes en muestras de sangre periférica de pacientes con enfermedad no sanguínea, suministrando un perfil de expresión de referencia del uno o m s genes en muestras de sangre periférica de humanos de referencia, y comparar el perfil de expresión con el perfil de expresión de referencia para identificar un gen que se expresa diferencialmente en pacientes con enfermedad no sanguínea con relación a los humanos de referencia. El perfil de expresión y el perfil de expresión de referencia se pueden determinar por ejemplo, al hibridizar el A Nc o ADNc preparado a partir de muestras de sangre periférica con una o más configuraciones de ácido nucleico. Los humanos de referencia pueden ser humanos libres de enfermedad. Los humanos de referencia también pueden tener la enfermedad no sanguínea pero en un estado de enfermedad diferente o con una respuesta clínica diferente que los pacientes investigados. En una modalidad, la enfermedad no sanguínea es un tumor sólido.
De acuerdo con todavía otro aspecto de la presente invención, se proporciona un kit que es útil para el diagnóstico del RCC u otros tumores sólidos. En una modalidad, el kit incluye la menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, o más polinucleótidos , cada polinucleótido es capaz de hibridizar bajo condiciones severas un transcrito de ARN o el complemento del mismo, de un gen respectivo diferente que se expresa diferencialmente en el PBMCs de pacientes que tiene un tumor sólido en comparación con el PBMCs de humanos libres de enfermedad. En otra modalidad el kit incluye al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, o más anticuerpos, cada anticuerpo es capaz de enlazarse a un polipéptido codificado por un gen respectivo diferente que se expresa diferencialmente de PBMCs de pacientes que tiene un tumor sólido con relación a los humanos libres de enfermedad . De acuerdo con un aspecto adicional de la presente invención, se proporciona un sistema que es útil para el diagnóstico de una enfermedad no sanguínea. La enfermedad no sanguínea es un tumor sólido tal como RCC, cáncer de próstata, o cáncer de cabeza y cuello. El sistema incluye una memoria que almacena uno o más perfiles de expresión de referencia de al menos un gen en muestras de sangre periférica de los humanos de referencia.. Cada gen se 13 expresa diferencialmente en el PBMCs de pacientes que tienen la enfermedad no sanguínea en comparación con el PBMCs de humanos libres de enfermedad. Las muestras de sangre periférica pueden ser muestras de sangre entera o muestras que comprenden los PBMCs enriquecidos. El uno o más perfiles de expresión de referencia pueden incluir un perfil de expresión de sangre periférica de humanos libres de enfermedades. El uno o más perfiles de expresión de referencia pueden incluir un perfil de expresión de sangre periférica de humanos libres de enfermedades. El uno o más perfiles de expresión de referencia también puede incluir un perfil de expresión de sangre periférica de un paciente que tiene la enfermedad no sanguínea. Además el uno o más perfiles de expresión de referencia puede incluir un perfil de expresión de sangre de periférica de pacientes que tienen otra enfermedad no sanguínea. El sistema incluye además un programa capaz de comparar un perfil de expresión de interés con el uno o más perfiles de expresión de referencia, y un procesador capaz de ejecutar el programa. En una modalidad el programa emplea un algoritmo de votación ponderado.
Breve Descripción de las Figuras Esta solicitud incorpora como referencia la descripción completa incluyendo todas las figuras de la solicitud de 14 patente de utilidad de E.U.A presentada el 21 de Noviembre de 2003 y titulada "Métodos para el diagnóstico de CC y otros Tumores Sólidos" . Los dibujos se suministran, como ilustración y no como limitación. La figura 1 detalla la verificación estadística de los genes de la enfermedad de RCC identificados en esta invención. La figura 2 muestra en dendrograma de la relatividad de la muestra usando valores de expresión de genes expresados . La figura 3 es un diagrama que resume los resultados de la validación cruzada de un conjunto de entrenamiento para el conjunto del gen predictor de tamaño creciente. La figura 4 ilustra los niveles de expresión relativos de un conjunto de ocho genes predictivos en un conjunto de entrenamiento . La figura 5A demuestra los resultados de validación cruzados para cada muestra en el conjunto de entrenamiento usando el conjunto predictor de ocho genes como se ilustra en la figura 4. La figura 5B muestra los resultados de predicción para el conjunto de prueba remanente de muestras de RCC y de PBMC normales usando el conjunto predictor de ocho genes como se ilustra en la figura 4.
Descripción Detallada de la Invención I. Definición Como se usa en la presente la Tabla 2 CPS se refiere a secuencias de sonda de clasificación completas (CPSs) enlistadas en la Tabla 2. La Tabla 4 de genes se refiere a los genes en la Tabla 4. Un "gen" se refiere a una secuencia de ADN en el genoma humano, a partir del cual al menos se puede transcribir una molécula de ADN. Como se usa en la presente invención, un gen puede ser un gen hipotético o supuesto, la expresión del cual se soporta por datos de EST o ARNm. Un "humano libre de enfermedad" se refiere a un humano que no tiene ningún cáncer u otras enfermedades que requieran atención o tratamiento médico. "Condiciones de severidad" son al menos tan severas como por ejemplo, las condiciones G-L que muestran en la Tabla 1. "Condiciones altamente severas" , son al menos tan severas como las condiciones A-F que se muestran en la Tabla 1. Como se usa en la Tabla 1 la hibridación se efectúa bajo las condiciones de (hibridación temperatura de hibridación y amortiguamiento) por alrededor de 4 horas, seguido por dos lavados de 20 minutos bajo las condiciones de lavado correspondiente (temperatura de lavado y de la solución amortiguadora) .
Tabla 1. Condiciones de Severidad.
Condición Híbrido de Longitud temperatura de Temperatura de polinucleótido del hibridación y de lavado y severidad híbrido solución solución (bp)1 amortiguadora H amortiguadora8 ? ADN:ADN >50 65 °C; lxSSC o 65°C; 42°C; lxSSC, 0.3xSSC 50% formamida B ADN:ADN >50 TB *; lxSSC TB * lxSSC ' C ADN: RN >50 67 °C; lxSSC o 67 °C; 45°C; lxSSC, 0.3xSSC 50% formamida D AD :ARN >50 TD *; lxSSC TD *; lxSSC E AR : RN >50 70°C; 1XSSC o 70°C; 0.3 x 50°C; lxSSC, SSC 50% formamida F ARN:ARN >50 TF *; lxSSC Tf * lxSSC G ADN:ADN >50 65°C; 4xSSC o 65 °C; lxSSC 42°C; 4xSSC, 50% formamida H AD rADN >50 TH *; 4xSSC TH *; 4xSSC I ADN: RN >50 67 °C; 4xSSC o 67 °C; lxSSC 45°C; 4xSSC, 50% formamida J ADN:AKN >50 Tj *; 4xSSC Tj *; 4xSSC ? AR rAR >50 70°C; 4xSSC o 67 °C; lxSSC 50°C; 4xSSC, 50% formamida L AR :AR >50 TL *; 2xSSC TL *; 2XSSC 1 : La longitud del híbrido es aquella que se anticipa para las regiones hibridizadas de los polinucleótidos hibridizantes . Cuando se hibridiza un polinucleótido a un polinucleótido objetivo de una secuencia desconocida la longitud del híbrido se asume que sea aquella del polinucleótido hibridizante . Cuando se hibridizan los polinucleótidos de la secuencia conocida, la longitud del híbrido se puede determinar a al alinear las secuencias de los polinucleótidos e identificar la región o regiones de complementariedad óptima de secuencias . H: SSPE (lxSSPE es 0.15M NaCl, lOmM NaH2P04, y 1.25mM EDTA, pH 7.4) se puede substituir por SSC (IxSSC es 0.15M NaCl y citrato de sodio ' 15mM) en las soluciones amortiguadores de hibridación y lavado. TB*-TR*: La temperatura de hibridación para los híbridos se anticipa que sea menor que 50 pares base de longitud debe ser 5-10°C menor que la temperatura de fusión (Tm) del híbrido, en donde Tm se determina de acuerdo con las siguientes ecuaciones. Para los híbridos de 18 pares base de longitud Tm(°C) = 2 (# de A + T bases) + 4 (# de G + C bases) . Para los híbridos entre 18 y 49 pares base de longitud Tm (°C) = 81.5 + 16.6 (logi0Na+) + 0.41 (%G + C) - (600/N) , en donde N es el número de bases en el híbrido y Na+ es la concentración molar de iones sodio en la solución amortiguadora de hibridación (Na+ para lxSSC = 0.165M). Se describen varios aspectos de la invención en mayor detalle en las siguientes secciones y subsecciones. El uso de las secciones y subsecciones no significa que limite la invención, cada sección y subsección se puede aplicar a cualquier aspecto de la invención.
II. La invención La presente invención proporciona métodos para el diagnóstico de RCC y otros tumores sólidos al detectar los patrones de expresión de genes en la sangre periférica. La presente invención identifica una pluralidad de genes de enfermedad RCC que se expresan diferencialmente en la sangre periférica de los pacientes RCC en comparación con los humanos libres de enfermedad. Al menos un subconjunto de estos genes de enfermedad RCC también se expresa diferencialmente en otros tumores sólidos tales como el cáncer de próstata y el cáncer de cabeza y cuello. Por lo tanto, estos genes se puede usar como marcadores substitutos para detectar la presencia o ausencia de RCC y/u otros tumores sólidos. En una modalidad, los patrones de expresión de estos genes en la sangre periférica se pueden determinar al evaluar los niveles de los transcritos de ARN de estos genes en muestras de sangre periférica. Las muestras de sangre periférica pueden ser las muestras de sangre o de sangre entera que contienen los PBMCs enriquecidos . Los métodos adecuados para la detección de los niveles de ARN incluyen pero no se limitan a RT-PCT, cuantitativa, inmunotransferencia Northerm, hibridación in situ, inmunotransferencia Southerm, inmunotransferencia de ranura ensayo de protección de nucleasas y conf guraciones de ácidos nucleicos. En otra modalidad los patrones de expresión de genes se pueden determinar al detectar los niveles de los polipéptidos codificados por los genes de enfermedad de tumor sólido. Los métodos adecuados incluyen pero no se limitan a inmunoensayos tales como ELISA (ensayo inmunosorbente ligado a enzimas) , RIA (radio inmunoensayo) , FACS (clasificador de células activadas por fluorescencia) o inmunotranferencia Westerm. Los métodos basados en la electroforesis de gel de poliacrilamida y SDS de dos dimensiones también se pueden usar.
A. Métodos Generales para identificar RCC y genes de enfermedad de tumores sólidos en la sangre periférica. La disponibilidad de la secuencia de genoma humano junto con nuevos desarrollos en tecnología tales como las microconfiguraciones de ADN, proteómica y biología computacional , permite estudios de expresión sistémica de genes para varias enfermedades . Esta invención emplea la técnica de análisis de expresión de genes sistemáticos para identificar genes y/o marcadores que se expresan diferencialmente en la sangre periférica de pacientes con tumores sólidos tales como RCC, cáncer de próstata y cáncer de cabeza y cuello. Estos genes se refieren en la presente como genes de enfermedades de tumores sólidos. En particular, los genes que se expresan diferencialmente en la sangre periférica en los pacientes con RCC en comparación con los humanos libres de enfermedades se refiere como genes de enfermedad RCC. Los genes de enfermedades de tumores sólidos se sobre expresan o subexpresan (incluyendo la no expresión) en la sangre periférica de pacientes con tumores sólidos en comparación con los humanos libres de enfermedades . Por lo tanto, los genes de enfermedad de tumor de sólido se pueden identificar al comparar los patrones de expresión de genes de pacientes con tumores sólidos con los patrones de expresión de genes correspondientes de humanos libres de enfermedad.
Los métodos para la detección y comparación de los patrones de expresión de genes son bien conocidos en el arte. En una modalidad, los patrones de expresión de genes se detectan al medir los niveles de los transcritos de ARN en la sangre periférica. Por ejemplo, los ARN totales o los ARN de polyA+ se pueden aislar a partir de una muestra de sangre periférica. Como se usa en la presente, un material biológico tal como un polinucleótido un polipéptido una célula o una muestra de sangre se aisla si el material biológico se retira de su ambiente nativo. Por ejemplo, un polinucleótido o un polipéptido se pueden aislar mediante un proceso de purificación o extracción. Una muestra de sangre se puede aislar cuando se retira del cuerpo humano. Los ARN aislados luego se amplifican para producir ADNc y ARNc. El nivel de expresión de un gen en la muestra de sangre periférica se puede determinar al medir la cantidad de los ADNc o ARNc correspondientes así amplificados. Un protocolo de amplificación ejemplar utiliza la transcriptasa inversa. Por ejemplo, los ARNm aislados se pueden transcribir primero de manera inversa en los ADNc usando una transcriptasa inversa, y un cebador que consiste de oligo d(T) y una secuencia que codifica el promotor del fago T7. Los ADNc así producidos son de hebra sencilla. Las segundas hebras de los ADNc se sintetizan usando una polimerasa de ADN combinada con una RNasa para fragmentar el híbrido ADN/ARN. Después de la síntesis de los ADNc de hebra doble, la polimerasa T7 de ARN se agrega, y los AR c luego se transcriben de las segundas hebras de los ADNc de hebra doble . En otra modalidad los patrones de expresión de genes se pueden analizar al medir los niveles de los polipéptidos en la sangre periférica. Las cantidades de polipéptidos en una muestra periférica se pueden detectar usando diversos métodos bien conocidos en el arte. Los métodos adecuados incluyen pero no se limitan a inmunoensayos tales como ELISA, RIA, FACS e inmunotransferencia Westerm. Los métodos de identificación y formación de secuencias de proteínas de alta producción también se pueden usar tales como los métodos que se basan en una electroforesis de gel de dos dimensiones y espectrometría de masas. En una modalidad preferida, las muestras de sangre periférica usadas para aislar el ARN o los polipéptidos contiene células mononucleares de sales periféricas purificada o enriquecida (PBMCs) . Los métodos para la preparación de sangre con PBMCs concentrados son bien conocidos en el arte. Por ejemplo, la sangre entera aislada de sujetos humanos se puede centrifugar de gradientes Ficoll o CPTs (tubos de purificación de células) y la fracción que contiene los PBMCs enriquecidos se recolecta. "Enriquecido" significa que un porcentaje de PBMCs en la muestra es mayor que el porcentaje de PBMCs en la sangre entera inicial. Por ejemplo, el porcentaje de PBMCs en la muestra enriquecida puede ser al menos 2 , 3 , 4 , 5 o más veces mayor que aquel en la sangre entera inicial. En una modalidad, la sangre entera se puede usar directamente para separar por exclusión los genes de enfermedad de tumores sólidos. En otra modalidad preferida, las configuraciones de polinucleótidos tales como configuraciones de ADNc o de oligonucleótidos se pueden usar para detectar y/o comparar los perfiles de expresión de genes en la sangre periférica de pacientes con tumores sólidos contra los humanos libres de enfermedades. Las configuraciones de polinucleótidos permiten una detección y monitoreo cuantitativo de los niveles de los transcritos de ARN de un gran número de genes en un tiempo. Las configuraciones de polinucleótidos adecuadas para este análisis global de expresión de genes incluyen pero no se limitan a configuraciones comercialmente disponibles tales como las configuraciones Genechip* de Affymetrix (Santa Clara, CA) o las microconfiguraciones ADNc de Agilent Technologies (Palo Alto, CA) . Los polinucleótidos a ser hibridizados a las microconfiguraciones se pueden etiquetar con una o más porciones de etiquetado para permitir la detección de complejos hibridizados de polinucleótidos. Las porciones de etiquetados pueden incluir composiciones que se puedan detectar por medio espectroscópicos , fotoquimicos , bioquímicos bioelectrónicos , inmunoquímicos , eléctricos, químicos u ópticos. Las porciones de etiquetado incluyen radioisótopos, compuestos quimioluminiscentes, proteínas de enlace etiquetadas, átomos de metales pesados, marcadores espectroscópicos tales como marcadores fluorescentes y colorantes, etiquetas magnéticas, enzimas ligadas, etiquetas de espectrometría de masas, etiquetas de giro, donadores y aceptores de transferencia de electrones y similares. Los polinucleótidos a ser hibridizados a las microconfiguraciones pueden ser ADN o AKN. Se pueden llevar a cabo reacciones de hibridación en formatos de hibridación absolutos o diferenciales. En el formato de hibridación absoluto, los polinucleótidos derivados de una muestra tal como una muestra de sangre periférica de un paciente con RCC o un humano libre de enfermedad, se hibridizan a las ondas en una microconfiguración. Las señales detectadas después de la formación de los complejos de hibridación se correlacionan con los niveles del polinucleótido en la muestra. En el formato de hibridación diferencial los polinucleótidos derivados de dos muestras biológicas tales como una de pacientes con tumores de sólidos y la otra libre de enfermedad se etiquetan con diferentes porciones de etiquetado. Una mezcla de estos polinucleótidos diferentemente etiquetados se agrega a una microconfiguración. La microconfiguración luego se examina bajo condiciones en las cuales las emisiones de dos etiquetas diferentes son individualmente detectables. En una modalidad, los fluoróforos Cy3 y Cy5 (Amersham Pharmacia Biotech, Piscataway N.J.) se usan como las porciones de etiquetado para el formato de hibridación diferencial . Se pueden analizar las señales reunidas de las microconfiguraciones usando un software comercialmente disponible tal como aquel suministrado por Affymetrix o Agilent Technologies. Los controles tales -como para la sensibilidad de barrido etiquetado de sondas y cuantificacion de ADNc se incluyen preferiblemente en los experimentos de hibridación. Las señales de expresión de microconfiguraciones se pueden escalar o normalizar antes de someterse a un análisis adicional. Por ejemplo, las señales de expresión para cada gen se pueden normalizar para tomar en cuenta las variaciones en las intensidades de hibridación cuando se usa más de una configuración bajo condiciones de prueba similares. Las señales para hibridación compleja de polinucleótidos individuales también se pueden normalizar usando la intensidades derivadas de controles internos de normalización contenidos en cada configuración. Además, los genes con niveles de expresión relativamente consistentes a través de las muestras se pueden usar para normalizar los niveles de expresión de otros genes. En una modalidad, los niveles de expresión de los genes son normalizados a través de las muestras de manera tal que la media es cero y la desviación estándar es uno. En otra modalidad de los datos de expresión detectados por la microconfiguracion se somete a un filtro de variación que excluyen genes que muestran una variación mínima o un significante a través de todas las muestras . Los perfiles de expresión en las muestras de sangre periférica en pacientes con tumores sólidos, se pueden comparar con los perfiles de expresión de genes correspondientes en las muestras de sangre periférica de humanos libres de enfermedad. Los genes que se expresan diferencialmente en pacientes con tumores sólidos con relación a los humanos libre de enfermedades se identifican. Preferiblemente el nivel de expresión de un gen de enfermedad de un tumor sólido es substancialmente mayor o menor en pacientes con tumores sólidos que en humanos libres de enfermedad. "Substancialmente superior" significa que el nivel de expresión promedio de un gen en las muestras de sangre periférica de pacientes con tumores sólidos es al menos 1.5 veces mayor al nivel de expresión promedio del gen en las muestras de sangre periférica de humanos libres de enfermedad. Por ejempl'o, el nivel de expresión promedio en pacientes con tumores sólidos puede ser de al menos 2, 3, 4, 5, 10, 20, o más veces sobre el nivel de expresión promedio en humanos libres de enfermedad. "Substancialmente menor" significa que el nivel de expresión promedio de un gen en las muestras de sangre periférica de pacientes con tumores sólidos no es mayor que 0.67 veces sobre el nivel de expresión de promedio del · gen en muestras de sangre periférica de humanos libres de enfermedad. Por ejemplo, el nivel de expresión promedio en pacientes con tumores sólidos no puede ser mayor que 0.5, 0.33, 0.25, 0.1, 0.05 o menos veces sobre el nivel de expresión promedio en humanos libres de enfermedad. En una modalidad, los genes de la enfermedad de tumores sólidos se pueden identificar usando algoritmos de agrupamiento con base en los datos de expresión de los genes de microconfiguración. Por ejemplo, el análisis de agrupamiento no supervisado se pueden usar para analizar y categorizar genes con patrones de expresión diferentes, con ello se identifican genes de enfermedad de tumores sólidos. Los algoritmos para el análisis de agrupamiento no supervisado incluyen pero no se limitan a, mapas auto-organizados (SOMs) , análisis de componentes de principios, agrupamiento de ligaduras promedio y agrupamiento jerárquico.
También se puede emplear un análisis de agrupamiento supervisado para organizar e identificar los genes de enfermedades de tumores sólidos. Bajo un análisis de agrupamiento supe.rvi.3ado, el estado de enfermedad de la fuente a partir de la cual se deriva un patrón de expresión de genes ya se conoce. Los algoritmos para el análisis de agrupamiento supervisados incluyen pero no se limitan a prueba de los vecinos más cercanos, máquinas de vectores de soporte y SPLASH. Se pueden usar ya sea métricas de correlación de dos clases o multiclase. En una modalidad preferida, un análisis de vecindad basado en la prueba de permutación se usa para analizar los datos de expresión de genes de microconfiguración con objeto de identificar los genes de enfermedades de tumores sólidos. El algoritmo para el análisis de vecindad se describe en T.R Golub, et al., Science, 286: 531-537 (1999), and D.K. Slonim et al . , Procs . of the Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan, Abril 8-11, p263-272 (2000) , ambas de las cuales se incorporan en la presente como referencia. Bajo una forma del análisis de una vecindad, el perfil de expresión de cada gen se representa por un vector de expresión = (ei, e2, e3,...,en), en donde ei corresponde al nivel de expresión del gen "g" en la muestra enésima. Una distinción de clase se representa por un patrón de expresión idealizado c = (ci, c2, c3, ... , cn) donde cx 0 1 o -1, depende de si la muestra enésima se aisla de la clase 0 o la clase 1. La clase 0 puede consistir de pacientes con un tumor sólido en particular tal como RCC, y la clase 1 puede representar humanos libres de enfermedad. La clase 0 también puede consistir de pacientes con diferentes tumores sólidos. La correlación del gen "g" a la distinción de clase se puede calcular usando un registro de señal a ruido: en donde xO (g) y xl(g) representa la media del algoritmo del nivel de expresión del gen xxg" en la clase 0 y la clase 1, respectivamente y sdO(g) y sdl (g) representa la desviación estándar del algoritmo de la expresión del gen "g" en la clase 0 y la clase 1 respectivamente. Un valor absoluto superior de un registro de señal a ruido indica que el gen correspondiente es más altamente expresado en una clase que en la otra. Una densidad inusualmente alta de genes dentro de las vecindades de la distinción de clase en comparación con los patrones aleatorios, sugiere que muchos genes tienen patrones de expresión que se correlacionan significativamente con la distinción de clase. Se puede seleccionar una pluralidad de genes de enfermedades de tumores sólidos usando el análisis de vecindad. En una modalidad, cada gen de enfermedad de tumores sólidos asi seleccionado tiene un nivel de expresión substancialmente mayor a inferior en PBMCs de pacientes con tumores sólidos que en un PBMCs de humanos libres de enfermedad. En otra modalidad, los genes de la enfermedad de tumores sólidos seleccionado tiene valores absolutos superiores de P(g,c) . Todavía en otra modalidad los genes de la enfermedad seleccionado de tumores sólidos incluyen ambos genes que se expresan altamente en la clase 0 (tales como los pacientes RCC) y los genes que se expresan altamente en la clase 1 (tales como los humanos libres de enfermedades) . Los genes de enfermedad de tumores sólidos seleccionados en la presente invención se pueden involucrar en diferentes trayectorias o mecanismos biológicos . En una modalidad, el número de genes de enfermedad de tumores sólidos seleccionados se limita a aquellos que se muestra que correlaciona significativamente por la prueba de permutación tal como en un nivel importante del 1 o 2%. Como de usa en la presente un nivel importante de x% significa que x% de las vecindades aleatorias contienen tantos genes como la vecindad real alrededor de la distinción de clases. Los métodos generales para la identificación de genes de enfermedades de tumores sólidos se pueden usar para identificar genes cuyos niveles de expresión en la sangre periférica o PBMCs se correlacionan con etapas diferentes del desarrollo, avance o tratamiento de tumores sólidos. Los pacientes se pueden agrupar con base en sus diferentes etapas de tratamiento o desarrollo de la enfermedad. El análisis global de expresión de genes se puede emplear para buscar genes que se expresen diferencialmente en una etapa en comparación con la otra etapa. Los genes asi identificados se pueden usar como marcadores para monitorear el avance o tratamiento de los tumores sólidos .
B. Identificación de Genes de la enfermedad RCC. En una modalidad, se usan microplaguetas de gen HG-U95Av2 (fabricada por Affymetrix) para detectar y comparar los niveles de transcrito de AR en muestras de sangre periférica enriquecida con PBMC preparada de pacientes RCC y humanos sin enfermedad. La Tabla 2 enlista ejemplos de calificadores en la microplaqueta del gen HG-U95Av2. Cada calificador representa sondas de oligonucleótidos múltiples que se enlazan establemente a regiones discretas en la microplaqueta del gen. El anexo A que se incorpora en la presente para referencia, enlista ejemplos de calificadores y sus correspondientes sondas de oligonucleótidos. Cada calificador en la Tabla 2 corresponde a al menos un gen de enfermedad RCC que se expresa diferencialmente en la sangre periférica de pacientes^ RCC en comparación con humanos sin enfermedad. En general los genes de enfermedad RCC correspondientes de un calificador pueden hibridizarse bajo condiciones de hibridización de configuración de ácido nucleico o severas a las sondas de oligonucleotido enlistadas bajo el mismo calificador en el anexo A.
La SEQ ID NO enlistada bajo cada calificador en la Tabla 2 describe un ADNc o secuencia genómica, o el complemento de los mismos, de los correspondientes genes de enfermedad RCC. Los fragmentos de la SEQ ID NO pueden usarse para hacer sondas de oligonucleótidos para detectar, los transcritos de ARN de los correspondientes genes de enfermedad RCC. El anexo A incluye algunos ejemplos de las sondas de oligonucleótido hechas así. Cada SEQ ID NO puede tener un número de acceso a la base de datos de secuencias de nucleótidos Entrez correspondientes. Las SEQ ID NOs y sus correspondientes números de acceso se ilustran en la Tabla 3. La base de datos de secuencia de nucleótidos Entrez se mantiene por National Center of Biotechnology Information (NCBI) , National Library of Medicine, Washington, DC, U. S. A. La base de datos se conoce públicamente y es fácilmente accesible. La base de datos de secuencias de nucleótidos Entrez contiene datos de secuencias del GenBank, EMBL y DDBJ. La secuencia descrita bajo cada SEQ ID NO puede derivarse de las secuencias descrita bajo el correspondiente número de acceso Entrez. Los residuos de nucleotido ambiguos ("n") en las SEQ ID NOs pueden determinarse usando métodos como se aprecia por alguien con experiencia en el arte. Por ejemplo, los residuos ambiguos pueden determinarse al alinear las SEQ ID NOs a sus correspondientes genes. Las secuencias de estos genes pueden obtenerse de varias bases de datos de secuencias de genoma humanos. Los residuos de nucleotido ambiguos pueden tener también determinarse al volver a procesar por secuencia las correspondientes SEQ ID NOs o las secuencias bajo los correspondientes números de acceso Entrez. Generalmente, cada posición ambigua representa ya sea al menos un nucleótido seleccionado de a, c, g, o t, o no contiene residuo de nucleótido. Cada calificador tiene una secuencia de sonda de clasificación correspondiente (CPS) que se deriva de la SEQ ID NO enlistada bajo . el mismo calificador. La correspondiente CPS consiste de la menos parte de la SEQ ID NO, o el complemento de la misma. Preferiblemente, cada CPS no contiene ningún residuo de nucleótidos ambiguos. Más preferiblemente, cada CPS contiene al menos una sonda de oligonucleótido enlistada bajo el correspondiente calificador en el anexo A. Cada CPS es capaz de hibridizar bajo condiciones severas o altamente severas a los transcritos de ARN de los genes de enfermedad RCC representados por el calificador correspondiente. Todos los CPSs enlistados en la Tabla 2 se refieren colectivamente como "CPS-Tabla-2" . Los transcritos de ARN, tales como ARNm, pueden aislarse de muestras de sangre periférica enriquecidas con PBMG de pacientes RCC y humanos sin enfermedades. Los ARNc pueden entonces prepararse usando los protocolos descritos en los Manuales Técnicos de Análisis de Expresión de Affymetrix. La subsección G de esta especificación proporciona ejemplos detallados para la preparación de muestras, la hibridización de la microplaqueta de gen HG-U95Av2, el análisis de datos posteriores.
Se colecta una señal de hibridización para cada sonda de oligonucleótido en la plaqueta de gen. Las señales para las sondas de oligonucleótidos con el mismo calificador se promedian. Los calificadores que producen señales de hibridización diferentes en las muestras RCC con relación a las muestras sin enfermedad se identifican. Los ejemplos de los calificadores identificados se enlistan en la Tabla 2. ' Cada perfil de expresión RCC en la Tabla 2 ("Nivel de expresión promedio en pacientes RCC") es un promedio de 45 pacientes RCC, mientras cada perfil de expresión para humanos sin enfermedad ("Nivel de expresión promedio en humanos sin enfermedad") es un promedio de 20 humanos sin enfermedad. El nivel de expresión promedio bajo cada calificador en la Tabla 2 representa el nivel de transcrito de ARN de los correspondientes genes de enfermedad RCC. La relación de cada perfil de expresión RCC sobre el perfil de expresión sin enfermedad correspondiente se proporciona bajo "veces de cambio" . El valor P de una prueba T de Student (distribución de dos confecciones, variación de dos muestras desiguales) para cada calificador también se proporcionan. El valor P sugiere el significado estadístico de la diferencia entre cada perfil de expresión RCC y el correspondiente perfil de expresión sin enfermedad. Los valores P más bajos indican un significado más estadístico para las diferencias observadas en pacientes RCC y humanos sin enfermedad. 35 Tabla 2. Comparación de los niveles de expresión entre pacientes RCC y humanos sin enfermedad CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 1 40310_at nucleótidos 34.8 13.8 4.8E- 2.5 2325 hasta 10 2635 de SEQ ID N0:1 2 41126_at El 5.71 2.7 1.9E- 2.1 complemento 09 de los nucleótidos 81 hasta 523 de SEQ ID NNO 2 3 35367_at nucleótidos 107 51.4 2.4E- 2.1 61 hasta 09 865 de SEQ ID NO: 3 36 CPS Calificador CPS Nivel de Nivel de Valor Veces de o. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=45) (n=20) 4 41193_ at Nucleótidos 26.2 8.2 2.7E- 3.2 2095 hasta 09 2390 de SEQ ID NO: 4 5 38829_r_ SEQ ID NO: 19.7 7.9 5.0E- 2.5 at 5 09 6 41102_at nucleótidos 8.44 1.95 5.4E- 4.3 1144 hasta 09 1607 de SEQ ID NO: 6 7 40210_at nucleótidos 9.89 4.25 2.1E- 2.3 S16 hasta 08 1159 de SEQ ID NO: 7 37 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t ¦ de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 8 37069_at nucleótidos 4.64 2.2 2.9E- 2.1 847 hasta 08 1236 de SEQ ID NO: 8 9 39530_at nucleótidos 8.51 4.15 3.0E- 2.05 1129 hasta 08 1365 de SEQ ID NO: 9 10 38739_at nucleótidos 6.4 3 3.5E- 2.1 46637 hasta 08 47224 de SEQ ID NO: 10 11 32133_at nucleótidos 12.9 4.45 3.7E- 2.9 4460 hasta 08 5038 de SEQ ID NO: 11 38 CPS Calificador CPS Nivel de Nivel de Valor Veces de NO. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 12 33873_at nucleótidos 15.7 6.9 4.5E- 2.3 950 hasta 08 1324 de SEQ ID NO: 12 13 39854_r_at nucleótidos 34.6 14.05 5.5E- 2.7 988 hasta 08 1568 de SEQ ID NO: 13 14 38546_at nucleótidos 4.4 2.05 5.6E- 2.1 4101 hasta 08 4542 de SEQ ID NO: 14 15 1856_at nucleótidos 8.47 3.7 5.8E- 2.3 1544 hasta 08 1984 de SEQ ID NO: 15 39 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio prueba (RCC/libre en en humanos t de pacientes sin enfermedad) RCC enfermedad (n=45) es (n=20) 16 36892_at nucleótidos 4.58 2.25 8.4E- 2.0 3458 hasta 08 4037 de SEQ ID NO: 16 17 37152_at nucleótidos 8.47 3.5 9.9E- 2.4 3047 hasta 08 3258 de SEQ ID NO: 17 18 37603_at nucleótidos 68.1 16.6 1.2E- 4.1 1184 hasta 07 1653 de SEQ ID NO: 18 19 37148_at nucleótidos 41.2 18.25 1.8E- 2.3 2098 hasta 07 2157 de SEQ ID NO: 19 20 34740_at SEQ ID NO: 65.1 22.25 1.8E- 2.9 20 07 40 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 21 377 _at nucleótidos 27.0 13.15 2.0E- 2.05 127 hasta 07 557 de SEQ ID NO: 21 22 36567_at nucleótidos 6.02 2.8 2.1E- 2.15 154 hasta 07 380 de SEQ ID NO: 22 23 38S56_at nucleótidos 4.56 2.1 2.8E- 2.2 688 hasta 07 1225 de SEQ ID NO: 23 24 32207_at nucleótidos 64.7 19.2 2.9E- 3.4 1399 hasta 07 1771 de SEQ ID NO: 24 41 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 25 36791_g_at nucleótidos 7.62 3.65 3.0E- 2.1 1002 hasta 07 1399 de SEQ ID NO: 25 26 31684_at nucleótidos 5.73 2.85 3.2E- 2.0 812 hasta 07 1206 de SEQ ID NO: 26 27 1401_g_at nucleótidos 6.73 2.3 3.3E- 2.9 2634 hasta 07 2981 de SEQ ID NO: 27 28 37542_at nucleótidos 8.8 2.35 3.5E- 3.7 3676 hasta 07 4193 de SEQ ID NO: 28 42 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) CC (n=20) • (n=45) 29 37966_at El 7.29 3.25 3.8E- 2.2 complemento 07 de los nucleótidos 34 hasta 320 de SEQ ID NO: 29 30 3878 _g_at nucleótidos 7.51 2.75 4.1E- 2.7 1231 hasta 07 1363 de SEQ ID NO: 30 31 40331_at nucleótidos 5.29 2 4.2E- 2.6 1177 hasta 07 1673 de SEQ ID NO: 31 32 40371_at nucleótidos 12.0 3.55 4.3E- 3.4 2127 hasta 07 2443 de SEQ ID NO: 32 43 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 33 32339_at El 7.67 3.3 5.2E- 2.3 complemento 07 de los rrucleótidos 9 hasta 433 de SEQ ID NO: 33 34 34435_at nucleótidos 23.4 9.4 6.6E- 2.5 2300 hasta 07 2842 de SEQ ID NO: 34 35 37136_at nucleótidos 4.78 2.2 7.0E- 2.2 1547 hasta 07 2068 de SEQ ID NO: 35 36 37285_at nucleótidos 370 54.1 7.0E- 6.8 1344 hasta 07 1921 de SEQ ID NO: 36 44 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 37 37391_at nucleótidos 136 38.45 LIE3.5 1022 hasta OS 1395 de SEQ ID NO: 37 38 35692_at nucleótidos 13.6 4.6 LIE3.0 557 hasta OS 1078 de SEQ ID NO: 38 39 38 49_at SEQ ID NO: 19.5 4.9 1.1E- 4.0 39 06 40 37002_at nucleótidos 42.2 11.05 1.2E- 3.8 252 hasta 06 819 de SEQ ID NO: 40 41 1139_at nucleótidos 10.8 4.95 1.3E- 2.2 813 hasta 06 1383 de SEQ ID NO: 41 45 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión P de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 42 1622_at nucleótidos 84.2 39.4 1.4E- 2.1 1830 hasta 06 2074 de SEQ ID NO: 42 43 32606_at Nucleótidos 15.8 7.7 1.4E- 2.1 12 hasta 542 06 de SEQ ID NO_ 43 44 39436_at nucleótidos 82.3 24.3 1.7E- 3.4 926 hasta 06 1154 de SEQ ID NO: 44 45 40274_at nucleótidos 8.27 19.5 1.7E- 0.42 561 hasta 06 736 de SEQ ID NO: 45 46 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 46 37945_at nucleótidos 8.13 3.85 1.9E- 2.1 1179 hasta 06 1492 de SEQ ID NO: 46 47 34255_at nucleótidos 7.47 2.85 2.1E- 2.6 1417 hasta 06 1798 de SEQ ID NO: 47 48 905_at nucleótidos 103 45.75 2.3E- 2.3 268 hasta 06 814 de SEQ ID. NO: 48 49 1569_r_at nucleótidos 9.27 4.45 2.5E- 2.1 4183 hasta 06 4257 de SEQ ID NO: 49 47 48 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) CC (n=20) (n=45) 55 2090_i_at nucleótidos 54.4 26.2 4.1E- 2.1 2 hasta 36 06 de SEQ ID NO: 55 56 37412_at nucleótidos 8.27 3.25 4.1E- 2.5 1319 hasta 06 1692 de SEQ ID NO: 56 57 39799_at nucleótidos 24.6 7.2 4.2E- 3.4 409 hasta 06 662 de SEQ ID NO: 57 58 31859_at nucleótidos 6.31 2.7 4.6E- 2.3 1756 hasta 06 2123 de SEQ ID NO: 58 49 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba ( CC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 59 37661_at nucleotidos 19.5 8.35 4.8E- 2.3 4061 hasta 06 4398 de SEQ ID NO: 59 60 36393_at nucleotidos 5.69 2.7 5.0?- 2.1 806 hasta 06 1398 de SEQ ID NO: 60 61 39994_at nucleotidos 10.0' 4 5.1E- 2.5 1878 hasta 06 2214 de SEQ ID NO: 61 62 35597_at nucleotidos 5.22 2.35 5.3E- 2.2 282 hasta 06 675 de SEQ ID NO: 62 50 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) CC (n=20) (n=45) 63 36780_at nucleótidos 172 79.95 5.7E- 2.15 1236 hasta 06 1651 de SEQ ID NO: 63 64 34476_r_at nucleótidos 11 3.5 5.7E- 3.1 4012 hasta 06 4358 de SEQ ID NO: 64 5 33862_at nucleótidos 3.91 1.85 5.7E- 2.1 1027 hasta 06 1445 de SEQ ID NO: 65 66 956_at SEQ ID NO: 23.0 8.7 5.8E- 2.6 66 06 67 40769_r_at nucleótidos 22.9 10.35 6.3E- 2.2 6070 hasta 06 6132 de SEQ ID NO: 67 51 CPS Calificador CPS Nivel de Nivel de Valor Veces de o. expresión expresión p de cambio promedio promedio en prueba ( CC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 68 41790_at nucleótidos 4.2 1.8 6.6E- 2.3 80268 hasta 06 80822 de SEQ ID NO: 68 68 0456_at nucleótidos 11.3 5.15 6.8E- 2.2 733 hasta 06 1310 de SEQ ID NO: 69 70 40647_at nucleótidos 17.4 5.85 7.4E- 3.0 4621 hasta 06 5041 de SEQ ID NO: 70 71 31834_r_at nucleótidos 5.78 2.85 7.8E- 2.0 4249 hasta 06 4499 de SEQ ID NO: 71 52 CPS Calificador CPS Nivel de Nivel de Valor Veces de ??. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n= 5) 72 38119_at nucleótidos 137 60.95 8.1E- 2.3 437 hasta 06 935 de SEQ ID NO: 72 73 1670_at nucleótidos 3.62 1.8 8.1E- 2.0 977 hasta 06 1421 de SEQ ID NO: 73 74 1649_at nucleótidos 10.5 4.4 8.1E- 2.4 384 hasta 06 651 de SEQ ID NO: 74 75 38868 at nucleótidos 7.82 3.25 9.3E- 2.4 205 hasta 06 808 de SEQ ID NO: 75 53 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 76 37952_at nucleótidos 13.4 5.25 1.0E- 2.6 3852 hasta 05 4432 de SEQ ID NO: 76 77 65 _at nucleótidos 65.4 21.35 1.1E- 3.1 1905 hasta 05 2355 de SEQ ID NO: 77 78 39839_at nucleótidos 70.2 16.3 1.2E- 4.3 1398 hasta 05 1568 de SEQ ID NO: 78 79 17 3_i_at nucleótidos 10.4 4.1 1.2E- 2.5 1613 hasta 05 2103 de SEQ ID NO: 79 54 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio' promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 80 37405_at nucleótidos 140 20.3 1.2E- 6.9 1113 hasta 05 1429 de SEQ ID NO: 80 81 936-s-at nucleótidos 12.0 3.95 1.3E- 3.0 60 hasta 05 556 de SEQ ID NO: 81 82 37323_r_at nucleótidos 5.09 2.25 1.6E- 2.3 130 hasta 05 517 de SEQ ID NO: 82 83 33336_at SEQ ID NO: 58.0 7.75 1.7E- 7.5 83 05 84 36229_at nucleótidos 3.84 1.9 1.8E- 2.0 2518 hasta 05 2844 de SEQ ID NO: 84 55 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 87 41442_at nucleótidos 8.69 2.55 2.1E- 3.4 3614 hasta 05 4179 de SEQ ID NO: 85 89 33080_s_at nucleótidos 170 51.95 2.1?- 3.3 5056 hasta 05 5248 de SEQ ID NO: 86 90 34742_at nucleótidos 14.3 3.35 2.2E- 4.3 774 hasta 05 926 de SEQ ID NO: 87 91 37026_at nucleótidos 54.3 24.9 2.2E- 2.2 803 hasta 05 1325 de SEQ ID NO: 88 56 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de ' pacientes enfermedades enfermedad) RCC (n=20) (n=45) 92 34777_at nucleótidos 50.3 20.15 2.3E- 2.5 901 hasta 05 1449 de SEQ ID NO: 89 93 36037_g_at nucleótidos 13 2.35 2.4E- 5.5 6396 hasta 05 6496 de SEQ ID NO: 90 94 4064 _g_at nucleótidos 19.7 6.35 2.4E- 3.1 2734 hasta 05 2853 de SEQ ID NO: 91 95 35331_at nucleótidos 5.16 2.2 2.6E- 2.3 2038 hasta 05 2395 de SEQ ID NO: 92 57 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) CC (n=20) (n=45) 96 875_g_at en 98 14.75 3.2E- 6.6 nucleótidos 05 562 hasta 886 de SEQ ID NO: 93 97 35773_i_at el 21.0 5.7 3.3E- 3.7 complemento 05 de los nucleótidos 98 hasta 398 de SEQ ID NO: 94 98 39802_at nucleótidos 18.9 5.2 3.4E- 3.6 444 hasta 05 991 de SEQ ID NO: 95 58 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 99 37220_at nucleótidos 8.67 4.05 3.9E- 2.1 150 hasta 05 425 de SBQ ID NO: 96 00 37192_at nucleótidos 94.8 23.6 3.9E- 4.0 2337 hasta 05 2715 de SEQ ID NO: 97 01 31610_at nucleótidos 18.4 7.95 3.9E- 2.3 224 hasta 05 512 de SEQ ID NO: 98 02 37104_at nucleótidos 17.4 2.85 4.0E- 6.1 1227 hasta 05 1673 de SEQ ID NO: 99 59 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio - promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades 'enfermedad) CC (n=20) (n=45) 103 38582_at el 5.58 2 4.1E- 2.8 complemento 05 de los nucleótidos 40 hasta 288 de' SEQ ID NO: 100 104 41169_at nucleótidos 6.22 2.25 4.2E- 2.8 890 hasta 05 1006 de SEQ ID NO: 101 105 1274_s_at nucleótidos 20.6 5.85 4. SE3.5 741 hasta OS 899 de SEQ ID NO: 102 60 61 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 110 19 7_s_at nucleótidos 4.2 8.65 5.2E- 0.49 325 hasta 05 388 de SEQ ID NO: 107 111 36162_at nucleótidos 37.2 10.25 5.2E- 3.6 1062 hasta 05 1560 de SEQ ID NO: 108 112 867_s_at nucleótidos 11.3 3.9 5.5E- 2.9 1820 hasta 05 1945 de SEQ ID NO: 109 113 38799_at nucleótidos 7.62 1.85 5.6E- 4.1 2706 hasta 05 2791 de SEQ ID NO: 110 62 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 115 36628_at nucleótidos 11.1 5.55 6.2E- 2.0 3321 hasta 05 3804 de SEQ ID NO: 111 116 34545_at nucleótidos 8.13 3.65 6.4E- 2.2 1003 hasta 05 1158 de SEQ ID NO: 112 117 313 6_at nucleótidos 6.64 2.7 6.4E- 2.5 647 hasta 05 1187 de SEQ ID NO: 113 118 40926_at nucleótidos 18.1 6.8 6.5E- 2.7 13656 hasta 05 14081 de SEQ ID NO: 114 63 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 119 33803__at nucleótidos 34.5 16.15 6.8E- 2.1 3479 hasta 05 4005 de SEQ ID NO: 115 120 296_at SEQ ID NO: 15.0 6.55 6.9E- 2.3 116 05 123 41617_at el 8.42 2.8 8 -6E- 3.0 complemento 05 de los nucleótidos 41 hasta 485 de SEQ ID NO: 117 125 1774_at nucleótidos 5.93 2.55 8.8E~ 2.3 497 hasta 05 845 de SEQ ID NO: 118 64 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 126 40990_at nucleótidos 8.29 3.45 8.8E- 2.4 1006 hasta 05 1405 de SEQ ID NO: 119 127 34798_at nucleótidos 39.8 15.55 8.9E- 2.6 732 hasta 05 1259 de SEQ ID NO: 120 128 35674_at nucleótidos 6.69 2.9 9.7E- 2.3 3798 hasta 05 4194 de SEQ ID NO: 121 129 1368_at nucleótidos 14.6 6.2 9.8E- 2.4 4459 hasta 05 4885 de SEQ ID NO: 122 65 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 130 430_at nucleótidos 18 8.9 0.00010 2.0 444 hasta 960 de 'SEQ ID NO: 123 131 39248_at el 17.8 47 0.00010 0.38 complemento de los nucleótidos 55 hasta 344 de SEQ ID NO: 124 132 33932_at nucleótidos 28.4 10.1 0.00011 2.8 2013 hasta 2558 de SEQ ID NO: 125 133 35767_at nucleótidos 60.1 27.55 0.00011 2.2 59 hasta 621 de SEQ ID NO: 126 66 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba t (RCC/libre en humanos sin de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 134 33516_at SEQ ID NO: 149 23.2 0.00011 6.4 127 135 40120_at nucleótidos 31.9 7.5 0.00011 4.3 426 hasta 948 de SEQ ID NO: 128 136 31380_at nucleótidos 10.4 4.9 0.00012 2.1 3015 hasta 3534 de SEQ ID NO: 129 137 35379_at nucleótidos 18.7 7.4 0.00013 2.5 2491 hasta 2893 de SEQ ID NO: 130 138 38138_at nucleótidos 28.6 12.15 0.00013 2.4 133 hasta 574 de SEQ ID NO: 131 67 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 139 355_s_at nucleótidos 4.96 2.3 0.00013 2.2 250 hasta 850 de SEQ ID NO: 132 141 36045_at SEQ ID NO: 4.31 1.8 0.00014 2.4 133 142 39145_at nucleótidos 5.98 1.8 0.00016 3.3 647 hasta 1120 de SEQ ID NO: 134 143 39423_f_at nucleótidos 6 2.95 0.00017 2.0 1589 hasta 1642 de SEQ ID NO: 135 68 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 144 38598_at el 8.84 3.5 0.00017 2.5 complemento de los nucleótidos 149 hasta 213 de SEQ ID NO: 136 145 33799_at nucleótidos 29.6 13.85 0.00017 2.1 1981 hasta 2240 de SEQ ID NO: 137 146 34319_at nucleótidos 22.9 9.55 0.00017 2.4 39 hasta 419 de SEQ ID NO: 138 147 36113_s_at nucleótidos 4.13 2.05 0.00019 2.0 14630 hasta 14687 de SEQ ID NO: 139 69 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 148 0848_g_at nucleótidos 14.6 2.95 0.00019 4.9 3447 hasta 3808 de SEQ ID NO: 140 149 2094_s_at nucleótidos 66.6 136 0.00020 0.49 2713 hasta 3294 de SEQ ID NO: 141 150 37185_at nucleótidos 226 84.55 0.00020 2.7 1311 hasta 1761 de SEQ ID NO: 142 151 35714_at nucleótidos 7.71 3.2 0.00021 2.4 642 hasta 960 de SEQ ID NO: 143 70 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 152 40951_at nucleótidos 5.27 2.3 0.00022 2.3 1860 hasta 2099 de SEQ ID NO: 144 153 37187_at nucleótidos 59.1 19.55 0.00023 3.0 504 hasta 946 de SEQ ID NO: 145 154 33506_at nucleótidos 7.07 2.2 0.00023 3.2 2672 hasta 3121 de SEQ ID NO: 146 155 34430_at nucleótidos 12.6 6.1 0.00025 2.1 2931 hasta 3119 de SEQ ID NO: 147 71 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 156 40062_s_at SEQ ID NO: 9.36 2.35 0.00027 4.0 148 157 37179_at nucleótidos 10.1 3.15 0.00028 3.2 1069 hasta 1648 de SEQ ID NO: 149 158 1486_at nucleótidos 5.22 1.8 0.00028 2.9 145 hasta 529 de SEQ ID NO: 150 159 40182_s_at nucleótidos 5.73 2.7 0.00029 2.1 1849 hasta 2085 de SEQ ID NO: 151 160 36419_at nucleótidos 4.22 1.8 0.00029 2.3 850 hasta 1028 de SEQ ID NO: 152 72 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 161 32531_at SEQ ID NO: 4.24 2 0.00035 2.1 153 162 31308_at nucleótidos 4 1.8 0.00039 2.2 36 hasta 484 de SEQ ID NO: 154 163 36871_at nucleótidos 14.2 2.55 0.00037 5.5 2087 hasta 2652 de SEQ ID NO: 155 164 0956_at nucleótidos 12.9 5.25 0.00038 2.45 2649 hasta 3183 de SEQ ID NO: 156 65 35151_at nucleótidos 4.18 1.9 0.00039 2.2 436 hasta 895 de SEQ ID NO: 157 73 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 166 395 3_at el 7.51 3.3 0.00041 2.3 complemento de los nucleótidos 106 hasta 619 de SEQ ID NO: 158 167 725_i_at nucleótidos 11.5 29.8 0.00043 0.39 1844 hasta 2146 de SEQ ID NO: 159 168 31454_f_at nucleótidos 5.6 2.55 0.00047 2.2 878 hasta 972 de SEQ ID NO: 160 74 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 169 40366_at nucleótidos 13.5 4.4 0.00048 3.1 2709 hasta 3063 de SEQ ID NO: 161 170 1251_g_at nucleótidos 8.53 2.45 0.00048 3.5 3043 hasta 3230 de SEQ ID NO: 162 171 115_at nucleótidos 42.2 17.25 0.00049 2.4 3083 hasta 3605 de SEQ ID NO: 163 ?72 3 47_at nucleótidos 6.58 2.35 0.00050 2.8 2881 hasta 3318 de SEQ ID NO: 164 75 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 173 38879_at nucleótidos 40.0 17.25 0.00050 2.3 19 hasta 325 de SEQ ID NO: 165 174 3938 _at nucleótidos 1 .9 7.4 0.00054 2.0 686 hasta 1058 de SEQ ID UO: 166 175 39729_at nucleótidos 25.4 8.4 0.00057 3.0 712 hasta 968 de SEQ ID NO: 167 176 39 8_r_at nucleótidos 8.07 16.45 0.00058 0.49 46 hasta 468 de SEQ ID NO: 168 76 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 177 33759_at nucleótidos 17.0 5 0.00059 3.4 1090 hasta 1582 de SEQ ID NO: 169 178 33449_at nucleótidos 10.5 5 0.00060 2.1 893 hasta 969 de SEQ ID NO: 170 179 31812_at nucleótidos 32.2 12.55 0.00061 2.6 1047 hasta 1464 de SEQ ID NO: 171 180 40578_s_at nucleótidos 12.1 2.45 0.00078 4.9 2081 hasta 2425 de SEQ ID NO: 172 77 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 181 40766_at SEQ ID NO: 11.4 4.25 0.00079 2.7 173 182 31320_at nucleótidos 3.84 1.8 0.00081 2.1 631 hasta 1169 de SEQ ID NO: 174 183 34378_at nucleótidos 102 28.2 0.00092 3.6 1217 hasta 1314 de SEQ ID NO: 175 184 40773_at nucleótidos 9.56 3.15 0.0010 3.0 37 hasta 522 de SEQ ID NO: 176 78 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 185 38726_at el 20.8 3.6 0.0010 5.8 complemento de los nucleótidos 125 hasta 494 de SEQ ID NO: 177 186 1832_at nucleótidos 5.00 2.05 0.0010 2.4 3598 hasta 4132 de SEQ ID NO: 178 187 36543_at nucleótidos 6.87 1.95 0.0011 3.5 1723 hasta 2013 de SEQ ID NO: 179 79 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) CC (n=20) (n=45) 188 137_at nucleótidos 6.02 1.8 0.0012 3.3 1138 hasta 180 de SEQ ID NO: 180 189 38585_at SEQ ID NO: 258 74.25 0.0012 3.5 181 190 34022_at nucleótidos 32.2 4.25 0.0012 7.6 426 hasta 993 de SEQ ID NO: 182 191 38021_at nucleótidos 5.67 2.25 0.0013 2.5 14286 hasta 14757 de SEQ ID NO: 183 •80 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n= 5) 192 33143_s_at nucleótidos 18.7 6.1 0.0015 3.1 1523 hasta 1918 de SEQ ID NO 184 194 40850_at nucleótidos 16.9 4.1 0.0016 4.1 1048 hasta 11504 de SEQ ID NO: 185 195 36766_at nucleótidos 24.5 11.3 0.0017 2.2 167 hasta 666 de SEQ ID NO: 186 196 38201_at nucleótidos 7.18 3.05 0.0018 2.4 836 hasta 1155 de SEQ ID NO: 187 81 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 199 2092_s_at nucleótidos 9.78 2.35 0.0022 4.2 824 hasta 1229 de SEQ ID NO: 188 201 408_at nucleótidos 21.1 2.4 0.0028 8.8 1229 hasta 1851 de SEQ ID NO: 189 202 36058_at nucleótidos 29.6 11.7 0.0030 2.5 1083 hasta 1550 de SEQ ID NO: 190 205 38429_at nucleótidos 5.00 2.4 0.0035 2.1 7939 hasta 8395 de SEQ ID NO: 192 82 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 206 502_s_at nucleótidos 5.18 1.85 0.0041 2.8 1959 hasta 2156 de SEQ ID NO: 193 207 33802_at nucleótidos 21.4 10.25 0.0047 2.1 51072 hasta 51587 de SEQ ID NO: 194 208 38010_at nucleótidos 6.58 3.25 0.0050 2.0 1044 hasta 1494 de SEQ ID NO: 195 209 41046_s_at nucleótidos 4.76 2.2 0.0068 2.2 5551 hasta 6046 de SEQ ID NO: 196 83 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 210 39095_at micleótidos 5.87 1.8 0.0072 3.3 5774 hasta 5945 de SEQ ID NO: 197 211 39402_at nucleótidos 71.6 18.45 0.0073 -3.9 927 hasta 1473 de SEQ ID NO: 198 212 37184_at nucleótidos 5.36 2.7 0.0074 2.4 1631 hasta 2037 de SEQ ID NO: 199 213 38273_at nucleótidos 6.47 2.5 0.0075 2.6 1251 hasta 1576 de SEQ ID NO: 200 84 85 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 218 39780_at nucleótidos 5.2 2.6 0.0094 2 2550 hasta 3078 de SEQ ID NO: 205 219 1257_s_at nucleótidos 33.6 14.35 0.0095 2.3 2590 hasta 2840 de SEQ ID NO: 206 220 32904_at SEQ ID NO: 8.78 20.85 0.0096 0.42 207 221 31 99_s_at nucleótidos 16.0 6.6 0.010 2.4 251 hasta 854 de SEQ ID NO: 208 222 1069_at nucleótidos 7.82 2.95 0.011 2.7 _ 8872 hasta 9184 de SEQ ID NO: 209 86 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 223 39413_at nucleótidos 4.91 1.8 0.012 2.7 6717 hasta 6771 de SEQ ID NO: 210 224 34281_at nucleótidos 9.4 3.4 0.012 2.8 1207 hasta 1559 de SEQ ID NO: 211 225 33914__r_at SEQ ID NO: 19.6 2.15 0.012 9.1 212 226 35762_at nucleótidos 8.89 2.8 0.013 3.2 4753 hasta 5179 de SEQ ID NO: 213 227 36372_at nucleótidos 6.78 2.95 0.013 2.3 2437 hasta 3029 de SEQ ID NO: 214 87 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 228 32 51_at nucleótidos 6.31 1.95 0.013 3.2 1020 hasta 1387 de SEQ ID NO: 215 223 40385_at nucleótidos 6.93 2.35 0.014 3.0 207 hasta 742 de SEQ ID NO: 216 230 35036_at nucleótidos 5.4 2.1 0.014 2.6 2895 hasta 3261 de SEQ ID NO: 217 23.1 34014_f_at nucleótidos 8.38 2.15 0.015 3.9 664 hasta 1000 de SEQ ID NO: 218 88 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 232 37120_at nucleótidos 12.2 3.45 0.016 3.5 1870 hasta 2379 de SEQ ID NO: 219 234 32054_at nucleótidos 6.13 2.3 0.017 2.7 1916 hasta 2038 de SEQ ID NO: 220 235 337 2_f_at nucleótidos 8.09 1.8 0.019 4.5 248 hasta 367 de SEQ ID NO: 221 236 31719_at nucleótidos 3.64 1.8 0.020 2.0 7039 hasta 7633 de SEQ ID NO: 222 89 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 237 35418_at nucleótidos 11.8 1.85 0.021 6.4 471 hasta 714 de SEQ ID NO: 223 239 1407_g_at nucleótidos 7.11 2.95 0.022 2.4 1768 hasta 1958 de SEQ ID NO: 224 240 31666_f_at nucleótidos 13.8 1.8 0.024 7.7 62 hasta 339 de SEQ ID NO: 225 241 38299_at nucleótidos 23.9 3 0.025 8.0 723 hasta 1053 de SEQ ID NO: 226 90 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 242 40517_at nucleótidos 7.84 3.05 0.025 2.6 5232 hasta 5667 de SEQ ID NO: 227 243 1350_at nucleótidos 7.8 2.85 0.026 2.7 2099 hasta 2350 de SEQ ID NO: 228 244 207_at nucleótidos 9.07 3.45 0.028 2.6 1512 hasta 2082 de SEQ ID NO: 229 245 39166_s_at nucleótidos 8.42 2.75 0.030 3.1 1583 hasta 1790 de SEQ ID NO: 230 91 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=45) (n=20) 246 31574_i_at nucleótidos 16.8 1.8 0.034 9.3 39 hasta 78 de SEQ ID NO: 231 247 40159_r_at nucleótidos 20.2 8.7 0.035 2.3 970 hasta 1341 de SEQ ID NO: 232 248 3324 _at SEQ ID NO: 9.29 3.75 0.037 2.5 233 249 2041_i_at nucleótidos 66.5 2.35 0.038 28 3736 hasta 3773 de SEQ ID NO: 234 250 40635_at nucleótidos 12.9 5.5 0.039 2.3 1460 hasta 1771 de SEQ ID NO: 235 92 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermeoade enfermedad) RCC (n=45) s '(n=20) 251 38908 s_at nucleótido 20.3 5.65 0.039 3.6 s 2043 hasta 2283 de SEQ ID NO: 236 252 732 f_at SEQ ID NO: 21.4 8.5 0.042 2.5 237 253 32579_at nucleótidos 40.1 7.75 0.043 5.2 5059 hasta 5246 de SEQ ID NO: 238 254 33021_at nucleótidos 8.42 4.2 0.047 2.0 1744 hasta 1878 de SEQ ID NO: 239 255 35175_f_at nucleótidos 118.47 191.35 4.4E- 0.62 1252 hasta 10 1447 de SEQ ID NO: 285 93 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 256 32587_at nucleó idos 61.16 117.80 5.2E- 0.52 4939 hasta 10 5425 de SEQ ID NO: 286 257 37337_at el 14.04 23.55 5.2E- 0.60 complemento 10 de los nucleótidos 7 hasta 362 de SEQ ID NO: 287 258 329_s_at SEQ ID NO: 8.44 16.00 3.0E- 0.53 288 10 59 36589_at nucleótidos 15.78 23.25 1.7E- 0.68 797 hasta 08 1192 de SEQ ID NO: 289 94 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 60 33828_at SEQ ID NO: 13.07 20.10 6.7E- 0.65 328 08 61 41787_at el 6.04 3.50 2.1E- 1.73 complemento 08 de los nucleótidos 77 hasta 413 de SEQ ID NO: 291 62 41220_at nucleótidos 169.69 227.65 3.8E- 0.75 3638 hasta 07 3874 de SEQ ID NO: 292 63 38590_r_at nucleótidos 201.78 274.50 1.4E- 0.74 575 hasta 07 1111 de SEQ ID NO: 293 95 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 264 40018_at nucleótidos 7.84 4.45 2.4E- 1.76 5780 hasta 07 6213 de SEQ ID NO: 294 265 39155_at nucleótidos 19.22 25.80 3.9E- 0.75 1548 hasta 08 2085 de SEQ ID NO: 295 266 37668_at nucleótidos 10.80 17.95 2.9E- 0.60 600 hasta 11 948 de SEQ ID NO: 296 267 39136_at nucleótidos 15.33 10.55 3.7E- 1.45 4031 hasta 06 4415 de SEQ ID NO: 297 96 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t' de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 268 1125_s_at nucleótidos 8.42 4.50 5.7E- 1.87 43 hasta 08 226 de SEQ ID NO: 298 269 1211_s_at nucleótidos 7.02 3.80 4 -5E- 1.85 972 hasta 07 1076 de SEQ ID NO: 299 270 1445_at nucleótidos 6.47 3.55 3.6E- 1.82 1097 hasta 07 1643 de SEQ ID NO: 300 271 32405_at nucleótidos 7.69 4.50 2.9E- 1.71 5804 hasta 07 6242 de SEQ ID NO: 301 97 CPS Calificador CPS Nivel de Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 272 32635 at nucleótidos 8.00 4.65 6.9E- 1.72 3240 hasta 05 3424 de SEQ ID NO: 302 273 36331_at nucleótidos 6.42 3.30 7.2E- 1.95 2550 hasta 07 3110 de SEQ ID NO: 303 274 37788_at nucleótidos 4.62 2.35 1.2E- 1.97 1293-1655 05 de SEQ ID NO: 304 275 38228_g_at nucleótidos 6.53 4.25 5.4E- 1.54 1878 hasta 05 2045 de SEQ ID NO: 305 98 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre de en humanos sin t enfermedad) pacientes enfermedades RCC (n=20) (n=45) 276 39708_at SEQ ID NO: 32.13 19.65 9.5E- 1.64 306 08 277 40076_at nucleótidos 59.36 35.35 2.5E- 1.68 1683 hasta 07 2285 de SEQ ID NO: 307 278 40177_at el 3.93 1.85 4.6E- 2.13 complemento 05 de los nucleótidos 67 hasta 276 de SEQ ID NO: 308 279 1891_at nucleótidos 9.16 4.65 1.3E- 1.97 2144 hasta 08 2738 de SEQ ID NO: 309 99 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 280 31536_at xmcleótidos 25.56 15.75 1.2E- 1.62 3430 hasta 08 4018 de SEQ ID NO: 310 281 32719_at nucleótidos 7.16 4.05 9.6E- 1.77 1261 hasta 08 1780 de SEQ ID NO: 311 282 33371_s_at nucleótidos 21.31 11.05 8.6E- 1.93 420 hasta 09 879 de SEQ ID NO: 312 283 3543 _at nucleótidos 12.62 7.25 1.7E- 1.74 1591 hasta 08 1897 de SEQ ID NO: 313 100 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 284 40167_s_at nucleótidos 9.11 6.45 3.3E- 1.41 1405 hasta 06 1643 de SEQ ID NO: 314 285 649_s_at nucleótidos 172.87 266.70 3.1E- 0.65 1038 hasta 06 1632 de SEQ ID NO: 317 286 31492_at nucleótidos 47.91 64.10 9.7E- 0.75 255 hasta 09 758 de SEQ ID NO: 318 287 31955_at nucleótidos 316.33 435.15 1.4E- 0.73 1 hasta 475 08 de SEQ ID NO: 319 101 CPS Calificador CPS Nivel de Nivel de Valor p Veces de No. expresión expresión de cambio promedio promedio en prueba t (RCC/libre en humanos sin de pacientes enfermedades enfermedad) RCC (ii=20) (n=45) 288 35125_at SEQ ID NO: 404.47 547.05 5.1E-07 0.74 330 289 36463_at nucleótidos 13.49 20.05 1.7E-09 0.67 3746 hasta 4119 de SEQ ID NO: 321 290 36786_at SEQ ID NO: 204.07 304.40 1.1E-09 0.67 329 291 38269_at nucleótidos 27.64 40.25 3.9E-07 0.69 1235 hasta 1699 de SEQ ID NO: 323 292 38527_at nucleótidos 53.49 70.70 6.8E-09 0.76 2145 hasta 2484 de SEQ ID NO: 324 102 CPS Calificador CPS Nivel de' Nivel de Valor Veces de No. expresión expresión p de cambio promedio promedio en prueba (RCC/libre en humanos sin t de pacientes enfermedades enfermedad) RCC (n=20) (n=45) 293 40610_at SEQ ID NO: 12.56 20.50 2.7E- 0.61 331 06 234 41506_at nucleótidos 8.11 13.45 2.7E- 0.60 1440 hasta 07 1952 de SEQ ID NO: 326 295 41604_at nucleótidos 13.60 21.30 3.5E- 0.64 1095 hasta 07 1400 de SEQ ID NO: 327 Tabla 3. SEQ ID NOs y los correspondientes números de acceso Entrez SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 1 AF051152 ARNm (TIL4) de proteina 4 tipo receptor de interleucina 1/Homo sapiens Toll 2 AA978353 3 ABO0S780 ARNm de homo sapiens para galectina 3 4 AB013382 ARNm de homo sapiens para DUSP6 6 U66359 ARNm de proteina T54 humano (T54) 7 X75593 ARNm de homo sapiens para rab 13 8 X91348 ADNc no codificado predicho de homo sapiens (DGCR5) 9 L35240 Gen de enigma de humano 10 AF017257 Cromosoma 21 de homo sapiens derivado de BAC que contiene el gen de proteina homologa 2 de oncogen de virus de eritroblastosis (ets-2) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 11 AB011161 ARNm de homo sapiens para proteina KIAA0589 12 D43642 ARNm YL-1 humano para proteina YL-1 (proteina nuclear con capacidad para enlazarse al ADN) 13 AF055000 ARNm desconocido de clon 24519 de homo sapiens 14 AB006537 ARNm de homosapiens para la proteina accesorio del receptor de interleucina 1 15 X75042 ARNm de prot-oncogen reí de homo sapiens 16 AF032108 ARNm alfa 7 de integrina de homo sapiens 17 L07592 ARNm del receptor activado por el proliferador de peroxisoma humano 18 X52015 ARNm de homo sapiens para el antagonista del receptor de interleucina 1 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 19 AF025533 ARNm del receptor 3tipo leucocito de inmunoglobulina de homo sapiens (LIR-3) 21 U05770 Gen de anexina V humano (ANX5) , exon 13 22 W26700 23 AF052111 Secuencia de ARNm de clon 23953 de homo sapiens 24 M64925 ARNm de proteina de membrana de eritrocito palmitoilada de humano (MPP1) 25 M19267 ARNm de tropomiosina humana 26 M62896 ARNm de seudogen 2 de lipocortina humano (LIP) 2 27 M13207 Gen del factor estimulante de la colina de macrófago-granulocito (CSF1) 28 D86961 ARNm humano para gen KIAA0206 29 AA187563 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 30 J05581 ARNm de la mucina epitelial polimorfica humana (PEM) 31 AF035819 ARNm MARCO del receptor macrófago del homo sapiens 32 X51362 ARNm humano para el receptor · D2 de la dopamina 33 AA844998 34 AB008775 ARNm de AQP9 del homo sapiens para la acuaporina 9 35 AB000520 ARNm del homo sapiens para APS 36 X60364 ARNm de ALAS humano para el precursor de las 5-aminolevulinato sintasa 37 X12451 ARNm humano para la procatepsina L (proteina principal excretada de MEP) 38 AL080235 ARNm de homo sapiens; ADNc DKFZp586E1621 (a partir del clon DKFZp586E1621) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 40 D32143 ARNm humano para la biliverdina-IX de beta reductasa I 41 L22075 Proteína reguladora del nucleótido de guanina de homo sapiens (G13) ARNm 42 D87116 ARNm humano para la MAP cinasa cinasa 3b 43 AA135683 44 AF079221 BCL2 de homo sapiens/adenovirus ElB proteína de interacción 3a ARNm de 19kDa 45 U48213 Gen de la proteina de enlace del sitio D humano, exon 4 46 U91316 ARNm de la acil-CoA tioéster hidrolasa humano 47 AF059202 ARNm del producto 1 del gen relacionado con ACAT de homo sapiens 48 L76200 ARNm de guanilato cinasa (GUK1) humana SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 49 L42243 Gen del receptor de interferon (FINAR2) alternativamente empalmado del homo sapiens (clon 51H8) , exon 9 50 D45421 ARNm humano para la fosfodiesterasa I alfa 51 AL095737 ARNm, ADNc, DKFZp43 Fl52 del1 homo sapiens; (a partir del DKFZp434F152) 52 L32831 Gen del receptor acoplado a la proteina G (GPR3) del homo sapiens 53 X07834 ARNm humano para la superóxido dismutasa de manganeso (Ec 1.15.1.1) 54 AJ243797 ARNm del homo sapiens para la desoxiribonucleasa III (gen drn3) 55 H12458 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 56 S78798 Isoforma de la 1- fosfatidilinositol-4-fosfato 5- cinasa C [leucocitos de sangre periférica humano, ARNm, 1835 nt] 57 M94856 Homologo de la proteína de enlace de ácido graso humano (PA-FABP) ARNm 58 J05070 ARNm de la colagenaza del tipo humano IV 59 J04027 ARNm de la ATPasa de bombeo Ca2+ de la membrana de plasma humano 60 U43343 ARNm de la proteína h-neuro-d4 humana 61 D10925 ARNm humano para HM145 62 AJ000480 ARNm del homo sapiens para la fosfoproteína de C8FW 63 M25915 ARNm inhibidor de la citolisis del complemento humano (CLI) 64 D30783 ARNm del homo sapiens para la epiregulina SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 65 AF017786 Homologo de la fosfohidrolasa del ácido fosfatidico del homo sapiens (Dri 2) ARNm 66 X79535 ARNm del homo sapiens para beta tubulina, clon nuk 278 67 D14689 ARNm humano para el gen KIAA0023 68 AL031230 Secuencia de ADN humano del clon 73M23 sobre el cromosoma 6p22.2-22.3; contiene la parte 5' del gen empalmado posiblemente de manera alterna para el precursor de fosfatidilinositol-glicano- especifico de la fosfolipasa D I (EC 3.1.4.50, PIGPLD1, Glicoproteína de fosoflipasa D, fosfolipasa D especifica de glicosil-fosfatidilinositol) , el gen para semialdehido deshidrogenasa succinica dependiente del NAD+ (SSADH, EC 1.2.1.24), y la parte 3' del gen KIAA0319, contiene ESTs, STSs, GSSs y una isla supuesta CpG, secuencia completa SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 69 AL049963 ARNm del homo sapiens; ADNc DKFZp564A132 (a partir del clon D FZp564A132) 70 Z32684 ARNm del homo sapiens para la proteina de transporte de membrana (gen XK) 71 AB020644 ARNm del homo sapiens para la proteina KIAA0837 72 X12496 ARNm humano para la sialoglicoproteina beta de membrana de eritrocito (glicoforina C) 73 L23959 Factor de transcripción relacionado con E2F del homo sapiens (DP-1) ARNm 74 U61836 ARNm de la proteina de interacción Gl de ciclina supuesta humana 75 U43774 Receptor alfa Fe, variante de empalme FcalfaR a.2 (CD89) ARNm 76 M35999 ARNm de la glicoproteina Illa (GPIIIa) de plaquetas humanas 112 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 77 L07648 ARNm de MXI1 humano 78 M24069 Gen de la proteina A de enlace al ADN humano (dbpA) , terminación 3' 79 AF061034 ARNm alternativamente traducido del FI 2 de homo sapiens 80 U29091 Proteina de enlace de seleneio de homo sapiens (sep) ARNm 81 U68111 Gen inhibidor 2 de la fosfatasa (PPP1R2) de proteina humana, exon 6 82 X82460 ARNm del homo sapiens para la 15 hidroxi prostaglandina deshidrogenasa 84 U58917 ARNm del receptor IL-17 del homo sapiens 85 AB010419 ARNm del homo sapiens para la proteína relacionada con MTG8 MTG16a 8d AB007943 ARNm del homo sapiens para la proteina KIAA0474 87 Z23115 ARNm para el bcl-xL del homo sapiens SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 88 AF001461 ARNm de la proteina saliente de zinc Zf9 del tipo Kruppel de homo sapiens 89 D14874 7ARNm de homo sapiens para el precursor de adrenomedulina 90 J05500 ARNm (SPTB) de beta espectrina humano 91 M34480 ARNm de la glicoproteina Ilb (GPIIb) de plaquetas humanas 92 U97067 ARNm de proteína del tipo de alfa catenina de homo sapiens 93 26683 ARNm inducible por tratamiento con gamma interferon humano 94 ??527880 95 X72308 ARNm del homo sapiens para la proteína 3 quimiotactica de monocitos (MCP-3) 96 M63835 Gen I del receptor Fe de IgG, exon 6 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 97 U28389 ARNm de la subunidad 52 kDa de dematina humana 98 U21049 ARNm DD96 de homo sapiens 99 L40904 ARNm del receptor gamma activado del proliferador de peroxisoma (PPARG) de homo sapiens 100 AI961220 101 X74039 ARNm de homo sapiens para el receptor activador de plasminogeno de uricinasa 102 L22005 ARNm de enzima conjugadora de la ubiquitina humana 103 AI732885 104 U00672 ARNm del receptor de interleucina 10 humana 105 AL050254 Mapeo de un gen humano novedoso para el cromosoma 22 106 AF026939 ARNm de CIG49 (cig49) del homo sapiens 107 U19599 ARNm humano (delta BAX) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 108 X64364 ARNm del homo sapiens para el antigeno 6 109 U12471 Gen humano de la trombospodina 1 110 AF068706 ARNm (G2AD) de la gamma2 adaptina de homo sapiens 111 L42542 ARNm de la prote na RLIP76 humana 112 AF070587 Secuencia de ARNm del clon 24741 de homo sapiens 113 AJ001481 ARNm de homo sapiens para la protexna DUX1 114 U36341 Cosmido humano Xq28, transportador de creatina (SLC6A8) gen, cds completo, gen CDM, cds parcial 115 J02973 Gen de trombomodulina humana 116 AF141349 ARNm de beta tubulina de homo sapiens 117 AI349593 118 L06895 Antagonizador de homo sapiens del ARNm de actividad transcripcional myc (Mad) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 119 AF065389 ARNm NET-4 de tetraspano de homo sapiens 120 Z35491 ARNm de homo sapiens para una proteina asociada con el receptor glucocorticoide novedoso 121 AB023211 ARNm de homo sapiens para una proteina de KIAA0994 122 M27492 ARNm del receptor de interleucina 1 humana 123 X00737 ARNm humano para un nucleosidod e fosforilasa de purina (PNP: EC 2.4.2.1) 124 N74607 125 X17644 ARNm GSTl-Hs humano para la proteina de enlace de GTP 126 AI565760 128 X90999 ARNm de homo sapiens para la glioxolasa II 129 AF059198 Proteina cinasa/endoribonucleasa de homo sapiens (IRE1) de ARNm SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 130 X54412 ARNm humano para colágeno alfa 1 (IX) (forma larga) 131 D38583 ARNm humano para la calgizarina 132 D38037 ARNm humano para la proteina de enlace FK506 del homologo de 12 kDa (hFKBP-12) 134 J02854 ARNm de la cadena ligera de miosina de 20-kDa humano (MLC-2) 135 AJ000644 ARNm de homo sapiens para SPOP 136 AI679353 137 U76248 ARNm de hSIAH2 humano 138 AA131149 139 AJ011712 Gen TNNT1 de homosapiens, exones 1- 11 (y CDS unidos) 140 AB018293 ARNm de homo sapiens para la proteina KIAA0750 141 K00650 Proto-oncogen fos (c-fos) humano 142 Y00630 ARNm humano para el Arg-serpina (activador de plasminogeno inhibidor 2, PAI-2) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 143 U89606 A Nm de la piridoxal cinasa humana 144 AL049250 ARNm; ADNc DKFZp56 D113de homo sapiens (a partir del clon DKFZp564D113) 145 36820 ARNm de la citocina humana (GRO- beta) 146 U96919 ARNm de la inositol polifosfato 4 fosfatasa de tipo I-beta de homo sapiens 147 U70732 Gen de la glutamato pxruvato de la transaminasa (GPT) humano 149 S77763 Factor nuclear eritroide 2 isoforma f, proteina de cremallera de leucina básica, {alternativamente empalmada, exon lf} [humano, hígado fetal, ARNm, 1678 bt] 150 L37127 ARN de la polimerasa II del ARNm del homo sapiens 151 AF055027 Secuencia de ARNm 24658 del clon del homo sapiens SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 152 AF038171 Secuencia de ARNm 23671 del clon del homo sapiens 154 L17330 Proteina asociada a la célula pre- T/NK humano (6H9A) ARNm 155 M60298 ARNm de la banca 4.2 (EPB42) de la proteina de membrana de eritrocito humano 156 X90857 ARNm del homo sapiens para el elemento regulador de globina que contienen el gen 14 157 AF089814 ARNm relacionado con el supresor del crecimiento (COD-1R) del homo sapiens 158 AI077476 159 K02401 Gen de la somatomamotropina corionica humana hCS-1 160 AF034209 ARNm 5-6 del tipo RIG del homo sapiens SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Ent ez correspondiente 161 25322 ARNm de la proteina de membrana de gránulos 140 humana 162 64788 ARNm de la proteína activadora de la GTPasa (raplgAP) humana 163 X14787 ARNm humano para la trombospondina 164 U62433 Precursor de la subunidad alfa 4 del receptor de acetilcolina nicotinida humana, ARNm 165 D83664 ARNm humano para CAAF1 (proteína de enlace al calcio en el fluido amniótico 1) 166 M38690 ARNm del antígeno CD9 humano 167 L19185 ARNm del factor mejorador de células exterminadoras naturales humanas (NKEFB) 168 W27095 169 X04327 ARNm de la 2 , 3-bisfosfoglicarato mutasa de eritrocitos humanos EC 2.7.5.4 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 170 AF054185 ARNm de HSPC de la subunidad de proteasoma de homo sapiens 171 M24470 Glucosa 6-fosfato deshidrogenasa humana 172 M77016 ARNm de la tropomodulina humana 174 U18548 Gen del receptor acoplado a la proteína G GRP12 humana 175 X97324 ARNm de homo sapiens para la adipofilina 176 L03785 ARNm de cadena ligera de miosina regulador humano (MYL5) 177 80399 178 M62397 ARNm de la proteína de cáncer mutante colorectal 179 J02931 ARNm del factor de tejido de placenta humana (dos formas) 180 U65404 ARNm de EKLf del factor de transcripción específico de eritroides humanos SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 182 M3S821 ARNm de la citocina humana (GRO- gamma) 183 U53204 ARNm de plectina humana (PLEC1) 184 U81800 ARNm del transportador de monocarboxilato (MCT3) de homo sapiens 185 L37033 ARNm del homologo de la proteina de enlace FK-506 (FKBP38) humano 186 X55988 ARNm del EDN humano para la neurotoxina derivada de eosinofilos 187 U21551 ARNm de ECA39 humano 188 J04765 ARN de osteopontina humana ARNm 189 X54489 Gen humano para la actividad estimuladora del crecimiento de melanoma (MGSA) 190 AL095741 ARNm de homo sapiens; ADNc DKFZp586O0223 (a partir del clon DKFZp586O0223) 192 U29344 ARNm de la sintasa del ácido graso de carcinoma de mama humano SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente i base de datos Entrez correspondiente 193 U37431 ARNm de HOXAl humano, transcrito largo y formas alternativamente empalmadas 194 Z82244 Secuencia de ADN humano del clon CTA-286B10 sobre el cromosoma 22; contiene la terminación 3' del gen TOM1 para objetivo del homólogo mybl (pollo) , el gen HMOXl para la Heme Oxigenasa (desciclización) 1 (HO-1, EC 1, 14.99.3), el gen MCM5 para deficiente en el mantenimiento de minicromosomas (S. cerevisiae) 5 (ciclo de división celular 46, factor de licénciamiento de la replicación de ADN, P1-CDC46) , EST, STS, GSS y dos islas CpG supuestas 195 AF002697 ARNm de la proteina de enlace E1B 19K/Bcl-2 Nip3 de homo sapiens, gen nuclear que codifica la proteina de la mitocondria SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 196 X95808 ARNm de homo sapiens para protéina codificada por el gen candidato, DXS6673E para retraso mental 197 M58018 ARNm de cadena pesada de beta miosina (MYH7) de homo sapiens 198 M15330 ARNm 1 beta (IL1B) de interleucina humana 199 L37792 ARNm 1A de sintaxina de homo sapiens 200 AJ006268 ARNm de homo sapiens para la ATPasa supuesta 201 X14362 ARNm de CR1 humano para la forma secretada del receptor C3b/C4b 202 AL050225 ARNm de homo sapiens; ADNc DKFZp586M1523 (del clon DKFZp586M1523) 203 M98776 Gen de queratina 1 humana 204 AF070571 Secuencia de ARNm del clon 24739 de homo sapiens SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 205 M29551 ARNm A2 de calcineurina humana 206 L42379 ARNm del factor de crecimiento derivado de hueso del homo sapiens (BPGF-1) 208 X16863 ADNc Fc-gamma RUI humano para el receptor Fc-gamma III-l (CD16) 209 U04636 Gen de ciclooxigenasa 2 humana (hCox-2) 210 AJ001189 ARNm de homo sapiens para oligofrenina 1 211 AF039555 ARNm de proteina 1 de tipo visinina de homo sapiens (VSNL1) 213 AB007952 ARNm de homo sapiens para la proteína KIAA0483 214 U51333 ARNm de hexocinasa III (HK3) humana 215 L35848 ARNm de cadena beta del receptor IgE (HTm4) de homo sapiens 216 U64197 ARNm de la guimiocina éxodo-1 de homo sapiens SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 217 U94333 ARNm ClqR(p) del receptor Clq/MBL/SPA humana 218 D10216 ARNm humano para Pit-l/GHF-1 219 X91817 ARNm de homo sapiens para la proteina de tipo transcetolasa (2418 pb) 220 AF048732 ARNm de ciclina T2b de homo sapiens 221 27838 222 X02761 ARNm humano para fibronectina (precursor FN) 223 J04178 ARNm de cadena alfa de beta- hexosaminidasa anormal humana (HEXA) , cromosoma 15q23-q24 224 M21985 ARNm del receptor esteroide TR2 humano 225 W28731 226 X04430 ARNm de IFN-beta 2a para interferón beta 2 227 AB002370 ARNm humano para el gen KIAA0372 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 228 U02388 ARNm del citocromo P450 4F2 (CYP4F2) de homo sapiens 229 86752 ARNm de proteina sensible a la transformación (IEF SSP 3521) humana 230 D83174 ARNm humana para proteina 2 de enlace al colágeno 231 M14087 Gen HL1 humana que codifica •lectina de enlace a la beta- galactosida, extremo 3' , clon 2 232 M55067 ARNm de proteina de enfermedad granulomatosa crónica autosomal de 47 kd humana 234 M14752 Gen c-abl humana 235 AF089750 ARNm de flotilina 1 de homo sapiens 236 AL096744 ARNm de homo sapiens; ADNc DKFZp566H033 (del clon DKFZp566H033) 237 M55406 ARNm de mucina (MÜC-3) intestinal humana SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 238 U29175 ARNm . activador transcripcional humano (BRG1) 239 AF035314 Secuencia de ARNm del clon 23651 de homo sapiens 285 X70940 ARNm de H. sapiens para el factor 1 alfa 2 de elongación 286 U07802 Gen Tisi Id humano 287 AI803447 288 Z11584 ARNm de homo sapiens para proteína NuMA 289 X15414 ARNm humano para aldosa reductasa (EC 1.1.1.2 290 AF035262 Gen BAF57 de homo sapiens (BAF57) 291 AI452442 292 AB023208 ARNm de homo sapiens para proteína KIAA0991 293 14630 ARNm de alfa protirnosina humana 294 AB007870 ARNm KIAA0410 homo sapiens SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 295 D67025 ARNm de homo sapiens para la subunidad de proteasoma p58 296 69039 Factor de emplame SF2p32 de pre- ARNtn humano 297 AB017642 ARNm de homo sapiens para respuesta a la tensión oxidante 1 298 L05424 Gen CD44 de glicoproteína de superficie de célula humana (CD44) exón 14 299 U84388 ARNm de la proteína que contiene el dominio de muerte CRADD humano 300 AF014958 ARNm del receptor X de quimiocina (CXRX) de homo sapiens 301 AB014607 ARNm de homo sapiens para proteína KIAA0707 302 AB029036 ARNm de homo sapiens para proteína IAA1113 303 AL050119 ARNm de homo sapiens; ADNc DKFZp586C091 SEQ ID NO Número de Fuente reportada de .la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondíente 304 AF052115 Secuencia de ARNm del clon 23688 de homo sapiens 305 AB006909 ARNm de homo sapiens para el factor de transcripción asociado con la microftalmia de tipo A 307 AF004430 ARNm de isoforma hD54+ins2 (hD54) de homo sapiens 308 AI732885 309 D14497 ARNm humana para la proteína del proto-oncogen 310 AB020693 ARNm de homo sapiens para la proteína KIAA0886 311 L41827 ARNm del factor derivado de la neurona motora y sensorial de homo sapiens (SMDF) 312 U59877 ARNm de proteína de enlace GTP de bajo Mr humano (RAB31) 313 L16794 ARNm de factor de transcripción humano (MEF2 ) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 314 AF038187 Secuencia de ARNm del clon 23714 de homo sapiens 315 L29277 ARNm de proteina de enlace del ADN (APRF) de homo sapiens 317 L06797 ARNm del receptor acoplado a la proteina G huérfana (clon L5) humana 318 AB019392 ARNm de homo sapiens del gen M9 específico del músculo 319 X65923 ARNm fau de homo sapiens 320 X67309 Gen de homo sapiens para la proteína ribosomal S6 321 AB020680 ARNm de homo sapiens para proteina IAA0873 SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 322 AL022721 Secuencia de ADN humano del clon 109F14 en el cromosoma 6p21.2-21.3, que contiene el gen alternativamente empalmado para un factor de mejora transcripcional TEF-5, el gen RPL10A de la proteina ribosomal 60S, un gen supuesto del tipo ZNF127 y el PPARD para el delta Receptor Activado por el Proliferador de Peroxisoma (PPAR- Delta, PPAR_Beta, receptor 1 de la Hormona Nuclear, NUCI, NUCI, PPARB) . También contiene tres islas supuestas CpG, EST, STS, GSS y un polimorfismo de la repetición ca 323 AL050147 ARNm de homo sapiens; ADNc DKFZp586E0820 (del clon DKFZp586E0820) SEQ ID NO Número de Fuente reportada de la secuencia acceso a la Entrez correspondiente base de datos Entrez correspondiente 324 U02493 ARNm de proteina de 54 kDa de humano 325 AI743507 Wf72a06.x2 Soares_NFL_T_GBC_SI ADNc de homo sapiens, clon I AGE : 2361106 en 3' similar a TR: 088532 proteina de enlace de ARN de extensión de zinc 326 AF032437 Gen de proteina cinasa activado por proteina cinasa activado por mitógeno de homo sapiens 327 U79297 Secuencia de ARNm de 23589 del clon humano Cada calificador en la tabla 2 representa al menos un gen de la enfermedad de RCC que se expresa diferencialmente en la sangre periférica de pacientes con RCC con relación a humanos libres de la enfermedad. Los transcritos de ARN para el gen de enfermedad de RCC pueden hibridizar al calificador correspondiente bajo condiciones de hibridación de configuración de ácido nucleico o severas. Como se usa en la presente, "hibridiza a un calificador" significa que hibridiza a al menos una sonda de oligonucleótido enlistada bajo el calificador en el Anexo A. Por ejemplo, los transcritos de ARN del gen de la enfermedad de RCC pueden hibridizar bajo condiciones de hibridación de configuración de ácido nucleico o severas para al menos 2, 4, 6, 8, 10, 12, 14 ó 16 sondas de oligonucleótidos enlistadas bajo el calificador correspondiente en el Anexo A. Los transcritos de ARN del gen de enfermedad RCC también pueden hibridizar bajo condiciones severas o altamente severas al CPS del calificador correspondiente. Los genes de enfermedad de RCC representados por los calificadores y CPS de la Tabla 2 se pueden determinar con base en la anotación de microplaqueta del gen HG-U95Av2 suministrada por Affymetrix. También se pueden determinar con base en los números de acceso Entrez enlistados en la tabla 3, como se apreciará por alguien con experiencia ordinaria en la técnica. Además, la identidad de los genes de la enfermedad RCC se puede evaluar por una búsqueda BLAST de los correspondientes CPS o sondas de oligonucleótidos, tales como aquellos enlistados en la Tabla 2 o Anexo A, contra una base de datos de secuencias del genoma humano. Las bases de datos de secuencias del genoma humano adecuadas para este propósito incluyen, pero no se limitan a, la base de datos de genoma \ humano Entrez mantenida en NCBI . La base de datos de genoma humano Entrez contiene alrededor del 97.8% de la secuencia total del genoma humano, y entre estos, alrededor del 63% son secuencia terminada y alrededor de 34.8% son secuencia sin terminar. El NCBI proporciona programas BLAS públicamente accesibles, tales como "blastn" para búsqueda BLAST de su secuencia de base de datos . Cada CPS se alinea con la hebra codificadora de proteína del gen o genes de enfermedad correspondiente RCC. Preferiblemente cada CPS alinea a los genes de enfermedad correspondientes RCC con al menos 97% de identidad de secuencia. Cada CPS puede hibridizar a los genes de enfermedad RCC correspondientes bajo condiciones de severidad o altamente severas. La tabla 4 enlista los CPS y sus correspondientes genes de enfermedad RCC. Todos los genes enlistados en la Tabla 4 se refieren colectivamente como "Tabla 4 de genes" .
Tabla 4. Genes de enfermedad CC CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 1 TLR2 AF051152 (SEQ ID NO: 1) ; y SEQ ID NO: 240 2 SLC1A4 el complemento de los ??978353 (SEQ ID NO: 2) 3 LGALS3 AB006780 (SEQ ID NO: 3) 4 DUSP6 AB013382 (SEQ ID NO: 4) ; y SEQ ID NO: 241 5 KHSRP SEQ ID NO: 5; y el complemento de los AA628946 (SEQ ID NO: 242) 6 T54 U66359 (SEQ ID NO: 6) 7 RAB13 X75593 (SEQ ID NO: 7) 8 DGCR5 X91348 (SEQ ID NO: 8) 9 ENIGMA L35240 (SEQ ID NO: 9) 10 ETS2 AF017257 (SEQ ID NO: 10); y J04102 (SEQ ID NO: 243) 11 PIP5K1C AB011161 (SEQ ID NO: 11) 12 TCFL1 D43642 (SEQ ID NO: 12); y SE ID NO: 244 13 UNK_AF055000 AF055000 (SEQ ID NO: 13) 14 IL1RAP AB006537 (SEQ ID NO: 14) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 15 REL X75042 (SEQ ID NO: 15) 16 ITGA7 AF032108 (SEQ ID NO: 16) 17 PPARD L07592 (SEQ ID NO: 17) 18 IL1RN X52015 (SEQ ID NO: 18) 19 LILRB3 AF025533 (SEQ ID NO: 19) 20 FOX03A SEQ ID NO: 20; y AF032886 (SEQ ID NO: 245) 21 ANXA5 U05770 (SEQ ID NO: 21) 22 SLC17A7 W26700 (SEQ ID NO: 22) (UNK W26700) 23 LOC51172 AF052111 (SEQ ID NO: 23) (UNK_AF052111 o APAA) 24 MPP1 M64925 (SEQ ID NO: 24) 25 TPM1 M19267 (SEQ ID NO: 25) 26 UNK_ 62896 62896 (SEQ ID NO: 26) 27 CSF2 M13207 (SEQ ID NO: 27) 28 XHFPL2 D86961 (SEQ ID NO: 28) (3676-4193) 29 PARVB el complemento de los AA187563 (UNK AA187563) (SEQ ID NO: 29) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 30 .MUC1 J05581 (SEQ ID NO: 30) 31 MARCO AF035819 (SEQ ID NO: 31) 32 DRD2 X51362 (SEQ ID NO: 32) 33 PPY el complemento de los 844998 (SEQ ID NO: 33) 34 AQP9 AB008775 (SEQ ID NO: 34) 35 APS AB000520 (SEQ ID NO: 35) 36 ALAS2 X60364 (SEQ ID NO: 36) 37 CTSL X12451 (SEQ ID NO: 37) 38 DKFZP586E1621 AL080235 (SEQ ID NO: 38) 39 PR02389 SEQ ID NO: 39; y el complemento de (ÜNK W28931) los W28931 (SEQ ID NO: 246) 40 BLVRB D32143 (SEQ ID NO: 40) 41 GNA13 L22075 (SEQ ID NO: 41) 42 AP2K3 D87116 (SEQ ID NO: 42) 43 BASP1 AA135683 (SEQ ID NO: 43) 44 BNIP3L AF079221 (SEQ ID NO: 44) 45 DBP , U48213 (SEQ ID NO: 45) 46 HBACH U91316 (SEQ ID NO: 46) ; y SE ID NO: 247 47 DGAT AF059202 (SEQ ID NO: 47) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 48 GU 1 L76200 (SEQ ID NO: 48) 49 IL10RB L42243 (SEQ ID NO: 49) 50 PDNP2 . D45421 (SEQ ID NO: 50) 51 SLC5A6 AL096737 (SEQ ID NO: 51) (ÜN AL096737) 52 GPR3 L32831 (SEQ ID NO: 52) 53 SOD2 X07834 (SEQ ID NO: 53); y SEQ ID NO: 248 54 TREX1 AJ243797 (SEQ ID NO: 54) 55 WNT6 H12458 (SEQ ID NO: 55) (UNK_H12458) 56 IP5K2A S78798 (SEQ ID NO: 56) (ÜNK_S78798) 57 FABP5 M94856 (SEQ ID NO: 57); y SEQ ID NO: 249 58 MMPS J05070 (SEQ ID NO: 58) 59 ENP2B1 J04027 (SEQ ID NO: 59); y SEQ ID NO: 250 60 NEUD4 U43843 (SEQ ID NO: 60) 61 CCR1 D10925 (SEQ ID NO: 61) ; y SEQ ID NO: 251 CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 62 C8F AJ000480 (SEQ ID NO: 62); y SEQ ID NO: 252 63 CLU M25915 (SEQ ID NO: 63); y SEQ ID NO: 253 64 EREG D30783 (SEQ ID NO: 64) 65 PPAP2B AF017786 (SEQ ID NO: 65) SEQ ID NO: 254 66 TÜBB X79535 (SEQ ID NO: 66) 67 NUP214 D14689 (SEQ ID NO: 67) 68 ALDH5A1 AL031230 (SEQ ID NO: 68) 69 LOC64116 AL049963 (SEQ ID NO: 69) (también referido como UNK AL049963) 70 XK Z32684 (SEQ ID NO: 70) 71 KIAA0837 AB020644 (SEQ ID NO: 71) 72 GYPC X12496 (SEQ ID NO: 72) 73 TFDP1 L23959 (SEQ ID NO: 73) ; y W28479 (SEQ ID NO: 255) 74 C20Orfl6 U61836 (SEQ ID NO: 74) (UNK U61836) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 75 FCAR U43774 (SEQ ID NO: 75) 76 ITGB3 M35999 (SEQ ID NO: 76) 77 MXI1 L07648 (SEQ ID NO: 77) ; y D63940 (SEQ ID NO: 256) 78 CSDA M24069 (SEQ ID NO: 78) ; y SE ID NO: 257 79 FIP2 AF061034 (SEQ ID NO: 79) 80 SELENBP1 U29091 (SEQ ID NO: 80); y SEQ ID NO: 258 81 PPP1R2 068111 (SEQ ID NO: 81) 82 PDG X82460 (SEQ ID NO: 82) 83 SLC4A1 SEQ ID NO: 83; y 27819 (SE ID NO: 259) 84 IL17R U58917 (SEQ ID NO: 84) 87 CBFA2 3 AB010419 (SEQ ID NO: 85) 89 RAP1GA1 AB007943 (SEQ ID NO: 86) (KIAA0474) 90 BCL2L1 L23115 (SEQ ID NO: 87) ; y SEQ ID NO: 260 91 COPEB AF001461 (SEQ ID NO: 88) 92 AD D14874 (SEQ ID NO: 89) ; y SEQ ID NO: 261 CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 93 SPTB J05500 (SEQ ID NO: 90) 94 ITGA2B M34480 (SEQ ID NO: 91) 95 CTNNAL1 U97067 (SEQ ID NO: 92) (ÜNK U97067) 96 SCYA2 M26683 (SEQ ID NO: 93) ; y M28225 (SE ID NO: 262) 97 NDUFB7 el complemento de los AA527880 (SEQ ID NO: 94) 98 SCYA7 X72308 (SEQ ID NO: 95) 99 FCGR1A 63835 (SEQ ID NO: 96) ; y SEQ ID NO: 263 100 EPB49 U28389 (SEQ ID NO: 97) 101 DD96 U21049 (SEQ ID NO: 98) 102 PPARG L40904 (SEQ ID NO: 99) 103 SPIN 1 el complemento de los AI961220 (SEQ ID NO: CPS 100) 104 PLAUR X74039 (SEQ ID NO: 101) 105 CDC34 L22005 (SEQ ID NO: 102) 106 ÜNK_AI732885 el complemento de los AI732885 (SEQ ID NO: 103) 107 IL10RA U00672 (SEQ ID NO: 104) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 108 FBX7 AL050254 (SEQ ID NO: 105) 109 IFIT4 AF026939 (SEQ ID NO: 106) 110 BAX, U19599 (SEQ ID NO: 107) 111 BSG X64364 (SEQ ID NO: 108) 112 THBS 1 U12471 (SEQ ID NO: 109) (UNKJJ12471) 113 G2AD AF068706 (SEQ ID NO: 110) 115 RALBP1 L42542 (SEQ ID NO: 111) 116 UNK_AF070587 AF070587 (SEQ ID NO: 112) (LOC196932) 117 DUX1 AJ001481 (SEQ ID NO: 113) 118 SLC6A8 U36341 (SEQ ID NO: 114) 119 THBD J02973 (SEQ ID NO: 115) 120 UNK_AF141349 AF141349 (SEQ ID NO: 116) (Tubulin, Beta) 123 HBE1 el complemento de los AI349593 (SEQ ID NO: 117); y SEQ ID NO: 264 125 MAD L06895 (SEQ ID NO: 118) 126 TSPAN-5 AF065389 (SEQ ID NO: 119) 127 BAG1 Z35491 (SEQ ID NO: 120) 128 ' PDI2 AB023211 (SEQ ID NO: 121) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 129 IL1R1 M27492 (SEQ ID NO: 122) 130 NP X00737 (SEQ ID NO: 123) 131 AQP3 el complemento de los N74607 (UNK N74607) (SEQ ID NO: 124) 132 GSPT1 X17644 (SEQ ID NO: 125) 133 GEF-2 el complemento de los AI565760 (SEQ ID NO: 126) 134 HBD SEQ ID NO: 127; y V00505 (SEQ ID NO: 265) 135 HAGH X90999 (SEQ ID NO: 128) 136 ERN1 AF059198 (SEQ ID NO: 129) 137 COL9A1 X54412 (SEQ ID NO: 130) 138 S100A11 D38583 (SEQ ID NO: 131) 139 FKBP1B D38037 (SEQ ID NO: 132) 141 RNAH SEQ ID NO: 133 AJ223948 (SE ID NO: 266) 142 MYRL2 J02854 (SEQ ID NO: 134) 143 SPOP AJ000644 (SEQ ID NO: 135) 144 SLC11A1 el complemento de los ??679353 (UNK AI679353) (SEQ ID NO: 136) 145 SIAH2 U76248 (SEQ ID NO: 137) ; y SEQ ID NO: 267 CPS NO. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 146 S100P AA131149 (SEQ ID NO: 138) 147 TNNT1 AJ011712 (SEQ ID NO: 139) ; SEQ ID NO: 268; y M19309 (SEQ ID NO: 269) 148 IAA0750 AB018293 (SEQ ID NO: 140) - 149 FOS K00650 (SEQ ID NO: 141) 150 PAI2 Y00630 (SEQ ID NO: 142) 151 PDXK U89606 (SEQ ID NO: 143) 152 U K_AL0 9250 AL049250 (SEQ ID NO: 144) 153 G 02 M36820 (SEQ ID NO: 145) 154 INPP4A U96919 (SEQ ID NO: 146) 155 GPT U70732 (SEQ ID NO: 147) 156 MYL4 SEQ ID NO: 148; y X58851 (SEQ ID NO: 270) 157 NFE2 S77763 (SEQ ID NO: 149) 158 POLR2J L37127 (SEQ ID NO: 150) 159' CARM1 AF055027 (SEQ ID NO: 151) 160 UNK_AF038171 AF038171 (SEQ ID NO: 152) 161 RAB2 SEQ ID NO: 153; y AF070629 (SEQ ID NO: 271) 162 6H9A L17330 (SEQ ID NO: 154) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 163 EPB42 60298 (SEQ ID NO: 155); y SEQ ID NO: 272 164 CGTHBA X90857 (SEQ ID NO: 156) 165 DOC-IR AF089814 (SEQ ID NO: 157) 166 KIAA0353 el complemento de los AI077476 (SEQ ID NO: 158) 167 CSH1 SEQ ID NO: 159 168 LOC51048 AF034209 (SEQ ID NO: 160) 169 SELP M25322 (SEQ ID NO: 161) 170 RAP1GA1 M64788 (SEQ ID NO: 162) 171 THBS1 X14787 (SEQ ID NO: 163) 172 CHRNA4 U62433 (SEQ ID NO: 164) 173 S100A12 D83664 (SEQ ID NO: 165) 174 CD9 M38690 (SEQ ID NO: 166) 175 TDPX1 L19185 (SEQ ID NO: 167) 176 B7 W27095 (SEQ ID NO: 168) 177 BPGM X04327 (SEQ ID NO: 169) 178 PSMA7 ' AF054185 (SEQ ID NO: 170); y SEQ ID NO: 273 179 GMPR M24470 (SEQ ID NO: 171); y SEQ ID NO: 274 CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 180 TMOD M77016 (SEQ ID NO: 172) 181 C4A SEQ ID NO: 173; y U24578 (SEQ ID NO: 275) , tal como los nucleótidos 16881 hasta 16928 y los nucleótidos 17131-17239 de SEQ ID NO: 275 182 GPR12 Ü18548 (SEQ ID NO: 174) 183 ADFP X97324 (SEQ ID NO: 175); y SEQ ID NO: 276 184 MYL5 L03785 (SEQ ID NO: 176) 185 DPM2 el complemento de los W80399 (SEQ ID NO: 177) 186 MCC M62397 (SEQ ID NO: 178) 187 F3 J02931 (SEQ ID NO: 179) 188 KLF1 U65404 (SEQ ID NO: 180) 189 HBG2 SEQ ID NO: 181; y M91036 (SEQ ID NO: 277), tal como los nucleótidos 2162-2268, 2391-2614 ó 3501-3565 de SEQ ID NO: 277 190 GR03 M36821 (SEQ ID NO: 182) 191 PLEC1 U53204 (SEQ ID NO: 183) 192 SLC16A3 U81800 (SEQ ID NO: 184) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 194 FKBP8 L37033 (SEQ ID NO: 185) 195 RNASE2 X55988 (SEQ ID NO: 186) 196 BCAT1 U21551 (SEQ ID NO: 187); y SEQ ID NO: 278 199 SPP1 J04765 (SEQ ID NO:- 188); y AF052124 (SEQ ID NO: 279) 201 GROl X54489 (SEQ ID NO: 189) 202 DKFZP58600223 AL096741 (SEQ ID NO: 190) 205 FASN U29344 (SEQ ID NO: 192) 206 HOXA1 U37431 (SEQ ID NO: 193) 207 HMOX1 Z82244 (SEQ ID NO: 194) 208 BNIP3 AF002697 (SEQ ID NO: 195) 209 ZNF261 X95808 (SEQ ID NO: 196) 210 YH7 58018 (SEQ ID NO: 197) 211 IL1B M15330 (SEQ ID NO: 198); y SEQ ID NO: 191 212 STX1A L37792 (SEQ ID NO: 199) 213 ATPASEP AJ006268 (SEQ ID NO: 200); y SEO ID NO: 280 214 CR1 X14362 (SEQ ID NO: 201) 215 DKFZP586 1523 AL050225 (SEQ ID NO: 202) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 216 KRT1 M98776 (SEQ ID NO: 203) 217 UNK_AF0 0571 AF070571 (SEQ ID NO: 204) (EXT1) 218 PPP3CB M29551 (SEQ ID NO: 205) 219 QSCN6 L42379 (SEQ ID NO: 206) 220 PRF1 SEQ ID NO: 207 M28393 (SE ID NO: 281) 221 FCGR3B X16863 (SEQ ID NO: 208) 222 PTGS2 U04636 (SEQ ID NO: 209) 223 OPHN1 AJ001189 (SEQ ID NO: 210) 224 VSNL1 AF039555 (SEQ ID NO: 211) 225 FECH SEQ ID NO: 212; y D00726 (SEQ ID NO: 282) 226 KIAA0 83 AB007952 (SEQ ID NO: 213) 227 HK3 U51333 (SEQ ID NO: 214) 228 MS4A3 L35848 (SEQ ID NO: 215) 223 SCYA20 U64197 (SEQ ID NO: 216) 230 C1QR1 U94333 (SEQ ID NO: 217) 231 POU1F1 D10216 (SEQ ID NO: 218)/ y D12892 (SEQ ID NO: 283) 232 TKTL1 X91817 (SEQ ID NO: 219) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 234 CCNT2 AF048732 (SEQ ID NO: 220) 235 ENP6V1H W27838 (SEQ ID NO: 221) (UNK_ 27838) 236 FN1 X02761 (SEQ ID NO: 222) 237 UNK_J04178 J04178 (SEQ ID NO: 223) (HEXA) 239 NR2C1 M21985 (SEQ ID NO: 224) 240 KIAA0168 28731 (SEQ ID NO: 225) 241 IL6 X04430 (SEQ ID NO: 226) 242 KIAA0372 AB002370 (SEQ ID NO: 227) 243 CYP4F2 U02388 (SEQ ID NO: 228) 244 STIP1 M86752 (SEQ ID NO: 229) 245 CBP2 D83174 (SEQ ID NO: 230) 246 UNKM14087 M14087 (SEQ ID NO: 231) 247 NCF1 M55067 (SEQ ID NO: 232) 248 CH 2 SEQ ID NO: 233; y U07223 (SEQ ID NO: 284) 249 ABL1 M14752 (SEQ ID NO: 234) 250 FLOT1 AF089750 (SEQ ID NO: 235) 251 REV3L (UNK AL096744 (SEQ ID NO: 236) AL096744) CPS NO. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 252 UC3 M55406 (SEQ ID NO: 237) 253 S ARCA4 U29175 (SEQ ID NO: 238) 254 LOC92684 AF035314 (SEQ ID NO: 239) (Ü K_AF035314) 255 EEF1A2 X70940 (SEQ ID NO: 285) 256 BRF2 U07802 (SEQ ID NO: 286) 257 SNRPG el complemento de los AI803447 (SEQ ID NO: 287) 258 UMA1 Z11584 (SEQ ID NO: 288) 259 AKR1B1 X15414 (SEQ ID NO: 289) 260 SMARCE1 AF035262 (SEQ ID NO: 290); y SEQ ID NO: 328 261 IAA0669 el complemento de los AI452442 (SEQ ID NO: 291) 262 MSF AB023208 (SEQ ID NO: 292) 263 PTMA M14630 (SEQ ID NO: 293) 264 KIAA0410 AB007870 (SEQ ID NO: 294) 265 PSMD3 D67025 (SEQ ID NO: 295) 266 C1QBP M69039 (SEQ ID NO: 296) 267 OSR1 AB017642 (SEQ ID NO: 297) 268 CD44 L05424 (SEQ ID NO: 298) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 269 CRADD U84388 (SEQ ID NO: 299) 270 CCRL2 AF014958 (SEQ ID NO: 300) 271 KIAA0707 AB014607 (SEQ ID NO: 301) 272 KIAA1113 AB029036 (SEQ ID NO: 302); y SEQ ID NO: 316 273 UNK_AL050119 ALO50119 (SEQ ID NO: 303) 274 ÜN _AF052115 AF052115 (SEQ ID NO: 304) 275 MITF AB006909 (SEQ ID NO: 305) 276 STAT3 SEQ ID NO: 306; y L29277 (SEQ ID NO: 315) 277 TPD52L2 AF004430 (SEQ ID NO: 307) 278 1INK_AI732885 el complemento de los AI732885 (SEQ ID NO: 308) 279 MAP3 8 D14497 (SEQ ID NO: 309) 280 NSP-CL AB020693 (SEQ ID NO: 310) 281 NRG1 L41827 (SEQ ID NO: 311) 282 RAB31 U59877 (SEQ ID NO: 312) 283 MEF2D L16794 (SEQ ID NO: 313) 284 U K_AF038187 AF038187 (SEQ ID NO: 314) 285 CXCR4 L06797 (SEQ ID NO: 317) CPS No. Gen Secuencias útiles para hacer correspondiente sondas/cebadores para detectar el gen correspondiente 286 M9 AB019392 (SEQ ID NO: 318) 287 FAU X65923 (SEQ ID NO: 319) 288 PS6 X67309 (SEQ ID NO: 320) ; y SEQ ID NO: 330 289 BAG5 AB020680 (SEQ ID NO: 321) 290 UNK_AL022721 el complemento de los SEQ ID NO: 322 (AL022721) ;y SEQ ID NO: 329 291 DKZP586E0820 AL050147 (SEQ ID NO: 323) 292 NONO U02493 (SEQ ID NO: 324) 293 UNK_AI743507 el complemento de los SEQ ID NO: 325 (AI743507) ; y SEQ ID NO: 331 294 MAPKAPK5 AF032437 (SEQ ID NO: 326) 295 UNK_U79297 U79297 (SEQ ID NO: 327) CPS 1 corresponde a TLR2 que codifica al receptor 2 similar a toll . TLR2 tiene el lugar ID: 7097 y se localiza en el cromosoma 4 con una ubicación citogenética reportada 4q32. La proteína codificada por el gen TLR2 es un miembro de la familia del receptor del tipo Toll (TLR) que se cree que juega un papel fundamental en el reconocimiento de patógenos y la actividad de la inmunidad innata. Los TLR son altamente conservados de la Drosophila a los humanos y comparten similitudes estructurales y funcionales. Reconocen los patrones moleculares asociados con patógenos (PAMP) que se expresan sobre agentes infecciosos, y median la producción de citocinas necesarias para el desarrollo de la inmunidad efectiva. Los diversos TLR muestran patrones diferentes de expresión. El TLR2 se reporta que se expresa abundantemente en los leucocitos de sangre periférica, y para mediar en la respuesta a hospedadores a bacterias gram-positivas y levadura por medio de la estimulación de NF-kappaB. TLR2 también puede mediar la señal para la apoptosis. CPS 2 corresponde a SLC1A4 que codifica la familia 1 de portador de soluto (transportador de aminoácido neutral/glutamato) , miembro 4. SLC1A4 tiene una identificación de ubicación: 6509, y se ubica en el cromosoma 2 con una ubicación citogenética reportada 2pl5-pl3. El producto de gen es un transportador de aminoácido neutral dependiente del sodio, y tiene una actividad de canal de cloruro independiente. Puede funcionar para equilibrar los grupos de aminoácidos neutrales. CPS 3 corresponde a LGALS3 que codifica una lectina soluble enlazada a la galactosidasa, 3 (galectin 3) . LGALS3 tiene una identificación de ubicación: 3958, y se localiza en el cromosoma 14 con una ubicación citogenética reportada 14q21-q22. LGALS3 puede estar involucrado en la regulación del crecimiento celular.
CPS 4 corresponde a DUSP6 que codifica la fosfatasa 6 de especificidad doble. DUSP6 tiene una ID de identificación: 1848, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12q22-q23. La proteína codificada por el gen DUSP6 es un miembro de la subfamilia de proteína fosfatasa de especificidad doble. Estas fosfatasas pueden inactivar sus cinasas objetivo al desfosforilar los residuos tanto de fosfoserina/treonina como fosfotirosina . Pueden ser miembros negativamente regulados de las superfamilia de la proteína cinasa (MA.P) activada por mitógeno ( APK/ERK, SAPK/J K, p38) , que se asocian con proliferación y diferenciación celular. Diferentes miembros de la familia de fosfatasa de especificidad doble muestran distintas especificidades de substrato para varias cinasa ???, diferentes distribución de tejido y ubicación celular, y diferentes modos de inducción de su- expresión por estímulos extra celulares . Se reporta que el producto de gen DUSP6 que inactiva ERK2 , se expresa en una variedad de tejidos con altos niveles de expresión en el corazón y páncreas, y se ubica en el citoplasma. La proteína fosfatasa 6 de especificidad doble puede desfosforiiarse selectivamente e inactivar la cinasa MAP. CPS 5 corresponde a HSRP que codifica la proteína reguladora de empalme tipo KH ( proteína de enlace FUSE 2) . KHSRP tiene un ID de ubicación: 8570, y se localiza en el cromosoma 19 con la ubicación citogenetica reportada a 19pl3. 3. Se reporta que el producto de gen KHSRP es un componente de complejo multiproteína y puede estar involucrado en el empalme del exón NI de SRC. La secuencia genómica (nucleótidos 544983 hasta 544793 del cromosoma 19) que alinean al CPS 5 se localizan en dirección descendente 3' a la secuencia que codifica la secuencia de KHSRP. Esta secuencias genómica también se localiza dirección descendente a la dirección que codifica el polipéptido de LOC125980. LOC125980 codifica una proteína similar al precursor C3 de complemento (humano) . se ¦ ha reportado la ubicación citogenetica 19pl3.3. Los nucleótidos 1-501 de SEQ ID NO: 241 (AA628946) tienen alrededor de 99% identidad de secuencia para KHSRP. En consecuencia SEQ ID NO: 241 puede usarse para diseñar sondas para detectar el perfil de expresión de KHSRP. Los nucleótidos 1-286 de SEQ ID NO: 241 también muestran alrededor de 89-93% de identidad de secuencia a la secuencia genómica cercana a la secuencia que codifica el polipéptido del gen supuesto LOC138679. El LOC138679 codifica una proteína similar a la proteína reguladora de empalme de tipo KH (proteína 2 de enlace FUSE) y la proteína reguladora de empalme tipo KH (proteína 2 de enlace FUSE) . El LOC138679 se localiza en el cromosoma 9 con una ubicación citogenética reportada 9p21.1.
CPS 6 corresponde a T54 que codifica la proteína T54. La T54 tiene una ID de ubicación: 27238, y se localiza en el cromosoma X con una ubicación citogenética reportada Xpll. 23. La proteína T54 tiene una región de baja similitud a Spp2 . CPS 7 corresponde a RAB13, miembro de la familia encogen RAS. El RAB13 tiene una ID de ubicación: 5872, y se localiza en el cromosoma 1 en un ubicación citogenética reportada lq21. 2. El producto de gen AB13 se conoce como la proteína 13 enlazada a GTP, y pueden involucrada en el transporte de vesícula. Es un miembro de la familia RAB de GTPases pequeños. Los nucleótidos 106- 1212 de SEQ ID NO: 7 (X75593) también alinean la secuencia genómica ubicada en el cromosoma 12 con una ubicación citogenética reportada 12ql3. CPS 8 corresponde a una secuencia genómica (DGCR5) en la región 5 critica del síndrome DiGeorge en el cromosoma 22. La correspondiente secuencia genómica se localiza en dirección descendente a la secuencia codificadora del gen supuesto LOC128966 (similar a la anhidrasa carbónica 15) . LOC128966 tiene una ID de ubicación de : 9993, y se localiza en la ubicación citogenética 22qll.l. CPS 8 también muestra alrededor del 97% de identidad de secuencia con una secuencia genómica cercana al gen supuesto LOC91208 en el cromosoma 22. LOC91208 a reportado la ubicación citogenética 22qll.21.
La búsqueda Blast de X91348 (SEQ ID NO: 8) muestra una secuencia genómica correspondiente que se ubica en el cromosoma 22. La secuencia genómica incluye el gen supuesto LOC200301 (similar a la proteína KIAA1647) y el gen A de síndrome DiGeorge (DGS-A) . El DGS-A tiene la ID de ubicación: 25787. Las eliminaciones de la región cercana a 22qli.2 se han asociado con una amplio rango de defectos del desarrollo (notablemente el síndrome DiGeorge, síndrome de velocardiofacial , síndrome de cara conotroncal anómala y defectos cardiacos conotroncales aislados) clasificados bajo el acrónimo CATCH 22. Además, los fragmentos de nucleótidos de 132 hasta 699 a X91348 tiene 91% de identidad de secuencia a CELSR1 que codifica el receptor 1 de tipo G de siete pasos EGF LAG, caderina (homólogo de flamingo, Drosophila) . El CELSR1 tiene una ID de ubicación: 9620, y también se localiza en el cromosoma 22. CPS 9 corresponde a ENIGMA que codifica el enigma (proteína de domino LIM) . ENIGMA tiene un ID de ubicación: 9260, y se localiza en el cromosoma 5 con una ubicación citogenética reportada 5q35.3. La proteína codificada por este gen es representante de la familia de proteínas compuestas de los dominios PDZ y LIM conservadores . Los dominios LIM se proponen para funcionar en el reconocimiento de proteína-proteína en una variedad de compuestos que incluyen ' la transcripción del gen y el desarrollo en la interacción sito esqueletal . Los dominios LIM del producto del gen ENIGMA, pueden enlazarse a las proteínas cinasas, mientras el domino PDZ puede enlazarse a los filamentos de actina. El producto del gen puede estar involucrado en el ensayo de un complejo asociado con el filamento de actina esencial para la transmisión la señalización mitogénica ret/ptc2. La función biológica del producto del gen ENIGMA se propone para que sea de un adaptador, con el domino PDZ localizado en las proteínas enlazados a LIM para filamentos de actina de tanto el músculo esqueletal como tejidos no musculares. También se reporta que el producto de gen ENIGMA puede enlazarse al receptor de insulina (INSR) . CPS 9 también tiene alrededor de 99% de identidad de secuencia para LOC220783 que codifica una proteína similar a enigma (proteína de dominio LIM ) . LOC220783 se localiza en el cromosoma 5 con un ubicación citogenetica reportada 5q35.3. CPS 10 corresponde a ETS2 que codifica el homólogo 2 de oncogen E26 de virus de eritroblastosis v-ets (ave) . ESTS2 tiene una ID de: 2114, y se localiza en el cromosoma 21 con una ubicación citogenetica reportada 21q22.2. El producto de gen ETS2 se considera que es un factor de transcripción, y pueden tener papel en alguna de las anormalidades esqueletales en el síndrome de Down.
CPS 11 corresponde a PIP5K1C que codifica la fosfatidilnositol-4-fosfatasa 5-cinasa, de tipo 1, gamma. PIP5K1C tiene una ID de ubicación: 23396, y se localiza en el cromosoma 19 con una ubicación citogenética reportada 19pl3.3. CPS 12 corresponde a TCFLl que codifica el factor tipo 1 de transcripción. El gen tiene un ID de ubicación: 6944, y se localiza en el cromosoma 1 con una ubicación citogenética reportada lq21. La secuencia de codificación del gen supuesto LOC148320 se localiza dentro de TCFLl. LOC148320 también se alinea con CPS 12. CPS 13 puede derivarse del AR m de homo sapiens para un huérfano de hígado desconocido. Los genes hipotéticos que corresponden a CPS 13 y producen los transcritos de AR m capaces de hibridizar bajo condiciones severas a CPS 13 se refieren en la presenta como UNK-AF055000. CPS 14 corresponde a IL1RAP que codifica la proteína accesoria del receptor de interleucina 1. El gen tiene ID de ubicación: 3556, y se localiza en el cromosoma 3 con una ubicación super genética' reportada 3q28. El producto de gen es un correceptor para IL-1RI (IL1R1) . CPS 15 corresponde a REL que codifica el homólogo de oncogen viral reticuloendoteliosis v-rel (ave) . El gen tiene una ID de ubicación: 5966, y se localiza en un cromosoma 2 a una ubicación citogenética reportada 2pl3-pl2. El producto de gen se considera que es un factor de transcripción. CPS 16 corresponde a ITGA7 que codifica la integrina, alfa 7. El gen tiene una ID de ubicación: 3679, y se localiza en el cromosoma 12 con una ubicación citogenética reportada 12ql3. ITGA7 codifica la integrina alfa de cadena 7. Las integrinas son proteínas de membrana integral heterodiméricas compuestas de una cadena alfa y una cadena beta. La cadena alfa 7 experimenta un desdoblamiento postraduccional del dominio extracelular para proporcionar cadenas pesadas y ligera enlazadas al disulfuro que se juntan con beta 1 para formar una integrina que se enlaza a la proteina de matriz extracelular laminina 1. La alfa 7 beta 1 es un complejo de integrina principal que se expresan en células del músculo diferenciadas. Las variantes de empalme de alfa 7 que difieren tanto en los dominios extracelulares como citopl smicos existentes en el ratón. Sin embargo, a la fecha solo se aislado un tipo de transcrito, humano sencillo. Contiene dominios extracelulares y citoplásmicos correspondientes a las variantes X2 y B ratón respectivamente. Se ha identificado una variante de empalme extracelular única en el humano, no obstante puede representar una especie menor y su significado biológico no es claro. La subunidad alfa 7 de la integrina es un receptor de laminina.
La anotación Affymetrix sugiere que CPS 17 corresponde a PPARD. La búsqueda Blas contra la base de datos de genoma humano Entrez muestra que CPS 17 también se alinea a LOC221486 sobre el 98% de identidad de secuencias. LOC221486 codifica una proteína similar al receptor beta activado por el proliferador de peroxisoma (PPAR-beta) (PPAR-delta) (receptor 1 de hormona nuclear) (NUCI) (NUCI) . El gen se localiza en el cromosoma 6 con una ubicación citogenética reportada 6p21.1. CPS 18 corresponde a IL1RN que codifica el antagonista del receptor de interleucina 1. El gen tiene el ID de ubicación: 3557, y se localiza en el cromosoma 2 con una ubicación citogenética reportada 2ql4.2. El producto de gen pueden enlazarse a inhibir el receptor IL-1. El producto de gen en un miembro de la familia de interleucina 1 (IL-1) . CPS 19 corresponde a LILRB3 el cual codifica el receptor de tipo inmunoglobulina de leucocito, de la subfamilia B (con los dominios TM y ITIM) , miembro 3. El gen tiene el lugar ID: 11025, y se localiza a el cromosoma 19 con una localización citogenética reportada 19ql3.4. El producto del genes puede jugar un papel en la regulación de respuestas inmunes. Es un miembro de la superfamilia ' de inmunoglobulina. CPS 19 también muestra que alrededor del 99% de la identidad de secuencia para LOC163021. LOC163021 codifica una proteína similar al transcrito 5 de inmunoglobulina. El gen se localiza en el cromosoma 19 con una ubicación citogenética reportada 19gl3.42. CPS 20 corresponde a FOX03A que codifica el recuadro de forkhead 03?. El gen tiene un LocusID: 23.09, y se localiza en el cromosoma 6 con una ubicación citogenética reportada 6q21. El producto de gen pertenece a la familia de forkhead de los factores de transcripción que se caracterizan por un dominio diferente de forkhead. Este gen puede funcionar como un disparador para la apoptósis a través de la expresión de los genes necesarios para la muerte celular. La transubicación de este gen con el gen MLL se puede asociar con la leucemia aguda secundaria. Los nucleótidos 1-3183 de SEQ ID NO: 245 (AF032886) , comparten al menos un 99% de identidad de secuencia para FOX03A. Consecuentemente, SEQ ID NO: 245 se puede usar para diseñar sondas para detectar la expresión de FOX03A. Los nucleótidos 672 a 3182 de SEQ ID NO: 245 también tienen un 98% de identidad de secuencia para L0C147167. LOC147167 es similar a bA653O20.1 (recuadro de forkhead 03A (homólogo de drosophila de forkhead tipo 1, FKHRL1) ) . LOC147167 se localiza en el cromosoma 17 con una ubicación citogenética reportada 17pll.l. CPS 21 corresponde a ANXA5 que codifica la anexina A5. El gen tiene LocusID: 308, y se localiza en el cromosoma 4 con una ubicación citogenética reforzada 4q28-q32. El producto de genes pertenece a la familia de la anexina de las proteínas de enlace de fosfolipidos dependientes del calcio, algunas de las cuales han estado implicadas en eventos relacionados con la membrana a lo largo de las trayectorias exocitóticas y endocitóticas . El producto del gen es una fosfolifasa A2 y una proteína inhibidora de la proteina cinasa C con la actividad del canal del calcio y un papel potencial en la transducción de señal celular inflamación de cimiento y diferenciación. El producto de genes también se ha descrito como una proteína 1 anticoagulante de la placenta, alfa anticoagulante vascular, endonexina II, lipocortina V, proteína de la placenta 4 y ancorina CII. El gen contiene al menos 13 exones y codifica al menos un transcrito de aproximadamente 1.6 kb y al menos un producto de proteínas con un peso molecular de alrededor de 35 kDa. CPS 22 corresponde a SLC17A7 que codifica la familia del portador de soluto 17 (contra portador de fosfato inorgánico dependiente del sodio), miembro 7. El gen tiene un LocusID: 57030, y se localiza en .el cromosoma 19 con una localización citogenética reportada 19gl3. La proteína codificada por este gen es altamente similar al cotransportador de fosfato inorgánico dependiente del sodio específico del cerebro (R.norvegicus) . La proteína es un transportador de fosfato dependiente del sodio enlazado a la vesícula. Se puede asociar con las membranas de las vesículas sinápticas y la función en el transporte de glutamato . La proteína comparte 82% de identidad con el cotransportador de fosfato inorgánico dependiente de Na asociado con la diferenciación. CPS 23 corresponde a LOC51172 (APAA) que codifica el N-acetilglucosamina-l-fosfodiéster alfa-N-acetilglucosaminidasa. El gen tiene LocusID: 51172 y se localiza en el cromosoma 16 con una ubicación citogenética reportada 16pl3.13. N-acetilglucosamina-l-fosfodiéster alfa-N-acetilglucosaminidasa (fosfodiéster alfa-GlcNAasa) cataliza la segunda etapa en la síntesis de la mañosa 6-fosfato, y pueden estar involucrado en la formación de la señal de reconocimiento de la mañosa 6 fosfato en las enzimas lisosomales . CPS 24 corresponde a MPP1 que codifica la proteína de membrana palmitoilada 1 (55kD) . El gen tiene LocusID: 4354, y se localiza con el cromosoma X con una ubicación citogenética reportada Xq28. La proteína de membrana palmitoilada 1 es el prototipo de una familia de proteínas asociadas con al membrana denominadas A.GUKS (homólogos de guanilato cinasa asociados con la membrana) . MA.GUKS interactúa con el citoesqueleto y regula la proliferación celular, las trayectorias de señalización y las uniones intracelulares. La proteína 1 de membrana palmitoilada contiene una secuencia conservada denominada SH3 (homología 3 de src) en la porción que se encuentran en diversas otras proteínas que se asocian con el citoesqueleto y se sospecha que juegan papeles importantes en la transducción de señales . La proteína 1 de membrana palmitoilada es similar al dlg de Drosofila (un supresor de tumores) y a las guanilatos cinasa. CPS 25 corresponde a TPMl que codifica la tropomiosina 1 (alfa) .El gen tiene LucosID: 7168, y se localiza en el cromosoma 15 con una ubicación citogenética reportada 15q22.1. La alfa tropomiosina 1 se enlaza a la actina y la troponina, es un miembro de una familia de proteínas de enlace de la tropomina y de enlace a la actina. CPS 26 corresponde a ???_?62896 que muestra alrededor de un 99% de identidad de secuencia con la hebra codificadora que no es de proteína del gen TRIM2. TRIM2 codifica la porción tripartita que contiene 2 y tiene LocusID: 23321 con una ubicación citogenética reportada 4q31.23. CPS 26 muestra alrededor de 86-90% de similitud de secuencia con LOC221025 y ANXA2P2. LOC221025 es un gen hipotético soportado por M62895. LOC221025 se localiza en el cromosoma 10. ANXA2P2 se localiza en el cromosoma 9 y codifica el pseudogen 2 de la anexina A2. Además CPS 26 tiene un 91-93% de identidad de secuencia con dos exones de ANXA2. A XA2 codifica la anexina ?2 , y tiene LocusID: 302 con una ubicación citogenética reportada 15q21~q22. CPS 27 corresponde a CSF2 que codifica el factor 2 estimulador de colonias (granulocito/macrófago) . El gen tiene XiOCUsID: 1437 y se localiza en el cromosoma 5 con una ubicación citogenética reportada 5q31.11. El factor 2 estimulador de la colonia de macrofagos y granulocitos regula la diferenciación de células hematopoyéticas , la expresión y crecimiento de genes . CPS 28 corresponde a LHFPL2 que codifica el compañero de fusión de lipoma H GIC del tipo 2. El gen tiene LocusID: 10184 y se localiza en el cromosoma 5 con una ubicación citogenética reportada 5ql3.3. Parte del CPS 28 tiene alrededor de un 90% de identidad de secuencia para LOC220397. LOC220397 codifica una proteína 4 del grupo de alta movilidad 4 (HMG- ) (proteína 2a del grupo alta movilidad) (HMG-2a) , y se localiza en el cromosoma 11 con una ubicación citogenética reportada llql4.2. CPS 29 corresponde a PARVB que codifica parvina beta. EL gen tiene un LocusID : 29780 , y se localiza el cromosoma 22 con un ubicación citogenética reportada 22ql3.2-ql3.33. El producto del gen también se conoce como proteína CGI-56. CPS 30 corresponde a MUCI que codifica la mucina 1 de transmembrana. El gen tiene LocusID: 4582, y se localiza en el cromosoma 1 con una ubicación citogenética reportada lq21. El producto del gen MUCI es una glicoproteína de transmembrana de superficie celular. Las alteraciones en la glicosilación se han observado en células de cáncer epiteliales . El gen MUCI contiene al menos 7 exones y diversas variantes alternativamente empalmadas se han informado. CPS 30 tiene también al menos un 99% de identidad de secuencia con LOC245755, que es un gen . hipotético soportado por NM_002456 y X52228. L0C245755 se localiza dentro de UC1. CPS 31 corresponde a MARCO que codifica el receptor macrófago con una estructura de colágeno. El gen tiene un LocusID. 8685, y se localiza en el cromosoma 2 con una ubicación citogenética reportada 2ql2-ql3. La proteína del gen tiene una estructura del colágeno que contiene una región de enlace a bacterias . CPS 32 corresponde a DRD2 que codifica el receptor de dopamina D2. El gen tiene un LocusID: 1813, y se localiza en el cromosoma 11 con una ubicación citogenética reportada llq23. Este gen codifica el subtipo D2 del receptor de dopamina. Este receptor acoplado a la proteína G puede incrementar la actividad de más potasio e inhibir la adenilil ciclasa, el flujo de calcio y el retorno de fosfolípidos . Una mutación en antisentido en este gen provoca myoclonus dystonia. Se han asociado otras mutaciones con la esquizofrenia. Un empalme alternativo de este gen resulta en dos variantes de transcrito que codifican diferentes isoformas. Se ha descrito una tercera variante, pero no se ha determinado si esta forma es normal o se debe un empalme aberrante.
CPS 33 corresponde a PPY que codifica el polipéptido pancreático. El gen tiene LocusID: 5539, y se localiza en el cromosoma 17 con una ubicación citogenética reportada 17g21. El producto de genes es un precursor del polipéptido pancreático y el icosapéptido pancreático. El péptido pancreático maduro puede inhibir la función exocrina pancreática. CPS 34 corresponde a AQP9 que codifica la acuaporina 9. EL gen tiene LocusID: 366, y se localiza en el cromosoma 15 con una ubicación citogenética reportada 15q22.1-22.2. La proteína intrínseca principal de acuaporinas son una familia de canales de membrana selectivos al agua. La acuaporina tiene una mayor similitud de secuencia con AQP3 y AQP7 y puede ser una subfamilia. La acuaporina 9 permite el paso de una amplia variedad de solutos no cargados. La acuaporina 9 estimula el transporte de urea y la permeabilidad osmótica en agua. Existen informes contradictorios acerca de su papel en suministrar la permeabilidad de glicerol . La acuaporina 9 también puede tener un papel en funciones especializadas en leucocitos tales como la respuesta inmunológica y la actividad bactericida. La acuaporina 9 se expresa en leucocitos . CPS 35 corresponde a APS que codifica la proteína del adaptador con la homología de plecstrina y los dominios 2 de homología con src. El gen tiene un LocusID: 10603 y se localiza en el cromosoma 7 con una ubicación citogenética reportada 7q22. La proteína de APS expresada en los leucocitos B contiene la homología a la plecstrina y los dominios 2 de homología src (SH2) . En las líneas celulares de linfoma de Burkitt, es un tiroxina fosforilada en la respuesta de la estimulación del receptor de células B. Debido a que se enlaza, a Shc independiente de la estimulación y a Grb2 después de la estimulación, parece jugar un papel en la transducción de señal desde el receptor a Shc/Grb2. Se pueden ligar tirosinas cinasas activadas a las trayectorias de señalización. CPS 36 corresponde a ALAS2 que codifican el aminolevulinato , delta-sintasa 2 (anemia sideroblastica/hipocromica) . El gen tiene LocusID: 212, y se localiza en el cromosoma X con una ubicación citogenética reportada Xpll.21. El producto del gen ALAS2 cataliza las primera etapa en la trayectoria biosintética heme. Un segundo gen de delta aminolevulinatos sintasa (ALAS1) se localiza en el cromosoma 3 y se expresa en diversos tejidos. Un gen defectuoso ALAS2 pueden provocar una anemia sideroblástica en respuesta a la piridoxina ligada en X (anemia hipocrómica) . EL producto del gen también se conoce como delta aminolevulinato sintasa específica de eritroide.
CPS 36 tiene alrededor de 99% de identidad de secuencia para LOC203568. LOC203568 codifica una proteina similar a cintaza del ácido 5-aminolevulinico, específica de eritroide, precursor mitocondrial (sintasa delta-aminolevulinata) (sintetasa Delta-ALA) (ALAS-E) . El gen se localiza en el cromosoma X con la ubicación citogenética reportada Xpl 1. 22. CPS 37 corresponde a CTSL que codifica la catepsina L. El gen tiene la ID de ubicación: 1514, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9q21-q22. El producto de gen es una cisteína (tiol) proteasa lisosomal que puede desdoblar colágeno y elastina. CPS 37 tiene alrededor de 80-90% de identidad de secuencia para ciertos otros genes. Estos genes incluyen LOC118945, LOC119215 y L0C219343. LOC118945 es similar al precursor de Catepsina L (Principal proteína excretada) (MEP) . Se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q23.32. LOC119215 también es similar al Precursor de Catepsina L (Principal proteína excretada) (MEP). Tiene la ubicación citogenética reportada 10q21.1. LOC219343 tiene la ubicación citogenética reportada 10q23.2.
CPS 38 corresponde a DKFZP586E1621 que codifica senescencia 1 inducida por Ras . El gen tiene la ID de ubicación: 25907, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p21.3. El gen también se conoce como RIS1. CPS 39 corresponde a PR02389 que codifica una proteína hipotética. El gen tiene la ID de ubicación: 80344, y se localiza en el cromosoma 14 con la ubicación citogenetica reportada 14qll.2. El producto de gen es débilmente similar a un factor de enpalme de 38kDa [H. sapiens] . CPS 40 corresponde a BLVRB que codifica la biliverdina reductasa B (flavin reductasa (NADPH) ) . El gen tiene la ID de ubicación: 645, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3. l-ql3.2. CPS 41 corresponde a GNA13 que codifica proteína que enlaza la nucleótido guanina (proteína G) , alfa 13. El gen tiene la ID de ubicación: 10672, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q22-q2 . El producto de gen es un componente del complejo de proteína G heterotrimérico . CPS 41 muestra alrededor de 75-80% de similitud de secuencia para una secuencia genómica cercana a LOC130117. LOC130117 es similar a la proteína de dedo zinc 10 (KOX 1) , y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2pll.2. CPS 42 corresponde a ???2 3 que codifica la cinasa 3 de proteína cinasa activada por mitógeno. El gen tiene la ID de ubicación: 5606, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17qll.2. La proteína codificada por este gen es una proteína cinasa de especificidad doble que pertenece a la familia de cinasa cinasa MAP . ' Esta cinasa puede activarse por tensión mitogénica y ambiental, y puede participar en la cascada de señalización mediada por la cinasa MAP. Puede fosforilarse y de esta manera activar MAPK14/p 8-MAPK. Esta cinasa también puede activarse por insulina, y puede ser necesaria para la expresión del transportador de glucosa. La expresión del oncogeno RAS se encuentra que resulta en la acumulación de la forma activa de esta cinasa, lo que lleva de esta manera a la activación constitutiva de ???14, y confiere transformación oncogénica de células primaria. La inhibición de esta cinasa está involucrada en la patogénesis de Yersina pseudotuberculosis . Tres variantes de transcrito alternativamente empalmados de este gen codifican distintas isoformas se han reportado. CPS 42 tiene alrededor de 96-98% de identidad de secuencia para LOC146732. LOC146732 es similar a la cinasa 3b de cinasa MAP, y tiene la ubicación citogenética reportada 17pl3.1. CPS 43 corresponde a BASP1 que codifica la señal de proteína 1 enlazada a la membrana, abundante en el cerebro. El gen tiene la ID de ubicación: 10409, y se localiza en el cromosoma 5 con la ubicación citogenética reportada 5pl5.1-pl4. Los nucleótidos 433 hasta 554 de 135683 también tienen 91% de identidad de secuencia para el gen supuesto LOC222467 el cual se localiza en el cromosoma 13 con la ubicación citogenética reportada 13ql2.11. CPS 44 corresponde a BNIP3L que codifica BCL2/la proteína que interactúa con adenovirus BIB de 19kD tipo 3. El gen tiene la ID de ubicación: 665, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8p21. Este gen es un miembro de la familia de la proteina que interactúa con BCL2/adenovirus E1B de 19 kd (BNIP) . El producto de gen BNIP3L puede interactuar con la proteína E1B de 19 kDa que es responsable para la protección de muerte celular viralmente inducida. El producto de gen es un homólogo funcional de BNIP3, una proteína proapoptótica . El producto de gen puede funcionar simultáneamente con BNIP3 y jugar un papel en la supresión del tumor. El producto de gen también puede enlazar Bcl2 o Bcl2Ll celular, y puede promover la apoptosis. CPS 45 corresponde a DBP que codifica el sitio D de la proteína que se enlaza al promotor de albúmina (caja de albúmina D) . El gen tiene la ID de ubicación: 1628, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.3. El producto de gen puede funcionar como, un factor de transcripción y jugar un papel en la regulación diaria de genes específicos del hígado. Es un miembro de la familia b/ZIP (rica en prolina y aminoácido ácido) PAR.
CPS 46 corresponde a BACH (hBACH) que codifica la acil-CoA hidrolasa del cerebro. El gen tiene la ID de ubicación: 11332, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lp36.31-p36.11. El producto de gen es un miembro de la familia de coenzima de acilo. Puede hidrolizar el tioéster CoA de palmitoil-CoA y otros ácidos grasos de cadena larga. El producto de gen también se conoce como hidrolasa del tioéster A de la coenzima de acilo citosólica . Los nucleótidos 76-1101 de la SEQ ID NO: 46 (U91316) tienen alrededor de 89% de identidad de secuencia para LOC132927 que codifica una proteína similar a la hidrolasa del tioéster A de la coenzima de acilo citosólica (hidrolasa de tioéster acil-CoA de cadena larga) (CTE-II) (hidrolasa acil-CoA del cerebro) (BACH) . L0C132927 se localiza en el cromosoma 4 con la ubicación citogenética reportada 4pl4. CPS 47 corresponde a DGATl que codifica el homólogo 1 de diacilglicerol O-aciltransferasa (ratón) . El gen tiene la ID de ubicación: 8694, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8qter. La enzima codificada por este gen utiliza diacilglicerol y acil CoA graso como substrato con objeto de catalizar la etapa final de la síntesis de triacilglicerol . También está involucrado en procesos metabólicos celulares así como fisiológicos. CPS 48 corresponde a GUK1 que codifica la guanilato cinasa 1. El gen tiene la ID de "ubicación: 2987, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Iq32-q41. El producto de gen puede convertir GMP a GTP como parte del ciclo cG P . CPS 49 corresponde a IL10RB que codifica el receptor de interleucina 10, beta. El gen tiene la ID de ubicación: 3588, y se localiza en el cromosoma 21 con la ubicación citogenética reportada 21q22.11. La subunidad beta del receptor de interleucina 10 transduce una señal durante el enlace de interleucina-10 (IL10) . Es un miembro de la clase II de la familia del receptor de citocina (CRF2) . La región cromosomal que alinea a CPS 49 también se localiza en dirección desendente a la secuencia que codifica el polipéptido de IFNAR2. IFNAR2 codifica el receptor 2 interferón (alfa, beta y omega) . El gen tiene la ID de ubicación: 3455, y se localiza en el cromosoma 21 con la ubicación citogenética reportada 21q22.11. CPS 50 corresponde a ENPP2 (PDNP2) que codifica ectonucleótido pirofosfatasa/fosfodiesterasa 2 (autotaxina) . El gen tiene la ID de ubicación: 5168, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8q24.1. La autotaxina es una potente proteína estimulante de la movilidad de célula de tumor. El producto de gen también se conoce como fosfodiesterasa I/nucleótido pirofosfatasa 2 (autotaxina) .
Los nucleótidos 375-452, 1241-1277, 1576-1761 y 1399-1488 de la SEQ ID NO: 50 (D45421) también tienen 97-100% de identidad de secuencia para una secuencia genómica cercana a LOC206890 en el cromosoma 8. LOC206890 es similar al citocromo c (somático) y tiene la ubicación citogenética reportada 8ql2.3. CPS 51 corresponde a SLC5A6 que codifica la familia 5 del portador de soluto (transportador de vitamina dependiente de sodio), miembro 6. El gen tiene la ID de ubicación: 8884, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2p23. El producto de gen funciona en la transferencia transplacental de biotina de pantotenato y lipoato. Los nucleótidos 962 hasta 1314 de la SEQ ID NO: 51 (AL096737) tienen alrededor de 90% de identidad a TCF23 (ID de ubicación: 150921) que codifica el factor de transcripción 23 y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2p23.3. CPS 52 corresponde a GPR3 que codifica el receptor 3 acoplado a la protelna G. El gen tiene la ID de ubicación: 2827, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Ip36.1-p35. El producto de gen puede activar la adenilato ciclasa en las líneas celulares, y es un miembro de la familia del receptor acoplado a la protelna G.
CPS 53 corresponde a S0D2 que codifica la superóxido dismutasa 2, mitocondrial . El gen tiene la ID de ubicación: 6648, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6q25.3. El producto de gen es una enzima de depuración de radical libre intramitocondrial , y tiene fuerte similitud para Sod2 murino. CPS 54 corresponde a TREX1 que codifica tres exonucleasas 1 reparadoras del cebador. El gen tiene la ID de ubicación: 11277, y se localiza' en el cromosoma 3 con la ubicación citogenética reportada 3p21.3-p21.2. Este gen utiliza al menos dos diferentes estructuras de lectura abiertas. El ORF en dirección asendente codifica proteínas que interactúan con la ataxia telangiectasia y proteína relacionada con Rad3 , una cinasa de punto de revisión. Las proteínas codificadas por este ORF en dirección ascendente localizan al fóculo intranuclear después del daño al ADN y pueden ser componentes importantes de punto de revisión del daño al ADN. El ORF en dirección desendente codifica proteínas con actividad de exonucleasa 3'. Otras enzimas con esta actividad están involucradas en la replicación, reparación, y recombinación de ADN. Similarmente a una proteína de E. coli que sugiere que las enzimas codificadas por este ORF pueden ser una subunidad de la polimerasa III de ADN, que no tiene actividad de exonucleasa intrínseca. Ambos ORFs son sujetos a un empalme alternativo, lo que resulta en al menos seis variantes de transcrito. CPS 54 también tiene alrededor de 99% de identidad de secuencia para al menos partes de LOC200884 y LOC152456. Ambos genes se localizan dentro de TREXl. LOC200884 codifica proteínas similares a tres exonucleasas 1 de reparación de cebador (isoforma b) , 3 exonucleasas 1 de reparación, deoxiribonucleasa III (tipo dnaQ/mutD (E. coli)), y proteína que ínteractúa con AT . LOC200884 tiene la ubicación citogenetica reportada 3p21.31. LOC152456 codifica proteínas similares a tres exonucleasas 1 que reparar cebador (isoforma b) , 3 exonucleasas 1 de reparación, deoxiribonucleasa III (tipo dnaQ/mutD (E. coli)), y proteína que interactúa con ATR. Tiene la ubicación citogenetica reportada 3p21.31. CPS 55 corresponde a WNT6 que codifica la familia del sitio de integración MMTV tipo áptero, miembro 6. El gen tiene la ID de ubicación: 7475, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2q35. La familia del gen WNT consiste de genes estructuralmente relacionados que codifican proteínas de señalización secretadas. Estas proteínas se han implicado en la oncogénesis y en varios procesos de desarrollo, incluyendo la regulación de la muerte celular y formación de patrones durante la embriogénesis . Este gen es un miembro de la familia del gen WNT. Se sobreexpresa en una línea de célula de cáncer cervical y se coexpresa fuertemente con otro miembro de la familia, W T10A, en una línea de célula de cáncer colorectal . La sobreexpresión del gen puede jugar papeles clave en la carcinogénesis . Este gen y el gen WNT10A se agrupan en la región 2q35 del cromosoma. La proteína codificada por este gen es 97% idéntica a la proteína nt6 de ratón al nivel de aminoácido . CPS 56 corresponde a ???5 2? que codifica la fosfatidilinositol-4-fosfato 5-cinasa, tipo II, alfa. El gen tiene la ID de ubicación: 5305, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10pll.23. El fosfatidilinositol-4 , 5-bisfosfato, el precursor para los segundos mensajeros de las trayectorias de transducción de señal fosfoinositida, está involucrado en la regulación de secreción, proliferación celular, diferenciación, y movilidad. La proteína codificada por este gen es una de la familia de enzimas capaces de catalizar la fosforilación del fosfatidilinositol-4-fosfato en el quinto idroxilo del anillo mio-inositol para formar el fosfatidilinositol-4 , 5-bisfosfato. El producto de gen exhibe actividad de cinasa. Este gen es un miembro de la familia fosfatidilinositol-4-fosfato 5-cinasa. El producto de gen también se conoce como isoforma C de 1-fosfatidilinositol-4-fosfato-5-cinasa. CPS 57 corresponde a FABP5 que codifica la proteína "5 enlazada al ácido graso (asociada con psoriasis) . El gen FABP5 tiene una ID de ubicación: 2171, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8q21.13. El gen codifica la proteína enlazada al ácido graso encontrada en células epidermales, y se identifica como que se sobrerregula en el tejido de psoriasis. Las proteínas enlazadas al ácido graso son una familia de proteínas citoplásmicas, altamente conservadas, pequeñas que enlazan ácidos grasos de cadena larga y otros ligandos hidrofóbicos . Se piensa que las proteínas enlazadas al ácido graso están involucradas en la absorción de ácido graso, transporte, y metabolismo. El producto de gen FABP5 se enlaza al ácido esteárico y puede tener un papel en la diferenciación de queratinocitos . CPS 57 también muestra 100% de alineación de secuencia con una secuencia intrón de STX3A que codifica la sintaxina 3A. El gen tiene la ID de ubicación: 6809, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llql2. 3. La sintaxina 3A está involucrada en el transporte de proteína intracelular . Además, CPS 57 tiene alrededor de 95-97% de identidad de secuencia para L0C95551, LOC220113, LOC114948, LOC220832, y LOC150161. LOC95551 es similar la proteína enlazada al ácido graso, epidermal (E-FABP) (homólogo de proteína enlazada al ácido graso asociada con psoriasis) (PA-FABP) . LOC95551 se localiza en el cromosoma 13 con la ubicación citogenética reportada 13q2l.33. LOC220113 codifica la proteína enlazada al ácido graso, epidermal (E-FABP) (homólogo de proteína enlazada al ácido graso asociada con psoriasis) (PA-FABP) .
LOC220113 tiene la ubicación citogenética reportada 13ql4.13. LOC220113 está dentro de un intrón de ATP7B que codifica el polipéptido beta, transportado en Cu++, ATPasa (enfermedad de filson) , y tiene una ID de ubicación: 540. L0C114948 codifica una proteína similar a la proteína enlazada al ácido graso, epidemial (E-FABP) (homólogo de proteína enlazada al ácido graso asociada con psoriasis) (PA-FABP) . Se localiza en el cromosoma 15 con la ubicación citogenética reportada 15q25.3. LOC220832 también codifica una proteína similar a la proteína enlazada al ácido graso, epidermal (E-FABP) (homólogo de proteína enlazada al ácido graso asociada con psoriasis) (PA-FABP) . Tiene la ubicación citogenética reportada 7q36.1. Similarmente, LOC150161 codifica una proteína similar a la proteína enlazada al ácido graso, epidermal (E-FABP) (homólogo de proteína enlazada al ácido graso asociada con psoriasis) (PA- FABP) . Se localiza en el cromosoma 22 con la ubicación citogenética reportada 22qll.l. Adicionalmente, CPS 57 tiene alrededor de 89-93% de identidad de secuencia para BTBD1, LOC130962, LOC152940 y LOC204114. BTBD1 codifica el dominio BTB (POZ) que contiene 1. Tiene una ID de ubicación: 53339, y se localiza en el cromosoma 15 con la ubicación citogenética reportada 15q24. El producto de gen contiene un dominio BTB/POZ, y puede funcionar como ADN o proteína enlazada a la actina. LOC130962 codifica una protelna similar a la proteína enlazada al ácido graso, epidermal (E-FABP) (homólogo de proteína enlazada al ácido graso asociada con psoriasis) (PA-FABP) . El gen tiene la ubicación citogenética reportada 2q23.3. Igualmente, LOC152940 codifica una proteína similar al producto de proteína sin nombre. Se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q31.3-q32.1. LOC204114 codifica una proteína similar al homólogo de proteína que se enlaza al ácido graso. Tiene la ubicación citogenética reportada 13q31.3. CPS 58 corresponde a MMP9 que codifica metaloproteinasa 9 de matriz (gelatinasa B, gelatinasa de 92kD, colagenasa de tipo IV de 32kD) . El gen tiene -la ID de ubicación: 4318, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20qll .2-ql3.1. Las proteínas de la familia de metaloproteinasa de matriz (MMP) están involucradas en la ruptura de la matriz extracelular en un proceso fisiológico normal, tal como desarrollo embriónico, reproducción, y remodelación del tejido, así como en procesos de enfermedad, tales como artritis y metástasis. La mayoría de los MMP se secretan como proproteínas inactivas las cuales se activan cuando se desdoblan por proteinazas extracelulares. La enzima codificada por este gen puede degradar los colágenos de tipo IV y V. Estudios en monos rhesus sugieren que la enzima está involucrada en la movilización inducida por IL-8 de células progenitoras hematopoyéticas de médula ósea, y estudios en murinos sugieren un papel en la remodelación de tejido asociado con tumor. La CPS 59 corresponde a ATP2B1 que codifica la membrana de plasma 1, ATPase, que transporta Ca++, . El gen tiene la ID de ubicación: 490, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12q21-q23. Los nucleótidos 2623 hasta 2814 de la SEQ ID NO: 59 (J04027) tienen alrededor de 81% de identidad de secuencia para ATP2B4 que codifica la membrana de plasma 4, ATPase, que transporta Ca++, . ATP2B4 tiene una ID de ubicación: 493, y se localiza en el cromosoma 1. Los nucleótidos 4365-4398 de la SEQ ID NO: 59 tienen 100% de identidad de secuencia para FLJ14075 que codifica una proteína hipotética FLJ14075. FLJ14075 tiene una ID de ubicación: 79954, y se localiza en el cromosoma 2. CPS 60 corresponde a NEUD4 que codifica el homólogo neuro-d4 (rata) . El gen tiene la ID de ubicación: 8193, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.13. El producto de gen contiene al menos un dominio de enlace de ADN de dedo de zinc. Los nucleótidos 61-198 de U43843 tienen 86% de identidad de secuencia para CERD4 que codifica el homólogo cer-d4 (ratón) . CERD4 tiene una ID de ubicación: 8110, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14q24.3-q31.1.
CPS 61 corresponde a CC 1 que codifica el receptor 1 de quimiocina (porción C-C) . El gen tiene la ID de ubicación: 1230, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p21. Los productos de genes son un miembro de la familia del receptor beta quimiocina, y se predice que sea una proteína de siete transmembranas similar a los receptores acoplados a la proteína G. Los ligandos de este receptor incluyen proteína 1 alfa inflamatoria de macrófago ( IP-1 alfa) , proteina 3 quimioatrayente de monocito (MCP-3) , y factor-1 inhibidor del progenitor mieloide (MPIF-1) . La transducción de señal mediada por quimiocinas y sus receptores se considera que es importante para el reclutamiento de células inmunoefectoras al sitio de inflamación. Los estudios agénicos de ratón homólogo sugieren el papel de este gen en la protección hospedadora de respuesta inflamatoria, y la susceptibilidad al virus y parásito. Este gen y otros genes del receptor de quimiocina, incluyendo CCR2 , CCRL2 , CCR3 , CCR5 y CCXCR1, se encuentra que forman un agrupamiento de genes en el cromosoma 3p. La proteína codificada por este gen puede enlazar quimiocinas de la subfamilia CC y mediar el flujo de calcio intracelular. CPS 62 corresponde a C8FW que codifica una fosfoproteína regulada por trayectorias mitogénicas . La proteína es similar a las proteínas cinasas. El gen tiene la ID de ubicación: 10221, y se localiza en el cromosoma 8 con la ubicación cite-genética reportada 8q24.13. CPS 63 corresponde a CLU que codifica clusterina (inhibidor del complemento de lisis, SP-40,40, glicoproteína 2 sulfatada, mensajero 2 de la próstata que reprime la testosterona, apolipoproteína J) . El gen tiene la ID de ubicación: 1191, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8p21-pl2. La clusterina es una glicoproteína y puede encontrarse en lipoproteínas de alta densidad y gránulos endocrinos y neuronales . Puede tener un papel en la reacción de complemento terminal. CPS 64 corresponde a EREG que codifica epiregulina. El gen tiene la ID de ubicación: 2069, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4ql3.3. La epiregulina es un miembro de la familia del factor de crecimiento epidermal . La epiregulina puede funcionar como un ligando de EGFR (receptor del factor de crecimiento epidermal) , así como un ligando de miembros de la familia ERBB (homólogo de oncogen v-erb-b2) de receptores de tirosina-cinasa . La epiregulina puede promover la proliferación celular. CPS 65 corresponde a PPAP2B que codifica la fosfatasa tipo 2B del ácido fosfatídico. El gen tiene la ID de ubicación: 8613, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lpter-p22.1. El producto de gen es fosfatasa 2b del ácido fosfatídico independiente del magnesio. Se puede convertir el ácido fosfatidico al diacilglicerol . También puede hidrolizar el lisofosfatidato, ceramida-l-fosfato, y esfingosina-l-fosfato. CPS 66 corresponde a TUBB que codifica tubulina, polipéptido beta. .El gen tiene la ID de ubicación: 7280, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6p21.3. La beta tubulina puede polimerizarse para formar microtúbulos . Es un miembro de una familia de proteínas estructurales. Los nucleótidos 119-231 y 340-939 de la SEQ ID NO: 66 (X79535) también tienen sobre 99% de identidad de secuencia para una secuencia genomica entre TUBB y LOC221753. LOC221753 se localiza en el cromosoma 6. Además, los nucleótidos 58-120 y 340-1397 de X79535 tienen alrededor de 98% de identidad de secuencia para LOC221753. LOC221753 tiene la ubicación citogenética reportada 6p24.3. Sin embargo, los fragmentos de X79535 exhiben alrededor de 82-92% de identidad de secuencia para ciertos otros genes. Estos genes incluyen TUBB5 , TUBB4 , LOC139112, LOC157586, LOC203068, LOC92755 y GABRR2. TUBB5 codifica tubulina, beta, 5. Esto tiene una ID de ubicación: 10382, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.3.
El gen TUBB5 tiene los nucleótidos 637115 hasta 644163 del cromosoma 19. La beta 5-tubulina puede polimerizarse para formar microtúbulos. TUBB4 codifica tubulina, beta, 4. Esto tiene una ID de ubicación: 10381, y se localiza en el cromosoma 16 con la ubicación citogenética reportada 16q24.3. La beta 4-tubulina también puede polimerizarse para formar microtúbulos. LOC139112 codifica una proteína similar a beta tubulina. El gen tiene la ubicación citogenética reportada Xq25. LOC157586 y LOC203068 codifican proteínas similares a la proteína hipotética DKFZp564N123.1-humana (fragmento). Ambos genes tienen la ubicación citogenética reportada 8p21.1. LOC92755 es un gen hipotético, y tiene la ubicación citogenética reportada 8p21.1. GABRR2 codifica el receptor del ácido gamma-aminobutírico (GABA) , rho 2. Esto tiene una ID de ubicación: 2570 y la ubicación citogenética reportada 6ql3-ql6.3. GABA es el neurotransmisor inhibidor principal en el cerebro del mamífero donde puede actuar como receptores GABA, que son canales de cloruro que abren el ligando. GABRR2 es un miembro de la familia de subunidad rho. CPS 67 corresponde a NUP214 que codifica la nucleoporina de 214kD (CAIN) . El gen tiene la ID de ubicación: 8021, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9q34.1. La nucleoporina de 214kD es una'protexna localizada al aspecto citoplásmico del complejo de poro nuclear. Contiene repeticiones FXFG. El fragmento de los nucleótidos 3712 hasta 5515 de D14689 (SEQ ID NO: 67), tiene 100% de identidad de secuencia para LOC158306. LOC158306 codifica una proteína similar a la nucleoporina de 214kD (CAIN) , y tiene la ubicación citogenetica reportada 9q34.2. LOC158306 se localiza dentro de un exón del gen NUP214. CPS 68 corresponde a ALDH5A1 que codifica la familia de la aldehido deshidrogenasa 5, miembro Al (succinato-semialdehído dehidrogenasa) . El gen tiene la ID de ubicación: 7915, y se localiza en el cromosoma 6 con la ubicación citogenetica reportada 6p22. CPS 68 alinea a los nucleótidos 32909278 hasta 32909817 del cromosoma 6, y se localiza en la región no traducida 3 ' de ALDH5A1. La aldehido deshidrogenasa 5A1 (semialdehído dehidrogenasa succínica) involucra la degradación del ácido 4-aminobutírico . Los nucleótidos 45212 hasta 44763 de la SEQ ID NO: 68 (AL031230) tienen alrededor de 90% de identidad de secuencia para HSPCAL3 que codifica la proteína 1 de 90kD de choque de cabeza, tipo alfa 3. El gen HSPCAL3 tiene una ID de ubicación: 3324 y la ubicación citogenética reportada llpl4.2-pl4.1. Además, los nucleótidos 11858 hasta 12096 de AL031230 muestran 86% de identidad de secuencia para una secuencia genómica en el cromosoma 1. CPS 69 corresponde a L0C64116. El gen tiene la ID de ubicación: 64116, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q22-q24. El gen está sobrerregulado por BCG-C S.
CPS 70 corresponde a que codifica el precursor del grupo sanguíneo Kell (fenotipo McLeod) . El gen tiene la ID de ubicación: 7504, y se localiza en el cromosoma X con la ubicación citogenética reportada Xp21.1. Esta ubicación controla la síntesis del grupo sanguíneo Kell "substancia de recurso" Kx) . Las mutaciones en este gen se han asociado con el síndrome McLeod, un trastorno recesivo, asociado con X, caracterizado por anormalidades en los sistemas neuromuscular y hematopoyético . La proteína codificada es un miembro de la familia de transporte y tiene características de proteína de transporte de membrana procariótica y eucariotica. CPS 71 corresponde a ????0837 (FACL6) que codifica el gen de acil-CoA sintetasa 2 graso largo (ligasa de coenzima A-ácido graso, de cadena larga 6) . El gen tiene la ID de ubicación: 23305, y se localiza en el cromosoma 5 con la ubicación citogenética reportada 5q31. CPS 72 corresponde a GYPC que codifica glicoforina C (grupo sanguíneo Gerbich) . El gen tiene la ID de ubicación: 2995, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2ql4-q21. La glicoforina C (GYPC) es una glicoproteína de membrana integral. Es una especie menor portada por eritrocitos humanos, pero juega un papel importante en la regulación de la estabilidad mecánica de células rojas. Un número de mutaciones de glicoforina C se han descrito. Los fenotipos Gerbich y Yus se deben a la eliminación del exón 3 y 2, respectivamente. Los antígenos ebb y Duch, también conocidos como glicoforina D, resultan de mutaciones puntuales sencillas del gen de glicoforina C. La proteína de glicoforina C tiene homología con las glicoforinas A y B. CPS 73 corresponde a TFDP1 que codifica un factor de transcripción Dp-1. El gen tiene la ID de ubicación: 7027, y se localiza en el cromosoma 13 con la ubicación citogenética reportada 13q34. El producto de gen puede heterodimerizarse con E2F a genes transactivados involucrados en el progreso del ciclo celular desde Gl hasta fase S. TFDP1 , CUL4A, y CDC16 son objetivos probables de un mecanismo de amplificación y pueden estar involucrados, junto o separadamente, en el desarrollo y/o progreso de algunos carcinomas hepatocelulares . CPS 73, así como los nucleótidos 9 hasta 1440 de L23959 (SEQ ID NO: 73) , tienen alrededor de 95% de identidad de secuencia para LOC245788 en el cromosoma 8. LOC245788 se reporta para codificar el factor de transcripción DP-1 (compañero de dimerización E2F 1) (DRTFl-polipéptido-1) (DRTF1) . Además, CPS 73 tiene alrededor de 87-90% de identidad de secuencia para L0C126611 y LOC51270. LOC126611 codifica una proteína similar al factor de transcripción DP-1 (compañero de dimerización E2F 1) (DRTFl-polipéptido-1) (DRTF1) . Se localiza en el cromosoma 1 con la ubicación citogenética reportada lq31.3. LOC51270 codifica la proteína tipo E2F que es similar a una región del factor de transcripción humano Dp-1. El gen tiene la ID de ubicación: 51270, y se localiza en el cromosoma X con la ubicación citogenética reportada Xq26.2. Los nucleótidos 1001 hasta 1440 de la SEQ ID NO: 73 (L23959) tienen alrededor de 87% de identidad de secuencia para CD36 que codifica el antígeno CD36 (receptor de colágeno tipo I, receptor de trombospondina) . El gen tiene la ID de ubicación: 348, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7qll.2. CD36 es un receptor para trombospondina y colágeno en plaquetas . Este funciona en la adhesión celular. Tiene un papel en la adhesión colágeno-plaqueta, y se puede unir a ácidos grasos de cadena larga. La proteína es fuertemente similar a FAT de rata. Los nucleótidos 9 hasta 947 de la SEQ ID NO: 73 tienen 95% de identidad de secuencia para LOC123471 que codifica una proteina similar al factor de transcripción DP-1 (compañero de dimerización E2F 1) (DRTFl-polipéptido-1) (DRTF1) . LOC123471 tiene la ubicación citogenética reportada 15q23. CPS 74 corresponde a C20orfl6 que codifica la estructura de lectura abierta 16 del cromosoma 20. El gen tiene la ID de ubicación: 54498, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20pl3. La proteína es un miembro de la familia de amina oxidasa gue contiene flavina. Es ligeramente similar a la monoamina MAOB (oxidasa B) . CPS 75 corresponde a FCAR que codifica un receptor para fragmento Fe de IgA. El gen tiene la ID de ubicación: 2204, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.2-gl3. . Este gen es un miembro de la superfamilia de gen de immunoglobulina y codifica un receptor para la región Fe de IgA. El receptor es una glicoproteína de transmembrana presente en la superficie de células de linaje mieloide tales como neutrófilos, monocitos, macrófagos, y eosinófilos, donde puede mediar las respuestas inmunológicas a los patógenos. Puede interactuar con objetivos opsonizados IgA y disparar varios procesos de defensa inmunológieos , incluyendo fagocitosis, citotoxicidad mediada por la célula dependiente del anticuerpo, y estimulación de la liberación de mediadores inflamatorios. Al menos diez variantes de transcrito gue codifican diferentes isoformas se han descrito por este gen. El producto de gen también se conoce como Fe alfa R. CPS 76 corresponde a ITGB3 que codifica la integrina, beta 3 (glicoproteína Illa de plaqueta, antígeno CD61.) . El gen tiene la ID de ubicación: 3690, y se localiza en el •cromosoma 17 con la ubicación citogenética reportada 17q21.32. el producto de proteína ITGB3 la beta integrina de cadena beta 3. Las integrinas son proteínas de superficie celular compuestas de una cadena alfa y una cadena beta. Una cadena dada puede combinarse con múltiples patrones que resultan en diferentes integrinas . La integrina beta 3 se encuentra junto con la cadena alfa Ilb en plaquetas. Las integrinas se conocen que participan en la adhesión celular asi como en la señalización mediada por la superficie celular. Este producto de gen puede estar involucrado en la agregación mediada por plaquetas. CPS 77 corresponde a MXI1 que codifica la proteína que interactúa con MAX. El gen tiene la ID de ubicación: 4601, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q24-q25. La expresión del gen c-myc, que produce a factor de transcripción oncogénico, es estrechamente regulada en células normales pero se desregula frecuentemente en cánceres de humano. La proteína codificada por este gen es una función MYC de represor transcripcional hasta regulada negativamente, y es por lo tanto un supresor potencial de tumor. La proteína inhibe la actividad transcripcional de MYC por competencia MAX, otra proteína de hélice-circuito-hélice básica que se enlaza a MYC y requiere para esta función. Los defectos en este gen se encuentran frecuentemente en pacientes con tumores de próstata. Dos variantes de transcrito que codifican diferentes isoformas se han identificado para este gen. Los nucleótidos 1 hasta 64 de la SEQ ID NO: 77 (L07648) muestran 100% de identidad de secuencia para ARHA que codifica la familia del gen homólogo ras, miembro A. El gen tiene la ID de ubicación: 387, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p21.3. El producto de gen es una proteína enlazada a GTP relacionada con ras de la subfamilia rho, y puede estar involucrada en la regulación de la reorganización de el citoesqueleto de actina. CPS 78 corresponde a CSDA que codifica la proteína A de dominio de choque frío. El gen tiene la ID de ubicación: 8531, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12pl3.1. El producto de gen es un miembro de una familia de reguladores transcripcionales . Puede unir y reprimir el promotor del gen (GM-CSF) . El producto de gen contiene un dominio de choque frío. CPS 78, así como los nucleótidos 14 hasta 1568 de M24069 (SEQ ID NO: 78) , muestran al menos 94% de identidad de secuencia para LOC220558. LOC220558 también codifica la proteína A de dominio de choque frío o proteína A de choque en frío. Se localiza en el cromosoma 16 con la ubicación citogenética reportada 16pll.l. CPS 79 corresponde a OPTN (FIP2) que codifica optineurina. El gen tiene la ID de ubicación: 10133, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10pl2.33. El producto de gen es un componente de un complejo heterodimérico que inhibe la citolisis inducida por el factor alfa de necrosis de tumor. Contiene cremalleras de leucina. También se conoce como la proteína celular que induce el factor alfa de necrosis de tumor que contiene dominios de cremallera de leucina o proteína L que interactúa con Huntingtin. CPS 80 corresponde a SELENBPl que codifica la proteína 1 enlazada al selenio. El gen tiene la ID de ubicación: 8991, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Iq21-q22. Este producto de gen que pertenece a la familia de la proteína enlazada al selenio. El selenio es un nutriente que exhibe propiedades anticarcinogénicas potentes, y la deficiencia de selenio puede causar ciertas enfermedades neurológicas . Se ha propuesto que los efectos del selenio en la prevención del cáncer y enfermedades neurológicas puede mediarse por proteínas que se enlaza al selenio. La función exacta de este gen no se conoce. CPS 81 corresponde a PPP1R2 que codifica la proteína fosfatasa 1, subunidad reguladora 2 (inhibidor) . El gen tiene la ID de ubicación: 5504, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3q29. La subunidad inhibidora 2 de la proteína fosfatasa 1 puede asociarse con la isoforma gamma de la proteína fosfatasa 1. Los nucleótidos 25 hasta 556 de la SEQ ID NO: 81 (U68111) también tienen 96% de identidad de secuencia para L0C153743. Este gen codifica una proteína similar a la proteína fosfatasa 1, subunidad reguladora 2 (inhibidor) . El gen tiene la ubicación citogenética reportada 5q33.2. Además, los nucleótidos 25 hasta 556 de U68111 tienen 85-90% de identidad de secuencia para ciertos otros genes o secuencias genómicas . Estos genes o secuencias genómicas incluyen PPP1R2P1, la región 3' para LOC160817, la región no codificada de LOC130957, la región no codificada de LOC220419, y ciertas regiones en los cromosomas 7 y 21. PPP1R2P1 codifica proteína fosfatasa 1, subunidad reguladora 2 (inhibidor) pseudogen 1. PPP1R2P1 tiene una ID de ubicación: 5505, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6p21.1. LOC160817 codifica una proteína similar a la proteína fosfatasa 1, subunidad reguladora 2 (inhibidor) , y tiene la ubicación citogenética reportada 13q21.1. LOC130957 codifica una proteína similar a la proteína fosfatasa 1, subunidad reguladora 2 (inhibidor) , y se localiza en el cromosoma 2ql2.1. LOC220419 se reporta para codificar proteína fosfatasa 1, subunidad reguladora 2 (inhibidor), y se localiza en el cromosoma 13ql4.11. CPS 82 corresponde a HPGD que codifica hidroxiprostaglandina deshidrogenasa 15- (NAD) . El gen tiene la ID de ubicación: 3248, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q34-q35. El producto de gen puede inactivar muchas prostaglandinas por oxidación de sus residuos C-.15.
CPS 83 corresponde a SLC4A1 que codifica la familia del portador de soluto 4, intercambiador de anión, miembro 1 (banda de proteína de membrana de eritrocito 3 , grupo sanguíneo Diego) . El gen tiene la ID de ubicación: 6521, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q21-q22. La secuencia genómica alineada a CPS 83 se localiza 3' a la secuencia que codifica el polipeptido del gen. El gen también se conoce como gen CD233. El producto de gen, también conocido como intercambiador de anión de banda 3, es parte de la familia del íntercambiador de anión (AE) . El producto de gen puede funcionar para mantener la homeostasis de ión al transportar iones de cloruro y bicarbonato . SEQ ID NO: 259 (M27819) también se alinea a SLC4A1 con sobre 98% de identidad de secuencia, y por lo tanto, puede usarse como una sonda para SLC4A1. Los nucleótidos 2206 hasta 2426 de la SEQ ID NO: 259 también muestran alrededor de 76% de identidad de secuencia para SLC4A2. Este gen codifica la familia 4 del portador de soluto, intercambiador de anión, miembro 2 (banda de proteína de membrana de eritrocito 3 tipo 1) . El gen tiene la ID de ubicación: 6522. CPS 84 corresponde a IL17R que codifica el receptor de interleucina 17. El gen tiene la ID de ubicación: 23765, y se localiza en el cromosoma 22 con la ubicación citogenética reportada 22qll.l. El producto de gen es altamente similar al murino Ill7r, y puede jugar un papel en la activación de la célula T y la inducción de IL-2 (IL2) . CPS 87 corresponde a CBFA2T3 que codifica el factor enlazado al núcleo, dominio runt", subunidad alfa 2 ; transubicado a, 3. El gen tiene la ID de ubicación: 863, y se localiza en el cromosoma 16 con la ubicación citogenética reportada 16g2 . El producto de gen es un miembro de la familia de proteína MTG8 (ETO/CDR) . CPS 89 corresponde a una secuencia de intrón de RAP1GA1. RAP1GA1 codifica la proteína 1 que activa la GTPase para rapl. El gen RAP1GA1 tiene una ID de ubicación: 5909, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Ip36.1-p35. El producto de gen también se conoce como producto de gen KIAA0474. CPS 90 corresponde a BCL2L1 que codifica BCL2 tipo 1. El gen tiene la ID de ubicación: 598, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20qll.l. La proteína codificada por este gen pertenece a la familia de la proteína BCL-2. Los miembros de la familia BCL-2 forman hetero- u homodímeros y actúan como reguladores anti- o pro-apoptóticos que están involucrados en una amplia variedad de actividades celulares. Las proteínas codificadas por estos genes se localizan en la membrana mitocondrial exterior, y han mostrado que regulan la apertura del canal de membrana mitocondrial exterior (VDAC) . VDAC regula el potencial de membrana mitocondrial , y de esta manera controla la producción de especies reactivas de oxígeno y la liberación de citocromo C por la mitocondria, ambos de los cuales son inductores potentes de la apoptosis celular. Al menos dos variantes de transcrito alternativamente empalmadas, que codifican distinl¾as isoformas, se han reportado. La isoforma más larga puede actuar como un inhibidor apoptotico y la forma más corta puede actuar como un activador apoptotico. CPS 91 corresponde a COPEB que codifica la proteína de enlace al elemento promotor del núcleo. El gen tiene la ID de ubicación: 1316, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10pl5. Este gen codifica una proteína nuclear (proteína enlazada al elemento de núcleo) . Esta proteína tiene tres extensiones de zinc al final de su dominio de terminal C, una región central rica en serina/treonina y un dominio ácido que va dentro de la región de terminal N. Los dedos de zinc de esta proteína se consideran que son responsables para el enlace de ADN específico con los elementos del promotor de núcleo rico en guanina. La región central puede estar involucrada en la activación o trayectorias reguladoras post-traduccionales , y el dominio de terminal N ácido puede jugar un papel importante en el¿>.proceso de activación transcripcional. Esta proteína se expresa en varios tejidos, con los niveles altos en la placenta. Es un activador transcripcional, capaz de activar la transcripción aproximadamente 4 veces ya sea en promotores homólogos o heterólogos . El enlace de ADN y la actividad transcripcional de esta proteína, en conjunto con su patrón de expresión, lo que sugiere que esta proteína puede participar en la regulación y/o mantenimiento de la expresión basal del gen de glicoproteína específico del embarazo y posiblemente otros genes menos de caja TATA. La secuencia genómica alineada a CPS 91 se localiza 3' a la secuencia que codifica el polípéptido del gen. CPS 92 corresponde a ADM que codifica adrenomedulina. El gen tiene la ID de ubicación: 133, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llpl5.4. La adrenomedulina, un péptido hípotensivo encontrado en el feocromocito a humano, consiste de 52 aminoácidos, tiene un enlace de disulfuro intramolecular , y muestra una ligera homología con el péptido relacionado con el gen de calcitonina. Esto puede funcionar como una hormona en el control de circulación debido a que se encuentra en la sangre en una concentración considerable. El precursor, llamado preproadrenomedulina, es de 185 aminoácidos de longitud. Por análisis de manchado de AR , el ARNm de adrenomedulina humano se encontró que se expresa altamente en varios tejidos. El ADN de ADM genómico consiste de al menos 4 exones y 3 intrones, con la región de flanqueo de cebador 5 que contiene cajas TATA, CAAT, y GC. También hay sitios de enlace múltiples para la proteína 2 del activador yurx elemento aumentador regulado por cAMP. El gen también codifica el precursor de adrenomedulina (A ) y el péptido de 20 aminoácidos supuesto proA -N20. El producto de gen puede regular la presión sanguínea y ritmo cardiaco. CPS 93 corresponde a SPTB que codifica espectrxna, beta, eritrocítico (incluye esferocitosis, tipo clínico I) . El gen tiene la ID de ubicación: 6710, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14q23-q24.2. La beta espectrina (beta-fodrina) puede reticular proteínas de actina del citoesqueleto asociado con la membrana. Es un miembro de una familia de proteínas reticulantes de actina. CPS 94 corresponde a ITGA2B que codifica integrina, alfa 2b (glicoproteína de plaqueta Ilb de complejo Ilb/IIIa, antígeno CD41B) . El gen tiene la ID de ubicación: 3674, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q21.32. Las integrinas son proteínas de membrana integral heterodiméricas compuestas de una cadena alfa y una cadena beta. La cadena alfa 2b experimenta desdoblamiento posterior a la traducción para proporcionar cadenas pesada y ligera enlazadas a disulfuro que unidas con beta 3 forman un receptor de fibronectina expresado en plaquetas que juega un papel crucial en la coagulación. Las mutaciones que interfieren con este papel pueden resultar en trombastenia . Además de la adhesión, las integrinas se conoce que participan en la señalización mediada por la superficie celular. El producto de gen puede actuar como un receptor para fibrinógeno, factor von Willebrand y f bronectina . CPS 95 corresponde a CTNNAL1 que codifica la catenina (proteína asociada con cadherina), tipo alfa 1. El gen tiene la ID de ubicación: 8727, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9q31.2. La catenina tipo alfa 1 (proteína asociada con cadherina) enlaza cadherinas al citoesqueleto . The proteína es un miembro de la familia de catenina de proteínas enlazadas a la cadherina. CPS 96 corresponde a SCYA2 que codifica la citocina A2 inducible pequeña (proteína quimiotáctica de monocito 1) . El gen tiene la ID de ubicación: 6347, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17qll.2-q21.1. La citocina A2 es un factor quimiotáctico para monocitos . CPS 97 corresponde a DUFB7 que codifica el subcomplejo NADH deshidrogenasa (ubiquinona) 1 beta, 7 (18kD, B18) . El gen tiene la ID de ubicación: 4713, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.12-pl3.11. El producto de gen es una subunidad de la NADH-ubiquinona oxidoreductasa (complejo I) . CPS 98 corresponde a SCYA7 que codifica la citocina inducible pequeña A7 (proteína quimiotáctica de monocito 3) . El gen tiene la ID de ubicación: 6354, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17qll.2-ql2. Este gen codifica la proteína quimiotáctica de monocito 3 , una quimiocina secretada que atrae macrófagos durante la inflamación y metástasis. Es un miembro de la subfamilia C-C de quimiocinas que se caracterizan por tener dos residuos de cisteína adyacentes . La proteína es un substrato in vivo de matriz de metaloproteinasa 2, una enzima que degrada componentes de la matriz extracelular . SCYA7 es parte de un agrupamiento de miembros de la familia de quimiocina C-C en el cromosoma 17q. Los nucleótidos 1 hasta 246 de la SEQ ID NO: 95 (X72308) tienen alrededor de 95% de identidad de secuencia para al menos dos de otras secuencias genómicas . La primera secuencia genómica se localiza entre las secuencias que codifican el polipéptido de AMPD3 y ZFP26. La segunda secuencia genómica se localiza cercana a LOC139170. A PD3 codifica la adenosin monofosfato deaminasa (isoforma E) , y tiene una ID de ubicación: 272. El gen se localiza en el cromosoma llplS. ZFP26 codifica la proteína de dedo de zinc tipo C3HC4, y tiene una ID de ubicación: 50862. El gen se localiza en el cromosoma llpl5.3. LOC139170 codifica una proteína similar a la proteína KIAA1892, y se localiza en el cromosoma Xq25. CPS 99 corresponde a FCGR1A que codifica el fragmento Fe de IgG, la de alta afinidad, receptor para (CD64) . El gen tiene la ID de ubicación: 2209, y se localiza en el cromosoma 1 con la ubicación citogenetica reportada lq21.2-q21.3. El producto de gen tiene un papel en la respuesta inmune, y es un miembro de la superfamilia de inmunoglobulina . CPS 100 corresponde a EPB49 que codifica la banda de proteína de membrana eritrocito 4.9 (dematina) . El gen tiene la ID de ubicación: 2039, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8p21.1. La dematina puede unirse a la actina. Es un miembro de la familia de vilina de proteínas que construyen la actina. CPS 101 corresponde a DD96 que codifica la proteína epitelial sobrerregulada en carcinoma, proteína asociada con la membrana 17. El gen tiene la ID de ubicación: 10158, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lp33. El gen se reporta que se sobrerregula en células epiteliales malignas de carcinomas de célula renal, así como en carcinomas de colon, mama y pulmón. Los nucleótidos 1 hasta 87 de la SEQ ID NO: 98 (U21049) muestran alrededor de 98% de identidad de secuencia para LOC222094. LOC222094 codifica el ciclo de división celular 2-tipo 5 (isoforma 1) , controlador de división celular relacionado con colinesterasa, y proteína cinasa 5 relacionada con CDC2. Se localiza en el cromosoma 7pl5.2. CPS 102 corresponde a PPARG que codifica el receptor que activa la peroxisoma proliferativa, gamma. El gen tiene la ID de ubicación: 5468, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p25. La proteína codificada por este gen es un miembro de la subfamilia del receptor activado por el proliferador de peroxisoma (PPAR) subfamilia de los receptores nucleares. Los PPA s forman heterodímeros con receptores de retinoide X (RXRs) y estos heterodímeros regulan la transcripción de varios genes. Se conocen tres subtipos de PPARs : PPAR-alfa, PPAR-delta, y PPAR-gamma. La proteína codificada por este gen es PPAR-gamma y es un regulador de la diferenciación de adipocito. Adicionalmente, el PPAR-gamma está implicado en la patología de numerosas enfermedades incluyendo obesidad, diabetes, aterosclerosis y cáncer. Múltiples variantes de transcrito que usan promotores alternativos y empalme se han identificado por este gen. Al menos tres de estas variantes codifican la misma isoforma. Los nucleótidos 1 hasta 77 de la SEQ ID NO: 99 (L40904) tienen 100% de identidad de secuencia para HBA2. HBA2 codifica hemoglobina, alfa 2, y tiene una ID de ubicación: 3040. El gen se localiza en el cromosoma 16 con la ubicación citogenética reportada 16pl3.3. La anotación Affymetrix sugiere que CPS 103 corresponde a SPINK1. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 103 también se alinea a una secuencia genómica entre SCGB3A2 y ????0555 con al menos 97% de identidad de secuencia. SCGB3A2 codifica secretoglobina, familia 3A, miembro 2. SCGB3A2 y IAA0555 se localizan en cromosoma 5g32. CPS 104 corresponde a PLAUR que codifica el activador de plasminógeno, receptor de urocinasa. El gen tiene la ID de ubicación: 5329, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3. El producto de gen, receptor del activador de plasminógeno tipo urocinasa, puede funcionar en la activación del plasminógeno pericelular. CPS 105 corresponde a CDC34 que codifica el ciclo de división celular 34. El gen tiene la ID de ubicación: 997, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.3. La proteína codificada por este gen es un miembro de la familia de la enzima conjugada por ubiquitina. La enzima conjugada por ubiquitina cataliza la unión covalente de ubiquitina a otras proteínas. El producto de gen CDC34 puede ser parte del complejo multiproteína grande, que está involucrado en la degradación mediada por ubiquitina de los reguladores Gl del ciclo celular y el inicio de la replicación de ADN. El producto de gen es similar a S. cerevisiae Cdc34p, y puede unir covalentemente a la ubiquitina a las proteínas substrato. CPS 106 corresponde a UNKA.I732885 que muestra 100% de identidad de secuencia con una secuencia de intrón de CG005. CG005 codifica una proteína hipotética de la región BCRA2. El gen CG005 tiene una ID de ubicación: 10443, y se localiza en el cromosoma 13 con la ubicación citogenética reportada 13ql2-ql3. El producto de gen contiene una región que tiene baja similitud con la región de nucleótido 3 ' -fosfodiesterasa 2 3 ' -cíclico de rata. CPS 107 corresponde a ILIORA que codifica el receptor de interleucina 10, alfa. El gen tiene la ID de ubicación: 3587, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llq23. Los nucleótidos 3467 hasta 3496 de U00S72 tienen 100% de identidad de secuencia para LOC200074 que se localiza en el cromosoma lp34.3. CPS 108 corresponde a FBX07 (PBX7) que codifica la proteína 7 sólo de la caja F. El gen tiene la ID de ubicación: 25793, y se localiza en el cromosoma 22 con la ubicación citogenética reportada 22ql2-ql3. Este gen codifica un miembro de la familia de la proteína de caja F que se caracteriza por una porción de aproximadamente 40 aminoácidos, la caja F. Las proteínas de la caja F constituyen una de las cuatro subunidades del complejo de ligasa de proteína de ubiquitina llamada SCFs (caja SKP1-culina-F) , que funciona en la ubiquitinación dependiente de la fosforilación. Las proteínas de la caja F se dividen en 3 clases: Fbws que contienen dominios WD-40, Fbls que contienen repeticiones ricas en leucina, y Fbxs que contiene ya sea diferentes módulos de interacción proteína-proteina o sin porciones reconocibles. La proteína codificada por FBX07 pertenece a la clase Fbxs y puede jugar un papel en regulación de la hematopoyesis. Alternativamente las variantes de transcrito de empalme de este gen se han reportado, pero la longitud completa natural de las variantes no se ha definido. CPS 109 corresponde a IFIT4 que codifica la proteína inducida por interferon con repeticiones de tetratricopéptido 4. El gen tiene la ID de ubicación: 3437, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q24. CPS 110 corresponde a BAX que codifica la proteína X asociada con BCL2. El gen tiene la ID de ubicación: 581, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.3-ql3.4. La proteína codificada por este gen pertenece a la familia de proteína BCL2. Los miembros de la familia BCL2 forman hetero- u homodímeros y actúan como reguladores anti- o pro-apoptóticos que están involucrados en una amplia variedad de actividades celulares. El producto de gen BAX forma un heterodímero con BCL2 , y puede funcionar como un activador apoptótico. Este producto de gen se reporta que interactúa con, e incrementa la apertura de, el canal de anión dependiente del voltaje mitocondrial (VDAC) , que lleva a la pérdida en el potencial de membrana y la liberación de citocromo c. La expresión de este gen es regulada por el supresor de tumor P53 y se ha mostrado que está involucrado en la apoptosis mediada por P53. Seis variantes de transcrito alternativamente empalmadas, que codifican diferentes isoformas, se han reportado por este gen. El producto de gen puede inducir la activación de caspasa al incrementar la permeabilidad mitocondrial , y puede funcionar en cooperación con el transubicador nucleotido de adenina (ANT) . CPS 111 corresponde a BSG que codifica la basigina (grupo sanguíneo OK) . El gen tiene la ID de ubicación: 682, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.3. La basigina (también conocido como factor estimulador de la colagenasa derivado de la célula de tumor, inductor de la metaloproteinasa de matriz extracelular, antígeno 6) puede estimular la síntesis de matriz de metaloproteinasa en fibroblastos. Es un miembro de la superfamilia de inmunoglobulina . CPS 111 también se alinea a LOC199717 con sobre el 97% de identidad de secuencia. LOC199717 codifica una proteína similar a basigina. LOC199717 se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.3. CPS 112 corresponde a THBS1 que codifica trombospondina 1. El gen tiene la ID de ubicación: 7057, y se localiza en el cromosoma 15 con la ubicación citogenética reportada 15ql5. La trombospondina 1 puede tener un papel en la coagulación sanguínea y en la angiogénesis . Es un miembro de una familia de moléculas adhesivas. CPS 113 corresponde a AP1G2 (G2AD) que codifica el complejo de proteína relacionado con el adaptador 1, subunidad gamma 2. El gen tiene la ID de ubicación: 8906, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14qll.2. Las adaptinas son componentes importantes de complejos ligando-receptor que transportan vesículas recubiertas de clatrina de la membrana de plasma o del canal trans-Golgi a las lisosomas. La familia adaptina de proteínas está compuesta de cuatro clases de moléculas llamadas adaptinas alfa, beta-, cebada en beta y gamma. Las adaptinas, junto con subunidades medias y pequeñas, forman un complejo heterotetramérico llamado un adaptador, cuyo papel puede promover la formación de huecos y vesículas recubiertas de clatrina. La proteína codificada por este gen es una proteína gamma-adaptina que pertenece a la familia de subunidades grandes de complejos de adaptador. La gamma- adaptina es la función en alguna etapa de trafico en las trayectorias de complejo entre el canal trans-Golgi y la superficie celular. Hay dos variantes de transcrito alternativamente empalmadas de este gen que codifica la misma , proteína. El producto de gen puede interactuar con beta-1 adaptina y la cadena sigma 1 del complejo AP-1. CPS 115 corresponde a RALBP1 que codifica la proteína de enlace ralA 1. El gen tiene la ID de ubicación: 10928, y se localiza en el cromosoma 18 con la ubicación citogenética reportada 18pll.3. La proteína de enlace ralA 1 puede interactuar con la Ral activada.
CPS 115 también se alinea a ????1634 con alrededor de 99% de identidad de secuencia. KIAA1634 codifica la proteína KIAA1634, y se localiza en el cromosoma lpl2-pll.2. Además, CPS 115 muestra alrededor de 89-92% de identidad de secuencia para LOC129522, LOC131054 y una secuencia genómica en el cromosoma 2. LOC129522 codifica una proteína similar a la proteína enlaza en ralA 1, y se localiza en el cromosoma 2qll.2. LOC131054 codifica una proteína similar a proteína de enlace ralA 1, y se localiza en el cromosoma 3q27.2. Los nucleótidos 3565 hasta 3875 de L42542 tienen 94% de identidad de secuencia para la secuencia genómica del cromosoma 6 que se localiza cercana a la secuencia que codifica el polipéptido de LOC221511. LOC221511 codifica la MHC de clase II DP3-alf , y se localiza en el cromosoma 6p21.2. CPS 116 corresponde a UNK_AF070587 que se localiza en un intrón del gen supuesto LOC196932. El gen LOC196932 codifica una proteína similar a una proteína hipotética LOC55580. LOC196932 se localiza en el cromosoma 14 con la ubicación citogenética reportada 14q32.12. La anotación affymetrix sugiere que CPS 117 corresponde a DUX1. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 117 también se alinea a LOC200133 y LOC131115 con alrededor de 82-86% de identidad de secuencia. LOC200133 codifica una proteína similar a una caja homeótica doble, 4 (proteína de caja homeótica doble 4) . Se localiza en el cromosoma lp31.3. LOC131115 codifica una protelna similar a la proteína de caja homeótica doble, y se localiza en el cromosoma 3pl4.1. Los nucleótidos 1 hasta 698 de la SEQ ID NO: 113 (AJ001481) muestran alrededor de 88% de identidad de secuencia para DUX , LOC201498, una secuencia genómica cercana a LOC131308, y una secuencia genómica cercana al gen hipotético LOC132684. DUX4 codifica la caja homeótica doble, 4. Tiene una ID de ubicación: 22947, y se localiza en el cromosoma 4 con la ubicación citogenetica reportada 4q35. LOC201498 codifica una proteína similar a la proteína del gen de región FSHD 2, y se localiza en el cromosoma 18. LOC131308 codifica una proteína similar a la proteína del gen de región FSHD 2, y se localiza en el cromosoma 3pl4.1. LOC132684 se localiza en el cromosoma 4q35.2. CPS 118 corresponde a SLC6A8 que codifica la familia del portador de soluto 6 (transportador de neurotransmisor, creatina), miembro 8. El gen tiene la ID de ubicación: 6535, y se localiza en el cromosoma X con la ubicación citogenética reportada Xq28. El producto de gen es un transportador de creatina dependiente de sodio y cloro. Es un miembro de la familia del transportador de neurotransmisor. CPS 118 también tiene alrededor de 95% de identidad de secuencia para una región genómica en el cromosoma 16. Esta región incluye o traslapa los genes LOC162151 y L0C146488.
LOC146488 codifica una proteína similar a la metaloproteinasa testicular tipo desintegrina (EC 3.4.24. -) macaco que come cangrejo IVb (fragmento) . La región tiene la ubicación citogenética reportada 16pll.l. Además, CPS 118 tiene alrededor de 95% de identidad de secuencia para una secuencia genómica que incluye o traslapa los genes supuestos LOC204478 y LOC146493. L0C146493 codifica una proteína similar al transportador de creatina dependiente de sodio y cloro 2 (CT2) . Los nucleó idos 13923 hasta 14462 de la SEQ ID NO: 114 (U36341) tienen alrededor de 94% de identidad de secuencia para una región cromosomal que se localiza 5' a CTAG2 y 3' a GAB3. CTAG2 codifica el antígeno 2 de cáncer de testículos, y tiene una ID de ubicación: 30848. Se localiza en el cromosoma Xq28. GAB3 codifica la proteína de enlace asociada con GRB2 3, y tiene una ID de ubicación: 139716. También se localiza en el cromosoma Xq28. CPS 119 corresponde a THBD que codifica trombomodulina . El gen tiene la ID de ubicación: 7056, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20pl2-cen. La trombomodulina puede cambiar la trombina procoagulante en un anticoagulante. Los nucleótidos 3867 hasta 4212 de la SEQ ID NO: 115 (J02973) alinean a una secuencia genómica en el cromosoma 2 con 97% de identidad de secuencia. La secuencia genómica se localiza entre LOC200422, que codifica una proteina similar al receptor de somatostatina, y LOC205172. Tanto LOC200422 como LOC205172 tienen la ubicación citogenética reportada 2pl2. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que SEQ ID NO: 116 (CPS 120) tiene alrededor de 99% de identidad de secuencia para la hebra que codifica la proteína de LOC203068 que codifica una proteína similar a la tubulina, beta 5. LOC203068 se localiza en el cromosoma 6. Además, SEQ ID NO: 116 tiene al menos 99% de identidad de secuencia con LOC157586 y L0C157584. LOC157586 y LOC157584 codifican proteínas similares a la proteína hipotética DKFZp564N123.1 (fragmento humano). Tanto LOC157586 como LOC157584 se localizan en el cromosoma 6. La SEQ ID NO: 116 (AF141349) también tienen 97% de identidad de secuencia con la hebra que codifica la proteína de LOC92755. LOC92755 se localiza en el cromosoma 8p21.1. Los nucleótidos 14 hasta 1586 de la SEQ ID NO:116 tienen 91% de identidad de secuencia para LOC222017 que se localiza en el cromosoma 7pl4.1. Los nucleótidos 15 hasta 1572 de la SEQ ID NO: 116 tienen 87% de identidad de secuencia para una secuencia de intrón de SCP2. SCP2 codifica la proteína portadora de esterol 2, y tiene una ID de ubicación: 6342. Se localiza en el cromosoma lp32. La proteína portadora de esterol 2 puede tener un papel en la regulación de la esteroidogénesis . Por otro lado, los nucleótidos 439 hasta 1474 de la SEQ ID NO: 116 portan 85% de identidad de secuencia para TUBB5 que codifica la tubulina, beta, 5. TUBB5 tiene una ID de ubicación: 10382, y se localiza en el cromosoma 19pl3.3. La tubulina beta 5 puede polimerizarse para forman microtúbulos, y es un miembro de una familia de proteínas estructurales. Los nucleótidos 421 hasta 1444 de la SEQ ID NO: 116 también tienen 84% de identidad de secuencia para TUBB4. TUBB4 codifica la tubulina, beta, 4, y tiene una ID de ubicación: 10381. Se localiza en el cromosoma 16q24.3. Los nucleótidos 142 hasta 1474 de la SEQ ID NO: 116 se alinea a LOC139112 con 80% de identidad de secuencia. LOC139112 codifica una proteína similar a la tubulina beta, y se localiza en el cromosoma Xq25. CPS 123 corresponde a HBEl que codifica la hemoglobina, epsilon 1. El gen tiene la ID de ubicación: 3046, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llpl5.5. El gen de globina epsilon (HBE) se expresa en el sac de yema embriónico. Dos cadenas epsilon junto con dos cadenas zeta (una globina similar a alfa) que constituye la hemoglobina embriónica Hb Gower I , y dos cadenas epsilon junto con dos cadenas alfa forman el Hb Gower II embriónico. Ambas de estas hemoglobinas embriónicas se suplantan normalmente por hemoglobina fetal, y más tarde, de adulto. Los cinco genes de globina tipo beta se encuentran dentro de un agrupamiento de 45 kb en el cromosoma 11 en el siguiente orden: 5' -epsílon- -G-gamma--A-gamma--delta--beta-3' . El epsilon de hemoglobina 1 (tipo beta embriónico) puede transportar oxigeno y dióxido de carbono entre el pulmón y los tejidos, y modular el metabolismo eritrocito y la senectud. CPS 125 corresponde a MAD que codifica la proteína de dimerización MAX. El gen tiene la ID de ubicación: 4084, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2pl3-pl2. La proteína de dimerización MAX pertenece a la subfamilia de proteína que interactúan con MAX. El producto de gen MAD compite con MYC para unirse a MAX para formar un complejo que enlaza al ADN específico de secuencia.
El producto de gen MAD puede actuar como un represor transcripcional mientras que MYC parece funcionar como un activador. El producto de gen MAD es un gen supresor de tumor candidato. El producto de gen es una de cremallera de leucina, hélice-rizo-hélice que dimeriza con MAX, y puede formar un heterodímero con MAX y reprime la transcripción. El producto de gen también puede antagonizar c-Myc (MYC) y promueve la diferenciación celular. CPS 126 corresponde a TSPA -5 que codifica tetraspan 5. El gen tiene la ID de ubicación: 10098, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q23. La proteína codificada por este gen es un miembro de la superfamilia de transmembrana 4, también conocida como la familia tetraspanina . Un grupo de miembros en la superfamilia son proteínas de superficie celular que se caracterizan por la presencia de cuatro dominio hidrofóbleos . Estas proteínas pueden mediar los eventos de transducción de señal involucrados en la regulación del desarrollo celular, activación, crecimiento y movilidad. CPS 127 corresponde a BAG1 que codifica el atanógeno asociado con BCL2. El gen tiene la ID de ubicación: 573, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9pl2. El oncogene BCL2 es una proteína de membrana que bloquea una etapa en la trayectoria que lleva a la apoptosis o muerte celular programada. La proteína BAG1 se enlaza a BCL2 y se refiere como el atanógeno asociado con BCL2. BAG1 aumenta los efectos anti-apoptóticos de BCL2 y representa una unión entre los receptores del factor de crecimiento y mecanismos anti-apoptóticos. BAG1 interactúa con tanto el receptor del factor de crecimiento hepatocito como el receptor del factor de crecimiento derivado de plaquetas y, en ambos casosaumenta la protección mediada por el factor de crecimiento de la apoptosis. Al menos tres proteínas, BAG-1L, BAG-1M y BAG-1, se codifican por el AR m BAG-1 a través del uso de sitios de inicio de traducción alternativos . Los nucleótidos 454 hasta 1006 de la SEQ ID NO: 120 (Z35491) tienen 88% de identidad de secuencia para una región cromosomal en el cromosoma X. Además, los nucleótidos 517 hasta 646 de la SEQ ID NO: 120 se alinean a LOC205900 con 100% de identidad de secuencia. LOC205900 codifica una proteína similar al precursor tipo 4 Kazal inhibidor de la serina proteasa (homólogo del Péptido PEC-60) . LOC205900 se localiza en el cromosoma 4. CPS 128 corresponde a PADI2 (PDI2) que codifica la peptidil arginina desiminasa, tipo II. El gen tiene la ID de ubicación: 11240, y se localiza en el cromosoma 1 con la ubicación citogenetica reportada lp35.2-p35.1. El producto de gen es similar a la peptidil arginina desiminasa de músculo esgueletal de rata, tipo II, y puede convertir los residuos de arginina con proteínas a residuos de citrulina. Los nucleótidos 3315 hasta 4119 de la SEQ ID NO: 121 (AB023211) se alinean con PRKG1 con 79% de identidad de secuencia. PRKG1 codifica la proteína cinasa, dependiente de cGMP, tipo I, y tiene una ID de ubicación: 5592-. La proteína cinasa dependiente de cGMP de tipo I puede relajar el músculo liso vascular e inhibir la agregación de plaquetas. El gen se localiza en el cromosoma 10qll.2. Los nucleótidos 1375 hasta 1500 de la SEQ ID NO: 121 tienen 85% de identidad de secuencia con PADI1 que codifica la peptidil arginina desiminasa, tipo 1. PADI1 tiene una ID de ubicación: 29943, y se localiza en el cromosoma 1 con la ubicación citogenetica reportada 1?36.13. CPS 129 corresponde a IL1R1 que codifica el receptor de interleucina 1, tipo I. El gen tiene la ID de ubicación: 3554, y se localiza en el cromosoma 2 con la ubicación citogenetica reportada 2ql2. El receptor de interleucina 1 tipo I puede unir las tres formas de interleucina 1 (ILLA, IL1B, y IL1R ) . La proteína contiene dominios de inmunoglobulina . CPS 130 corresponde a NP que codifica nucleósido fosforilasa. El gen tiene la ID de ubicación: 4860, y se localiza en el cromosoma 14 con la ubicación citogenetica reportada 14ql3.1. NP codifica la enzima purina nucleósido fosforilasa. La proteína codificada, junto con la adenosina desaminasa (ADA) , sirve un papel clave en el catabolismo de purina, que se refiere como la trayectoria de salvamento. Las mutaciones en la proteína codificada pueden resultar en una inmunodeficiencia combinada severa (SCID) . CPS 131 corresponde a la región no traducida 3' de AQP3 que codifica la acuaporina 3. El gen tiene la ID de ubicación: 360, y se localiza en el cromosoma 9 con la ubicación citogenetica reportada 9pl3. CPS 131 se localiza en la región no traducida 3 ' de AQP3. La acuaporina 3 es una proteína del canal acuoso. Las acuaporinas son una familia de proteínas de membrana integral pequeña relacionadas con la proteína intrínseca mayor (MIP or AQP0) . La acuaporina 3 se localiza en las membranas laterales básales de las células de ductos colectores en el riñon. Además de su función en el canal acuoso, la acuaporina 3 se ha encontrado que facilita el transporte de solutos pequeños no iónicos tales como urea y glicerol, pero a un grado más pequeño. Se ha sugerido que los canales acuosos pueden ser funcionalmente heterogéneos y poseen mecanismos de permeacion acuoso y de soluto. CPS 132 corresponde a GSPT1 que codifica la transición 1 de fase Gl hasta S. El gen tiene la ID de ubicación: 2935, y se localiza en el cromosoma 16 con la ubicación citogenética reportada 16pl3.1. El producto de gen es una proteína enlazada a GTP, y tiene actividad de enlace a GTP. El producto es similar al factor de alargado de la cadena de polipéptido EF1 alfa (EEF1A1) y puede tener un papel en la transición de fase Gl hasta S. CPS 132 tiene alrededor de 85% de identidad de secuencia con LOC120337. LOC120337 codifica una proteína similar al homólogo de proteína 1 de transición de fase Gl hasta S (proteína GST1-HS enlazada a GTP) . LOC120337 se localiza en el cromosoma llq22.3. Los nucleótidos 2301 hasta 2587 de X17644 se alinean con una secuencia genómica localizada 5' a GNB2 con identidad de secuencia del 83%. GNB2 codifica la proteína que enlaza la nucleótido guanina (proteína G) , polipéptido beta 2. GNB2 tiene una ID de ubicación: 2783, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7q22. Los nucleótidos 291 hasta 576 y 585 hasta 2494 de la SEQ ID NO: 125 (X17644) tienen 82-87% de identidad de secuencia con GSPT2 que codifica la transición 2 de fase Gl hasta S. GSPT2 tiene una ID de ubicación: 23708, y se localiza en el cromosoma 5. Los nucleótidos 2522 hasta 2587 de la SEQ ID NO: 125 tienen 93% de identidad de secuencia con una secuencia intrón de LOC153643. LOC153643 codifica una proteína similar una proteína hipotética FLJ14957, y se localiza en el cromosoma 5q21.1. CPS 133 corresponde a GABARAPL2 (GEF-2) que codifica la proteína tipo- 2 asociada al receptor GABA (A) . El gen tiene la ID de ubicación: 11345, y se localiza en el cromosoma 16 con la ubicación citogenética reportada 16q22.3-q24.1. El producto de gen es una fosfoproteína y contiene sitios de enlace de actina y nucleótido supuestos. Los nombres alternativos para el producto de gen incluyen GEF2 o factor 2 de expresión de gangliosida. CPS 133 también tiene alrededor de 81-82% de identidad de secuencia con una secuencia genómica localizada 3' a LOC206774, y una secuencia intrón de RAB3-GAP150. LOC206774 se localiza en el cromosoma 8q24.12. RAB3 -GAP150 codifica la subunidad no catalítica (150kD) de la proteína que activa la rab3 GTPasa. AB3-GAP150 tiene una ID de ubicación: 25782, y se localiza en el cromosoma lq42.12. Los nucleótidos 26 hasta 253 de la SEQ ID NO: 126 (AI565760) tienen alrededor de 84% de identidad de secuencia con una secuencia intrón de ACCN1. ACCN1 codifica el canal 1 de catión sensible a amilorido, neuronal (degenerina) . ACCN1 tiene una ID de ubicación: 40, y se localiza en el cromosoma I7qll.2-ql2. CPS 134 corresponde a HBD que codifica la hemoglobina, delta. El gen se localiza en el cromosoma 11 con la ubicación citogenética reportada llplS.S. El gen tiene la ID de ubicación: 3043. HBB, que codifica la hemoglobina, beta, también se localiza en esta región cromosoma1. Las ubicaciones alfa (HBA) y beta (HBB) determinan la estructura de los 2 tipos de cadenas de polipeptido en la hemoglobina adulta, Hb A. El tetrámero de hemoglobina adulta normal consiste de dos cadenas alfa y dos cadenas beta. La globina beta mutante causa la anemia de célula enferma. La ausencia de cadena beta causa la beta-cero-talasemia. Cantidades reducidas de detectable globina beta causa beta-plus-talasemia. El orden de los genes en el agrupamiento de beta-globina es 5' -epsilon--gamma-G--gamma-A--delta--beta-3' . Un fragmento de CPS 134 (los nucleotidos 2 hasta 366 de la SEQ ID NO: 127) se alinea a HBB con 93-96% de identidad de secuencia. Por otro lado, otro fragmento de CPS 134 (los nucleotidos 157 hasta 364 de la SEQ ID NO: 127) tiene 80% de identidad de secuencia con HBE1. HBE1 codifica hemoglobina, epsilon 1. Tiene una ID de ubicación: 3046, y se localiza en el cromosoma llpl5.5.
CPS 135 corresponde a HAGH que codifica hidroxiacil glutation hidrolasa. El gen tiene la ID de ubicación: 3029, y se localiza en el cromosoma 16 con la ubicación citogenética reportada 16pl3.3. La enzima codificada por este gen se clasifica como una tiolesterasa y es responsable para la hidrólisis de S-lactoil-glutation para reducir la glutationa y D-lactato. CPS 136 corresponde a ERN1 que codifica ER a los núcleos de señalización 1. El gen tiene la ID de ubicación: 2081, y se localiza en el cromosoma 17. El producto de gen es un homólogo humano del producto de gen Irel de levadura. La proteína ER 1 es importante para alterar la expresión del gen como respuesta a las señales de tensión con base en el retículo endoplasínico . La proteína ERN1 es una proteína de transmembrana de retículo endoplásmico, y puede actuar como un sensor de la trayectoria que responde a la proteína no doblada . Los nucleótidos 1504 hasta 1536 de la SEQ ID NO: 129 (AF059198) tienen 96% de identidad de secuencia con una región cromosomal en el cromosoma 3. La región es cercana a LOC152282 que codifica una proteína similar a una proteína gansocoide de caja homeótica. L0C15228 se localiza en el cromosoma 3p25.1. CPS 137 corresponde a COL9A1 que codifica colágeno, tipo IX, alfa 1. El gen tiene la ID de ubicación: 1297, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6ql2-ql4. Este gen codifica una de las tres cadenas alfa de colágeno tipo IX, un componente de colágeno principal del cartucho de hialina. El colágeno tipo IX usualmente se encuentra en tejidos que contienen colágeno tipo II, un colágeno fibrilar. Estudios en ratones agénicos han mostrado que la síntesis de la cadena alfa 1 es esencial para el ensamble de moléculas de colágeno tipo IX, una molécula heterotrimérica, y que carece de colágeno tipo IX se asocia con el inicio temprano de la osteoartritis . Las mutaciones en este gen pueden asociarse con displasia de epilepsia múltiple. Dos variantes de transcrito se han identificado para este gen. CPS 138 corresponde a S100A11 que codifica la proteína All enlazada al calcio S100 (calgizarina) . El gen tiene la ID de ubicación: 6282, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq21. La proteína codificada por este gen es un miembro de la familia S100 de proteínas que contiene 2 porciones enlazadas al calcio de mano EF. Las proteínas S100 se localizan en el citoplasma y/o los núcleos de un amplio rango de células, y pueden estar involucradas en la regulación de un número de procesos celulares tales como progreso y diferenciación del ciclo celular. Los genes S100 incluyen al menos 13 miembros que se localizan como un agrupamiento en el cromosoma lq21. El producto de gen S100A11 puede funcionar en movilidad, invasión, y polimerización de tubulina. Las xeconfiguraciones cromosomales y la expresión alterada de SlOOAll se han implicado en la metástasis de tumor. El empalme alternativo del 5'UTR de SlOOAll resulta en dos productos de gen. CPS 138 también tiene alrededor de 88-90% de identidad de secuencia con S100A14, LOC222128, LOC202763 y una secuencia genómica que contiene LOC221948. S100A14 codifica proteína A14 enlazada al calcio S100 (calgizarina) . S100A14 tiene una ID de ubicación: 30013, y se localiza en el cromosoma 7q22-q31.1. El producto de gen S100A14 es similar a la proteína de calgranulina C humana, y puede pertenecer a la familia de la proteína S100. LOC222128 codifica la proteína dpy-19, y se localiza en el cromosoma 7pl5.3. LOC221948 codifica la calgizarina (proteína S100C) ( LN 70) , y se localiza en el cromosoma 7p22.3. LOC202763 codifica una proteína similar a la proteína dpy-19, y se localiza en el cromosoma 17. Los nucleótidos 103 hasta 149 de la SEQ ID NO: 131 (D38583) se alinean con una secuencia genómica en el cromosoma X con sobre 90% de identidad de secuencia. CPS 139 corresponde a FKBPIB que codifica la proteína IB enlazada a FK506 (12.6 kD) . El gen tiene la ID de ubicación: 2281, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2p23.3. La proteína codificada por este gen es un miembro de la familia de proteína de inmunofilina . Esta familia de proteínas puede jugar un papel en la inmunoregulación y procesos celulares básicos que involucran doblado y trafico de proteína. El producto de gen FKBP1B es una cis-trans prolil isomerasa que puede unir los inmunosupresores FK506 y rapamicina. Es similar a la proteína 1A enlazada a FK505. Este papel fisiológico es para estar en el acoplamiento excitación-contracción en el músculo cardiaco. Hay al menos dos variantes de transcrito alternativamente empalmadas de este gen que codifica diferentes isoformas. CPS 139 también tiene alrededor de 83% de identidad de secuencia con una secuencia intrón de L0C145581. LOC145581 codifica una proteína similar una proteína hipotética GC2656, y se localiza en el cromosoma 14ql3.3. CPS 141 corresponde a RNAH que codifica la familia de helicasa de A . El gen tiene la ID de ubicación: 10973, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6ql6. CPS 141 se localiza en la región no traducida 3 ' del gen . CPS 142 corresponde a MYL9 (MYRL2) que codifica miosina, polipéptido 9 ligero, regulador. El gen tiene la ID de ubicación: 10398, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20qll.22. El producto de gen también se conoce como cadena ligera reguladora de miosina 2. El producto de gen puede regular la actividad ATPasa de las cabezas de miosina, y es un miembro de una familia de proteína que regula la actividad de miosina. CPS 143 corresponde a SPOP que codifica la proteína POZ tipo manchita. El gen tiene la ID de ubicación: 8405, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q22. El producto de gen es una proteína autoantigénica y puede ser un ADN o proteína enlazada a la actina. El producto contiene un dominio POZ, y puede mediar las interacciones proteína-proteína. CPS 144 corresponde a la región no traducida 3' de SLC11A1 que codifica la familia del portador de soluto 11 (transportador de ión de metal divalente acoplado al protón) , miembro 1. El gen tiene la ID de ubicación: 6556, y se localiza . en el cromosoma 2 con la ubicación citogenética reportada 2q35. El producto de gen es similar al Beg murino (Nrampl) , y puede controlar la actividad antimicrobial de macrófagos . CPS 145 corresponde a SIAH2 que codifica siete en ausencia del homólogo 2 (Drosophila) . El gen tiene la ID de ubicación: 6478, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3q25. El producto de gen puede ser un regulador negativo de trayectorias de señalización mediadas por Vav y DCC. CPS 146 corresponde a S100P que codifica la proteína P enlazada al calcio S100. El gen tiene la ID de ubicación: 6286, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4pl6. La proteína codificada por este gen es un miembro de la familia S100 de proteínas que contiene 2 porciones enlazadas al calcio de mano EF. Las proteínas S100 se localizan en el citoplasma y/o los núcleos de un amplio rango de células, y están involucradas en la regulación de un número de procesos celulares tales como progreso y diferenciación del ciclo celular. Los genes S100 incluyen al menos 13 miembros que se localizan como un agrupamiento en el cromosoma lq21. Sin embargo, S100P se localiza en el cromosoma 4pl6. La protelna S100P, además de enlazar Ca2+, también enlaza Zn2+ y g2+. Esta proteína puede jugar un papel en la etiología del cáncer de próstata. CPS 147 corresponde a TNNT1 que codifica la troponina TI, esqueletal, lenta. El gen tiene la ID de ubicación: 7138, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.4. El producto de gen también se conoce como troponina TI, subunidad enlazada a tropomiosina de troponina, o proteína reguladora del músculo esqueletal de sacudida lenta. Los nucleótidos 15639 hasta 15571 de la SEQ ID NO: 139 (AJ011712) tienen 84% de identidad de secuencia con una región cromosomal en 4q32.3. Los nucleótidos 15562 hasta 15604 de la SEQ ID NO: 139 tienen 93% de identidad de secuencia con una región cromosomal cercana a TRAF6. TRAF6 codifica el factor 6 asociado con el receptor T P, y tiene una ID de ubicación: 7189. TRAFG se localiza en el cromosoma llpll.2. CPS 148 corresponde a KIAA0750 que codifica el producto de gen KIAA0750. El gen tiene la ID de ubicación: 9645, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llpl5.2. CPS 149 corresponde a FOS que codifica el homólogo de oncogen viral de osteosarcoma de murino v-fos FBJ. El gen tiene la ID de ubicación: 2353, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14q24.3. La familia del gen Fos consiste de al menos cuatro miembros : FOS, FOSB, FOSL1, y F0SL2. Estos genes codifican proteínas de cremallera de leucina que pueden dimerizarse con proteínas de la familia JU , por lo que se forma el complejo de factor de transcripción AP-1.- Como tal, las proteínas FOS se han implicado como reguladores de la proliferación celular, diferenciación, y transformación. En algunos casos, la expresión del gen FOS se ha asociado con la muerte celular apoptótica. El producto de gen FOS puede funcionar como un factor de transcripción. También puede estar involucrado en la regulación de la metilación de ADN. La región cromosomal que se alinea con CPS 149 también contiene LOC196923. LOC196923 codifica una proteína similar a la proteína c-fos de proto-oncogen (oncogen fos celular) (G0/G1 proteína ¦ reguladora de interruptor 7) . Los nucleótidos 1 hasta 6210 de la SEQ ID NO: 141 (K00650) también se alinean con una región cromosomal en el cromosoma 14 con 99% de identidad de secuencia. Esta región cromosomal incluye LOC196937, LOC196936 y LOC196935. Todos estos tres genes supuestos tienen la ubicación citogenética reportada 14q23.2. LOC196936 codifica una proteína similar a la proteina c-fos de proto-oncogen (fos oncogen celular) (G0/G1 proteína reguladora de interruptor 7) . LOC196935 codifica una proteína similar una proteína c-fos de proto- oncogen (fos oncogen celular) (G0/G1 proteína reguladora de interruptor 7) . CPS 150 corresponde a SERPINB2 (PAI2) que codifica el inhibidor de serina (o cisteína) proteinasa, clade B (ovalbúmina) , miembro 2. El gen tiene la ID de ubicación: 5055, y se localiza en el cromosoma 18 con la ubicación citogenética reportada 18q21.3. El producto de gen se conoce como inhibidor del activador de plasminógeno, tipo II (arginina-serpina) . Es un miembro de la familia serpina de inhibidores de serina proteasa. Los nombres alternativos para este producto de gen incluyen PAI o PLANH2. CPS 151 corresponde a PDXK que codifica la piridoxal (piridoxina, vitamina B6) cinasa. El gen tiene la ID de ubicación: 8566, y se localiza en el cromosoma 21 con la ubicación citogenética reportada 21q22.3.
CPS 152 puede derivarse de ARNm o ADNc de homo sapiens DKFZp564D113 (del clon DKFZp564D113 ) . CPS 152 corresponde a un gen hipotético UNK_AL049250 que representa el gen o genes que producen los transcritos de ARN capaces de hibridizar bajo condiciones severas al CPS 152. CPS 152 se alinea a varias regiones cromosomales con 97-98% de identidad de secuencia. Una región incluye L0C196123 que se localiza en una secuencia intrón de LOC143518. LOC143518 se localiza en el cromosoma 11. Otra región se localiza en el cromosoma 16pl2.1 e incluye o traslapa LOC146384, LOC197204, y LOC146136. LOC146136 codifica una proteína similar a la proteína que interactúa con el complejo de poro nuclear. Una tercera región también se localiza en el cromosoma 16pl2.1, y traslapa LOC220548 que codifica una proteina hipotética IAA0220. Una cuarta región sigue a KIAA0220 que codifica la proteína KIAA0220 y se localiza en el cromosoma 16pl2.1. Una quinta región es en 16pl2.2, y continua hasta LOC146172. Una sexta región es en el cromosoma 7 e incluye o traslapa LOC202736, LOC154729, y LOC154725. LOC154729 codifica una proteína similar a la proteína que interactúa con el complejo de poro nuclear. LOC154725 codifica una proteína similar una proteína hipotética KIAA0220. Una séptima región es cercana a L0C146385 que se localiza en el cromosoma 16ql3. Una octava región incluye L0C197445 la cual también se localiza en el cromosoma 16ql3 y codifica una proteína similar a la proteína nuclear asociada con BTG3 , isoforma a (homólogo BANP u homólogo SMAR1) . Una novena región es en 16q22.3 e incluye LOC146452 que codifica una proteína similar a KIAA0251 proteína hipotética. Una décima región es en 16pl3.2, y se alinea con el gen supuesto LOC146613. Una décimo primera región se localiza 5' a la secuencia que codifica el polipéptido de NPIP. NPIP codifica a la proteína que interactua con el complejo de poro nuclear, y tiene una ID de ubicación: 9284. NPIP se localiza en el cromosoma 16pl3-pll. Aún otra región se localiza cercana a LOC124155. LOC124155 codifica una proteína similar a la proteína que interactúa con el complejo de poro nuclear, y se localiza en el cromosoma 16pll.2. Otras regiones incluyen LOC197366 en 16pll.2, KIAA0370 en 16pl2.1-pll .2 , LOC146130 en 16pll.l, y LOC197362 en 16pll.2. Además, CPS 152 tiene alrededor de 97% de identidad de secuencia con BANP. BANP codifica la proteína nuclear asociada con BTG3 , y tiene una ID de ubicación: 54971. El gen se localiza en el cromosoma 18. BTG3 es una proteína que interactúa con CAF1 que es un componente del complejo multisubunidad de transcripción general . Se piensa que BTG3 está involucrada en el control negativo del ciclo celular. La proteína codificada por BANP puede unirse a BTG3. Los estudios con homólogo de ratón sugieren que esta proteína codificada también puede xnteractuar con una región asociada con la matriz nuclear/andamiaje específica (MAR) . Las variantes de transcrito que codifican diferentes isoformas se han descrito por el gen BANP. CPS 152 también se alinea con LOC118735 con alrededor de 92% de identidad de secuencia. LOC118735 codifica una proteína similar a la proteína responsable de la apoptosis o la proteína responsable de la apoptosis de la próstata 4. Este gen se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q24.2. Adicionalmente, fragmentos de AL049250 (SEQ ID NO: 144) se alinean con otras regiones cromosomales con alrededor de 78-85% de identidad de secuencia.' Por ejemplo, los nucleótidos 182 hasta 2011 de AL049250 se alinean con una secuencia genómica cercana a LOC139011. LOC139011 codifica una proteína similar a la cadena más larga de polimerasa de ARN que dirige el ADN de la Arabidopsis thaliana (EC 2.7.7.6) II (JDMU1) . LOC139011 se localiza en el cromosoma llpl5.5. Los nucleótidos 1720 hasta 2185 de la SEQ ID NO: 144 (AL049250) se alinean con LOC220178 que tiene una similitud de secuencia para el gen específico de riñon de rata (KS) y se localiza en el cromosoma 10q23.2. Los nucleótidos 1463 hasta 1911 de la SEQ ID NO: 144 se alinean con CECR7 que codifica la región del cromosoma del síndrome de ojo de gato, candidato 7. CECR7 tiene una ID de ubicación: 27438, y se localiza en el cromosoma 22. Por otro lado, los nucleótidos 1483 hasta 1943 de la SEQ ID NO: 144 se alinean con LOC204354 que codifica una protelna similar al homólogo asociado con la hipertensión de rata SA y se localiza en el cromosoma 15. Los nucleótidos 1483 hasta 1943 de la SEQ ID NO: 144 se alinean con BUCS1 que codifica la butiril Coenzima A sintetasa 1. BUCS1 tiene una ID de ubicación: 116285, y se localiza en el cromosoma 16 con la ubicación citogenetica reportada 16pl2.2.
CPS 153 corresponde a GR02 que codifica el oncogen GR02. El gen tiene la ID de ubicación: 2920, y se localiza en el cromosoma 4 con la ubicación citogenetica reportada 4q21. El producto de gen puede ser un agente quimiotáctico para leucocitos polimorfonucleares . CPS 153 también se alinea con GR01 con alrededor de 85% de identidad de secuencia. GROl representa el oncogen GR01 (actividad estimulante del crecimiento de melanoma, alfa) . El gen tiene la ID de ubicación: 2919, y se localiza en el cromosoma 4. El producto de gen tiene actividad estimulante del crecimiento de melanoma, y puede ser un factor mitogénico involucrado en procesos inflamatorios . Además, los nucleótidos 2 hasta 298 de M36820 (SEQ ID NO: 145) tienen alrededor de 89-94% de identidad de secuencia con GR03. GR03 representa el oncogen GR03, y tiene una ID de ubicación: 2921. El gen se localiza en el cromosoma 4q21. el producto de gen GR03 puede ser un factor mitogénico. Los nucleótidos 184-299 de la SEQ ID NO: 145 ( 36820) tienen 91% de identidad de secuencia con LOC201963. LOC201963 codifica una proteína similar a la ribonucleoproteina nuclear heterogénea Al (proteína que desestabiliza la hélice) (proteína enlazada de hebra sencilla) (proteína Al de núcleo hnRNP) (HDP). LOC201963 se localiza en el cromosoma 4ql3.3. CPS 154 corresponde a INPP4A que codifica inositol polifosfato-4-fosfatasa, tipo 1, 107kD. El gen tiene la ID de ubicación: 3631, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2qll.2. El producto de gen INPP4A se involucra en las trayectorias de señalización ^ fosf tidilinositol . Este producto remueve el grupo fosfato en la posición 4 del anillo inositol del inositol 3,4-bisfosfato. CPS 155 corresponde a GPT que codifica la glutámico-piruvato transaminasa (alanina aminotransferasa) . El gen tiene la ID de ubicación: 2875, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8q24.3. Los nucleótidos 9 hasta 1550 de la SEQ ID NO: 147 (U70732) se alinean con una región cromosomal con 96% - de identidad de secuencia. La región cromosomal se localiza 3' a FBXL6. FBXL6 codifica proteína de repetición rica en leucina y de caja F 6, y tiene una ID de ubicación: 26233. FBXL6 se localiza en el cromosoma 8q24.3. FBXL6 codifica un miembro de la familia de proteína de caja F que se caracteriza por una porción de aproximadamente 40 aminoácidos, la caja F. Los nucleótidos 1962 hasta 2110 de la SEQ ID NO: 147 tienen 83% de identidad de secuencia con GPT2 que codifica la glutámico piruvato transaminasa (alanina aminotransferasa) 2. GPT2 tiene una ID de ubicación: 84706, y se localiza en el cromosoma 16. CPS 156 corresponde a MYL4 que codifica la miosina, polipéptido ligero 4, alcalino; atrial, embriónico. El gen tiene la ID de ubicación: 4635, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q21-qter. La miosina es una proteina motora celular ATPasa hexamérica. Está compuesta de dos cadenas pesadas de miosina, dos cadenas ligeras alcalinas de miosina no fosforilables, y dos cadenas ligeras reguladoras de miosina fosforilables . MYL4 codifica una cadena ligera alcalina de miosina que se encuentra en el músculo embriónico y atria de adultos. El producto de gen MYL4 puede modular la interacción entre miosina y actina. Es un miembro de una familia de proteínas reguladoras de miosina y actina. CPS 157 corresponde a NFE2 que codifica el factor nuclear (derivado eritroide 2) , 45kD. El gen tiene la ID de ubicación: 4778, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12ql3. El producto del gen NFE2 es una subunidad 45 kD del factor de transcripción dimérico bZIP. El factor de transcripción puede regular la expresión del gen de globina beta (HBB) . CPS 157, asi como NFE2, se localizan dentro de un intrón de ATF7. ATF7 codifica factor de transcripción activante ? , y tiene una ID de ubicación: 11016. ATF7 se localiza en el cromosoma 12ql3. El producto de gen es una proteína enlazada al ADN cremallera de leucina, y puede reconocer un elemento que responde a cAMP (CRE) . El producto de gen también puede estar involucrado en la regulación del adenovirus que responde a Ela y promotores inducibles por cAMP celulares . CPS 158 corresponde a POLR2J que codifica el polipeptido J (dirigido por ADN) de (AR ) II (13.3kD). El gen tiene la ID de ubicación: 5439, y se localiza, en el cromosoma 7 con la ubicación citogenética reportada 7qll.2. Este gen codifica una subunidad de polimerasa de ARN II, la polimerasa es responsable por el ARN mensajero sintetizador en eucariotas. El producto de este gen se presenta como un heterodímero con otra subunidad de polimerasa, y el heterodímero forma una unidad de subensamble de núcleo de la polimerasa. Dos genes similares se localizan cercanamente al cromosoma 7qll.2 y otra ubicación similar se encuentra en el cromosoma 7pl5. Los nucleótidos 11 hasta 382 de la SEQ ID NO: 150 (L37127) tienen 94% de identidad de secuencia con LOC245815. LOC245815, también conocido como POLR2J2, es un gen relacionado con el polipeptido J de polimerasa III de ARN dirigido por ADN. LOC245815 tiene una ID de ubicación: 246721, y se localiza en el cromosoma 7qll.22. Similarmente a una ubicación relacionada sugiere que LOC245815 codifica una subunidad de polimerasa II de ARN. El empalme alternativo de este gen resulta en al menos tres variantes de transcrito que codifican diferentes isoformas. Además, los nucleótidos 11 hasta 382 de L37127 tienen 94% de identidad de secuencia con una región cromosomal cercana a L0C154696 y una región cromosomal en el cromosoma 7. LOC154696 codifica una proteína similar a la proteína HSPC047, y se localiza en el cromosoma 7pl5.1. CPS 159 corresponde a CARM1 que codifica la arginina metiltransferasa 1 asociada con el coactivador. El gen tiene la ID de ubicación: 10498, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.2. CPS 160 corresponde a U K_AF038171 que se localiza en una secuencia intrón de LOC206073. LOC206073 se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q24.
CPS 161 corresponde a RAB2 que codifica RAB2 , miembro de la familia del oncogen RAS. El gen tiene la ID de ubicación: 5862, y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8qll.23. El producto de gen RAB2 también es conocido como proteína enlazada a GTP 2 , y puede estar involucrado en el transporte vesicular del ER al complejo Golgi. El producto de gen es un miembro de la subfamilia RAB. La anotación affymetrix sugiere que CPS 162 corresponde a 6?9?. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 162 se alinea con una secuencia intrón de MY01E con alrededor de 94% de identidad de secuencia. MY01E codifica la miosina IE, y tiene una ID de ubicación: 4643. MY01E se localiza en el cromosoma 15 con la ubicación citogenética reportada 15g21-q22. El producto de gen MY001E es similar a la miosina de clase I, y puede unirse a los péptidos ricos en prolina. El producto de gen contiene una homología Src 3 (SH3) y un dominio de cabeza de miosina (dominio motor) . CPS 163 corresponde a EPB42 que codifica la banda de proteína de membrana eritrocito 4.2. El gen tiene la ID de ubicación: 2038, y se localiza en el cromosoma 15 con la ubicación citogenética reportada 15ql5-q21. La banda de proteína de membrana eritrocito 4.2 es una proteína enlazada a ATP la cual puede regular la asociación de la proteína 3 con anquirina. Probablemente tiene un papel en la forma del eritrocito y regulación de la propiedad mecánica. Las mutaciones en el gen EPB42 se asocian con eliptocitosis esferocítica recesiva y anemia hemolítica hereditaria recesivamente transmitida. CPS 163 también se alinea con LOC203401 con alrededor de 97% de identidad de secuencia. LOC203401 codifica una proteína similar a la banda de proteína de membrana eritrocito 4.2 (P4.2) (Palidina) . La ubicación cromosomal de LOC203401 se desconoce. CPS 164 corresponde a CGTHBA que significa wgen telomérico conservado para agrupamiento de alfa globina" . El gen tiene la ID de ubicación: 8131, y se localiza en el cromosoma 16 con la ubicación citogenética reportada 16pl3.3.
CPS 165 corresponde a DOC-IR que codifica el supresor de tumor eliminado en el 1 relacionado con el cáncer oral. El gen tiene la ID de ubicación: 10263, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llql3. El producto de gen es similar al doc-1 de hámster. CPS 165 también se alinea con L0C222984 con alrededor de 89% de identidad de secuencia. LOC222984 codifica una proteína similar al supresor de tumor eliminado en el 1 relacionado con el cáncer oral, y se localiza en el cromosoma 7p22.2. Los nucleótidos 3 hasta 663 de la SEQ ID NO: 157 (AF089814) tienen alrededor de 86% de identidad de secuencia con LOC169609 y LOC169607. Ambos genes codifican una proteína similar a la miosina Vb (Miosina 5B) . LOC169609 se localiza en el cromosoma 9ql2. LOC169607 se localiza en el cromosoma 9q21.11. Además, los nucleótidos 3 hasta 777 de AF089814 tienen alrededor de 86-93% de identidad de secuencia con LOC138403. LOC138403 codifica una proteína similar a la miosina Vb (Miosina 5B) , y se localiza en el cromosoma 9ql3.
CPS 166 corresponde a KIAA0353 (DMN) que codifica desmuslina. El gen tiene la ID de ubicación: 23336. DMN se localiza en el cromosoma 15 con la ubicación citogenética reportada 15q26.3. Un fragmento de CPS 166 (los nucleótidos 477 hasta 602 de AI077476) se alinea con LOC120511 con alrededor de 97% de identidad de secuencia. LOC120511 codifica una proteína similar a la protelna rig-1 (ratón) , y se localiza en el cromosoma llq23.3. La anotación affymetrix sugiere que CPS 167 corresponde a CSH1. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 167 también se alinea con CSH2 con alrededor de 98% de identidad de secuencia. CSH2 codifica la hormona de somatomamotropina coriónicá 2. El gen tiene la ID de ubicación: 1443, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q24.2. La proteína codificada por este gen es un miembro de la familia somatotropina/prolactina de hormones y puede jugar un papel importante en el control del crecimiento. CSH2 se localiza en la hormona del crecimiento ubicada en el cromosoma 17 junto con otros cuatro genes relacionados en la misma orientación transcripcional . Esta configuración se piensa que está envuelta por una serie de duplicaciones de gen. No obstante que los cinco genes portan un alto grado de identidad de secuencia, se reportan que se expresan en diferentes tejidos. El empalme alternativo genera isoformas adicionales de cada una de las cinco hormonas de crecimiento. CSH2 se expresa en la placenta y utiliza los sitios de inicio de transcripción múltiples . La expresión de las proteínas maduras para hormonas de somatomamotropina coriónicas 1 y 2 se sobrerregula durante el desarrollo. CPS 168 corresponde a LOC51048 (DKK3) que codifica el homólogo dickkopf 3 (Xenopus laevis) {5-6 tipo RIG) . El gen tiene la ID de ubicación: 27122, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llpl5.2. El producto de gen DK 3 también es conocido como 7-1 tipo RIG, y puede relacionarse a proteínas que antagonizan la señalización nt . Los nucleótidos 3 hasta 92 de la SEQ ID NO: 160 (AF034209) tienen alrededor de 90% de identidad de secuencia con RIG (regulada en glioma) . RIG tiene una ID de ubicación: 10530, y se localiza en el cromosoma llpl5.1. CPS 169 corresponde a SELP que codifica la selectina P (proteína de membrana de granulo 140kD, antígeno CD62) . El gen tiene la ID de ubicación: 6403, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Iq22-q25. El producto de gen SELP es una proteína de membrana de gránulo alfa de plaqueta de peso molecular 140,000 que redistribuye a la membrana de plasma durante la activación y desgranulación de plaquetas. Es un miembro de una familia de receptores de adhesión/alojamiento. Las variantes de empalme alternativas pueden presentarse pero no están bien documentadas . El producto de gen puede mediar interacciones de leucocitos con la pared del vaso sanguíneo. Contiene un dominio EGF y dominio de proteína de-' complemento reguladora (CR) . CPS 170 corresponde a RAP1GA1 que codifica la proteína 1 que activa la GTPasa para RAP1. El gen tiene la ID de ubicación: 5909, y se localiza en el cromosoma 1 con la ubicación citogenética reportada G?36.1-?35. Los nucleótidos 916 hasta 1044 de la SEQ ID NO: 162 (M64788) tienen alrededor de 85% de identidad con KIAA1039. KIAA1039 codifica la proteína IAA.1039, y tiene una ID de ubicación: 23108. El gen tiene la ubicación citogenética reportada 17pl3.3. CPS 171 corresponde a THBS1 que codifica la trombospondina 1. El gen tiene la ID de ubicación: 7057, y se localiza en el cromosoma 15 con la ubicación citogenética reportada 15ql5. La trombospondina 1 puede tener un papel en la coagulación sanguínea y en la angiogénesis . Es un miembro de una familia de moléculas adhesivas. CPS 172 corresponde a CHRNA4 que codifica el receptor colinérgico, nicotínico, polipéptido alfa 4. El gen tiene la ID de ubicación: 1137, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20ql3.2-ql3.3. Los nucleótidos 615 hasta 1995 de la SEQ ID NO: 164 (U62433) también se alinean con LOC149656. LOC149656 codifica una proteína similar a la proteína del receptor acetilcolina neuronal, precursor de cadena alfa 4, y se localiza en el cromosoma 20ql3.33. Los fragmentos de los nucleótidos 602 hasta 1313 de U62433 (SEQ ID NO: 164) se alinean con CHRNA2, CHRNA3 y CHRNB2 con alrededor de 79-89% de identidad de secuencia. CHRNA2 codifica el receptor colinérgico, nicotínico, polipéptido alfa 2 (neuronal) . CHR A2 tiene una ID de ubicación: 1135, y se localiza en el cromosoma 8p21. CHKNA3 codifica el receptor colinérgico, nicotínico, polipéptido alfa 3. CHRNA3 tiene una ID de ubicación: 1136, y se localiza en el cromosoma 15g24. CHRNB2 codifica el receptor colinérgico, nicotínico, polipéptido beta 2 (neuronal) . CHRNB2 tiene una ID de ubicación: 1141, y se localiza en el cromosoma lq21.3. CPS 173 corresponde a S100A12 que codifica la proteína A12 enlazada al calcio S100 (calgranulina C) . El gen tiene la ID de ubicación: 6283, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq21. La proteína codificada por este gen es un miembro de la familia S100 de proteínas que contiene 2 porciones enlazadas al calcio de mano EF. Las proteínas S100 se localizan en el citoplasma y/o los núcleos de un amplio rango de células, y están involucradas en la regulación de un número de procesos celulares tales como progreso y diferenciación del ciclo celular. Los genes S100 incluyen al menos 13 miembros que se localizan como un agrupamiento en el cromosoma lq21. El producto de gen S100A12 se propone que esté involucrado en las trayectorias de transducción de señal dependientes del calcio específicas, y su efecto regulador en los componentes citoesqueletales puede modular varias actividades neutrófilas . CPS 174 corresponde a CD9 que codifica el antígeno CD9 (p24) . El gen tiene la ID de ubicación: 928, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12pl3.3. La proteína codificada por este gen es un miembro de la superfamilia de la transmembrana 4, también conocida como la familia tetraspanina . La mayoría de estos miembros son proteínas de superficie celular que se caracterizan por la presencia de cuatro dominios hidrofóbicos . Estas proteínas median eventos de transducción de señal que juegan un papel en la regulación del desarrollo celular, activación, crecimiento y movilidad. La proteína que codifica CD9 es una glicoproteína de superficie celular que se conoce que hace complejo con integrinas y otras proteínas de la superfamilia 4 de transmembrana. Puede modular adhesión celular y migración y también disparar la activación de plaquetas y la agregación. Además, la proteína codificada parece promover la fusión celular del músculo y mantenimiento del miotubo de soporte . CPS 175 corresponde a PRDX2 (TDPX1) que codifica la peroxiredoxina 2. La peroxiredoxina 2 también es conocida como la peróxido reductasa dependente de tioredoxina (antioxidante 1 específico de tiol, factor B que aumenta la eliminación natural) , y puede ser protector contra la tensión oxidante. El gen PRDX2 tiene una ID de ubicación: 7001, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.2. CPS 175 tiene alrededor de 88% de identidad de secuencia con MGC2599 y LOC134602. MGC2599 codifica la proteína hipotética MGC2599 la cual es similar a la subunidad A 1 2599 de catanina p60. El gen tiene la ID de ubicación: 84056, y se localiza en el cromosoma 13ql2.2. LOC134602 codifica una proteína similar al antioxidante específico de tiol (TSA) , y se localiza en el cromosoma 6q21. Los nucleótidos 497 hasta 767 de la SEQ ID NO: 167 (L19185) se alinean con LOC219772 con 89% de identidad de secuencia. LOC219772 codifica la peroxiredoxina 2 (tioredoxin peroxidasa 1) (peróxido reductasa dependiente de tioredoxina 1) (proteína antioxidante específica de tiol) (TSA) (PRP) (factor B aumentador de la célula eliminadora natural) (NKEF-B) . LOC219772 se localiza en el cromosoma 10qll.21. Por otro lado, los nucleótidos 5 hasta 65 de L19185 muestran 100% de identidad de secuencia con LOC204141 y LOC205227. LOC204141 es similar a H-NUC (humano), y se localiza en el cromosoma 13. LOC205227 codifica una proteína similar a la malonil-CoA descarboxilasa (EC 4.1.1.9) (ganso), y se localiza en el cromosoma 2. CPS 176 corresponde a B7 que codifica la proteína B7. El gen tiene la ID de ubicación: 10233, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12pl3. La proteína B7 tiene una baja similitud de secuencia con la subunidad reguladora de las proteína fosfatasas. La proteína B7 contiene repeticiones ricas en leucina, y puede mediar las interacciones proteína-proteína . CPS 177 corresponde a BPGM que codifica la 2,3.-bisfosfoglicerato mutasa. El gen tiene la ID de ubicación: 669, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7q31-q34. La 2 , 3 -bisfosfoglicerato mutasa tiene actividades de sintasa, mutasa, y fosfatasa. Está involucrada en controlar el metabolismo de 2,3-difosfoglicerato. CPS 178 corresponde a PSMA7 que codifica la subunidad de proteasoma (prosoma, macropaina) , tipo alfa, 7. El gen tiene la ID de ubicación: 5688, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20ql3.33. La subunidad alfa 7 de la proteasoma (prosoma macropaina) es un posible objetivo para la proteína X del virus de hepatitis B.
CPS 179 corresponde a GMPR que codifica la guanosina monofosfato reductasa. El gen tiene la ID de ubicación: 2766, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6p23. La guanosina monofosfato reductasa puede facilitar la termogénesis , y tiene muy fuerte similitud con la guanosina monofosfato reductasa de rata. CPS 180 corresponde a TMOD que codifica la tropomodulina . El gen tiene la ID de ubicación: 7111, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9g22.3. La tropomodulina puede unirse a un extremo de la eritrocito tropomiosina . CPS 181 corresponde a C4A que codifica componente de complemento 4A. El gen tiene la ID de ubicación: 720. El gen se localiza en el cromosoma 6. Este gen codifica la forma ácida del factor de complemento 4, parte de la trayectoria de activación clásica. El producto de gen se expresa como un precursor de cadena sencilla el cual se desdobla proteolíticamente en un trímero de cadenas alfa, beta, y gamma antes de la secreción. El trímero proporciona una superficie para la interacción entre el complejo antígeno-anticuerpo y otros componentes de complemento. La cadena alfa puede desdoblarse para liberar la anafilatoxina C4, un mediador de la inflamación local. La deficiencia del componente de complemento 4A se asocia con lupus eritematoso sistémico y diabetes mellitus tipo I. El gen C4A localiza al la región de clase III del complejo de histocompatibilidad principal (MHC) en el cromosoma 6. Se presentan haplotipos variables de este agrupamiento de genes, de tal manera que los individuales pueden tener 1, 2, ó 3 copies de este gen.
Los fragmentos de CPS 181 (los nucleótidos 1 hasta 45 y los nucleótidos 199 hasta 248 de la SEQ ID NO: 173) también se alinean con X.OC220819 con 100% de identidad de secuencia. LOC220819 codifica una proteína similar a dJ34F7.4 (componente de complemento 4A) . LOC220819 se localiza en el cromosoma 6. Además, CPS 181 se alinea con C4B con sobre el 94% de identidad de secuencia. C4B codifica el componente de complemento 4B, y tiene una ID de ubicación: 721. C4B se localiza en el cromosoma 6p21.3. El gen C4B codifica la forma básica del factor de complemento 4, parte de la trayectoria de activación clásica. Este gen se presenta como una forma larga y una forma corta debido a la presencia o ausencia de un retrovirus HERV-K endógeno de 6.4 kb en el intrón 9. CPS 182 corresponde a GPR12 que codifica el receptor 12 acoplado a la proteína G. El gen tiene la ID de ubicación: 2835, y se localiza en el cromosoma 13 con la ubicación cítogenética reportada 13ql2. El producto de gen es un miembro de la familia del receptor acoplado con la proteína G. Es similar al Gpcrl2 de murino y Rn.10218 de rata. CPS 182 también se alinea con una secuencia cercana a LOC202175 con 97% de identidad de secuencia. LOC202175 se localiza en el cromosoma 5pl5.33. CPS 183 corresponde a ADFP que codifica la proteína relacionada con la diferenciación adiposa. El gen tiene la ID de ubicación: 123, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9p21.2. la proteína relacionada con la diferenciación adiposa se asocia con el material de membrana de superficie de glóbulo. Esta proteína es un constituyente principal de la superficie del glóbulo. El incremento en los niveles de AR m es una de las indicaciones más tempranas de la diferenciación de adipocito. La proteína es un componente de glóbulos de lípido de leche. La proteína también es conocida como adipofilina. Los nucleótidos 1 hasta 1314 de la SEQ ID NO: 175 (X97324) tienen 91-92% de identidad de secuencia con ILF2 que codifica el factor enlazado al aumentador de interleucina 2 , 45kD. ILF2 tiene una ID de ubicación: 3608, y se localiza en el cromosoma lq21.1. El producto de gen es una subunidad del factor nuclear de células T activadas (NF-AT) . Es un factor de transcripción enlazado al ADN. CPS 184 corresponde a MYL5 que codifica miosina, polipéptido ligero 5·, regulador. El gen tiene la ID de ubicación: 4636, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4pl6.3. Este gen codifica una de las cadenas ligeras de miosina, un componente de la proteína miosina motor celular hexamérica ATPasa. La miosina está compuesta de dos cadenas pesadas, dos cadenas ligeras alcalinas no fosforilable, y dos cadenas ligeras reguladoras fosforilables . Este producto de gen, una de las cadenas ligeras reguladoras, se expresa en el músculo fetal y en la retina de adulto, cerebelo, y ganglio basal . El producto de gen puede modular la interacción entre miosina y actina. Es un miembro de una familia de proteínas reguladoras de miosina y actina. CPS 185 corresponde a DPM2 que codifica el polipéptido de dolicil-fosfato manosiltransferasa 2, subunidad reguladora. El gen tiene la ID de ubicación: 8818, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9q34.13. CPS 186 corresponde a MCC que codifica la proteína mutada en cánceres colorectales . El gen tiene la ID de ubicación: 4163, y se localiza en el cromosoma 5 con la ubicación citogenética reportada 5q21-q22. MCC es un candidato para el gen supresor del tumor colorectal supuesto. El producto de gen MCC puede estar involucrado en etapas tempranas de neoplasia colorectal tanto en tumores esporádicos como familiares. El producto de gen es similar al receptor acetilcolina muscarinico m3 acoplado a la proteína G. CPS 187 corresponde a F3 que codifica el factor de coagulación III (tromboplastina, factor de tejido) . El gen tiene la ID de ubicación: 2152, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Ip22-p21. Este gen codifica el factor de coagulación III que es una glicoproteína de superficie celular. Este factor permite que las células inicien las cascadas de coagulación sanguínea, y funcione como el receptor de alta afinidad para el factor de coagulación VII. El complejo resultante proporciona un evento catalítico que es responsable del inicio de la cascada de coagulación de proteasa por proteólisis limitada específica. Sin tener en cuenta algunos de los otros cofactores de estas cascadas de proteasa, que circulan como precursores no funcionales, el factor de coagulación III es un iniciador potente que es completamente funcional cuando se expresa en superficies celulares. Hay 3 distintos dominios de este factor: extracelular, transmembrana, y citoplásmico. El factor de coagulación III puede iniciar la cascada de coagulación de proteasa en forma ensamblada y la propagación, y puede funcionar en la hemostasis normal. El factor es un componente de la respuesta celular inmune. CPS 188 corresponde a KLF1 que codifica el factor 1 tipo Kruppel (eritroide) . El gen tiene la ID de ubicación: 10661, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.13-pl3.12. El factor 1 eritroide tipo Kruppel es un activador transcripcional del promotor beta-globina adulto. CPS 188 también se alinea a LOC146544 con alrededor de 94% de identidad de secuencia. L0C146544 se localiza en el cromosoma 16.
CPS 189 corresponde a HBG2. HBG2 codifica la hemoglobina, gamma G. El gen tiene la ID de ubicación: 3047, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llpl5.5. HBG1 también se localiza en la misma región cromosomal . Los genes de globina gamma (HBG1 y HBG2) se expresan normalmente en el hígado fetal, bazo y médula ósea. Dos cadenas gamma junto con dos cadenas alfa constituyen la hemoglobina fetal (HbF) que se reemplaza normalmente por hemoglobina de adulto (HbA) al nacer. En algunas beta-talasemias y condiciones relacionadas, la producción de cadena gamma continua en la madurez. Los dos tipos de cadenas gamma difieren en el residuo 136 donde la glicina se encuentra en el producto gamma G (HBG2) y la alanina se encuentra en el producto gamma A (HBG1) . El último es predominante al nacer. El orden de los genes en el agrupamiento beta-globina es: 5' -epsilon- -gamma-G- -gamma-A--delta- -beta—3' . Los productos de genes pueden transportar oxígeno y dióxido de carbono entre el pulmón y tejidos. Un fragmento de CPS 189 (los nucleótidos 332...234 de la SEQ ID NO: 181) tiene 86% de identidad de secuencia con HBE1 que codifica la hemoglobina, epsilon 1. Además, la SEQ ID NO: 277 ( 91036) puede usarse para designar sondas para detectar HBG2. Los nucleótidos 2162-2268, 2391-2614 y 3501-3565 de la SEQ ID NO: 277 se alinean a HBG2 con 100% de identidad de secuencia. Los nucleótidos 2379 hasta 2626 y 7309 hasta 7556 de la SEQ ID NO: 277 tienen 87% de identidad de secuencia con HBE1 que codifica la hemoglobina, epsilon 1. El gen HBE1 tiene una -ID de ubicación: 3046, y se localiza en el cromosoma llpl5.5. Los nucleótidos 2384 hasta 2621 y 7314 hasta 7551 de la SEQ ID NO: 277 también tienen 84% de identidad de secuencia con una región cromosomal en el cromosoma 11. CPS 190 corresponde a GR03 que codifica el oncogen GR03. El gen tiene la ID de ubicación: 2921, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q21. El producto de gen puede ser un factor mitogénico. Los nucleótidos 6 hasta 298 de la SEQ ID NO: 182 ( 36821) tienen alrededor de 86-95% de identidad de secuencia con GROl y GR02. GR01 codifica el oncogen GR01 (actividad estimulante del crecimiento de melanoma, alfa) , y tiene una ID de ubicación: 2919. GROl se localiza en el cromosoma 4q21. El producto de gen GROl tiene actividad estimulante del crecimiento de melanoma, y puede ser un factor mitogénico involucrado en procesos inflamatorios. GR02 codifica el oncogen GR02 , y tiene una ID de ubicación: 2920. GR02 se localiza en el cromosoma 4q21. El producto de gen GR02 puede ser un agente quimiotáctico para leucocitos polimorfonucleares . La anotación affymetrix sugiere que CPS 191 corresponde a PLEC1. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que los nucleótidos 14629 hasta 14800 de la SEQ ID NO: 183 (U53204) tienen 93% de identidad de secuencia con LOC162613 y una región cromosomal cercana a LOC93232. Tanto LOC162613 como LOC93232 se localizan en el cromosoma 17q25.3, y codifican proteínas similares a la proteína KIAA1640. Además, los nucleótidos 14268 hasta 14800 de la SEQ ID NO: 183 (U53204) se alinean con LOC160535 con 88% de identidad de secuencia. LOC160535 se localiza en el cromosoma 12ql2. CPS 192 corresponde a SLC16A3 que codifica la familia del portador de soluto 16 (transportadores de ácido monocarboxílico) , miembro 3. El gen tiene la ID de ubicación: 9123, y se localiza en el cromosoma 17. El producto de gen es un miembro de la familia del transportador de monocarboxilato, y puede funcionar como un transportador. Los nucleótidos 34 hasta 945 de la SEQ ID NO: 184 (U81800) se alinean con LOC201281 con sobre 96% de identidad de secuencia. LOC201281 codifica una proteína similar al transportador de monocarboxilato, y se localiza en el cromosoma 17q25.3. CPS 194 corresponde a FKBP8 que codifica la proteína 8 enlazada a FK506 (38kD) . El gen tiene la ID de ubicación: 23770, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl2. La proteína codificada por este gen es un miembro de la familia de proteína de inmunofilina, la cual juega un papel en la immunoregulación y procesos celulares básicos que involucran plegado de proteína folding y tráfico. La proteína codificada no se aprecia que tenga actividad PPIasa/rotamasa. Tiene una repetición de tetratricopéptido de tres unidades y una repetición de consenso leucina-cremallera, y puede tener un papel en las neuronas asociadas con la función de la memoria. CPS 194 también se alinea con una secuencia intrón de PPP1R12B con alrededor de 88% de identidad de secuencia. PPP1R12B codifica la proteína fosfatasa 1, subunidad reguladora (inhibidor) 12B. El gen tiene la ID de ubicación: 4660, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq32.1. La miosina de fosfatasa de cadena ligera (MLCP) consiste de tres subunidades: la subunidad catalítica, La subunidad grande/subunidad enlazada a la miosina (MBS) y la subunidad pequeña (sm-M20) . PPP1R12B es un gen muítif ncíonal que codifica tanto MBS como sm-M20. MLCP regula las miosinas y la desfosforilación se aumenta por la presencia de MBS. La subunidad sm-M20 se sugiere que juega un papel regulador en la contracción muscular al enlazarse a MBS. MBS también se codifica por otro gen, subunidad 1 objetivo de miosina fosfatasa de cadena ligera. No obstante que ambas MBSs incrementan la actividad de MLCP, la subunidad 1 objetivo de miosina fosfatasa de cadena ligera -MBS es un activador más eficiente. Hay al menos cuatro variantes de transcrito alternativamente empalmadas de PPP1R12B descritas, dos alteran la región de codificación MBS y dos alteran la región de codificación sm-M20. CPS 195 corresponde a RNASE2 que codifica la ribonucleasa, familia RNasa A, 2 (hígado, neurotoxina derivada de eosinófilo) . El gen tiene la ID de ubicación: 6036, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14q24-q31. La neurotoxina derivada de eosinófilo tiene actividades neurotóxicas y de ribonucleasa. Es un miembro de la superfamilia de ribonucleasa. CPS 195 también se alinea con LOC122661 con alrededor de 92% de identidad de secuencia. LOC122661 codifica una proteína similar al precursor de ribonucleasa no secretor (ribonucleasa US) (neurotoxina derivada de eosinófilo) (RNasa UpI-2) (ribonucleasa 2) (RNasa 2) . LOC122661 se localiza en el cromosoma 14qll.l. Además, CPS 195 tiene alrededor de 88-94% de identidad de secuencia con RNASA3. RNASA3 codifica la ribonucleasa, familia RNasa A, 3 (proteína catiónica de eosinófilo) . RNASA3 tiene una ID de ubicación: 6037, y se localiza en el cromosoma 14q24-q31. El producto de gen de RNASA3 tiene actividades neurotóxicas y de ribonucleasa. Es un miembro de la superfamilia de ribonucleasa. Los nucleótidos 639 hasta 735 de la SEQ ID NO: 186 (X55988) muestran 95% de identidad de secuencia con ¦ una secuencia intrón de LOC159655. LOC159655 se localiza en el cromosoma 10q23.33. CPS 196 corresponde a BCAT1 que codifica la aminotransferasa 1 de cadena ramificada, citosólica. El gen tiene la ID de ubicación: 586, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12pter-ql2. La carencia de la transaminasa de aminoácido de cadena ramificada de enzima citosólica (BCT) causa la inhibición del crecimiento celular. Pueden haber 2 diferentes trastornos clínicos debido a un defecto de la transaminación de aminoácido de cadena ramificada: hipervalinemia e hiperleucina-isoleucinemia. La aminotransferasa de aminoácido de cadena ramificada citosólica 1 cataliza la conversión de a-ceto ácidos de cadena ramificada a aminoácidos L. CPS 199 corresponde a SPPl que codifica la fosfoproteína 1 secretada (osteopontina sialoproteína I ósea, activación del linfocito T temprana 1) . El gen tiene la ID de ubicación: 6696, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4q21-q25. La osteopontina (sialoproteína ósea) es una proteína de matriz celular de vaso sanguíneo y ósea involucrada en la calcificación y aterosclerosis . CPS 201 corresponde a GROl que codifica el oncogen GROl oncogen (actividad estimulante del crecimiento de melanoma, alfa) . El gen tiene la ID de ubicación: 2919, y se localiza en el cromosoma 4 con la ubicación citogenética reportada 4g21. El producto de gen tiene actividad estimulante del crecimiento de melanoma, y puede ser un factor mitogénico involucrado en procesos inflamatorios . CPS 201 también se alinea con GR02, que codifica el oncogen GR02, con 87-89% de identidad de secuencia. GR02 tiene una ID de ubicación: 2920, y se localiza en el cromosoma 4q21. GR02 puede ser un agente quimiotáctico para leucocitos polimorfonucleares . Los nucleót dos 1 hasta 830 de la SEQ ID NO: 189 (X54489) tienen alrededor de 90% de identidad de secuencia con GR03 que codifica el oncogen GR03. GR03 tiene una ID de ubicación: 2921, y se localiza en el cromosoma 4q21. El producto de gen GR03 puede ser un factor mitogénico. Los nucleótidos 2 hasta 466 de la SEQ ID NO: 189 tienen 85% de identidad de secuencia con LOC201963 que codifica una proteína similar a la ribonucleoproteína nuclear heterogénea Al (proteína desestabilizante de la hélice) (proteína de enlace de hebra sencilla) (pro eina Al de núcleo hnRNP) (HDP). LOC201963 se localiza en el cromosoma 4ql3.3. CPS 202 corresponde a FLJ21588 (DKFZP58600223) que codifica la subunidad P100 del complejo ASC-1. El gen tiene la ID de ubicación: 84164, y se localiza en el cromosoma 22 con la ubicación citogenetica reportada 22ql2.1. CPS 205 corresponde a FASN que codifica sintasa de ácido graso. El gen tiene la ID de ubicación: 2194, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q25. La enzima codificada por este gen es una proteína multifuncional . Una de sus funciones es catalizar la síntesis del palmitato de acetil-CoA y malonil-CoA, en presencia de NADPH, en ácidos grasos saturados de cadena larga. En algunas lineas de células de cáncer, esta proteína se ha encontrado que se fusiona con el receptor alfa de estrógeno (ER-alfa) , en el cual la terminación N de FAS se fusiona en la estructura con la terminación C de ER-alfa. Los nucleótidos 7777 hasta 8199 y 8270 hasta 8457 de la SEQ ID NO: 192 (U29344) tienen alrededor de 94-96% de identidad de , secuencia con L0C133934. El gen es un gen hipotético, y se localiza en el cromosoma 5pl5.2. Los nucleótidos 7528 hasta 8223 de la SEQ ID NO: 192 muestran 84% de identidad de secuencia con una secuencia intrón de LY9 que codifica el antígeno de linfocito 9. LY9 tiene una ID de ubicación: 4063, y se localiza en el cromosoma Iq21.3-q22. El antígeno de linfocito 9 puede estar involucrado en la adhesión entre células T y células accesorias. Es un miembro de la superfamilia de inmunoglobulina . Además, los nucleótidos 8299 hasta 8337 de U29344 se alinean con DDX27 con 97% de identidad de secuencia. DDX27 codifica el polipéptido 27 de caja DEAD/H (Asp-Glu-Ala- Asp/His) , y tiene una ID de ubicación: 55661. DDX27 se localiza en el cromosoma 20ql3.13. Las proteínas de caja DEAD, se caracterizan por la porción conservadora Asp-Glu-Ala-Asp (DEAD) , son helicasas de ARN supuestas. Están implicadas en un número de procesos celulares que involucra la alteración de la estructura de ARN secundario tal como inicio de traducción, empalme nuclear y mitocondrial , y ensamble de ribosoma y espliceosoma. Con base en sus patrones de distribución, algunos miembros de esta familia se consideran que están involucrados en la embriogénesis , espermatogénesis, y crecimiento celular y división. DDX27 codifica una proteína de caja DEAD la cual es un miembro de la caja DEAD/DEAH de la familia de helicasa de ADN o ARN dependiente de ATP. CPS 206 corresponde a H0XA1 que codifica caja homeótica Al. El gen tiene la ID de ubicación: 3198, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7pl5.3. La caja homeótica Al es un miembro de la familia homeodominio de proteínas enlazadas al ADN, y puede regular la expresión del gen, morfogénesis, y diferenciación. CPS 207 corresponde a HM0X1 que codifica la heme oxigenasa (desciclante) 1. El gen tiene la ID de ubicación: 3162, y se localiza en el cromosoma 22 con la ubicación citogenética reportada 22ql3.1. CPS 207 se alinea con los nucleótidos 15085942 hasta 15086457 del cromosoma 22 con 100% de identidad de secuencia. La heme oxigenasa, una enzima esencial en el catabolismo heme, desdoble heme para formar biliverdina, la cual posteriormente se convierte a bilirubina por la biliverdina reductasa, y monóxido de carbono, un neurotransmisor supuesto. La actividad de heme oxigenasa es inducida por su substrato heme y por varias substancias no heme. La heme oxigenasa se presente como 2 isozimas, una heme oxigenasa 1 inducible y una heme oxigenasa 2 constitutiva. HM0X1 y HM0X2 pertenece a la familia heme oxigenasa. La región cromosomal a la cual CPS 207 se alinea está en la proximidad de otros genes. Estos genes incluyen CM5 y LOC129121. MCM5 codifica el ciclo de división celular 46 (S. cerevisiae) , deficiente en el mantenimiento del minicromosoma MCM5 5. Su ID de ubicación: 4174, y se localiza en el cromosoma 22ql3.1. La proteína codificada por MCM5 es similar a CDC46 de S. cerevisiae la cual está involucrada en el inicio de la síntesis de ADN. El producto de gen MCM5 es un miembro de la familia MCM de proteínas enlazadas a cromatina. LOC129121 es un gen hipotético LOC129121 que se localiza en el cromosoma 22ql2.3. Los nucleótidos 26880 hasta 28079 de la SEQ ID NO: 194 (Z82244) se alinean con LOC168550 con 79% de identidad de secuencia. LOC168550 codifica una proteína similar a la proteína pol. LOC168550 se localiza en el cromosoma 7q36.1. Los nucleótidos 26774 hasta 28057 de la SEQ ID NO: 194 se alinean con L0C205176 con 76% de identidad de secuencia. LOC205176 se localiza en el cromosoma 2pl2. La anotación affymetrix sugiere que CPS 208 corresponde a BNIP3. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 208 también se alinea con LOC159348 con sobre 98% de identidad de secuencia. LOC159348 se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q26. 3. Además, CPS 208 se alinea con una región cromosomal en el cromosoma 14 con alrededor de 97% de identidad de secuencia. CPS 208 también tiene alrededor de 81% de identidad de secuencia con una secuencia intrón de LOC146062. LOC146062 codifica una proteína similar a la proteína FLJ00088, y se localiza en el cromosoma 15ql4. Los nucleótidos 152 hasta 1081 de la SEQ ID NO: 195 (AF002697) se alinean con una región cromosomal cercana a LOC152687 con 78% de identidad de secuencia. LOC152687 codifica una proteína similar a la proteína de dedo de zinc 91 (proteína de dedo de zinc HTF10) (HPF7) , y se localiza en el cromosoma 4pl6.3. CPS 209 corresponde a ZNF261 que codifica la proteína de dedo de zinc 261. El gen tiene la ID de ubicación: 9203, y se localiza en el cromosoma X con la ubicación citogenética reportada Xql3.1. El producto de gen contiene una porción enlazada al zinc supuesta (MYM) . CPS 210 corresponde a MYH7 que codifica miosina, polipéptido 7 pesado, músculo cardiaco, beta. El gen tiene la ID de ubicación: 4625, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14ql2. MYH7 codifica la isoforma beta (o lenta) del músculo cardiaco de miosina. Los cambios en la abundancia relativa del producto de gen MYH7 y el producto de gen ???6 (el alfa, o rápido, isoforma de cadena pesada de miosina cardiaca) se correlaciona con la velocidad de contracción del músculo cardiaco. Las mutaciones en MYH7 se asocian con cardiomiopatía hipertrófica familiar. El producto de gen MYH7 es un miembro de la familia de la proteína motor que proporciona fuerza para la contracción muscular . Los nucleótidos 432 hasta 5869 de la SEQ ID NO: 197 (M58018) se alinean con MYH6 con alrededor de 88-98% de identidad de secuencia. En particular, los nucleótidos 5741· hasta 5869 se alinean con MYH6 con 96% de identidad de secuencia. MYH6 codifica miosina, polipéptido pesado 6, músculo cardiaco, alfa (cardiomiopatía, hipertrófica 1) . Tiene una ID de ubicación: 4624, y se localiza en el cromosoma 14ql2. El alfa 6 de cadena pesada de miosina cardiaco es un miembro de la familia de proteína motor que proporciona fuerza para la contracción muscular. Varios fragmentos en los nucleótidos 432 hasta 5543 de M58018 tienen alrededor de 77- 90% de identidad de secuencia con MYH1, MYH2, MYH3, MYH4 y YH13. MYH1 codifica miosina, polipéptido pesado 1, músculo esqueletal, adulto, y tiene una ID de ubicación: 4619. YH2 codifica miosina, polipéptido pesado 2, músculo esqueletal, adulto, y tiene una ID de ¦ubicación: 4620. MYH3 codifica miosina, polipéptido pesado 3, músculo esqueletal, embriónico, y tiene una ID de ubicación: 4621. MYH4 codifica miosina, polipéptido pesado 4, músculo esqueletal, y tiene una ID de ubicación: 4622. MYH13 codifica miosina, polipéptido pesado 13, músculo esqueletal, y tiene una ID de ubicación: 8735. MYH1, YH2, MYH3 y MYH4 todas se localizan reportadamente en el cromosoma 17pl3.1. MYH13 tiene la ubicación citogenética reportada 17pl3. La miosina es la proteína contráctil principal que convierte le energía química en energía mecánica a través de la hidrólisis de ATP. La miosina es una proteína hexamérica compuesta de un par de cadenas pesadas de miosina (MYH) y dos pares de cadenas ligeras no idénticas. Las cadenas pesadas de miosina se codifican por una familia de gen múltiple. En mamíferos, se han descrito al menos 10 diferentes isoformas de cadena pesada de miosina (MYH) de células estriadas, lisas y no de músculo. Estas isoformas muestran la expresión que es espacialmente y temporalmente regulada durante el desarrollo. Las proteínas codificadas por MYH1, MYH4 y MYH13 contienen una cabeza ATPasa y dominios de extremidad tipo varilla. La cadena pesada de miosina 1 y 13 puede proporcionar fuerza para la contracción muscular, citocinasis y fagocitosis. La cadena pesada de músculo esqueletal de miosina 3 y 4 puede proporcionar fuerza para la contracción muscular. Además, los nucleótidos 1494 hasta 1654 de M58018 se alinean con MYH7B y una región cromosomal cercana a FLJ22037 con alrededor de 88-92% de identidad de secuencia. FLJ22037 codifica la protexna hipotética FLJ22037, y tiene una ID de ubicación: 84176- Se localiza en el cromosoma 7 con la ubicación citogenética reportada 7qll.2l. MYH7B codifica miosina, polipéptido pesado 7B, músculo cardiaco, beta. MYH7B tiene una ID de ubicación: 57644, y se localiza en el cromosoma 20qll.21. CPS 211 corresponde a IL1B que codifica la interleucina 1, beta. El gen tiene la ID de ubicación: 3553, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2ql4. La interleucina 1 beta puede iniciar y amplificar las respuestas inmunes e inflamatorias. CPS 212 corresponde a STXIA que codifica la sintaxina 1A (cerebro) . El gen tiene la ID de ubicación: 6804, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7qll.23. La sintaxina 1A (cerebro) puede estar involucrada en el transporte intracelular y liberación de neurotransmisor . CPS 213 corresponde a ATPASEP (ATP9B) que codifica la ATPasa tipo IV, que transporta fosfolípidos (tipo P) (supuesto) (ATPasa, Clase II, tipo 9B) . El gen tiene la ID de ubicación: 11071, y se localiza en el cromosoma 18 con la ubicación citogenética reportada 18q23. CPS 214 corresponde a CRl que codifica el receptor 1 del componente de complemento (3b/4b) , incluyendo sistema de grupo sanguíneo Knops. El gen tiene la ID de ubicación: 1378, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq32. El gen comprende los nucleótidos 2769865 hasta 2857756 del cromosoma 1. Este gen codifica una glicoproteína de membrana encontrada en células de sangre periféricas, podocitos glomerulares, y células dendríticas foliculares. La proteína codificada por el gen es un receptor para los componentes de complemento C3b y C4b y regula la actividad de la cascada del complemento. La variación en la proteína codificada es la base del sistema de grupo sanguíneo Kno s. Los dos alelos communes, F y S, difieren por 8 exones y se considera que son el resultado de un evento de transferencia inadecuado. La forma secretada de la proteína codificada presente en el plasma se ha descrito, pero su longitud natural completa no se ha determinado. La proteína codificada tiene repeticiones de consenso cortas (SCRs) . CPS 214 también se alinea con CR1L con alrededor de 93% de identidad de secuencia. CR1L codifica el receptor tipo 1 del componente de complemento (3b/4b) . Tiene una ID de ubicación: 1379, y se localiza en el cromosoma lq32.1. CPS 215 corresponde a DKFZP586M1523 que codifica la proteína DKFZP586M1523. El gen tiene la ID de ubicación: 25941, y se localiza en el cromosoma -18 con la ubicación citogenética reportada 18ql2.1.
CPS 215 también se alinea con LOC201347 con sobre 99% de identidad de secuencia. LOC201347 se localiza en un intrón de BRUN0L4 que codifica la proteína enlazada al ADN (Drosophila) , tipo bruno 4. BRU 0L4 tiene una ID de ubicación: 56853, y se localiza en el cromosoma 18 con la ubicación citogenética reportada 18gl2. CPS 216 corresponde a KRTl que codifica la queratina 1 (hiperqueratosis epidermolítica) . El gen tiene la ID de ubicación: 3848, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12ql2-ql3. La proteína codificada por este gen es un miembro de la familia del gen de queratina. Las queratinas tipo II incluyen proteínas básicas o neutrales que se configuran en pares de cadenas de queratina heterotípica coexpresadas durante la diferenciación de los tejidos epiteliales sencillos y estratificados. La citoqueratina tipo II codificada por KRTl puede expresarse en las capas espinosas y granulares de la epidermis con un miembro de la familia KRT10. Las mutaciones en los genes KRTl y KRT10 puede asociarse con eritroderma ictiosiforme congénita bulosa. Las citoqueratinas de tipo II se agrupan en la región del cromosoma 12ql2-ql3. Los nucleótidos 4076 hasta 4275 de la SEQ ID NO: 203 (M98776) tienen 87% de identidad de secuencia con KRT2A. KRT2A codifica la queratina 2A (ictiosis epidermal bulosa de Siemens) . El gen tiene la ID de ubicación: 3849, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12gll-ql3. El gen KRT2A es un miembro de la familia del gen de queratina. La proteína codificada por el gen KRT2A se expresa en la capa espinosa superior de los queratinocitos epidermales. Las mutaciones en este gen puede asociarse con eritroderma ictiosiforme congénita bulosa. La queratina 2A es un componente de filamento intermedio que puede tener un papel en la cornifícación terminal de queratinocitos epidermales. Los nucleótidos 3203 hasta 3246 de la SEQ ID NO: 203 tienen 93% de identidad de secuencia con una secuencia intrón de LOC221618 que se localiza en el cromosoma 6p21.32. CPS 217 corresponde a UNK AF070571 (EXT1) . CPS 217 se alinea a la región no traducida 3' de EXT1. EXT1 codifica exostosas (múltiple) 1, y tiene una ID de ubicación: 2131 con la ubicación citogenética reportada 8q24. Il-q2 .13. La exostosas (múltiple) 1 (EXT1) es una glicosiltransferasa de transmembrana de tipo II residente en ER involucrada en la etapa de alargado de la cadena de biosíntesis de heparan sulfato. Está involucrada en la exostosas múltiple hereditaria, un trastorno caracterizado por las excrecencias cartilaginosas cercanas a los extremos de la diafises de los huesos de las extremidades. CPS 218 corresponde a PPP3CB que codifica la proteína fosfatasa 3 (antiguamente 2B) , subunidad catalítica, isoforma beta (calcineurina A beta) . El gen tiene la ID de ubicación: 5532, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q21-q22. El producto codificado por el gen, el cual es también conocido como subunidad catalítica de proteína fosfatasa 3 regulada por calmodulina, puede regular la actividad de factores de transcripción involucrados en la transducción de señal y control del crecimiento . CPS 219 corresponde a QSCN6 que codifica la quiescina Q6. El gen tiene la ID de ubicación: 5768, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq24. La proteína codificada por el gen contiene dominios de tioredoxina y ERY1, miembros de dos familias de genes de larga duración. La expresión del gen QSCN6 se induce cuando los fibroblastos comienzan a sacar el ciclo proliferativo y entrar la quiescencia, lo que sugiere que el gen QSCN6 puede jugar un papel en la regulación del crecimiento. La quiescina Q6 tiene similitud con tioredoxinas y S. cerevisiae Ervlp. CPS 220 corresponde a PRF1 que codifica la perforina 1 (proteína formadora de poro) . El gen tiene la ID de ubicación: 5551, y se localiza en el cromosoma 10 con la ubicación citogenética reportada 10q22. La perforina 1 es una proteína que forma un canal, citolítica, y puede jugar un papel en la liberación de células hospedadoras viralmente infectadas y células de tumor. CPS 220 se localiza en la región no traducida 3' del gen.
La anotación affymetrix sugiere que CPS 221 corresponde a FCGR3B. FCGR3B codifica el fragmento Fe de IgG, receptor Illb de baja afinidad para (CD16) . El gen tiene la ID de ubicación: 2215, y se localiza en el cromosoma lq23. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 221 también se alinea con FCGR3A con sobre 97% de identidad de secuencia. FCGR3A codifica el fragmento Fe del receptor Illa de baja afinidad, IgG para (CD16) . FCGR3A tiene una ID de ubicación: 2214, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq23. El producto de gen FCGR3A es un receptor gamma Fe tipo III. Puede asociarse con la cadena zeta del complejo del receptor de célula T (CD3Z) , y es un miembro de la superfamilia de inmunoglobulina . El gen FCGR3B se localiza 3 ' al gen FCGR3A en el cromosoma 1. CPS 222 corresponde a PTGS2 que codifica la prostaglandin-endoperóxido sintasa 2 (prostaglandina G/H sintasa y ciclooxigenasa) . El gen tiene la ID de ubicación: 5743, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq25.2-q25.3. La prostaglandina- endoperóxido sintasa. (PTGS) , también conocida - como ciclooxigenasa, es una enzima clave en la biosíntesis de prostaglandina, y actúa tanto como una dioxigenasa y como una peroxidasa. Hay dos isozimas de PTGS: una PTGS1 constitutiva y una PTGS2 inducible. Las dos isofarmas difieren en su regulación de la expresión y distribución de tejido. El gen PTGS2 codifica la proteína PTGS2 , la cual muestra 86-89% de identidad de secuencia de aminoácidos con proteínas PTGS2 de ratón, rata, oveja, bovino, caballo y conjeo. El gen PTGS2 humano aparece para expresarse en un número limitado de tipos de células y regularse por eventos estimuladores específicos, lo que sugiere que puede ser responsables para la biosíntesis prostanoide involucrada en la inflamación y mitogénesis. La expresión del gen PTGS2 puede desregularse en tumores epiteliales. La proteína PTGS2 puede regular la angiogénesis y migración celular, y catalizar la etapa limitada por la velocidad en la formación de prostaglandinas inflamatorias. CPS 223 corresponde a 0PHN1 que codifica oligofrenina 1. El gen tiene la ID ' de ubicación: 4983, y se localiza en el cromosoma X con la ubicación citogenética reportada Xql2. Oligofrenina 1 tiene al menos 25 exones y puede codificar una proteína activadora de la Rho-GTPasa. Las proteínas Rho son importantes mediadores de la transducción de señal intracelular que afecta la migración celular y la morfogénesis celular. Las mutaciones en el gen 0PHN1 pueden ser responsables para el retraso mental no específico ligado a X. Los nucleótidos 2971 hasta 3363 de la SEQ ID NO: 210 (AJ001189) tienen 84% de identidad de secuencia con una secuencia intrón del gen supuesto L0C200861 que se localiza en el cromosoma 3p24. 1.
CPS 224 corresponde a VSNL1 que . codifica visinina similar 1. El gen tiene la ID de ubicación: 7447, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2p24.3. la proteína similar a visinina 1 puede enlazar al calcio. La proteína es similar a Vsnll rata. CPS 225 corresponde a FECH que codifica ferroquelatasa (protoporfiria) . El gen tiene la ID de ubicación: 2235, y se localiza en el cromosoma 18 con la ubicación citogenética reportada 18q21.3. Ferroquelatasa se localiza hasta la mitocondria en donde se cataliza la inserción de la forma ferrosa del hierro en la protoporfirina IX en la trayectoria de síntesis heme. Los defectos en la ferroquelatasa se asocian con protoporfiria. CPS 225 se localiza en la región no traducida 3' del gen. SEQ ID NO: 282 (DO0726) también se alinea a FECH con más del 97% de identidad de secuencia, y puede usarse para diseñar sondas para detectar el nivel de expresión de FECH. Los nucleótidos 167 hasta .1972 de la SEQ ID NO: 282 tienen 82-84% de identidad de secuencia con LOC205467. LOC205467 es el gen supuesto, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p22.1. CPS 226 corresponde a KIAA0483 que codifica IAA0483 proteína. El gen tiene la ID de ubicación: 23219, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lq41. CPS 227 corresponde a ??3 que codifica hexocinasa 3 (glóbulo blanco) . El gen tiene la ID de ubicación: 3101, y se localiza en el cromosoma 5 con la ubicación citogenética reportada 5q35.2. Hexocinasas fosforilato glucosa hasta producir glucosa-6-fosf to, comprome iendo asi la glucosa hasta la trayectoria glicolítica. El gen HK3 codifica hexocinasa 3 que es similar a hexocinasas 1 y 2. Hexocinasa 3 es una enzima alostérica y se puede inhibir por su producto glucosa- 6 -fosfato. CPS 228 corresponde a MS4A3 que codifica los 4 dominios de cobertura de membrana, subfamilia A, miembro 3 (específico de células hematopoyéticas) . El gen tiene la ID de ubicación: 932, y se localiza en el cromosoma 11 con la ubicación citogenética reportada 1 Iql2-ql3.1. El producto de gen tiene baja similitud con CD20 y la subunidad beta de FCER1B. Contiene cuatro dominios de cobertura de membrana predichos, y puede jugar un papel en transducción de señal . CPS 229 corresponde a SCYA20 que codifica la subfamilia A de citocina inducible pequeña (Cys-Cys) , miembro 20. El -gen tiene la ID de ubicación: 6364, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2q33-q37. El producto de gen Citocina A20 (éxodo) es un factor quimiotáctico para linfocitos, pero no un factor quimiotáctico para monocitos. CPS 230 corresponde a C1QR1 que codifica el componente de complemento 1, subcomponente q, receptor 1. El gen tiene la ID de -ubicación: 22918, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20pll.21. Este gen codifica a una proteína tipo I de membrana. La proteína codificada actúa como un receptor para la proteína del complemento Clq, lectina de enlace a la mañosa, y proteína A tensoactiva pulmonar. La proteína es un receptor funcional involucrado in la mejora mediada . por ligandos de la fagocitosis. Puede jugar un papel en la destrucción fagocítica de patógenos y complejos inmunes. CPS 230 también se alinea con una región cromosomal cercana al gen supuesto LOC200421 con alrededor de 99% de identidad de secuencia. LOC200421 tiene la ubicación citogenética reportada 2pl2. CPS 231 corresponde a POU1F1 que codifica el dominio POU, clase 1, factor de transcripción 1 (Pitl, factor de hormona del crecimiento 1) . El gen tiene la ID de ubicación: 5449, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3pll. El producto de gen, también conocido como factor de transcripción 1 del homeodominio POU, puede regular los genes PRL, GH y TSH. CPS 232 corresponde a TKTLl que codifica el similar 1 de transcetolasa . El gen tiene la ID de ubicación: 8277, y se localiza en el cromosoma X con la ubicación citogenética reportada Xq28. la transcetolasa 1 es una enzima dependiente de tiamina pirofosfato en la trayectoria de la fosfato pentosa . CPS 234 corresponde a CCNT2 que codifica ciclina T2. El gen tiene la ID de ubicación: 905, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2gl4. 3. La protelna codificada por este gen pertenece a una familia altamente conservada de ciclina, cuyos miembros se caracterizan por una periodicidad dramática en abundancia de proteínas a través del ciclo celular. Las ciclinas funcionan como reguladores de las COK cinasas . Diferentes ciclinas muestran patrones de expresión y degradación diferentes que contribuyen a la coordinación temporal de cada evento mitótico. La ciclina T2 y su compañero la cinasa CDK9 se encontraron para ser las subunidades del factor de elongación de la transcripción p-TEFb . El complejo p-TEFb que contiene ciclina T2 se reportó que interactúa con, y actúa como un regulador negativo del virus de inmunodeficiencia humana tipo 1 (VIH-1) , protelna Tat . Al menos se han descrito dos variantes de transcrito alternativamente empalmadas, que codifican distintas isoformas. Los nucleótidos 261 hasta 723 y 936 hasta 1349 de la SEQ ID NO: 220 (AF048732) tienen alrededor de 88% de identidad de secuencia para una región crcmosomal en el cromosoma 1. CPS 235 corresponde a ATP6V1H que codifica ATPasa, transportador de H+ , subunidad H lisosomal 50/57kD VI. El gen tiene la ID de ubicación: 51606, y se localiza en el cromosoma 8 con la ubicación citogenetica reportada 8p22-q22.3. El polipéptido codificado por el gen también se conoce como CGI-11 proteína [H . sapiens] . Un intrón del gen ATP6V1H incluye el gen RGS20. RGS20 codifica al regulador de la proteína G señalización 20, y tiene una ID de ubicación: 8601. CPS 236 corresponde a FN1 que codifica fibronectina 1. El gen tiene la ID de ubicación: 2335, y se localiza en el cromosoma 2 con la ubicación citogenetica reportada 2g34. Fibronectina es una glicoproteína presente en una forma dimérica soluble en plasma, y en una forma dimérica o multimérica en la superficie celular y en la matriz extracelular. La fibronectina está involucrada en adhesión celular y procesos de migración incluyendo embriogénesis, cicatrización de heridas, coagulación sanguínea, defensa de hospedador, y metástasis. El gen FN1 tiene tres regiones sujetas al empalme alternativo, con el potencial para producir 20 diferentes variantes de transcrito. CPS 237 corresponde a UNK04178 que se localiza en un intrón of HEXA. HEXA codifica hexosaminidasa A (alfa polipéptido) . HEXA tiene una ID de ubicación: 3073, y se localiza en el cromosoma 15 con la ubicación citogenética reportada 15q23-q24. La hexosaminidasa A is la subunidad alfa de la enzima lísosomal de beta-hexosaminidasa la cual, junto con la proteína activadora del cofactor GM2 , cataliza la degradación del gangliósido GM2 , y otras moléculas que contienen N-acetil hexosaminas terminales. La beta-hexosaminidasa está compuesta de dos subunidades, alfa y beta, que se codifican por genes separados. Amabas subunidades beta y alfa de beta-hexosaminidasa son miembros de la familia 20 de glicosil hidrolasas. Las mutaciones en los genes de la subunidad alfa o beta pueden conducir a una acumulación de gangliósido GM2 en neuronas y trastornos neurodegenerativas denominados los gangliosidosos G 2. Las mutaciones de genes de la subunidad alfa pueden llevar a la enfermedad de Tay-Sachs (G 2-gangliosidosis tipo 1) . La región cromosomal que alinea a CPS 237 se localiza en un intrón de HEXA. CPS 237 también se alinea con LOC145709 que es un gen hipotético soportado por J04178. LOC145709 tiene la ubicación citogenética reportada 15q22.32. CPS '239 corresponde a NR2C1 que codifica la subfamilia del receptor nuclear 2, grupo C, miembro 1. El gen tiene la ID de ubicación: 7181, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12q21.32-q21.33. El producto de gen puede existir en isoformas múltiples con diferentes dominios de enlace al ligando. CPS 240 corresponde a RASSF2 > (KIAA0168) que codifica la familia 2 del dominio de asociación (RalGDS/AF-6) . El gen tiene la ID de ubicación: 9770, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20pter-pl2. 1. El nombre alternativo para este producto de gen es la proteína ????0168. CPS 241 corresponde a IL6 que codifica interleucina 6 (interferón, beta 2) . El gen tiene la ID de ubicación: 3569, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7p21. Interleucina 6 (interferón-beta 2) puede inducir la maduración de las células B en las células que secretan inmunoglobulina . CPS 242 corresponde a KIAA0372 que codifica el producto de genes KIAA0372. El gen tiene la ID de ubicación: 9652, y se localiza en el cromosoma 5 con la ubicación citogenética reportada 5q21. l-q21.2. CPS 243 corresponde a CYP4F2 que codifica citocromo P450, subfamilia IVF, polipéptido 2. El gen tiene la ID de ubicación: 8529, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pter-pl3. 11. Este gen codifica un miembro de la superfamilia del citocromo P450 de enzimas. Las proteínas del citocromo P450 son monooxigenasas que catalizan muchas reacciones involucradas en el metabolismo de fármacos y síntesis de colesterol, esteroides y otros lípidos. Las proteínas del citocromo P450 localizan hasta el retículo endoplásmico . Pueden iniciar el proceso de inactivación y degradación de leucotrieno B , un mediador potente de inflamación. El gen CYP4F2 es parte de un agrupamiento de genes de citocromo P450 en el cromosoma 19. otro miembro de esta familia, CYP4F11, está a aproximadamente 16 kb de distancia. CPS 243 también se alinea con CYP4F3 con alrededor de 97% de identidad de secuencia. CYP4F3 codifica el citocromo P450, subfamilia IVF, polipéptido 3 (leucotrieno -B4 omega hidroxilasa) . Tiene una ID de ubicación: 4051, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.2. CYP4F3 codifica un miembro de la superf milia de enzimas del citocromo P450. Este gen también es parte de un agrupamiento de genes de citocromo P450 en el cromosoma 19. Otro miembro de esta familia, CYP4F8, está a aproximadamente 18 kb de distancia. El producto del gen CYP4F3 puede convertir leucotrieno B4 en el 20-hidroxi-leucotrieno B4. Diversos fragmentos en los nucleótidos 253 hasta 1639 de U02388 (SEQ ID NO: 228) se alinean a varios genes con alrededor de 83-93% de identidad de secuencia. Estos genes incluyen LOC126538, LOC126537, LOC126407, CYP4F12 , y CYP4F8. LOC126538 y LOC126537 codifican proteínas similares a citocromo P450, subfamilia IVF, polipéptido 2 (leucotrieno B4 omega-hidroxilasa) (leucotrieno-B4 20-monooxigenasa) . Ambos genes se localizan en cromosoma 19pl3.12. LOC126407 codifica una proteína similar a citocromo P450, y se localiza en el cromosoma 19. CYP4F12 codifica citocromo P450, subfamilia IVF, polipéptido 12. CYP4F12 tiene una ID de ubicación: 66002. CYP4F8 codifica citocromo P450, subfamilia IVF, polipéptido 8, y tiene una ID de ubicación: 11283. Los nucleótidos 446 hasta 1457 de la SEQ ID NO: 228 (U02388) también se alinean con una región cromosomal entre las secuencias de codificación de LOC222275 y CYP4F11. L0C222275 codifica una proteína similar a la polimerasa de ARN de la mitocondria, y tiene la ubicación citogenética reportada 19pl3.12. CYP4F11 codifica citocromo P450, subfamilia IVF, polipéptido 11, y tiene una ID de ubicación: 57834. CYP4F11 tiene la ubicación citogenética reportada 19pl3. 1. CPS 244 corresponde a STIPl que codifica fosfoproteína 1 inducida por la tensión (proteína organizadora de Hsp70/Hsp90) . El gen tiene la ID de ubicación: 10963, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llgl3. Los nucleótidos 1 hasta 1086 de la SEQ ID NO: 229 (M86752) tienen 100% de identidad de secuencia con STIPl. STIPl codifica la fosfoproteína 1 inducida por la tensión (proteína que organiza Hsp70/Hsp90) . El gen tiene la ID de ubicación: 10963, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llql3. El producto de gen es similar a Stilp de S . cerevisiae , y tiene repeticiones TPR. El alineado de secuencia entre los nucleótidos 1 hasta 1086 de M8S752 y STTP1 se localizan en un intrón del gen supuesto LRP16. LRP16 codifica la proteína LRP16, y tiene una ID de ubicación: 28992. LRP 16 tiene la ubicación citogenética reportada llqll. El producto de gen LRP 16 contiene una región que tiene baja similitud con la familia de histona H2A. Los nucleótidos 69 hasta 1086 de la SEQ ID NO: 229 tienen sobre 99% de identidad de secuencia con una región cromosomal entre las secuencias de codificación de NAALADASEL y LOC220489. NA7ALADASEL codifica la tipo dipeptidasa acida enlazada a alfa N-acetilada (ILEAL DIPEPTIDILPEPTIDASA) , y tiene una ID de ubicación: 10004. LOC220489 codifica una proteína similar a la fosfoproteína 1 inducida por tensión. Por otro lado, CPS 244 se alinea con LOC170030 y una región cercana a LOC121392 con 85-93% de identidad de secuencia. LOC170030 codifica una proteína similar a la proteína sensible a la transformación IEF SSP 3521 (humana) . Se localiza en el cromosoma Xq21.1. LOC121392 codifica una proteína similar al complejo 2 de queratina, gen 6g. Se localiza en el cromosoma 12ql2. CPS 245 corresponde a SERPINH2 (CBP2) que codifica el inhibidor de serina (o cisteína) proteinasa, clase H (proteína de choque de calor 47), miembro 2. El gen tiene la ID de ubicación: 872, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llql3. . El producto de gen también se conoce como proteína 2 enlazada al colágeno o coligen 2. Es una proteína enlazada al colágeno que actúa como una proteína de choque de calor. CPS 245 también se alinea con LOC158172 con alrededor de 91% de identidad de secuencia. LOC158172 codifica una proteína similar al precursor de proteína 2 enlazada al colágeno (coligina 2) (antígeno relacionado con la artritis reumatoide RA-A47) . LOC158172 se localiza en el cromosoma 9pll.2. CPS 247 corresponde a NCF1 que codifica el factor neutrofil citosólico 1 (47kD, enfermedad granulomatosa crónica, autosomal 1) . El gen tiene la ID de ubicación: 4687, y se localiza en el cromosoma 7 con la ubicación citogenetica reportada 7qll.23. NCF1 codifica el factor citosólico neutrófilo lia subunidad citosólica de 47 kilodaltones del complejo multi-proteína conocido como NADPH oxidasa encontrado en neutrófilos. Esta oxidasa produce una explosión de superóxido que se suministra al lumen de la neutrófilo fagosoma. Las mutaciones en NCF1 , así como en otras subunidades de NADPH oxidasa, pueden resultar en enfermedad granulomatosa crónica. CPS 247 también se alinea con LOC220830 con más de 95% de identidad de secuencia. LOC220830 codifica una proteína similar al factor 1 neutrófilo citosólico (47kD, enfermedad granulomatosa crónica, autosomal 1) . LOC220830 se localiza en el cromosoma 7 con la ubicación citogenetica reportada 7pl3.
La anotación affymetrix sugiere que CPS 248 corresponde a CH 2. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que CPS 248 también se alinea a la región no traducida 3 ' de LOC222172 con 99% de identidad de secuencia. LOC222172 codifica la beta-quimarina (Beta-quimerina) . El gen se localiza en el cromosoma 7 con la ubicación citogenética reportada 7p21. l-pl5.3. Los nucleótidos 456 hasta 2446 de la SEQ ID NO: 284 (U07223) se alinean con L0C222172 con más de 97% de identidad de secuencia. Los nucleótidos 4 hasta 473 de la SEQ ID NO: 284 (U07223) tienen 97% de identidad de secuencia con GFAP. GFAP codifica la proteína acida glial fibrilar. Tiene una ID de ubicación: 2670, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q21. La proteína acida Glial fibrilar es una proteína de un filamento intermedio. CPS 249 corresponde a ABL1 que codifica el homólogo 1 del oncogen viral de leucemia murina v-abl Abelson. El gen tiene la ID de ubicación: 25, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9q34.1. El protooncogen 7ABL1 codifica una proteína citoplásmica y nuclear de tirosina cinasa que está implicada en procesos de diferenciación celular, división celular, adhesión celular, y respuesta a tensión. La actividad de la proteína ABL1 está negativamente regulada por su dominio SH3 , y la eliminación del dominio SH3 cambia a ABL1 en un oncogen. La transubicación t(9;22) resulta en la fusión de cabeza a cola del BCR (MIM: 151410) y los genes ABL1 presentes en muchos casos de la leucemia mielógeno crónica. La actividad de enlace de ADN de la ABL1 tirosina cinasa ubicuamente expresada se regula por la fosforilación mediada por CDC2, lo que sugiere una función del ciclo celular para ABL1. El gen ABL1 puede expresarse como un transcrito de ARNm de 6- o 7-kb, con primeros exones alternativamente empalmados hasta los exones comunes 2-11. CPS 250 corresponde a FL0T1 que codifica flotilina 1. El gen tiene la ID de ubicación: 10211, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6p21.3. Los Caveolos son dominios pequeños en la membrana celular interna involucrados in el tráfico vesicular y transducción de señal. FLOT1 codifica una proteina de membrana integral asociada a los caveolos. La función de la flotilina 1 no ha sido determinada. La flotilina 1 es similar a una flotilina murina (Mm. 2931) . CPS 250 también se alinea a una secuencia intrón de LOC203011 con alrededor de 91% de identidad de secuencia. LOC203011 se localiza en el cromosoma 8q23.3. CPS 251 corresponde a REV3L que codifica la subunidad catalítica tipo REV3 de ADN polimerasa zeta (levadura) . El gen tiene la ID de ubicación: 5980, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6q21. La subunidad catalítica de ADN polimerasa zeta actúa en la replicación de la traducción, y puede estar involucrada en mutagénesis . La anotación affymetrix sugiere que CPS 252 corresponde a MUC3 que codifica mucina 3, intestinal. El gen tiene la ID de ubicación: 4584, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7q22. CPS 253 corresponde a SMA CA4 que codifica el regulador dependiente de la actina, asociada a matriz relacionado con S I/SNF de cromatina, subfamilia a, miembro 4. El gen tiene la ID de ubicación: 6597, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19pl3.2. La proteína codificada por este gen es un miembro de la familia SWI/SNF de proteínas y es similar a la. proteína brahma de Drosophila. Miembros de esta familia tienen actividades de helicasa y ATPasa y se cree que regulan la transcripción de ciertos genes al alterar la estructura de cromatina alrededor de estos genes. La proteína codificada es parte del complejo SNF/SWI de remodelación de cromaina dependiente de ATP grande, que se requiere para la activación transcripcional de genes normalmente reprimidos por la cromatina. Además, la proteína codificada puede enlazar a BRCA1, así como regular la expresión de la proteína tumorigénica CD44. _ Los transcritos alternativamente empalmados se han encontrado para este gen. Los nucleótidos 2063 hasta 2094 de la SEQ ID NO: 238 (U29175) tienen 100% de identidad de secuencia con diversas regiones en el genoma humano. Estas regiones incluyen LOC203511, que se localiza en el cromosoma Xp22.31, y una región croraosomal cercana a LOC200164 en el cromosoma 1. CPS 254 corresponde a LOC92684 que codifica el gen hipotético soportado por AF035314. El gen se localiza en el cromosoma 20 con la ubicación citogenética reportada 20pll.21. El alineado de secuencia entre CPS 254 y LOC92684 se localiza en un intrón de C20orfl9. C20orfl9 se refiere al cromosoma 20, estructura de lectura abierta 19. Tiene una ID de ubicación: 55857, y se localiza frecuentemente en el cromosoma 20pter-ql 1.23. CPS 255 corresponde a EEF1A2 que codifica el factor 1 alfa 2 de alargamiento de la traducción eucariótica. El gen tiene la ID de ubicación: 1917, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20ql3. 3. El producto de gen tiene un sitio de enlace de guanina nucleótido, y puede estar involucrado en el enlace de aminoacil-ARNt a la ribosoma durante la síntesis de péptidos.
CPS 256 corresponde a BRF2 (ZFP36L2) que codifica la proteína de extensión de zinc 36, similar al tipo 2 de C3H. El gen tiene la ID de ubicación: 678, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2p22.3-p21. Este gen es un miembro de la familia TIS11 de genes de respuesta temprana. Los miembros de la familia se inducen por diversos agonistas tales como el forbol éster TPA y el polipéptido mitógeno EGF. La proteína codificada por este gen contiene a un dominio de extensión de zinc supuesto y diferenciado con una porción de repetición cys-his. La proteína codificada es un factor de transcripción nuclear supuesto, y puede funcionar en regular la respuesta a los factores de crecimiento. El alineado de secuencia entre CPS 256 y BRF2 traslapa LOC151103 y LOC165204. Los nucleótidos 3862 hasta 4187 y 4238 hasta 4907 de la SEQ ID NO: 286 tienen 84- 86% de identidad de secuencia para una región cromosomal cercana a LOC143974. LOC143974 se localiza en el cromosoma llpl4.1. Los nucleótidos 5004 hasta 5497 de la SEQ ID NO: 286 alinean a una secuencia intrón de IAA1301 con 82% de identidad de secuencia. KIAA1301 codifica KIAA1301 proteína, y se localiza en el cromosoma 2q33. 1. CPS 257 corresponde a SNRPG que codifica el polipéptido G de ribonucleoproteina nuclear pequeña. El gen tiene la ID de ubicación: 6637, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2pl2. El producto de gen también se conoce como proteína G de núcleo Sm asociada con el AR sn de empalme- somal , y puede estar involucrada en la biogénesis de los snRNPs . CPS 257, o fragmentos del mismo, también se alinea a diversas regiones o genes con alrededor de 95-96% de identidad de secuencia. Estas regiones o genes incluyen una región cromosomal entre LOC162681 y LOC125307, una secuencia intrón de RGS19IP1, una secuencia intrón de FLJ10748, una región cromosomal cercana a S D3, POLE2 , y una secuencia intrón de OPTN. Ambos LOC162681 y LOC125307 tienen la ubicación citogenética reportada 18q2.1. 2. RGS19IP1 codifica el regulador de la prote'lna 1 de interacción con la señalización 19 de la proteína G, y tiene una ID de ubicación: 10755. RGS19IP1 se localiza en el cromosoma 19 con ubicación citogenética reportada 19pl3.1. FLJ10748 codifica la proteína hipotética FLJ10748, y se localiza frecuentemente en el cromosoma lq31.2. SKD3 codifica al supresor del defecto 3 de transporte de potasio. Tiene una ID de ubicación: 81570 y la ubicación citogenética reportada llql3.3. POLE2 codifica la polimerasa (dirigida al ADN) , epsilon 2 (subunidad p59) , y tiene una ID de ubicación: 5427. Se localiza en el cromosoma 14q21-q22. OPTN codifica la optineurina, y tiene una ID de ubicación: 10133. OPTN se localiza en el cromosoma 10pl2.33. Además, fragmentos de CPS 257 se alinean a diversas regiones o genes con alrededor de 85-92% de identidad de secuencia. Estas regiones o genes incluyen una región cromosomal cercana a LOC164917, una región localizada 5' a ABCA5, una secuencia intrón de KIAA1170, y regiones cromosomales cercanas a SPG3A, LOC201203, LOC205322, LOC203775 y ERG, respectivamente. LOC164917 se localiza en el cromosoma 2ql2.2. ABCA5 codifica el cásete de enlace a ATP, sub-familia A (ABC1) , miembro 5. ABCA5 tiene una ID de ubicación: 23461, y se localiza en el cromosoma 17q24.3. KIAA1170 codifica KIAA1170 proteína, y se localiza en el cromosoma 7q31.1. SPG3A codifica la paraplejia 3A espástica (autosomal dominante) . SPG3A tiene una ID de ubicación: 51062, y se localiza en el cromosoma 14q21.3. LOC201203, LOC205322, LOC203775 y ERG se localizan en cromosoma 17q22, 2p23.3 , 10q26.2 y 21q22.3, respectivamente. LOC203775 codifica una proteína similar a una proteína 4 de un grupo de alta movilidad (HMG-4) (proteína 2a de un grupo de alta movilidad) (H G-2a) . ERG codifica el oncogen similar E26 de eritrobalstosis v-ets (aves) , y tiene una ID de ubicación: 2078. CPS 258 corresponde a UMA1 que codifica la proteína 1 del aparato mitótico nuclear. El gen tiene la ID de ubicación: 4926, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llq!3. El producto de gen es un componente estructural del núcleo. Contiene un dominio predicho de serpentín enrollado, y se predice para tener un papel en el reensamble nuclear en la mitosis tardía. CPS 259 corresponde a AKR1B1 que codifica aldo-ceto reductasa familia 1, miembro Bl (aldosa reductasa) . El gen tiene la ID de ubicación: 231, y se localiza en el cromosoma 7 con la ubicación citogenética reportada 7q35. El producto de gen también se conoce como aldo-ceto reductasa 1B1 (aldosa reductasa, aldehido deshidrogenasa) . Puede reducir la glucosa y otros substratos que contienen carbonilo. El producto de gen es un miembro de la superfamilia de la aldo-ceto reductasa dependiente de NADPH. Fragmentos de la- SEQ ID NO: 289 se alinea a otros genes o regiones con alrededor de 83- 92% de identidad de secuencia. Estos genes o regiones incluyen LOC126242, L0C163862, LOC131710, LOC145401, LOC170139, LOC125836, y una región cromosomal cercana a LOC220082. LOC126242 codifica una proteína similar a aldosa reductasa (AR) (aldehido reductasa), y se localiza en el cromosoma 19ql3.12. LOC163862 también codifica una proteína similar a aldosa reductasa. Se localiza en el cromosoma lq41. LOC131710 y LOC125836 codifican proteínas similares a aldosa reductasa (E.C.1.1.1.21) (Mutante con Tyr 48 Reemplazado por His (Y48h) formando complejos con Nadp+ y Citrato) , y se localizan en cromosoma 3pl3 y 18pll.21, respectivamente. LOC145401 codifica una proteína similar a la familia de la aldo-ceto reductasa, miembro Bl (aldosa reductasa) . LOC145401 se localiza en el cromosoma 14q22.3. LOC170139 se localiza en el cromosoma Xq23, y codifica una proteína similar a aldose reductasa (AR) (aldehido reductasa). LOC220082.se localiza en el cromosoma 13ql4.11.
CPS 260 corresponde a SMARCE1 que codifica el regulador dependiente de la actina, asociado con la matriz, relacionado con SWI/SNF de cromatina, subfamilia e, miembro 1. El gen tiene la ID de ubicación: 6605, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q21. 1. La proteína codificada por este gen es parte del complejo SWI/SNF de remodelación de cromatina dependiente de la ATP grande, que se require para la activación transcripcional de genes normalmente reprimidos por cromatina. La proteína codificada, ya sea sola o cuando está en el complejo SWI/SNF, puede unirse a un ADN de unión de 4 vías, el cual se piensa que imita la topología del ADN cuando entra o sale del nucleosoma. La proteína codificada contiene un dominio de HMG de enlace al ADN, pero la fragmentación de este dominio no elimina las actividades de desplazamiento del nucleosoma o de enlace al ADN del complejo SWI/SNF. El complejo SNF/SWI se asocia con la matriz nuclear y está implicado en la regulación de la transcripción al afectar la estructura de la cromatina . SEQ ID NO: 290 se alinea hasta SMARCE1 con más del 98% de identidad de secuencia y por lo tanto, se puede usar hasta preparar sondas dirigidas a SMARCE1. Los nucleótidos 10 hasta 1377 de- la SEQ ID NO: 290 (AF035262) también muestran alrededor de 90-94% de identidad de secuencia con LOC160863, LOC145357 y LOC134699. Todos estos tres genes supuestos codifican proteínas similares a Regulador dependiente de la actina, asociado a matriz, relacionado con SWI/SNF de cromatina, subfamilia e, miembro 1. LOC160863, LOC145357 y LOC134699 se localizan en cromosoma 13ql4.11, 14qll.l y 6ql6.1, respectivamente. CPS 261 corresponde a KIAA0669 que codifica el producto de genes KIAA0669. El gen tiene la ID de ubicación: 9819, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3q25. 1. La anotación affymetrix sugiere que CPS 262 corresponde a SF que codifica fusión similar de septana MLL. El gen tiene la ID de ubicación: 10301, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q25. SEQ ID NO: 292 se alinea hasta una región cromosomal en el cromosoma 17 con más del 99% de identidad de secuencia. La región incluye LOC204508, FLJ12190, LOC204512 y LOC197453. Todos estos genes tienen la ubicación citogenética reportada 17q25.3. FLJ12190 tiene una ID de ubicación: 80141. LOC197453 codifica una proteína similar una proteína hipotética SBBI23. CPS 263 corresponde a ???? que codifica protimosina, alfa (secuencia de genes 28) . El gen tiene la ID de ubicación: 5757, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2q35-q36. la protimosina alfa puede asociarse con proliferación celular. Los nucleótidos 43 hasta 1200 de la SEQ 'ID NO: 293 también se alinean a LOC220771 con 98% de identidad de secuencia. LOC220771 codifica protimosina alfa, y se localiza frecuentemente en el cromosoma 5q23.2. Además, CPS 263, o fragmentos del mismo, se alinean con LOC145123, LOC220508, una región cromosomal entre PZP y DDX12, y una secuencia intrón de TRIPll con alrededor de 94-95% de identidad de secuencia. LOC145123 se localiza en el cromosoma 13q22.3. LOC220508 codifica protimosina alfa, y se localiza en el cromosoma 12pl2. . PZP codifica la proteína de la zona de preñez, y tiene una ID de ubicación: 5858. Se localiza en el cromosoma 12pl3-pl2.2. DDX12 codifica DEAD/H (Asp-Glu-Ala-Asp/His) caja de polipéptido 12 (homólogo de helicasa similar a CHLl , S. cerevisiae) , y tiene una ID de ubicación: 1664. DDX12 se localiza en el cromosoma 12pl3. TRIPll codifica el receptor de la hormona tiroides interactor 11, y tiene una ID de ubicación: 9321. TRIPll se localiza en el cromosoma 14q31-g32. CPS 263, o fragmentos del mismo, también se alinean a otras regiones en el genoma humano con 90-95% de identidad de secuencia . CPS 264 corresponde a KIAA0410 que codifica el producto de genes KIAA0410. El gen tiene la ID de ubicación: 9818, y se localiza en el cromosoma 13 con la ubicación citogenetica reportada 13ql2.12. CPS 265 corresponde a PSMD3 que codifica proteasoma (prosoma, macrodolor) 26S subunidad, no ATPasa, 3. El gen tiene la ID de ubicación: 5709, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17ql2. CPS 266 corresponde a C1QBP que codifica el componente de complemento 1, proteína de enlace al subcomponente q. El gen tiene la ID de ubicación: 708, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17pl3. 3. El subcomponente del complemento humano Clq se asocial con Clr y Cls hasta producir el primer componente del sistema del complemento del suero. La proteína codificada por el gen - C1QBP se conoce que enlaza las cabezas globulares de las moléculas Clq e inhiben la activación Cl . Esta proteína también se ha identificado como la subunidad p32 del factor SF2 de empalme pre-ARm, así como una proteína de enlace del ácido hialurónico. Los nucleótidos 58 hasta 1071 y 107 hasta 1037 de la SEQ ID NO: 296 se alinea a C1QBPP y una secuencia intrón de RYR3 con 79-84% de identidad de secuencia. C1QBPP codifica el componente de complemento 1, proteína de enlace al subcomponente q, pseudogen. Tiene una ID de ubicación: 54098, y se localiza en el cromosoma 21q21.1. RYR3 codifica el receptor 3 de rianodina. RYR3 tiene una ID de ubicación: 6263, y se localiza en el cromosoma 15ql4-ql5. Además, los nucleótidos 1070 hasta 1227 de la SEQ ID NO: 296 se alinean a LOC221903 con 100% de identidad de secuencia. LOC221903 es un gen hipotético soportado por AF000974, BC004999, AF000974, BC021540, BC004249, AJ001902, AF025437, L40374, BC004999, AF025437, AK056773, BC002680, AK056773, BC004999, y BC002680. El gen se localiza en el cromosoma 7qll . 1. CPS 267 corresponde a 0SR1 que codifica la respuesta 1 de tensión oxidante. El gen tiene la ID de ubicación: 9943, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p22-p2i.3. El gen de respuesta 1 de tensión oxidante tiene al menos 18 exones y se localiza en la vecindad de los otros tres genes G0LGA4 , ITGA9 y HYA22. estos cuatro genes se consideran por ser candidatos para supresores de tumores . La proteína 1 de respuesta a la tensión oxidante tiene similitud con la cinasa 1 de respuesta a la tensión oxidante humana Ste20 y se piensa que está involucrada en la respuesta a la tensión oxidante. La proteína 1 de respuesta a la tensión oxidante es un miembro supuesto de la familia SOK (Ste20/cinasa de respuesta a la tensión oxidante), y se puede activar por la tensión oxidante . CPS 268 corresponde a CD44 que codifica el antxgeno CD44 (función de alojamiento y sistema del grupo de sangre de la India) . El gen tiene la ID de ubicación: 950, y se localiza en el cromosoma 11 con una ubicación citogenética reportada llpl3. CPS 269 corresponde a CRADD que codifica dominio CASP2 y RIPKl que contiene el adaptador con el dominio de muerte. El gen tiene la ID de ubicación: 8738, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12q21. 33-q23. 1. El producto de gen es una molécula adaptadora apoptótica, y puede funcionar hasta acoplar CASP2 a la proteína de interacción con el receptor FasL/TNF RIP. , CPS 270 corresponde a CCRL2 que codifica el receptor similar 2 de quimiocína (porción C-C) . El gen tiene la ID de ubicación: 9034, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3p21. Este gen codifica una proteína similar al receptor de quimiocina, la cual se predice que sea a una proteína de siete transmembranas y más cercanamente relacionada a CCR1. Las quimiocinas y sus receptores se consideran que son críticos para el reclutamiento de células inmunoefectoras al sitio de inflamación. El gen CCRL2 gene se expresa en altos niveles en los neutrofilos primarles y en los monocitos primarios, y se sobrerregula además en la activación de neutrofilos y durante la diferenciación de monocitos a macrófagos . El gen CCRL2 se mapea a la región donde se localiza el agrupamiento de genes del receptor de quimiocinas. El producto de gen es un miembro de la familia del receptor acoplado con la proteína G. CPS 271 corresponde a KIAA0707 (THEA) que codifica tioesterasa, asociado con adiposa. El gen tiene la ID de ubicación: 26027, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lp32. 2.
CPS 272 corresponde a KIAA1113 (TRI 33) que codifica la porción tripartita que contiene 33. El gen tiene la ID de ubicación: 51592, y se localiza en el cromosoma 1 con la ubicación citogenética reportada lpl3.1. La proteína codificada por este gen se piensa que es un corepresor transcripcional . La proteína codificada es un miembro de la familia de la porción tripartita. La porción tripartita incluye tres dominios de enlace al zinc, un anillo, un recuadro B del tipo 1 y un recuadro B del tipo 2 y una región de serpentín enrollado. Al menos tres variantes de transcrito alternativamente empalmados para este gen se han descrito. CPS 273 corresponde a una región cromosomal en el cromosoma 21. Esta región se refiere como UNK AL050119. La región se localiza en un intrón de TMEM1 que codifica la proteína 1 de transmembrana. TMEM1 tiene una ID de ubicación: 7109 con la ubicación citogenética reportada 21q22.3. El producto de genes . TMEM1 es similar a las proteínas del canal de sodio. CPS 274 corresponde a UNKAF052115 (LOC151405) que es un gen hipotético soportado por AF052115. El gen tiene la ubicación citogenética reportada 2q33.3. El gen LOC151405 se localiza 3' con la secuencia que codifica el polipéptido de ADA 23 que codifica el dominio de desintegrina y metaloproteinasa 23·. ADAM23 tiene una ID de ubicación: 8745, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2g33. El producto del gen ADAM23 es un miembro de la familia de proteínas ADAM. Miembros de esta familia son las proteínas ancladas de membrana estructuralmente relacionadas con las desintegrinas de veneno de serpiente, y se han implicado en una diversidad de procesos biológicos que involucran interacciones célula a célula y matriz a célula, incluyendo fertilización, desarrollo de músculos, y neurogénesis . CPS 275 corresponde a MITF que codifica el factor de transcripción asociado con microftalmia . El gen tiene la ID de ubicación: 4286, y se localiza en el cromosoma 3 con la ubicación citogenética reportada 3pl4. l-pl2.3. El producto de genes MITF contiene características estructurales de cremallera de leucina y de hélice-rizo-hélice básicas. MITF produce al menos dos transcritos alternos: la isoforma M se expresa exclusivamente en los melanocítos, y la isoforma A con un intervalo de expresión más amplio. Las mutaciones en MITF pueden llevar al síndrome Waardenburg. CPS 276 corresponde a STAT3 que codifica el transductor de señal y activador de la transcripción 3 (factor de respuesta en fase aguda) . El gen tiene la ID de ubicación: 6774, y se localiza en el cromosoma 17 con la ubicación citogenética reportada 17q21. La proteína codificada por este gen es un miembro de la proteína de familia STAT. En respuesta a las citocinas y factores del crecimiento, los miembros de la familia STAT se pueden fosforilar por las cinasas asociadas al receptor, y luego formar homo o heterodímeros que se transubican al núcleo celular en donde actúan como activadores de la transcripción. La proteína codificada por el gen STAT3 gene se puede activar a través de fosforilación en respuesta a varias citocinas y factores de crecimiento incluyendo IFNs, EGF, IL5, IL6, HGF, LIF y BMP2. La proteína codificada puede mediar la expresión de una diversidad de genes en respuesta a los estímulos celulares y así, juegan un papel en muchos procesos celulares tales como el crecimiento celular y apoptosis. La GTPasa Racl obscura ha demostrado unir y regular la actividad de esta proteína. La proteína PIAS3 es un inhibidor específico de esta proteína. Dos variantes de transcrito alternativamente empalmadas codifican distintas isoformas se han descrito. Además, los nucleótidos 16 hasta 2787 de la SEQ ID NO: 315 (L29277) tienen al menos 95% de identidad de secuencia con STAT3. Por lo tanto, SEQ ID NO: 315 (L29277) , o el complemento del mismo, puede usarse para diseñar sondas/cebadores para detectar la expresión de STAT3. Los nucleótidos 217 hasta 1502 de la SEQ ID NO: 315 (L29277) tienen al menos 98% de identidad de secuencia con LOC254114. L0C254114 codifica una proteína similar a un transductor de señal y activador de transcripción 3 (factor de respuesta en fase aguda) . LOC254114 se localiza en el cromosoma 17. CPS 277 corresponde a TPD52L2 que codifica el similar 2 a la proteina D52 de tumor. El gen tiene la ID de ubicación: 7165, y se localiza en el cromosoma 20 con la ubicación citogenética reportada 20ql3. 2-ql3. 3. El producto de gen es un miembro de la familia similar a D52 de proteínas, y puede tener un papel en el control de la proliferación celular. El producto de gen contiene dominios de serpentín enrollados. CPS 278 corresponde a una región cromosomal (referido como UNKAI732885) . Esta región cromosomal se localiza en un intrón de CG005 que codifica una proteína hipotética de la región BCRA2. CG005 tiene una ID de ubicación: 10443 con la ubicación citogenética reportada 13ql2-ql3. El producto del gen CG005 incluye una región que tiene baja similitud con la región de 2 ', 3 ' -cíclico nucleótido 3 ' -fosfodiesterasa de rata (Rn. 31762) . CPS 279 corresponde a AP3 8 que codifica la proteína cinasa cinasa cinasa 8 activada por mitógeno . El gen tiene la ID de ubicación: 1326, y se localiza en el cromosoma 10 con la ubicación citogenética reportada I0pll.2. Este gen se identificó por su actividad de transformación oncogénica en células. La proteína codificada es un miembro de la familia de la proteína cinasa de serina/treonin . Esta cinasa puede activar ambas trayectorias de la MAP cinasa y JNK cinasa. Esta cinasa se muestra que activa las IkappaB cinasas, y así induce la producción nuclear de NE-kappaB. Esta cinasa se encontró también que promueve la producción de TNF- alfa y IL-2 durante la activación de linfocitos T. Los estudios de un gen similar en la rata sugiere el involucramiento directo de esta cinasa en la proteolisis de NF-kappaBl, pl05 (NF B1) . El gen MA.P3K8 puede también utilizar un codón de partida de la traducción en la estructura en la dirección descendente, y así producir una isoforma que contiene una terminación N más corta. La isoforma más corta se ha demostrado que despliega una actividad de transformación más débil. CPS 280 corresponde a NSP-CL (RTN4) que codifica el reticulón 4. El gen tiene la ID de ubicación: 57142, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2pl4-pl3. El gen RTN4 traslapa LOC200512 en el cromosoma 2. LOC200512 codifica una proteína similar al reticulón 4. LOC200512 tiene la ubicación citogenética reportada 2pl6.1. CPS 281 corresponde a NRG1 que codifica neuregulina 1. El gen tiene la ID de ubicación: - 3084 , y se localiza en el cromosoma 8 con la ubicación citogenética reportada 8p21-pl2. Neuregulina 1 se identificó orginalmente como una glicoproteína de 44 kD que interactúa con el receptor NEU/ERBB2 receptor de tirosina cinasa para incrementar su fosforilación sobre los residuos de tirosina. Se sabe que una extraordinaria variedad de diferentes isoformas se producen del gen NRG1 gene por el empalme alternativo. Estas isoformas incluyen heregulinas (HRGs) , factores de crecimiento glial (GGFs) y factor derivado de neuronas motoras y sensoriales (SMDF) . Se expresan específicamente en tejidos y difieren significativamente en su estructura. Las isoformas HRG contienen todas dominios de immunoglobulina (Ig) y similares al factor de crecimiento epidermal (EGF) . Las isoformas GGF y GGF2 contienen una secuencia de tipo kringle más Ig y dominios del tipo EGF, y la isoforma SMDF comparte solamente el dominio similar a EGF con otras isoformas. Los receptores para todas las isoformas NRG1 son la familia ERBB de los receptores de transmembrana de tirosina cinasa. A través de la interacción con los receptores ERBB, las isoformas NRG1 pueden inducir el crecimiento y diferenciación de células epiteliales, neuronales, gliales, y otros tipos de células. CPS 282 corresponde a RAB31 que codifica RAB31, familia de oncogenes del miembro RAS. El gen tiene la ID de ubicación: 11031, y se localiza en el cromosoma 18 con la ubicación citogenética reportada 18pl 1. 3. El producto de gen es una proteína de enlace a GTP. CPS 282 también se alinea a LOC12414 y LOC200972 con 83% de identidad de secuencia. LOC124146 tiene la ubicación citogenética reportada 16qll.2, y codifica una proteína similar a la proteína Rabo de enlace a- GTP. LOC200972 se localiza en el cromosoma 3, y también codifica una proteína similar a la proteína abO de enlace a GTP . CPS 283 corresponde a MEF2D que codifica el factor 2 mejorador de la transcripción de la caja MADS, polipéptido D (factor mej orador de miocitos 2D) . El gen tiene la ID de ubicación: 4209, y se localiza en el cromosoma 1 con la ubicación citogenética reportada Iql2-q23. El producto de gen es un miembro de la familia del cuadro MADS de factores de transcripción, y puede regular genes específicos de músculos e inducibles por mitógenos. CPS 285 corresponde a CXCR4 que codifica el receptor 4 de quimiocinas (porción C-X-C) . El gen tiene la ID de ubicación: 7852, y se localiza en el cromosoma 2 con la ubicación citogenética reportada 2q21. El receptor de quimiocina CXC (fusina) es un receptor acoplado a la proteína G que puede mediar el flujo de calcio intracelular. CPS 286 corresponde a M9 que codifica el gen específico del músculo. El gen tiene la ID de ubicación: 27335, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.2. Los nucleótidos 109 hasta 858 de la SEQ ID NO: 318 tienen 88% de identidad de secuencia con LOC134505 que es similar a un gen específico del músculo. LOC134505 se localiza en el cromosoma 5 con la ubicación citogenética reportada 5ql5. Los nucleótidos 100 hasta 856 de la SEQ ID NO: 318 también se alinean a una región cromosomal en el cromosoma 4 con alrededor de 85% de identidad de secuencia. La región cromosomal abarca LOC 152771 que es similar a PRO 1474. LOC152771 tiene la ubicación citogenetica reportada 4q26. Además, los nucleótidos 140 hasta 799 de la SEQ ID NO: 318 se alinean a LOC131480 con alrededor de 84% de identidad de secuencia. LOC131480 codifica una proteína similar a PRO 1474, y tiene la ubicación citogenética reportada 3p24.1. CPS 287 corresponde a FAU que codifica el virus de sarcoma murino de Finkel-Biskis-Reilly (FBR- uSV) expresado ubicuamente (derivado fox); proteína ribosomal S30. El gen tiene la ID de ubicación: 2197, y se localiza en el cromosoma 11 con la ubicación citogenética reportada llql3. Este gen es el homólogo celular de la secuencia fox en el virus de sarcoma murino de Finkel-Biskis-Reilly (FBR-MuSV) . Codifica una proteína de fusión que consiste de la proteína fubi del tipo de la ubiquitina en la terminación N y la proteína ribosomal S30 en la terminación C. Se ha propuesto que la proteína de fusión se procese post-traduccionalmente para generar fubi libre y proteína ribosomal libre S30. Fubi es un miembro de la familia de ubiquitina, y la proteína ribosomal S30 pertenece a la familia S30E familia de las proteínas ribosomales . Los pseudogenes derivados de este gen están presentes en el genoma . SEQ ID NO: 319 también se alinea a FAUP1 con alrededor de 92% de identidad de secuencia. FAUP1 codifica el pseudogen 1 expresado ubicuamente asociado a FBR-MuSV- (derivado de fox) . El gen tiene la ID de ubicación: 140623, y se localiza en el cromosoma 18. Los nucleótidos 57 hasta 351 de la SEQ ID NO: 319 tienen alrededor de 84% de identidad de secuencia con LOC151661. LOC151661 codifica una proteína similar a la proteína de fusión ribosomal S30 similar a ubiquitina. LOC151661 tiene la ubicación citogenética reportada 3q27.2. Además, los nucleótidos 454 hasta 490 de la SEQ ID NO: 319 alinean a una secuencia intrón de RHOBTB1 con 97% de identidad de secuencia. RH0BTB1 codifica el dominio BTB relacionado con Rh que contiene 1, y tiene una ID de ubicación: 9886 con la ubicación citogenética reportada 10q22.1. CPS 288 corresponde a RPS6 que codifica la protelna ribosomal S6. El gen tiene la ID de ubicación: 6194, y se localiza en el cromosoma 9 con la ubicación citogenética reportada 9p21. Este gen codifica una proteína ribosomal citoplásmica que es un componente de la subunidad 40S en ribosoma. La proteína codificada pertenece a la familia S6E de proteínas ribosomales. Es el substrato principal de las proteína cinasas en la ribosoma, con subconjuntos de cinco residuos de serina en la terminación C fosforilados por diferentes proteína cinasas. Se reporta que la fosforilación puede ser inducida por un amplio rango de estímulos, incluyendo factores de crecimiento, agentes promotores de tumor, y mitógenos . La desfosforilación sucede con lesión del crecimiento. La proteína codificada puede contribuir al control del crecimiento y proliferación celular a través de la traducción selectiva de clases particulares de ARNm. Este gen tiene múltiples pseudogenes procesados disperses a lo largo del genoma. Los fragmentos de la SEQ ID NO: 320 se alinean a diversas regiones cromosomales con alrededor de 80-97% de identidad de secuencia. Estas regiones cromosomales incluyen, por ejemplo, LOC205865, L0C137397, LOC253482, y una secuencia intrón de GCDH. LOC205865 codifica una proteína similar a la proteína ribosomal S6. El gen tiene la ubicación citogenética reportada 4g21.22. LOC137397 codifica una proteína similar a Rim2 proteína, y se localiza en el cromosoma 8g22.3. LOC253482 codifica una proteína similar a proteína ribosomal S5, y se localiza en el cromosoma 9. GCDH codifica la glutaril-Coenzima A des idrogenasa . GCDH tiene una ID de ubicación: 2639, y se localiza en el cromosoma 19pl3. 2. CPS 289 corresponde a BAG5 que codifica el atanogen 5 asociado con BCL2. El gen tiene la ID de ubicación: 9529, y se localiza en el cromosoma 14 con la ubicación citogenética reportada 14q32.33. La proteína codificada por este gen es un miembro de la familia de proteína relacionada con BAGl. BAGl se considera que es una proteína anti-apoptótica que puede funcionar a través de las interacciones con una diversidad de proteínas relacionadas con la apoptosis y crecimiento celular incluyendo BCL-2, Raf-proteína cinasa, receptores de hormona esferoide, receptores del factor de crecimiento y miembros de la familia de la proteína de choque térmico de 70 kDa. La proteína codificada por el gen BAG5 contiene un dominio BAG cercano a i la terminación C, que puede inhibir y enlazar la actividad de acompañamiento de Hsc70/Hsp70. Los nucleótidos 3913 hasta 4117 de la SEQ ID NO: 321 muestran 82% de identidad de secuencia con una secuencia intrón de DNAH11. DNAH11 codifica dineín, axonemal, polipéptido pesado 11. El gen tiene la ID de ubicación: 8701, y según se dice se localiza en el cromosoma 7p21. CPS 290 corresponde a UNKAL022721 (RPL10A) que codifica la proteína ribosomal LlOa. RPL10A tiene una ID de ubicación: 4736, y se localiza en el cromosoma 6 con la ubicación citogenética reportada 6p21.3-p21.2. El producto de gen es un componente de la subunidad grande 60S ribosomal. CPS 290 también tiene 96% de identidad de secuencia con LOC253986' y LOC137107, ambos codifican proteínas similares a la proteína ribosomal LlOa. LOC253986 se localiza en el cromosoma 8, y LOC137107 se localiza en el cromosoma 8pll.23. Además, CPS 290 tiene alrededor de 90-96% de identidad de secuencia con secuencias de intrón de PTPRG, BST1, y ARK3. PTPRG codifica proteína tirosina fosfatasa, receptor tipo, G. PTPRG tiene una ID de ubicación: 5793, y se localiza en el cromosoma 3p21-pl4. BST1 codifica antigeno 1 de célula estromal de médula ósea, y tiene una ID de ubicación: 683 con la ubicación citogenética reportada 4pl5. MARK3 codifica la cinasa 3 reguladora de la afinidad MAP/microtúbulo, y tiene una ID de ubicación: 4140 con la ubicación citogenética reportada 14g32.3. CPS 290 se alinea hasta LOC138030 con 84% de identidad de secuencia. LOC138030 codifica una proteína similar a proteína ribosomal LlOa, y se localiza en el cromosoma 8p21.3. CPS 290 (SEQ ID NO: 329) es un producto empalmado del complemento de los nucleotidos 26623 hasta 27200 de la SEQ ID NO:322. La búsqueda Blast contra la base de datos del genoma humano Entrez muestra que SEQ ID NO: 322 tiene 100% de identidad de secuencia con una región cromosomal en el cromosoma 6. Esta región cromosomal se localiza dentro edl lugar genómico NT007592, e incluye los siguientes genes: TEAD3, RPL10A, FANCE, LOC221485, y LOC221486. TEAD3 codifica el miembro 3 de la familia del dominio TEA, y tiene una ID de ubicación: 7005. RPL10A codifica la proteína ribosomal LlOa, y tiene una ID de ubicación: 4736. FANCE codifica anemia Fanconi anemia, grupo de complementación E, y tiene una ID de ubicación: 2178. LOC221485 codifica una proteína similar a dJ109F14. 3 (proteína supuesta similar a ZNF127) . LOC221486 codifica una proteína similar al beta receptor activado por el proliferador de peroxisoma (PPAR-beta) (PPAR-delta) (receptor 1 de la hormona nuclear) (NUCI) (NUCI) . SEQ ID NO: 322 se a la hebra que codifica la proteína de TEAD3 , mientras se alinea a las hebras no codificadoras de proteínas de RPL10A, FANCE, LOC221485, y LOC22148S. Los fragmentos de la SEQ ID NO: 322 muestran varios grados de identidad de secuencia con una pluralidad de regiones cromosomales a través del genoma humano. CPS 291 corresponde a DKZP586E0820 (PKD2) que codifica proteína cinasa D2. El gen tiene la ID de ubicación: 25865, y se localiza en el cromosoma 19 con la ubicación citogenética reportada 19ql3.2. El producto de gen es similar hasta la región de isoformas mu de proteína cinasa C, y puede funcionar para mediar la interacción proteína-proteína y proteína-lípido . El producto de gen contiene un dominio de cinasa un dominio de homología de plecstrina (PH) . CPS 292 corresponde a NONO que codifica el dominio que no es POU que contiene, enlace a octámeros. El gen tiene la ID de ubicación: 4841, y se localiza en el cromosoma X con la ubicación citogenética reportada Xql3.1. El producto de gen es una proteína nuclear que contiene porciones de reconocimiento de ARN. SEQ ID NO: 324 también se alinea a LOC146455 con alrededor de 95-96% de identidad de secuencia. LOC146455 codifica una proteína similar a una proteína de enlace de ADN y ARN de 54 kDa nuclear (p54 (nrb) ) (p54nrb) (proteína nuclear de 55 kDa) (NMT55) (proteína de enlace al octámero que contiene un dominio que no es POU) (complejo de enlace al ADN P52/P100, subunidad de 52 ' kDa) . LOC146455 se localiza en el cromosoma 16q22.3. Además, los nucleótidos 514 hasta 2591 de SEQ ID NO: 324 tienen alrededor de 84-85% de identidad de secuencia con una región cromosomal que traslapa LOC130867. LOC130867 codifica una proteína similar a la proteína ribosomal S12 (40S proteína ribosomal S12) , y se localiza en el cromosoma 2pl5. CPS 293 corresponde a UNKAI743507 ( ZFR) que codifica una proteína de enlace de ARN con extensión de zinc. ZFR tiene una ID de ubicación: 51663, y se localiza en el cromosoma 5 con la ubicación citogenetica reportada 5pl3.2. CPS 293 también muestra 92% de identidad de secuencia con LOC119355 que codifica una proteína similar al homólogo de fase de fosfoproteína ; probablemente el ortólogo de la proteína Zfr de extensión de zinc de ratón. LOC119355 tiene la ubicación citogenética reportada 10q23.33. Además, CPS 293 tiene 94-96% de identidad de secuencia con una región cromosomal en el cromosoma 1. La región cromosomal está cercana a TSNAX que codifica el factor X asociado a translina y tiene una ID de ubicación: 7257 y ubicación citogenética lq42.1. Los nucleótidos 292 hasta 399 de CPS 293 tienen alrededor de 92% de identidad de secuencia con una región cromosomal en el cromosoma 1.
CPS 294 corresponde a MAPKAPK5 que codifica la proteina cinasa 5 activada por la proteína cinasa activada por mitógeno. El gen tiene la ID de ubicación: 8550, y se localiza en el cromosoma 12 con la ubicación citogenética reportada 12q24.12. La proteína codificada por este gen es un miembro de la familia de serina/treonina cinasa. En respuesta a la tensión celular y las citocinas proinflamatorias , esta cinasa puede ser activada a través de su fosforilación por las MAP cinasas incluyendo MAPKl/ERK, MAPK14/p38 -alfa , y MAPKll/p38 -beta . Al menos dos variantes de transcrito alternativamente empalmadas de este gen que codifican distintas isoformas se han reportado. CPS 295 corresponde a UNK U79297 (LOC157567) que codifica una proteína similar a una proteína hipotética MGC25673. LOC157567 según se dice se localiza en el cromosoma 8q23.1. La importancia de los genes de enfermedades enlistados en la tabla 4 se puede estimar usando una métrica de separación de clases relativa de acuerdo con la clasificación supervisada de RCC contra libre de enfermedad. Ver Golub et al., Science, 286: 531-537 (1999) y Slonim et al-, Procs. De la Cuarta Conferencia Anual Internacional en Biología Molecular Computacional , Tokio, Japón, Abril 8-11, p263-272 (2000). Se puede luego efectuar un análisis de vecindad para determinar la importancia de las correlaciones medidas. Por ejemplo, este método puede permutar aleatoriamente las 65 muestras totales (45 pacientes con RCC y 20 humanos libres de la enfermedad) en dos grupos de 45 y 20 muestras cada uno y luego clasificar los genes con las medidas más elevadas de correlación en los 100 conjuntos aleatorios de muestras. Este análisis muestra que una mayoría de los genes de la enfermedad RCC identificados en la presente invención poseen medidas o correlación arriba del 1% del nivel importante comparado con los vectores de clase aleatoriamente permutada. Los mecanismos biológicos que subyacen a los patrones de expresión diferencial de los genes de la enfermedad RCC en la sangre periférica no están completamente entendidos. Los patrones de expresión diferencial se pueden atribuir a los patrones de expresión de genes alterados en células de tumor RCC fragmentadas en la sangre periférica. Por ejemplo, la tabla 5 muestra que un subcon unto de los genes de enfermedades RCC también se expresan diferencialmente en las células de tumor RCC en comparación con los PBMC de los humanos libres de enfermedad. El patrón de expresión difexencial también se puede provocar por las reacciones inmunogénicas inducidas por los . tumores RCC. En un experimento, se aislan las células mononucleares de sangre periférica de humanos libres de enfermedad y luego se tratan con fitohemaglutinina (PHA) . La estimulación PHA ex vivo parece recapitular el patrón de expresión diferencial de un número importante de genes de enfermedad RCC de esta invención, como se ilustra en la tabla 5. Esto sugiere que los patrones de expresión diferencial de algunos genes de enfermedades de RCC en la sangre periférica pueden resultar de la activación de leucocitos in vivo. La tabla 5 identifica además un subconjunto substancial de genes de enfermedad RCC que se expresan diferencialmente en pacientes con insuficiencia renal en etapa terminal. Por lo tanto, los patrones de expresión diferencial de este subconjunto de genes de enfermedad RCC en la sangre periférica puede deberse a alteraciones en los leucocitos en respuesta a la disfunción renal en pacientes con RCC.
Tabla 5. Genes de enfermedad RCC expresados diferencialmente bajo otras condiciones Gen de No. de acceso Expresados diferencialmente en : enfermedad RCC Entrez (comparado con PBMCs sin enfermedad IL1R1 M27492 PBMCs estimulados por PHA Ex vivo CSF2 M13207 PBMCs estimulados por PHA Ex vivo IL1B PBMCs estimulados por PHA Ex vivo Tubulin, Beta AF141349 PBMCs estimulados por PHA Ex vivo BASP1 AA135683 PBMCs estimulados por PHA Ex vivo SIAH2 U76248 PBMCs estimulados por PHA Ex vivo GSPT1 X17644 PBMCs estimulados por PHA Ex vivo SCYA2 M28225 PBMCs estimulados por PHA Ex vivo BCL2L1 Z23115 PBMCs estimulados por PHA Ex vivo Gen de No. de acceso Expresados diferencialmente en: enfermedad RCC Entrez (comparado con PBMCs sin en ermedad BAG1 Z35491 PBMCs estimulados por PHA Ex vivo PAI2 Y00630 PBMCs estimulados por PHA Ex vivo PDG X82460 PBMCs estimulados por PHA Ex vivo CTSL X12451 PBMCs estimulados por PHA Ex vivo IL6 X04430 PBMCs estimulados por PHA Ex vivo TUBB X79535 PBMCs estimulados por PHA Ex vivo SCYA7 X72308 PBMCs estimulados por PHA Ex vivo DRD2 X51362 PBMCs estimulados por PHA Ex vivo SCYA2 M26683 PBMCs estimulados por PHA Ex vivo FABP5 M94856 PBMCs estimulados por PHA Ex vivo/Tejido de tumor RCC Gen de No. de acceso Expresados diferencialmente en: enfermedad RCC Entrez (comparado con PBMCs sin enfermedad · SCYA20 _ U64197 PBMCs estimulados por PHA Ex vivo/Tejido de tumor RCC ADM D14874 PBMCs estimulados por PHA Ex vivo/Tejido de tumor RCC/PBMCs de insuficiencia renal COPEB AF001461 PBMCs estimulados por PHA Ex vivo/Tejido de tumor RCC/PBMCs de insuficiencia renal AQP9 AB008775 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal PTGS2 U04636 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal STIP1 M86752 PBMCs estimulados por PHA Ex vivo/ PBMCs de insuficiencia renal S0D2 X07834 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal PDXK U89606 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal Gen de No. de acceso Expresados diferencxalmente en: enfermedad RCC Entrez (comparado con PBMCs sin enfermedad IL1RN X52015 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal ANXA5 U05770 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal IFIT4 AF026939 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal IL1B M15330 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal GROl X54489 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal PLAUR X74039 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal NP X00737 PBMCs estimulados por PHA Ex vivo/PBMCs de insuficiencia renal Gen de No. de acceso Expresados diferencialmente en: enfermedad RCC Entrez (comparado con PBMCs sin enfermedad FCGR3B X16863 Tejido de tumor RCC UNK_M62896 M62896 Tejido de tumor RCC FN1 X02761 Tejido de tumor RCC HMOX1 Z82244 Tejido de tumor RCC ITGA7 AF032108 Tejido de tumor RCC DGCR5 X91348 Tejido de tumor RCC CBP2 D83174 Tejido de tumor RCC UNK_AL049250 AL049250 Tejido de tumor RCC SLC1A4 AA978353 Tejido de tumor RCC MMP9 J05070 Tejido de tumor RCC/PBMCs de insuficiencia renal SLC16A3 U81800 Tejido de tumor RCC/PBMCs de insuficiencia renal LILRB3 AF025533 Tejido de tumor RCC/PBMCs de insuficiencia renal FCGR1A M63835 Tejido de tumor RCC/PBMCs de insuficiencia renal LHFPL2 D86961 Tejido de tumor RCC/PBMCs de insuficiencia renal PLEC1 U53204 Tejido de tumor RCC/PBMCs de insuficiencia renal Gen de No. de acceso Expresados diferencialmente en: enfermedad RCC Entrez (comparado con PBMCs sin enfermedad S100A11 D38583 Tejido de tumor RCC/PBMCs de insuficiencia renal SPOP AJ000644 Tejido de tumor RCC/PBMCs de insuficiencia renal CCR1 D10925 Tejido de tumor RCC/PBMCs de insuficiencia renal TLR2 AF051152 Tejido de tumor RCC/PBMCs de insuficiencia renal KIAA0750 AB018293 Tejido de tumor RCC/PBMCs de insuficiencia renal CDC34 L22005 PBMCs de insuficiencia renal POLR2J L37127 PBMCs de insuficiencia renal ETS2 J04102 PBMCs de insuficiencia renal MAD L06895 PBMCs de insuficiencia renal GPR3 L32831 PBMCs de insuficiencia renal PIP5 1C AB011161 PBMCs de insuficiencia renal PRF1 M28393 PBMCs de insuficiencia renal PSMA7 AF054185 PBMCs de insuficiencia renal INPP4A U96919 PBMCs de insuficiencia renal TCFL1 D43642 PBMCs de insuficiencia renal Gen de No. de acceso Expresados diferencialmente en: enfermedad RCC Entrez (comparado con PBMCs sin enfermedad DGAT AF059202 PBMCs de insuficiencia renal S100P AA131149 PBMCs de insuficiencia renal DOC-IR AF089814 PBMCs de insuficiencia renal C8FW AJ000480 PBMCs de insuficiencia renal PDI2 AB023211 PBMCs de insuficiencia renal GEF-2 AI565760 PBMCs de insuficiencia renal TNNT1 M19309 PBMCs de insuficiencia renal BSG X64364 PBMCs de insuficiencia renal IL17R U58917 PBMCs de insuficiencia renal HK3 U51333 PBMCs de insuficiencia renal RALBP1 L42542 PBMCs de insuficiencia renal R ASE2 X55988 PBMCs de insuficiencia renal TP 1 M19267 PBMCs de insuficiencia renal BLVRB D32143 PBMCs de insuficiencia renal APS . AB000520 PBMCs de insuficiencia renal PPARD L07592 PBMCs de insuficiencia renal NFE2 S77763 PBMCs de insuficiencia renal IL1RAP ??006537 PBMCs de insuficiencia renal ETS2 AF017257 PBMCs de insuficiencia renal S100A12 D83664 PBMCs de insuficiencia renal Gen de No. de acceso Expresados diferencialmente en: enfermedad RCC Entrez (comparado con PB Cs sin enfermedad CD9 M38690 PBMCs de insuficiencia renal ENIGMA L35240 PBMCs de insuficiencia renal HAGH X90999 PBMCs de insuficiencia renal NCF1 M55067 PBMCs de insuficiencia renal FLOT1 AF089750 PBMCs de insuficiencia renal ITGA2B M34480 PBMCs de insuficiencia renal FKBP8 L37033 PBMCs de insuficiencia renal DUSP6 AB013382 PBMCs de insuficiencia renal CBFA2T3 AB010419 PBMCs de insuficiencia renal C. Otros Genes de Enfermedades de Tumores Sólidos Las metodologías descritas en la subsección B se pueden adaptar fácilmente a la identificación de otros genes de enfermedades de tumores sólidos. Estos genes de enfermedades de tumores sólidos se expresan diferencialmente en la sangre periférica o PBMC de pacientes con tumores sólidos en comparación con los humanos libres de enfermedades. En una modalidad, se recolectan los datos de expresión de microplaquetas de genes derivados de muestras de sangre periférica enriquecida con PBMC de RCC, cáncer de próstata, cáncer de cabeza y cuello y humanos libres de enfermedad, se comparan y analizan utilizando una métrica de correlación de multiclase. La métrica de correlación de multiclase puede identificar y clasificar los genes más altamente correlacionados con cada clase de perfiles de expresión de genes de sangre periférica. Las métricas de correlación adecuadas multi-clase incluyen pero no se limitan a, el software GeneCluster 2 suministrado por el Centro del MIT para Investigación del Genoma en hitehead Institute (Cambridge, MA) . El software GeneCluster2 tiene clasificación supervisada, selección de genes y funciones de prueba de permutación. Incluye algoritmos para construir y probar modelos supervisados usando votación ponderada y algoritmos vecinos más cercanos a k. En un ejemplo, un conjunto de 20 genes se selecciona usando el 70% de los perfiles de expresión como un conjunto de entrenamiento. Estos 20 genes clasificadores multiclase se enlistan en la Tabla 10. Cada uno de estos 20 genes tiene un patrón de expresión diferencial en la sangre periférica de todos los tres tipos de pacientes con tumores sólidos (esto es, RCC, cáncer de próstata y cáncer de cabeza y cuello) cuando se compara con humanos libres de la enfermedad. El conjunto de genes tiene una precisión de predicción de más del 89% para cada perfil restante. Otros conjuntos de genes con alta precisión de predicción para RCC, cáncer de próstata, cáncer de cabeza y cuello y libres de enfermedades se puede obtener similármente . En otra modalidad, se usa una correlación métrica de clase múltiple para identificar genes capaces de producir tumores sólidos contra libres de tumor sólido, sin tener en cuenta el tipo particular de tumor sólido. Los perfiles de expresión de sangre periférica de RCC, cáncer de próstata, cáncer de cabeza/cuello, y humanos sin enfermedad se analizan usando la comparación de clases múltiples . Se selecciona un conjunto de 19 genes usando 70% de las muestras totales como un conjunto de entrenamiento. El conjunto de genes de esta manera seleccionados se en lista en la Tabla 11. Cada gen en el conjunto de genes expresa diferencialmente en la sangre periférica de los tres tipos de pacientes con tumores sólido (RCC, cáncer de próstata y cáncer de cabeza/cuello) en comparación con humanos sin enfermedad. Este conjunto de 19 genes es capaz de predecir exactamente el tumor sólido contra libres de tumor sólido para el resto de los perfiles de expresión. Otros conjuntos de genes con una exactitud de predicción alta para tumores sólidos contra libres de tumor pueden obtenerse similarmente .
D. Detección de RCC, sin RCC, tumor sólido y/o sin tumor sólido Los genes de enfermedad RCC identificados en la Tabla 4 pueden usarse para detectar RCC, libre de RCC, tumores sólidos, y/o libres de tumor sólido en un sujeto humano con una estado de enfermedad desconocido. Por ejemplo, si los patrones de expresión de uno o más genes de enfermedad CC en la muestra de sangre periférica del sujeto humano no son substancialmente diferentes de los patrones de expresión correspondientes en humanos sin enfermedad, entonces se sugiere que el sujeto humano bajo diagnóstico está libre de RCC. A la inversa, si los patrones de expresión de uno o más genes de enfermedad RCC en el sujeto humano son substancialmente diferentes de los patrones de expresión correspondientes en humanos sin enfermedad (por ejemplo, niveles de expresión de gen en el sujeto humano son substancialmente más altos o más bajos que aquellos en humanos sin enfermedad) , entonces se sugiere que el sujeto humano puede estar infectado con RCC (u otros tumores sólidos, dependiendo de los genes usados en el diagnóstico) . Los algoritmos, tales como los programas de votación ponderada, pueden usarse para facilitar el diagnóstico. Además puede combinarse otra evidencia química con la prueba basada en genes para reducir el riesgo de un diagnóstico falso. Pueden usarse enfoques similares para predecir la presencia o ausencia de otros tumores sólidos tales como cáncer de próstata y cáncer de cabeza/cuello. Los métodos de diagnóstico o separación por exclusión basados en los productos de gen diferencialmente expresados son bien conocidos en el arte. De conformidad con un aspecto de la presente invención, los patrones de expresión diferencial de genes de enfermedad RCC pueden determinarse al medir los niveles de transcritos de ARN de estos genes en muestras de sangre periférica. Los métodos apropiados para este propósito incluyen, pero no se limitan a RT-PCT, inmunotransferencia Northerm, hibridización in situ, inmunotransferencia Southerm, manchado de punto, ensayo de protección de nucleasa y configuraciones de polinucleótido. Las muestras de sangre periféricas pueden ser ya sea de sangre entera o muestras de sangre que contiene PBMCs enriquecido. En general, el ARN aislado de muestras de sangre periférica puede amplificarse a ADNc o ARNc antes de la detección y/o cuantificación. El ARN aislado puede ser ARN total o ARNm. La amplificación de ARN puede ser específica o no específica. Los métodos de amplificación apropiados incluyen, pero no se limitan a PCR de transcriptasa inversa, amplificación isotérmica, reacción de cadena de ligasa, y replicasa Qbeta. Los productos de ácido nucleico amplificados pueden detectarse y/o cuantificarse a través de la hibridización a sondas etiquetadas. Los cebadores de amplificación o sondas de hibridización para un gen de enfermedad RCC pueden prepararse de la secuencia de genes o su correspondiente CPS usando métodos bien conocidos en el arte. Las secuencias de genes apropiadas para este propósito incluyen pero no se limitan a, exones, e intrones o las regiones no traducidas 3' o 5', o cualquier combinación de los mismos. En una modalidad, las sondas o cebadores se diseñan con base en la secuencia en o cerca de la región que codifica la proteina 3' del gen de enfermedad RCC. Por ejemplo, la secuencia de nucleótido que codifica los últimos 100 hasta 300 residuos de aminoácidos en la región de terminación C del producto de gen de enfermedad RCC pueden diseñarse para seleccionar sonda o cebadores. En el caso de que las ubicaciones genomicas del gen de enfermedad RCC no se haya determinado o que el gen pueda corresponder a una ubicación genómica múltiple, las sondas/cebadores pueden diseñarse con base en el CPS del gen, o las sondas de oligonucleótido en la inmunoplaqueta de gen HG-U95Av2 que se usa para la identificación del gen. La Tabla 4 enlista las secuencias apropiadas para hacer sondas/cebadores para la detección de sus correspondientes genes de enfermedad RCC. Los ejemplos de sondas/cebadores de oligonucleótido apropiadas se en listan en el ANEXO A. En una modalidad, cada cebador/sonda, comprende al menos 15 nucleótidos. Por ejemplo, cada sonda puede comprender al menos 20, 25, 50, 75, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 400 o más nucleótidos. Preferiblemente, cada sonda/cebador tiene una complejidad de secuencia relativamente alta y no tiene ningún residuo ambiguo (residuos "n" no determinados) . Las sondas/cebadores preferiblemente pueden hibridizar el gen objetivo, incluyendo sus transcritos de AR , bajo condiciones severas o altamente severas . En otra modalidad, las sondas/cebadores para un gen se seleccionan de regiones que difieren significativamente de la secuencia de otros genes. Tales regiones pueden determinarse al revisar las secuencias de sonda/cebador contra una base de datos de secuencia de genoma humano, tal como la base de datos Entrez en el NCBI . En algoritmo apropiado para este propósito es el algoritmo BLAST. Este algoritmo involucra identificar primero pares de secuencia de alto registro (HSPs) al identificar palabras cortas de longitud o secuencia de pregunta, que alinean o satisfacen algunos registros T de umbral de valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se refiere al umbral de registro de palabra vecino. Estos aciertos iniciales de palabras en la vecindad actúan como siembra para iniciar búsquedas para encontrar los HSPs más largos que los contienen. Estas líneas de palabras se extienden entonces en ambas direcciones a lo largo de cada secuencia para incrementar el registro de alineación acumulativo. Los registros acumulativos se registran usando, las secuencias de nucleótidos, los parámetros (registro preñado para un par de residuos registrados; siempre >0) y N (registro penalizado para residuos erróneos: siempre >0) . Los parámetros , T, y X del algoritmo BLAST determina la sensibilidad y velocidad de la alineación. Estos parámetros pueden ajustarse para diferentes propósitos, como se aprecia por alguien de experiencia ordinaria en el arte. En una modalidad preferida, el RT-PC cuantitativo (tal como TagMan, ABI) se usa para detectar y comparar los niveles de transcrito de AR de los genes de enfermedad RCC en muestras de sangre periférica. El RT-PCR cuantitativo involucra la transcripción inversa (RT) del ARN para ADNc después del PCR relativo cuantitativo (RT-PCR) . En PCR, el número de moléculas del ADN objetivo amplificado se incrementa por factor que enfoca dos de cada ciclo de la reacción hasta que un reactivo se vuelve limitante. Posteriormente la relación de amplificación se disminuye incrementadamente hasta que no hay incremento en el objetivo amplificado entre ciclos. Si se plantea la gráfica en la cual el número de ciclo está en el eje X y el log de la concentración del ADN objetivo amplificado está en el eje Y se observa que una línea curvada de forma caracteriza se forma al conectar los puntos en plano. Iniciando con el primer ciclo, la inclinación de la línea es positiva y constante. Esto se dice que es la porción lineal de la curva.
Después de que algunos reactivos se han vuelto limitantes, la inclinación de la línea comienza a reducirse y eventualmente se vuelve cero. En este punto la concentración del ADN objetivo amplificado se vuelve asintótica para algunos valores fijados. Esto se dice que es la porción plana de la curva. La concentración del ADN objetivo en la porción lineal del PCR es proporcional a la concentración inicial del objetivo antes de iniciar PCR. Al determinar la concentración de los productos PCR del ADN objetivo en reacciones PCR que han completado el mismo número de sitios y están en sus rangos lineales es posible determinar las concentraciones relativas de la secuencia objetivo específica en la mezcla de AND original . Si la mezclas de ADN son ADNc sintetizados de ARN aislados de diferentes tejidos o células las abundancias relativas del ARNm específico de la cual se deriva la secuencia objetivo pueden determinarse de los respectivos tejidos o células. Esto es proporcionalmente directo entre la concentración de los productos PCR y las abundancias relativas de ARNm es real en la porción del rango lineal de la reacción PCR. La concentración final del ADN objetivo en la porción plana de la curva se determina por la disponibilidad de reactivos en la mezcla de reacción y es independientemente de la concentración original del ADN objetivo, por lo tanto, el muestreo y cuantificación de los productos PCR amplificados se llevará a cabo preferiblemente cuando las reacciones PCR están en la porción lineal de sus curvas . Además las concentraciones relativas de los ADNc amplificables preferiblemente se normalizan para algún estándar independiente, que puede basarse ya sea en las especies de ARN internamente existente o especies de ARN externamente introducidas. La abundancia de especies de ARNm particulares también puede determinarse con relación a la abundancia promedio de todas las especies de ARNm en la muestra. En una modalidad, la amplificación PCR utiliza estándares PCR internos que aproximadamente son tan abundantes como el objetivo. Esta estrategia es efectiva si los productos de las amplificaciones PCR se procesan en muestra durante su fase lineal. Si los productos se procesan en muestras cuando las reacciones se enfocan en fase de plano, entonces el producto menos abundante pueden ponerse relativamente sobre representado. Las comparaciones de abundancias relativas hechas por muchas de ARN diferentes, tal como en el caso cuando se examinan muestras de ARN para expresión diferencial pueden distorsionarse de tal manera que hacen diferencias en las abundancias relativas de los ARN que parecen menos de las que actualmente hay. Esto puede mejorar si el estándar interno es más abundante que el objetivo. Sin el estándar interno es más abundante que el objetivo, entonces pueden hacerse comparaciones lineales directas entre las muestras de ARN. Un problema inherente en las muestras clínicas es que son de calidad y/o cantidad variable. Este problema puede vencerse si' el RT-PCR realiza como un RT-PCR cuantitativo con un estándar interno en el cual estándar interno es un fragmento de ADNc amplificable es más largo que el fragmento de ADN objetivo y en el cual la abundancia del ARNm que codifica el estándar interno es más o menos 5-100 veces mayor que el ARNm que codifica el objetivo. Estas mediciones de ensayo con relación a la abundancia, no es la abundancia absoluta de las especies de ARNm respectivas. En otra modalidad, el RT-PCR cuantitativo relativo utiliza un protocolo estándar externo. Bajo este protocolo los productos PCR se procesan se muestrean en una porción lineal de sus curvas de amplificación. El número de ciclos PCR que son óptimos para usar en muestras pueden determinarse empíricamente para cada fragmento .de ADNc objetivo. Además, los productos de transcriptasa inversa de cada población de ADN aislados de muestras pueden normalizarse para concentraciones iguales de ADNc amplificables . Aunque la determinación empírica del rango lineal del la curva de amplificación y normalización de preparaciones de ADNc son procesos tediosos y que consumen tiempo, los ensayos RT-PCR resultantes pueden, en ciertos casos, ser superiores a aquellos derivados de RT-PCR cuantitativo relativo con un estándar interno . Las configuraciones de ácido nucleico también pueden usarse para detectar y comparar los patrones de expresión diferenciales de los genes de enfermedad RCC en muestras de sangre periférica. Las sondas apropiadas para detectar los genes de enfermedad correspondientes pueden usarse establemente a regiones discretas conocidas en un substrato sólido. Como se usa en la presente, una sonda se "enlaza establemente" a una región discreta si la sonda mantiene su posición con relación a la región discreta durante la hibridización y los posteriores lavados. La construcción de configuraciones de ácido nucleico es bien conocida en el arte. Los substratos apropiados para hacer configuraciones de polinucleótidos incluyen pero no se limitan a, membranas, películas, plásticos, y obleas de cuarzo. Una configuración de ácido nucleico de la presente invención puede comprender al menos 2 , 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, 200, 250 o más sondas de polinucleótidos diferentes, cada sonda diferente capaz de hibridizar un gen de enfermedad respectivo diferente. Pueden usarse sondas múltiples para el mismo gen en una configuración de ácido nucleico sencilla. Los ejemplos de sondas apropiadas para esta invención se enlistan en el ANEXO A. Las sondas para otros genes de enfermedad también pueden incluirse en la configuración de ácido nucleico de esta invención. La densidad de sonda en la configuración puede estar en cualquier rango. Por ejemplo, la densidad puede ser 50, 100, 200, 300, 400, 500 o más sondas/cm2. En una modalidad, los ensayos de protección de nucleasa se usan para cuantificar los ARN derivados de las muestras de sangre periférica. Hay muchas versiones diferentes de ensayo de protección de nucleasa conocidos por aquellos practicantes en el arte. La característica común de estos ensayos de protección de nucleasa es que involucran la hibridización de ácido nucleico antisentido con el ARN a cuantif carse . La molécula híbrida resultante se digiere entonces con una nucleasa que digiere los ácido nucleicos de hebra sencilla más eficientemente que las moléculas de hebra doble. La cantidad de ácido nucleico antisentido que sobrevive a la digestión se mide de la cantidad de especies del ARN objetivo a cuantificarse . Un ejemplo de un ensayo de proteasa que está corriereialmente disponible es el ensayo de protección RNasa fabricado por Ambion, Inc. (Austin, Texas) . Los métodos arriba descritos también pueden usarse para determinar los niveles de especies de ARN en la sangre periférica que son capaces de hibridizar a los CPSs en listados en la Tabla 2 de CPS. Los niveles de estas especies de ARN en la sangre periférica pueden ser indicados como para un sujeto humano tenga RCC o este libre de RCC.
De conformidad con otro aspecto de la presente invención, los patrones de expresión diferenciales de los genes de enfermedad RCC pueden determinarse al medir los niveles de polipéptidos codificados por estos genes en la sangre periférica. Los métodos apropiados para este propósito incluyen pero no se limitan a, inmunoensayos tales como ELISA, RIA, FACS, manchado de punto, inmunotransferencia Western, inmunohistoquímica, y formación de radioimagen basada en el anticuerpo. Los protocolos para llevar a cabo estos inmunoensayos son bien conocidos en el arte. Otros métodos tales como la electroforesis en gel de SDS-poliacrilamida 2-dimensional también pueden usarse. Un método ejemplar apropiado para detectar los niveles de proteína objetivo en las muestras de sangre periférica es ELISA. En un ELISA ejemplificante, los anticuerpos capaces de unirse a las proteínas objetivo codificadas por uno o más genes de enfermedad RCC se inmovilizan sobre una superficie seleccionada que exhibe la afinidad de proteína, tal como pozos en una placa de microtitulación de poliestireno o cloruro de polivinilo. Luego, las muestras de sangre periférica a probarse se agregan a los pozos. Después de enlazarse y lavarse para remover los inmunocomplejos no específicamente unidos pueden detectarse los antígenos unidos. La detección puede realizarse por la adición de un segundo anticuerpo que es específico para la proteínas antisentido y se enlaza a una etiqueta detectable. La detección también puede realizarse por un segundo anticuerpo, seguido por la adición de un tercer anticuerpo que tiene una afinidad de enlace para el segundo anticuerpo, con el tercer anticuerpo siendo enlazado a una etiqueta detectable. Antes de agregar a la placa de microtitulación, las células en las muestras de sangre periférica pueden lisarse usando varios métodos conocidos en el arte. Los procedimientos de extracción apropiados pueden usarse para separar las proteínas objetivo de substancias potencialmente interferentes . En otro ELISA amplificante, las muestras de sangre periférica que se sospecha que contiene proteínas objetivo se inmovilizan sobre la superficie del pozo y luego se ponen en contacto con los anticuerpos de la invención. Después de enlazar y lavar para remover los inmunocomplejos no específicamente unidos, se detecta el antígeno unido. Donde los anticuerpos iniciales se enlazan a una etiqueta detectable pueden detectarse directamente los inmunocomplejos. Los inmunocomple os también pueden detectarse usando un segundo anticuerpo que tiene una afinidad de enlace para el primer anticuerpo, con el segundo anticuerpo enlazado a una etiqueta detectable. Otro ELISA ejemplar involucra el uso de una competencia de anticuerpo en la detección. En este ELISA las proteínas objetivos se inmovilizan en la superficie del pozo. Los anticuerpos etiquetados se agregan al pozo, se permite que se unan a las proteínas objetivo y se detectan en medio de sus etiquetas. La cantidad de las proteínas objetivo en una muestra desconocida se determina luego al mezclar la muestra con los anticuerpos etiquetados antes o durante la incubación con los pozos recubiertos . La presencia de las proteínas objetivo en la muestra desconocida actúa para reducir la cantidad de anticuerpo disponible para unirse al pozo y de esta manera reduce la señal final. Los formatos ELISA diferentes pueden tener ciertas características en común, tal como recubrimiento, incubación o unión, lavado para remover las especies no específicamente unidas, y detectar los inmunocomplejos unidos. Por ejemplo, en el recubrimiento con una placa ya sea antígeno o anticuerpo los pozos pueden incubarse con una solución del antígeno o anticuerpo ya sea durante la noche por un periodo específico de "horas. Los pozos de la placa se lavan entonces para remover el material incompletamente adsorbido. Cualesquiera de las superficies restantes disponibles de los pozos se "recubre" entonces con una proteína no específica que es antigénicamente neutral con respecto a las muestras de pruebas. Los ejemplos de estos proteínas no específicas incluyen albúmina de suero de bovina (BSA) , caseína y soluciones de leche en polvo. El recubrimiento permite el bloqueo de absorción no específicos en la superficie inmovilizada, y reduce así el respaldo provocado por la unión no especifica del antisuero sobre la superficie. En los ELISA, puede usarse también un medio de detección secundario o terciario. Después de unir la proteína o anticuerpo al pozo, recubrir con material no reactivo para reducir el respaldo y lavar para remover el material no unido, la superficie inmovilizada se pone en contacto con una muestra de control clínica y/o biológica para probarse bajo condiciones efectivas que permitan la formación de inmunocomplejo (antígeno/anticuerpo) . Estas condiciones pueden incluir, por ejemplo, diluir los antígenos y anticuerpos con soluciones tales como BSA, globulina gamma de bovino (BGG) y solución salina amortiguada en fosfato (PBS)/Tween y luego incubar los anticuerpos y antígenos a temperatura ambiente durante alrededor de 1 hasta 4 horas o a 4°C durante la noche. La detección del inmunocomplejo requiere luego un ligando de enlace secundario etiquetado o anticuerpo o un ligando o anticuerpo de enlace secundario en conjunto con un anticuerpo terciario etiquetado o tercer ligando de enlace. Después de todas la etapas de incubación de un ELISA, la superficie en contacto puede lavarse para que de esta manera se elimine el material no complejo. Por ejemplo, la superficie pueden lavarse con una solución tal como PBS/Tween, o solución amortiguadora de borato. Después de la formación de los inmunocom.plejos específicos entre la muestra de prueba y el material originalmente unido, y el lavado posterior, la presencia de la cantidad de inmunocomplejos puede determinarse . Para proporcionar medios de detección, el segundo o tercer anticuerpo pueden tener una etiqueta asociada para permitir la detección. En una modalidad, la etiqueta es una enzima que genera el desarrollo de color durante la incubación con un substrato cromogénico 'apropiado. De esta manera, por ejemplo, puede estar en contacto e incubarse el primero o segundo inmunocomplejo con ureasa, oxidasa de glucosa, fosfatasa alcalina, o un anticuerpo conjugado en peroxidasa de hidrógeno durante un periodo de tiempo, y bajo condiciones que favorecen el desarrollo de la formación de un inmunocomple o adicional (por ejemplo, incubación durante 2 horas a temperatura ambiente en una solución que contiene PBS tal como PBS-Tween) . Después de la incubación con el anticuerpo etiquetado, y posteriormente lavado para remover el material no unido, se cuantifica la cantidad de etiqueta, por ejemplo, por incubación con un substrato cromogénico tal como urea y morado de bromocresol o ácido 2 , 2 ' -azido-di- (3 -etil) -benztiazolina-6-sulfónico (ABTS) y H202, y en el caso de peroxidasa como en la etiqueta de enzima. La cuantif cación puede realizarse al medir el grado de generación de color, por ejemplo, usando un espectrofotómetro . Otro método apropiado de esta invención es el RIA (radioinmunoensayo) . Un RIA ejemplar se basa en la competencia entre polipéptidos radioetiquetados y polipéptidos no etiquetados para unirse a una cantidad limitada de anticuerpos . Los radioetiquetados incluyen pero no se limitan a I125. En una modalidad, una concentración fija de polipéptidos etiquetado en I125 se incuba con una serie de diluciones de un anticuerpo específico para el polipéptido. Cuando el polipéptido no etiquetado se agrega al sistema, la cantidad de polipéptido I125 que se une al anticuerpo se reduce . Puede construirse por lo tanto una curva estándar para representar la cantidad de polipéptido I125 unido al anticuerpo como una función de la concentración del polipéptido no etiquetado. De esta curva estándar la concentración del polipéptido en muestras desconocidas puede determinarse. Varios protocolos para conducir el RIA para medir los niveles de polipéptidos en muestras de sangre periférica son bien conocidos en el arte. Los anticuerpos apropiados para esta invención incluyen, pero no se limitan a anticuerpos policlonales, anticuerpos monoclonales , anticuerpos quiméricos, anticuerpos humanizados, anticuerpos de cadena sencilla, fragmentos Fab y fragmentos producidos por una colección de expresión Fab. Los anticuerpos neutralizantes (esto es, aquellos que inhiben la formación de dímero) también pueden usarse. Los anticuerpos policlonales pueden prepararse al inmunizar un sujeto apropiado con productos de gen de enfermedad RCC o fragmentos de los mismos. La concentración del anticuerpo en el sujeto inmunizado puede monitorearse durante el tiempo usando técnicas estándar tales como ELISA. Los anticuerpos pueden aislarse del sujeto inmunizado usando técnicas bien conocidas en el arte . En una modalidad, las hibridomas capaces de producir anticuerpos contra los productos de gen de enfermedad RCC se preparan. Los productos de genes de enfermedades de RCC pueden prepararse usando bacterias u otras células transformadas o transfectadas con las secuencias de polinucleótido que codifican los productos de gen. Los productos de gen purificado, o fragmentos de los mismos se usan para inmunizar un vertebrado tal como un mamífero. Tales mamíferos incluyen ratones, conejos, y ovejas. Preferiblemente el fragmento usado para inmunización comprende al menos ocho residuos de aminoácido, más preferiblemente al menos 12 residuos de aminoácidos, altamente más preferiblemente al menos 16 residuos de aminoácido y aun más preferiblemente al menos 20 residuos de aminoácidos. Los fragmentos inmunogénicos (epítopos) en los productos de gen pueden identificarse usando técnicas conocidas. Los epítopos preferidos son regiones que se localizan en las superficie de los productos del gen. Estas regiones son usualmente hidrofilicas . Se aislan esplenocitos del vertebrado inmunizado y se fusionan con una línea de célula inmortalizada (tal como una mieloma) para formar hibridomas. Preferiblemente, la línea de célula inmortal se deriva de la misma especie de mamífero como los linfocitos. Por ejemplo, los hibridomas de murino pueden hacerse al fusionar una línea de célula de ratón inmortalizada con linfocitos aislados de un ratón que está inmunizada con una preparación inmunogénica de la presente invención. Las líneas de células inmortalizadas preferidas incluyen líneas de célula de mieloma de ratón que son sensibles al medio de cultivo que contiene hipoxantina, aminopterina y timidina ("medio HAT") . Las líneas de célula de mieloma apropiadas incluyen, pero no se limitan a, las líneas de mieloma P3-NSl/l/-Ag4-l, P3-x63-Ag8.653 o Sp210-Agl4, todas las cuales están disponibles de ATCC. En una modalidad, las células de mieloma de ratón sensibles a HAT se fusionan a los esplenocitos de ratón usando polietilenglicol ("PEG"). Las células de hibridoma de esta manera producidas se seleccionan contra el medio HAT, que elimina células de mieloma fusionadas no productivamente o no fusionadas. Las células de hibridoma que producen anticuerpos monoclonales contra los productos de gen de enfermedad RCC pueden detectarse por separación por exclusión de los sobrenadantes de cultivo de hibridoma. Los anticuerpos monoclonales también pueden prepararse por separación por exclusión de una colección de inmunoglobulina combinatoria recombinante (por ejemplo, una colección que exhibe la fase de anticuerpos) . Los kits para generar y separar por exclusión colecciones que exhiben fagos están comercialmente disponibles (por ejemplo, Pharmacia Recombinant Phage Antibody System, catálogo No. 27-9400-01; y el Stratagene SurfZAP™ Phage Display Kit, catálogo No. 240612) . Los anticuerpos apropiados para esta invención también incluyen "Fv de cadena sencilla" o "scFv" . Los fragmentos scFv comprenden los dominios VH y VL de una anticuerpo. Generalmente, el polipéptido scFv comprende además un enlazador de polipéptido entre los dominios VH y VL. El enlazador de polipéptido permite que el scFv forme la estructura deseada para unir el antigeno. Adicionalmente, los anticuerpos recombinantes , tales como anticuerpos monoclonales quiméricos y humanizados, pueden prepararse como se aprecia por alguien de experiencia ordinaria en el arte. Pueden también usarse anticuerpos humanizados . Las formas humanizadas de anticuerpos no humanos (por ejemplo, murino) son inmunoglobulinas quiméricas, cadenas de inmunoglobulina, o fragmentos de los mismos (tales como Fv, Fab, Fab' , (ab' >2 u otras subsecuencias enlazadas al antxgeno del anticuerpo) que contiene una secuencia mínima derivada de inmunoglobulina no humana. Los anticuerpos humanizados se derivan de inmunoglobulinas humanas en las cuales los residuos forman las regiones . complementariamente determinantes (CDRs) se reemplazan por los residuos de CDRs de un anticuerpo no humano, tal como un anticuerpo de ratón, rata ,o conejo que tiene la especificidad afinidad y capacidad deseada. En algunos casos los residuos de estructura Fv de la inmunoglobulina humana se reemplazan por los residuos no humanos correspondientes. Los anticuerpos humanizados también pueden comprender residuos que no se encuentran' ni en el anticuerpo receptor ni en el CDR importado o secuencias de estructura. El anticuerpo humanizado pueden comprender al menos uno o dos dominios variados en los cuales todo substancialmente todas las regiones CDR corresponde a aquellas de inmunoglobulina no humano y todas o substancialmente todas las región constante son aquellas de una secuencia de consenso inmunoglobulina humana. El anticuerpo humanizado comprenden preferiblemente al menos una porción y una región constante de inmunoglobulina (Fe) de una inmunoglobulina humana. Los anticuerpos humanizados pueden producirse usando ratones transgénicos que son incapaces de expresar cadenas pesada y ligera de dnmunoglobulina endógena, pero pueden expresar cadena pesada y ligeras humanas. Los ratones transgénicos se inmunizan de manera normal con un antígeno seleccionado. Los anticuerpos monoclonales dirigidos contra el antígeno pueden obtenerse usando tecnologías de hibridoma convencional. Los transgenes de inmunoglobulina humanos que están portados en la reconfiguración de ratón transgénico durante la diferenciación de células B, y posteriormente experimentan el encendido de clase y la mutación somática. Usando esta técnica pueden prepararse anticuerpos IgG, IgA y IgE terapéuticamente útiles. Además los anticuerpos humanizados que reconocen un epítopo seleccionado pueden generarse usando una técnica con referencia a "sección guía". En este enfoque, un anticuerpo monoclonal no humano selecciona por ejemplo, una anticuerpo de murino, se usa para guiar la selección de un anticuerpo humanizado que reconoce el mismo epítopo. En una modalidad, los anticuerpos de la presente invención pueden unirse a los correspondientes productos de gen de enfermedad RCC o los antígenos deseados con una constante de afinidad de enlace Ka de al menos 104 "1, tal como al menos 105 M"1, 106 M"1, 107, "1 o mas. Los anticuerpos de esta invención pueden etiquetarse con una o más porciones detectables para permitir la detección de los complejos-antígenos . Las porciones detectables pueden incluir composiciones detectables por medios espectroscópicos, enzimáticos, fotoqumicos, bioquímicos, bioelectrónicos, inmunoquímicos, eléctricos, ópticos o químicos. Las porciones detectables incluyen pero no se limitan a, radioisótopos, compuestos quimioluminiscentes, proteínas enlazadas etiquetadas, átomos de metal pesado, marcadores espectroscópicos tales como marcadores fluorescentes ,y pigmentos, etiquetas magnéticas, enzimas enlazadas, etiquetas de espectrometría de masa, etiquetas de giro, donadores y aceptores de transferencia de electrón y similares. De conformidad con aun otro aspecto de la presente invención, los niveles de polipéptidos en las muestras de sangre periférica pueden determinarse al detectar las actividades biológicas asociadas con los polipéptidos. Si una función/actividad biológica de un polipéptido se conoce pueden diseñarse bioensayos in vitro apropiados para evaluar la función/actividad biológica, determinando por ello la cantidad de polipéptido en la muestra. Los niveles de expresión de genes de enfermedad RCC o los respectivos CPSs pueden compararse con los niveles de expresión de referencia usando varios métodos. Estos niveles de referencia pueden determinarse usando muestras de sangre periférica aisladas de humanos sin enfermedad, pacientes con RCC u otro tumor sólido. La comparación puede realizarse usando el cambio de veces o la diferencia absoluta entre los niveles de expresión a compararse. Uno o más genes de enfermedad RCC o CPSs pueden usarse en la comparación. Por ejemplo, al menos 2, 3, 4, 6, 8, 10, 12, 14, 16, 18, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200 o más genes de enfermedad RCC o CPSs pueden usarse. Los patrones de la expresión también se comparan al usar una o más relaciones entre los niveles de expresión de diferentes genes de enfermedad. Otras mediciones apropiadas o indicadores también pueden emplearse para valorar la diferenciación o diferencia entre los diferentes patrones de expresión. El uso de múltiples CPSs o genes de enfermedad RCC puede reducir el riesgo de una predicción falsa. En una modalidad, si más del 50% (tal como 60%, 70%, 80%, ó 90%) de los CPSs seleccionados o genes de enfermedad RCC sugieren que el humano de prueba tiene RCC o está libre de RCC, entonces la predicción para RCC o libre de RCC puede hacerse respectivamente. En otra modalidad, la comparación basada en la expresión del gen se combina con otra evidencia clínica para predecir RCC y/u otros tumores sólidos. En una modalidad preferida, los genes de enfermedad RCC usados para predecir RCC contra libre de RCC incluyen o consisten de uno o más genes seleccionados del grupo que consiste de EEF1A2 , TLR2, BRF2 , LCALS3, SNRPG, DKFZP586E1621 , NUMA1, SOD2, AKR1B1, DUSP6, SMARCE1, KIAA0669, MSF, IL1R , PTMA, KIAA0410, PSMD3 , T54, C1QBP, y OSR1. Por ejemplo, los genes de enfermedad RCC usados para la predicción de RCC pueden incluir o consistir de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo. Por otro lado, los genes de enfermedad RCC usados para el diagnóstico pueden comprender (1) al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 genes seleccionados del grupo que consiste de TLR2 , LGALS3 , DKFZP586E1621, SOD2 , DUSP6 , KIAA0669, IL1RN, KIAA0410, T54 y OSR1, y/o (2) al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 genes seleccionados del grupo que consiste de EEF1A2 , BRF2, SNRPG, NU A1, AKR1B1, S ARCE1, MSF, PTMA, PSMD3 y C1QBP . En otra modalidad preferida, los CPS usados para predecir RCC contra libre de RCC incluyen o consisten de uno o más CPSs seleccionados del grupo que consiste de CPS 1, CPS 3, CPS 4, CPS 6, CPS 18, CPS 38, CPS 53, CPS 255, CPS 256, CPS 257, CPS 258, CPS 259, CPS 260, CPS 261, CPS 262, CPS 263, CPS 264, CPS 265, CPS 266 y CPS 267. Por ejemplo, los CPSs usados para la predicción de RCC pueden incluir o consistir de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18, ó 20 CPSs seleccionados del grupo. Por otro lado, los CPSs usados para diagnóstico pueden comprender (1) al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 CPSs seleccionados del grupo que consiste de CPS 1, CPS 3, CPS 4, CPS 6, CPS 18, CPS 38, CPS 53, CPS 261, CPS 264 y CPS 267 y/o (2) al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 CPSs seleccionados del grupo que consiste de CPS 255, CPS 256, CPS 257, CPS 258, CPS259, CPS 260, CPS 262, CPS 263, CPS 265 y CPS 266.
Aun en otra modalidad preferida, los genes de enfermedad RCC usados para predecir RCC contra libre de RCC incluyen o consisten de uno o más genes seleccionados del grupo que consiste de CD44, KIAA0410, MARCO, MAP3K8, NSP-CL, PIP5K1C, NRG1, RAB31, LGALS3, MRF2D, ITGA7, LHFPL2 , ETS2 , KHSRP, ENIGMA, UNK__AF038187, RABI3 , TLR2 , T54 y DUSP6. Por ejemplo, los genes de enfermedad RCC usados para la predicción pueden incluir o consiste de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo. Todavía en otra modalidad preferida, los CPSs usados para predecir RCC contra libre de RCC incluyen o consisten de uno o más CPSs seleccionados del grupo que consiste de CPSs 1, 3, 4, 5, 6, -7, 9, 10, 11, 16, 28, 31, 268, 264, 279, 280, 281, 282, 283 y 284. Por ejemplo, los CPSs usados para la predicción pueden incluir o consiste de al menos 4, 6, 8, 10, 12, 14, 16, 18 ó 20 CPSs seleccionados del grupo. En otra modalidad preferida, los genes de enfermedad RCC usados para predecir RCC y/u otros tumores sólidos, tales como cáncer de próstata y cáncer de cabeza/cuello, incluyen o consisten de uno o más genes seleccionados del grupo que consiste de CD44, CRADD, CCRL2, KIAA0837, KIAA0707, KIAA1113, EREGE, UNK_AL050119, PPARD, CTSL, ATP2B1, UNK_AF052115 , MITF, STAT3 , KIAA0410, TPD52L2, UNK_A1732885, MARCO, LOC64116 y PDNP2. Por ejemplo, los genes de enfermedad RCC usados para la predicción pueden incluir o consistir de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo. Aun en otra modalidad preferida, los CPSs usados para predecir RCC y/u otros tumores sólidos, tal como cáncer de próstata y cáncer de cabeza/cuello, incluyen o consisten de uno o más CPSs seleccionados del grupo que consiste de CPSs 17, 31, 37, 50, 59, 64/ 69, 71, 264, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277 y 278. Por ejemplo, los CPSs usados para la predicción pueden incluir o consistir de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 CPSs seleccionados del grupo . En otra modalidad, los genes de enfermedad RCC usados para predecir tumores sólidos contra libre de tumor sólido incluyen o consisten de uno o más genes seleccionados del grupo que consiste de UMA1, CXCR4, IL10RA, 9, FAU, BRF2, RPS6, EEF1A2 , BAG5, A R1B1, UN _AL022721, C1QBP, DKZP586E0820, NONO, PS D3, UN _N74607, UNK_AI743507 , ???????5 y UN _U79297. Por ejemplo, los genes de enfermedad RCC usados para la predicción pueden incluir o consistir de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo . En otra modalidad, los CPSs usados para predecir tumores sólidos contrá libres de tumor incluyen o consisten de uno o más CPSs seleccionados del grupo que consiste de CPSs 258, 258, 107, 286, 287, 256, 288, 255, 289, 259, 290, 266, 291, 292, 265, 131, 293, 294 y 295. Por ejemplo, los CPSs usados para la predicción pueden incluir o consistir de al menos 2, 4, 6, 8, 10, 12, 14, 16/ 18 ó 20 CPSs seleccionados del grupo. La comparación de los perfiles de expresión también puede realizarse con base en la hibridización cuantitativa de clones de ADN configurados, los análisis en serie de tecnología de expresión de gen (SAGE) , o análisis electrónicos, tales como la herramienta formadora de imágenes de transcrito o el programa de análisis de expresión de gen GEMTOOLS (Incyte Pharmaceuticals) o la tecnología de análisis de expresión cuantitativa y GeneCalling (Curagen) . Los algoritmos tales como los programas de reconocimiento de patrón, pueden usarse para comparar los perfiles de expresión de genes de enfermedad RCC con perfiles de expresión de referencia.
E. Predicción de RCC y otro tumor sólido con base en el algoritmo de votación ponderado De conformidad con una aspecto de esta invención, se usa el algoritmo de votación ponderado para comparar los perfiles de expresión de un conjunto de genes de enfermedad RCC en el humano bajo diagnóstico, para los perfiles de expresión del mismo conjunto de genes de enfermedad RCC en humanos sin enfermedad y pacientes con RCC o tumor sólido conocido. El algoritmo de votación ponderado se describe en T.R. Golub, et al., Science, 286: 531-537 (1999), y D.K. Slonim et al., Procs. Of the Fourth Annual International Conference on Computational Molecular Biology, Tokyo, Japan, April 8-11, p263-272 (2000) . El algoritmo puede involucrar un análisis de dos clases o de clases múltiples . El software de análisis de clase múltiple, tal como el software GeneCluster 2, esta disponible del MIT Center for Genome Research at Whitehead Institute. El algoritmo es capaz de evaluar al humano bajo diagnóstico para una de al menos dos clases . Bajo una forma del algoritmo, el humano al diagnosticarse se evalúa para una de dos clases (referido como clase 0 y 1) . Por ejemplo, Clase 0 pueden representar u consistir de humanos sin enfermedad, y clase 1 pueden consiste de pacientes de RCC. El conjunto de genes de enfermedades RCC se evalúan para crear un predictor de clase (clasificador) . Cada gen en el predictor de clase lanza un voto pesado para una de las dos clases (clase 0 y clase 1) . El voto del gen "g" puede definirse como Vg = ag (??-bg) , en donde ag = P(g,c) refleja la correlación entre el nivel de expresión del gen "g" y la distinción de clase, bg = [xO (g) +xl (g) ] ¡2 es el promedio de los logs medios de los niveles de expresión del gen wg" en la clase 0 y clase 1, y ¾ representa el log normalizado del nivel de expresión del gen "g" en la muestra de prueba. Un vg positivo indica un voto de clase 0, y un vg negativo indica un voto para la clase 1. V0 significa la suma de todos los votos positivos, y VI significa el valor absoluto de la suma de todos los votos negativos . Un PS resistente de predicción se define como PS = (V0-V1)/(V0+V1) . La validación cruzada puede usarse para evaluar la exactitud del predictor de clase creado bajo el algoritmo de votación ponderado. Brevemente, una muestra que se usa para identificar los genes de enfermedad RCC bajo el análisis de vecindad se retiene. Un predictor de clase se crea con base en las muestra restantes, y luego se usa para predecir la clase de la muestra retenida. Este proceso puede repetirse para cada muestra que se a usado en el análisis de vecindad. Los predictores de clase comprenden diferentes genes de enfermedad RCC pueden evaluarse usando el proceso de validación cruzada, y el mejor predictor de clase con la predicción más exacta que puede identificar. Además, el umbral resistente a la predicción apropiado (PS) puede evaluarse agrupando la relación de error de validación cruzada acumulativa contra la resistencia de predicción. En una modalidad, un predicción positiva de que una muestra de prueba pertenece a la clase 0 o clase 1 puede hacerse si el valor absoluto de PS para la muestra de prueba no es menor a 0.3. Otro umbral PS, tal como no menor a 0.1 ó 0.2, también puede usarse. En otra modalidad, el predictor de clase o clasificador consiste de n genes de enfermedad RCC identificados bajo el análisis de vecindad. La mitad de estos genes de enfermedad RCC tienen los registros P(g,c) más largos, y la otra mitad tiene los registros -P(g,c) más largos. El número n es el único parámetro libre para definir el predictor de clase. La subsección G de esta especificación, describe ejemplos detallados de construcción y entrenamiento de clasificadores de enfermedad RCC. En una modalidad preferida, el predictor de clase comprende o consiste de al menos 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados de EEF1A2, TLR2, BRF2, LGALS3, SNRPG, DKFZP586E1621, NUMA1, S0D2 , A R1B1, DUSP6, SMARCE1, KIAA0669, SF, IL1R , ????, KIAA0410, PSMD3 , T54, C1QBP, y 0SR1. Por ejemplo, un predictor de clase de 2 genes puede consistir de TLR2 y EEF1A2. Un predictor de clase de 4 genes puede consistir de TLR2, IGALS3, EEF1A2 , y BRF2. Un predictor de clase de 6 genes puede consistir de TLR2, LGALS3 , DKFZP586E1621, EEF1A2 , BRF2 y SNRPG. Un predictor de clase de 8 genes pueden consistir de TLR2 , LGALS3 , DKFZP586E1621 , SOD2, EEF1A2, BRF2, SNRPG y NUMA1. Un predictor de clase de 10 genes puede consistir de DKFZP586E1621, SOD2, DUSP6, EEF1A2 , BRF2 , SNRPG, NUMA1 , y AKR1B1. Un predictor de clase de 12 genes puede consistir de TLR2, LGALS3 , DKFZP586E1621 , SOD2, DUSP6, KIAA0S69, EEF1A2, BRF2 , SNRPG, NU A1, AKR1B1, y SMARCE1. Un predictor de clase de 14 genes puede consistir de TLR , LGALS3, D FZP586E1621 , SOD2 , DUSP6 , ????0669, IL1RN, EEF1A2, BRF2 , SNRPG, NUMA1, AKR1B1 , SMARCE1, y MSF. Un predictor de clase de 16 genes puede consistir de TLR2 , LGALS3, DKFZP586E1621, S0D2 , DUSP6, KIAA0669, IL1RN, KIAA.0410, EEF1A2 , BRF2 , SNRPG, NUMA1, AKR1B1, SMARCE1, MSF, y PTMA. Un predictor de clase de 18 genes puede consistir de TLR2 , LGALS3, DKFZP586E1621 , S0D2 , DUSP6, KIAA0669, IL1R , KIAA0410, T54, EEF1A2 , BRF2 , SNRPG, NUMA1 , AKR1B1, S ARCE1, MSF, PTMA, y PSMD3. Finalmente, un predictor de clase de 20 genes puede consistir de EEF1A2, TLR2, BRF2 , LGALS3, SNRPG, DKFZP586E1621, NUMA1 , SOD2 , AKR1B1, DUSP6, SMARCE1, KIAA0669, MSF, IL1RN, PTMA, KIAA0410, PSMD3 , T54 , C1QBP, y OSR1. En otra modalidad preferida, el predictor de clase comprende (1) al menos 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 genes seleccionados del grupo que consiste de TLR2 , LGALS3 , DKFZP586E1621, SOD2 , DUSP6, KIAA0669, IL1RN, KIAA0410, T54 y OSR1, y (2) al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, ó 10 genes seleccionados del grupo que consiste de EEF1A2 , BRF2, SNRPG, NUMA1, AKR1B1, SMARCE1, MSF, PTMA, PSMD3 y C1QBP . Aun en otra modalidad preferida, el predictor de clase comprende o consiste de 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo que consiste de CD44, KIAA0410, MARCO, MAP3K8, NSP-CL, PIP5K1C, NRG1, RAB31 , LGALS3, MEF2D, ITGA7, LHFPL2, ETS2 , KHSRP, ENIGMA, UNK_AF038187 , RAB13 , TLR2, T54 y DUSP6.
Todavía en otra modalidad preferida, el predictor de clase comprende o consiste de 2 , 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo que consiste de CD44, CRADD, CCRL2, KIAA0837, KIAA0707, KIAA1113, EREG, U K_AL050119, PPARD, CTSL, ATP2B1, UNK_AF052115 , MITF, STAT3 , KIAA0410, TPD52L2, UNK_AI732885 , MARCO, LOC64116, y PDNP2. Los predictores de clase de, esta modalidad pueden usarse para predecir RCC, cáncer de próstata, cáncer de cabeza/cuello, y sin enfermedad. Todavía aun en otra modalidad preferida, el predictor de clase comprende o consiste de 2, 4, 6, 8, 10, 12, 14, 16, 18 ó 20 genes seleccionados del grupo que consiste de UMA1, CXCR4, IL10RA, M9, FAU, BRF2 , RPS6 , EEF1A2 , BAG5, AKR1B1, UNK_AL022721, C1QBP, DKZP586E0820 , NONO, PSMD3 , I K_N74607, UNK_AI743507, MAPKAPK5, y UNKJJ79297.. Los predictores de clase de esta modalidad pueden usarse para predecir tumor sólido contra libre de tumor sólido, sin tener en cuenta el tipo particular de tumor sólido. El tumor sólido predecible en esta modalidad incluye RCC, cáncer de próstata y cáncer de cabeza/cuello. En una modalidad, los niveles de expresión de referencia de genes de enfermedad RCC, tales como niveles de expresión elevados de humanos sin enfermedad o RCC conocido o pacientes con tumor sólido, se almacenan en una base de datos y se recuperan fácilmente. En otra modalidad la comparación entre los perfiles de expresión de varios genes se realiza electrónicamente, tal como usando un sistema de computadora. Comprende un procesador acoplado a una memoria que almacena datos que representan los perfiles de expresión a compararse. Preferiblemente la memoria se lee así como se rescribe. Los datos de expresión almacenados en la memoria pueden cambiarse, recuperarse, o manipularse de otra manera, la memoria también almacena uno o más programas capaces de causar que el procesador compare los perfiles de expresión almacenados. Por ejemplo, el programa puede ser capaz de ejecutar un algoritmo de votación ponderado. El procesador también puede acoplarse a un analizador de configuración de polinucleótido y es capaz de recibir señales del analizador. En otra modalidad, el umbral de confianza se establece para optimizar la exactitud de predicción y minimizar la incidencia de resultados tanto positivos falsos como negativos falsos. Los registros de confianza promedio colectados del grupo acumulado de pacientes correctamente diagnosticados e individuos sin enfermedad correctamente no diagnosticados, puede calcularse y un rango de referencia de valores, para el diagnóstico de conjunto de gen predictivo particular en cuestión, puede reportarse.
F. Otras aplicaciones El análisis de expresión de gen sistemático de esta invención puede usarse para identificar genes que se expresan diferencialmente en muestras de sangre periférica aisladas en diferentes etapas de progreso, desarrollo o tratamiento de RCC y/u otros tumores sólidos. Los genes de esta manera identificados son marcadores moleculares para monitorear el progreso, desarrollo o tratamiento de RCC y/u otros tumores sólidos . Los genes de esta manera identificados también pueden usarse como marcadores substitutos para evaluar la eficacia del tratamiento para RCC u otros tumores sólidos. Un enfrentamiento clínico que concierne a RCC y otros tumores sólidos es la respuesta altamente variable de los pacientes a la terapia. El concepto básico de farmacogenómicos se entiende como el genotipo del paciente con relación a las opciones de tratamiento disponibles y luego se individualiza la opción más apropiada para el paciente. Pueden crearse diferentes clases de pacientes y/u otro tumor sólido con base en sus respuestas diferentes a una terapia dada. Los genes diferencialmente expresados en estas clases pueden identificarse usando el análisis de expresión de gen global. Los genes de esta manera identificados pueden servir como marcadores predictivos para predecir si un paciente particular será más o menos receptivo a una terapia dada. Para pacientes predichos se tienen un resultado favorable para la terapia, pueden considerarse esfuerzos para minimizar la toxicidad de la terapia, mientras que para aquellos predichos que no responderán a la terapia, puede usarse el tratamiento con otros regímenes de terapia o experimentales . La presente invención también contempla vectores de expresión que codifican los genes de enfermedad RCC. Los genes de enfermedad RCC pueden sub-expresarse en células de tumor RCC. Al introducir los vectores de expresión en los pacientes, la expresión anormal de los genes objetivo puede corregirse . La expresión apropiada o vectores de entrega de genes son bien conocidos en el arte. Preferiblemente, estos vectores son vectores virales, tales como vectores retrovirales, lentivirales, adenovirales virales asociados con adeno (AAV) , virales del herpes, o alfavirus. Los vectores virales también son vectores astrovirus, coronavirus, ortomixovirus , papovavirus, paramixovirus, parvovirus, picomavirus, virus de sarampión o togavírus virales . La administración de constructos de expresión no se limita a los vectores virales arriba mencionados. Otros métodos de administración también pueden emplearse. Estos métodos incluyen vectores de expresión de ácido nucleico, ADN condensado policationico enlazado o no enlazado para eliminar el adenovirus, enlaces de ligando, pistolas de genes, radiación ionizante, neutralización de carga nucleica o fusión con membranas celulares. También puede emplearse ADN desnudo. Los métodos ejemplares para usar ADN desnudo se conocen en el arte. La eficiencia de absorción puede mejorarse usando perlas de látex biodegradables . Este método puede mejorarse además por el tratamiento de las perlas para incrementar su hidrofobicidad. Los métodos basados en liposomas también pueden usarse. Además, esta invención contempla vectores de expresión capaces de expresar secuencias que son antisentido a un gen de la enfermedad de RCC de interés . El gen de enfermedad RCC de interés puede sobre expresarse en RCC u otros pacientes de tumor. sólido. Al introducir un vector de expresión antisentido en estos pacientes, la expresión anormal del gen puede corregirse . Un polinucleótido "antisentido" comprende una secuencia de nucleótido que es complementaria a un polinucleótido "sentido" que codifica una proteina. Un polinucleótido antisentido puede unirse por medio de enlaces de hidrógeno a estos polinucleótidos . El polinucleótido antisentido puede ser complementario a una hebra de codificación completa del gen objetivo, o una porción de la misma. En una modalidad, la molécula de polinucleótido antisentido es antisentido a "una región no codificada" en la hebra codificada del gen ob etivo. Los polinucleótidos antisentido pueden diseñarse de conformidad con las reglas de apareamiento de bases de Watson and Crick. Estos pueden ser oligonucleótidos que son antisentidos solo a una porción del gen objetivo. Un polinucleótido antisentido puede ser, por ejemplo, de alrededor de 5, 10, 15, 20, 25, 30, 35, 40, 45 o 50 nucleotidos en longitud. Un polinucleótido antisentido puede construirse usando síntesis química y reacciones de ligado enzimático como se aprecia por alguien de experiencia en el arte. Por ejemplo, un polinucleótido antisentido (por ejemplo, un oligonucleótido antisentido) puede sintetizarse químicamente usando nucleotidos que se presentan naturalmente o diversos nucleotidos modificados designados para incrementar la estabilidad biológica de las moléculas o para incrementar la estabilidad física del dúplex formado entre los polinucleótídos sentido y antisentido. Alternativamente, el polinucleótido antisentido puede producirse biológicamente usando un vector de expresión en el cual el polinucleótido se ha subclonado en una orientación antisentido (esto es, ARN transcrito del polinucleótido insertado será de una orientación antisentido al polinucleótido objetivo de interés) . Los polinucleótídos antisentido pueden administrarse a un sujeto o aplicarse in situ de tal manera que hibridizan o unen los ARN celulares y/o ADN geonómicos del gen objetivo, por lo que se inhibe la expresión del gen objetivo. La hibridización puede resultar en un dúplex estable por medio de una complementariedad de nucleótido convencional . Una ruta ejemplar para administrar polinucleótidos antisentido incluyen la inyección directa en el sitio de tejido; los polinucleótidos antisentido también pueden modificarse primero, y luego administrarse sistémicamente . Por ejemplo, para administración sistémica, las moléculas antisentido pueden modificarse de tal manera que se unan específicamente a los receptores o antígenos expresados en una superficie celular seleccionada. Las modificaciones apropiadas incluyen enlazar los polinucleótidos antisentido a péptidos o anticuerpos que se unen a los receptores o antígenos de superficie celular. Además, los polinucleótidos antisentido pueden administrarse a las células usando vectores. Para alcanzar concentraciones intracelulares suficientes de las moléculas antisentido, pueden usarse promotores pol II o pol III fuertes en los vectores. En una modalidad, los polinucleótidos antisentidos son polinucleótidos oc-anoméricos . Una molécula de polinucleótido a-anomérico forma un híbrido de hebra doble específico con un ARN de complementariedad en el cual, contrario a las unidades ß usuales, las hebras corren en paralelo una a la otra. La molécula de polinucleótido antisentido también puede comprender un 2 ' -o-metilribonucleótido o un análogo ARN-ADN quimérico.
En otra modalidad, el polinucleótido antisentido es una ribozima. Las ribozimas son moléculas de ARN catalíticas con actividad de ribonucleasa que son capaces de desdoblar un polinucleótido de hebra sencilla tal como un ARNm, al cual tienen una región complementaria. De esta manera, las ribozimas pueden usarse para desdoblar catalíticamente transcritos de ARNm del gen objetivo con objeto de inhibir su expresión. Los ARNm transcritos del gen objetivo pueden usarse para seleccionar de un grupo de moléculas de ARN un - ARN catalítico que tiene una actividad de ribonucleasa específica. Alternativamente, la expresión del gen objetivo puede inhibirse al usar secuencias de nucleótidos complementarias a la región reguladora (por ejemplo, el promotor y/o los aumentadores) . Estas secuencias de nucleótidos pueden formar estructuras de hélice triple que previenen la transcripción del gen en las células objetivo. La expresión del gen objetivo también puede inhibirse usando interferencia de ARN ("ARNi" ) . Esta es un técnica usada en el silenciado de gen después de la transcripción ("PTGS"), en la cual la actividad del gen objetivo se elimina específicamente. El ARNi se asemeja en muchos aspectos al PTGS en plantas y se ha detectado en muchos invertebrados tal es el caso de tripanosomas, hydra, planaria, nemátodos y mosca de la fruta (Drosophila melanogaster) . Puede estar involucrado en la modulación de la movilización del elemento que se transpone y la formación de un estado antiviral . El ARNA y los sistemas de mamíferos se describen en la solicitud PCT WO00/63364. en una modalidad, el ARNds de al menos de alrededor de 21 nucleótidos, homólogo con el gen objetivo, se introduce en las células. Los anticuerpos contra los polipeptidos codificados por los genes de la enfermedad RCC también pueden prepararse y administrarse a pacientes con objeto de afectar la función de los genes de enfermedad RCC. En una modalidad, los anticuerpos puede reducir al menos 25% de la actividad del gen objetivo. Preferiblemente, los anticuerpos reducen al menos alrededor de 50% de la actividad del gen correspondiente. Altamente de manera preferible, los anticuerpos se reducen alrededor de 95-100% de la actividad del gen ob etivo. Puede hacerse una composición farmacéutica que comprende el anticuerpo o vector de expresión de esta invención. La composición farmacéutica también incluye un portador f rmacéuticamente aceptable. Como se usa en la presente "un portador farmacéuticamente aceptable" se pretende que incluya cualesquiera y todos los solventes, solubilizantes, rellenadores, estabilizantes, aglutinantes, absorbentes, bases, agentes amortiguantes, lubricantes, vehículos de liberación controlada, diluyentes, agentes emulsificantes, humectantes, lubricantes, medios de dispersión, recubrimientos, agentes antibacteriales o antihongos, agentes que retardan la absorción e isotónicos y similares, compatibles con la administración farmacéutica. El uso de tales medios y agentes para substancias farmacéuticamente activas son bien conocidas en el arte . Excepto en lo que respecta a cualquier medio convencional o agente que es incompatible con el compuesto activo, el uso de los mismos en las composiciones se contempla. También pueden incorporarse agentes complementarios en las composiciones . Una composición farmacéutica puede formularse para ser compatible con su ruta pretendida de administración. Los ejemplos de rutas de administración incluyen administración parenteral, por ejemplo, intravenosa, intradermal, subcutánea, oral (por ejemplo, inhalación) transdermal (tópica) , transmucosal y rectal . Las soluciones o suspensiones usadas para aplicación parenteral, intradermal, o subcutánea, pueden incluir los siguientes componentes un diluyente estéril tal como agua para inyección, solución salina, aceites fijos, polietilen glicoles, glicerina; propilen glicol u otros solventes sintéticos; agentes antibacteriales tales como alcohol bencílico o metil parabenos; antioxidantes tales como ácido ascórbico o bisulfato de sodio; agentes quelantes tales como ácido etilendiamintetraacético; amortiguadores tales como acetatos, citratos o fosfatos, y agentes para el ajuste de tonicidad tal como cloruro de sodio o dextrosa. El pH puede ajustarse con ácidos o bases, tal como ácido clorhídrico, o hidróxido de sodio. La preparación parenteral puede introducirse en ampolletas, jeringas desechables o viales de dosis múltiple hechos de vidrio o plástico. Los ejemplos de genes de enfermedad RCC apropiados que pueden usarse como objetivos de la terapia de gen o tratamiento de fármaco incluyen pero no se limitan a DUSP6, DRD2, ABL1, GUK1, MAP2K3, BSG, PPARG, TNNT1 , ERN1, C4A, CCR1, PPARD, PDXK, MMP9, PPP3CB, CHRNA4 , C8FW, PDNP2 , ALDH5A1, y GPR12. Otros ejemplos incluyen los genes de la enfermedad RCC que se sobre o subexpresan en los tejidos de tumor tanto PB Cs' y RCC . En una modalidad, la presente invención proporciona un kit que comprende uno o más polinucleotidos, cada uno del uno o más polinucleotidos es capaz de hibridizar bajo condiciones severas al gen seleccionado de la Tabla de genes 4. cualquier cebador/sonda de esta invención, o el complemento de la misma puede incluirse en el kit. Los polinucleotidos pueden etiquetarse con porciones fluorescentes, radioactivas, u otras detectables . En un caso, el uno o más polinucleotidos están contenidos, en viales, tubos, botellas u otros medios de contención. En otros caso, el uno o más polinucleotidos se unen establemente a un soporte sólido. La hibridización del ácido nucleico puede llevarse a cabo directamente en el soporte sólido.
Aún en otro caso, el kit contiene al menos 2, 3, 4, 5, 10, 15, 20 o más polinucleótidos, cada uno siendo un polinucleótido diferente capaz de hibridizar bajo condiciones severas al gen respectivo diferente seleccionado de la Tabla 4 de genes. En otra modalidad, el kit de la presente invención contiene uno o más anticuerpos capaces de enlazarse a los polipéptidos codificados por los genes seleccionados de la Tabla 4 de genes. Los anticuerpos pueden ser etiquetados o no etiquetados. Cualquier anticuerpo de esta invención puede incluirse en el kit. En un ejemplo el kit también incluye otros reactivos de inmunodetección tal como anticuerpos secundarios, controles o subtratos de enzima. En otro ejemplo, los anticuerpos están incluidos en uno o más recipientes. Aún en otros ejemplos, los anticuerpos se unen establemente a un soporte sólido tal como una película, membrana, matriz de columna o pozos de placa de microtitulación . Los inmun ensayos pueden realizarse directamente en el soporte sólido. Todavía aún en otro ejemplo, el kit contiene al menos 2, 3, 4, 5, 10, 15, 20 o más anticuerpos diferentes, cada anticuerpo diferente capaz de unirse a un polipéptido codificado por un gen respectivo diferente seleccionado de la Tabla 4 de genes. Se entenderá ' que las modalidades arriba descritas y los siguientes ejemplos se dan a modo de ilustración, sin limitación. Varios cambios y modificaciones dentro del alcance de la presente invención son aparentes para aquellos expertos en el arte a partir de la siguiente descripción.
G. Ejemplos Ejemplo 1. Aislado de ARN y preparación de objetivos de microconfiguración etiquetados. PBMCs de los ensayos clínicos se aislaron de muestras de sangre entera (8 mL) colectadas en tubos CPT de conformidad con un procedimiento estándar. Todas las muestras de sangre RCC y sin enfermedad se embarcaron o almacenaron durante la noche antes de procesar. Los PBMCs se purificaron sobre 'gradientes Ficoll, se lavaron 2 veces con PBS y se contaron. El ARN total se aisló de los peletizados PBMC usando el mini kit Rneasy (Qwiagen, Valencia, CA) . El objetivo etiquetado para las configuraciones de oligonucleótidos se preparó usando una modificación del procedimiento descrito en Lockhart, et al., Mature Biotechnology, 14: 1675-80 (1996) . Se convirtieron 2 µg de ARN total a AÍDNc al cebar con un cebador oligo-dT que contiene promotor de polimerasa de ADN T7 en el extremo 5' . El ADNc se usó como la plantilla para la transcripción in vitro usando un kit de polimerasa de ADN T7 (Ambison, Woodlands, TX) y CTP y U P (Enzo) biotinilados . El ARNc etiquetado se fragmentó en Tris-acetato 40 mM pH 8.0, KOAc 100 mM, MgCAc 30 mg durante 35 minutos a 94 °C en un volumen final de 40 µ??.
Ejemplo 2. Hibridización para microconfiguraciones Affymetrix y para detección de fluorescencia. Se hibridizaron muestras sin enfermedad y de RCC individuales a una microplaqueta génica HgU95A (Affymetrix) . No se agruparon muestras. Se involucraron en el estudio 45 pacientes RCC y 20 voluntarios sin enfermedad. Los tumores de los pacientes RCC se clasificaron histopatológicamente como subtipos de carcinoma de célula renal específicos usando la clasificación Heidelberg de tumores de células renal descrita en Kovacs, et al., J. Pathol, 183:131-133 (1997). Entre la 45 muestras de tumor RCC, 24 muestras se clasificaron como carcinoma convencionales (de células limpias) , una muestra se clasificó como granular, 3 muestras se clasificaron como capilares, 7 muestras se clasificaron como subtipos mezclados, y 10 muestras de tumor se clasificaron como desconocidos . Se diluyeron 10 µg del objetivo etiquetado en solución amortiguadora 1 x MES con 100 µg/ml de ADN de esperma de arenque y 50 µg/ml de BSA acetilado. Para normalizar las configuraciones una a cada otra y para estimar las sensibilidad de las configuraciones de oligonucleótido, se incluyen transcritos sintetizados in vitro de 11 genes bacteriales en cada reacción de hibridización como se describe en Hill et al., Science, 290: 809-812 (2000). La abundancia de estos transcritos está en el rango desde 1:3000, 000(3 ppm) hasta 1:1000 (1000 ppm) establecidos en términos del número de transcrito de control por transcritos totales . Como se determina por la respuesta a la señal de estos transcritos de control, la sensibilidad de detección de las configuraciones está en el rango entre alrededor de 1:300,000 y 1:100,000 copias/millón . Las sondas etiquetadas se desnaturalizaron a 99°C durante 5 minutos y luego 45°C durante 5 minutos y se hibridizaron para configuraciones de oligonucleótidos que comprenden sobre 12,500 genes humanos (HgU95A, Affymetrix) . Las configuraciones se hibridizaron durante 16 horas a 45 °C. la solución amortiguadora de hibridización comprende de MES 100 mM, [Na+] 1 M, EDTA 20 mM y Tween 20 al 0.01%. después de la hibridización, los cartuchos se lavaron extensivamente son solución amortiguadora de lavado (6x SSPET) , por ejemplo, 3 lavados de 10 minutos a temperatura ambiente. Esta hibridización y las condiciones de lavado se refieren colectivamente como "condiciones de hibridización de configuración de ácido nucleico" . Los cartuchos de lavado luego se tiñen con ficoeritrina acoplada a estreptavidina . Soluciones de reserva MES 12x que contiene MES 1.22 y [Na+] 0.89 M. Para 1000 mi, la solución de reserva puede prepararse al mezclar 70.4 g de monohidrato de ácido libre de MES, 193.3 de sal de sodio de MES y 800 mi de agua de grado biológico molecular y ajustar el volumen hasta 1000 mi. El pH deberá estar entre 6.5 y 6.7. la solución amortiguadora de hibridización 2x puede realizarse al mezclar 8.3 ttiL de solución de reserva 12x MES, 17.7 mL de NaCl 5 M, 4.0 mL de EDTA 0.5 M, 1.0 mL de T een 20 al 10% y 19.9 de agua. 6x SSPET contiene NaCl 0.9 M, NaH2P0 60 mM, EDTA 6 mM, pH 7.4 y Tritón X-100 al 0.005%. En algunos casos, la solución amortiguadora de lavado puede prepararse con una solución amortiguadora de lavado más severa. Pueden prepararse 1000 mL de solución amortiguadora de lavado severa al mezclar 8.3 mL de solución de reserva 12x MES, 5.2 de NaCl 5 M, 1.0 mL de Tween 20 al 10% y 910.5 mL de agua.
Ejemplo 3. Análisis de datos de expresión de genes Se realizó el análisis de datos en valores de intensidad fluorescente en bruto usando el software GENECHIP 3.2 (Affymetrix) . El software GENECHIP 3.2 utiliza un algoritmo para calcular la probabilidad de que un gen esté "ausente" o "presente" así como un valor de intensidad de hibridización específico o "diferencia promedio" para cada transcrito representado en la configuración. Los algoritmos usados en estos cálculos se describen en Affymetrix GeneChip Análisis Suite User Guide (Affymetrix) . La "diferencia promedio" para cada transcrito se normaliza hasta los valores "de frecuencia" de conformidad con los procedimientos de Hill et al., Science, 290:809-812 (2000). Estos se realiza al referir los valores de diferencia promedio en cada microplagueta hasta una curva de calibración construida a partir de los valores de diferencia promedio para los 11 transcritos de control con una abundancia conocida que se clavan en cada solución de hibridación. Este proceso también sirve para normalizar entre configuraciones. Los transcritos específicos se evalúan además si reúnen los siguientes criterios. Primero, los genes que se designan "ausentes" por el software GENECHIP 3.2 para todas las muestras se excluyen de los análisis. Segundo, en comparación de los niveles de transcrito entre las configuraciones, se requiere un gen que este presente en al menos 1 de las configuraciones. Tercero, para configuraciones de los niveles de transcrito entre los grupos, se aplica una prueba t de Student para identificar un subconjunto de transcritos que tienen una diferencia importante (p < 0.05) en valores de frecuencia. En ciertos casos, un cuarto criterio, que requiere que los cambios en veces de promedio en los valores de frecuencia a través del subconjunto estadísticamente importantes de genes sea de 2 veces o más , también se usa . El agrupado jerárquico no supervisado de genes y/o configuraciones con base a sus similitudes de expresión, se realiza utilizando el procedimiento descrito en Eisen, et al., Proc. Nat . Acad. Sci . , U.S.A., 95:14863-14868 (1998). Los análisis de predicción de vecindad cercana y análisis de agrupados supervisados se realizan usando las medidas ilustradas en Golub et al., Science, 286: 531-537 (1999). Para el agrupado jerárquico y el análisis de predicción de vecindad cercana, los datos se transforman log y se normalizan para tener un valor medio de 0 y una variación de 1. Se usa una prueba t de Student para comparar los perfiles de expresión PBMC sin enfermedad para perfiles PBMC de carcinoma renal. En las comparaciones, el valor p < 0.05 se usa para indicar una importancia estadística. Los perfiles de expresión en varios tejidos también pueden accederse y descargarse de la base de datos BioExpress. (geneLogic, Gaithersburg MD) . El software GeneLogic GX2000 con base en las herramientas de análisis incluye los análisis de cambio de pliegues y los inmunoprecipitados electrónicos pueden utilizarse para calcular los cambios de pliegues y distribución de valores de expresión, y perfiles de expresión para diferentes muestras pueden exportarse usando la herramienta de análisis de expresión para un análisis adicional en el paquete de agrupamiento jerárquico (Eisen, et al., Proc. Nat . Acad. Sci. U.S.A., 95: 14863-14868 (1998)). Un enfogue de vecindad cercano a K se usa para realizar un análisis de vecindad de datos permutados aleatoriamente y reales usando una correlación métrica (P (g, c) =µ1-µ2 /s? + s2) donde g es el vector de expresión de un gen, c es la clase de vector, µ? y s? define el nivel de expresión medio y la desviación estándar del gen en la clase 1 y 2µ y s2 define el nivel de expresión medio y la desviación estándar del gen en la clase 2. Las mediciones de correlación para los 246 genes sobrerregulados más estadísticamente importantes de las clases definidas reales (RCC contra sin enfermedad) se compara para las mediciones más estadísticamente importantes de la correlación observada en distinciones de clase aleatoriamente permutadas. Las mediciones de distancia de 1%, 5% y medias superiores de 100 clases aleatoriamente permutadas en comparación con las mediciones de distancia observada para las clases RCC y sin enfermedad se agrupan. La figura 1 describe la verificación estadística de los genes de enfermedad RCC identificados en esta invención.
Ejemplo 4. Identificación de genes de enfermedad RCC en sangre periférica Las tablas 6 y 7 enlistan 184 genes de enfermedad RCC que se colocan en un rango por el número de muestras en las cuales el gen se hace presente (# Presente) . El valor p de la prueba T de Student ("prueba T (valor p)") para cada uno de los 184 genes de enfermedad RCC también se enlista en la tabla 6. Llamadas "presentes" se calcula usando el software GENECHIP 3.2 al estimar si un transcrito se detecta en una muestra con base en la fuerza de la señal del gen en comparación con el respaldo. Ver GeneChip® Expresión Análisis Technical Manual, 701021 Rev. 3 (1999-20002 Affymetrix, Inc . ) . Los valores de "diferencia promedio" para cada transcrito se normalizan a los valores "de frecuencia" usando un método de normalización de frecuencia en escala en el cual las diferencias promedio para 11 ARNc de control con picos de abundancia conocidos en cada solución de hibridización se usan para generar una curva de calibración global. Ver Hill et al., Genome Biol . , 2(12); Research 0055.1-0055.13 (2001) que se incorpora en la presente en su totalidad para referencia. Esta calibración se usa entonces para convertir los valores de diferencia promedio de todos los transcritos de estimados de frecuencia, establecidos en unidades de parte por millón (ppm) que pueden estar en el rango, pero que no se limitan a, desde 1:300,000 (esto 3 ppm) hasta 1:1000(1000 ppm) . El análisis de perfil de expresión de 20 muestras de ARN PBMC sin enfermedad y 45 muestras de ARN PBMC RCC revelan que de los 12,626 transcritos en la microplagueta HgU95A, 5,249 transcritos cumplen los criterios iniciales para un análisis adicional. Los criterios iniciales son (1) tener al menos una llamada presente, y (2) al menos una frecuencia estará sobre 10 ppm. En promedio, 4023 transcritos se detectan como "presentes" en los 45 PB Cs RCC, mientras 4254 transcritos expresados se detectan como "presente" en 20 PBMC sin enfermedad . El porcentaje de coeficientes de variación (esto es, la frecuencia media/ S.D. X 100) de cada uno de los 5,249 transcritos originales nivelados a través de ambos grupos de muestra (45 RCC, 20 sin enfermedad o PBMC normales) se calculan (% COV) . Los transcritos se colocan en rangos donde el gen menos variables a través de las muestras RCC recibe un rango RCC COV = 1 y el gen más variable a través de las muestra RCC recibe un rango RCC COV = 5249. Este proceso se repite para las 20 muestras PBMC sin enfermedad (normal) y el rango COV se calcula de manera similar, esto es, el gen menos variables a través de las muestras RCC sin enfermedad recibe un rango de norma COV = 1 y el gen más variable a través de las muestras sin enfermedad recibe un rango de norma COV = 5249. Además, las veces de cambio se calculan como la frecuencia promedio RCC / frecuencia promedio normal, donde un número igual a o mayor a 2.0 se considera que representa un transcrito inducido en RCC PBMCs. Las veces de cambio para cada uno de los 5249 transcritos se describe en la Tabla 6. el numero de muestras que posee niveles mayores a 10 ppm (" # Freq > 10") también se presentan en la Tabla 6 para cada transcrito. Por otro lado, el número de muestras en done le transcrito se dice presente a través de los 45 RCC ("# presente de RCC"), presente llamado a través de 20 normales " (# número normal presente") presente en niveles mayores a 10 ppm a través de 45 RCC ("# Freq > 10RCC") y presente a niveles mayores 10 ppm a través de 20 normales (w# Freq > 10 Norm" ) se reportan en las tablas 6 y 7. Un análisis de cambio de pliegues y prueba t de Student (distribución de 2 configuraciones, variación desigual de 2 muestras) identifica transcritos diferencialmente expresados entre RCC PBMC y PBMCs sin enfermedad. Los niveles de transcrito de los 184 genes de enfermedad RCC mostrados en las Tablas 6 y 7 difieren en promedio de 2 veces o mayor entre PBMCs sin enfermedad y RCC con un valor p desajustado debajo de 0.001 en una prueba T entre los grupos. De estos, 132 transcritos se expresan en al menos 15 % de la muestras PBMC (presente en 10 o más de los 65 perfiles) . Adicionalmente, la posibilidad dé que las diferencias observadas en los perfiles de expresión de peletizados PBMC de RCC purificados por CPT y peletizados PBMC sin enfermedad purificados por CPT se investigan simplemente. Un coeficiente de correlación para cada nivel de expresión de gen con el nivel de granulocitos, linfocitos, y monocitos medidos en muestra PBMC se calcula. La correlación relativa de expresión de cada gen con el nivel de cada tipo celular se coloca en el rango para determinar si los transcritos asociados con la enfermedad detectados en PBMC RCC se sobre expresan en una población celular dada. El rango relativo (de entre los 5,249 transcritos que pasan el filtro de datos inicial) correlaciona cada uno de los transcritos con los números absolutos de granulocitos, linfocitos y monocitos medidos en muestras PBMC se obtienen. Estos análisis indican que la vasta mayoría de transcritos asociados con la enfermedad identificados en PBMC de pacientes RCC no se correlacionan simplemente con la subpoblaciones celulares específicas en sangre periférica. Un enfoque de análisis de agrupación no supervisada inicial con muestras y genes jerárquicamente agrupados con base en los coeficientes de correlación (Eisen et al., supra) se realiza usando los 5,249 transcritos que pasan el criterio de filtrado inicial . La figura 2 describe un dendograma de muestras no relacionadas que usa los valores de expresión de gen expresados. Los perfiles de expresión PBMC del paciente RCC se denotan por barras blancas y los perfiles de expresión PBMC de voluntarios sin enfermedad se indican en barras negras . El dendograma agrupa la mayoría de los PBMCs (42/45) RCC en un ramillete específico de RCC sencillo mientras que los patrones de expresión de PBMCs sin enfermedad y un subconjunto pequeño de PBMCs (3/45) RCC forma un conjunto separado. Entre los 184 genes de enfermedad RCC enlistados en las Tablas 6a y 7, hay varios genes relacionados con la inflamación incluyendo el receptor 2 tipo Toll, galectina 3, antagonista del receptor IL-1 y acuaporina-9, un canal acuso implicado en la migración de leucocitos. Los niveles sin cambio de muchas otras citocinas, quimiocinas y sus respectivos receptores entre los PBMCs normales y RCC sugieren que una activación específica, en vez de global de los PBMC constituye parte de la firma de enfermedad en la sangre periférica RCC. Un número substancial de los transcritos detectados como que cambian significativamente en los PBMCs de pacientes RCC que poseen un grado importante de variabilidad a través de los perfiles PBMCs RCC. Esto indica que mientras los niveles de estos transcritos son significativamente distintos de los niveles en PBMC normales, hay una heterogeneidad relativa de expresión de estos transcritos a través de pacientes RCC. Será de mayor interés determinar si cualesquiera de estos transcritos variables todavía significativamente asociados con la enfermedad en los PBMC de RCC estarán correlacionados con cualquier categoría clínica de respuesta, una vez que los índices clínicos de resultado y seguimiento se miden satisfactoriamente en estos pacientes.
Tabla 6. 184 TRANSCRIPTOS ASOCIADOS A ENFERMEDADES EN PACIENTES CON RCC Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec. LO GenBank COV COV pliege 5 AF051152 Receptor 2 tipo toll Hs .63668 3753 2841 2.5 4.824E-10 65 61 AB006780 Lectina, galactosida enlazada, Hs .621 3123 2648 2.1 2.373E-09 65 65 soluble, 3 (galectina 3) AF032886 Caja 03A de forkhead Hs.14845 4751 2553 2.9 1.823E-07 65 63 64925 Proteina de membrana, Hs.1861 4885 3740 3.4 2.921E-07 65 65 10 palmitoilado 1 (55kD) X12451 Catepsina L Hs.78056 4948 4959 3.5 1.053E-06 65 64 D32143 biliverdina reductasa B (flavina Hs.76289 4978 4946 3.8 1.176E-06 65 51 reductasa) ÍNADPH) AF079221 proteína tipo 3 que interactúa Hs.132955 4973 738 3.4 1.667E-06 65 65 con el BCL2/adenovirus E1B 19kD 15 L76200 guanilato cinasa 1 Hs.3764 4702 545 2.3 2.341E-06 65 65 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege 25915 Clus erina (inhibidor de Hs.75106 4671 2556 2.2 5.652E-06 65 65 5 complemento de lisis, SP-40, mensajero 2 de próstata reprimido en testosterona, apolipoproteina J) X12496 Glicoforina C (grupo sanguíneo Hs.81994 4784 2756 2.3 8.074E-06 65 65 Gerbich) L07648 Proteína 1 de interacción MAX Hs.118630 5017 3607 3.1 1.054E-05 65 65 24069 proteína A de dominio de choque 198726 5080 1964 4.3 1.214E-05 65 62 frío L07648 Proteína 1 de interacción MAX Hs.118630 4993 1677 2.7 1.961E-05 65 65 D14874 Adrenomedulina Hs.394 4945 4139 2.5 2.328E-05 65 64 15 AL050254 Proteína 7 de caja F Hs.5912 4969 39 2.3 4.875e-05 65 65 X17644 Transición 1 de fase Gl hasta S Hs.2707 5068 1732 2.8 0.0001073 65 44 AI565760 Factor 2 de expresión de Hs.6518 4966 527 2.2 0.0001082 65 65 gangliosida Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al ünigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege V00505 Hemoglobina, delta Hs.36977 5167 5070 6.4 0.0001176 65 58 X79535 Tubulina, polipéptido beta Hs.336780 4836 4393 2.0 0.0001308 65 41 5 U76248 Homologo 2, siete en Hs.20191 4982 395 2.1 0.0001703 65 62 abstinencia (Drosofila) AB013382 Fosfatasa 6 de especificidad Hs.180383 4363 4916 3.2 2.665E-09 64 44 dual AF025533 Receptor tipo leucocito Hs.105928 4281 3711 2.3 1.796E-07 64 62 inmunoglobulina, subfamilia B (con dominios TM y ITIM) , 3 miembros U05770 Anexina A5 Hs.300711 3405 4405 2.1 1.998E-0.7 64 54 X60364 Aminolevulinato, delta-, Hs.323383 5066 4919 6.8 7.041E-07 64 65 cintaza 2 15 (sideroblástico/anemia hipocrónica) AF001 61 Proteina enlazada al elemento Hs.285313 3489 5175 2.2 2.229E-05 64 62 promotor de núcleo Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente freOlO GenBank COV COV pliege Z35491 Atanogen asociado a BCL2 Hs. 1714 5040 1910 2.6 8.933E-05 64 63 D83664 Proteina A12 enlazada a calcio Hs.19413 5048 4905 2.3 0.0005046 64 50 5 S100 (calgranulina C) L19185 Peróxido de reductasa 1 Hs.16354 5130 4840 3.0 0.0005744 64 35 dependiente de tioredoxina (antioxidante 1 especifico de tiol, factor B aumentador de la 10 eliminación natural M24470 Monofosfato reductasa de Hs.1435 5095 4312 2.6 0.0006112 64 47 guanosina X97324 Proteina relacionada con la Hs.3416 5170 2819 3.6 0.0009168 64 64 diferenciación de adiposa; 15 adipofilina X52015 Antagonista receptor de Hs.81134 4900 5136 4.1 1.249E-07 63 59 interleucina 1 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege AB008775 Aquaporina 9 Hs.104624 4467 4955 2.5 6.609E-07 63 39 J02973 Trombomodulina Hs.2030 4665 5035 2.1 6.829E-05 63 57 D87116 Proteína cinasa activada por Hs.180533 4377 4016 2.1 1.391E-06 62 65 miogen cinasa 3 N74607 ESTs, altamente similar a Hs.234642 4662 4739 0.4 0.0001043 62 50 AQUAPORIN 3 [H.sapiens] M36820 Oncogen GR02 Hs.75765 5077 5213 3.0 0.0002266 62 46 M38690 Antígeno CD9 (p24) Hs.1244 4838 5074 2.0 0.0005439 62 26 X90999 Hidroxiacil glutation hidrolasa; Hs.155482 5138 4356 4.3 0.0001189 61 35 glioxalasa 2 M94856 Proteína 5 enlazada al ácido Hs.153179 4992 5080 3.4 4.231E-06 60 31 graso (asociada con la psoriasis) Z32684 Precursor del grupo sanguíneo Hs.78919 4994 2026 3.0 7.435E-06 60 22 Kell (fenotipo McLeod) Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege AF061034 Proteina inducible alfa del Hs.278898 4937 1223 2.5 1.229E-05 60 13 factor de necrosis de tumor con dominios de cremallera de leucina; proteina L que interactúa con Huntingtina J04102 Homólogo 2 del oncogen E26 del Hs.85146 4668 4364 2.1 2.14E-05 60 27 virus de eritroblastosis de aves 10 v-ets L42542 Proteina 1 enlazada a ralA Hs.75447 4795 3443 2.0 6.245E-05 60 17 AF141349 Tubulina, Beta 4864 5013 2.3 6.903E-05 60 29 D38583 Proteina All enlazada a calcio Hs.256290 4942 5084 2.4 0.0001294 60 45 S100 (calgizarina) 15 X04327 2,3-bisfosfoglicerato mutasa Hs.198365 5156 2762 3.4 0.0005919 60 19 J04027 ATPasa, transporte Ca++, Hs.78546 4590 4932 2.3 4.802E-06 59 38 membrana de plasma 1 AF141349 Tubulina, Beta Hs.336780 5011 4590 2.5 8.725E-05 59 34 Número de 7Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege Y00630 Inhibidor activador del Hs.75716 5022 5214 2.7 0.0001986 59 59 plasminogeno, tipo II (arginina- 5 serpina) U29091 Proteina 1 enlazada a selenio Hs.334841 5123 5032 6.9 1.249E-05 58 59 U28389 Banda 4.9 de proteina de Hs.274122 5102 3910 4.0 3.927E-05 58 65 membrana eritrocito (dematina) X64364 Basigina Hs.74631 5093 1296 3.6 5.217E-05 58 53 X00737 Nucleosido fosforilasa Hs.75514 4507 5038 2.0 0.0001001 58 39 M26683 Citocina A2 inducible pequeña Hs.30369 5139 5215 6.6 3.159E-05 57 49 (proteina 1 quimiotáctica de monccito, homólogo al Sig-e de ratón) AI349593 Hemoglobina, epsilon 1 Hs.117848 5064 5121 3.0 8.566E-0.5 56 13 L22075 Proteina enlazada a nucleotido Hs.1666 3815 4953 2.2 1.35E-06 53 20 guanina (proteina G) , alfa 13 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente freOlO GenBank COV COV pliege AA135683 Proteína 1 soluble en ácido Hs.79516 4198 4148 2.1 1.44E-06 53 32 cerebral U00672 Receptor 10 de interleucina, Hs.327 4277 4086 0.5 4.823E-05 53 54 alfa AL080235 Proteína DKFZP586E1621 Hs.35861 4889 3240 3.0 1.13E-06 52 23 K00650 Homólogo de oncogen viral de Hs.25647 5101 4029 0.5 0.0001975 52 55 osteosarcoma de murino v-fos 10 FBJ M28225 Citocina A2 inducible pequeña Hs.303649 5155 5197 6.7 5.68E-05 51 37 (proteína 1 quimiotáctica de monocito, homólogo al Sig-je de ratón) S78798 Isoforma C de agrupamiento Incl Hs.108966 4875 665 2.5 4.123E-06 50 10 S78798 :1-fosfatidilinositol-4- fosfato 5-cinasa [humano, PBLs, ARNm, 1835 nt] .
Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege AL049963 AKNm de hcmosapiens; ADNc Hs.284205 4651 4155 2.2 6.76E-06 50 18 DKFZp564Al32 (del clon 5 DKFZp564A132) L22005 Ciclo de división celular 34 Hs.76932 5082 4185 3.5 4.315E-05 50 29 K02401 Honrona 1 de somatomamotropina 4673 4930 0.4 0.000423 50 36 coriónica (lactogen de placenta) 10 X14787 Trorribospondin 1 Hs.87409 5001 5217 2.4 0.0004915 50 49 X75042 Homólogo de oncogen viral de Hs . 4313 2993 4933 2.3 5.819E-08 49 13 reticuloendoteliosis de ave v- rel AA131149 Proteína P enlazada a calcio Hs .2962 4970 5115 2.-4 0.0001709 49 35 S100 35999 Integrina, beta 3 (plaqueta de Hs.87149 4908 4341 2.6 1.011E-05 48 23 glicoproteína Illa, antígeno CD61) Número de 7Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege U21049 Protelna epitelial regulada en Hs.271473 4932 3123 2.3 3.94E-05 48 31 carcinoma, membrana asociada a 5 proteina 17 M19267 Tropomiosina 1 (alfa) Hs. 7899 4904 2893 2.3 2E-05 47 11 27819 Familia 4 del portador de Hs.185923 5134 5216 7.5 1.725E-05 46 42 soluto, intercambiador de anión, miembro 1 27492 Receptor de interleucina 1, tipo Hs.82112 4888 5142 2.4 9.826E-05 46 25 I X07834 Superóxido dismutasa 2, Hs.372783 4867 2075 2.5 3.956E-06 45 17 mitocondrial X72308 Citocina A7 inducible pequeña Hs.251526 5075 5097 3.6 3.391E 45 26 (proteina quimiotáctica de monocito 3) Número de /Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege AI679353 EST, débilmente similar a Hs.182611 5003 5154 2.5 0.0001701 45 14 5 ¡ADVERTENCIA DE ENTRADA ALU CLASE E! (H. Sapiens) L42243 Receptor 2 del ínterferón (alfa, Hs.173936 4415 3824 2.1 2.471E-06 44 13 beta y omega) D10925 Receptor 1 de quimiocina Hs.301921 4811 4666 2.5 5.121E-06 44 13 (porción C-C) D30783 Epiregulina Hs.115263 4998 3590 3.1 5.694E-06 44 18 S77763 Factor nuclear (derivado 2 de Hs.75643 5124 2980 3.2 0.0002806 42 12 eritroide) , 45 kD X79535 Túbulina, beta polipéptido 4780 5120 2.6 5.817E-06 41 42 U61836 ARNm de proteína de interacción Hs.92374 4788 4609 2.4 8.146E-06 41 14 15 de ciclina Gl supuesta humana, secuencia parcial Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al ünigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege 34480 Integrina, alfa 2b (glicoproteina Hs.785 5029 5006 3.1 2.414E-05 39 30 5 Iib de plaqueta del complejo Ilb/IIIa, antígeno CD41B) M63835 Fragmento Fe de IgG, la de alta Hs.77424 4809 4285 2.1 3.916E-05 39 11 afinidad, receptor para (CD64) AF017257 Homólogo 2 del oncogen E26 del 3987 897 2.1 3.459E-08 38 5 10 virus de la eritroblastosis de las aves v-ets ??527880 Sübcomplejo 1 beta de la NADH Hs.661 5081 4675 3.7 3.306E-05 37 28 deshidrogenasa (ubiquinona) , 7 (18kD, B18) AF065389 Tetraspan 5 Hs.20709 5021 953 2.4 8.816E-05 37 11 15 D86961 Compañero tipo 2 de fusión de Hs.79299 4939 2043 3.7 3.534E-07 35 12 HMGIC de lipoma Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege U61836 Secuencia parcial, ARNm de Hs.92374 5119 5156 4.2 7.33E-05 35 17 5 proteína de interacción de ciclina Gl supuesta humana AF026939 Proteína inducida por interferón Hs.181874 4750 4395 2.1 4.978E-05 34 14 con repeticiones 4 de tetraicopéptido 10 M25322 Selectina P (proteína de Hs.73800 5133 2402 3.1 0.0004767 33 15 membrana de gránulos 140 kD, antígeno CD62) ??007943 Producto de genes KIAA0474 Hs.75151 5057 4196 3.3 2.19E-05 30 65 60298 Banda de proteína de membrana de Hs.733 5179 3017 5.6 0.0003742 30 17 eritrocitos 4.2 15 X58851 Miosina, polipéptido ligero 4, Hs.356717 5151 3371 4.0 0.0002666 " 29 12 álcali, atrial, embriónico Numero de TAnotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec.MO GenBank COV COV pliege J05070 Metaloproteinasa de matriz 9 Hs.151738 4778 2918 2.3 4.644E-06 28 6 5 (gelatinasa B, gelatinasa 92kD, colagenasa tipo IV de 92 kD) U43774 Receptor para Fragmento Fe de Hs.193122 4777 4857 2.4 9.317E-06 27 10 IgA. AF052111 Secuencia de ARNm del clon Hs.21334 4215 3789 2.2 2.807E-07 26 2 10 23953 de homo sapiens AM87563 EST, altamente similares a la Hs.8836 4478 1311 2.2 3.825E-07 26 7 proteína CGI-56 (H. Sapiens) H12458 Placenta Soares yjl2d03 ADNc de 4250 4652 2.1 4.07E-06 26 57 homo sapiens Nb2HP clon IMAGE:148517 similar en 3' a 15 WNT6 Z23115 BCL2 como 1 Hs.305890 5086 5167 4.3 2.221E-05 26 22 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec. LO GenBank COV COV pliege U12471 Gen 1 de trombospondina humana, Hs.87409 5041 5030 2.9 5.46E-05 26 18 5 cds parcial L06895 Proteína de dimerización MAX Hs.109012 4985 3015 2.3 8.798E-05 26 6 AB023211 Peptidil arginina desiminasa Hs.33455 4936 4868 2.3 9.707E-05 26 8 tipo II D63940 Proteina 1 de interacción MAX Hs.118630 5114 1391 3.9 7.286E-05 25 10 10 X74039 Activador de plasrrdnógenc, Hs.179657 5033 2574 2.8 4.169E-05 24 7 receptor de urocinasa AB018293 Producto de gen KIAA0750 Hs.314434 5163 4386 4.9 0.0001921 24 17 978353 Familia 1 del portador de Hs.374464 3351 1336 2.1 1.947E-09 23 3 soluto (glutamato/transportador de aminoácido neutral) , miembro 4 AJ243797 Tres reparadores de cebador de Hs.278408 4915 5202 3.2 4.017E-06 23 15 exonucleasa 1 Número de dotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen, RCC normal de (valor p) presente frec>10 GenBank COV COV pliege U89606 Piridoxal cinasa (piridoxina. Hs.38041 5046 3734 2.4 0.0002111 23 8 5 vitamina B6) M19267 Tropomiosina 1 (alfa) Hs.77899 4274 771 2.1 3.017E-07 22 8 L35240 Enigma (proteína de dominio Hs.102948 3575 2807 2.1 3.028E-08 21 12 LIM) AL096737 ARNm de homo sapiens; ADNc Hs.5167 4814 4749 2.6 3.048E-06 19 64 10 DKFZp434F152 (del clon DKFZp434F152) D14689 Nucleoporina 214kD (CAIN) Hs.170285 4623 4524 2.2 6.273E-06 19 46 U36341 Familia 6 del portador de Hs.187958 5032 3765 2.7 6.494E-05 19 28 soluto (transportador neurotransmisor, creatina) , 15 miembro 8 77016 Tropomodulina Hs.170453 5186 2442 4.9 0.0007758 19 11 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec. LO GenBank COV COV pliege U91316 Tioéster hidrolasa acil Hs.8679 4502 2737 2.1 1.898E-06 18 12 5 coenzima A citosólica M62896 ARNm del pseudogen de Hs.348252 3841 3722 2.0 3.217E-07 17 4 lipocortina (LIP)2 humane, región tipo cds completa L40904 Receptor activado proliferativo Hs.100724 5141 4460 6.1 4.033E-05 16 20 10 de peroxisoma, gamma U66359 Proteína T54 Hs.100391 4764 2450 4.3 5.444E-09 15 13 W28931 EST, débilmente similares al Hs.283976 4933 5232 4.0 1.143E-06 15 29 factor de eraplame de 38 kDA (H. Sapiens) AB006537 Proteína accesoria del receptor Hs.173880 4072 1425 2.1 5.561E-08 13 1 1 de interleucina Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec.MO GenBank COV COV pliege U97067 Agrupamiento Incl U97067: ARtto Hs.58488 4819 4961 2.3 2.571E-05 13 6 5 de proteína de tipo catenina alfa de homo sapiens, cds completo U19599 Proteína X asociada a BCL2 Hs.159428 4039 4061 0.5 5.153E-05 13 6 628946 Proteína reguladora de emplame Hs.91142 3189 4910 2.5 5.017E-09 12 44 10 del tipo KH (proteína 2 ce enlace a FUSE) AI961220 Inhibidor de serina proteasa, Hs.181286 5035 2667 2.8 4.079E-05 12 4 Kazal tipo 1 AL049250 ARMn de homo sapiens; ADNc Hs.356390 5027 3940 2.3 0.0002155 12 5 DKFZp564D113 (del clon 15 DKFZp564D113) Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente freOlO GenBank COV COV pliege AL031230 Familia de la aldehido 4830 1089 2.3 6.562E-06 11 3 5 deshidrogenasa 5, miembro Al (succinaro semialdehído deshidrogenasa) U68111 Proteina fosfatasa 1, subunidad 4983 5109 3.0 1.282E-05 11 19 reguladora 2 (inhibidor) AF035819 Receptor macrófago con Hs.67726 4726 1966 2.6 4.175E-07 10 5 10 estructura de colágeno AJ000480 Fosfoproteina regulada por las Hs.7837 4716 2979 2.2 5.308E-06 10 5 trayectorias mitogénicas U58917 Receptor 17 de interleucina Hs.129751 4674 2850 2.0 1.796E-05 10 1 X90857 Gen telomérico conservado al Hs.19699 5074 2410 2.5 0.0003808 10 13 15 agrupamiento de alfa globina J05500 Espectrina, beta, eritrocitica Hs.47431 5122 4713 5.5 2.364E-05 9 17 (incluye esperocitosis, clínica tipo I) Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente freOlO GenBank COV COV pliege X54412 Colágeno, tipo IX, alfa 1 Hs.154850 5013 5050 2.5 0.0001267 9 28 5 X75593 RAB13, familia de oncogenes Hs .151536 4147 2502 2.3 2.116E-08 8 13 miembro RAS D38037 Proteína IB de enlace a F2Q6 Hs.77643 4886 4835 2.2 0.0001298 8 2 (12.6 kD) J02854 Cadena ligera 2 reguladora de Hs .9615 5111 1099 3.3 0.0001603 8 7 la miosina, isoforma de músculo liso AF034209 RIG tipo 5-6 Hs.166175 5042 3640 2.2 0.0004712 8 4 U24578 Componente del complemento 4? 5108 4986 2.7 0.0007918 8 15 AB011161 Fosfatidilinositol-4-fosfato 5- Hs.275182 4546 4539 2.9 3.707E-08 7 24 cinasa, tipo I, gamma 15 L23959 Factor de transcripción Dp~l Hs.79353 4621 1087 2.0 8.135E-06 7 2 64788 RAPl, proteína 1 activadora de Hs.75151 5153 1951 3.5 0.0004775 7 10 la GTPasa Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente freOlO GenBank COV COV pliege X51362 Receptor D2 de dopamina Hs.73893 4781 5203 3.4 4.287E-07 6 21 5 AB000520 Proteina adaptadora con Hs.105052 4462 1941 2.2 7.021E-07 6 3 homología de plecstrina y dominios de homología 2 src U43843 Homólogo neuro d4 (rata) Hs.159589 4124 4902 2.1 5.029E-06 6 5 D43642 Factor de transcripción similar Hs.2430 3926 4299 2.3 4. 73E-08 5 35 10 a 1 W26700 EST, altamente similares al Hs .6535 3942 4297 2.2 2.112E-07 5 5 cotransportador de fosfato inorgánico dependiente de Na+ específico del cerebro (R. Norvegicus) 15 844998 Polipéptido pancreático Hs.184606 4324 4714 2.3 5.173E-07 5 11 AJ223948 Familia de la helicasa del ARN Hs.48295 5034 1093 2.4 0.0001437 5 3 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec>10 GenBank COV COV pliege AJ000644 Proteína POZ del tipo pequeñas Hs.129951 4924 2873 2.0 0.0001677 5 4 5 manchas W27095 Proteína B7 Hs.155586 4896 4612 0.5 0.0005773 5 29 AF032108 Integrina, alfa 7 Hs.74369 3876 2021 2.0 8.428E-08 4 1 M13207 Factor 2 estimulador de Hs.139 4803 3030 2.9 3.338E-07 4 7 colonias (granulocitos- macrófagos) AF059202 Homólogo de diacilglicerol 0- Hs.288627 4782 4723 2.6 2.08E-06 4 10 aciltransferasa (ratón) X82460 Hidroxiprostaglandina Hs.77348 4818 4170 2.3 1.647E-05 4 3 deshidrogenasa 15 (NAD) AJ011712 Troponina TI, esqueletal, lenta Hs.73980 4935 1426 2.0 0.0001917 4 2 L37127 Polimerasa (AN) II (dirigida por Hs.80475 5104 1098 2.9 0.0002842 4 5 ADN) polipéptido J (13.3 kD) Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al ünigen RCC normal de (valor p) presente frec. LO GenBank COV COV pliege AF089814 Supresor de tumor eliminado en Hs.355753 5038 2134 2.2 0.0003873 4 2 5 el relacionado 1 al cáncer oral L07592 Receptor activado proliferativo Hs.106415 4163 4744 2.4 9.857E-08 3 18 de peroxisoma, delta AB020644 Gen 2 de acil-CoA sintetasa Hs.14945 4424 4306 2.0 7.813E-06 3 4 grasa extensa 10 AF068706 Complejo de proteína Hs.343244 5113 1688 4.1 5.554E-05 3 12 relacionado con el adaptador 1, gamma 2 subunidad AF059198 ER a señalización del núcleo 1 Hs.137575 4683 5101 2.1 0.0001249 3 17 AF055027 Arginina metiltransferasa 1 Hs.143696 4999 2921 2.1 0.0002883 3 6 asociada con el coactivador 15 L03785 Miosina, péptido ligero 5, Hs.170482 5154 3757 3.0 0.0009999 3 8 regulador Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec.XLO GenBank COV COV pliege X91348 Transcrito no codificador Hs .335328 3774 2545 2.1 2.892E-08 2 1 5 supuesto (región 5 critica de DiGeorge) L32831 Receptor 3 acoplado a la Hs.66542 4578 5177 2.6 3.18E-06 2 18 proteina G 732885 Región BRCA2 humana, secuencia Hs.142907 4892 681 2.1 4.626E-05 2 2 10 de ARNm CG011 U96919 Inositol polifosfato-4- Hs.32944 5118 3038 3.2 0.0002322 2 7 fosfatasa, tipo I, 107 kD U6233 Receptor colinérgico, Hs.10734 5089 5189 2.8 0.0004996 2 9 nicotinico, alfa polipéptido 4 AF05500 ARlsta de homo sapiens para Hs.118463 4378 3305 2.5 5.537E-08 1 58 15 huérfano de hígado desconocido J05581 Mucina 1, transmembrana Hs.89603 4634 4942 2.7 4.138E-07 1 10 Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec. LO GenBank COV COV pliege U48213 Proteína de enlace del sitio D Hs.155420 4812 3542 0.4 1.723E-06 1 32 5 del promotor de albúmina (recuadro albúmina D) D45421 Fosfodiesterasa I/pirofosfatasa Hs.174185 4753 2549 2.4 2.976E-06 1 4 2 de nucleótido (autotaxina) AF017786 Fosfatasa de ácido fosfatícico Hs.173717 4679 680 2.1 5.747E-06 1 3 tipo 2b AB010419 Factor de enlace al núcleo, Hs.110099 5065 3641 3.4 2.068E-05 1 11 dominio runt, subunidad alfa 2, transubicado a 3 AF070587 Secuencia de ARNm clon 24741 de Hs.25770 4869 4801 2.2 6.352E-05 1 13 homo sapiens 15 AJ001481 Caja homeótica doble, 1 Hs.274469 5004 2922 2.5 6.436E-05 1 7 Ü70732 Glutámico-piruvato transaminasa Hs.103502 4512 5163 2.1 0.000245 1 24 (alanina aminotransferasa) Número de Anotación de Gen ID de Rango Rango Cambio Prueba T # # de acceso al Unigen RCC normal de (valor p) presente frec.MO GenBank COV COV pliege A038171 Agrupamiento Incl AF038171: 5059 1096 2.3 0.0002938 1 3 5 secuencia de ARNm del clon 23671 de homo sapiens AF070629 RAB2, familia de oncogenes del Hs.78305 5020 1967 2.1 0.0003503 1 3 miembro RAS L17330 Proteina asociada con la célula Hs.280 5044 1094 2.2 0.0003682 1 3 10 pre-T/NK AI077476 Proteina KIAA0353 Hs.10587 5053 3147 2.3 0.0004087 1 7 AF054185 Subunidad de proteasoma Hs.233952 4963 5009 2.1 0.0005972 1 15 (prosoma, macrodolor) , tipo alfa 7 U18548 Receptor 12 acoplado a la Hs.123034 5062 1097 2.1 0.0008125 1 2 15 proteina G Tabla 7. 184 TRANSCRITOS ASOCIADOS CON ENFERMEDADES EN PACIENTES CON RCC Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank 5 AF051152 Receptor 2 tipo toll 45 20 45 16 Células T activadas AB006780 Lectina, enlace a 45 20 45 20 galactósido, soluble, 3 (galectina 3) 10 AF032886 Caja forkhead 03A 45 20 45 18 64925 Proteina de membrana 45 20 45 20 palmitoilada 1 (55 kD) X12451 Catepsina L 45 20 45 19 Células T activadas 15 D32143 Reductasa B de 45 20 44 7 biliverdina (flavina reductasa (NADPH) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AF079221 BCL2/adenovirus ElB 45 20 45 20 similar de proteina 3 de interacción de 19 kD L76200 Guanilato cinasa 1 45 20 45 20 25915 Clusterina (inhibidor 45 20 45 20 de la lisis de complemento, SP-40, mensaje 2 de próstata reprimido de testosterona, apolipoproteina J 15 X12496 Glicoforina C (grupo 45 20 45 20 de sangre Gerbich) L07648 Proteina 1 de 45 20 45 20 interacción MAX Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank M24069 Proteína A de dominio 45 20 45 17 5 de choque en frío L07648 Proteína 1 de 45 20 45 20 interacción MAX D14874 Adrenomedulina 45 20 45 19 AL050254 Proteína 7 de caja F 45 20 45 20 X17644 Transición de fase 1 45 20 35 9 Células T 10 Gl a S activadas AI565760 Factor 2 de expresión 45 20 45 20 de gangliósidos V00505 Hemoglobina, delta 45 20 43 15 Insuficiencia renal 15 X79535 Tubulina, polipéptido 45 20 34 7 beta Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank U76248 Homólogo 2 siete en 45 20 43 19 5 lejanía (Drosophila) AB013382 Especificidad dual de 45 19 40 4 fosfatasa 6 AF025533 Receptor similar a 44 20 44 18 inmunoglobulina de leucocitos, subfamilia 10 B (con dominios TM e ITIM) , miembro 3 U05770 Anexina A5 45 19 43 11 X60364 Aminolevulinato, 45 19 45 20 Insuficiencia delta, cintaza 2 renal 15 (anemia sideroblás ica/hipoc ó mica) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AF001461 Proteína de enlace del 45 19 45 17 5 elemento promotor del núcleo Z35491 Atanogen asociado con 44 20 44 19 BCL2 D83664 Proteína de enlace del 44 20 37 13 calcio S100 Al2 10 (calgranulina C) L19185 Peróxido reductasa 1 45 19 31 4 dependiente de tioredoxina (antioxidante 1 15 específico del tilo, factor B mejorador del exterminador natural) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank M24470 Guanosina monofosfato 44 20 34 13 reductasa X79324 Proteina relacionada con 44 20 44 20 la diferenciación adiposa, adipofilina X52015 Antagonista del 44 19 44 15 Células T receptor de activadas interleucina 1 AB008775 Acuaporina 9 44 19 33 6 J02973 Trombomodulina 44 19 43 14 D87116 Proteina cinasa cinasa 3 44 18 45 20 activada por mitógeno 15 N74607 EST, altamente 42 20 30 20 Células T similares a Acuaoprina activadas 3 (H. Sapiens) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank M36820 Oncogen GR02 43 19 36 10 M38690 Antigeno CD9 (p2 ) 44 18 23 3 X90999 Hidroxiacil glutatión 44 17 31 4 hidrolasa; glioxilasa 2 M94856 Proteina 5 de enlace a 42 18 28 3 Células T ácidos grasos activadas (asociada a la psoriasis) Z32684 Precursor del grupo de 41 19 22 0 sangre de ell (fenotipo de Me Leod) Número de Anotación del Gen #RCC # Normal #Frec>10 tFreOlO Común con acceso presente Presente RCC Normal GenBank AF061034 Proteina inducible del 44 16 13 0 5 factor alfa de necrosis de tumor con dominios de cremallera de leucina; proteina L de interacción de Huntington 10 J04102 homólogo 2 del oncogen 41 19 25 2 E26 del virus de eritroblastosis aviaria v-ets L42542 Proteina 1 de enlace a 42 18 17 0 15 ralA AF141349 Tubulina, beta 43 17 25 4 Células T activadas Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank D38583 Proteína de enlace de 40 20 33 12 5 calcio S100 All (calgizarina) X04327 2 , 3-bisfosfoglicerato 42 18 18 1 mutasa J04027 Membrana 1 de plasma, 43 16 33 5 transportadora de 10 Ca++, ATPasa AF141349 Tubulina, beta 43 16 29 5 Células T activadas Y00630 Inhibidor del 41 18 42 17 activador de 15 plasminógeno, tipo II (arginina-serpina) U29091 Proteína 1 de enlace al 44 14 44 15 selenio Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank U28389 Banda 4.9 de proteína de 43 15 45 20 5 membrana de eritrocitos (dematina) X64364 Basigina 43 15 43 10 X00737 Nucleósido fosforilasa 43 15 34 5 Células T activadas 26583 Citocina A2 inducible 40 17 37 12 10 pequeña (proteína 1 quimiotáctica de monocitos, homologa para ratón Sig-je) AI349593 Hemoglobina, epsilon 1 42 14 13 0 15 L22075 Proteína de enlace de 41 12 19 1 nucleótido guanina (proteína G) alfa 13 Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AA135683 Proteína 1 soluble en 39 14 29 3 5 ácido del cerebro U00672 Receptor 10 de 33 20 34 20 interleucina, alfa AL080235 Proteína DKFZP586E1621 41 11 23 0 K00650 Homólogo del oncogen 32 20 35 20 Células T viral de osteosarcoma activadas 10 murino FBJ v-fos M28225 Citocina ?2 inducible 36 15 34 3 pequeña (proteína quimiotáctica de monocito 1, homologa 15 al ratón Sig-je) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank S78798 Agrupamiento Incl 39 11 10 0 5 S78798 : 1- fosfatidilinositol-4- fosfato isoforma C de 5-cinasa (humano, PBL, ARNm, 1835 nt) AL049963 ARNm de homo sapiens; 38 12 17 1 Insuficiencia 10 ADNc DKFZp564Al32 (del renal clon DKFZp564A132) L22005 Ciclo 34 de división 38 12 27 2 celular K02401 Hormona 1 de 30 20 17 19 15 sornatomamotropina coriónica (lactógeno placental) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank X14787 Trombospondina 1 38 12 39 10 5 X75042 Homólogo de oncogen 35 14 12 1 viral de reticuloendoteliosis aviaria v-rel AA131149 Proteina P de enlace al 35 14 30 5 calcio S100 10 M35999 Integrina, beta 3 36 12 22 1 (glicoproteina Illa de plaquetas, antigeno CD61) U21049 Proteina epitelial- 37 11 28 3 15 sobreregulada en carcinoma, proteina 17 asociada a la membrana Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank M19267 Tropomiosina 1 (alfa) 36 11 11 0 5 M27819 Familia 4 del portador 40 6 40 2 Insuficiencia de soluto, renal intercambiador de aniones, miembro 1 27492 Receptor de 36 10 21 4 Células T interleucina 1, tipo I activadas 10 X07834 Superóxido dismutasa 36 9 17 0 2, mitocondrial X72308 Citocina A7 inducible 35 10 24 2 pequeña (proteina 3 quimiotáctica de 15 monocitos ) AI679353 EST, débilmente similar a 37 8 13 1 ¡ADVERTENCIA DE ENTRADA ALU CLASE E! (H. Sapiens) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank L42243 Receptor 2 del interferón 36 8 13 0 5 (alfa, beta y omega) D10925 Receptor 1 de quimiocina 35 9 13 0 (porción C-C) D30783 Epiregulina 35 9 18 0 S77763 Factor nuclear (derivado 2 36 6 12 0 de eritroide) , 5 kD 10 X79535 Tubulina, beta polipéptido 33 8 36 6 Insuficiencia renal y Células T activadas U61836 ARNm de proteina de 33 8 14 0 15 interacción de ciclina Gl supuesta humana, secuencia parcial Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank M34480 Integrina, alfa 33 6 27 3 5 2b (glicoproteína Iib de plaqueta del complejo Ilb/IIIa, antígeno CD41B) 63835 Fragmento Fe de IgG, la de 28 11 11 0 alta afinidad, receptor para (CD64) 10 AF017257 Homólogo 2 del oncogen E26 32 6 5 0 del virus de la eritroblastosis de las aves v-ets AA527880 Subcomplejo 1 beta de la 24 13 26 2 Insuficiencia 15 NADH deshidrogenas a renal (ubiquinona) , 7 (18kD, B18) AF065389 Tetraspan 5 29 8 11 0 Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank D86961 Compañero tipo 2 de fusión 31 4 12 0 Insuficiencia de HMGIC de lipoma renal 5 U61836 Secuencia parcial, ARNm de 29 6 16 1 proteina de interacción de ciclina Gl supuesta humana AF026939 Proteína inducida por 25 9 14 0 interferón con repeticiones 10 4 de tetraicopéptido 25322 Selectina P (proteína de 27 6 15 0 membrana de granulos 140 kD, antígeno CD62) AB007943 Producto de genes ????0474 24 6 45 20 M60298 Banda de proteína de 28 2 17 0 15 membrana de eritrocitos 4.2 Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank X58851 Miosina, polipéptido ligero 26 3 12 0 5 4, álcali, atrial, embriónico J05070 etaloproteinasa de matriz 24 4 6 0 9 (gelatinasa B, gelatinasa 92kD, colagenasa tipo IV de 92 kD) 10 U43774 Receptor para Fragmento Fe 24 3 10 0 de IgA AF052111 Secuencia de ARNm del clon 19 7 2 0 23953 de homo sapiens AA18.7563 EST, altamente similares a 23 3 7 0 15 la proteína CGI-56 (H. Sapiens) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank H12458 Placenta Soares yjl2d03. sl 18 8 41 16 5 AD c de homo sapiens Nb2HP clon IMAGE: 148517 similar en 3' a WNT6 Z23115 BCL2 como 1 25 1 21 1 Células T activadas U12471 Gen 1 de trombospondina 23 3 17 1 10 humana, cds parcial L06895 Proteina de dimerización 18 8 6 0 MAX AB023211 Peptidil arginina 18 8 8 0 desiminasa tipo II 15 D63940 Proteina 1 de interacción 24 1 10 0 MAX Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank X74039 Activador de plasminógeno, 21 3 7 0 5 receptor de urocinasa AB018293 Producto de gen IAA0750 23 1 17 0 ??978353 Familia 1 del portador de 21 2 3 0 soluto (glutamato/transportador de aminoácido neutral) , 10 miembro 4 AJ243797 Tres reparadores de cebador 13 10 14 1 Células T de exonucleasa 1 activadas U89606 Piridoxal cinasa 20 3 8 0 (piridoxina, vitamina B6) 15 19267 Tropomiosina 1 (alfa) 20 2 8 0 L35240 Enigma (proteina de dominio 17 4 12 0 LIM) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AL096737 ARNm de homo sapiens; ADNc 11 8 44 20 5 DKFZp434F152 (del clon DKFZp434F152) D14689 Nucleoporina 214kD (CAIN) 15 4 37 9 U36341 Familia 6 del portador de 19 0 26 2 Insuf icienci soluto (transportador a renal neurotransmisor, creatina) , 10 miembro 8 M77016 Tropomodulina 19 0 11 0 U91316 Tioéster hidrolasa acil 17 1 12 0 coenzima A citosólica 62896 ARNm del pseudogen de 15 2 4 0 15 lipocortina (LIP) 2 humano, región tipo cds completa Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank L4090 Receptor activado 15 1 20 0 5 proliferativo de peroxisoma, gamma U6767359 Proteína T54 15 0 13 0 W28931 EST, débilmente similares 12 3 27 2 al factor de emplame de 38 kDA (H. Sapiens) 10 AB006537 Proteína accesoria del 11 2 1 0 receptor 1 de interleucina U97067 Agolpamiento Incl U97067 : 12 1 6 0 AKNm de proteína de tipo catenina alfa de homo 15 sapiens, cds completo U19599 Proteína X asociada a BCL2 4 9 1 5 Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank ??628946 Proteína reguladora de 9 3 39 5 5 emplame del tipo H (proteína 2 de enlace a FÜSE) AI961220 Inhibidor de serina 12 0 4 0 proteasa, Kazal tipo 1 AL049250 AR m de homo sapiens; ADNc 11 1 5 0 10 DKFZp564D113 (del clon DKFZp564Dll3) AL031230 Familia de la aldehido 11 0 3 0 deshidrogenase 5, miembro Al (succinaro semialdehído 15 deshidrogenasa) U68111 Proteína fosfatasa 1, 10 1 18 1 subunidad reguladora 2 (inhibidor) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AP035819 Receptor macrófago con 10 0 5 0 5 estructura de colágeno AJ000480 Fosfoproteina regulada por 9 1 5 0 las trayectorias mitogénicas U58917 Receptor 17 de interleucina 8 2 1 0 X90857 Gen telomérico conservado 10 0 13 0 10 al agrupamiento de alfa globina J05500 Espectrina, beta, 9 0 17 0 eritrocitica (incluye esperocitosis , clínica tipo 15 I) X54412 Colágeno, tipo IX, alfa 1 8 1 24 4 Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank X75593 AB13, familia de oncogenes 8 0 13 0 5 miembro RAS D38037 Proteína IB de enlace a 7 1 2 0 FK206 (12.6 kD) J02854 Cadena ligera 2 reguladora 8 0 7 0 de la miosina, isoforma de músculo liso 10 AF034209 RIG tipo 5-6 7 1 4 0 U23478 Corrponente del complemento 8 0 14 1 4A AB011161 Fosfatidilinositol-4- 5 2 24 0 Insuf icienci fosfato 5-cinasa, tipo I, a renal 15 gamma L23959 Factor de transcripción Ep- 6 1 2 0 1 Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank M674788 RAP1, proteina 1 activadora 7 0 10 0 de la GTPasa X51362 Receptor D2 de dopamina 6 0 20 1 ??0004520 Proteína adaptadora con 6 0 3 0 homología de plecstrina y dominios de homología 2 src U43843 Homólogo neuro d4 (rata) 6 0 5 0 D43642 Factor de transcripción 5 0 34 1 similar a 1 26700 EST, altamente similares al 5 0 5 0 cotransportador de fosfato inorgánico dependiente de 15 Na+ específico del cerebro (R. Norvegicus) Número de Anotación del Gen #RCC # Normal #Frec>10 # Frec>10 Común con acceso presente Presente RCC Normal GenBank AA844998 Polipéptido pancreático 5 0 11 0 AJ223948 Familia de la helicasa del 5 0 3 0 A N AJ000644 Proteina POZ del tipo 4 1 4 0 pequeñas manchas 27095 Proteina B7 3 2 13 16 AF032108 Integrina, alfa 7 4 0 1 0 M13207 Factor 2 estimulador de 4 0 7 0 colonias (granulocitos- macrófagos) AF059202 Homólogo de diacilglicerol 3 1 10 0 O-aciltransferasa (ratón) 15 X82460 Hidroxiprostaglandina 3 1 3 0 deshidrogenasa 15 (NAD) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AJ011712 Troponina TI, esqueletal, 4 0 2 0 5 lenta L37127 Polxmerasa (ARN) II (dirigida 4 0 5 0 por ADN) polipéptido J (13.3 kD) AF089814 Supresor de tumor eliminado 3 1 2 0 en el relacionado 1 al 10 cáncer oral L07592 Receptor activado 2 1 18 0 proliferativo de peroxisoma, delta AB020644 Gen 2 de acil-CoA sintetasa 2 1 4 0 15 grasa extensa Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AF0678706 Complejo de proteina 3 0 12 0 5 relacionado con el adaptador 1, gamma 2 subunidad AF059198 ER a señalización del 2 1 16 1 núcleo 1 AF055027 Arginina metiltransferasa 1 3 0 6 0 10 asociada con el coactivador L03785 Miosina, péptido ligero 5, 1 2 8 0 regulador X91348 Transcrito no codificador 2 0 1 0 supuesto (región 5 critica 15 de DiGeorge) L32831 Receptor 3 acoplado a la 1 i · 16 2 proteina G Número de Anotación del Gen #RCC # Normal # Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AI732885 Región BRCA2 humana, 2 0 2 0 5 secuencia de ARNm CG011 U96919 Inositol polifosfato-4- 2 0 7 0 ¦ fosfatasa, tipo I, 107 kD U62433 Receptor colinérgico, 2 0 8 1 nicotinico, alfa polipéptido 4 10 AF055000 ARNm de homo sapiens para 1 0 43 15 huérfano de hígado desconocido J05581 ucina 1, transmembrana 1 0 10 0 U48213 Proteína de enlace del 1 0 14 18 15 sitio D del promotor de albúmina (recuadro albúmina D) Número de Anotación del Gen #RCC # Normal tFrec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank D45421 Fosfodiesterasa 0 1 4 0 5 I/pirofosfatasa 2 de núcleotido (autotaxina) AF017786 Fosfatasa de ácido 1 0 3 0 fosfatídico tipo 2b AB010419 Factor de enlace al núcleo, 1 0 11 0 dominio runt, subunidad 10 alfa 2, transubicado a 3 AF070587 Secuencia de ARNm clon 1 0 13 0 24741 de homo sapiens AJ001481 Caja horneótica doble, 1 1 0 7 0 U70732 Glutámico-piruvato 1 0 22 2 15 transaminasa (alanina aminotransferasa) Número de Anotación del Gen #RCC # Normal #Frec>10 #Frec>10 Común con acceso presente Presente RCC Normal GenBank AF038171 Agrupamiento Incl AF038171 : 1 0 3 0 5 secuencia de AR m del clon 23671 de homo sapiens AF070629 RAB2, familia de oncogenes 0 1 3 0 del miembro RAS L17330 Proteína asociada con la 1 0 3 0 célula pre-T/NK 10 AI 077476 Proteína ????0353 1 0 7 0 AF054185 Subunidad de proteasoma 1 0 13 2 (prosoma, macrodolor) , tipo alfa 7 Ü18548 Receptor 12 acoplado a la 1 0 2 0 15 proteína G Ejemplo 5. Formación de sondas de las bases moleculares del conjunto de clasificación de genes de enfermedad RCC en PB Cs Los perfiles de PBMC de RCC se compararon con perfiles en tumores primarios RCC. En estos experimentos, los promedios de diferencia (desde las frecuencias normalizadas de curva estándar) de 20 PBMCs normales y 45 PBMCs RCC del presente estudio, se normalizaron usando el algoritmo de normalización GeneLogic GLGC con promedios de diferencia detectados en los perfiles de expresión de 57 biopsias de riñon normales y 43 biopsias de tejido de tumor RCC. Los perfiles de expresión de los tejidos de tumor RCC primarios y de riñon normal se descargaron in silico de la base de datos BioExpress (Genelogic, Giathersburg MD) . Para identificar cualesquiera de los genes inducidos tanto en PBMCs de RCC como tejido de tumor RCC con relación a los controles normales, los valores de expresión de gen para 165 configuraciones se agrupan de conformidad con el método de Eisen et al., Proc . Nat . Acad. Sci . , U.S.A., 95: 14863-14868 (1998) . En estos análisis solo los genes se agruparon y el orden original de las configuraciones como se describe se conserva con objeto de detectar visualmente bacterias de genes con patrones de regulación consistentes con los marcadores de tumor RCC presentes en la sangre periférica RCC. Los perfiles de expresión en PBMC de RCC también se comparan con perfiles en PBMCs estimulados con PHA ex vivo. En estos experimentos los perfiles de expresión de 20 PBMCs normales y 45 PBMCs RCC se comparan con los perfiles de expresión detectados en (n=3) no tratados o 6h PHA estimulados por PBMCs cultivados ex vivo. La normalización usando una curva estándar para generar frecuencias se realizo, y el agrupamiento jerárquico de genes se realizo posteriormente . Además, los perfiles de expresión en PBMCs RCC se comparan con perfiles en PBMCs de pacientes no RCC con insuficiencia renal. Los promedios de diferencia de 20 PBMCs normales y 45 PBMCs RCC se normalizan usando el algoritmo de normalización GeneLogic GLGC con promedios de diferencia detectados en los perfiles de expresión de 8 PBMCs de insuficiencia renal no RCC descargados in silico de la base de datos BioExpress (Genelogic , Giatherburg MD) . El agrupamiento jerárquico de los genes solo se realizó posteriormente . Adicionalmente, los 184 genes de enfermedad en RCC en listado en las Tablas 6 y 7 se compararon con los 10 transcritos más fuertemente sobrerregulados en tumores RCC (n= 47) con relación al tejido de riñon normal (n=6) usando perfiles descargados de la base de datos Bioexpress (GeneLogic, Gaithersburg MD) . Los transcritos específicos de tumor RCC que poseen las diferencias en veces promedio más altas en la expresión entre el tejido de tumor RCC y el riñon normal se cambiaron entre los PBMCs normal por RCC, lo que sugiere que las células de tumor RCC esparcidas no contribuyen significativamente a los transcritos asociados con la enfermedad identificados PBMCs aislados de pacientes RCC. Los 184 genes de enfermedad RCC enlistados en las Tablas 6 y 7 también se comparan con genes diferencialmente expresados entre células CD4+T no estimuladas (donadores normales n=3 ) y células CD4+T (donadores normales n=3) estimulados ex vivo con anti-CD3 y anti-CD28 en cultivo. Las células CD4+T estimulados poseen 14 transcritos que son mayores que los cambiados 2 veces en la misma dirección (inducido o reprimidos) como los transcritos asociados con la enfermedad en PBMCs RCC, como se indica en la última columna de la Tabla 7. Los 184 genes de enfermedad RCC enlistados en las Tablas 6 y 7 se comparan además con los genes diferencialmente expresados entre PBMCs de pacientes con insuficiencia renal en etapa terminal no de RCC (n=9 individuos) y PBMCs de voluntarios normales (n=4 individuales) . De estos 9 transcritos diferencialmente expresados en PBMCs de pacientes con insuficiencia renal también son transcritos asociados con la enfermedad en PBMCs de RCC, como se indica en la ultima columna de la Tabla 7. De esta manera los 184 genes de enfermedad RCC enlistados en las Tablas S y 7 contienen un subconjunto de marcadores comúnmente involucrados en las respuestas inmunes mediadas ex vivo (activación de célula CD4+T) y en respuestas de leucocitos circulantes para la disfunción renal observada ex vivo. Sin limitar la presente 'invención a cualquier teoría particular, estos resultados soportan la hipótesis de que los niveles de expresión de al menos un subconjunto de los genes asociados con la enfermedad observados en PBMCs RCC pueden resultar de una activación de célula T circulantes y u otros leucocitos en respuesta a la presencia del tumor. Además es posible que la regulación de otros subconjunto de transcritos asociados con enfermedad detectados en PBMCs RCC pueda deberse a alteraciones de los perfiles de expresión de leucocito en respuesta a una disfunción renal en pacientes RCC.
Ejemplo 6. Clasificación de estado de RCC y libre de RCC usando perfiles de expresión de genes en células de sangre periférica. Para construir y evaluar los clasificadores de enfermedad RCC, 70% de los patrones de PBMC de RCC (n = 31) y 70% de los patrones de expresión PBMC sin enfermedad (n = 14) se seleccionan aleatoriamente y se usan como un conjunto de entrenamiento. El resto de los patrones de expresión RCC y sin enfermedad PBMC se usaron como un conjunto de prueba. Se uso una métrica de separación de clase relativa para calcular una medida de correlación de rango un ángulo de los genes con los niveles de expresión más altamente correlacionados con el vector de clasificación característico del conjunto de entrenamiento. Esta medida de correlación se compone de valores y varianzas de expresión media. La clasificación del conjunto de prueba de muestra se realizo usando el método de votación ponderado para clasificar los perfiles de expresión PBMC restantes como características de PBMC sin enfermedad o RCC . En este método el nivel de expresión de cada gen en el conjunto clasificador contribuye a una fuerza de predicción general que determina la clasificación de la muestra. La fuerza de predicción en este ejemplo es esencialmente una variable combinada que indica el número de "votos" para cada una de clase o de la otra y puede variar entre 0 (margen de victoria con flechas) y 1 (margen de victoria amplios) a favor de clase predicha. Para cuantificar la exactitud de este método de predicción un valor de 0.3 se impone como el umbral de fuerza de predicción arriba del cual se pueden hacer llamadas confiadamente. En este ejemplo, la exactitud de predicción para cualquier conjunto de genes clasificadores dados se define como el porcentaje de llamadas con fuerza de predicción mayores a 0.3 que también clasifican correctamente las muestras . Los predictores usados en este ejemplo incluyen (1) un predictor de clase de dos genes que consiste de TLR2 y EEF1A2 , (2) un predictor de clase de gen de 4 que consiste de TLR2 , LGALS3 , EEF1A2 , y BRF2 , (3) un predictor de clase de 6 genes que consiste de TLR2 , LGALS3 , DKFZP586E1621 , EEF1A2 , BRF2 , y SNRPG, (4) un predictor de clase de 8 genes que consiste de TLR2, LGALS3 , DKFZP586E1621 , S0D2 , EEF1A2 , BRF2 , SNRPG, y NUMAl, (5) un predictor de clase de 10 genes que consiste de TLR2 , LGALS3 , DKFZP586E1621 , S0D2 , DUSP6 , EEF1A2 , ERF2 , SNRPG , NU 1 , y AKR1B1 , (6) un predictor de clase de 12 genes que consiste de TLR2 , LGALS3, DKFZP586E1621 , SOD2 , DUSP6, KIAA0669, EEF1A2 , BRF2 , SNRPG, NUMA1 , AKR1B1 , y S ARCE1, (7) un predictor de clase de 14 genes que consiste de TLR2 , LGALS3 , DKFZP586E1621 , S0D2 , DUSP6 , KIAA0669, IL1RN, EEF1A2 , BRF2, SNRPG, NUMAl', AKR1B1 , SMARCE1 , y MSF, (8) un predictor de clase 16 genes que consiste de TLR2 , LGALS3, DKFZP586E1621, S0D2 , DUSP6, KIAA0669, IL1RN, KIAA0410, EEF1A2 , BRF2 , SNRPG, NUMAl, AKR1B1 , SMARCE1, MSF, y PTMA, (9) un predictor de clase 18 genes que consiste de TLR2 , LGALS3 , DKFZP586E1621 , S0D2 , DUSP6, KIAA0669, IL1RN, ' IAA0410, T54 , EEF1A2 , BRF2 , SNRPG, NUMAl, AKR1B1, SMARCE1 , MSF, PTMA, y PSMD3 , y (10) un predictor de clase de 20 genes que consiste de EEF1A2, TLR2 , BRF2, LGALS3 , SNRPG, DKFZP586E1 S21 , NUMA1 , S0D2 , AKR1B1, DUSP6, SMARCE1 , ????0669, MSF, IL1RN, ????, KIAA0410, PSMD3, ?54 , C1QBP, y 0SR1. La exactitud de predicción para ambos de los conjuntos de entrenamiento y los conjuntos de prueba de PBMCs de RCC con cada conjunto de genes predictores se calcula. Al calcular la exactitud de la clasificación para un conjunto de entrenamiento se indica como uniformemente el gen predictor es estable en una correlación positiva con cada muestra individual en el conjunto de entrenamiento, mientras se calcula la exactitud de predicción para un conjunto de prueba que indica como la expresión de este gen predice la identidad de las muestras individuales en un grupo "desconocido" . La tabla 8 ilustra la exactitud de predicción para cada uno de los predictores de clase arriba descritos. Los conjuntos del gen clasificador usando 10 o más genes en el algoritmo de votación ponderado proporciona 100% de exactitudes en la predicción del conjunto de prueba. Estos estudios de muestran la posibilidad de realizar una predicción de forma par sencilla de RCC contra estado sin RCC usando los patrones de expresión encontrados en un número limitado de- transcritos de gen en el comportamiento de sangre p'eriferica.
Tabla 8. Predicción de exactitud de los predictores de clase de la presente invención La figura 3 muestra un resumen del conjunto de entrenamiento a través de la validación de resultados para los conjunto de gen predictor de tamaño incrementado. Un subconjunto de muestras PBMC RCC y normales (70%) se usaron como el "conjunto de entrenamiento" para generar conjuntos de gen clasificadores, y luego cada conjunto predictor se evaluó por validación cruzada para identificar el conjunto predictor con exactitud alta para clasificación de las muestras en el conjunto de entrenamiento. Se usó la métrica de correlación por omisión de Genecluster (Golub et el . , supra) para identificar los genes con niveles de expresión más altamente correlacionados con el vector de clasificación característico del conjunto de entrenamiento. Todos los 5,249 de genes que cumplen los criterios de filtrado inicial se separaron por exclusión usando este enfoque. La predicción también se realizó en un Genecluster usando el método de votación ponderado. En este método, el nivel de expresión de cada gen en el conjunto clasificador contribuye a un voto general en la clasificación de la muestra (Slonim et al., supra) . La fuerza de predicción en una variable combinada que indica el soporte para una clase o la otra, y puede variar entre 0 (margen de victoria estrecho) y 1 (margen de victoria amplio) a favor la clase predicha. Los conjuntos predictores que contienen entre 2 y 20 genes se evaluaron para llevar a validación cruzada para identificar el conjunto predictor con la exactitud mayor para la clasificación de las muestras en el conjunto de entrenamiento (FIG. 3) . El conjunto predictor del gen 8 (89% de exactitud) se selecciona para la predicción del conjunto de prueba. El conjunto de 8 genes consiste de TLRS, LGALS3, D FZP586E1621, SOD2, EEF1A2, BRF2 , SNRPG, y NUMA.1. La figura 4 muestra los niveles de expresión relativos de los 8 genes predictores en el conjunto de entrenamiento. Cada gen se representa por su calificador respectivo. Se representan gráficamente los 4 genes elevados en RCC con relación a PBMCs normales (TLR2, LGALS3 , DKFZP586E1621, y SOD-2) y los 4 genes reprimidos en RCC con relación a PBMCs normal (EEF1A2, BRF2, SNRPG y NUMA1) . El nivel de expresión incrementa, ásperamente desde obscuro hasta ligero y luego a gris (o más precisamente, el nivel de expresión se incrementa desde azul hasta rojo, como se muestra en la figura 4 de la correspondiente solicitud de patente de utilidad E.U.A presentado el 21 de Noviembre de 2003 y titulada "Methods for Diagnosing RCC and Other Solid Tumors") . Los registros de confianza de predicción individual para cada muestra en el conjunto de entrenamiento usando este conjunto clasificador de 8 genes se presentan en la figura 5A. Para propósitos de ilustración se asigna una señal positiva a las fuerzas de predicción que resultan en votos para RCC y una señal negativa se asigna a las fuerzas de predicción que resulta un votos para PBMCs normales. Una validación cruzada de una hoja se realiza y las fuerzas de predicción se calculan para cada muestra en el conjunto de entrenamiento. Las muestras de conjunto de entrenamiento se ordenan en el mismo orden como en la figura 4. La figura 5B ilustra los resultados de predicción para el resto del conjunto de prueba de RCC y muestras de PBMC normales usando el conjunto predictor de ocho genes. En el conjunto de prueba, la clase predictora marca la clase real en todos los casos a través de una de las 19 muestras de prueba la fuerza de predicción fue insignificante. Estos estudios de muestran la posibilidad de predecir RCC contra un estado sin enfermedad usando los patrones de expresión encontrados en un número limitado de transcrito de gen en células mononucleares de sangre periférica.
Ejemplo 7. Genes di erencialmente expresados en tejidos de tumor RCC y pacientes con insuficiencia renal en estado terminal sin RCC Los perfiles de expresión de PBMCs de RCC se comparan por los perfiles de expresión de tejidos de tumor RCC o PBMCs de pacientes con insuficiencia renal . En cada comparación se emplea un análisis multivariado (agrupado jerárquico) para buscar las baterías correguladas de genes entre los grupos, seguido por un análisis de cambio de veces y la prueba T de Student para soportar cualquiera de los hallazgos . En el primer análisis los perfiles de expresión PBMCs RCC se comparan in silico con los perfiles de expresión de tejidos de tumor RCC (n=43 biopsias) de la base de datos GeneLogic BioExpress (Gaithersburg, MD) . Todas las muestras se ordenan de una muestra supervisada (esto es, no se agrupan configuraciones) los genes se ordenan usando un enfoque de agrupación jerárquico para identificar los conjuntos de genes sobrerregulados en tanto pacientes PBMCs de RCC como de biopsias de tumor RCC comparado con controles sin enfermedad. El análisis de cambio de pliegues identifica 24 especies de ARN que son estadísticamente importantes (p<0.05, prueba t de Student) y mayor a dos veces inducido a PBMCs de RCC con relación a PBMCs sin enfermedad y en tumores con RCC con relación a tejido de riñon sin enfermedad. Estas 24 especies de ARN corresponde a FABP5, SCYA20 , ADM, COPEB, FCGR3B, UNK_M62896, FN1, HMOX1, ITGA7, DGCR5, CBP2 , UNK_AL049250, SLC1A4 , MMP9, SLC16A3 , LILRB3 , FCGR1A, LIHFPL2 , PLEC1, S100A11, SPOP, CCR1, TLR2 y IAA0750, respectivamente. Además, estas 24 especies de ARN son capaces de hibridizar bajo condiciones severas a CPSs 57, 229, 92, 91, 221, 26, 236, 207, 16, 8, 245, 152, 2, 58, 192, 19, 99, 28, 191, 138, 143, 61, 1 y 148 respectivamente . En un segundo análisis, las PBMCs de pacientes con insuficiencia renal en etapa terminal sin RCC (n=8 individual) se comparan con PBMCs de voluntarios sin enfermedad y pacientes con RCC. El agrupamiento jerárquico de estos genes en grupos de muestras identifican varios agrupamientos que parecen ser similarmente regulados entre pacientes con RCC avanzado y pacientes con insuficiencia renal en etapa terminal . El análisis de cambio de RCC identifica una pluralidad de transcritos de ARN que son estadísticamente importante (p<0.05, prueba t de Student) y mayor a dos veces inducido en PBMCs de RCC y en PBMCs sin RCC, con insuficiencia renal con relación a PBMCs sin enfermedad. Los CPSs capaces de hibridizar a estos transcritos de ARN bajo condiciones severas se describen en la Tabla 9. Los genes que corresponden a los CPSs también se indican.
Tabla 9. Genes de enfermedad RCC que expresan diferenclalmente en pacientes con insuficiencia renal son RCC con relación. a PBMCs sin enfermedad.
Numero de CPS Genes correspondientes 92 ADM 91 COPEM 34 AQP9 222 PTGS2 244 STIP1 53 SOD2 151 PDXK 18 IL1RN 21 ANXA5 109 IFIT4 211 IL1B 201 GROl 104 PLAÜR 130 NP 58 MMP9 192 SLC16A3 Numero de CPS Genes correspondientes 19 LILRB3 99 FCGR1A 28 LHFPL2 191 PLEC1 138 S100A11 143 SPOP 61 CCR1 1 TLR2 148 KIAA0750 105 CDC3 158 POLR2J 10 ETS2 125 MAD 52 GPR3 11 " PIP5 1C 220 PRF1 178 PSMA7 154 INPP4A 12 TCFL1 47 DGA.T 146 S100P 165 DOC-IR 62 C8F Numero de CPS Genes correspondientes 128 PDI2 133 GEF-2 147 TNNT1 111 BSG 84 IL17R 227 HK3 115 RALBP1 195 RNASE2 25 TPM1 40 BLVRB 35 APS 17 PPARD 157 NFE2 14 IL1RAP 173 S100A12 174 CD9 9 ENIGMA 135 HAGH 247 NCF1 250 FLOTl 94 ITGA2B 148 ????0750 Numero de CPS Genes correspondientes 194 FKBP8 4 DUSPS 87 CBFA2T3 Los genes y CPSs enlistados en la Tabla 9 pueden usarse como marcadores para insuficiencia renal y otros tipos de disfunción renal.
Ejemplo 8. Predicción de estado RCC contra voluntarios sin enfermedad y pacientes con otros tumores sólidos. En este análisis, los perfiles de expresión se comparan simultáneamente entre cuatro clases de PBMCs que incluyen PBMCs de RCC , PBMCs sin enfermedad, PBMCs con cáncer de próstata y PBMCs con cáncer de cabeza y cuello. Un análisis jerárquico inicial demuestra las relaciones de transcripción global entre la base de datos expandida de los perfiles de expresión PBMC. Se usan entonces 70% de las muestras como un conjunto de entrenamiento, y una métrica de correlación de clase múltiple se emplea para identificar y clasificar los genes más altamente correlacionados con cada una de las clases de perfil de expresión PBMCs (RCC, sin enfermedad, carcinoma de próstata, cabeza y cuello) en la base de datos. Se determina un clasificador de 20 genes. Estos genes y los CPSs correspondientes se ilustran en la Tabla 10. Este conjunto de 20 genes pueden usarse para predecir cada clase contra todas las otras clases. La capacidad de este conjunto de genes para predecir el restante 30% de las muestras como RCC contra no RCC se calcula. El conjunto de genes es capaz de predecir cada gen PBMC restante en el conjunto de prueba como RCC o no RCC con 89% o 92% de exactitud respectivamente. Como se aprecia por alguien de experiencia ordinaria en el arte, un subconjunto de estos 20 genes, tal como 2, 4, 6, 8, 10, 12, 14, 16 o 18 genes, puede usarse para predecir de RCC de no RCC. Los no RCC incluyen otros tumores sólidos, tales como cáncer de próstata o cáncer de cabeza/cuello.
Tabla 10. Conjunto de genes para predecir RCC contra voluntarios sin enfermedad y pacientes con otros tumores sólidos Número de CPS Genes correspondientes 268 CD44 269 CRADD 270 CCRL2 71 ???0837 271 IAA0707 272 KIAA1113 Número de CPS Genes correspondientes 64 EREG 273 UNK_AL050119 17 PPARD 37 CTSI 53 ATP2B1 274 UNK_AF052115 275 ITF 276 STAT3 264 KIAA0410 277 TPD52L2 278 UNK_AI732885 31 MARCO 69 LOC64116 (también se refiere como un U K_AL049963) 50 PDNP2 Ejemplo 9. Identif cación de un conjunto de gen predictor sin tumor sólido El análisis supervisado de los perfiles de expresión en PBMCs sin enfermedad y PBMCs de diferentes tumores sólidos se conducen. Los perfiles de expresión PB C de 3 de los 5 pacientes con cáncer de cabeza/cuello, 14 de 20 voluntarios 457 sin enfermedad, 11 de 15 pacientes con cáncer de próstata y 32 de 45 pacientes RCC se clasifican, y se calcula de algoritmo de vecindad cercado a k de los genes más altamente correlacionados en cada distinción de clase. Los 19 genes superiores con patrones de expresión más altamente correlacionados con estos PBMCs de pacientes de cabeza/cuello voluntarios sin enfermedad, pacientes con cáncer de próstata y pacientes RCC se identificaron. Los 19 genes superiores de esta manera identificados se usan entonces para determinar la exactitud de predicción de un estado de tumor sólido " contra sin tumor sólido en muestras PBMC restantes. Se usa el método de votación ponderado para determinar la fuerza de predicción para cada muestra. Estos 19 genes se en listan en la Tabla 11.
Tabla 11. Conjunto de genes predictores sin tumor sólido Número de CPS Genes correspondientes Numero de acceso Entrez 258 UMA1 Z11584 285 CXCR4 L06797 107 IL10RA U00672 286 M9 AB019392 287 FAU X65923 256 BRF2 U07802 288 RPS6 X67309 255 EEF1A2 X70940 289 BAG5 AB020680 259 AKR1B1 X15414 290 U K_AL0227221 AL022721 266 C1QBP M69039 291 DKZP586E0820 ALO50147 292 NONO U02493 265 PSMD3 D67025 131 UNK_N74607 N74607 293 UNK_AI743507 AI743507 294 MAPKAPK5 AF032437 295 UNK_U79297 U79297 La descripción anterior de la presente invención proporciona la ilustración y descripción, pero no pretende ser exhaustiva o limitante de la invención a la escrita precisamente. Las modificaciones y variaciones son posibles consistentes con las técnicas anteriores o pueden adquirirse de la práctica de esta invención. De esta manera, se nota que el alcance de la invención se define por las reivindicaciones y sus equivalentes. Se hace constar que con relación a esta fecha, el mejor método conocido por la solicitante para llevar a la práctica la citada invención, es el que resulta claro de la presente descripción de la invención.

Claims (20)

459 Reivindicaciones : Habiéndose descrito la invención como antecede, se reclama como propiedad lo contenido en las siguientes reivindicaciones .
1. Un método, caracterizado porque comprende las etapas de: proporcionar al menos una muestra de sangre periférica de un humano; y comparar un perfil de expresión de uno o más genes en al menos una muestra de sangre periférica para al menos un perfil de expresión de referencia de uno o más genes, en donde cada uno de los uno o más genes se expresa diferencialmente en las células mononucleares de sangre periférica (PBMCs) de pacientes que tienen un tumor sólido en comparación con PBMC de humanos sin enfermedad, con la condición de que si uno o más genes consisten de un solo gen, el gen no se selecciona del grupo que consiste de IL1B, IL6, MMP-9 y FCGR3B, y además con la condición de que uno o más genes consiste de 2 genes, los 2 genes no son IL1B y IL6.
2. El método de conformidad con la reivindicación 1, caracterizado porque el tumor sólido se selecciona del grupo 460 que consiste de RCC, cáncer de próstata y cáncer de cabeza/ cuello .
3. El método de conformidad con la reivindicación 2, caracterizado porque la muestra de sangre periférica comprende PBMCs enriquecidos.
4. El método de conformidad con la reivindicación 2, caracterizado porque la muestra de sangre periférica es una muestra de sangre entera.
5. El método de conformidad con la reivindicación 2, caracterizado porque el perfil de expresión de determina usando RT-PCR cuantitativo o un inmunoensayo .
6. El método de conformidad con la reivindicación 1, ca acterizado porque al menos un perfil de expresión de referencia comprende un perfil de expresión de uno o más genes en muestras de sangre periféricas de humanos sin enfermedad.
7. El método de conformidad con la reivindicación 6, caracterizado porque al menos un perfil de expresión de referencia comprende además un perfil de expresión de uno o más genes en muestras de sangre periférica de pacientes que tienen un tumor sólido.
8. El método de conformidad con la reivindicación 7, caracterizado porque uno o más genes incluyen al menos 2 genes, y el perfil de expresión del humano se \ 461 compara con el al menos un perfil de expresión de referencia usando un algoritmo de votación ponderado.
9. El método de conformidad con la reivindicación 6, caracterizado porgue uno o más genes se expresan diferencialmente en PBMCs de pacientes que tienen otro tumor sólido con relación a humanos sin enfermedad .
10. El método de conformidad con la reivindicación 9, caracterizado porque el tumor sólido y el otro tumor sólido son tumores diferentes seleccionados del grupo que consiste de RCC, cáncer de próstata, cáncer de cabeza/cuello.
11. El método de conformidad con la reivindicación 1, caracterizado porque uno o más genes incluyen al menos un gen seleccionado de la Tabla 4 o Tabla 6.
12. El método de conformidad con la reivindicación 1, caracterizado porque uno o más genes incluyen al menos un gen que tiene un transcrito de ARN capaz de hibridizar bajo condiciones severas a una secuencia de sonda de clasificación (CPS) seleccionada de la Tabla 2.
13. El método de conformidad con la reivindicación 1, caracterizado porque uno o más genes incluyen al menos un gen que tiene un transcrito de ARN capaz de hibridizar bajo condiciones severas a un calificador 462 seleccionado del Anexo A.
14. El método de conformidad con la reivindicación 1, caracterizado porgue uno o más genes incluyen al menos 2 genes seleccionados de la Tabla 4.
15. El método de conformidad con la reivindicación 1, caracterizado porque uno o más genes incluyen un clasificador que se identifica usando un algoritmo métrico de correlación de dos clases o de clase múltiple .
16. Un método, caracterizado porque comprende las etapas de : proporcionar al menos una muestra de sangre periférica de un humano que tiene una enfermedad no sanguínea; y comparar un perfil de expresión de uno o más genes en al menos una muestra de sangre periférica con al menos un perfil de expresión de referencia de uno o más genes, en donde cada uno de uno o más genes se expresan diferencxalmente en PBMC de pacientes que tienen la enfermedad no sanguínea y en comparación con PBMC de humano sin enfermedad.
17. El método de conformidad con la reivindicación 16, caracterizado porque la enfermedad no sanguínea es un tumor sólido seleccionado del grupo que consiste de RCC, cáncer de próstata y cáncer de cabeza/cuello . 463
18. Un método para identificar un gen, que se expresa diferencialmente en muestras de sangre periférica de pacientes con enfermedad no sanguínea en comparación con muestras de sangre periférica de humanos de referencia, caracterizado porque comprende las etapas de: proporcionar un perfil de expresión de uno o más genes en muestras de sangre periférica de pacientes con enfermedad no sanguinea; proporcionar un perfil de expresión de referencia de uno o más genes en las muestras de sangre periférica en los humanos de referencia; y comparar el perfil de expresión para el perfil de expresión de referencia para identificar un gen que se expresa diferencialmente en los pacientes con enfermedad no sanguínea con relación a los humanos de referencia.
19. Un kit, caracterizado porque comprende: uno o más polinucleótidos , cada uno del uno o más polinucleótidos capaz de hibridizar bajo condiciones severas a un transcrito de ARN, o el complemento del mismo, de un gen diferencialmente expresado en PBMCs de pacientes que tienen un tumor sólido en comparación con PBMCs de humanos sin enfermedad; o uno o más anticuerpos, cada uno del uno o más anticuerpos capaz de enlazarse a un polipéptido codificado por un gen diferencialmente expresado en PBMCs 464 pacientes que tienen un tumor sólido en comparación con PBMCs de humanos sin enfermedad.
20. Un sistema, caracterizado porque comprende: una memoria que almacena al menos un perfil de expresión de referencia de uno o más genes en muestras de sangre periférica de humanos de referencia, en donde cada uno de los genes se expresa diferencialmente en PBMCs de pacientes que tienen enfermedad no sanguínea en comparación con PBMCs de humanos sin enfermedad; un programa capaz de comparar un perfil de expresión de interés para al menos un perfil de expresión de referencia; y un procesador capaz de ejecutar el programa.
MXPA05005283A 2002-11-21 2003-11-21 Metodos para diagnostico de rcc y otros tumores solidos. MXPA05005283A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US42798202P 2002-11-21 2002-11-21
US45978203P 2003-04-03 2003-04-03
PCT/US2003/037481 WO2004048933A2 (en) 2002-11-21 2003-11-21 Methods for diagnosing rcc and other solid tumors

Publications (1)

Publication Number Publication Date
MXPA05005283A true MXPA05005283A (es) 2005-07-25

Family

ID=32397089

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA05005283A MXPA05005283A (es) 2002-11-21 2003-11-21 Metodos para diagnostico de rcc y otros tumores solidos.

Country Status (8)

Country Link
US (1) US7611839B2 (es)
EP (1) EP1588142A4 (es)
JP (1) JP2006514554A (es)
AU (1) AU2003298689A1 (es)
BR (1) BR0316111A (es)
CA (1) CA2505416A1 (es)
MX (1) MXPA05005283A (es)
WO (1) WO2004048933A2 (es)

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040248170A1 (en) * 1999-01-06 2004-12-09 Chondrogene Limited Method for the detection of hyperlipidemia related gene transcripts in blood
US20090215024A1 (en) * 2001-01-24 2009-08-27 Health Discovery Corporation Biomarkers upregulated in prostate cancer
US20090215058A1 (en) * 2001-01-24 2009-08-27 Health Discovery Corporation Methods for screening, predicting and monitoring prostate cancer
US20090226915A1 (en) 2001-01-24 2009-09-10 Health Discovery Corporation Methods for Screening, Predicting and Monitoring Prostate Cancer
US8008012B2 (en) * 2002-01-24 2011-08-30 Health Discovery Corporation Biomarkers downregulated in prostate cancer
WO2003099312A1 (en) 2002-05-27 2003-12-04 Östergötlands Läns Landsting Method for determining immune system affecting compounds
US20050123594A1 (en) * 2002-11-13 2005-06-09 Sanjay Awasthi Liposomes for protection against toxic compounds
US20060182749A1 (en) * 2002-11-13 2006-08-17 Board Of Regents, The University Of Texas System Therapies for cancer using RLIP76
US9895413B2 (en) 2002-11-13 2018-02-20 Board Of Regents, University Of Texas System Protection against and treatment of ionizing radiation
US8163692B2 (en) * 2002-11-13 2012-04-24 University Of North Texas Health Science Center Of Fort Worth Protection against and treatment of ionizing radiation
WO2004048933A2 (en) 2002-11-21 2004-06-10 Wyeth Methods for diagnosing rcc and other solid tumors
WO2004067716A2 (en) 2003-01-24 2004-08-12 Agensys, Inc. Nucleic acids and corresponding proteins entitled 254p1d6b useful in treatment and detection of cancer
CA2515677A1 (en) * 2003-02-11 2004-08-26 Wyeth Methods for monitoring drug activities in vivo
US20050287532A9 (en) * 2003-02-11 2005-12-29 Burczynski Michael E Methods for monitoring drug activities in vivo
US7643943B2 (en) 2003-02-11 2010-01-05 Wyeth Llc Methods for monitoring drug activities in vivo
EP1618218A2 (en) * 2003-04-29 2006-01-25 Wyeth Methods for prognosis and treatment of solid tumors
EP1522857A1 (en) * 2003-10-09 2005-04-13 Universiteit Maastricht Method for identifying a subject at risk of developing heart failure by determining the level of galectin-3 or thrombospondin-2
US20070276040A1 (en) * 2004-02-04 2007-11-29 Mamoru Sato Peptidyl Arginine Deiminase Type IV Inhibitor
EP1766043A4 (en) * 2004-06-19 2012-05-30 Genenews Corp COMPUTER SYSTEMS AND METHODS FOR CONSTRUCTING BIOLOGICAL CLASSIFIERS AND USES THEREOF
US7991557B2 (en) * 2004-06-19 2011-08-02 Genenews Corporation Computer system and methods for constructing biological classifiers and uses thereof
US20060094018A1 (en) * 2004-08-03 2006-05-04 Bauer A R Jr Discovery and a method for the early detection of pancreatic cancer and other disease conditions
US7820382B2 (en) * 2004-08-03 2010-10-26 Bauer A Robert Method for the early detection of breast cancer, lung cancer, pancreatic cancer and colon polyps, growths and cancers as well as other gastrointestinal disease conditions and the preoperative and postoperative monitoring of transplanted organs from the donor and in the recipient and their associated conditions related and unrelated to the organ transplantation
US20080280282A1 (en) * 2004-08-03 2008-11-13 Bauer Jr A Robert Method for early detection of various cancers and gastrointestinal disease and monitoring of transplanted organs
US8080373B2 (en) * 2004-08-03 2011-12-20 Bauer Jr A Robert Method for the early detection of pancreatic cancer and other gastrointestinal disease conditions
SE0402536D0 (sv) 2004-10-20 2004-10-20 Therim Diagnostica Ab Immunoregulation in cancer, chronic inflammatory and autoimmune diseases
US11105808B2 (en) 2004-11-12 2021-08-31 Health Discovery Corporation Methods for screening, predicting and monitoring prostate cancer
AU2006210794A1 (en) * 2005-02-01 2006-08-10 Government Of The U.S.A., As Represented By The Secretary, Department Of Health & Human Services Biomarkers for tissue status
WO2006097388A2 (en) * 2005-02-08 2006-09-21 Innogenetics N.V. Nucleic acid variants in the c1qr1 gene associated with altered innate immunity.
MX2007010001A (es) * 2005-02-18 2007-09-27 Wyeth Corp Marcadores farmacogenomicos para el pronostico de tumores solidos.
EP1875246B1 (en) * 2005-04-15 2016-10-05 CanImGuide Therapeutics AB Diagnostic method for detecting cancer by measuring amount of a cytokine like il-6
WO2006119434A2 (en) * 2005-05-02 2006-11-09 University Of Southern California DNA METHYLATION MARKERS ASSOCIATED WITH THE CpG ISLAND METHYLATOR PHENOTYPE (CIMP) IN HUMAN COLORECTAL CANCER
JP5435529B2 (ja) 2005-09-02 2014-03-05 東レ株式会社 腎ガン診断、腎ガン患者予後予測のための組成物および方法
EP1988164A4 (en) * 2006-02-23 2009-04-22 Univ Kanazawa Nat Univ Corp METHOD FOR TESTING THE SENSITIVITY OF SOLIC CANCER AGAINST A TYROSINE KINASE INHIBITOR AND CORRESPONDING TEST REQUIREMENTS
WO2008086502A2 (en) * 2007-01-10 2008-07-17 University Of Chicago Molecular marker for clear renal cell carcinoma
DK2487186T3 (da) 2007-05-08 2017-01-16 Canimguide Therapeutics Ab Immunregulatoriske strukturer fra normalt forekommende proteiner
WO2009091023A1 (ja) 2008-01-17 2009-07-23 Toray Industries, Inc. 腎癌の診断又は検出のための組成物及び方法
ES2663662T3 (es) * 2008-01-18 2018-04-16 President And Fellows Of Harvard College Métodos para detectar distintivos de enfermedades o afecciones en fluidos corporales
US20110020433A1 (en) 2008-02-07 2011-01-27 Cunningham C Casey Compositions for delivery of cargo such as drugs proteins and/or genetic materials
GB0803464D0 (en) * 2008-02-26 2008-04-02 Medical Res Council Methods and compositions
DE102008031699A1 (de) * 2008-07-04 2010-01-14 Protagen Ag Markersequenzen für Prostataentzündungserkrankungen, Prostatakarzinom und deren Verwendung
WO2010033371A2 (en) * 2008-09-22 2010-03-25 Advpharma, Inc. Molecular markers for lung and colorectal carcinomas
WO2010048347A2 (en) * 2008-10-21 2010-04-29 Astute Medical, Inc. Methods and compositions for diagnosis and prognosis of renal injury and renal failure
MX2011004501A (es) * 2008-10-29 2011-11-18 Bg Medicine Inc Inmunoensayo de galectina-3.
KR101087617B1 (ko) * 2009-03-19 2011-11-29 한국생명공학연구원 Enigma―Mdm2 상호작용 및 그 용도
CN102573874A (zh) * 2009-07-24 2012-07-11 泰拉皮奥公司 用于辐射后保护的组合物和方法
CN102576028A (zh) * 2009-08-25 2012-07-11 保函医药公司 半乳凝集素-3和心脏再同步疗法
WO2011073905A1 (en) * 2009-12-14 2011-06-23 Koninklijke Philips Electronics N.V. Novel tumor markers
NZ705645A (en) 2010-01-11 2016-05-27 Genomic Health Inc Method to use gene expression to determine likelihood of clinical outcome of renal cancer
US9606057B2 (en) 2010-06-01 2017-03-28 Todos Medical Ltd. Biochemical analysis of PBMC
US20110301110A1 (en) * 2010-06-03 2011-12-08 Aucagne Romain TRIM33 (TIF1gamma) AS A NEW DIAGNOSTIC MARKER OF CHRONIC MYELOMONOCYTIC LEUKEMIA (CMML)
WO2012153326A1 (en) 2011-05-11 2012-11-15 Todos Medical Ltd. Diagnosis of cancer
JP5872285B2 (ja) * 2011-12-28 2016-03-01 株式会社島津製作所 腎がん血中マーカー
AU2013203713B2 (en) 2012-02-13 2015-07-16 Terapio Corporation RLIP76 as a medical chemical countermeasure
US9493810B2 (en) 2012-06-07 2016-11-15 Pioma, Inc. 5-ALA for detection of brain tumors
CN104781415A (zh) * 2012-06-28 2015-07-15 卡尔德拉健康有限责任公司 用于诊断前列腺癌的靶向RNA-Seq的方法和材料
LT2920308T (lt) * 2012-10-31 2019-04-25 Ionis Pharmaceuticals, Inc. Vėžio gydymas
US20160222457A1 (en) * 2012-11-14 2016-08-04 Mayo Foundation For Medical Education And Research Methods and materials for identifying malignant skin lesions
US10494675B2 (en) 2013-03-09 2019-12-03 Cell Mdx, Llc Methods of detecting cancer
WO2014164365A1 (en) * 2013-03-09 2014-10-09 Harry Stylli Methods of detecting head and neck cancer
EP2965086A4 (en) 2013-03-09 2017-02-08 Harry Stylli Methods of detecting prostate cancer
WO2014191980A1 (en) 2013-05-28 2014-12-04 Todos Medical Ltd. Differential diagnosis of benign tumors
SG10201709537PA (en) 2013-05-30 2017-12-28 Genomic Health Inc Gene expression profile algorithm for calculating a recurrence score for a patient with kidney cancer
EP3046544A4 (en) 2013-09-17 2017-03-22 Terapio Corporation Methods of preventing or treating mucositis using rlip76
US9611304B2 (en) * 2014-05-29 2017-04-04 The University Of British Columbia TNNT1 mini-promoters
WO2016025717A1 (en) 2014-08-14 2016-02-18 Mayo Foundation For Medical Education And Research Methods and materials for identifying metastatic malignant skin lesions and treating skin cancer
WO2016031816A1 (ja) 2014-08-26 2016-03-03 学校法人慶應義塾 抗がん剤の感受性の判定マーカー
US10626464B2 (en) 2014-09-11 2020-04-21 Cell Mdx, Llc Methods of detecting prostate cancer
EP3067698A1 (en) 2015-03-11 2016-09-14 Institut d'Investigació Biomèdica de Bellvitge (IDIBELL) Pd-ecgf as biomarker of cancer
JP6976257B2 (ja) 2016-01-28 2021-12-08 シーメンス・ヘルスケア・ダイアグノスティックス・インコーポレーテッドSiemens Healthcare Diagnostics Inc. マルチビューの特徴付けのための方法及び装置
WO2017132169A1 (en) * 2016-01-28 2017-08-03 Siemens Healthcare Diagnostics Inc. Methods and apparatus for detecting an interferent in a specimen
WO2017196944A1 (en) 2016-05-10 2017-11-16 Mayo Foundation For Medical Education And Research Methods and materials for staging and treating skin cancer
EP3523453A4 (en) * 2016-10-05 2020-08-19 Institute Of Environmental Science And Research Limited RNA SEQUENCES USED TO IDENTIFY AN ORGANIC LIQUID
WO2020081956A1 (en) * 2018-10-18 2020-04-23 Medimmune, Llc Methods for determining treatment for cancer patients
WO2021030604A1 (en) * 2019-08-14 2021-02-18 University Of Massachusetts Urinary rna signatures in renal cell carcinoma (rcc)
WO2023102519A1 (en) * 2021-12-02 2023-06-08 The Children's Medical Center Corporation Gene therapy in succinic semialdehyde dehydrogenase deficiency (ssadhd)

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4489710A (en) 1981-06-23 1984-12-25 Xoma Corporation Composition and method for transplantation therapy
WO1983001451A1 (en) 1981-10-23 1983-04-28 Molecular Biosystems Inc Oligonucleotide therapeutic agent and methods of making same
US4671958A (en) 1982-03-09 1987-06-09 Cytogen Corporation Antibody conjugates for the delivery of compounds to target sites
US4522811A (en) 1982-07-08 1985-06-11 Syntex (U.S.A.) Inc. Serial injection of muramyldipeptides and liposomes enhances the anti-infective activity of muramyldipeptides
US4625014A (en) 1984-07-10 1986-11-25 Dana-Farber Cancer Institute, Inc. Cell-delivery agent
US4542225A (en) 1984-08-29 1985-09-17 Dana-Farber Cancer Institute, Inc. Acid-cleavable compound
US4638045A (en) 1985-02-19 1987-01-20 Massachusetts Institute Of Technology Non-peptide polyamino acid bioerodible polymers
US4751180A (en) 1985-03-28 1988-06-14 Chiron Corporation Expression using fused genes providing for protein product
US4935233A (en) 1985-12-02 1990-06-19 G. D. Searle And Company Covalently linked polypeptide cell modulators
US4902505A (en) 1986-07-30 1990-02-20 Alkermes Chimeric peptides for neuropeptide delivery through the blood-brain barrier
US5459039A (en) 1989-05-12 1995-10-17 Duke University Methods for mapping genetic mutations
US5498531A (en) 1993-09-10 1996-03-12 President And Fellows Of Harvard College Intron-mediated recombinant techniques and reagents
GB9517779D0 (en) 1995-08-31 1995-11-01 Roslin Inst Edinburgh Biological manipulation
GB9517780D0 (en) 1995-08-31 1995-11-01 Roslin Inst Edinburgh Biological manipulation
US5840506A (en) 1996-06-05 1998-11-24 Thomas Jefferson University Methods for the diagnosis and prognosis of cancer
US5919638A (en) 1996-10-08 1999-07-06 Abbott Laboratories Reagents and methods useful for detecting prostate tumors
US6303301B1 (en) 1997-01-13 2001-10-16 Affymetrix, Inc. Expression monitoring for gene function identification
US6063028A (en) 1997-03-20 2000-05-16 Luciano; Joanne Sylvia Automated treatment selection method
US6190857B1 (en) * 1997-03-24 2001-02-20 Urocor, Inc. Diagnosis of disease state using MRNA profiles in peripheral leukocytes
US6087098A (en) 1997-04-15 2000-07-11 The Trustees Of Columbia University In The City Of New York Enhanced reverse transcriptase polymerase chain assay to detect MN in patients with renal cell carcinoma
US6420108B2 (en) * 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
EP1021549A2 (en) 1997-09-19 2000-07-26 Sequitur, Inc. SENSE mRNA THERAPY
US20030104371A1 (en) 1997-09-24 2003-06-05 Strom Terry B. Methods of evaluating transplant rejection
FR2771422B1 (fr) 1997-11-21 2001-07-27 Centre Nat Rech Scient Reactifs et methodes pour la detection de genes lies au complexe majeur d'histocompatibilite d'oiseaux d'elevage, tels que le poulet
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
JP3944996B2 (ja) 1998-03-05 2007-07-18 株式会社日立製作所 Dnaプローブアレー
CA2359816C (en) 1999-01-06 2010-08-03 Genenews Inc. Method for the detection of gene transcripts in blood and uses thereof
DE19956568A1 (de) 1999-01-30 2000-08-17 Roland Kreutzer Verfahren und Medikament zur Hemmung der Expression eines vorgegebenen Gens
US6605273B2 (en) 1999-04-08 2003-08-12 Schering Corporation Renal cell carcinoma treatment
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
BR0009884A (pt) 1999-04-21 2002-01-08 American Home Prod Processos e composições para a inibição da função das sequências de polinucleotìdeos
AU1086501A (en) 1999-10-15 2001-04-30 Carnegie Institution Of Washington Rna interference pathway genes as tools for targeted genetic interference
GB9927444D0 (en) 1999-11-19 2000-01-19 Cancer Res Campaign Tech Inhibiting gene expression
WO2001053836A2 (en) 2000-01-24 2001-07-26 Millennium Pharmaceuticals, Inc. Identification, assessment, prevention, and therapy of prostate cancer
AU2001245793A1 (en) 2000-03-16 2001-09-24 Cold Spring Harbor Laboratory Methods and compositions for rna interference
JP2003527856A (ja) 2000-03-17 2003-09-24 ベニテック オーストラリア リミテッド 遺伝子のサイレンシング
ES2336887T5 (es) 2000-03-30 2019-03-06 Whitehead Inst Biomedical Res Mediadores de interferencia por ARN específicos de secuencias de ARN
EP1290161B1 (en) 2000-05-30 2011-06-22 Johnson & Johnson Research Pty Limited METHODS FOR MEDIATING GENE SUPPRESION BY USING FACTORS THAT ENHANCE RNAi
US20020042072A1 (en) 2000-06-26 2002-04-11 Jacobus Van Meel Method for monitoring the effect of cancer therapies
JP2004527209A (ja) 2000-07-21 2004-09-09 ソーントン、マイケル ヒトキナーゼ
CA2420862A1 (en) 2000-09-21 2002-03-28 Incyte Genomics, Inc. Protein phosphatases
US7198895B2 (en) 2000-11-14 2007-04-03 Mohanlal Ramon W In vitro cell-based methods for biological validation and pharmacological screening of chemical entities and biologicals
TWI286074B (en) 2000-11-15 2007-09-01 Wyeth Corp Pharmaceutical composition containing CCI-779 as an antineoplastic agent
DE10057894A1 (de) * 2000-11-22 2002-06-06 Adnagen Gmbh Diagnose-Kit, DNS-Chip sowie Verfahren zur Diagnostik oder Behandlungskontrolle bei Hodenkrebs
CA2429721A1 (en) 2000-11-28 2002-06-06 Wyeth Expression analysis of inhibitor of differentiation nucleic acids and polypeptides useful in the diagnosis and treatment of prostate cancer
WO2002075314A2 (en) 2000-11-30 2002-09-26 Matritech, Inc. Detection and treatment of prostate cancer
US20020132274A1 (en) 2001-01-17 2002-09-19 Nevalainen Marja T. Diagnostic and monitorings methods for cancer
US20030091569A1 (en) 2001-10-18 2003-05-15 Genentech, Inc. Methods for the treatment of carcinoma
WO2004048933A2 (en) 2002-11-21 2004-06-10 Wyeth Methods for diagnosing rcc and other solid tumors
US20050287532A9 (en) 2003-02-11 2005-12-29 Burczynski Michael E Methods for monitoring drug activities in vivo
US7643943B2 (en) 2003-02-11 2010-01-05 Wyeth Llc Methods for monitoring drug activities in vivo
CA2515677A1 (en) 2003-02-11 2004-08-26 Wyeth Methods for monitoring drug activities in vivo
EP1618218A2 (en) 2003-04-29 2006-01-25 Wyeth Methods for prognosis and treatment of solid tumors

Also Published As

Publication number Publication date
EP1588142A2 (en) 2005-10-26
WO2004048933A2 (en) 2004-06-10
CA2505416A1 (en) 2004-06-10
WO2004048933A3 (en) 2005-11-10
JP2006514554A (ja) 2006-05-11
US20040110221A1 (en) 2004-06-10
BR0316111A (pt) 2005-09-13
EP1588142A4 (en) 2007-10-31
US7611839B2 (en) 2009-11-03
AU2003298689A1 (en) 2004-06-18

Similar Documents

Publication Publication Date Title
US7611839B2 (en) Methods for diagnosing RCC and other solid tumors
US10689711B2 (en) Test kits and methods for their use to detect genetic markers for urothelial carcinoma of the bladder and treatment thereof
LaTulippe et al. Comprehensive gene expression analysis of prostate cancer reveals distinct transcriptional programs associated with metastatic disease
US20170039328A1 (en) Molecular profiling for cancer
CN1950701B (zh) 乳腺癌预后
US20100131286A1 (en) Methods for the prognosis or for the diagnosis of a thyroid disease
WO2010064702A1 (ja) 癌の予後を予測するためのバイオマーカー
Shou et al. Identification of blood biomarkers of rheumatoid arthritis by transcript profiling of peripheral blood mononuclear cells from the rat collagen-induced arthritis model
WO2004097051A2 (en) Methods for diagnosing aml and mds differential gene expression
WO2012092336A2 (en) Molecular profiling for cancer
MX2007014537A (es) Genes de la enfermedad de la leucemia y sus usos.
MX2009002535A (es) Metodos para predecir la metastasis distante de cancer de mama primario negativo en el nodo linfatico, utilizando el analisis de expresion del gen de la trayectoria biologica.
US20210148916A1 (en) Methods for Monitoring Polymorphonuclear Myeloid Derived Suppressor Cells and Compositions and Methods of Treatment of Cancer
US20190367964A1 (en) Dissociation of human tumor to single cell suspension followed by biological analysis
WO2013025322A2 (en) Marker-based prognostic risk score in liver cancer
AU2021265878A1 (en) Immunotherapy response signature
JP2008529554A (ja) 固形腫瘍の予後のための薬理ゲノミクス的マーカー
Bauer et al. Gene-expression profiling in rheumatic disease: tools and therapeutic potential
US20230059578A1 (en) Protein markers for estrogen receptor (er)-positive-like and estrogen receptor (er)-negative-like breast cancer
CA3214819A1 (en) Protein markers for estrogen receptor (er)-positive luminal a(la)-like and luminal b1 (lb1)-like breast cancer
WO2022091085A1 (en) Methods of assessing the therapeutic activity of agents for the treatment of immune disorders
WO2010138843A2 (en) Acute lymphoblastic leukemia (all) biomarkers
US20070212688A1 (en) Method For Distinguishing Cbf-Positive Aml Subtypes From Cbf-Negative Aml Subtypes
GIBELLINI IFI16 reduced expression is correlated with unfavorable outcome in chronic lymphocytic leukemia
EP1682906A2 (en) Method for distinguishing aml subtypes with differents gene dosages

Legal Events

Date Code Title Description
FA Abandonment or withdrawal