ES2549752T3 - Métodos y sistemas para el análisis de células individuales - Google Patents

Métodos y sistemas para el análisis de células individuales Download PDF

Info

Publication number
ES2549752T3
ES2549752T3 ES11810302.7T ES11810302T ES2549752T3 ES 2549752 T3 ES2549752 T3 ES 2549752T3 ES 11810302 T ES11810302 T ES 11810302T ES 2549752 T3 ES2549752 T3 ES 2549752T3
Authority
ES
Spain
Prior art keywords
cells
expression
analysis
genes
tert
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11810302.7T
Other languages
English (en)
Inventor
Michael F. Clarke
Stephen R. Quake
Piero D. Dalerba
Huiping Liu
Anne Leyrat
Tomer Kalisky
Maximilian Diehn
Michael Rothenberg
Jianbin Wang
Neethan Lobo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Leland Stanford Junior University
Original Assignee
Leland Stanford Junior University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Leland Stanford Junior University filed Critical Leland Stanford Junior University
Application granted granted Critical
Publication of ES2549752T3 publication Critical patent/ES2549752T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1072Differential gene expression library synthesis, e.g. subtracted libraries, differential screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método para el análisis de la biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende: i. particionar aleatoriamente las células de la biopsia en ubicaciones individuales, en las que las células son clasificadas antes de su partición de acuerdo con la presencia de uno o más marcadores en la superficie de la célula; ii. recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado; iii. llevar a cabo un análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente, en el que el análisis del transcriptoma se utiliza para categorizar las células aisladas en grupos que muestran similitudes en su perfil de expresión; y iv. usar los datos del transcriptoma para la identificación de uno o más objetivos terapéuticos para el tratamiento de dicho tumor heterogéneo, en el que los perfiles de expresión obtenidos se comparan con un perfil de referencia o de control para la elaboración de un diagnóstico, de un pronóstico o de un análisis de la eficacia farmacológica, en el que el uno o más objetivos terapéuticos son una metiltransferasa de ADN, una metiltransferasa de ARN, una enzima similar a una metiltransferasa, una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona, una desmetilasa de histona, una cinasa de proteína.

Description

imagen1
DESCRIPCIÓN
Métodos y sistemas para el análisis de células individuales
Reivindicación de prioridad
Antecedentes de la invención
En los años recientes, el análisis de los patrones de expresión génica proporciona una forma de mejorar el diagnóstico y la estratificación del riesgo de muchas enfermedades. Por ejemplo, un análisis no supervisado de los patrones de expresión génica globales ha identificado distintos subtipos de cáncer, que se distinguen por unas grandes diferencias en la expresión génica, enfermedades que eran consideradas homogéneas si nos basábamos en los métodos diagnósticos clásicos. Dichos subtipos moleculares están a menudo asociados con diferentes resultados clínicos. El patrón de expresión génica global también puede ser examinado para evaluar las características que se correlacionan con el comportamiento clínico, para la creación de unas firmas pronósticas.
El cáncer, como muchas enfermedades, no es frecuentemente el resultado de una única causa bien definida, sino que más bien puede contemplarse como muchas enfermedades, provocadas cada una de ellas por diferentes aberraciones en rutas de información, que finalmente dan como resultado unos fenotipos patológicos aparentemente similares. La identificación de los polinucleótidos que son expresados diferencialmente en las células cancerosas, precancerosas o con un bajo potencial metastásico con respecto a las células normales del mismo tipo tisular, puede proporcionar una base para herramientas diagnósticas, facilitando el descubrimiento de fármacos al proporcionar objetivos para agentes candidatos, y adicionalmente sirve para identificar agentes terapéuticos para terapias oncológicas que están más adaptados al tiempo de cáncer que se va a tratar.
La identificación de los productos génicos expresados diferencialmente también ayuda adicionalmente a la comprensión de la progresión y la naturaleza de enfermedades complejas, y es la clave para la identificación de los factores genéticos que son responsables de los fenotipos relacionados con el desarrollo de, por ejemplo, los genotipos metastásicos o inflamatorios. La identificación de los productos génicos que son expresados diferencialmente en diversas etapas y en diversos tipos de células, puede proporcionar, ambos, unas pruebas diagnósticas tempranas y servir adicionalmente como agentes terapéuticos. Adicionalmente, el producto de un gen expresado diferencialmente puede ser la base de ensayos de cribado para la identificación de agentes quimioterapéuticos que modulen su actividad (por ejemplo, su expresión, su actividad biológica, y similares).
El diagnóstico temprano de una enfermedad tiene una importancia crucial para detener la progresión de la enfermedad y reducir la morbilidad. El análisis de muestras de un paciente para la identificación de los patrones de expresión génica proporciona la base de una terapia específica más racional de la enfermedad que pueda dar como resultado una disminución en los efectos secundarios adversos con respecto a las terapias convencionales. Adicionalmente, la confirmación de que una lesión presenta menos riesgo para el paciente (por ejemplo, que un tumor es benigno) puede evitar terapias innecesarias. En resumen, la identificación de los patrones de expresión génica en células relacionadas con enfermedades puede proporcionar una base terapéutica, diagnóstica, pronóstica, teramétrica, y similares.
Como otro ejemplo, las enfermedades infecciosas provocan daños en tejidos y órganos que dan lugar a la morbilidad y la mortalidad de un organismo en particular. En el caso de las infecciones por gripe A, la causa más frecuente de hospitalización y muerte es la infección del tejido pulmonar. Sin embargo, las células precisas que son infectadas por la gripe y las células que reparan los pulmones lesionados no son comprendidas a nivel de la célula individual. Dicho conocimiento podría ayudar a identificar objetivos terapéuticos para una intervención, tales como nuevos fármacos para prevenir infecciones víricas, y nuevos tratamientos para mejorar la morbilidad.
Muchos tumores contienen poblaciones mixtas de células cancerosas que podrían diferir con respecto a las rutas de señalización que usan para su crecimiento y supervivencia. Dado que estas células cancerosas difieren con respecto a su respuesta a una terapia en particular, la resistencia de una población de células madre cancerosas en particular contribuye a las recaídas después de una radioterapia y una quimioterapia citotóxicas. Como tales, los fracasos de tratamiento en clínica pueden ser debidos parcialmente a la resistencia de una población de células cancerosas en particular a la terapia
El encogimiento inicial observado a menudo en un tumor poco después del tratamiento puede reflejar más que la relativa sensibilidad de una subpoblación de células cancerosas, que podría comprender el conjunto de un tumor y puede no ser importante para la supervivencia a largo plazo. Por lo tanto, la variable clínica más importante para la evaluación de la respuesta al tratamiento y el pronóstico puede no ser el tamaño absoluto del tumor sino más bien el número absoluto de una población de células cancerosas en particular que quedan después del tratamiento. Si se pudieran identificar las diferencias en las rutas de señalización usadas por estas diferentes poblaciones de células cancerosas en un tumor, entonces podrían diseñarse terapias que se dirijan a cada población de células. Mediante el direccionamiento a todas las poblaciones, se podrían eliminar tumores mediante el tratamiento con fármacos que afecten a cada población diferente.
Como otro ejemplo, la enfermedad inflamatoria del intestino da como resultado la desestabilización de la estructura normal del intestino, dando como resultado problemas tales como diarrea, hemorragias y malabsorción. Estos problemas están provocados por la destrucción del revestimiento normal de la mucosa del intestino. El revestimiento de la mucosa del colon consiste en criptas, en las que las células caliciformes, las células madre y las células progenitoras están en la base de la cripta, mientras que las células maduras, que incluyen los enterocitos y las células caliciformes, residen en la parte superior de la cripta. Con respecto a la enfermedad inflamatoria del intestino, no se sabe qué poblaciones celulares están lesionadas ni qué rutas de señalización son necesarias para la reparación de la mucosa dañada.
imagen2
Los métodos para la determinación precisa del número y el fenotipo de las células en lesiones patológicas mediante el uso de unas pocas células es de gran interés para el pronóstico, el diagnóstico, la identificación de las rutas a las que pueden dirigirse productos terapéuticos específicos, de múltiples enfermedades, incluyendo la enfermedad inflamatoria del intestino, infecciones, cánceres, enfermedades autoinmunes tales como la artritis reumatoide, e infecciones. La presente invención aborda este asunto.
Resumen de la invención
Se proporcionan composiciones y métodos para el uso de la caracterización de la expresión génica de células individuales y/o el análisis del transcriptoma. Un método proporcionado en el presente documento es un método para la identificación de diferentes poblaciones celulares en una muestra de un tumor sólido heterogéneo, que comprende: particionar aleatoriamente las células individuales del tumor en ubicaciones individuales; llevar a cabo el análisis del transcriptoma de una pluralidad de los genes de las células particionadas individualmente en las ubicaciones individuales; y llevar a cabo un análisis agrupado para la identificación de una o más poblaciones celulares diferentes. En algunos casos, las células individuales no son enriquecidas antes de particionar. El análisis del transcriptoma puede llevarse a cabo sobre al menos 1.000 células individuales simultáneamente. El análisis del transcriptoma puede llevarse a cabo mediante el uso de un análisis de los ácidos nucleicos. Las ubicaciones individuales pueden estar en un sustrato plano. En algunas formas de realización, el particionado aleatorio se lleva a cabo en un sistema microfluido. El análisis del transcriptoma puede comprender el análisis dell ARN expresado, del ARN no expresado o de ambos. El análisis del transcriptoma puede ser un análisis completo del transcriptoma. El análisis del transcriptoma puede comprender la amplificación del ARN mediante el uso de un único conjunto de pares de cebadores, que en algunas formas de realización no son cebadores internos.
El análisis del transcriptoma puede llevarse a cabo simultáneamente o sustancialmente en tiempo real en todas las células individuales o un en subconjunto. La una o más poblaciones celulares pueden ser células madre normales, células progenitoras normales, células maduras normales, células inflamatorias, células cancerosas, células madre cancerosas o células madre no oncogénicas.
También se proporciona en el presente documento un método para el tratamiento de una afección en un sujeto que comprende: la administración de uno o más agentes terapéuticos que selectivamente se unen, inhiben o modulan uno o más de los objetivos recogidos en la Tabla 1 y/o en la Tabla 2 o una ruta de un adjetivo recogido en la Tabla 1 y/o en la Tabla 2. Los objetivos, en algunas formas de realización no son Notch4 ni Tert, ni ambos. Los agentes pueden ser antagonistas o inhibidores de una ruta Nodal. Algunos objetivos pueden incluir LEFTY1, LEFTY2 y CFTR, un marcador de la superficie celular y/o un ARN mensajero. Una afección que se va a tratar puede ser cáncer de mama, cáncer de colon, colitis ulcerosa o enfermedad inflamatoria del intestino. En algunas formas de realización, el agente terapéutico es un anticuerpo o un fragmento de anticuerpo, una molécula pequeña, un ácido nucleico, un ARN, un ADN, una quimera de ARN -ADN, una proteína o un péptido. Un ácido nucleico puede ser un ARNip.
Adicionalmente se proporciona en el presente documento un método para el análisis de una biopsia de un tumor heterogéneo de un sujeto, que comprende: particionar aleatoriamente las células de la biopsia en ubicaciones individuales; llevar a cabo el análisis del transcriptoma sobre al menos 50 genes de las células particionadas individualmente; y mediante el uso de los datos del transcriptoma, identificar una o más características del tumor. La etapa de realización puede llevarse a cabo sin un enriquecimiento previo de un tipo celular. Una característica identificada puede ser la presencia, la ausencia o el número de células cancerosas. Una característica identificada puede ser también la presencia, la ausencia o el número de células madre, de células progenitoras tempranas, de células progenitoras de diferenciación temprana, de células progenitoras de diferenciación tardía o de células maduras. Una característica identificada también puede ser la eficacia de un agente terapéutico para eliminar una o más de las células. Una característica identificada también puede ser la actividad de una ruta de señalización, por ejemplo, una ruta específica hacia una célula madre cancerosa, una célula cancerosa diferenciada, una célula cancerosa madura, o una combinación de las mismas. Un método divulgado en el presente documento puede comprender adicionalmente la etapa del uso de la característica para diagnosticar a un sujeto con cáncer o en un estadio oncológico.
Otro método divulgado en el presente documento es un método para la identificación de una ruta de señalización utilizada por una célula patológica, que comprende: particionar aleatoriamente las células de una muestra heterogénea; llevar a cabo un análisis del transcriptoma de las células particionadas; usar el análisis del transcriptoma para la identificación de al menos una célula patológica; comparar el análisis de transcriptoma de la al menos una célula patológica con el transcriptoma de: a) una célula no patológica; b) una célula patológica diferente; y c) una célula madre patológica; e identificar una ruta de señalización que es expresada en (i) la célula patológica,
imagen3
(ii) la célula madre patológica y (iii) opcionalmente en la célula patológica diferente, pero no en una célula no patológica, identificando así una ruta de señalización utilizada por una célula patológica. El estado patológico puede ser cáncer, colitis ulcerosa o enfermedad inflamatoria del intestino. En algunas formas de realización, la ruta de señalización es necesaria para la supervivencia de dicha célula patológica.
La presente divulgación también proporciona un método para el diagnóstico de un sujeto con una afección que comprende: particionar aleatoriamente las células de una muestra heterogénea; llevar a cabo un primer análisis del transcriptoma de las células particionadas; usar el análisis del transcriptoma para la identificación de al menos una célula patológica mediante la comparación del primer análisis del transcriptoma de la al menos una célula patológica con un segundo análisis del transcriptoma de una célula no patológica, diagnosticando así la presencia o la ausencia de una afección relacionada con la célula patológica en dicho sujeto. El estado patológico puede ser cáncer de mama, cáncer de colon, colitis ulcerosa o enfermedad inflamatoria del intestino. El análisis del transcriptoma puede comprender el análisis del ARN expresado, del ARN no expresado o de ambos. El análisis del transcriptoma puede ser un análisis del transcriptoma completo.
Otro método más proporcionado en el presente documento es un método para el cribado de un agente terapéutico que comprende: exponer un primer sujeto con células patológicas a uno o más agentes de prueba; obtener una biopsia de un tumor heterogéneo de una región de interés del sujeto; llevar a cabo un análisis del transcriptoma de al menos una célula individual de la biopsia del tumor heterogéneo, en el que la biopsia comprende una o más células patológicas; y comparar el análisis del transcriptoma con un transcriptoma derivado de: (i) un segundo sujeto sin las células patológicas; o (ii) el primer sujeto antes de dicha etapa de exposición; e identificar un agente que afecte al transcriptoma de las células del área de prueba que sean más parecidas a las del segundo sujeto o el primer sujeto antes de la exposición. La afección puede ser cáncer de mama, cáncer de colon, colitis ulcerosa o enfermedad inflamatoria del intestino. Un agente terapéutico puede ser un anticuerpo o un fragmento de anticuerpo, una molécula pequeña, un ácido nucleico (por ejemplo, un ARNip), un ARN, un ADN, una quimera de ARN - ADN, una proteína o un péptido.
La presente divulgación también proporciona un método para la determinación de la potencial eficacia de un agente terapéutico frente a una enfermedad, que comprende: separar una primera población de células patológicas en ubicaciones individuales, en las que las ubicaciones individuales comprenden una célula individual; determinar el nivel de expresión de al menos un ácido nucleico o una proteína de al menos una de las células individuales, produciendo así una firma de expresión patológica; exponer una segunda población de células patológicas a un agente; separar la segunda población de células patológicas en ubicaciones individuales, en las que las ubicaciones individuales comprenden una célula individual; determinar el nivel de expresión de al menos un ácido nucleico o una proteína de al menos una de las células individuales de la segunda población; y comparar el nivel de expresión de la célula individual de la segunda población con la firma de expresión patológica, determinando así la eficacia de un agente frente a la enfermedad. La etapa de exposición puede llevarse a cabo in vivo. En algunos casos, la primera población y la segunda población se aíslan a partir de un sujeto, por ejemplo, de un ser humano. La enfermedad puede ser cáncer, colitis ulcerosa o enfermedad inflamatoria del intestino. El ácido nucleico o la proteína puede ser un marcador de una célula cancerosa, un marcador de una célula madre cancerosa o ambos. Un nivel de expresión puede ser un nivel de expresión del ARNm. En algunas formas de realización, la determinación del nivel de expresión del ARNm comprende la detección de la expresión o de la ausencia de expresión de 10 o más ácidos nucleicos. Un nivel de expresión también puede ser un nivel de expresión de una proteína. Las etapas de separación pueden comprender la exposición de la población de células a un anticuerpo que se une específicamente a una proteína presente en las células individuales.
Adicionalmente se proporciona en el presente documento un método para la determinación de la probabilidad de una respuesta por parte de un sujeto a un agente terapéutico, que comprende: separar una población de células de un sujeto en ubicaciones individuales, en las que las ubicaciones individuales comprenden una célula individual y en las que al menos una de las células individuales es una célula patológica; determinar el nivel de expresión de al menos un ácido nucleico o una proteína de al menos una de las células patológicas individuales, en las que el ácido nucleico o la proteína es un objetivo del agente terapéutico; y determinar la probabilidad de una respuesta por parte de un sujeto basada en el nivel de expresión del al menos un ácido nucleico o proteína. Un nivel de expresión puede ser un nivel de expresión del ARNm. En algunas formas de realización, la terminación del nivel de expresión del ARNm comprende la detección de la expresión o de la ausencia de expresión de 10 o más ácidos nucleicos. Un nivel de expresión también puede ser un nivel de expresión de una proteína. Las etapas de separación pueden comprender la exposición de la población de células a un anticuerpo que se une específicamente a una proteína presente en las células individuales. El agente terapéutico puede ser un agente antineoplásico.
Otro método detallado en el presente documento proporciona un método pronóstico o diagnóstico que utiliza la expresión génica de las células individuales, que comprende las etapas de: separar las células de una muestra heterogénea en posiciones abordables por separado; lisar las células individuales y dividir los lisados resultantes en al menos dos porciones; amplificar el ARNm o el ADNc derivado de las mismas a partir de las células individuales; determinar los perfiles de expresión génica de una de las porciones del lisado, en el que el perfil de expresión génica proporciona información sobre una subpoblación; y llevar a cabo un análisis del transcriptoma en al menos una célula de una subpoblación objetivo. En algunos métodos se analizan al menos 102 o al menos 103 células individuales. Las células pueden ser clasificadas según la expresión de al menos un marcador de la superficie de la célula. Las células analizadas mediante los métodos divulgados en el presente documento pueden ser células madre, por ejemplo, células madre hematopoyéticas. Las muestras iniciales pueden comprender menos de 106 células o menos de 105 células. Las células pueden ser clasificadas según la expresión de al menos uno de CD34 y Thy1. En algunas formas de realización, se determina la expresión de al menos uno o al menos cinco (5) genes asociados a las células madre hematopoyéticas. El análisis del transcriptoma es un análisis del transcriptoma completo.
imagen4
Adicionalmente se proporciona en el presente documento un método para la clasificación de una célula madre, que comprende las etapas de: (a) obtener el perfil del transcriptoma de una célula madre a partir de una muestra; y (b) comparar el perfil del transcriptoma obtenido con el perfil del transcriptoma de una célula madre de referencia. Un perfil de transcriptoma puede comprender un conjunto de datos obtenido a partir de al menos aproximadamente 5 proteínas asociadas a una célula madre. Las células madre analizadas puede ser células madre cancerosas, células madre hematopoyéticas, células madre intestinales, células madre leucémicas o células madre pulmonares. Las muestras analizadas pueden incluir células de un cáncer, por ejemplo, de un carcinoma de mama o de un carcinoma de colon. El análisis del perfil del transcriptoma también puede comprender las etapas adicionales de: extraer el ARNm a partir de una muestra de células madre; cuantificar el nivel de una o más especies de ARNm correspondientes a las secuencias específicas de la célula madre; y comparar el nivel de una o más especies de ARNm con el nivel de dicha especie de ARNm en una muestra de referencia.
También se proporciona en el presente documento un método para la recolección de datos relativos a un transcriptoma, que comprende las etapas de: recoger los datos relativos a un transcriptoma mediante el uso de cualquiera de los métodos descritos en el presente documento, y enviar dichos datos a un ordenador. Un ordenador puede estar conectado a un aparato de secuenciación. Los datos correspondientes a un transcriptoma pueden ser almacenados adicionalmente después de su envío, por ejemplo, los datos pueden ser almacenados en un medio legible por ordenador que puede ser extraído desde el ordenador. Los datos pueden ser transmitidos desde el ordenador hasta una ubicación remota, por ejemplo, a través de internet.
Adicionalmente se proporciona en el presente documento un método para el análisis de una biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende las etapas de: particionar aleatoriamente las células de la biopsia en ubicaciones individuales; recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado; llevar a cabo el análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente; y usar los datos del transcriptoma para la identificación de uno o más objetivos terapéuticos para el tratamiento de dicho tumor heterogéneo. El uno o más objetivos terapéuticos pueden ser una metiltransferasa de ADN o de ARN, una enzima similar a la metiltransferasa o un derivado de la misma. El uno o más objetivos terapéuticos también pueden ser una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona o un derivado de la misma. El uno o más objetivos terapéuticos también puede ser una desmetilasa de histona o un derivado de la misma, una cinasa de proteína o un derivado de la misma.
Adicionalmente se proporciona en el presente documento un método para el análisis de una biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende las etapas de: particionar aleatoriamente las células de la biopsia en ubicaciones individuales; recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado; llevar a cabo el análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente; y usar los datos del transcriptoma para la identificación de uno o más marcadores diagnósticos presentes en la biopsia tumoral para la detección del cáncer y la evaluación del estadio del cáncer. El uno o más marcadores diagnósticos pueden ser una metiltransferasa de ADN o de ARN, una enzima similar a la metiltransferasa o un derivado de la misma. El uno o más marcadores diagnósticos pueden ser también una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona o un derivado de la misma. El uno o más marcadores diagnósticos pueden ser también una desmetilasa de histona o un derivado de la misma. Finalmente, el uno o más marcadores diagnósticos pueden ser una cinasa de proteína o un derivado de la misma.
También se proporciona en el presente documento un método para el análisis de una biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende las etapas de: particionar aleatoriamente las células de la biopsia en ubicaciones individuales; recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado; llevar a cabo el análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente; y usar los datos del transcriptoma para la identificación de uno o más marcadores diagnósticos para la evaluación de la eficacia del tratamiento de dicho tumor heterogéneo. El uno o más marcadores diagnósticos pueden ser una metiltransferasa de ADN o de ARN, una enzima similar a la metiltransferasa o un derivado de la misma. El uno o más marcadores diagnósticos pueden ser también una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona o un derivado de la misma. El uno o más marcadores diagnósticos pueden ser también una desmetilasa de histona o un derivado de la misma, o una cinasa de proteína o un derivado de la misma.
imagen5
Breve descripción de los dibujos
El archivo de la patente o de la solicitud contiene al menos un dibujo realizado en color. Las copias de esta patente o publicación de solicitud de patente con dibujo(s) en color serán proporcionadas por la Oficina previa solicitud y pago de la tasa necesaria.
Figura 1. Análisis de la expresión génica de una célula individual mediante una PCR en tiempo real de “células madre de cáncer colorrectal” humanas (EpCAMhigh) purificadas a partir de tejidos cancerosos colorrectales humanos xenoinjertados en ratones NOD / SCID (tumor #4m6). En el primer experimento (panel A) se han analizado 16 células individuales para comprobar la expresión de 5 genes, llevando a cabo 27 réplicas para cada combinación de célula-gen; en este experimento, cada preparación de ARNm de una célula individual se usa en 3 filas consecutivas de la matriz de reacción, y cada conjunto de cebadores específicos del gen se usa en 9 columnas consecutivas, con la única excepción de las primeras tres, en las que no se añadieron cebadores; los niveles de expresión génica de cada célula individual pueden ser visualizados como bloques de 3 x 9 mediante el uso de una escala a color. En el segundo experimento (panel B) se siguió una metodología similar, mientras que se han analizado 16 células individuales para comprobar la expresión de 16 genes, llevando a cabo 9 réplicas para cada combinación de célulagen; en este segundo caso, cada preparación de ARNm de una célula individual se usa en 3 filas consecutivas de la matriz de reacción, y cada conjunto de cebadores específicos del gen se usa en 3 columnas consecutivas, de forma que los niveles de expresión génica de cada célula individual pueden ser visualizados en forma de bloques de 3 x 3 mediante el uso de una escala a color. En ambos casos, el ensayo muestra un elevado nivel de reproducibilidad y coherencia en cada conjunto de réplicas.
Figura 2. Análisis de la expresión génica de una célula individual mediante una PCR en tiempo real de “células madre de cáncer colorrectal” humanas (células EpCAMhigh / CD166+, del xenoinjerto #8m3). En esta figura, cada fila identifica una célula individual y cada columna identifica un gen distinto. La intensidad de la expresión génica está representada mediante el uso de un código de colores, en el que el rojo oscuro indica una intensidad más fuerte y el verde oscuro una intensidad más débil. El análisis muestra claramente que, basándose en su repertorio transcripcional, las células tumorales EpCAMhigh / CD166+ pueden subdividirse en distintos subconjuntos. Lo más importante, los subconjuntos celulares que muestran una expresión coordinada y simultánea de unos elevados niveles de los genes que codifican para los marcadores de diferenciación terminal del epitelio del colon (por ejemplo, citoqueratina 20, CD66a / CEACAM1, anhidrasa carbónica II, MUC2, factor de la familia Trefoil 3) no expresan o expresan unos bajos niveles de los genes que codifican para los marcadores candidatos de las células madre intestinales o genes que se sabe que son necesarios para la función de la célula madre (por ejemplo, hTERT, LGR5, Survivina), y viceversa.
Figura 3 A -B. a: purificación de las MTIC 11'ESA+H2K- a partir de células pulmonares de ratones NOD / SCID portadores de tumores de cáncer de mama. Panel superior, células separadas de linaje H2K-Dapilviable), panel inferior izquierdo células ESA+ separadas para la separación adicional de las células CD244V en el panel inferior derecho, b: análisis mediante una PCR en tiempo real de los niveles de ARNm de HIF1a, Snail2, Zeb2, E-cadherina, Vimentina, VEGFC, CCR7, Lox, Cox2 en las MTIC y no en las TIC.
Figura 4. Valores de CT de un análisis mediante una PCR en tiempo real de los niveles de microARN (miR) en comparación con las TIC y las MTIC primarias.
Figura 5 A- 5 D. CD66a como marcador de las células cancerosas no oncogénicas de cáncer de mama.
Figura 6. Análisis del número de copias de variantes de 18 muestras celulares para varios miles de CNV. Muchas pueden estar asociadas a una inestabilidad genómica y dar lugar a una alteración en las propiedades de las células madre pluripotenciales.
Figura 7. Dispositivo de análisis de células individuales, principio.
Figura 8. Análisis de enriquecimiento del conjunto de genes de la expresión de los genes relacionados con las células madre. Se analizaron los genes expresados por las HSC normales autorrenovables, las células madre leucémicas derivadas de progenitores de Granulocitos / Macrófagos (GMP) pero no por GMP normales no autorrenovables en células madre de cáncer de mama (CSC) y en su progenie no oncogénica (NTG). Como se ha predicho, estos genes estaban significativamente sobrerrepresentados en la firma de expresión génica de las CSC. Se muestra un mapa térmico de los genes sobreexpresados.
Figura 9. Un esquema de la clasificación “in silico” para el aislamiento de subpoblaciones raras de células. Las poblaciones celulares, tales como las células madre hematopoyéticas, son clasificadas mediante FACS en placas de 96 pocillos que contienen una única célula. Las células se lisan y el lisado se divide en dos fracciones. Una fracción del lisado es analizada para comprobar la expresión de un conjunto de genes, permitiendo la caracterización de las células sobre la base de la transcripción, en lugar de la expresión de las proteínas de superficie. Utilizando esta información, los lisados seleccionados y/o los lisados agrupados a partir de células similares se someten a un análisis del transcriptoma completo.
Figura 10. Una representación pictórica de la recolección, el almacenamiento y el transporte de los datos a través de un ordenador.
imagen6
Figura 11. Una representación gráfica de un mapa térmico que muestra la viabilidad del análisis de células individuales.
Figura 12. Una comparación de poblaciones de células de cáncer de colon (CD66+ y CD66-) mediante el uso de un análisis de células individuales.
Figura 13. Una representación del uso de genes constitutivos para la selección de muestras celulares.
Figura 14. Un análisis de agrupamiento jerárquico que muestra que muestra que el TERT es expresado por poblaciones celulares tempranas.
Figura 15. Un análisis de agrupamiento jerárquico en células de colon, que muestra la presencia de células madre LGR5- y LGR- TERT+.
Figura 16. Un análisis de agrupamiento jerárquico que muestra heterogeneicidad basándose en los genes de desarrollo.
Figura 17. Datos que muestran que varios genes se expresan diferentemente en varias células de cáncer de colon.
Figura 18. Datos que muestran la metodología usada para la determinación de las mediciones de corte de los niveles de expresión a partir de experimentos de qRT-PCR en células individuales. Se muestra la expresión con respecto al control negativo.
Figura 19. Datos que muestran la metodología usada para la verificación de que es posible la cuantificación del ARN sobre las cantidades de ARN recogidas a partir de una célula. Se muestran los ensayos de diversas cantidades de ARN y de conjuntos de cebadores.
Figura 20. Datos que muestran la metodología usada para la verificación de que es posible la cuantificación del ARN sobre las cantidades de ARN recogidas a partir de una célula. Se muestran los ensayos de diversas cantidades de ARN y de conjuntos de cebadores.
Figura 21. Datos que muestran la metodología usada para la verificación de que es posible la cuantificación del ARN sobre las cantidades de ARN recogidas a partir de una célula. Puede derivarse el umbral del ciclo para la amplificación.
Figura 22. Datos que muestran la metodología usada para la verificación de que es posible la cuantificación del ARN sobre las cantidades de ARN recogidas a partir de una célula. Puede derivarse el umbral del ciclo para la amplificación.
Figura 23. La variabilidad en la expresión génica entre células individuales procedentes de tejido humano es mayor que la variabilidad de los estándares de ARN.
Figura 24. Histogramas de diferentes ensayos que demuestran que la variabilidad intracelular medida (para la mayoría de los ensayos de buena calidad) es mayor que el ruido interno del protocolo de medida.
Figura 25. Histogramas de diferentes ensayos que demuestran que la variabilidad intracelular medida es mayor que el ruido interno del protocolo de medida.
Figura 26. Histogramas de diferentes ensayos que demuestran que la variabilidad intracelular medida (para la mayoría de los ensayos de buena calidad) es mayor que el ruido interno del protocolo de medida.
Figura 27. Validación de varios conjuntos de cebadores.
Figura 28. Validación de varios conjuntos de cebadores.
Figura 29. Metodología para la identificación de células fiables.
Figura 30. Se muestran conjuntos de genes útiles para el agrupamiento jerárquico de células de colon. También se muestran posibles genes objetivo tales como Notch1, Notch2, Stat3, IGF1R, IGF2R, EphB4 y LGR5-6.
Figura 31. Se muestra la capacidad para correlacionar la expresión génica con el TERT. Una posible aplicación es usar esta metodología para dirigirse a las células que expresan el TERT. En el eje X se indican algunos genes que son posibles objetivos.
Figura 32. Se muestra la capacidad para correlacionar la expresión génica con el TERT. Una posible aplicación es usar esta metodología para dirigirse a las células que expresan el TERT. En el eje X se indican algunos genes que son posibles objetivos.
imagen7
Figura 34. Se muestran los genes usados para el agrupamiento jerárquico de las células de colon en el eje X en la izquierda. En el lado derecho del eje X están los posibles genes objetivo. Esta metodología puede ser útil para la evaluación de cánceres de colon para el tratamiento de un colon objetivo y normal para una caracterización de la toxicidad.
Figura 35. Agrupamiento jerárquico por grupos celulares. Los genes expresados en ciertos tipos celulares están
marcados por un cuadrado negro. Figura 36. Se muestran los genes usados para el agrupamiento jerárquico de células de colon en el eje X en la izquierda. En el lado derecho del eje X están los posibles genes objetivo. Esta metodología puede ser útil para la evaluación de cánceres de colon para el tratamiento de un colon objetivo y normal para una caracterización de la toxicidad.
Figura 37. Se muestran los genes usados para el agrupamiento jerárquico de células de colon en el eje X en la izquierda. En el lado derecho del eje X están los posibles genes objetivo. Esta metodología puede ser útil para la evaluación de cánceres de colon para el tratamiento de un colon objetivo y normal para una caracterización de la toxicidad.
Figura 38. Células de cáncer de colon analizadas en ensayos de chips múltiples. Figura 39. Se muestran los genes usados para el agrupamiento jerárquico de células de colon en el eje X en la izquierda. En el lado derecho del eje X están los posibles genes objetivo. Esta metodología puede ser útil para la
evaluación de cánceres de colon para el tratamiento de un colon objetivo y normal para una caracterización de la toxicidad. Figura 40. Se muestran 6 muestras, 5 por duplicado, del análisis de las células de colon individuales. Se analiza la
expresión de los posibles genes para el direccionamiento hacia los tumores. Figura 41. Mapa térmico combinado después de eliminar las células no deseadas. Figura 42. Agrupamiento jerárquico por grupos celulares. Los genes expresados en ciertos tipos celulares están
marcados por un cuadrado negro. Figura 43. Muestra el grado de asociación del TERT en un gráfico de barras. Figura 44. Expresiones génicas asociadas con la expresión del TERT. Figura 45. Expresiones génicas asociadas con la expresión del TERT mediante el uso de un valor mediano. Figura 46. Genes expresados conjuntamente con el TERT. Figura 47. El AXlN es expresado conjuntamente con el TERT. Figura 48. Expresión del BMPR en relación con la expresión del TERT. Figura 49. El C-MYC es expresado conjuntamente con el con TERT Figura 50. Expresión del CYCLIN-D1 en relación con la expresión del TERT. Figura 51. El EPHB es expresado conjuntamente con el con TERT Figura 52. Expresión del HATH en relación con la expresión del TERT. Figura 53. Expresión del INDIAN en relación con la expresión del TERT. Figura 54. Expresión del LIN en relación con la expresión del TERT. Figura 55. Expresión del MET en relación con la expresión del TERT. Figura 56. Expresión del NANOG en relación con la expresión del TERT. Figura 57. Expresión del N-MYC en relación con la expresión del TERT Figura 58. El NOTCH es expresado conjuntamente con el con TERT. Figura 59. Expresión del SOX en relación con la expresión del TERT.
imagen8
mediante cuadrados según los tipos celulares.
Figura 64. Análisis en chip llevados a cabo en células procedentes de una progenie no oncogénica (NTG) o de una progenie oncogénica (TG). Figura 65. Mapa térmico combinado que compara los ocho análisis en chip mediante el uso de células procedentes
de una progenie no oncogénica (NTG) o de una progenie oncogénica (TG). Figura 66. Selección de células para el análisis de la expresión génica de las células individuales. Se representaron
tanto células TG como NTG en una gráfica de dispersión de acuerdo con los niveles de expresión del HPRT o del ACTB. Figura 67. Curvas de la qPCR del Gclm generadas a partir de células NTG y TG. Figura 68. Curvas estándar de ACTB, HPRT GCLM y Chi311 generadas a partir de reacciones de qPCR de células
NTG y TG.
Figura 69. Curvas estándar de TERT, GCLC y PRNP generadas a partir de reacciones de qPCR de células NTG y TG. Figura 70. Histogramas que representan los niveles de expresión génica en células TG o NTG de GSS, GCLM,
GCLC y GPX.
Figura 71. Histogramas que representan los niveles de expresión génica en células TG o NTG de gpx4, gpx7, slpi y pmp. Figura 72. Histogramas que representan los niveles de expresión génica en células TG o NTG de SOD1, SOD2,
SOD3 y CAT.
Figura 73. Histogramas que representan los niveles de expresión génica en células TG o NTG de NFKB1, FOXO1, FOX3A y FOXO4. Figura 74. Histogramas que representan los niveles de expresión génica en células TG o NTG de KRT19, STAT3,
CHI311 y TERT.
Figura 75. Histogramas que representan los niveles de expresión génica en células TG o NTG de HIF1, EPAS1, HPRT y ACTB. Figura 76. Agrupamiento jerárquico de células TG y NTG, que identifica los grupos de genes expresados en ciertas
células (círculo y cuadrado). Figura 77. Mapa térmico diferencial que enfatiza la región 0,7 hasta 1. Figura 78. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en las células TG
o NTG, representados frente a la puntuación Z. Figura 79. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en las células TG
o NTG, representados frente al valor de p.
Figura 80. Agrupamiento jerárquico únicamente de los genes relacionados con el glutatión en forma de un mapa térmico mediante el uso del método de agrupamiento de las k medias. Figura 81. Células TG y NTG comparadas en un agrupamiento medio de los genes relacionados con el glutatión,
tales como GSS, GCLM, FOXO1 y FOXO4.
Figura 82. Se compararon las células TG y NTG en un agrupamiento medio de los genes relacionados con el glutatión, incluyendo HIF1a. Figura 83. Agrupamientos medio-centrado-max-normalizado que compara las poblaciones de TG y de bNTG. Figura 84. Una representación diferente de la Figura 88. Figura 85. Método de cálculo de “medio-centrado-max-normalizado”.
imagen9
Figura 87. Una representación diferente de la Figura 86. Figura 88. Un primer mapa térmico obtenido a partir de células. Figura 89. Un segundo mapa térmico obtenido a partir de células. Figura 90. Un tercer mapa térmico obtenido a partir de células. Figura 91. Un cuarto mapa térmico obtenido a partir de células. Figura 92. Un quinto mapa térmico obtenido a partir de células. Figura 93. Un sexto mapa térmico obtenido a partir de células. Figura 94. Un mapa térmico combinado que compara seis análisis en chip. Figura 95. Selección de células para el análisis de la expresión génica de las células individuales. De las 504 células
ensayadas, se desecharon 56 células que no expresan el HPRT1 ni ninguna de las queratinas (KRT14-870, KRT17207, KRT18-706, KRT19-980) y se seleccionaron 448 células para un análisis adicional.
Figura 96. Curvas estándar que muestra la linealidad de las reacciones de pPCR. Figura 97. Histogramas que representan los niveles de expresión génica en células TG o NTG de TGFBI, SNAI1, BMI1 y KRT19.
Figura 98. Histogramas que representan los niveles de expresión génica en células TG o NTG de TRP63, CDH1,
KRT17 y KRT14. Figura 99. Histogramas que representan los niveles de expresión génica en células TG o NTG de HPRT1, TCF3 y CTNNB1.
Figura 100. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en las células TG o NTG, representada frente al valor de p. Figura 101. Agrupamiento medio-centrado-max-normalizado que compara TG y NTG.
Figura 102. Una representación diferente de la Figura 101. Figura 103. Agrupamiento de medias de k que muestra que HIF1a y HPRT son expresados diferencialmente en las células TG y NTG.
Figura 104. Mapas térmicos de cuatro análisis en chip diferentes de muestras de cáncer de colon. Figura 105. Un mapa térmico combinado que compara los cuatro análisis en chip. Figura 106. Selección de células para un análisis de la expresión génica de las células individuales. De las 336
células ensayadas, se desecharon 68 células al examinar los niveles de expresión de GAPDH y de TACSTD1 y se
seleccionaron 268 células para un análisis adicional. Figura 107. Agrupamiento jerárquico que muestra las expresiones no uniformes de BIRC5, MKI67, VEFGA, KRT19, CD66 y KRT20 entre las células.
Figura 108. Agrupamiento jerárquico que muestra las expresiones no uniformes de BIRC5, MKI67, VEFGA, KRT19,
CD66 y KRT20 (comparación de dos análisis en chip). Figura 109. Agrupamiento jerárquico que mostraba las expresiones no uniformes de BIRC5, MKI67, VEFGA, KRT19, CD66 y KRT20 entre las células (comparación de dos análisis en chip).
Figura 110. Agrupamiento jerárquico que mostraba las expresiones no uniformes de BIRC5, MKI67, VEFGA, KRT19, CD66 y KRT20 entre las células (comparación de dos análisis en chip). Figura 111. Mapas térmicos de la segunda ronda del experimento. Figura 112. Curvas estándar que muestra la linealidad de la qPCR de la segunda ronda. Figura 113. El resultado de los agrupamientos en los que no hay expresión está marcado en color gris.
imagen10
Figura 114. Resultados del agrupamiento que marca poblaciones totales que contienen células que no existen en la población CD66+
Figura 115. Resultados del agrupamiento que marca poblaciones totales que contienen poblaciones CD66+. Figura 116. Mapas térmicos de cuatro análisis en chip diferentes de las muestras. Se tomaron células a partir de mucosa de colon normal. Las células se clasificaron mediante FACS con los marcadores de superficie EpCAM y CD66a. Las células de colon no oncogénicas (NTCC no madres) se definieron como células EpCAM+ / CD66a+. Las células madre de cáncer de colon (CoCSC) se definieron como células EpCAM+ / CD66a-.
Figura 117. Un mapa térmico combinado que compara los cuatro análisis en chip.
Figura 118. Selección de células para un análisis de la expresión génica de las células individuales. De las 924
células ensayadas, se desecharon 219 células al examinar los niveles de expresión de GAPDH y de TACSTD1 y se seleccionaron 705 células para un análisis adicional Figura 119. Histogramas que representan los niveles de expresión génica en células CD66+ o CD66- de ACTB,
AQP9, BIRC5 (SURVIVIN), BIRC5 (EPR1), BMI1, CA2, CDK6, CDKN1 A y CD66A.
Figura 120. Histogramas que representan los niveles de expresión génica en células CD66+ o CD66- de DKC1, DFF4, FOXO1, FSTL1, GAPDH, HES1, HES6, IHH e IL11RA. Figura 121. Histogramas que representan los niveles de expresión génica en células CD66+ o CD66- de KRT20,
LFNG, LGR5, LLGL1, MAML2, MKI67, MUC2, MUC2-094, y NOLA3.
Figura 122. Histogramas que representan los niveles de expresión génica en células CD66+ o CD66-de PCNA, PLS3, RETNLB, RFNG, RNF43, RUVBL2, SLCO3A1, SOX2, y SOX9. Figura 123. histogramas que representan los niveles de expresión génica en células CD66+ o CD66- de TACSTD1,
TCF7L2, TERT, TERT-669, TFF3, TINF2, TOP1, UGT8 y UGT2B17.
Figura 124. Histogramas que representan los niveles de expresión génica en células CD66+ o CD66- de VDR, VEGFA y WWOX. Figura 125. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en células
NTCC y CoCSC, representada frente al valor de p. Figura 126. Medianas de todos los genes en un formato gráfico. Figura 127. Medianas delta de todos los genes en un formato gráfico. Figura 128. Un mapa térmico para 6 réplicas. Figura 129. Resultados del agrupamiento jerárquico que muestra que MUC2, MKI67, TERT, LGR5, TFF3 y CA2 se
expresaron diferencialmente en las células madre enriquecidas o en las células maduras enriquecidas. Figura 130. Una representación diferente de la Figura 129. Figura 131. Genes correlacionados con el TERT que fueron identificados en un análisis del componente principal. Figura 132. Expresiones génicas correlacionadas con la expresión del TERT. Figura 133. Genes asociados con la expresión del TERT. Figura 134. Expresiones génicas asociadas con la expresión del TERT mediante el uso del valor mediano. Figura 135. Genes activados conjuntamente con el TERT. Figura 136. La expresión de CDK6 se correlaciona con la expresión del TERT. Figura 137. Expresión de HES6 en relación con la expresión del TERT. Figura 138. Expresión de DLL4 en relación con la expresión del TERT. Figura 139. Expresión de DKC1 en relación con la expresión del TERT Figura 140. La expresión de IFNG se correlaciona con la expresión del TERT. Figura 141. Expresión de PLS3 en relación con la expresión del TERT. Figura 142. Expresión de RFNG en relación con la expresión del TERT.
imagen11
Figura 143. Expresión TCF712 en relación con la expresión del TERT. Figura 144. Expresión de TOP 1 en relación con la expresión del TERT. Figura 145. La expresión de UGT8 se correlaciona con la expresión del TERT. Figura 146. La expresión de WWOX se correlaciona con la expresión del TERT. Figura 147. Mapas térmicos de 4 análisis en chip diferentes. Se recogieron células de un xenoinjerto de células de
colon. Las células se clasificaron mediante FACS con los marcadores de superficie EpCAM y CD66a. Las células madre de cáncer de colon (CoCSC) se definieron como células EpCAMhigh / CD166+.
Figura 148. Un mapa térmico combinado que compara los cuatro análisis en chip. Figura 149. Selección de células para un análisis de la expresión génica de las células individuales. De las 504 células ensayadas, se desecharon 21 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1 y se seleccionaron 483 células para un análisis adicional.
Figura 150. Eliminación adicional de células que para cada gen, en las que los valores de CT son mayores que en algunos umbrales dependientes de genes.
Figura 151. Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 152. Agrupamiento jerárquico. Los genes expresados en ciertos tipos celulares están marcados por un cuadrado negro.
Figura 153. Mapa de agrupamiento de las medias de k que identifica los genes expresados diferencialmente entre la
población madura y la población madre / en proliferación Figura 154. Agrupamiento de las medias de k que identifica los genes expresados diferencialmente entre la población madura y la población madre / en proliferación. Los genes expresados significativamente diferencialmente están marcados por un cuadrado.
Figura 155. Agrupamiento de las medias de k que identifica los genes expresados diferencialmente entre la
población madura y la población madre / en proliferación. Figura 156. Patrones de expresiones génicas anti-correlacionadas entre las poblaciones, por ejemplo, HES1 y TFF3, CDK6 y CDKN1A, y UGT8 y VEGFA.
Figura 157. Agrupamiento de genes que muestra la diferencia entre las células maduras y en proliferación.
Figura 158. El mapa de agrupamiento después de la normalización con ACTB, GAPDH y TACSTD1 mostró una diferencia entre las dos subpoblaciones Figura 159. Agrupamiento de las medias de k para los genes madre, en proliferación y maduros. Figura 160. Agrupamiento de las medias de k para los genes madre, en proliferación y maduros después de la
normalización con ACTB, GAPDH y TACSTD1. Figura 161. Un mapa térmico de un análisis estándar. Figura 162. Resultado del agrupamiento jerárquico que demuestra que ciertos genes son expresados
diferencialmente, por ejemplo, PCNA, MK167, TERT, CD66a, TFF3, KRT20, WWOX y BMI1. Figura 163. Una representación de los genes expresados. Figura 164. Genes correlacionados con el TERT que fueron identificados en un análisis del componente principal. Figura 165. Expresiones génicas correlacionadas con la expresión del TERT. Figura 166. Expresiones génicas asociadas con la expresión del TERT. Figura 167. Genes que tienen una diferencia significativa en la expresión del TERT. Figura 168. El CDK6 es expresado conjuntamente con el TERT. Figura 169. El DKC1 es expresado conjuntamente con el TERT. Figura 170. Expresión de DLL4 en relación con la expresión del TERT. Figura 171. El HES1 es expresado conjuntamente con el TERT.
imagen12
Figura 172. El HES6 es expresado conjuntamente con el TERT. Figura 173. Expresión de IL11RA en relación con la expresión del TERT. Figura 174. El LFNG es expresado conjuntamente con el TERT. Figura 175. El LLGL es expresado conjuntamente con el TERT. Figura 176. Expresión de MAML2 en relación con la expresión del TERT. Figura 177. El NOLA3 es expresado conjuntamente con el TERT. Figura 178. Expresión de PCNA en relación con la expresión del TERT. Figura 179. El RNF43 es expresado conjuntamente con el TERT. Figura 180. El RUVB es expresado conjuntamente con el TERT. Figura 181. El SLCO es expresado conjuntamente con el TERT. Figura 182. El SOX9 es expresado conjuntamente con el TERT. Figura 183. El TOP1 es expresado conjuntamente con el TERT. Figura 184. Expresión de UGT2B17 en relación con la expresión del TERT. Figura 185. El UGT8 es expresado conjuntamente con el TERT. Figura 186. Expresión de VEGFA en relación con la expresión del TERT. Figura 187. El WWOX es expresado conjuntamente con el TERT. Figura 188. Agrupamiento jerárquico que muestra únicamente el gen relacionado con el TERT. Figura 189. Agrupamiento jerárquico que muestra únicamente el gen relacionado con el TERT. Se muestran los
tipos celulares.
Figura 190. Agrupamiento jerárquico que compara las células normales que son una población CD66a-con una población CD66a+. Figura 191. Agrupamiento jerárquico que compara células cancerosas que son una población CD66a- con una
población CD66a+.
Figura 192. Agrupamiento jerárquico, que representa pares de genes anti-correlacionados tales como CDKN1A y CDK6, y KRT20 y UGT8. Figura 193. Mapas térmicos de ocho análisis diferentes en chip de muestras. Se recogieron células del xenoinjerto
(m10) de células de colon. Las células se clasificaron mediante FACS con EGFP y CD66a. Las células maduras no
oncogénicas se definieron como células EGFP+ / CD66a+. Las células CoCSC se definieron como células EGFP+.
Figura 194. Un mapa térmico combinado que compara los ocho análisis en chip. Figura 195. Selección de células para un análisis de la expresión génica de las células individuales. De las 336 células ensayadas, se desecharon 72 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1, y se seleccionaron 264 células. De las 264 células, se desecharon adicionalmente 5 células al examinar los niveles de expresión génica de EGFP y se seleccionaron 259 células para un análisis adicional.
Figura 196. Eliminación adicional de células que para cada gen, en las que los valores de CT son mayores que en algunos umbrales dependientes de genes, las células se eliminaron. Figura 197. Se confirmó que todas esas células de colon expresaban el EGFP.
Figura 198. Histogramas que representan los niveles de expresión génica de EGFP, KRT20, CD66A y CA2 Figura 199. Histogramas que representan los niveles de expresión génica de LGR5, TERT, OLFM4, MK167, LEFGY1 y LEFTY2.
Figura 200. Agrupamiento jerárquico de todos los genes.
Figura 201. Expresiones génicas correlacionadas con la expresión del TERT.
imagen13
Figura 202. Expresiones génicas asociadas con la expresión del TERT. Figura 203. Expresiones génicas asociadas con la expresión del TERT mediante el uso del valor mediano. Figura 204. El ARL5 es expresado conjuntamente con el TERT. Figura 205. El CES3 es expresado conjuntamente con el TERT. Figura 206. El CLDN es expresado conjuntamente con el TERT. Figura 207. El DIG1 es expresado conjuntamente con el TERT. Figura 208. El DLL4 es expresado conjuntamente con el TERT. Figura 209. El ERBB3 es expresado conjuntamente con el TERT. Figura 210. El ETS2 es expresado conjuntamente con el TERT. Figura 211. El EZEI2 es expresado conjuntamente con el TERT. Figura 212. Expresión del GNAI en relación con la expresión del TERT. Figura 213. Expresión del HUNK en relación con la expresión del TERT. Figura 214. El ID2 es expresado conjuntamente con el TERT. Figura 215. El IGFPB4 es expresado conjuntamente con el TERT. Figura 216. Expresión del KIF12 en relación con la expresión del TERT. Figura 217. Expresión del LABM en relación con la expresión del TERT. Figura 218. Expresión del LEFTY en relación con la expresión del TERT. Figura 219. El METTL3 es expresado conjuntamente con el TERT. Figura 220. El MPP7 es expresado conjuntamente con el TERT. Figura 221. Expresión del NAV1 en relación con la expresión del TERT. Figura 222. Expresión del NRN1 en relación con la expresión del TERT. Figura 223. El NUMB es expresado conjuntamente con el TERT. Figura 224. El OLFM4 es expresado conjuntamente con el TERT. Figura 225. Expresión del PDGFA en relación con la expresión del TERT. Figura 226. El PRKCZ es expresado conjuntamente con el TERT. Figura 227. Expresión del PROX1 en relación con la expresión del TERT. Figura 228. El PTEN es expresado conjuntamente con el TERT. Figura 229. El SCRIB es expresado conjuntamente con el TERT. Figura 230. El SEC24 es expresado conjuntamente con el TERT. Figura 231. El SEC62 es expresado conjuntamente con el TERT. Figura 232. Expresión del STC2 en relación con la expresión del TERT. Figura 233. El SUZ12 es expresado conjuntamente con el TERT. Figura 234. El UGT1A6 es expresado conjuntamente con el TERT. Figura 235. El UGT2B17 es expresado conjuntamente con el TERT. Figura 236. El UGT8 es expresado conjuntamente con el TERT. Figura 237. El UTRN es expresado conjuntamente con el TERT. Figura 238. Agrupamiento jerárquico de la firma de los enterocitos inmaduros y de los genes expresados
imagen14
diferencialmente en diversos tipos celulares.
Figura 239. Agrupamiento jerárquico que ilustra enterocitos inmaduros, enterocitos más maduros, células caliciformes inmaduras y una población de madres y en ciclo. Figura 240. Mapas térmicos de los análisis diferentes en chip de muestras. Se recogieron células a partir del
xenoinjerto (m10) de células de colon. Las células se clasificaron mediante FACS con EGFP y CD66a. Las células maduras no oncogénicas se definieron como células EGFP+ / CD66a+. Las células CoCSC se definieron como células EGFP+.
Figura 241. Un mapa térmico combinado que compara los dos análisis en chip. Figura 242. Se observó una diferencia entre el número de copias Figura 243. Un mapa térmico combinado que compara otros dos análisis en chip. Figura 244. Un mapa térmico combinado. Figura 245. Un mapa térmico que compara la copia con el original. Figura 246. Que el ARN total se dividió igualmente entre el original y la copia. Figura 247. Una comparación entre las muestras y los estándares. Figura 248. Mapas térmicos de cuatro análisis diferentes en chip colon de muestras. Se recogieron células a partir
de mucosa de colon normal. Las células se clasificaron mediante FACS con EpCAM y CD66a. Las NTCC normales se definieron como células EpCAM+ / CD66a+. Las células CoCSC normales se definieron como células EpCAM+ / CD66alow.
Figura 249. Un mapa térmico combinado que compara los cuatro análisis en chip. Figura 250. Selección de células para un análisis de la expresión génica de las células individuales. De las 328 células ensayadas, se desecharon 126 células mediante el análisis de los niveles de expresión génica de GAPDH y de ACTB y se seleccionaron 202 células. De las 202 células, se desecharon adicionalmente 2 células al examinar
los niveles de expresión génica de GAPDH y de TACSTD1, y se seleccionaron 200 células para un análisis adicional. Figura 251. Eliminación adicional de células que para cada gen, en las que los valores de CT son mayores que en
algunos umbrales dependientes de genes, las células se eliminaron. Figura 252. Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 253. Agrupamiento jerárquico de todos los genes. Figura 254. Agrupamiento jerárquico de todos los genes. Los tipos celulares están marcados. Figura 255. Agrupamiento jerárquico de genes del subgrupo 1. Figura 256. Agrupamiento jerárquico de genes del subgrupo 1. Los tipos celulares están marcados. Figura 257. Agrupamiento jerárquico de genes del subgrupo 2. Figura 258. Agrupamiento jerárquico de las medias de k de los genes del subgrupo 2. Figura 259. Agrupamiento jerárquico de las medias de k de los genes del subgrupo 2. Los tipos celulares están
marcados. Figura 260. Agrupamiento jerárquico de los genes expresados diferencialmente. Figura 261. Agrupamiento jerárquico de los genes expresados diferencialmente. Los marcadores para la población
inmadura se definieron como LGR5, ASCL2, LEFTY1, TERT, PTPRO, OLFM, METTL3, LIF12, EZH2, UTRN, UGT8, AQP1, ETS2, LAMB1, CDKN1B, SUZ12, ESF1, CFTR, RBM25, CES3, VIL1, VEGFB, SEC62, MAST4 y DLL4. Las expresiones génicas de los enterocitos maduros se identificaron como KRT20, CEACAM1, CDKN1A, CA2 y VEGFA.
Figura 262. Agrupamiento jerárquico de los genes expresados diferencialmente. Figura 263. Agrupamiento jerárquico de los genes expresados diferencialmente. Las expresiones génicas de de la
población inmadura en ciclo se identificaron como BIRC, TOP2A, MKI67 y GPSM2. . Las expresiones génicas de las células caliciformes maduras se identificaron como TFF3 y MUC2. Figura 264. Mapas térmicos de dos análisis en chip diferentes de las muestras. Las células se tomaron a partir de
imagen15
mucosa normal de colon. Las células se clasificaron mediante FACS con EpCAM y CD66a. Las NTCC normales se definieron como células EpCAM+ / CD66a+. Las células CoCSC normales se definieron como células EpCAM+ / CD66alow.
Figura 265. Un mapa térmico combinado que compara los dos análisis en chip. Figura 266. Selección de células para un análisis de la expresión génica de las células individuales. De las 292 células ensayadas, se desecharon 38 células al examinar los niveles de expresión génica de GAPDH y de ACTB, y
se seleccionaron 254 células. De las 254 células, se desecharon adicionalmente 10 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1, y se seleccionaron 244 células para un análisis adicional. Figura 267. Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 268. Expresiones génicas asociadas con la expresión del TERT. Figura 269. Agrupamiento jerárquico que identifica los genes expresados diferencialmente entre los grupos. Los
tipos celulares están marcados. Figura 270. Agrupamiento jerárquico que identifica los genes expresados diferencialmente entre los grupos. Figura 271. Agrupamiento jerárquico que identifica los genes expresados diferencialmente entre los grupos. Los
tipos celulares y los genes de interés están marcados. Figura 272. La expresión está correlacionada con la expresión del TERT. Figura 273. Expresiones génicas asociadas con la expresión del TERT. Figura 274. Genes que tienen una diferencia significativa en la mediana entre células TERT+ y TERT-. Figura 275. Genes activados conjuntamente con el TERT. Figura 276. Expresión del ACVR1B en relación con la expresión del TERT. Figura 277. Expresión del ACVR1C en relación con la expresión del TERT. Figura 278. Expresión del ACVR2A en relación con la expresión del TERT. Figura 279. Expresión del ACVR2B en relación con la expresión del TERT. Figura 280. Expresión de todos los ACVR en relación con la expresión del TERT. Figura 281. Expresión de ADAM10 en relación con la expresión del TERT. Figura 282. El AQP1 es expresado con el TERT. Figura 283. Expresión del BRD7 en relación con la expresión del TERT. Figura 284. El CDK6 es expresado con el TERT. Figura 285. El CDKNB1 es expresado con el TERT. Figura 286. El CES3 es expresado con el TERT. Figura 287. El CFTR es expresado con el TERT. Figura 288. El ESF1 es expresado con el TERT. Figura 289. El ETS2 es expresado con el TERT. Figura 290. Expresión del EZH2 en relación con la expresión del TERT. Figura 291. El HNFB1 es expresado con el TERT. Figura 292. Expresión del ID2 en relación con la expresión del TERT. Figura 293. El KIF12 es expresado con el TERT. Figura 294. El LEFTY1 es expresado con el TERT. Figura 295. El METTL3 es expresado con el TERT. Figura 296. El MY06 es expresado con el TERT.
imagen16
Figura 297. El PTPRO es expresado con el TERT. Figura 298. El RBBP6 es expresado con el TERT. Figura 299. El RBM25 es expresado con el TERT. Figura 300. El SEC62 es expresado con el TERT. Figura 301. El TOP1 es expresado con el TERT. Figura 302. El UGT1A6 es expresado con el TERT. Figura 303. El UGT2B17 es expresado con el TERT. Figura 304. El UGT8 es expresado con el TERT. Figura 305. El UTRN es expresado con el TERT. Figura 306. El VIL1 es expresado con el TERT. Figura 307. Agrupamiento jerárquico de todos los genes relacionados con el TERT y de los genes centrales. Figura 308. Agrupamiento jerárquico de todos los genes relacionados con el TERT y de los genes centrales pero no
de marcadores del ciclo tales como KI67.
Figura 309. Agrupamiento jerárquico de todos los genes relacionados con el TERT y de los genes centrales. Los
tipos celulares están marcados.
Figura 310. Agrupamiento de las k medias de todos los genes relacionados con el TERT y de los genes centrales.
Figura 311. Los genes correlacionados con el TERT que fueron identificados en un análisis del componente
principal.
Figura 312. Comparación de las poblaciones de TG y NTG mediante el uso de la mediana del valor de CT para cada gen. Figura 313. Medianas delta para todos los genes en un formato gráfico. Figura 314. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en las células
TG o NTG, frente a KRT20.
Figura 315. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en TG o NTG, frente a TFF3. Figura 316. Prueba de significación estadística de Kolmogorov-Smimov para los genes expresados en las células
TG o NTG células, frente al valor de p. Figura 317. Una representación del agrupamiento jerárquico por tipos celulares. Figura 318. Mapas térmicos de 4 análisis diferentes en chip de muestras. Se recogieron células a partir del
xenoinjerto (m6). Figura 319. Un mapa térmico combinado que compara los cuatro análisis en chip. Figura 320. Selección de células para un análisis de la expresión génica de las células individuales. De las 335
células ensayadas, se desecharon 5 células al examinar los niveles de expresión génica de TACSTD1 y de ACTB y
se seleccionaron 330 células. De las 330 células, no se desechó ninguna célula adicional al examinar los niveles de
expresión génica de GAPDH y de ACTB y se seleccionaron las 330 células para un análisis adicional.
Figura 321. Un mapa térmico combinado después de la eliminación de las células no deseadas.
Figura 322. Se ilustra un agrupamiento representativo mediante un estándar normalizado centrado en la media y un agrupamiento de un subconjunto Figura 323. Se ilustra un agrupamiento representativo mediante un estándar normalizado centrado en la media y un
agrupamiento de un subconjunto
Figura 324. Se ilustra un agrupamiento representativo mediante un estándar normalizado centrado en la media y un agrupamiento de un subconjunto Figura 325. Se ilustra un agrupamiento representativo mediante un estándar normalizado centrado en la media y un
imagen17
agrupamiento de un subconjunto Figura 326. Expresiones génicas correlacionadas con la expresión del TERT. Figura 327. Expresiones génicas asociadas con la expresión del TERT. Figura 328. Expresión del ACVR en relación con la expresión del TERT. Figura 329. Expresión del ADAM10 en relación con la expresión del TERT. Figura 330. Expresión del AQP1 en relación con la expresión del TERT. Figura 331. Expresión del ARL5A en relación con la expresión del TERT. Figura 332. Expresión del BRD7 en relación con la expresión del TERT. Figura 333. Expresión del CCND1 en relación con la expresión del TERT. Figura 334. Expresión del CDK2 en relación con la expresión del TERT. Figura 335. Expresión del CDK6 en relación con la expresión del TERT Figura 336. Expresión del CES6 en relación con la expresión del TERT. Figura 337. Expresión del CFTR en relación con la expresión del TERT. Figura 338. Expresión del DLL4 en relación con la expresión del TERT. Figura 339. Expresión del ESF1 en relación con la expresión del TERT. Figura 340. Expresión del ETS2 en relación con la expresión del TERT. Figura 341. La expresión del EZH2 está correlacionada con la expresión del TERT. Figura 342. Expresión del GPR en relación con la expresión del TERT. Figura 343. Expresión del HNF1B en relación con la expresión del TERT. Figura 344. Expresión del HUNK en relación con la expresión del TERT. Figura 345. Expresión del KIF12 en relación con la expresión del TERT. Figura 346. Expresión del LAMB en relación con la expresión del TERT. Figura 347. La expresión del LEFTY está correlacionada con la expresión del TERT. Figura 348. Expresión del METTL3 en relación con la expresión del TERT. Figura 349. Expresión del MY06 en relación con la expresión del TERT. Figura 350. Expresión del OLFM4 en relación con la expresión del TERT. Figura 351. Expresión del PTPRO en relación con la expresión del TERT. Figura 352. Expresión del RBBP6 en relación con la expresión del TERT. Figura 353. Expresión del RBM25 en relación con la expresión del TERT. Figura 354. Expresión del SEC62 en relación con la expresión del TERT. Figura 355. La expresión del SUZ12 está correlacionada con la expresión del TERT. Figura 356. La expresión del TOP1 está correlacionada con la expresión del TERT. Figura 357. Expresión del UGT1A6 en relación con la expresión del TERT. Figura 358. Expresión del UGT2B17 en relación con la expresión del TERT. Figura 359. Expresión del UGT8 en relación con la expresión del TERT. Figura 360. La expresión del UTRN está correlacionada con la expresión del TERT. Figura 361. Expresión del VIL1 en relación con la expresión del TERT.
imagen18
Figura 362. Una representación del agrupamiento jerárquico por tipos celulares, que muestra las células madre, los
enterocitos maduros, los enterocitos inmaduros y las células caliciformes. Figura 363. Una representación del agrupamiento jerárquico por tipos celulares, que muestra las células madre en ciclo y los enterocitos inmaduros.
Figura 364. Un mapa térmico combinado que compara todos análisis en chip. Se tomaron células a partir del xenoinjerto (m4) de la muestra de cáncer de mama. Las células se clasificaron mediante FACS con CD24. Las células Br-CSC se definieron como células CD24-.
Figura 365. Selección de células para el análisis de la expresión génica en células individuales. Figura 366 Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 367. Un agrupamiento jerárquico representativo. Figura 368. Un agrupamiento jerárquico representativo. Los tipos celulares están marcados. Figura 369. Una gráfica de correlación que muestra los genes que son más diferencialmente expresados. Figura 370. Una representación del agrupamiento únicamente con los genes que son expresados significativamente
diferencialmente entre las células TG y NTG.
Figura 371. Resultado de la prueba estadística de K-S que muestra que algunos genes son expresados significativamente diferencialmente entre las células TG y NTG. Los datos están representados frente al valor de p. Figura 372. Una representación del agrupamiento únicamente con los genes que son expresados significativamente
diferencialmente entre las células TG y NTG con un valor de p (K-S) menor de 0,05 / 96 pocillos. Figura 373. Genes expresados diferencialmente en una población de TG. Figura 374. Genes expresados diferencialmente en una población de NTG. Figura 375. Un experimento de agrupamiento jerárquico representativo. Figura 376. Un experimento de agrupamiento jerárquico representativo. Figura 377. Un experimento de agrupamiento jerárquico representativo. Figura 378. Un experimento de agrupamiento jerárquico representativo. Figura 379. Un experimento de agrupamiento jerárquico representativo. Figura 380. Un experimento de agrupamiento jerárquico representativo, que muestra células caliciformes, madre,
enterocitos inmaduros y enterocitos maduros. Figura 381 Un experimento de agrupamiento jerárquico representativo. Figura 382 Un experimento de agrupamiento jerárquico representativo, que muestra células madre en ciclo y
enterocitos inmaduros. Figura 383 Un experimento de agrupamiento jerárquico representativo. Figura 384. Un experimento de agrupamiento jerárquico representativo, que muestra células caliciformes, madre,
enterocitos inmaduros y enterocitos maduros. Figura 385. Selección de células para el análisis de la expresión génica en las células individuales. Se tomaron células a partir de una biopsia de mucosa normal o de un tumor primario. Las células de ambas muestras se clasificaron mediante FACS para comprobar las células EpCAM+ / CD166+. De las 335 células ensayadas, se desecharon 37 células al examinar los niveles de expresión génica de EPCAM y de ACTB, y se seleccionaron 298
células. De las 298 células, se desecharon adicionalmente 4 células al examinar los niveles de expresión génica de GAPDH y de ACTB y se seleccionaron 294 células para un análisis adicional. Figura 386. Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 387. Se ilustran los histogramas que representan los niveles de expresión génica en células de mucosa
normales o de un tumor primario para los siguientes genes: ACTB, CA1, GAPDH, SHH, BIRC5, CDKN1A, GPSM2,
PRPRO, CFTR, LEFTY1 y OLFM. Figura 388. La prueba de significación estadística de Kolmogorov-Smimov para genes expresados en células normales o en células tumorales primarias identificó las muestras que expresaban unos niveles significativamente
imagen19
mayores de cada gen. Figura 389. Genes clasificados mediante el uso de los valores medianos. Figura 390. Un agrupamiento jerárquico representativo para las muestras cancerosas y las muestras normales. Figura 391. Un agrupamiento jerárquico representativo para las células cancerosas. Figura 392. Un agrupamiento jerárquico representativo para las células normales. Figura 393. Un agrupamiento jerárquico que muestra la expresión de CEACAM1 y de TERT en una muestra normal
o tumoral.
Figura 394. Mapas térmicos de 4 análisis diferentes en chip de nuestras. Se tomaron células de dos muestras individuales de colon de ratón.
Figura 395. Un mapa térmico combinado que compara los 4 análisis en chip.
Figura 396. Selección de células para un análisis de la expresión génica de las células individuales. De las 168 células ensayadas, se desecharon 81 células al examinar los niveles de expresión génica de TACSTD1 y de ACTB, y se seleccionaron 87 células. De las 87 células, se desecharon adicionalmente 30 células al examinar los niveles de expresión génica de HPRT y de ACTB, y se seleccionaron 57 células para un análisis adicional.
Figura 397. Un mapa térmico combinado después de la eliminación de las células no deseadas.
Figura 398. Un agrupamiento representativo normalizado estándar centrado en la media.
Figura 399. Se identificaron algunos pares de genes anti-correlacionados, incluyendo TERT y CA2, KLF4 y KLF5, CD66 y TERT.
Figura 400. Se identificaron algunos pares de genes anti-correlacionados, incluyendo BMI1 y FGF5, FGR5 y CD66, y CD66 y BMI1.
Figura 401. Un agrupamiento jerárquico que muestra únicamente FGR5, BMI1 y CD66a.
Figura 402. Mapas térmicos de 4 análisis diferentes en chip de las muestras. Se tomaron células de epitelio de mama normal. Las células se clasificaron mediante FACS con EpCAM, Lin y CD49f. Las células epiteliales totales se definieron como células EpCAM+ / Lin- / CD49f+. Las células estromales desconocidas se identificaron como células EpCAM- / Lin- / CD49f-.
Figura 403. Un mapa térmico combinado que compara los 4 análisis en chip.
Figura 404. Selección de células para un análisis de la expresión génica de las células individuales. De las 168 células ensayadas, se desecharon 9 células al examinar los niveles de expresión génica de GAPDH y de ACTB y se seleccionaron 159 células para un análisis adicional.
Figura 405. Un mapa térmico combinado después de la eliminación de las células no deseadas.
Figura 406. Un agrupamiento jerárquico representativo.
Figura 407. Un agrupamiento jerárquico representativo, que muestra la respuesta a las hormonas de los genes de la familia EGFR y del gen LEFTY.
Figura 408. Un agrupamiento jerárquico representativo, que muestra los marcadores basales, los marcadores luminales, CD49f y EpCAM.
Figura 409. Un agrupamiento jerárquico representativo, que muestra únicamente CD49f+.
Figura 410. Un mapa térmico de muestras obtenidas a partir de epitelio y de estroma.
Figura 411. Un agrupamiento jerárquico representativo de la Figura 410.
Figura 412 Mapas térmicos de 4 análisis diferentes en chip de las muestras. Las células se obtuvieron a partir de un xenoinjerto (m10). Las células se clasificaron mediante FACS con EGFP y CD66a. Las células maduras no oncogénicas se definieron como células EGFP+ / CD66a+. Las células CoCSC se definieron como células EGFP+. Las células clasificadas mediante FACS se sometieron a un conjunto de diferentes condiciones experimentales: 5 l de sort-mix con Tween-20 al 0,025 % (para analizar si la adición de Tween-20 es de alguna ayuda); calentadas a 65 ºC durante 10 minutos o a 95 ºC durante 5 minutos. La muestra se dividió entonces en un “original” y una “copia”. Los estándares se añadieron un día antes de los experimentos y se congelaron de nuevo. Se muestran los mapas térmicos de la primera serie de tres conjuntos en dos condiciones diferentes (a 65 ºC, 10 min o a 95 ºC, 5 min).
imagen20
Figura 413. Un segundo conjunto de mapas térmicos de los experimentos descritos en la Figura 412.
Figura 414. Un tercer conjunto de mapas térmicos de los experimentos descritos en la Figura 412.
Figura 415. Curvas estándar que muestran la linealidad de la qPCR.
Figura 416. Se muestran los niveles de expresión génica entre el original y la copia para ciertos genes, incluyendo GAPH, ALCAM, ATOH1, AXIN2, CA2 y CECAM1.
Figura 417. Se muestran los niveles de expresión génica entre el original y la copia para ciertos genes, incluyendo NOTCH1, LGF5, HES5, KRT20, HES6 e IHH.
Figura 418. Se muestran los niveles de expresión génica entre el original y la copia para ciertos genes, incluyendo TACSTD1, SOX2, NOTCH2 y RETNLB.
Figura 419. Comparación entre los resultados obtenidos en un conjunto de experimentos llevados a cabo independientemente.
Figura 420. Que sin la división del ARNm, se observa una variabilidad similar en las réplicas en la que CT es menor de 20 en experimentos estándar de dilución del ARN total.
Figura 421. Un mapa térmico combinado. Las células se tomaron a partir de mucosa de colon normal. Las células se clasificaron mediante FACS con los marcadores de superficie EpCAM y CD66a. Las células NTCC normales se definieron como células EpCAM+ / CD66a+. Las células CoCSC normales se definieron como células EpCAM+ / CD66alow.
Figura 422. Selección de células para un análisis de la expresión génica de las células individuales. De las 168 células ensayadas, se desecharon 46 células al examinar los niveles de expresión de GAPDH y de ACTB, y se seleccionaron 126 células. De las 126 células, se desecharon adicionalmente 9 células al examinar los niveles de expresión de EPCAM y de ACTB y, se usaron 117 células para un análisis adicional.
Figura 423. Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 424. Un agrupamiento jerárquico representativo. Figura 425. Un agrupamiento jerárquico representativo, que muestra células caliciformes, madre, enterocitos
maduros y enterocitos inmaduros.
Figura 426 Un agrupamiento jerárquico representativo, que muestra los genes expresados diferencialmente en varios tipos celulares (caja cuadrada). Figura 427. Un mapa térmico combinado. Las células se tomaron a partir del colon de ratones de la raza FVB. Las
células se clasificaron mediante FACS con los marcadores Esa, CD45 y CD66a. Las células se agruparon en dos
poblaciones; Esa+ / CD45- / CD66ahi o Esa+ / CD45- / CD66ahi/low. Figura 428. Selección de células para un análisis de la expresión génica de las células individuales. De las 336 células ensayadas, se desecharon 10 células al examinar los niveles de expresión de GAPDH y de ACTB y se seleccionaron 326 células. De las 326 células, se desecharon adicionalmente 63 células al examinar los niveles de expresión de TACSTD1 y de ACTB y se usaron 263 células para un análisis adicional.
Figura 429. Un mapa térmico combinado después de la eliminación de las células no deseadas. Figura 430. Un agrupamiento jerárquico representativo de todos los genes. Figura 431. Un agrupamiento jerárquico representativo que compara la población enriquecida en células madre con
la población enriquecida en células maduras. Figura 432. Agrupamiento jerárquico únicamente de las células CD66a-. Figura 433. Agrupamiento jerárquico únicamente de las células CD66a-, excluyendo las células elegidas. Figura 434. Mapas térmicos de los experimentos preparados con 6 réplicas por dilución. Figura 435. Eficacia de la qPCR en los estándares. Figura 436. Linealidad en la amplificación, que es demostrada por la amplificación lineal de los genes
seleccionados, tales como ACTB, CA2, CAR1 y CLDN7. Figura 437. Linealidad en la amplificación, que es demostrada por la amplificación lineal de los genes seleccionados, tales como GAPDH, GPSM2, KLF4 y KRT20.
imagen21
Figura 438. Linealidad en la amplificación, que es demostrada por la amplificación lineal de los genes seleccionados, tales como MUC2, OLFM4, TACSTD1 y TFF3. Figura 439. Un agrupamiento jerárquico de genes con una elevada eficacia en la PCR.
Figura 440. Que algunos genes son sobreexpresados en las células clasificadas. Figura 441. Selección de células para un análisis de la expresión génica de las células individuales. Las células se tomaron a partir de epitelio de mama normal de ratón. Las células se clasificaron mediante FACS con los marcadores de superficie CD24, CD49f, CD49 y Lin. Las células madre enriquecidas se definieron como CD24med / CD49fhi / Lin-. Las células progenitoras enriquecidas se definieron como CD24h / CD49med / Lin-. De las 168 células ensayadas, se desecharon 8 células al examinar los niveles de expresión de ACTB y se seleccionaron 160 células.
Figura 442. Un mapa térmico combinado de las células madre enriquecidas.
Figura 443. Un agrupamiento jerárquico representativo de las células madre enriquecidas.
Figura 444. Un agrupamiento jerárquico representativo de las células madre enriquecidas en el que los genes
expresados diferencialmente están marcados con un cuadrado. Figura 455. Un mapa térmico combinado de las células progenitoras enriquecidas. Figura 456. Selección de células en la que las células progenitoras fueron eliminadas al examinar las expresiones
génicas de GAPDH y de ACTB. Figura 457. Un agrupamiento jerárquico representativo que compara las MRU con las MaCFC. Figura 448. Un agrupamiento jerárquico representativo que muestra únicamente las MaCFC. Figura 449. Un mapa térmico combinado de células madre y de células caliciformes y enterocitos maduros. Figura 450. Se realizó una qPCR del chip M48 o del chip M96 y se compararon los resultados entre sí. Figura 451. Mapas térmicos de las muestras de la qPCR. Figura 452. Curvas estándar generadas a partir de estos análisis, que muestran que están muy cercanas entre sí. Figura 453. Se compara la eficacia entre los chips M48 y M96, con la excepción de un elevado ruido de fondo en el
análisis 96 preamplificado. Figura 454. Ilustra un agrupamiento jerárquico de la xenografía de mama para los genes seleccionados. Figura 455. Ilustra un agrupamiento jerárquico de CD49fhigh de la xenografía de mama para los genes
seleccionados. Figura 456. Ilustra el agrupamiento jerárquico de ITGA6. Figura 457. Ilustra el agrupamiento jerárquico de una muestra de mama normal humana. Figura 458. Ilustra el agrupamiento jerárquico de una muestra de mama normal CD49f. Figura 459. Ilustra otra vista del agrupamiento jerárquico de muestra de mama normal CD49f. Figura 460. Ilustra el agrupamiento jerárquico de una muestra de mama normal CD49flow . Figura 461. Ilustra el agrupamiento jerárquico de una muestra de mama normal CD49f+. Figura 462. Ilustra el agrupamiento jerárquico de una muestra de mama normal CD49fhigh. Figura 463. Ilustra el agrupamiento jerárquico de una muestra de mama normal CD49f+. Figura 464. Ilustra el agrupamiento jerárquico de CDH1 y ESR1. Figura 465. Ilustra el agrupamiento jerárquico de CDH1. Figura 466. Representación gráfica de un chip en matriz de micropocillos para el lavado en el chip y la presentación
de la célula. Figura 467. Ilustra el lavado en el chip de las células, con células con una tinción doble. Figura 468. Una representación pictórica de una forma de realización de un clasificador celular / recolector celular.
imagen22
Figura 469. Es una representación gráfica de una demostración de la clasificación de las células GFP.
Figura 470. Ilustra los patrones de expresión génica de las células individuales a partir de cultivos in vitro de células madre. Figura 471. Separación de subpoblaciones de criptas de colon con CD44, CD66a y CD24. Figura 472. Análisis de la expresión génica de las células individuales que compara la base de la cripta con la parte
superior de la cripta. Figura 473. Las células Lgr5high y Bmi1high son fenotípicamente distintas CD24low/neg CD44high CD24high
Figura 474. Las células CD44med y pueden generar teratomas de colon autorrenovadores
Figura 475. Aislamiento de células epiteliales, hematopoyéticas y estromales a partir de colon murino disociado. Figura 476. Expresión génica diferencial en células clasificadas a partir de la base de la cripta y de la parte superior de la cripta.
Figura 477. Análisis de las células individuales de las células epiteliales de mama humanas y de ratón. Figura 478. El Thy-1 enriquece las células madre de mama. Figura 479. El CD66a discrimina entre dos poblaciones enriquecidas en células madre. Figura 480. Las células luminales ER-contienen poblaciones celulares con los patrones de expresión génica de las
células progenitoras. Figura 481. Análisis de tumores de mama positivos para el receptor de estrógenos. Figura 482. Análisis mediante citometría de flujo de células de mama de ratón basados en la tinción de CD24 y de
CD49f. Figura 483. El Thy-1 es muy expresado en la población basal de células epiteliales de mama humana. Figura 484. Las células Thy-1+ CD24med CD49fhigh producen un epitelio mamario funcional. Figura 485. Análisis mediante citometría de flujo de un tumor ER+ y de una muestra de mama normal emparejada. Figura 486. Agrupamiento de los datos de expresión génica de las células individuales de glándula mamaria de
ratón.
Figura 487. Agrupamiento de los datos de expresión génica de las células individuales de cáncer de mama humano (Tumor 1). Figura 488. Histogramas de los ciclos umbrales de la qPCR para algunos de los genes, que se averiguó que eran
expresados diferencialmente entre los compartimentos clasificados mediante FACS MRU y MYO mamarios. Figura 489. Histogramas de los ciclos umbrales de la qPCR para algunos de los genes, que se averiguó que eran expresados diferencialmente entre los compartimentos clasificados mediante FACS MaCFC y CD24med CD49f/low mamarios.
Descripción detallada
Los métodos de la invención utilizan la caracterización de la expresión génica de células individuales de las células primarias para la caracterización de poblaciones de células para el diagnóstico de una enfermedad, de la sensibilidad a una intervención terapéutica en particular, para aplicaciones pronósticas y para la identificación de nuevos objetivos farmacológicos. Una muestra celular heterogénea se divide en células individuales separadas espacialmente, que opcionalmente son clasificadas según sus propiedades de interés (incluyendo posiblemente marcadores de superficie), después son lisadas y el contenido es amplificado y analizado individualmente para comprobar la expresión de los genes de interés. Las células así analizadas son clasificadas de acuerdo con las firmas genéticas de las células individuales. Dicha clasificación permite una evaluación precisa de la composición celular de la muestra de prueba.
Los métodos convencionales de análisis de células individuales con fines diagnósticos incluyen el uso de contadores Coulter y de citometrías para contar el número de células de un tipo dado. Sin embargo, estas mediciones se basan normalmente en el uso de anticuerpos contra los marcadores de superficie y no evalúan la expresión génica a nivel del ARNm ni la expresión de proteínas. Existen ejemplos previos de análisis de células individuales mediante PCR, pero éstos se llevaban a cabo en un número demasiado pequeño de células y/o de genes como para proporcionar una información diagnóstica útil o proporcionar la capacidad de una discriminación fina o de las células de subpoblaciones relacionadas en un tejido. Los métodos de tinción tisular usados por los patólogos adolecen de unos inconvenientes similares y dependen fuertemente de las valoraciones cualitativas del patólogo. Además, estas mediciones están limitadas a la medición de un pequeño número de parámetros. Los métodos de la presente invención, permiten sin embargo la medición de al menos 10, de al menos 15, de al menos 20, de al menos 50, de al menos 100, de al menos 200, de al menos 300, de al menos 400, de al menos 500, o más parámetros diferentes, en la que los parámetros incluyen la expresión del ARNm, la expresión génica, la expresión de proteínas y pueden incluir adicionalmente marcadores de la superficie celular junto con la expresión del ARNm, de genes y/o de proteínas.
imagen23
En sus muchos aspectos, la invención proporciona provechosamente métodos para el cribado de agentes antineoplásicos; para el ensayo de terapias antineoplásicas; para el desarrollo de fármacos dirigidos a nuevas rutas; para la identificación de nuevos agentes terapéuticos antineoplásicos; para la identificación y el diagnóstico de células malignas en muestras de patología; para el ensayo y la evaluación de la sensibilidad a fármacos de células madre de tumores sólidos; para la medición de factores específicos que predicen la sensibilidad a fármacos; y para el cribado de pacientes (por ejemplo, como un complemento para una mamografía). La invención puede usarse como un modelo para ensayar la sensibilidad de los tumores de los pacientes a terapias conocidas; como un modelo para la identificación de nuevos objetivos terapéuticos para el tratamiento del cáncer; como un sistema para establecer un banco de tumores para el ensayo de nuevos agentes terapéuticos para el tratamiento del cáncer; y como un sistema para identificar las células cancerosas oncogénicas.
Por ejemplo, pueden cribarse varios candidatos a fármacos potenciales, por ejemplo, moléculas pequeñas, ARNip, péptidos, hormonas, etc., (in vivo o in vitro) para determinar si pueden modular cualquiera de los objetivos descritos en el presente documento, o las rutas objetivo descritas en el presente documento. Aquellos fármacos candidatos que sean capaces de modular los objetivos o las rutas objetivo pueden ensayarse adicionalmente para determinar si pueden ser eficaces como agentes terapéuticos, agentes antineoplásicos, o si pueden dar lugar a otros agentes terapéuticos u objetivos basándose en sus agentes de unión, o si puede determinarse un mecanismo de acción basándose en su actividad.
En esta memoria descriptiva y en las reivindicaciones anexas, las formas singulares “un”, “uno/a” y “el / la” incluyen la referencia plural salvo que el contexto lo indique claramente de otro modo.
Cuando se proporcione un intervalo de valores, se entiende que cada valor interviniente, hasta el décimo de la unidad del límite inferior, salvo que el contexto lo indique claramente de otro modo, entre el límite superior e inferior de ese intervalo, y cualquier otro valor establecido o interviniente en ese intervalo, están englobados en la invención. Los límites superior e inferior de estos intervalos más pequeños pueden estar incluidos independientemente en los intervalos menores y también están englobados en la invención, sometidos a cualquier límite excluido específicamente en el intervalo establecido. Cuando el intervalo establecido incluya uno o ambos de los límites, los intervalos que excluyen cualquiera de ellos o ambos de esos límites incluidos también están incluidos en la invención.
Salvo que se defina de otro modo, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado al comprendido habitualmente por el experto habitual en la materia a la que pertenece esta invención. Aunque en la práctica o el ensayo de la invención puede usarse cualquier método, dispositivo y material similar o equivalente a los descritos en el presente documento, ahora se describen métodos, dispositivos y materiales ilustrativos.
Identificación y clasificación de las células en poblaciones y subpoblaciones
La presente divulgación se refiere a métodos para la clasificación para la identificación de poblaciones y de subpoblaciones de células, y al uso de las poblaciones y/o de las subpoblaciones para el diagnóstico, el pronóstico y/o la identificación de objetivos terapéuticos de afecciones tales como enfermedades. Algunas enfermedades pueden incluir cánceres de cualquier tipo (incluyendo, pero no se limitan a, tumores sólidos, cáncer de mama, cáncer de colon, cáncer de pulmón, leucemia), enfermedad inflamatoria del intestino, colitis ulcerosa, enfermedades autoinmunes, enfermedades inflamatorias y enfermedades infecciosas. La presente divulgación también proporciona reactivos y kits para su uso en la práctica de los métodos en cuestión, tales como sondas de anticuerpos y de ácidos nucleicos útiles en la detección de cualquiera de los biomarcadores descritos en el presente documento, o de activos que modulan los biomarcadores del presente documento. Los métodos también pueden determinar un nivel apropiado de tratamiento para un cáncer en particular.
Aislamiento de las células individuales
Se proporciona la caracterización de la expresión génica de las células individuales para aplicaciones de diagnóstico
o de pronóstico de enfermedades, así como una herramienta de investigación para la identificación de nuevos objetivos farmacológicos. Algunas enfermedades de interés incluyen, sin limitación, disfunciones mediadas por el sistema inmunitario, cáncer, y similares. En los métodos de la invención, una mezcla celular heterogénea, por ejemplo, una biopsia por punción de un tumor, una biopsia de una lesión inflamatoria, líquido sinovial, una punción lumbar, etc., se divide al azar o en un cierto orden en células individuales separadas espacialmente, por ejemplo, en una placa multipocillos, en una micromatriz, en un dispositivo microfluido o en un portaobjetos. Después las células se lisan y el contenido se amplifica y se analiza individualmente para comprobar la expresión de los genes de interés. Las células así analizadas son clasificadas de acuerdo con las firmas genéticas de las células individuales. Dicha clasificación permite una evaluación precisa de la composición celular de la muestra de prueba, evaluación que puede hallar uso, por ejemplo, en la determinación de la identidad y del número de células madre cancerosas en un tumor; en la determinación de la identidad y del número de células asociadas al sistema inmunitario, tales como el número y la especificidad de los linfocitos T, de las células dendríticas, de los linfocitos B y similares.
imagen24
En algunas formas de realización, la muestra celular que se va a analizar es una muestra primaria, que puede estar recién aislada, congelada, etc. Sin embargo, las células que se van a analizar pueden ser células cultivadas. Habitualmente la muestra es una mezcla heterogénea de células, que comprende una pluralidad de tipos celulares distintos, de poblaciones distintas o de subpoblaciones distintas, por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 o más tipos celulares, poblaciones o subpoblaciones. En algunas formas de realización, la muestra es una muestra de cáncer procedente de un tumor sólido, de leucemia, de linfoma, etc., que puede ser una biopsia, por ejemplo, una biopsia por punción, etc., una muestra sanguínea para tumores diseminados y leucemias, y similares. Las muestras pueden obtenerse antes del diagnóstico, pueden obtenerse en el transcurso del tratamiento, y similares.
Para el aislamiento de células a partir de un tejido puede usarse una solución apropiada para su dispersión o suspensión. Dicha solución será generalmente una solución salina equilibrada, por ejemplo, suero salino normal, PBS, solución salina equilibrada de Hank, etc., convenientemente complementada con suero bovino fetal u otros factores naturales, junto con un tampón aceptable a una baja concentración, generalmente de entre 5 -25 mM. Algunos tampones convenientes incluyen HEPES, tampones de fosfato, tampones de lactato, etc. Las células separadas pueden recogerse en cualquier medio apropiado que mantenga la viabilidad de las células, habitualmente con un cojín de suero en el fondo del tubo de recolección. Existen diversos medios disponibles en el mercado y pueden usarse de acuerdo con la naturaleza de las células, incluyendo dMEM, HBSS, dPBS, RPMI, medio de Iscove, etc., frecuentemente complementado con suero bovino fetal.
En algunas formas de realización, las células de una muestra se separaran en una micromatriz. Por ejemplo, un sistema de micromatriz para células vivas altamente integrado puede utilizar micropocillos, cada uno de los cuales es lo suficientemente grande como para que se ajuste a una única célula (véase Tokimitsu et al. (2007) Cytometry Parte A 71k 1003: 1010; y Yamamura et al. (2005) Analytical Chemistry 77: 8050;
El enriquecimiento previo de las células de interés - tal como mediante FACS u otra clasificación - es opcional, y en algunas formas de realización, las células de la muestra se dividen en ubicaciones individuales sin ninguna clasificación ni enriquecimiento previos. Por ejemplo, las células de una muestra (por ejemplo, de una muestra sanguínea, de una biopsia, de un tumor sólido) pueden ser aisladas individualmente en distintas posiciones. Normalmente, para las muestras de tejido sólido, las muestras se separan mecánicamente, químicamente y/o enzimáticamente (por ejemplo, mediante un tratamiento con tripsina o la aplicación de ultrasonidos). Las células de una muestra pueden colocarse en cualquier dispositivo de clasificación celular (por ejemplo, un clasificador celular de celda microfluida) de forma que se aíslen las células individuales, tal como en una posición abordable o en una superficie plana. Las superficies planas pueden tener indentaciones, barreras u otras características que aseguren el aislamiento de las células individuales. Las células aisladas pueden analizarse entonces de acuerdo con los métodos del presente documento. Preferiblemente, las células se separan en posiciones distintas, en las que cada posición contiene 1 o 0 células.
Las células son opcionalmente clasificadas, por ejemplo, mediante una citometría de flujo, antes de la separación. Por ejemplo, puede usarse una clasificación mediante FACS o diferencial por tamaños, para aumentar la concentración inicial de las células de interés en al menos 1.000, 10.000, 100.000, o más veces, de acuerdo con uno
o más marcadores presentes en la superficie de la célula. Dichas células son clasificadas opcionalmente de acuerdo con la presencia y/o la ausencia de los marcadores de la superficie celular, particularmente los marcadores de una población o subpoblación de interés. Por ejemplo, pueden usarse anticuerpos contra CD66a, EpCAM, CD24, ESDA y/u otros anticuerpos para enriquecer - mediante una selección positiva y/o negativa - en células madre cancerosas una muestra (por ejemplo, anti-CD66a en el que la expresión negativa del CD66a es indicativa de una CSC; EpCAM, en el que la expresión del EpCAM es indicativa de que una célula es una CSC; CD24, en el que la expresión negativa de CD24 es indicativa de una CSC; ESDA, en el que la expresión positiva es indicativa de una célula madre; e incluyendo también marcadores conocidos en la materia que están asociados con las CSC, incluyendo CD47, CD96, CD99, EGFRv I111, etc.)
Cuando las células están aisladas en posiciones distintas para su análisis, las células pueden ser clasificadas con un clasificador microfluido, mediante una citometría de flujo, una microscopía, etc. Un clasificador celular activado por fluorescencia microfabricado es descrito por Eu et al. (1999) Nature Biotechnology 17: 1109 y por Eu et al. (2002) Anal. Chem. 74: 2451 - 2457,
Una muestra puede ser clasificada con un clasificador celular microfabricado integrado mediante el uso de una litografía blanda multilaminar. Este clasificador celular integrado puede incorporar varias funcionalidades microfluidas, incluyendo bombas peristálticas, amortiguadores, válvulas de intercambio y pocillos de entrada y salida, para llevar a cabo la clasificación celular de una forma coordinada y automatizada. El volumen activo de una válvula activada en este clasificador celular integrado puede ser tan pequeño como de 1 pl, y el volumen de análisis óptico tan pequeño como de 100 fl. En comparación con las máquinas convencionales de FACS, el FACS microfluido proporciona una mayor sensibilidad, ninguna contaminación cruzada y un menor coste.
imagen25
Las células individuales pueden aislarse en posiciones distintas (por ejemplo, en una placa de 96 pocillos o en una disposición en micromatriz) para un análisis y/o manipulación adicionales. Por ejemplo, se clasifica una población de células que contiene células madre hematopoyéticas (HSC) mediante un análisis por FACS utilizando anticuerpos capaces de distinguir las HSC de las células maduras. Las células son clasificadas en placas de 96 pocillos, lisadas mediante los métodos apropiados, y los lisados son analizados mediante una qPCR, un análisis en micromatriz y/o una secuenciación.
Los dispositivos para el aislamiento de células individuales incluyen un clasificador celular microfluido, que aísla las células vivas de los desechos celulares y clasifica las células a partir de una suspensión de células individuales. Los dispositivos microfluidos pueden usarse junto con señales fluorescentes (por ejemplo, anticuerpos marcados con marcadores para una población o subpoblación objetivo) a partir de 1, 2, 3, 4, 5 o más marcadores de superficie diferentes, y las colocan en depósitos individuales para los subsiguientes estudios genéticos. En este sistema pueden incorporarse otras etapas previas tales como la digestión del tumor o del cultivo celular para obtener una suspensión de células, y la tinción de las células con marcadores de superficie fluorescentes. El número de células que se va a analizar depende de la heterogeneidad de la muestra y de la frecuencia esperada de las células de interés en la muestra. Habitualmente se analizan al menos aproximadamente 102 células, al menos aproximadamente 103, al menos 5 x 103, al menos aproximadamente 104, al menos aproximadamente 105, al menos aproximadamente 106, al menos aproximadamente 107, al menos aproximadamente 108, al menos aproximadamente 109, al menos aproximadamente 1010, al menos aproximadamente 1011, al menos aproximadamente 1012, al menos aproximadamente 1013, al menos aproximadamente 1014, al menos aproximadamente 1015, o más células.
En algunos casos, un dispositivo de análisis de células individuales (SCAD) es modular y puede llevar a cabo las siguientes etapas de una forma integrada totalmente automatizada 1) Digestión del tejido. El tejido se coloca en el puerto de entrada del dispositivo. Se introducen las enzimas apropiadas en el dispositivo y se hacen fluir para llevar a cabo la digestión de la matriz extracelular con objeto de obtener una suspensión de células. 2) Separación de las células vivas de los desechos celulares, por ejemplo, haciendo fluir una suspensión de la muestra digerida a través de un “metamaterial” microfluido, lo que permite dividir el flujo fluido de acuerdo con el tamaño de las partículas. 3) Tinción. La suspensión de células individuales filtrada se tiñe opcionalmente mediante el uso de los marcadores de superficie apropiados en un compartimento del dispositivo microfluido. Una tinción con hasta cinco marcadores diferentes puede ser útil para obtener una población de células cancerosas de elevada pureza. 4) Clasificación. La suspensión de células individuales teñidas se hacer fluir hacia el siguiente compartimento del dispositivo microfluido para separar las células cancerosas del resto de las células. En los Ejemplos se describen varias formas de realización de clasificadores.
Caracterización de la expresión
Las células clasificadas pueden ser lisadas individualmente para llevar a cabo un análisis de la composición genética (ARN, ADN) y/o de proteínas de las células. Puede capturarse el ARNm sobre una columna de microesferas de oligo-dT, retrotranscribirse en las microesferas, procesarse fuera del chip, transferirse a un pocillo macroscópico, etc. Opcionalmente, el ADN o ARN es preamplificado antes del análisis. La preamplificación puede ser de la totalidad del genoma o del transcriptoma, o de una porción de los mismos (por ejemplo, de los genes / transcritos de interés). Puede transferirse una muestra de polinucleótido a un chip para su análisis (por ejemplo, mediante una qRT-PCR) y realizar la determinación de un perfil de expresión.
El término “perfil de expresión” se usa ampliamente para incluir las proteínas expresadas y/o los ácidos nucleicos expresados. Una muestra de ácidos nucleicos incluye una pluralidad o una población de ácidos nucleicos distintos que pueden incluir la información sobre la expresión de los genes determinantes del fenotipo de interés de la célula individual. Una muestra de ácido nucleico puede incluir ácidos nucleicos de ARN o de ADN, por ejemplo, ARNm, ARNc, ADNc, etc. Los perfiles de expresión pueden ser generados mediante cualquier medio conveniente para la determinación de la expresión diferencial de los genes entre dos muestras, por ejemplo, una hibridación cuantitativa de ARNm, de ARNm marcado, de ARNm amplificado, de ARNc, etc., una PCR cuantitativa, y similares. Se ensaya la muestra de un sujeto o de un paciente, por ejemplo, células o conjuntos de las mismas, por ejemplo, tejidos. Las muestras se recogen mediante cualquier método conveniente, como se sabe en la materia. Adicionalmente, pueden recogerse y ensayarse muestras tumorales para determinar la eficacia relativa de una terapia para provocar la muerte diferencial entre las células normales y las enfermas. Los genes / proteínas de interés son genes / proteínas que se sabe que son predictivos, incluyendo los genes / proteínas proporcionados en el presente documento, en los que el perfil de expresión puede incluir los datos de expresión para 5, 10, 20, 25, 50, 100 o más (incluyendo todos) de los genes / proteínas indicados.
La muestra puede ser preparada de varias formas diferentes, como se sabe en la materia, por ejemplo, mediante el aislamiento del ARNm a partir de una célula individual, en el que el ARNm aislado se usa como tal, se amplifica, se emplea para la preparación de ADNc, de ARNc, etc., como se sabe en la técnica de expresión diferencial (por ejemplo, véase Marcus, et al., Anal. Chem. (2006); 78 (9): 3084 - 89). La muestra puede ser preparada a partir de cualquier tejido (por ejemplo, de una lesión o de un tejido tumoral) recogida de un sujeto. El análisis de las muestras puede usarse con cualquier fin (por ejemplo, diagnóstico, pronóstico, clasificación, seguimiento y/o desarrollo de la terapia). Las células pueden cultivarse antes de su análisis.
imagen26
El perfil de expresión puede ser generado a partir de la muestra inicial de ácido nucleico mediante el uso de cualquier protocolo convencional. Aunque se conoce una variedad de diferentes formas de generar perfiles de expresión, tales como las empleadas en el campo del análisis de la expresión génica diferencial, un tipo conveniente y representativo de protocolo para la generación de perfiles de expresión es una PCR cuantitativa (QPCR o QT- PCR). Puede utilizarse cualquier metodología disponible para llevar a cabo la QPCR, por ejemplo, según se describe en Valera, et al., J. Neurooncol. (2007) 85 (1): 1 - 10.
Después de obtener un perfil de expresión a partir de la muestra que se está ensayando, el perfil de expresión puede ser comparado con un perfil de referencia o de control para realizar un diagnóstico, un pronóstico, un análisis de la eficacia del fármaco, u otro análisis deseado. Se proporciona un perfil de control o de referencia, o puede obtenerse mediante métodos empíricos. Un perfil de expresión obtenido puede ser comparado con un perfil individual de referencia / control para obtener la información relativa al fenotipo de la célula / tejido que se está ensayando. Alternativamente, el perfil de expresión obtenido puede ser comparado con dos o más perfiles diferentes de referencia / control para obtener una información más detallada relativa al fenotipo de la célula / tejido ensayado. Por ejemplo, el perfil de expresión obtenido puede compararse con un perfil de referencia positivo y negativo para obtener una información confirmada relativa a si la célula / tejido tiene el fenotipo de interés.
La determinación o el análisis de la diferencia entre los valores, es decir, la diferencia en la expresión entre dos perfiles, puede llevarse a cabo mediante el uso de cualquier metodología convencional, en la que los expertos en la materia de matrices conocen varias metodologías, por ejemplo, mediante la comparación de imágenes digitales de los perfiles de expresión, mediante la comparación de bases de datos de los datos de expresión, etc. Algunas Patentes que describen las formas de comparar los perfiles de expresión incluyen, pero no se limitan a, las Patentes de EE.UU. Nº 6.308.170 y 6.228.575.
En el presente documento también se describen métodos para la comparación de los perfiles de expresión.
A continuación puede llevarse a cabo una etapa de análisis estadístico para obtener la contribución ponderada del conjunto de genes. Por ejemplo, puede aplicarse un análisis de los centroides reducidos más próximos según se describe en Tibshirani et al. (2002) P.N.A.S. 99: 6567 - 6572 para computar el centroide de cada clase, computando después la distancia cuadrada promedio entre un perfil de expresión dado y cada centroide, normalizada por la desviación típica dentro de la clase.
La clasificación puede ser definida probabilísticamente, a partir de lo cual puede derivarse empíricamente el valor de corte. En una forma de realización de la divulgación, puede usarse una probabilidad de aproximadamente 0,4 para distinguir entre los pacientes quiescentes y los inducidos, puede usarse una probabilidad de aproximadamente 0,5 y más habitualmente una probabilidad de aproximadamente 0,6 o mayor. Una probabilidad “alta” puede ser de al menos aproximadamente 0,75, de al menos aproximadamente 0,7, de al menos aproximadamente 0,6, o de al menos aproximadamente 0,5. Una probabilidad “baja” puede ser de no más de aproximadamente 0,25, de no más de 0,3, o de no más de 0,4. En muchas formas de realización, la información obtenida anteriormente sobre la célula / tejido que se está ensayando se emplea para predecir si un hospedador, un sujeto o un paciente debería ser tratado con una terapia de interés, y para optimizar la dosis de la misma.
Caracterización de poblaciones y subpoblaciones celulares mediante el uso de células cancerosas como modelo
En algunas formas de realización de la divulgación, por ejemplo, con cánceres epiteliales, que incluyen, sin limitación, cáncer de mama y cáncer de colon, la caracterización de las células madre cancerosas de acuerdo con la expresión de un marcador de la célula madre cancerosa (por ejemplo, el CD66a) permite la identificación de la CSC. Existe una su población de células cancerosas oncogénicas con capacidad de autorrenovación y de diferenciación. Estas células oncogénicas son responsables del mantenimiento del tumor y también dan lugar a un elevado número de una progenie de diferenciación anormal que no es oncogénica, cumpliendo así los criterios de células madre cancerosas.
El potencial oncogénico está contenido en una subpoblación de células cancerosas que expresan diferencialmente los marcadores de la presente divulgación. Como se muestra en el presente documento, dentro de la población de células que expresan positivamente los marcadores de las células madre cancerosas, hay una heterogeneidad, por ejemplo, cuando las células que son negativas para las células CD66 (CD66-), están enriquecidas en células madre cancerosas (oncogénicas), mientras que las células CD66a+ no son oncogénicas. La detección de dicha heterogeneidad en las poblaciones permite la determinación de las subpoblaciones.
El experto en la materia reconocerá que pueden analizarse múltiples secuencias -que representan genes, transcritos y/o proteínas. Dichas secuencias pueden permitir la determinación y/o la diferenciación de los fenotipos de las células de una muestra. Por ejemplo, algunos genes pueden codificar para proteínas constitutivas, para proteínas implicadas en la síntesis o el metabolismo del glutatión (GSH), para proteínas anti-especies de oxígeno reactivo (ROS), para factores de transcripción, para marcadores de células cancerosas, para marcadores de células madre o para cualquier otra proteína pertinente. Una lista no limitante de dichos genes (incluyendo homólogos de
imagen27
5 seres humanos y de otros animales) incluye: ca2, VEGFa, Ihh, CdkN1a, Krt20, Vdr, Tff3, Ceacam1, Top1, Nola3, Tcf7l2, Rfng, Llgl1, Cdk6, Ruvbl2, Dkc1, ActB, Gapdh, Tacstd, Sox9, Hes1, Rnf43, Utg8, Wwox, Slco3a1, Lfng, Dll4, Maml2, Il11ra, Hes6, Tert, Muc2, Retnlb, Cal, Ugt2b17, TinG, Pls3, Sox2, Lgr5, Pena, Mk167, Birc5, Gss, Gclm, Gclc, Gpx1, Gpx4, Gpx7, S1pi, Pmp, Sodl, Sod2, Sod3, Cat, Nfkb1, Foxo1, Foxo3a, Foxo4, Krt19, Stat3, Chi311, Tert, Hifla, Epas1 (Hif2a), Hprt y Actb.
10 Los marcadores, o los paneles de marcadores, pueden elegirse sobre la base de múltiples aspectos de una población o subpoblación objetivo de una muestra, por ejemplo, la fuente del tejido (por ejemplo, neuronal frente a epitelial) o el estado patológico (por ejemplo, canceroso frente a no canceroso). Otras secuencias útiles para distinguir las poblaciones celulares (por ejemplo, las células madre cancerosas de las células normales) pueden ser determinadas mediante el uso de los métodos descritos en el presente documento, tales mediante la detección de
15 los cambios (por ejemplo, la regulación por aumento o por disminución) en los genes de las poblaciones objetivo. Por ejemplo, pueden usarse las células obtenidas a partir de una biopsia de tejido de mama que son CD49f+ / CD24-, CD49+ / EPCAM low/-o CD49f+ / EPCAM+ para diagnosticar al paciente de cáncer de mama.
Los ácidos nucleicos que son útiles para distinguir una población de otra población pueden estar regulados por aumento o regulados por disminución al comparar las dos poblaciones. Por ejemplo, la expresión de algunos ácidos 20 nucleicos está regulada por aumento o regulada por disminución en las células cancerosas con respecto a las normales, en las células madre con respecto a las células diferenciadas y en las células madre cancerosas con respecto a las células cancerosas diferenciadas. En algunos casos puede usarse la regulación por aumento o por disminución de los genes para distinguir subpoblaciones dentro de poblaciones más grandes. Por ejemplo, algunos ácidos nucleicos son expresados únicamente en células normales, en células normales y en células madre
25 cancerosas o únicamente en células madre cancerosas.
Adicionalmente, puede usarse la expresión de ciertos ácidos nucleicos constitutivos para la determinación de la viabilidad celular. Por ejemplo, las TABLAS 1 y 2 proporcionan algunos ejemplos de ácidos nucleicos que muestran una expresión diferencial entre la población de células normales y las células derivadas de tejido de mama y las derivadas de tejido de colon.
30 Tabla 1. Genes que son expresados diferencialmente en subpoblaciones celulares de células de tejido de colon
Nombre del gen Población de células Estado de regulación
Met Enterocitos inmaduros Regulado por aumento
Notch1 Células madre, enterocitos inmaduros. Regulado por aumento Células en ciclo
Notch2 Regulado por aumento
Células madre, enterocitos inmaduros, células en ciclo
Ephrb2 Regulado por aumento
Células madre, enterocitos inmaduros
Células madre
Hes6 Regulado por aumento
Células madre cancerosas
Wnt6 Células madre Regulado por aumento Tcf3 Células madre Regulado por aumento
Igr5
Células madre Células madre cancerosas Regulado por aumento
tert
Células madre, células caliciformes Células madre cancerosas Regulado por aumento
ASCL2
Células madre Células madre cancerosas Regulado por aumento
Tert + RBM25
Células madre cancerosas Regulado por aumento
Tert + SEC62
Células madre cancerosas Regulado por aumento
Tert + TFF3
Células madre cancerosas Regulado por aumento
Tert + Villin1
Células madre cancerosas Regulado por aumento
Tert + Ceacam1
Células madre cancerosas Regulado por aumento
Tert + DLL4
Células madre cancerosas Regulado por aumento
Tert + KRT20
Células madre cancerosas Regulado por aumento
Tert + CES3
Células madre cancerosas Regulado por aumento
Tert + PTPRO
Células madre cancerosas Regulado por aumento
imagen28
tert Células madre, células caliciformes Regulado por aumento ceacam1 Enterocitos maduros, células madre en ciclo lento Regulado por aumento
Enterocitos maduros, células caliciformes, células madre en
ck20 Regulado por aumento
ciclo lento
Muc2 Células caliciformes Ephb2 Células madre, células en ciclo Axin2 Células madre, células madre en ciclo
Células madre, células inmaduras en ciclo
cMyc
Células madre cancerosas Sonic hedgehog Enterocitos inmaduros Células madre, células en ciclo, enterocitos inmaduros
Hes1
Células madre cancerosas
Hes5 Células madre, células en ciclo Tcf4 Enterocitos inmaduros Tert Células madre,
Células madre cancerosas Tff3 Células caliciformes, células madre en ciclo lento
Ca2 Enterocitos maduros Cdk6 Madre, enterocitos inmaduros Pcna Células madre, enterocitos inmaduros Tinf2 Células madre, enterocitos inmaduros Pls3 Células madre, enterocitos inmaduros
Maml2 Células madre, enterocitos inmaduros) Células madre, enterocitos inmaduros
Bmi1
Células madre cancerosas Vegfa Enterocitos inmaduros Células madre, enterocitos inmaduros
Foxo1
Células madre cancerosas Cdkn1a Enterocitos inmaduros, células caliciformes Enterocitos maduros, células caliciformes,
Krt20
células madre en ciclo lento Indian hedgehog Enterocitos inmaduros Ruvbl2 Células madre, enterocitos inmaduros Células madre, enterocitos inmaduros
Ugt8
Células madre cancerosas Ugt2bl7 Células madre, inmaduras Top1 Células madre, enterocitos inmaduros Nola3 Células madre, inmaduras Tcf712 Células madre, enterocitos inmaduros Células madre, células en ciclo
Lgr5
Células madre cancerosas Wwox Células madre, células en ciclo, enterocitos inmaduros Sloca3a1 Células madre, células en ciclo, enterocitos inmaduros Dkc1 Células madre, células en ciclo, enterocitos inmaduros Llgl1 Células madre, células en ciclo, enterocitos inmaduros Rnf43 Células madre, células en ciclo, enterocitos inmaduros Sox9 Células madre, células en ciclo, enterocitos inmaduros Krt20 Células madre, células en ciclo, enterocitos inmaduros Birc5 Células madre, células en ciclo, enterocitos inmaduros
Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento Regulado por aumento
Regulado por aumento Mayores niveles en las células caliciformes Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento Menores niveles en las células caliciformes Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Células madre
LAMB1 Regulado por aumento
Células madre cancerosas
D114 Células madre, enterocitos inmaduros, células caliciformes Regulado por aumento IL11ra Células madre, células en ciclo, enterocitos inmaduros Regulado por aumento
29
imagen29
Lfhg Células madre, células en ciclo, enterocitos inmaduros Mki67 Células madre, células en ciclo, enterocitos inmaduros () Pls3 Células madre, células en ciclo, enterocitos inmaduros Rfng Células madre, células en ciclo, enterocitos inmaduros
Vdr Células madre, células en ciclo, enterocitos inmaduros Células madre
Aqp1
Células madre cancerosas Células madre
Kif12
Células madre cancerosas Células madre
Lgr5
Células madre cancerosas Células madre
Ptpro
Células madre cancerosas Gspm2 Células madre, enterocitos inmaduros, células caliciformes Utrn Células madre, enterocitos inmaduros, células caliciformes
Esf1 Células madre, enterocitos inmaduros Hnf1b Células madre, enterocitos inmaduros Células madre, enterocitos inmaduros
Mett13 Células madre cancerosas Células madre, enterocitos inmaduros Lefty1
Células madre cancerosas Células madre, enterocitos inmaduros Cftr Células madre cancerosas Células madre, enterocitos inmaduros Ces3
Células madre cancerosas
Myo5 Células madre, enterocitos inmaduros, células caliciformes Rbm25 Células madre, enterocitos inmaduros, células caliciformes Células madre, enterocitos inmaduros, células caliciformes
Ets2 Células madre cancerosas Células madre, enterocitos inmaduros, células caliciformes Vil1
Células madre cancerosas Cdkn1b Células madre, enterocitos inmaduros, células caliciformes Sec62 Células madre, enterocitos inmaduros, células caliciformes Células madre, enterocitos inmaduros
Krt20
Células madre cancerosas Ca1 Enterocitos maduros Aqp8 Enterocitos maduros
Acvr1c Células madre, enterocitos inmaduros Acvr2a Células madre, enterocitos inmaduros Células madre, enterocitos inmaduros
Olfm4
Células madre cancerosas
Tnfrsfl1a Células madre, enterocitos inmaduros Vegfb Células madre, enterocitos inmaduros Células madre, enterocitos inmaduros
Ezh2 Células madre cancerosas Células madre, enterocitos inmaduros Gpsm2
Células madre cancerosas Células madre, células en ciclo, enterocitos inmaduros Cdk2
Células madre cancerosas Ccnd1 Células madre, células en ciclo, enterocitos inmaduros Brd7 Células madre, células en ciclo, enterocitos inmaduros Adam10 Células madre, células en ciclo, enterocitos inmaduros Ets2 Células madre, células en ciclo, enterocitos inmaduros Células madre, células en ciclo, enterocitos inmaduros Células
Rmb25
madre cancerosas Esf1 Células madre, células en ciclo, enterocitos inmaduros
Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento, regulado por disminución en las células caliciformes
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento
Regulado por aumento Regulado por aumento Regulado por aumento Regulado por aumento
Regulado por aumento
Regulado por aumento
imagen30
Suz12
Células madre cancerosas Células madre, células en ciclo, enterocitos inmaduros Regulado por aumento
Gpr
Células madre cancerosas Células madre, células en ciclo, enterocitos inmaduros Regulado por aumento
Hunk
Células madre, células en ciclo Regulado por aumento
Tabla 2. Genes expresados diferencialmente en varias poblaciones celulares en células de tejido de mama
Nombre del gen
Población de células Estado de regulación
Cdh2
Células madre Regulado por aumento
CD109
Células madre Regulado por aumento
Cdk6
Células oncogénicas (célula madre cancerosa) Regulado por aumento
PTEN
Células oncogénicas (célula madre cancerosa) Regulado por aumento
Top1
Células oncogénicas (célula madre cancerosa) Regulado por aumento
Suz12
Cáncer: células oncogénicas (célula madre cancerosa) Normal: células madre, células epiteliales luminales Regulado por aumento
Bmi1
Células oncogénicas (célula madre cancerosa) Regulado por aumento
Sox9
Células oncogénicas (célula madre cancerosa) Regulado por aumento
Mett13
Cáncer: células oncogénicas (célula madre cancerosa), células epiteliales luminales normales de mama Regulado por aumento
Lefty2
Cáncer: células oncogénicas (célula madre cancerosa) Normal: células madre y células epiteliales luminales Regulado por aumento
NR2F1
Células madre cancerosas Regulado por aumento
EpCAM
Mama normal: células epiteliales luminales Regulado por aumento
Elf5
Cáncer: células no oncogénicas Normales de mama: células epiteliales luminales Regulado por aumento
Ugt8
Células no oncogénicas, células en ciclo Mama normal: células epiteliales luminales GATA6+ Regulado por aumento
Erbb2
Mama normal: células madre, células epiteliales luminales Regulado por aumento
Krt5
Células mioepiteliales Regulado por aumento
Maml2
Células madre cancerosas Mama normal: células madre, células epiteliales luminales Regulado por aumento
Krt19
Mama normal: células epiteliales luminales Regulado por aumento
Krt8
Mama normal: células madre, células epiteliales luminales Regulado por aumento
Ezh2
Cáncer: células madre cancerosas Normal: células madre, células epiteliales luminales GATA6+ Regulado por aumento
Notch1
Normal: células madre, células epiteliales luminales Regulado por aumento
Krt14
Mama normal: células madre, células mioepiteliales Regulado por aumento
Krt18
Mama normal: células madre, células epiteliales luminales Regulado por aumento
Id2
Mama normal: células madre, células epiteliales luminales Regulado por aumento
Krt17
Mama normal: células madre, células mioepiteliales Regulado por aumento
Vegfa
Células madre, células epiteliales luminales Regulado por aumento
Cdk6
Luminal-CDK6+ células epiteliales luminales Regulado por aumento
Egf1
Luminal GATA6+ células epiteliales luminales Regulado por aumento
Esf1
Luminal GATA6+ células epiteliales luminales Regulado por aumento
Notch2
Células madre, células epiteliales luminales GATA6+ Regulado por aumento
Itga6 (CD49f)
Células madre células epiteliales luminales, GATA6+ Células madre cancerosas Regulado por aumento
Tcf7L2
Células madre, células epiteliales luminales GATA6+ Regulado por aumento
Erbb3
Células epiteliales luminales Células cancerosas no oncogénicas Regulado por aumento
Hes1
Células epiteliales luminales Regulado por aumento
Notch3
Células epiteliales luminales GATA6+ Células madre cancerosas Regulado por aumento
Acvr2a
Células madre, algunas células epiteliales luminales GATA6+ Células madre cancerosas Regulado por aumento
Lamb1
Células madre normales Células madre cancerosas Regulado por aumento
Ngfr
Células madre normales Células madre cancerosas Regulado por aumento
Snai2
Células madre Regulado por aumento
Cyr61
Células mioepiteliales (Basal-1), células madre Regulado por aumento
imagen31
Egfr
Células mioepiteliales (Basal-1), células madre Células madre cancerosas Regulado por aumento
Foxo1
Células madre normales Células madre cancerosas Regulado por aumento
Tbx3
Células madre normales, células epiteliales luminales GATA6+ Células madre cancerosas Regulado por aumento
Cdkn1a
Células madre Regulado por aumento
Ets2
Normal: células madre, células epiteliales luminales GATA6+ Regulado por aumento
Top1
Células epiteliales luminales GATA6+, células madre Regulado por aumento
Pgr
Células epiteliales luminales ER+, ERBB3+, células madre Regulado por aumento
Erbb4
Células epiteliales luminales ER+ (Luminal 2) Regulado por aumento
Tff3
Células epiteliales luminales ER+ (Luminal-2) Regulado por aumento
Esr1
Células epiteliales luminales ER+ (Luminal-2) Regulado por aumento
Kif12
Células epiteliales luminales ER+ (Luminal-2) Regulado por aumento
Stc2
Células epiteliales luminales ER+ (Luminal-2) Regulado por aumento
Lefty1
Normal células madre, células epiteliales luminales GATA6+ Células madre cancerosas Regulado por aumento
Lefty2
Células madre normales, células epiteliales luminales GATA6+, MRU Células madre cancerosas Regulado por aumento
Cfc1
Células madre normales, células epiteliales luminales GATA6+ Células madre cancerosas Regulado por aumento
ASCL2
Células madre normales de mama Células madre cancerosas Regulado por aumento
ZEB2
Células madre cancerosas Regulado por aumento
PTEN
Células madre cancerosas Regulado por aumento
Las Tablas 1 y 2 proporcionan una lista de ejemplos de ácidos nucleicos que son expresados diferencialmente en las diferentes células de una muestra homogénea que comprende múltiples poblaciones y subpoblaciones (por ejemplo, la biopsia de un paciente). Mediante el uso de los métodos descritos en el presente documento pueden
5 analizarse las células individuales de una muestra heterogénea para identificar poblaciones y/o subpoblaciones celulares en particular. Por ejemplo, las células de tejido de mama que muestran la expresión de células CDK6, PTEN, Top1, Suz12 y/o Sox9 pueden ser clasificadas como células oncogénicas, en las que la expresión puede ser alta, intermedia o baja. En otro ejemplo, las células de tejido de colon que muestran la expresión Aqp1, Kif12, Tert, Ptpro, Mett13, Lefty10, Cftr y/o Ezh2 pueden ser clasificadas como células madre.
10 Los ácidos nucleicos pueden ser regulados por aumento o regulados por disminución en comparación con otra población o subpoblación, con un ácido nucleico en particular con un nivel de expresión conocido o con un nivel de expresión estándar. Alternativamente, cuando se analiza la expresión de múltiples genes puede crearse un mapa térmico sustrayendo la media y dividiendo por la desviación típica de cada gen independientemente, y los valores numéricos se asignan basándose en el grado de desviación con respecto a la media. Por ejemplo, unos valores de
15 +/-1 pueden representar unas desviaciones típicas de 2,5 -3 con respecto a la media. Dichos análisis pueden refinarse adicionalmente, de forma que los genes en el intervalo de “+/- 3” pueden usarse para agrupar diferentes tipos de poblaciones (por ejemplo, al cáncer se le asigna el valor “+3” y al tejido normal se le asigna el valor “-3”, de forma que un algoritmo de agrupamiento pueda discernir entre ellos). Un gen regulado por aumento puede ser un valor “+”.
20 En algunos casos pueden usarse combinaciones de los ácidos nucleicos expresados diferencialmente como perfiles para una población o subpoblación en particular.
Los perfiles pueden comprender cualquier número de ácidos nucleicos y/o de proteínas expresados diferencialmente, por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 o más ácidos nucleicos y/o proteínas. En algunos casos, un ácido nucleico utilizado para la identificación
25 de una población o subpoblación objetivo puede ser expresado de forma similar en una población objetivo y no objetivo o en una subpoblación no objetivo. Dichos ácidos nucleicos expresados de forma similar se utilizarán generalmente junto con otros ácidos nucleicos expresados diferencialmente para la identificación de una población o subpoblación objetivo.
Los datos mostrados en las Figuras 11 -465 muestran los análisis de las células individuales de diferentes
30 poblaciones (por ejemplo, de células no cancerosas diferenciadas, de células cancerosas diferenciadas, de células madre, de células pluripotentes, de células madre cancerosas, etc.). Por lo tanto, los métodos descritos en el presente documento pueden usarse para analizar una población celular heterogénea procedente de cualquier fuente (por ejemplo, de una biopsia, de un tejido normal, de un tumor sólido, etc.). Dichos métodos pueden usarse para aislar y analizar cualquier población de células, por ejemplo, una población objetivo dentro de una población o
35 subpoblación heterogénea más grande, una población o subpoblación heterogénea para comprobar la presencia de
imagen32
una célula objetivo, de células madre cancerosas o de otras, o de la totalidad de la población heterogénea.
Descubrimiento de biomarcadores
Los métodos divulgados en el presente documento permiten la determinación de nuevos marcadores que están asociados con una población o subpoblación de células (por ejemplo, células normales, células cancerosas, células 5 patológicas). Los marcadores pueden incluir cualquier biomarcador que incluye, pero no se limita a, ADN, ARN y proteínas. En algunos casos, el marcador para una población de células es un gen o un ARNm que es expresado normalmente en una célula dada (por ejemplo, la expresión de un gen de una célula madre por parte de una célula progenitora, o una célula que expresa marcadores de diferenciación, o la expresión genes de de proliferación por parte de células que también expresan marcadores de diferenciación). Normalmente, se evalúa más de un
10 marcador, por ejemplo, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1.000 o más marcadores. Cuando los marcadores son ARN expresados, puede determinarse cualquier porción de un transcriptoma, hasta, e incluyendo, la totalidad del transcriptoma.
El análisis de los patrones de expresión de los ácidos nucleicos en ciertas poblaciones o subpoblaciones de células objetivo puede dar lugar a la identificación de nuevos biomarcadores que distinguen la población o la subpoblación 15 objetivo de otras. Por ejemplo, cuando una proteína marcadora de superficie única es expresada en una población o subpoblación objetivo, puede desarrollarse un anticuerpo que se una a ese marcador para su uso en el aislamiento y/o la identificación de las células de esa población o subpoblación en el mismo individuo o en otros (por ejemplo, mediante FACS). La identificación de biomarcadores específicos de una población o subpoblación incluye la ausencia de ciertos marcadores en poblaciones o subpoblaciones de células que le permitirían una selección
20 negativa. La Tabla 3 recoge algunos genes que pueden ser usados para distinguir entre células madre cancerosas y células madre no cancerosas y/u otros tipos de células.
Tabla 3. Perfiles de expresión diferencial de genes
Población
Genes Estado de regulación
Células madre de cáncer de colon
AQP1, KIF1, TERT, PTPRO, METTL3, LEFTY1, CFTR, CA2, EZH2 Regulado por aumento
Células madre de cáncer de colon
MUC2, AQP8, CEACAM1, TFF3 Regulado por disminución
Células madre de cáncer de mama
LEFTY1, LEFTY2, CFC1, THY1, CDK1, PTEN, TOP1, SUZ12, SOX9 Regulado por aumento
Células madre de cáncer de mama
PGR, ERBB4, TFF3, ESR1, KIF12, STC2, TBX3, ETS2, CDH2, EZF12, NOTCH1, NGFR, SNAI2, EGFR, FOXO1 Regulado por disminución
La presencia de marcadores en una población o subpoblación puede ser determinada mediante el uso de los
25 métodos descritos en el presente documento, y puede usarse para definir una población de células. Los ARNm de las poblaciones o subpoblaciones de células analizadas han demostrado que ciertos genes son expresados diferencialmente en las células normales y en las cancerosas. La expresión diferencial puede incluir aumentos o disminuciones a nivel del transcrito, una ausencia de transcripción y/o una alteración en la regulación de la expresión (por ejemplo, un patrón de expresión diferente en respuesta a un estímulo). Los ARNm u otros marcadores que
30 sirvan como marcadores de una población o subpoblación de células también pueden comprender mutaciones que están presentes en esa población o subpoblación de células (por ejemplo, células cancerosas y células madre cancerosas, pero no células normales). El experto en la materia reconocerá que dichos marcadores pueden representar una población de células de un único individuo ensayado y/o pueden representar marcadores de muchos individuos. Por ejemplo, una lista no limitante de fenotipos de expresión para células madre de cáncer de
35 mama incluye, pero no se limita a: CD49f+ CD24-; CD49+ epcamlow/-; CD49f+ epcam+; NGFR+; NGFR- (los tumores de algunos pacientes tendrán este fenotipo); ACVR2A+; EGFR+; FOXO1+; Lefty1+; Lefty2+; NGFR+ LEFTY1+ LEFTY2+ (y otras posibles combinaciones); NGFR/low LEFTY1- LEFTY2- (y otras posibles combinaciones); METTL3+; TBX3+; FOX01+; LAMB1+; ZEB2+; GPSM2+; SOX9high; SUZ12high; ERBB3-/low; KIF12-/low; MARVELD3-; CEACAM1-/low; Lefty1+ Lefty2+ GPSM2+ (y/o CD49fhigh, y/o NGFR+ y/o EGFR+); o
40 GPSM2+. Como otro ejemplo, una lista no limitante de fenotipos de expresión para células madre de cáncer de colon incluye, pero no se limita a: TERT+; EZF12+; PTPRO+; LAMB1+; Lefty1+; GPSM2+; DLL4+; AQP1+; UGT8+; OLFM+; UTRN+; METTL3+; CFTR+; CA2-; TFF3-; CEACAM1low; TFF3-/low; VEGFA -/low; o KRT20 -/low. En algunos casos, los ARNm expresados son traducidos en proteínas que pueden ser detectadas por cualquiera de un amplio abanico de métodos de detección de proteínas (por ejemplo, inmunoensayo, inmunotransferencia Western,
45 etc.).
Otros marcadores que pueden ser detectados incluyen microARN. En algunos casos, los niveles de expresión de los microARN sirven como marcador de una población de células en la que la expresión de un microARN en particular está aumentada o disminuida en aproximadamente 1,5, 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 2,7, 2,8, 2,9, 3,0 o más veces en comparación con una población de células similar. Por ejemplo, en células madre de cáncer de 50 mama CD49f+ / CD24- y en células de cáncer de colon CD49f high, una diferencia dos veces menor en la expresión
imagen33
de uno o más microARN (en comparación con las células que expresan la mayor cantidad del mismo miARN) puede usarse como un marcador. Algunos ejemplos no limitantes de dichos microARN incluyen: miR-200c; miR- 141; miR200b; miR -200a; miR -429; miR -182; miR -183; y miR -96. Como otro ejemplo, en células madre de cáncer de mama CD49f+ / CD24- y en células de cáncer de colon CD49f high, una diferencia dos veces mayor en la expresión de uno o más microARN (en comparación con las células que expresan la menor cantidad del mismo miARN) puede usarse como un marcador. Algunos ejemplos no limitantes de dichos microARN incluyen: miR-214; miR-127; miR142-3p; miR-199a; miR-409-3p; miR-125b; miR-146b; miR-199b; miR-222; miR-299-5p; miR-132; miR-221; miR-31 ; miR-432; miR-495; miR-150; miR-155; miR-338; miR-34b; miR-212; miR-146a; miR-126*; miR-223; miR-130b; y miR-196b.
Determinación de los transcriptomas en poblaciones y subpoblaciones celulares
Para obtener información adicional relativa a las células aisladas mediante cualquiera de los métodos de la presente divulgación (por ejemplo, separación de las células de una población mediante FACS, seguido de un análisis transcripcional parcial), puede ser ventajoso analizar adicionalmente las células. En algunos casos, las células individuales aisladas a partir de una muestra (por ejemplo, mediante el aislamiento de las células individuales, con o sin un enriquecimiento previo), son lisadas y se recogen los ácidos nucleicos de interés (por ejemplo, ADN genómico, ARNm, etc.). Según se describe en el presente documento, el análisis transcripcional de un gen o de un conjunto de genes puede utilizarse para categorizar las células aisladas en grupos que muestran similitudes en sus perfiles de expresión (por ejemplo, células madre cancerosas frente a células que no son madre). Sin estar ceñidos a ninguna teoría, dicha información puede sugerir diferencias funcionales, ya que los genes que está transcribiendo una célula están fuertemente relacionados con su función. Una vez que las células están organizadas en grupos celulares similares (por ejemplo, aquellas células que muestran unos perfiles transcripcionales similares o idénticos), pueden analizarse adicionalmente los lisados de las células individuales y/o los lisados que comprenden los ácidos nucleicos agrupados de las células similares a nivel del transcriptoma. En algunos casos, los lisados (por ejemplo, de células individuales o de grupos de células similares) se someten a metodologías (por ejemplo, secuenciación de alto rendimiento) para definir una porción del transcriptoma de cada célula y/o de grupos de células similares. La información del transcriptoma de las células individuales puede ser analizada a nivel poblacional mediante la comparación y/o la combinación de los resultados de las células individuales con los resultados de otras células similares. La información del transcriptoma de los grupos de células similares también puede usarse para definir las características transcripcionales de dichos grupos.
Cualquier población de células puede ser estudiada de dicha forma, por ejemplo, poblaciones de células que comprenden células madre. En algunas formas de realización, las células incluyen células madre, incluyendo células madre embrionarias, células madre adultas - que incluyen, pero no se limitan a, células madre cancerosas, células madre hematopoyéticas (HSC) y células madre mesenquimatosas -y células madre pluripotentes inducidas. Generalmente, una población de células es una población heteróloga (por ejemplo, una muestra clínica). Las subpoblaciones de interés dentro de una población de células más grande pueden ser aisladas mediante cualquier método del presente documento (por ejemplo, una clasificación mediante FACS) de acuerdo con cualquier criterio pertinente (por ejemplo, la expresión de una proteína de superficie). En algunas formas de realización, dichas células clasificadas están compartimentalizadas de forma que cada población clasificada comprende 10 células o menos, 5 células o menos, 4 células, 3 células, 2 células o 1 célula.
En algunas formas de realización, las células son lisadas y divididas en dos o más porciones. Una porción del lisado es analizado adicionalmente (por ejemplo, el análisis de un conjunto de genes para detectar la expresión) para detectar y/o diferenciar subpoblaciones dentro de una población heteróloga más grande. Los lisados de las células que indican que están en la subpoblación indicadas de interés (por ejemplo, células madre hematopoyéticas) se analizan adicionalmente. Los lisados de las células individuales, o los lisados agrupados de las células similares, pueden ser analizados. La determinación de las poblaciones de “células similares” puede basarse en similitudes en la expresión de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1.000 o más genes.
Las poblaciones o subpoblaciones celulares de células de interés pueden ser analizadas adicionalmente. Las poblaciones o subpoblaciones celulares pueden comprender células que comprenden una porción de la muestra original, por ejemplo, células que comprenden un 1 %, un 2 %, un 3 %, un 4 %, un 5 %, un 6 %, un 7 %, un 8 %, un 9 %, un 10 % o más de la muestra original. Mediante el uso de los métodos descritos en el presente documento, pueden aislarse poblaciones o subpoblaciones de células de interés a partir de muestras heterogéneas, de forma que las poblaciones o subpoblaciones aisladas pueden ser un 51 %, un 52 %, un 53 %, un 54 %, un 55 %, un 56 %, un 57 %, un 58 %, un 59%, un 60 %, un 61 %, un 62 %, un 63 %, un 64 %, un 65 %, un 66 %, un 67%, un 68 %, un 69%, un70%, un71%, un72%, un73%, un74%, un75%, un76%, un77%, un78%, un79%,un80%, un 81%, un82%, un83%, un84%, un85%, un86%, un87%, un88%, un89%, un90%, un91%,un92%, un 93 %, un 94 %, un 95%, un 96 %, un 97 %, un 98 %, un 99% o un 100 % de células libres que no son miembros de la población o subpoblación objetivo. Por ejemplo, mediante el uso de los métodos descritos en el presente documento, una población de células aislada puede comprender células de las que el 95 % expresan CDK6, PTEN, TOP1, SUZ12 y/o SOX9. Dado que los lisados se preparan a partir de células que son aisladas a partir de la población original, el estudio de las poblaciones de células similares puede realizarse mediante el agrupamiento de los lisados a partir de células similares.
imagen34
El análisis adicional de las células, de las poblaciones y/o de las subpoblaciones puede incluir el análisis del transcriptoma completo. En algunos casos, los lisados comprenderán un ARNm que puede ser amplificado (por ejemplo, un ADNc) para su análisis o analizado directamente (por ejemplo, una secuenciación del ARNm, un análisis en micromatriz). La amplificación del ARNm puede llevarse a cabo mediante cualquier método conocido en la materia (por ejemplo, una transcripción in vitro, una amplificación de ADNc mediante una PCR de ligación). En algunas formas de realización, la amplificación del ARNm puede llevarse a cabo con, o mediante el uso de, un dispositivo microfluido. El análisis del transcriptoma completo puede llevarse a cabo mediante plataformas de secuenciación, tales como las disponibles comercialmente en Illumina (ARN-Seq) y en Helicos (Digital Gene Expression o “DGE”). En algunas formas de realización, se secuencian los polinucleótidos de interés. Los ácidos nucleicos objetivo pueden ser secuenciados mediante métodos convencionales basados en una electroforesis en gel mediante el uso de, por ejemplo, una secuenciación de tipo Sanger. Alternativamente, la secuenciación puede llevarse a cabo mediante el uso de varios métodos de "la siguiente generación". Dichos métodos de secuenciación de "la siguiente generación" incluyen, pero no se limitan, los comercializados por: 1) 454/Roche Lifesciences que incluyen, pero no se limitan a, los métodos y el aparato descrito en Margulies et al., Nature (2005) 437: 376 -380 (2005); y en las Patentes de EE.UU. Nº 7.244.559; 7.335.762; 7.211.390; 7.244.567; 7.264.929; 7.323.305; 2) Helicos BioSciences Corporation (Cambridge, MA) según se describe en la solicitud de EE.UU. con el número de serie 11/167046 y en las Patentes de EE.UU. Nº 7.244.559; 7.335.762; 7.211.390; 7.244.567; 7.264.929; 7.323.305; 2) Helicos BioSciences Corporation (Cambridge 7501245; 7491498; 7,276,720; y en las Publicaciones de Solicitud de Patente de EE.UU. Nº US20090061439; US20080087826; US20060286566; US20060024711; US20060024678; US20080213770; y US20080103058; 3) Applied Biosystems (por ejemplo, secuenciación SOLiD); 4) Dover Systems (por ejemplo, secuenciación Polonator G.007); 5) Illumina según se describe en las Patentes de EE.UU. Nº 5.750.341; 6.306.597; y 5.969.119; y 6) Pacific Biosciences según se describe en las Patentes de EE.UU. Nº 7.462.452; 7.476.504; 7.405.281; 7.170.050; 7.462.468; 7.476.503; 7.315.019; 7.302.146; 7.313.308; y en las Publicaciones de Solicitud de Patente de EE.UU. Nº US20090029385, (US20090068655; US20090024331; y US20080206764);
El análisis del transcriptoma completo puede llevarse a cabo por múltiples razones que permiten una caracterización adicional de las diferentes subpoblaciones de células, que incluyen, pero no se limitan a: 1) la detección de la actividad de genes que puede revelar unas propiedades biológicas únicas de las subpoblaciones y/o de los factores de transcripción que controlan su desarrollo; 2) la localización y/o la caracterización de marcadores de superficie que pueden ser usados para la purificación de las subpoblaciones (por ejemplo, mediante una clasificación por FACS); y 3) la detección y/o la caracterización de los genes y/o de los productos génicos celulares como potenciales objetivos farmacológicos de enfermedades que distinguen la subpoblación de la población general (por ejemplo, células madre cancerosas frente a tejido normal).
El análisis de las poblaciones y/o subpoblaciones (por ejemplo, mediante un análisis del transcriptoma) puede permitir el refinado de las técnicas para el aislamiento de las células que pertenecen a la subpoblación. Por ejemplo, cuando los métodos revelan un antígeno de superficie específico de una subpoblación, pueden usarse los anticuerpos desarrollados mediante cualquier método de síntesis de anticuerpos disponible para aislar dichas células a partir de una población heteróloga (por ejemplo, la muestra de un paciente). Adicionalmente, pueden usarse los perfiles del transcriptoma para desarrollar paneles de expresión génica que pueden usarse para la identificación de células procedentes de otras poblaciones (por ejemplo, de muestras del mismo paciente o de pacientes diferentes).
Diagnóstico y pronóstico
La invención halla uso en la prevención, el tratamiento, la detección o la investigación en cualquier afección, incluyendo el cáncer, enfermedades inflamatorias, enfermedades autoinmunes e infecciones. Algunos ejemplos de cánceres incluyen cánceres de próstata, de páncreas, de colon, de cerebro, de pulmón, de mama, de hueso y de piel. Algunos ejemplos de afecciones inflamatorias incluyen síndrome de intestino irritable y colitis ulcerosa. Algunos ejemplos de enfermedades autoinmunes incluyen enfermedad de Chrohn, lupus y enfermedad de Graves. Por ejemplo, la invención halla uso en la prevención, el tratamiento, la detección o la investigación de cánceres gastrointestinales, tales como cáncer de ano, de colon, de esófago, de vejiga urinaria, de estómago, de hígado y de recto; cánceres genitourinarios tales como cáncer de pene, de próstata y de testículos; cánceres ginecológicos tales como cáncer de ovario, de cuello de útero, de endometrio, de útero, de trompas de Falopio, de vagina y de vulva; cánceres de cabeza y cuello, tales como cáncer de hipofaringe, de laringe, de orofaringe, de labios, cánceres de boca y orales, cáncer de las glándulas salivales, cáncer del tracto digestivo y cáncer de senos paranasales; sarcomas; cáncer de piel; cáncer del tracto urinario incluyendo cánceres de vejiga, de riñón y de uretra; cánceres del sistema endocrino, tales como cánceres de tiroides, de pituitaria y de glándulas arenales y de los islotes pancreáticos; y cánceres pediátricos.
También se proporcionan métodos para la optimización de la terapia, mediante una primera clasificación de las células individuales de una muestra y basándose en la información de esa clasificación, seleccionar la terapia, la dosis, la modalidad de tratamiento, etc. apropiados que optimizan el diferencial entre la administración de un tratamiento antiproliferativo a las células objetivos indeseables, minimizando la toxicidad indeseable. El tratamiento se optimiza mediante la selección de un tratamiento que minimiza la toxicidad indeseable proporcionando una actividad antiproliferativa eficaz. El tratamiento puede seleccionarse para que afecte únicamente a un subconjunto de las células de una muestra. En algunos casos se selecciona una terapia que afecta a menos de aproximadamente el 5 %, a menos de aproximadamente el 1 %, a menos de aproximadamente el 0,5 %, a menos de aproximadamente el 0,2 %, a menos de aproximadamente el 0,1 %, a menos de aproximadamente el 0,05 %, a menos de aproximadamente el 0,02 %, a menos de aproximadamente el 0,01 %, a o menos de las células de la muestra.
imagen35
La firma de una afección puede referirse a un patrón de expresión de uno o más genes o proteínas de una célula individual que indica la presencia de una afección. La firma de una célula madre cancerosa puede referirse a un patrón de expresión de uno o más genes y/o proteínas cuya expresión es indicativa de un fenotipo de célula madre cancerosa. Una firma de célula autoinmune o inflamatoria se refiere a los genes y/o las proteínas cuya expresión es indicativa de una firma de célula autoinmune o inflamatoria. Una firma puede obtenerse a partir de la totalidad o de parte de un conjunto de datos, habitualmente una firma comprenderá información sobre la expresión de los genes y/o de las proteínas de al menos aproximadamente 5 genes y/o proteínas, de al menos aproximadamente 10 genes y/o proteínas, de al menos aproximadamente 15 genes y/o proteínas, de al menos aproximadamente 20 genes y/o proteínas, de al menos aproximadamente 25 genes y/o proteínas, de al menos aproximadamente 50 genes y/o proteínas, de al menos aproximadamente 75 genes y/o proteínas, de al menos aproximadamente 100 genes y/o proteínas, de al menos aproximadamente 150 genes y/o proteínas, de al menos aproximadamente 200 genes y/o proteínas, de al menos aproximadamente 300 genes y/o proteínas, de al menos aproximadamente 400 genes y/o proteínas, de al menos aproximadamente 500 genes y/o proteínas, o de más genes y/o proteínas. Cuando se usa un subconjunto de datos, el subconjunto puede comprender genes regulados por aumento, genes regulados por disminución o una combinación de los mismos.
Análisis de muestras de pacientes para aplicaciones clínicas
Aunque la siguiente descripción se centra en las células madre cancerosas, los métodos descritos en el presente documento pueden usarse para aislar y/o analizar cualquier población de células, incluyendo, pero no se limitan a, células normales de cualquier tejido (por ejemplo, células madre normales, células progenitoras normales y células maduras normales), células infectadas por virus, células inflamatorias, células progenitoras, células cancerosas (por ejemplo, células oncogénicas, células no oncogénicas, células madre cancerosas, y células cancerosas diferenciadas), células patológicas (por ejemplo, células de un cáncer, células de enfermedad inflamatoria del intestino, células de colitis ulcerosa, etc.), células microbianas (bacterianas, fúngicas, de protistas), etc.
Por lo tanto, los detalles proporcionados mediante el uso de células madre cancerosas (CSC) son ilustrativos del análisis que puede llevarse a cabo para cualquier estado patológico o afección.
En algunas formas de realización de la divulgación, puede determinarse el número de CSC en la muestra de un paciente con respecto al número total de células cancerosas. Por ejemplo, las células de una muestra de biopsia se aíslan y se analizan para comprobar la expresión de uno o más ARNm y/o proteínas, indicativa de una célula cancerosa, y se cuantifican las células que muestran el fenotipo de CSC. Alternativamente, los datos recogidos para poblaciones o subpoblaciones de CSC en particular pueden usarse para desarrollar cribados por afinidad (por ejemplo, de un anticuerpo) para la población o la subpoblación, y dichos cribados de afinidad pueden usarse para cuantificar el número de células. Normalmente, un mayor porcentaje de CSC es indicativo del potencial de continua autorrenovación de las células con el fenotipo canceroso. La cuantificación de las CSC en la muestra de un paciente puede compararse con una muestra de referencia positiva y/o negativa, por ejemplo, la muestra de un paciente tal como una muestra de sangre, la muestra de un paciente en remisión, etc. En algunas formas de realización, la cuantificación de las CSC se lleva a cabo durante el transcurso del tratamiento, en el que se cuantifica el número de células cancerosas y el porcentaje de dichas células que son CSC antes, durante y como seguimiento del curso de una terapia. Deseablemente, la terapia dirigida a las células madre cancerosas da como resultado una disminución en el número total y/o en el porcentaje de CSC en la muestra de un paciente.
Las CSC pueden ser identificadas por su fenotipo con respecto a unos marcadores en particular, y/o por su fenotipo funcional. En algunas formas de realización, las CSC son identificadas y/o aisladas mediante la unión a la célula de reactivos específicos para los marcadores de interés. Las células que se van a analizar pueden ser células viables, o pueden ser células fijadas o incluidas.
La presencia de una CSC en la muestra de un paciente también puede ser indicativa de la fase del cáncer (por ejemplo, leucemia, cáncer de mama, cáncer de próstata). Además, la detección de CSC puede usarse para monitorizar la respuesta a la terapia y para ayudar al pronóstico. La presencia de CSC puede ser determinada mediante la cuantificación de las células que tienen el fenotipo de célula madre. Además del fenotipado de la superficie celular, puede ser útil cuantificar las células de una muestra que tengan un carácter de “célula madre”, que puede ser determinado mediante criterios funcionales, tales como la capacidad de autorrenovación, de originar tumores in vivo, por ejemplo, en un modelo de xenoinjerto, y similares.
Las muestras clínicas para su uso en los métodos de la divulgación pueden obtenerse a partir de una variedad de fuentes, particularmente de sangre, aunque en algunos casos pueden usarse muestras tales como de médula ósea, de linfoma, de líquido cefalorraquídeo, de líquido sinovial, y similares. Las muestras pueden incluir biopsias u otras muestras clínicas que contengan células. Algunas muestras comprenden tumores sólidos o porciones de los mismos. En los casos en los que se van a analizar masas de células, dichas masas pueden ser disociadas mediante cualquier medio apropiado conocido en la materia (por ejemplo, una digestión enzimática, una separación física). Dichas muestras pueden ser separadas mediante centrifugación, elutriación, separación por gradiente de densidad, aféresis, selección por afinidad, cribado, FACS, centrifugación con Flypaque, etc. antes del análisis, y habitualmente se usa una fracción mononuclear (PBMC). De esta forma pueden analizarse las células individuales de una muestra (por ejemplo, de un tumor sólido) para comprobar la expresión génica diferencial y/o realizar un análisis del transcriptoma según se describe en el presente documento.
imagen36
Una vez que se ha obtenido la muestra, puede usarse directamente, congelarse o mantenerse en un medio de cultivo apropiado durante cortos periodos de tiempo. Pueden emplearse diversos medios para mantener las células. Las muestras pueden obtenerse mediante cualquier procedimiento conveniente, tal como biopsia, extracción de sangre, venopunción o similares. En algunas formas de realización, una muestra comprenderá al menos aproximadamente 102 células, más habitualmente al menos aproximadamente 103, 104, 105 o más células. Normalmente, las muestras proceden de pacientes humanos, aunque pueden hallar uso los modelos animales, por ejemplo, equino, bovino, porcino, canino, felino, roedor, por ejemplo, ratones, ratas, hámster, primate, etc.
Puede usarse una solución apropiada para la dispersión o la suspensión de una muestra de células. Dicha solución será generalmente una solución salina equilibrada, por ejemplo, suero salino normal, PBS, solución salina equilibrada de Hank, etc., convenientemente complementada con suero bovino fetal u otros factores naturales, junto con un tampón aceptable a una baja concentración, generalmente de entre 5 -25 mM. Algunos tampones convenientes incluyen HEPES, tampones de fosfato, tampones de lactato, etc.
El análisis de la tinción celular puede llevarse a cabo mediante el uso de los métodos convencionales. Algunas técnicas que proporcionan un recuento apropiado incluyen clasificadores de células activadas por fluorescencia, que pueden tener grados variables de sofisticación, tales como canales de múltiples colores, canales de detección de la difracción de luz de ángulo bajo y obtuso, canales de impedancia, etc. Las células pueden ser seleccionadas frente a células muertas mediante el empleo de colorantes asociados a las células muertas (por ejemplo, yoduro de propidio).
Los reactivos de afinidad pueden ser receptores o ligandos específicos para las moléculas de la superficie celular indicadas anteriormente. Además de reactivos anticuerpos, pueden usarse, pares de receptores de péptido antígeno del MHC y linfocitos T; ligandos y receptores peptídicos; moléculas efectoras y receptoras, y similares. Los anticuerpos y los receptores de los linfocitos T pueden ser monoclonales o policlonales y pueden ser producidos por animales transgénicos, por animales inmunizados, por linfocitos B humanos o por animales inmortalizados, por células transfectadas con vectores de ADN que codifican para el anticuerpo o el receptor del linfocito T, etc. Los detalles relativos a la preparación de anticuerpos y su idoneidad para su uso como miembros de unión específica son bien conocidos por los expertos en la materia.
Una metodología es el uso de anticuerpos como reactivos de afinidad.
Convenientemente, estos anticuerpos pueden conjugarse con un marcador para su uso en separación. Algunos marcadores incluyen cualquier marcador conocido en la materia incluyendo, pero no se limitan a, microesferas magnéticas, que permiten una separación directa, biotina, que puede ser eliminada con avidina o con estreptavidina unida a un soporte, fluorocromos, que pueden usarse con un clasificador de células activadas por fluorescencia, o similares, para facilitar la separación de un tipo celular en particular. Algunos fluorocromos que hallan uso incluyen ficobiliproteínas, por ejemplo, ficoeritrina y aloficocianinas, fluoresceína y rojo de Texas. Frecuentemente, cada anticuerpo se marca con un fluorocromo diferente, para permitir una clasificación independiente para cada marcador.
Pueden añadirse anticuerpos a una suspensión de células e incubarse durante un periodo de tiempo suficiente para que se unan a los antígenos disponibles en la superficie celular. La incubación será habitualmente de al menos aproximadamente 5 minutos y habitualmente de menos de aproximadamente 30 minutos. Es deseable tener una concentración suficiente de anticuerpos en la mezcla de reacción, de forma que la eficacia de la separación no esté limitada por la carencia de anticuerpos. La concentración apropiada se determina mediante una valoración. El medio en el que se separan las células es cualquier medio que mantenga la viabilidad de las células. Un medio que puede utilizarse es solución salina tamponada con fosfato que contiene entre un 0,1 y un 0,5 % de BSA. En el mercado hay disponibles diversos medios, y pueden usarse de acuerdo con la naturaleza de las células, incluyendo Medio de Eagle Modificado de Dulbecco (dMEM), solución salina básica de Hank (HESS), solución salina tamponada con fosfato de Dulbecco (dPBS), RPMI, medio de Iscove, PBS con EDTA 5 mM, etc., frecuentemente complementados con suero bovino fetal, BSA, HSA, etc. Las células marcadas pueden cuantificarse entonces según la expresión de los marcadores de la superficie de las células, como se ha descrito previamente.
La comparación entre un análisis progenitor diferencial obtenido a partir de la muestra de un paciente y un análisis progenitor diferencial de referencia puede realizarse mediante el uso de unos protocolos de deducción adecuados, sistemas de Al, comparaciones estadísticas, etc. Una comparación con un análisis progenitor diferencial de referencia de células normales, de células de un tejido patológicamente similar, y similares, puede proporcionar una indicación del estadio de la enfermedad. Puede compilarse una base de datos de referencia de análisis progenitores diferenciales. Un análisis de particular interés sigue la evolución de un paciente, por ejemplo, en las etapas crónicas y preleucémicas de la enfermedad, tal que se observa una aceleración de la enfermedad en una etapa temprana. Los métodos de la divulgación proporcionan la detección de la aceleración antes de la aparición de los síntomas clínicos, y por lo tanto permiten una intervención terapéutica temprana, por ejemplo, el inicio de una quimioterapia, el aumento de la dosis de la quimioterapia, un cambio en la selección del fármaco quimioterapéutico, y similares.
imagen37
Clasificación del tumor y estratificación del paciente
También se proporcionan métodos para la optimización de la terapia mediante una primera clasificación, y basándose en esa información, seleccionar la terapia, la dosis, la modalidad de tratamiento, etc. apropiados que optimizan el diferencial entre la administración de un tratamiento antiproliferativo a las células objetivo indeseables y la minimización de la toxicidad indeseable. El tratamiento se optimiza mediante la selección de un tratamiento que minimiza la toxicidad indeseable proporcionando una eficaz actividad antiproliferativa.
En un aspecto, la divulgación proporciona métodos para la clasificación de lesiones, por ejemplo, de lesiones tumorales, de muestras de trastornos inmunitarios, y similares, y por lo tanto agrupa o “estratifica” a los pacientes de acuerdo con la firma de la expresión génica de la célula individual (incluyendo las CSC). Por ejemplo, los tumores clasificados por tener un elevado porcentaje de células madre cancerosas tienen un mayor riesgo de metástasis y de muerte, y por lo tanto pueden ser tratados más agresivamente que los tumores de un tipo más benigno. Por lo tanto, el análisis de las poblaciones o subpoblaciones presentes en la muestra de un paciente puede ser utilizado para la caracterización del estado de una enfermedad, para la monitorización de los regímenes de tratamiento y/o para el desarrollo de metodologías terapéuticas.
La muestra de cada paciente en un grupo de potenciales pacientes para un ensayo clínico puede ser clasificada como se ha descrito anteriormente. Después pueden seleccionarse los pacientes que tengan unas lesiones clasificadas de forma similar para su participación en un ensayo de investigación o clínico de un producto terapéutico en el que se desea una población de pacientes homogénea. La clasificación de un paciente también puede usarse para la evaluación de la eficacia de un producto terapéutico en una población de pacientes heterogénea. Por lo tanto, la comparación entre el perfil de expresión de un individuo y el perfil de la población para la clasificación de una enfermedad, permite la selección o el diseño de fármacos o de otros regímenes terapéuticos que se espera que sean seguros y eficaces para un paciente o población de pacientes en particular (es decir, un grupo de pacientes que tienen mismo tipo de cáncer). Por ejemplo, algunos pacientes con cáncer de mama tienen células cancerosas (por ejemplo, células cancerosas diferenciadas, células madre cancerosas) que expresan el NGFR, mientras que otros pacientes no muestran expresión del NGFR. Por lo tanto, los pacientes pueden ser clasificados, al menos en parte, de acuerdo con la expresión del NGFR. La clasificación puede basarse en la expresión (o en la ausencia de la misma) de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 o más ácidos nucleicos y/o proteínas.
Diagnóstico, pronóstico, evaluación de la terapia (teramétrica) y tratamiento de trastornos
Los métodos de clasificación descritos en el presente documento, así como sus productos génicos y los correspondientes genes y productos de los genes, son de particular interés como marcadores genéticos o bioquímicos (por ejemplo, en sangre o en tejidos) que detectarán los cambios más tempranos a lo largo de una ruta patológica (por ejemplo, una ruta de carcinogénesis, una ruta inflamatoria, etc.), y/o monitorizarán la eficacia de diversas terapias e intervenciones preventivas.
La estadificación es un proceso usado por los médicos para describir cuán avanzado es el estado canceroso en un paciente. La estadificación ayuda al médico a determinar un pronóstico, a planificar un tratamiento y a evaluar los resultados de dicho tratamiento. Los sistemas de estadificación varían según el tipo de cáncer, pero generalmente implica el siguiente sistema "TNM": el tipo de tumor, indicado por T; si el cáncer ha metastatizado a nódulos linfáticos próximos, indicador por N; y si el cáncer a metastatizado a partes más distantes del cuerpo, indicado por M. Generalmente, si un cáncer solo es detectable en el área de la lesión primaria sin que se haya diseminado a ningún nódulos linfático se denomina Estadio I. Si se ha diseminado únicamente a los nódulos linfáticos próximos, se denomina Estadio II. En el Estadio III, el cáncer se ha diseminado de forma general a los nódulos linfáticos cercanos en las proximidades del sitio de la lesión primaria. Los cánceres que se han diseminado a partes distantes del cuerpo, tales como hígado, hueso, cerebro u otros sitios, son de Estadio IV, el estadio más avanzado.
Los métodos descritos en el presente documento pueden facilitar un ajuste fino del proceso de estadificación mediante la identificación de la agresividad de un cáncer, por ejemplo, el potencial metastásico, así como la presencia en diferentes áreas del cuerpo. Por lo tanto, un cáncer de Estadio II, con una clasificación que significa que es un cáncer con un elevado potencial metastásico, puede usarse para un tumor en el límite del Estadio II a un tumor en Estadio III, justificando una terapia más agresiva. Por el contrario, la presencia de un polinucleótido que signifique un bajo potencial metastásico permite una estadificación más conservativa de un tumor.
Por ejemplo, se analiza una biopsia de cáncer de mama en Estadio II de un paciente mediante los métodos descritos en el presente documento. Si la muestra del paciente contiene una o más células que expresan un gen objetivo por encima o por debajo de un nivel umbral, el cáncer de mama puede ser clasificado como que tiene un elevado potencial metastásico. Por lo tanto, el médico responsable puede usar dicha información para tratar más agresivamente al paciente de lo que lo haría sin la clasificación adicional. La determinación de la expresión de unos marcadores en particular también puede proporcionar información sobre potenciales objetivos para la terapia farmacológica (por ejemplo, células oncogénicas de un paciente que expresan un objetivo farmacológico).
imagen38
Desarrollo e identificación de productos terapéuticos
Los métodos y las composiciones descritos en el presente documento pueden utilizarse para el desarrollo o la identificación de nuevos agentes terapéuticos y/o para refinar las terapias existentes. Por ejemplo, mediante el uso de un análisis de las células individuales, pueden analizarse los perfiles de expresión de las poblaciones de células objetivo (por ejemplo, células madre cancerosas, células madre cancerosas y células cancerosas diferenciadas, o células cancerosas diferenciadas) para detectar potenciales objetivos de agentes terapéuticos. Algunos potenciales objetivos incluyen, sin limitación, biomarcadores en particular y rutas con una regulación alterada. Algunos objetivos de interés pueden incluir marcadores o rutas específicas de la(s) población(es) de células de interés.
En un caso pueden analizarse las células de una población o subpoblación objetivo para comprobar la expresión de los ácidos nucleicos según se describe en el presente documento para detectar nuevos biomarcadores que puedan ser el objetivo de un tratamiento. Por ejemplo, puede investigarse una molécula de la superficie celular en particular de las células madre cancerosas y/o de las células cancerosas diferenciadas como objetivo de un potencial agente terapéutico (por ejemplo, de un anticuerpo o de otra fracción de unión - potencialmente conjugado con una toxina o con otro efector similar -con especificidad por la molécula de superficie). En otros casos pueden analizarse poblaciones de células objetivo para evaluar una alteración en la regulación de las rutas implicadas en los procesos patológicos (por ejemplo, una pérdida del control de la maquinaria del ciclo celular en células cancerosas). Algunas rutas pueden incluir, sin limitación, activadores y/o represores de la expresión génica, la expresión de unos genes o de unos conjuntos de genes en particular, y rutas globales más complejas. Los agentes terapéuticos que se dirigen a dicha alteración en la regulación pueden afectar potencialmente a las células objetivo para alterar la expresión de los ácidos nucleicos asociados con las células objetivo. La alteración en la expresión inducida por los agentes terapéuticos puede dar como resultado una regulación por aumento o por disminución del ácido nucleico. En algunos casos, el tratamiento de las células y/o de un sujeto con uno o más agentes terapéuticos puede dar como resultado la expresión de ácidos nucleicos que imitan la expresión en células no patológicas (por ejemplo, el tratamiento da como resultado la expresión de unos genes relacionados con el ciclo celular similares a los de las células no cancerosas).
Mediante el uso de los métodos y de las composiciones descritas en el presente documento pueden analizarse poblaciones de células objetivo para evaluar una expresión alterada de uno o más ácidos nucleicos. El desarrollo de agentes terapéuticos nuevos y/o refinados puede implicar el análisis de una población de células objetivo (por ejemplo, de células madre cancerosas de colon, de células de cáncer de mama, etc.) para determinar los ácidos nucleicos que muestran unos perfiles de expresión alterados en comparación con las células “normales”. Por ejemplo, algunas células madre cancerosas de colon muestran un aumento en la expresión de, por ejemplo, TERT, PTPRO, AQP1, KIF12, METTL3, LEFTY1, CFTR, CA2 y/o EZF12. Dichas células pueden ser utilizadas para el cribado de potenciales agentes terapéuticos para evaluar los efectos sobre la expresión de éstos y/o de otros ácidos nucleicos, mediante la exposición de las células aisladas de la población objetivo a los agentes candidatos, y el ensayo para comprobar la alteración en la expresión de los genes tras la exposición.
Los métodos divulgados en el presente documento también pueden ser utilizados para analizar los efectos de compuestos que afectan a ciertos fenotipos celulares, que incluyen, pero no se limitan a, la expresión génica, el funcionamiento de una ruta (por ejemplo, el ciclo celular, la ruta TERT, rutas de estrés oxidativo) y o el tipo o la morfología de la célula. Por lo tanto, los compuestos que afectan a dichas características genotípicas pueden ser analizados además de, o en lugar de, analizar el potencial de un compuesto como agente terapéutico Por ejemplo, puede llevarse a cabo un análisis de los cambios en la expresión génica en una población objetivo (por ejemplo, en células de colon normales, en células de mama normales, en células cancerosas, en células madre, en células madre cancerosas, etc.) expuesta a uno o más compuestos de prueba para analizar el (los) efecto(s) de los compuestos de prueba sobre la expresión génica u otros fenotipos deseados (por ejemplo, la expresión de marcadores, la viabilidad celular). Dichos análisis pueden ser útiles para múltiples fines, por ejemplo, la investigación sobre el ciclo celular o el análisis de rutas conocidas o desconocidas.
Los agentes que se van a analizar para comprobar su potencial valor terapéutico pueden ser cualquier compuesto, molécula pequeña, proteína, lípido, carbohidrato, ácido nucleico u otro agente apropiado para su uso terapéutico. Las células aisladas de una población objetivo pueden ser expuestas a bibliotecas de potenciales agentes terapéuticos (por ejemplo, bibliotecas de anticuerpos, bibliotecas de moléculas pequeñas) para determinar los efectos sobre la expresión génica y/o la viabilidad celular. En algunos casos un agente terapéutico candidato se dirigirá específicamente a la población celular de interés. Por ejemplo, tras un análisis de las células individuales se revela la existencia de una mutación que está presente en las células objetivo (por ejemplo, células madre cancerosas y/o células cancerosas diferenciadas), un agente terapéutico candidato puede dirigirse a la mutación. En algunos casos, las células tratadas pueden exponerse a un análisis de las células individuales para determinar los efectos del (los) agente(s) terapéutico(s) candidato(s) sobre la expresión de uno o más genes de interés y/o los efectos sobre el transcriptoma.
imagen39
En otras formas de realización de la divulgación, los agentes se dirigen a una población o subpoblación de células patológicas mediante la unión específica a un marcador o a una combinación de marcadores presentes en la población o subpoblación objetivo. En algunas formas de realización, los agentes incluyen anticuerpos o derivados de unión al antígeno de los mismos específicos para un marcador o una combinación de marcadores, que opcionalmente están conjugados con una fracción citotóxica. Dichas metodologías pueden usarse para disminuir la población o subpoblación objetivo en un paciente (por ejemplo, para disminuir las poblaciones de células madre cancerosas).
Ensayos de cribado de agentes terapéuticos
Las células (por ejemplo, las células patológicas) que expresan un marcador o una combinación de marcadores también son útiles para ensayos in vitro y para el cribado para la detección de factores y de agentes quimioterapéuticos que son activos sobre las células cancerosas diferenciadas y/o las células madre cancerosas. De particular interés son los ensayos de cribado de agentes que son activos sobre células humanas. Puede usarse una amplia variedad de ensayos con este fin, incluyendo inmunoensayos de unión de proteínas; la determinación del crecimiento, la diferenciación y la actividad funcional celulares; la producción de factores; y similares (véase, por ejemplo, Balis, (2002) J Natl Cancer Inst. 94: 2; 78). En otras formas de realización, los polipéptidos aislados correspondientes a un marcador o a una combinación de marcadores de la presente invención son útiles en ensayos de cribado de fármacos.
En los ensayos de cribado de agentes biológicamente activos, de fármacos antiproliferativos, etc. se pone en contacto un marcador o una composición de células objetivo con el agente de interés y se evalúa el efecto del agente monitorizando los parámetros de salida de las células, tales como la expresión de los marcadores, la viabilidad celular, y similares; o la eficacia de unión o el efecto sobre la actividad enzimática o del receptor para polipéptidos. Por ejemplo, se expone una composición de células de cáncer de mama que se sabe que tiene un perfil de expresión de “célula madre cancerosa” a un agente de prueba, y las células expuestas son analizadas individualmente según se describe en el presente documento para determinar si el agente de prueba ha alterado el perfil de expresión en comparación con las células no tratadas. Cualquier población de células aisladas descrita en el presente documento o producida mediante los métodos descritos en el presente documento puede ser recién aislada, cultivada, alterada genéticamente, y similares. Las células pueden ser variantes inducidas por factores ambientales de cultivos clonales: por ejemplo, divididas en cultivos independientes y cultivadas en distintas condiciones, por ejemplo, con o sin fármacos; en presencia o ausencia de citocinas, o combinaciones de los mismos. La forma en la que responden las células a un agente (por ejemplo, un péptido, un ARNip, una molécula pequeña, etc.), particularmente a un agente farmacológico, incluyendo las respuestas cronológicas, es un importante reflejo del estado fisiológico de la célula.
Los parámetros son componentes cuantificables de las células, particularmente componentes que pueden ser medidos de forma precisa, por ejemplo, con un sistema de alto rendimiento. Un parámetro puede ser cualquier componente de la célula o producto de la célula, incluyendo un determinante de la superficie celular, un receptor, una proteína o una modificación conformacional o postraduccional de los mismos, un lípido, un carbohidrato, una molécula orgánica o inorgánica, un ácido nucleico, por ejemplo, ARNm, ADN, etc. o una porción derivada de dicho componente celular, o combinaciones de los mismos. Por ejemplo, en una forma de realización, se ponen en contacto las células aisladas según se describe en el presente documento con uno o más agentes, y se determina el nivel de expresión de un ácido nucleico de interés (por ejemplo, TERT, PTPRO, AQP1, KIF12, METTL3, LEFTY1, CFTR, CA2 y/o EZH2). Los agentes que alteran la expresión del (los) ácido(s) nucleico(s) detectado(s), por ejemplo, cuando las células muestran un patrón de expresión similar al de una célula no patológica, pueden ser analizados adicionalmente para comprobar su potencial terapéutico. Aunque la mayoría de los parámetros (por ejemplo, la expresión del ARNm o de proteínas) proporcionarán una lectura cuantitativa, en algunos casos es aceptable un resultado semicuantitativo o cualitativo. Las lecturas pueden incluir un valor determinado individualmente, o pueden incluir el valor medio, mediano o la varianza, etc. De forma característica se obtiene un intervalo de valores de lecturas del parámetro para cada parámetro a partir de una multiplicidad de los mismos ensayos. Se espera variabilidad y se obtiene un intervalo de valores para cada uno de los conjuntos de parámetros de ensayo mediante el uso de los métodos estadísticos habituales, usándose un método estadístico común para proporcionar los valores individuales.
Algunos agentes de interés para el cribado incluyen compuestos conocidos y desconocidos que engloban numerosas clases químicas, moléculas principalmente orgánicas, que pueden incluir moléculas organometálicas, secuencias genéticas, etc.
Un aspecto importante de la invención es la evaluación de fármacos candidatos, incluyendo pruebas de toxicidad; y similares.
Además de complejos agentes candidatos biológicos, los agentes incluyen moléculas orgánicas que comprenden grupos funcionales necesarios para las interacciones estructurales, particularmente fuentes de hidrógeno, y normalmente incluyen al menos un grupo amina, carbonilo, hidroxilo o carboxilo, frecuentemente al menos dos de los grupos químicos funcionales. Los agentes candidatos pueden comprender estructuras de carbono cíclicas o heterocíclicas y/o estructuras aromáticas o poliaromáticas sustituidas con uno o más de los grupos funcionales anteriores. Los agentes candidatos también pueden encontrarse entre las biomoléculas, que incluyen péptidos, polinucleótidos, sacáridos, ácidos grasos, esteroides, purinas, pirimidinas, derivados, análogos estructurales o combinaciones de los mismos. En algunos casos, los compuestos de ensayo pueden tener funciones conocidas (por ejemplo, el alivio del estrés oxidativo), pero pueden actuar a través de un mecanismo desconocido o actuar sobre un objetivo desconocido.
imagen40
Están incluidos los fármacos farmacológicamente activos, las moléculas genéticamente activas, etc. Algunos compuestos de interés incluyen agentes quimioterapéuticos, hormonas o antagonistas de hormonas, etc. Algunos ejemplos de agentes farmacéuticos adecuados para esta divulgación son los descritos en "The Pharmacological Basis of Therapeutics," Goodman y Gilman, McGraw-Hill, Nueva York, Nueva York, (1996), novena edición, en las secciones: Water, Salts and Ions; Drugs Affecting Renal Function and Electrolyte Metabolism; Drugs Affecting Gastrointestinal Function; Chemotherapy of Microbial Diseases; Chemotherapy of Neoplastic Diseases; Drugs Acting on Blood-Forming organs; Hormones and Hormone Antagonists; Vitamins, Dermatology; y Toxicology, todas ellas incorporadas al presente documento como referencia. También están incluidas las toxinas y los agentes de guerra biológica y química, por ejemplo, véase Somani, S. M. (Ed.), "Chemical Warfare Agents," Academic Press, Nueva York, 1992).
Los compuestos de ensayo incluyen todas las clases de moléculas descritas anteriormente, y pueden comprender adicionalmente muestras con un contenido desconocido. Son de interés las mezclas complejas de compuestos naturales derivadas de fuentes naturales tales como plantas, hongos, bacterias, protistas o animales. Aunque muchas muestras comprenderán compuestos en disolución, también pueden ensayarse las muestras sólidas que puedan disolverse en un disolvente adecuado. Algunas muestras de interés incluyen muestras medioambientales, por ejemplo, de agua terrestre, de agua marina, de desechos de minería, etc., muestras biológicas, por ejemplo, lisados preparados a partir de cultivos, muestras de tejido, etc.; muestras de fabricación, por ejemplo, durante el transcurso de la preparación de productos farmacéuticos; así como bibliotecas de compuestos preparados para su análisis; y similares (por ejemplo, compuestos que están siendo evaluados por su potencial valor terapéutico, es decir, fármacos candidatos).
Las muestras o los compuestos también pueden incluir componentes adicionales, por ejemplo, componentes que afectan a la fuerza iónica, al pH, a la concentración total de proteínas, etc. Además, las muestras pueden ser tratadas para conseguir al menos un fraccionamiento o una concentración parcial. Las muestras biológicas pueden ser almacenadas si se tiene cuidado en reducir la degradación del compuesto, por ejemplo, en una atmósfera de nitrógeno, congeladas, o una combinación de los mismos. El volumen de muestra usado es suficiente como para permitir una detección mensurable, por ejemplo, puede ser suficiente de desde aproximadamente 0,1 ml hasta 1 ml de una muestra biológica.
Los compuestos, incluyendo los agentes candidatos, se obtienen a partir de una gran diversidad de fuentes, incluyendo bibliotecas de compuestos sintéticos o naturales. Por ejemplo, hay disponibles numerosos medios de síntesis aleatoria y dirigida de una gran diversidad de compuestos orgánicos, que incluyen biomoléculas, incluyendo la expresión de oligonucleótidos y oligopéptidos aleatorizados. Alternativamente, hay disponibles bibliotecas de compuestos naturales en forma de extractos bacterianos, fúngicos, vegetales y animales, o pueden producirse fácilmente. Adicionalmente, la genotecas y los compuestos naturales o producidos sintéticamente son fácilmente modificados a través de un medio químico, físico y bioquímico convencional, y pueden usarse para producir bibliotecas combinatorias. Los agentes farmacológicos conocidos pueden someterse a modificaciones químicas dirigidas o aleatorias, tales como acilación, alquilación, esterificación, amidación, etc., para producir análogos estructurales.
Los agentes son cribados para comprobar su actividad biológica mediante la adición del agente a al menos una, y habitualmente a una pluralidad, de muestras celulares, habitualmente junto con células que carecen del agente. Se miden los cambios en los parámetros en respuesta al agente y el resultado se evalúa mediante una comparación con cultivos de referencia, por ejemplo, en presencia o en ausencia del agente, la obtenida con otros agentes, etc.
Los agentes pueden ser añadidos en disolución o en una forma fácilmente soluble, al medio de las células en cultivo. Los agentes pueden ser añadidos en un sistema de flujo a través, en forma de una corriente, de forma intermitente o continua, o como alternativa, añadiendo un bolo del compuesto, individualmente o por incrementos, a una solución por lo demás estática. En un sistema de flujo a través se usan dos fluidos, en el que uno es una solución fisiológicamente neutra y el otro es la misma solución a la que se le ha añadido el compuesto. El primer fluido se hace pasar sobre las células, seguido del segundo. En un método de solución individual se añade un bolo del compuesto de ensayo al volumen de medio que rodea a las células. Las concentraciones globales de los componentes del medio de cultivo no deberían cambiar significativamente con la adición del bolo, o entre las dos soluciones en un método de flujo a través.
Algunas formulaciones de agentes no incluyen componentes adicionales, tales como conservantes, que pueden tener un efecto significativo sobre la formulación global.
Por lo tanto, dichas formulaciones consisten esencialmente en un compuesto biológicamente activo y un portador fisiológicamente aceptable, por ejemplo, agua, etanol, DMSO, etc. Sin embargo, si un compuesto es líquido sin un disolvente, la formulación puede consistir esencialmente en el propio compuesto.
imagen41
Pueden llevarse a cabo una pluralidad ensayos en paralelo con diferentes concentraciones del agente para obtener una respuesta diferencial a las diversas concentraciones.
Como se sabe en la materia, la determinación de la concentración eficaz de un agente usa normalmente un intervalo de concentraciones resultantes de diluciones a 1:10, o a otra escala logarítmica. Las concentraciones pueden refinarse adicionalmente con una segunda serie de diluciones si fuera necesario. Normalmente, una de estas concentraciones sirve como control negativo, es decir, una concentración cero o por debajo del nivel de detección del agente, o a la concentración de agente o por debajo que no proporciona un cambio detectable en el fenotipo.
Pueden utilizarse varios métodos para la cuantificación de la presencia de los marcadores seleccionados. Para medir la cantidad presente de una molécula, un método conveniente es marcar una molécula con una fracción detectable, que puede ser fluorescente, luminiscente, radioactiva, enzimáticamente activa, etc., particularmente una molécula específica para la unión al parámetro con elevada afinidad. Las fracciones fluorescentes están fácilmente disponibles para el marcado de prácticamente cualquier biomolécula, estructura o tipo celular.
Pueden dirigirse fracciones inmunofluorescentes para que se unan no solo a proteínas específicas sino también a conformaciones específicas, productos de escisión o modificaciones del sitio tales como una fosforilación. Los péptidos y las proteínas individuales pueden ser diseñados para que sean autofluorescentes, por ejemplo, mediante su expresión en forma de proteínas quiméricas fluorescentes verdes dentro de las células (para una revisión, véase Jones et. al. (1999) Trends Biotechnol. 17 (12): 477 -81). Por lo tanto, los anticuerpos pueden modificarse genéticamente para proporcionar un colorante fluorescente como parte de su estructura. Dependiendo del marcador usado, los parámetros pueden medirse mediante el uso de marcadores distintos a los fluorescentes, mediante el uso de técnicas de inmunoensayo tales como un radioinmunoensayo (RIA) o un ensayo de inmunoadsorción enzimática (ELISA), inmunoensayos enzimáticos homogéneos y técnicas relacionadas no enzimáticas. La cuantificación de losácidos nucleicos, especialmente de los ARN mensajeros, también es de interés como parámetro. Éstos pueden medirse mediante técnicas de hibridación que dependen de la secuencia de ácidos nucleicos de los nucleótidos. Algunas técnicas incluyen los métodos de reacción en cadena de la polimerasa así como las técnicas de matriz génica. Véanse Current Protocols in Molecular Biology, Ausubel et al, eds, John Wiley & Sons, Nueva York, NY, 2000; Freeman at al. (1999) Biotechniques 26 (1): 112 - 225; Kawamoto at al. (1999) Genome Res 9 (12): 1305 - 12; y Chen et al. (1998) Genomics 51 (3): 313 - 24, para algunos ejemplos.
Bases de datos de perfiles de expresión y análisis de los datos
También se proporcionan bases de datos de perfiles de expresión génica de células madre cancerosas y de otros tipos celulares, y usos de los mismos. Dichas bases de datos comprenderán normalmente perfiles de expresión derivados de diversas subpoblaciones celulares, tales como células madre cancerosas, células cancerosas que no son células madre, los equivalentes normales de células cancerosas, células patológicas (por ejemplo, células inflamatorias del intestino, células de colitis ulcerosa), células infectadas por virus, células progenitoras tempranas, células progenitoras inicialmente diferenciadas, células progenitoras tardíamente diferenciadas y células maduras. Los perfiles de expresión y las bases de datos de los mismos pueden proporcionarse en una variedad de medios para facilitar su uso. “Medios” se refiere a una manufactura que contiene la información del perfil de expresión de la presente divulgación. Las bases de datos de la presente divulgación pueden ser registradas en un medio legible por ordenador, por ejemplo, cualquier medio que pueda ser leído y accesible directamente por un ordenador. Dichos medios incluyen, pero no se limitan a: medios de almacenamiento magnético, tales como discos floppy, un medio de almacenamiento de disco duro y una cinta magnética; medio de almacenamiento óptico tales como un CD-ROM; medios de almacenamiento eléctrico tales como RAM y ROM; y los híbridos de estas categorías, tales como medios de almacenamiento magnéticos / ópticos. El experto en la materia apreciará fácilmente cómo puede usarse cualquiera de los medios legibles por ordenador conocidos actualmente para crear una manufactura que comprenda un registro de la presente información de bases de datos. “Registrado” se refiere a un proceso para el almacenamiento de información sobre un medio legible por ordenador, mediante el uso de cualquiera de los métodos como se conoce en la materia. Puede elegirse cualquier estructura de almacenamiento de datos conveniente basándose en el medio usado para acceder a la información almacenada. Para el almacenamiento puede usarse una variedad de programas de procesado de datos y de formatos, por ejemplo, un archivo de texto de procesado de palabras, un formato de base de datos, etc.
Según se usa en el presente documento, “un sistema basado en un ordenador” se refiere al medio de hardware, al medio de software y al medio de almacenamiento de datos usados para analizar la información de la presente divulgación. El hardware mínimo del sistema basado en un ordenador de la presente divulgación comprende una unidad de procesado central (CPU), un medio de entrada, un medio de salida y un medio de almacenamiento de datos. Un artesano experto apreciará fácilmente que cualquiera de los sistemas basados en un ordenador disponibles actualmente es adecuado para su uso en la presente divulgación. El medio de almacenamiento de datos puede comprender cualquier manufactura que comprenda un registro de la presente información como se ha descrito anteriormente, o un medio de acceso a memoria que pueda acceder a dicha manufactura.
Puede usarse una variedad de formatos estructurales para el medio de entrada y de salida para introducir y obtener la información en los sistemas basados en un ordenador de la presente divulgación. Dicha presentación proporciona al artesano experto una escala de similitudes e identifica el grado de similitud contenido en el perfil de expresión de prueba.
imagen42
Pueden utilizarse varios métodos de análisis de un conjunto de datos. En una forma de realización, los datos de la expresión se someten a una transformación y a una normalización.
Por ejemplo, se generan proporciones mediante el centrado de la media de los datos de expresión de cada gen (dividiendo la medición de intensidad de cada gen de una matriz dada por la intensidad media de un gen a lo largo de todas las matrices), (2) después se transforman logarítmicamente (base 2) las proporciones resultantes y (3) después se centra la mediana de los datos de expresión para todas las matrices y después a lo largo de los genes.
Para los datos de una micromatriz de ADNc, los genes con unas señales de hibridación fluorescente al menos 1,5 veces mayor que la señal fluorescente de fondo local en el canal de referencia se consideran medidos adecuadamente. Los genes son centrados según el valor medio de cada conjunto de datos y se lleva a cabo un agrupamiento de unión promedio.
También puede realizarse una metodología a escala para el análisis de los datos. Por ejemplo, la correlación de Pearson de los valores de expresión de los genes puede proporcionar una puntuación cuantitativa que refleje la firma de cada CSC. Cuanto mayor sea el valor de correlación mas se parecerá la muestra al fenotipo de referencia de CSC. Puede llevarse a cabo una correlación similar para cualquier tipo celular, incluyendo células normales, células progenitoras, células con fenotipo autoinmune, células con fenotipo inflamatorio, células infectadas, células cancerosas diferenciadas, células madre normales, células maduras normales, etc. Un valor de correlación negativo indica el comportamiento opuesto. El umbral para la clasificación puede moverse por encima o por debajo de cero dependiendo del objetivo clínico. Por ejemplo, puede calcularse la sensibilidad y la especificidad para predecir las metástasis como el primer evento recurrente para cualquier umbral entre - 1 y +1 para la puntuación de correlación en incrementos de 0,05 y puede seleccionarse el valor umbral que proporciona una sensibilidad deseada de, por ejemplo, el 80 %, el 90 %, el 95 %, etc. para la predicción de metástasis.
Para proporcionar una ordenación de la significación puede determinarse la tasa de falsos descubrimientos (FDR). En primer lugar se genera un conjunto de distribuciones nulas de valores distintos. En una forma de realización, los valores de los perfiles observados son permutados para crear una secuencia de distribuciones de los coeficientes de población obtenidos al azar, creando así un conjunto apropiado de distribuciones nulas de los coeficientes de correlación (véase Tusher et al. (2001) PNAS 98, 5118 - 21, incorporado al presente documento como referencia). El conjunto de distribución nula se obtiene mediante: la permutación de los valores de cada perfil para todos los perfiles disponibles; el cálculo de los coeficientes de correlación emparejados para todo los perfiles; el cálculo de la función de la densidad de probabilidad de los coeficientes de correlación para esta permutación; y repitiendo el procedimiento N veces, donde N es un número alto, habitualmente 300. Mediante el uso de N distribuciones se calcula una medida aproximada (media, mediana, etc.) del recuento de los valores del coeficiente de correlación cuyo valor excede el valor (de similitud) que se ha obtenido a partir de la distribución de los valores de similitud observados experimentalmente a un nivel de significación dado.
La FDR es la proporción entre el número de correlaciones falsamente significativas esperadas (estimadas a partir de las correlaciones mayores que esta correlación de Pearson seleccionada del conjunto de datos aleatorizados) y el número de correlaciones mayor que esta correlación de Pearson seleccionada en los datos empíricos (correlaciones significativas). El valor de corte de la correlación puede aplicarse a las correlaciones entre los perfiles experimentales.
Mediante el uso de la distribución mencionada anteriormente se elige el nivel de confianza de la significación. Esto se usa para determinar el menor valor del coeficiente de correlación que supera el resultado que se habría obtenido al azar. Mediante el uso de este método se obtienen los umbrales de correlación positiva, de correlación negativa o ambos. Mediante el uso de este(os) umbral(es) el usuario puede filtrar los valores observados en los coeficientes de correlación emparejados y eliminar aquellos que no excedan el (los) umbral(es). Adicionalmente puede obtenerse una estimación de la tasa de falsos positivos para un umbral dado. Para cada una de las distribuciones individuales de "correlación aleatoria" se puede averiguar cuántas observaciones están fuera del intervalo del umbral. Este procedimiento proporciona una secuencia de recuentos. La media de la desviación típica de la secuencia proporciona el número medio de potenciales falsos positivos y su desviación típica.
Los datos pueden someterse a un agrupamiento jerárquico no supervisado para revelar relaciones entre los perfiles. Por ejemplo, puede llevarse a cabo un agrupamiento jerárquico en el que se emplea la correlación de Pearson como la métrica de agrupamiento. El agrupamiento de la matriz de correlación, por ejemplo, mediante el uso de un escalado multidimensional, mejora la visualización de las similitudes y las diferencias en la homología funcional. El escalado multidimensional (MDS) puede ser aplicado en una, dos o tres dimensiones.
El análisis puede implementarse en hardware o en software, o en una combinación de ambos. En una forma de realización de la divulgación se proporciona un medio de almacenamiento legible por una máquina, medio que comprende un material de almacenamiento de datos codificado con datos elegibles por una máquina, cuando se usa una máquina programada con instrucciones para el uso de dichos datos, es capaz de mostrar cualquiera de los conjuntos de datos y comparaciones de datos de esta divulgación. Dichos datos pueden usarse para diversos fines, tales como el descubrimiento de fármacos, el análisis de las interacciones entre los componentes celulares, y similares. En algunas formas de realización, la divulgación es implementada en programas informáticos que se ejecutan en ordenadores programables, que comprenden un procesador, un sistema de almacenamiento de datos (incluyendo elementos de memoria y/o de almacenamiento volátiles y no volátiles), al menos un dispositivo de entrada y al menos un dispositivo de salida. Se aplica un código de programa a los datos introducidos para llevar a cabo las funciones descritas anteriormente y generar información de salida. La información de salida es aplicada a uno o más dispositivos de salida de una forma conocida. El ordenador puede ser, por ejemplo, un ordenador personal, un microordenador o una estación de trabajo de diseño convencional.
imagen43
Cada programa puede ser implementado en un procedimiento de alto nivel o en un lenguaje de programación orientado al objeto para comunicarse con un sistema informático. Sin embargo, los programas pueden ser implementados en un lenguaje de ensamblaje o de máquina, si se desea. En cualquier caso, el lenguaje puede ser un lenguaje compilado o interpretado. Cada uno de dichos programas informáticos puede ser almacenado en un medio o en un dispositivo de almacenamiento (por ejemplo, en una ROM o en un disquete magnético) legible por un ordenador programable con un fin especial o general, para configurar y manipular el ordenador cuando el medio o el dispositivo de almacenamiento es leído por el ordenador para llevar a cabo los procedimientos descritos en el presente documento. También puede considerarse que el sistema está implementado en un medio de almacenamiento legible por ordenador, configurado con un programa informático, en el que el medio de almacenamiento así configurado hace que el ordenador opere de una forma específica y predefinida para llevar a cabo las funciones descritas en el presente documento.
Puede usarse una variedad de formatos estructurales para el medio de entrada y de salida para introducir y recoger la información en los sistemas basados en ordenador de la presente divulgación. Un formato para un medio de salida ensaya los conjuntos de datos que poseen unos grados de similitud variables con un perfil de confianza. Dicha presentación proporciona al artesano experto una clasificación de similitudes que identifica el grado de similitud contenido en el patrón de prueba.
Almacenamiento y transmisión de los datos
Adicionalmente se proporciona en el presente documento un método para el almacenamiento y/o la transmisión, a través de un ordenador, de secuencias y de otros datos recogidos por los métodos divulgados en el presente documento. Puede usarse cualquier ordenador o accesorio informático incluyendo, pero no se limitan a, software y dispositivos de almacenamiento, para llevar a cabo la presente divulgación. Un usuario puede introducir directa o indirectamente las secuencias u otros datos (por ejemplo, datos del transcriptoma), en un ordenador. Adicionalmente, puede usarse cualquiera de los dispositivos para secuenciar el ADN o para analizar el ADN o para analizar los datos del transcriptoma que puedan estar conectados a un ordenador, de forma que los datos sean transferidos a un ordenador y/o a un dispositivo de almacenamiento compatible con un ordenador. Los datos pueden ser almacenados en un ordenador o en un dispositivo de almacenamiento adecuado (por ejemplo, un CD). Los datos también pueden enviarse desde un ordenador a otro ordenador o a un punto de recolección de datos a través de métodos bien conocidos en la materia (por ejemplo, internet, correo terrestre, correo aéreo). Por lo tanto, los datos recogidos mediante los métodos descritos en el presente documento pueden ser recogidos en cualquier punto o ubicación geográfica y enviados a cualquier otra ubicación geográfica.
En la Figura 10 se ilustra un método ejemplar. En este ejemplo un usuario proporciona una muestra a un aparato de secuenciación. El aparato de secuenciación recoge y/o analiza los datos, y está conectado a un ordenador. Los programas informáticos del ordenador permiten la recolección y/o el análisis de los datos. Los datos pueden ser almacenados, mostrados (a través de un monitor o de otro dispositivo similar) y/o enviados a otra ubicación. Como se muestra en la Figura 10, el ordenador está conectado a internet, que se utiliza para transmitir los datos a un dispositivo portátil utilizado por un usuario remoto (por ejemplo, un médico, un científico o un analista). Se entiende que los datos pueden ser almacenados y/o analizados antes de la transmisión. En algunas formas de realización, pueden recogerse datos en bruto y enviarse a un usuario remoto, que analizará y/o almacenará los datos. La transmisión puede producirse, según se muestra en la Figura 10, a través de internet, pero también puede producirse a través de una conexión por satélite o de otro tipo. Alternativamente, los datos pueden ser almacenados en un medio legible por ordenador (por ejemplo, un CD, un dispositivo de almacenamiento de memoria) y el medio puede ser enviado al usuario final (por ejemplo, a través del correo). El usuario remoto puede estar en la misma ubicación geográfica o en una diferente, incluyendo, pero no se limita a, un edificio, una ciudad, un estado, un país o un continente.
Reactivos y kits
También se proporcionan reactivos y kits de los mismos para llevar a cabo uno o más de los métodos descritos anteriormente. Los reactivos y los kits de los mismos en cuestión pueden variar ampliamente. Algunos reactivos de interés incluyen los reactivos diseñados específicamente para su uso en la producción de los perfiles de expresión de los genes determinantes del fenotipo descritos anteriormente. Por ejemplo, los reactivos pueden incluir conjuntos de cebadores para los genes que se sabe que son expresados diferencialmente en una población o subpoblación objetivo (por ejemplo, dos reactivos para la detección de células oncogénicas de cáncer de mama pueden incluir cebadores y sondas para la expansión y la detección de la expresión de CD49f, de CD24 y/o de EPCAM).
imagen44
Un tipo de reactivo que está adaptado específicamente para generar los perfiles de expresión de poblaciones y subpoblaciones de células objetivo es un conjunto de cebadores específicos de genes que están diseñados para amplificar selectivamente dichos genes, para su uso en una PCR cuantitativa y en otros métodos de cuantificación. Algunos cebadores específicos de genes y los métodos de uso de los mismos se describen en la Patente de EE.UU. Nº 5.994.076.
Son de particular interés los conjuntos de cebadores específicos de genes que tienen cebadores para al menos 5 de los genes, a menudo una pluralidad de estos genes, por ejemplo, para al menos 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1.000 genes o más. Los conjuntos de cebadores específicos de genes pueden incluir únicamente cebadores para los genes asociados a una población o subpoblación objetivo (por ejemplo, mutaciones, genes conocidos mal regulados, etc.), o pueden incluir cebadores para genes adicionales (por ejemplo, genes constitutivos, controles).
Los kits de la invención en cuestión pueden incluir los anteriormente descritos conjuntos de cebadores específicos de genes. Los kits pueden incluir adicionalmente un paquete de programas informáticos para el análisis estadístico de uno o más fenotipos y pueden incluir una base de datos de referencia para calcular la probabilidad de susceptibilidad. El kit puede incluir los reactivos empleados en los diversos métodos, tales como cebadores para la generación de los ácidos nucleicos objetivo, dNTP y/o rNTP, que pueden estar mezclados previamente o separados, uno o más dNTP y/o rNTP marcados de forma única, tales como dNTP biotinilados o marcados con Cy3 o Cy5, partículas de oro o de plata con diferentes espectros de dispersión, u otros reactivos de marcado o posteriores a la síntesis, tales como derivados químicamente activos de colorantes fluorescentes, enzimas, tales como transcriptasas inversas, polimerasas de ADN, polimerasas de ARN, y similares, diversos medios tamponantes, por ejemplo, tampones de hibridación y de lavado, matrices de sondas prefabricadas, reactivos y componentes de purificación de la sonda marcada, columnas de rotación similar, etc., reactivos para la generación y la detección de la señal, por ejemplo, un conjugado de estreptavidina -fosfatasa alcalina, un sustrato quimiofluorescente o quimioluminiscente, y similares.
Además de los componentes anteriores, los kits en cuestión incluirán adicionalmente instrucciones para llevar a cabo los métodos en cuestión. Estas instrucciones pueden estar presentes en los kits en cuestión en una variedad de formas, una o más de las cuales puede estar presente en el kit. Una forma en la que pueden estar presentes estas instrucciones es una información impresa sobre un medio o un sustrato adecuado, por ejemplo, un trozo o trozos de papel sobre el que se ha impreso la información, en el envase del kit, en un prospecto, etc. Otro medio sería un medio legible por ordenador, por ejemplo, un disquete, un CD, etc., en el que se ha registrado la información. Otro medio más qué puede haber presente es una dirección de página web que puede usarse a través de internet para acceder a la información de un sitio eliminado. En los kits puede haber presente cualquier medio conveniente.
Los métodos analíticos descritos anteriormente pueden llevarse a cabo como un programa de instrucciones ejecutables por un ordenador para ejecutar los diferentes aspectos de la divulgación. Cualquiera de las técnicas descritas anteriormente puede llevarse a cabo mediante los componentes informáticos cargados en un ordenador o en otro aparato de información o dispositivo digital. Cuando se permita, el ordenador, el aparato o el dispositivo puede llevar a cabo después las técnicas descritas anteriormente para ayudar al análisis de los conjuntos de valores asociados con una pluralidad de genes de la forma descrita anteriormente, o para comparar dichos valores asociados. El componente del programa informático puede ser cargado desde un medio fijo o ser accesible a través de un medio de comunicación tal como internet u otro tipo de red de trabajo informática. Las características anteriores están representadas en uno o más programas informáticos pueden ser llevadas a cabo por uno o más ordenadores que ejecuten dichos programas.
EJEMPLOS
Los siguientes ejemplos se ofrecen a modo de ilustración y en modo alguno como limitación.
Ejemplo 1: análisis de la expresión génica en células individuales
Una fracción significativa de CSC murinas contiene unos niveles relativamente bajos de ROS y por lo tanto se elabora la hipótesis de que estas células pueden expresar unos niveles mayores de defensas frente a las ROS en comparación con sus homólogas NTC.
Análisis de la expresión génica de las células individuales. Para los experimentos de expresión génica de las células individuales usamos chips microfluidos de qPCR DynamicArray (Fluidigm). Se clasificaron células individuales MMTV-Wnt-1 enriquecidas en Thy1+ CD24+ Lin-CSC (TG) y "No Thy1+ CD24+ "Lin" no oncogénicas (NTG) mediante FACS en placas de 96 pocillos que contenían una mezcla de PCR (CellsDirect, Invitrogen) e inhibidor de RNasa (Superaseln, Invitrogen). Después de una lisis hipotónica añadimos las enzimas de la RT-qPCR (Superscript III RT / Platinum Taq, Invitrogen) y una mezcla que contenía un conjunto de ensayos a baja concentración (cebadores / sondas) para los genes de interés (Gclm- Mm00514996_m1, Gss-Mm00515065_m1, Foxo1-Mm00490672_m1, Foxo4- Mm00840140_g1, H ifla Mm00468875 ml, Epas1 - Mm00438717_ m1). La transcripción inversa (15 minutos a 50 ºC, 2 minutos de 95 ºC) fue seguida por una pre-amplificación durante 22 ciclos de PCR (cada ciclo: 15 s a 95 ºC, 4 minutos a 60 ºC). Los controles de ARN total se analizaron en paralelo. El ADNc amplificado resultante de cada una de las células se insertó en las entradas para muestras del chip con la mezcla qPCR para de Taqman (Applied Biosystems). Los ensayos individuales (cebadores / sondas) se insertaron en las entradas para muestras del chip (2 réplicas para cada uno). El chip se cargó durante una hora en un cargador de chips (Nanoflex, Fluidigm) y después se transfirió a un lector (Biomark, Fluidigm) para el termociclado y la cuantificación fluorescente. Para eliminar los ensayos génicos de baja calidad, desechamos los ensayos génicos cuyas curvas de qPCR no mostraron incrementos exponenciales. Para eliminar las células de baja calidad (por ejemplo, las células muertas) desechamos las células que expresaban los genes constitutivos Actb (beta-actina) y Hprt1 (fosforribosil transferasa 1 de hipoxantina guanina). Esto dio como resultado un conjunto de datos de la expresión génica de las células individuales que consisten en 248 células (109 oncogénicas y 139 no oncogénicas) a partir de un total de 7 análisis en chip. Se calculó una estadística de Kolmogorov-Smirnov (K-S) para dos muestras para comprobar si los genes eran expresados diferencialmente en las dos poblaciones. Generamos los valores de p mediante la permutación de los marcadores de las muestras (es decir, TG frente a NTG) y comparando la estadística real de K-S con la de la distribución nula procedente de la permutación. Los valores de p fueron adicionalmente corregidos mediante una corrección de Bonferroni para el ajuste de ensayos de hipótesis múltiples. EJEMPLO 2 Análisis y cuantificación de “células madre cancerosas colorrectales” humanas (Co-CSC) mediante el uso de una SINCE-PCR, un nuevo método basado en el “análisis de la expresión génica de las células individuales”.
imagen45
El método de SINCE-PCR permite la identificación, la caracterización y la cuantificación de "células madre cancerosas" en tejidos cancerosos colorrectales humanos, con un grado de pureza y resolución que no se había podido conseguir previamente. Las células madre cancerosas, que pueden ser células oncogénicas o iniciadoras de tumores, son una subpoblación de células cancerosas que pueden tener la capacidad de formar tumores cuando son trasplantadas en ratones inmunodeficientes. Las poblaciones de células madre cancerosas se han identificado actualmente en cánceres de mama, de cerebro, de cabeza y cuello, de páncreas y de colon. La definición y la cuantificación funcional precisas de las "células madre cancerosas" tienen muchas implicaciones importantes para el diagnóstico, el pronóstico, la clasificación y el abordaje terapéutico del cáncer en el ser humano.
Describimos un nuevo método para la identificación, el análisis y la cuantificación de "células madre cancerosas" en tejidos cancerosos colorrectales humanos, basado en un análisis de la expresión génica de las células individuales mediante una reacción en cadena de la polimerasa en tiempo real (PCR en tiempo real). Hemos identificado un nuevo conjunto de genes cuya expresión coordinada y diferencial puede usarse como una "firma" para identificar distintos subconjuntos de células cancerosas en el mismo tejido tumoral. Este nuevo subconjunto de genes incluye genes constitutivos comunes a todas las células epiteliales (EpCAM, beta-Actina, GAPDH), genes relacionados con la biología de las células Madre (hTERT, LGR5, Survivina) y genes implicados en las rutas de diferenciación específicas tisulares de las distintas estirpes celulares (Anhidrasa Carbónica II, MUC2, Factor 3 de la familia trébol) y estadios de diferenciación (Citoqueratina 20, CD66a / CEACAM1) del epitelio normal del colon. Tomando como base el patrón de expresión de este conjunto de genes, las células epiteliales purificadas a partir de tejidos cancerosos colorrectales humanos y analizadas individualmente como células individuales pueden ser "clasificadas" y agrupadas en distintos grupos, correspondientes a estadios de diferenciación más o menos avanzados (por ejemplo, células diferenciadas terminalmente en la parte superior de la cripta del colon humano frente a las células más inmaduras ubicadas en la parte inferior de la cripta del colon humano) y para distinguir las estirpes de diferenciación del epitelio del colon (por ejemplo, células caliciformes, enterocitos, células inmaduras). Cada grupo puede ser cuantificado como un porcentaje de la población total. Hemos denominado a esta metodología para el análisis de la composición celular de tejidos biológicos "SINCE-PCR" (expresión de células individuales - reacción en cadena de la polimerasa).
Nuestro descubrimiento se basa en varias observaciones. Las "células madre cancerosas colorrectales" humanas enriquecidas mediante una citometría de flujo recogidas directamente a partir de tejidos tumorales sólidos recién extirpados pueden ser analizadas de una forma reproducible y sólida a nivel de la célula individual (Figura 1).
En xenoinjertos de cáncer de colon humano, el análisis de la expresión génica de las células individuales mediante una PCR en tiempo real indica que ambas células cancerosas EpCAPW÷ / CD44+ y EpCAM-VCD166+, que se sabe que están enriquecidas en la población de "células madre de cáncer colorrectal", pueden subdividirse adicionalmente en diferentes subconjuntos celulares caracterizados por la expresión coordinada y diferencial de distintos grupos de genes implicados en la biología de las células madre y en los procesos de diferenciación. Lo más interesante es que los subconjuntos de células que muestran unos mayores niveles de genes que codifican para los marcadores conocidos de diferenciación terminal del epitelio del colon (por ejemplo, Citoqueratina 20, CD66a / CEACAM1 Anhidrasa Carbónica II, MUC2, Factor 3 de la familia trébol) no expresan, o expresan unos niveles menores, de los genes que codifican para los marcadores candidatos de células madre intestinales o los genes que se sabe que son necesarios para la función de las células madre (por ejemplo, hTERT, LGR5, Survivina) y viceversa. Esto sugiere que las células cancerosas EpCAM / CD44+ / CD166+ contienen unos subconjuntos celulares distintos caracterizados por diferentes estadios de diferenciación (Figura 2).
Cuando son purificadas mediante una clasificación de células activadas por fluorescencia (FACS) e inyectadas de nuevo en ratones inmunodeficientes NOD / SCID, las células CD44+ /CD66a+ y CD44+ / CD66anew1" muestran unas propiedades oncogénicas sustancialmente diferentes, comportándose la población CD44+ / CD66neglow como la dotada con la mayor capacidad oncogénica (Tabla 4). Esto indica que, dentro de la población de células EpCAM+ / CD44+, los subconjuntos de células que están caracterizados por unos mayores niveles de expresión de los genes que codifican para marcadores de diferenciación tales como los CD66a / CEACAMI (es decir, un subconjunto de células más "maduras") está frecuentemente relativamente desprovisto de capacidad oncogénica. Por otro lado, el subconjunto de células que está caracterizado por la ausencia o por unos bajos niveles de expresión de marcadores de diferenciación tales como CD66a / CEACAMI (es decir, el subconjunto de células más "inmaduras") está enriquecido en su contenido de "células madre de cáncer colorrectal".
imagen46
Tabla 4. Propiedades oncogénicas de las células cancerosas de colon humano basándose en la expresión de CD66a / CEACAMI, en combinación con EpCAM y/o CD44.
a Dosis de Muestra de Código de
Exp. Fuente del tumor Poblaciones clasificadas como Linneg b c
células tumor experimento
1)
UM#4 m4 CD44neg CD44+ / CD66a+ CD44+ / CD66aneg-low 10.000 450 250 2 / 10 1 / 3 2 / 3 PD69
2)
UM#4 m6 CD44neg CD44+ / CD66a+ CD44+ / CD66aneg-low 10.000 500 1.000 1 / 5 0 / 2 3 / 3 PD85
3)
UM#4 m4 CD44neg CD44+ / CD66a+ CD44+ / CD66aneg-low 10.000 1.000 1.000 0 / 5 0 / 1 3 / 4 PD 107
4)
SU29 m1 CD44neg CD44+ / CD66a+ CD44+ / CD66aneg-low 7.000 1.000 2.000 1.000 0 / 5 0 / 5 1 / 5 0 / 5 PD88
5)
SU43 primario EpCAM+ / CD44neg EpCAM+ / CD44+ / CD66a+ EpCAM+ / CD44+ / CD66aneg-low 12.000 300 1.000 0 / 5 0 / 1 1 / 3 PD79
10
a Para cada experimento, el pase sucesivo in vivo del xenoinjerto tumoral usado como fuente para la purificación de las células cancerosas se indica como sigue: m1 indica la primera ronda de tumores obtenida a partir del injerto del tumor primario, m2 la segunda ronda de tumores obtenida a partir del injerto de m1, m3 la tercera ronda de tumores obtenida a partir del injerto de m2 y así sucesivamente de forma progresiva; primario indica un tumor primario, que 15 se recogió directamente a partir de una muestra quirúrgica. b Todas las poblaciones clasificadas deben ser consideradas negativas para los marcadores de estirpe (Linneg), que incluyen CD45 de ratón y H2-Kd de ratón en el caso de xenoinjertos tumorales humanos establecidos en ratones NOD / SCID, y CD3 y CD45 humanos en el caso de tumores primarios humanos (en este caso el EpCAM sirve como un marcador positivo de selección epitelial). c La muestra de tumor se indica como: número de tumores obtenidos / número de inyecciones; la muestra de tumor no se
20 considera satisfactoria cuando no hay masa tumoral visible después de 5 meses de seguimiento.
Ejemplo 2: generación y obtención de imágenes de modelos de xenoinjerto de cáncer de mama humano con metástasis pulmonares.
Se trasplantaron ortotópicamente muestras de cáncer de mama procedentes de pacientes (fragmentos o TIC) en las almohadillas grasas mamarias de ratones NOD-SCID. Se generaron seis modelos de xenoinjerto tumoral (1 ER+, 1
25 Fler2+ y 4 triples negativos ER-PR-Her2-). Los cuatro xenoinjertos triples negativos desarrollaron micrometástasis pulmonares espontáneas, demostradas mediante tinciones de IHC, es decir, H&E, tinciones del marcador de proliferación Ki67 y de Vimentina (Vim). Estos datos sugirieron que tras la implantación en ratones inmunodeficientes, las células tumorales de mama o TIC son capaces de adaptarse al microambiente del ratón y reiniciar el crecimiento y la progresión tumoral humana con metástasis tumorales espontáneas.
imagen47
Para facilitar la obtención de imágenes dinámicas y semicuantitativas del cáncer de mama humano y de la metástasis en ratones, se transdujeron las TIC de mama con un gen de fusión de luciferasa de luciérnaga-EGFP a través del lentivirus pHRuKFG (moi 50). 4 días después del implante, las TIC del sitio primario eran detectables con unas débiles señales bioluminiscentes. Y un mes después, tanto los tumores primarios (en las almohadillas grasas mamarias L4 y R2) como las metástasis de pulmón fueron detectados y visualizados mediante un sistema Xenogen IVIS 200 en el Small Animal Imaging Center de Stanford. Observamos que el tamaño del tumor o el número de células se correlacionaba bien con la intensidad de la señal. La generación y la visualización bioluminiscentes de los tumores del xenoinjerto con metástasis nos proporcionan la posibilidad de validar las funciones de los miARN en MTIC de cáncer de mama humano in vivo en esta propuesta.
Ejemplo 3: análisis en micromatriz y mediante una PCR en tiempo real de las MTIC de mama humanas
Se aislaron las células iniciadoras de los tumores primarios de cáncer de mama (TIC) o TIC metastásicas (MTIC) (estirpe CD44+ CD244I' ESA+) a partir del sitio primario del cáncer de mama o de derrames pleurales. Una vez detectadas las metástasis pulmonares en los modelos de xenoinjerto, se disociaron los pulmones con blenzima (Roche) las células se tiñeron con H2K de ratón y CD44, CD24 y ESA humanas para purificar las poblaciones de MTIC (CD44+ CD2441" ESA+ H2K-, Figura 3 a), que producen tumores ortotópicos en una proporción de 5 / 8 por 200 - 1.000 células clasificadas, después de ser trasplantadas en las almohadillas grasas mamarias de ratón.
Se ha demostrado mediante un análisis en micromatriz y una PCR en tiempo real que los genes objetivo regulados HIF1a y HIF1 fueron expresados diferencialmente en las MTIC en comparación con las células tumorales no oncogénicas, incluyendo Snail, Zeb2, Vimentina, E-cadherina, Lox, Cox2, VEGF, etc. (Figura 3 B). Se confirmó la localización conjunta de HIF1a, Vimentina y CD44 mediante una tinción inmunohistoquímica.
Ejemplo 4: análisis del microARN
Mediante un cribado del microARN se identificaron los perfiles de expresión diferencial de las células madre de cáncer de mama parentales y de las células cancerosas metastásicas de los pulmones. Por ejemplo, una mayor expresión de miR-10a y unos niveles menores de miR-490, miR-199a, etc. en las MTIC de pulmón que los de las TIC de mama primarios. Según se muestra mediante una PCR en tiempo real por triplicado en la Figura 4, la comparación de los valores medios de CT de las MTIC de pulmón frente a las TIC primarias: miR-10a (-7,9), miR490 (+3,0) y miR-199a (+12,9). Se usó NR3 como control interno. Los datos indicaban que el miR-10a estaba regulado por aumento hasta 27'9 veces y el miR-199a regulado por disminución 212-9 veces en las MTIC con respecto a las TIC primarias de cáncer de mama.
Ejemplo 5: el CD66a como marcador de las células cancerosas no oncogénicas de cáncer de mama
Las células de cáncer de mama se clasificaron basándose en el CD44 y el CD66a mientras que la mayoría de las células eran CD244bw. Después, las células se implantaron en las almohadillas grasas mamarias de ratones NOD / SCID y se monitorizó el crecimiento del tumor. Las células CD44 / CD66a- mostraron un mayor índice de transplante, así como una mayor tasa de crecimiento mediante una visualización bioluminiscente según se muestra en la Figura 5. Las células CD66+ mostraron un índice menor y más retrasado en el crecimiento tumoral, el tamaño del tumor era mucho menor y mostraron unos perfiles de fluidez muy similares en comparación con los tumores derivados de CD66-.
En la Figura 5 a, se mostró el perfil de fluidez basándose en los marcadores CD44 y CD66a. Las células CD66-CD44+ y CD66-CD44+ fueron clasificadas para los ensayos oncogénicos in vivo (100 células o 1.000 células implantadas a Zid o en 41h de las almohadillas grasas mamarias de ratones NOD / SLID). Como indicaba 10 b, 5 de los 8 implantes de 100 células CD66-produjeron tumores, mientras que 2 de los 8 de 100 células CD66+ crecieron. Para 1.000 células, 8 de las 8 procedentes de las inyecciones de células CD66-crecieron, pero únicamente 3 de las 8 de las células CD66+ produjeron tumores. Comparando el índice de crecimiento de los tumores palpables, las células CD66+ tenían unos tamaños mucho menores y pequeños que los obtenidos a partir de las células CD66(Figura 5 c). En la Figura 5 d, se infectaron 100K de células CD66- CD44+ o CD66+ CD44+ con lentivirus de luciferasa de luciérnaga-EGFP antes de la inyección. Las señales bioluminiscentes de las células CD66+ eran mayores que las de las células CD66- desde el principio (día 13). Pero después de 1 mes o de 2 meses, las células CD66- mostraron unas señales bioluminiscentes dominantes y al final formaron tumores palpables (día 68).
Ejemplo 6: optimización de la lista de genes usada para la identificación y la medición de la frecuencia de las células madre cancerosas
La mayoría de los marcadores usados actualmente para la identificación tanto de las células madre normales como de las células madre cancerosas no están relacionados con una función esencial de la célula madre. Su expresión está relacionada con el microentorno particular en el que reside la célula madre en el momento de su aislamiento. Por lo tanto, la utilidad de los marcadores comunes que se usan para la identificación de las células madre puede variar dependiendo del sitio a partir del cual son recogidas.
Nuestra metodología ha sido para la identificación de los marcadores de las funciones críticas de las células madre. Dado que la autorrenovación es la propiedad por excelencia de la célula madre, hemos centrado nuestros esfuerzos en rutas renovadas. Hemos identificado múltiples genes que son muy expresados por las HSC normales, por las células madre leucémicas que proceden de células progenitoras y por las células madre cancerosas epiteliales humanas, pero no por las células no autorrenovables en cada respectivo tejido. Este análisis genómico descrito en los resultados preliminares identificó varios genes que habían sido previamente relacionados con la autorrenovación de las células madre. De forma análoga, identificamos microARN candidatos que son expresados diferencialmente por las células madre cancerosas de mama y por las células cancerosas no oncogénicas. Las pruebas demuestran que muchos de estos genes y microARN tienen funciones críticas en las células madre, y que la función de estos genes también es crítica para la autorrenovación y el mantenimiento de las hESC y de las iPSC.
imagen48
Para producir un dispositivo capaz de medir la frecuencia de las células madre cancerosas en una población de células tumorales es deseable optimizar la lista de genes usada para la identificación de las células madre cancerosas. Según se muestra en la Figura 1 B, hemos realizado grandes progresos al hacerlo, identificando la telomerasa como marcador de una célula cancerosa, así como varios genes relacionados con el proceso de autorrenovación. El componente TERT de la telomerasa solo es expresado en las células de cáncer de colon con un fenotipo inmaduro. Además, el TERT no es eficientemente regulado por disminución durante la diferenciación de algunas líneas de hESC y de iPSC.
Se analizan las células epiteliales de cáncer de colon tanto normales como cancerosas para comprobar la expresión de los genes relacionados con la maduración de las células de la cripta y la autorrenovación. La lista de genes de autorrenovación es expandida más allá del TERT para maximizar la confianza en que la célula sea una célula madre. Se mide la expresión de los genes identificados en nuestro análisis de las células madre normales y de las cancerosas. Debido a que las células madre cancerosas pueden surgir a partir de potencialmente cualquier célula madre que haya escapado a las restricciones en la expansión, o a partir de células progenitoras que han escapado a los mecanismos de recuento que limitan el número de mitosis que pueden experimentar, los genes candidatos son aquellos que son expresados por las HSC murinas normales, las células madre de leucemia murinas que derivaban de una célula progenitora y las células madre cancerosas de cáncer de mama. Los genes candidato más importantes identificados en la lista, todos los cuales han sido relacionados con el mantenimiento de las células madre, incluyen BMI1, -IDI, IGFBP3, los miembros de la familia HOX HOXA3, HOXA5, MEIS1, ETS1, ETS2, RUNX2 y STAT3. Comprobaremos cuál de estos genes está relacionado con la autorrenovación de las células cancerosas. Para hacerlo, ensayaremos sistemáticamente nuestros genes candidatos para comprobar su papel en la autorrenovación de las células madre cancerosas mediante el uso de técnicas in vitro e in vivo.
La expresión de los genes que regulan la autorrenovación está relacionada con la expresión de genes específicos de las células epiteliales, incluyendo los marcadores de maduración, tales como las queratinas y las mucinas intestinales. Esto permitirá averiguar si una célula del análisis no es una célula normal que esté contaminando la biopsia. Las mutaciones de los genes supresores tumorales cuya expresión está regulada por disminución por el gen de autorrenovación BMI I permiten la autorrenovación de las células progenitoras tempranas. Estos genes se encuentran habitualmente mutados en el cáncer de colon, por lo que se producirá la autorrenovación de las células madre cancerosas de color a partir tanto de las células madre normales como de las células progenitoras de colon tempranas. Adicionalmente, las mutaciones oncogénicas alterarán la expresión génica por parte de las células de cáncer de colon. Por lo tanto, puede haber diferencias en la expresión de al menos algunos genes relacionados con la maduración temprana de las células de la cripta entre las células madre epiteliales de colon normales y su homólogo maligno, que hará posible distinguir entre estas 2 poblaciones de células autorrenovables entre sí.
Hemos identificado 37 miARN que eran expresados diferencialmente en las células madre cancerosas y en las células cancerosas no oncogénicas. Varios grupos de miARN estaban regulados por disminución en las células madre del tejido normal pero no en las células madre cancerosas; además, la expresión de algunos miARN, tales como el miR-20c y el miR-183 suprimió el crecimiento in vitro de las células de carcinoma embrionarias, anuló su capacidad de formación de tumores in vivo e inhibió la clonogenicidad de las células de cáncer de mama in vitro. Se identificaron estos miARN y los otros grupos, proporcionando una conexión molecular que relaciona la biología de las células madre cancerosas de mama y la de las células madre normales. La expresión de estos microARN; que fueron coherentemente regulados por aumento, corroborada por la disminución en las células oncogénicas, se comprueba en las células individuales procedentes de hESC y de iPSC no diferenciadas y diferenciadas. Esencialmente, las células no diferenciadas son clasificadas por los marcadores de la superficie celular distintos a los de las células madre pluripotenciales, tales como los subtipos Tra y SSEA, y se evalúa la expresión del miARN, la eficacia de reposición y los parámetros de la población in vivo (resultado de los ensayos de teratoma en términos de carcinoma embrionario, carcinoma embrionario mixto / índice de células diferenciadas (% de EC frente a diferenciadas), y células diferenciadas). Las poblaciones de células madre diferenciadas se obtienen mediante la producción de cuerpos embrionarios y se clasifican a través de una selección positiva y negativa para los marcadores SSENTRA, después de 28 días de diferenciación. Examinaremos las células individuales de las poblaciones clasificadas para comprobar: 1) los perfiles de los microARN indicativos de células madre cancerosas 2) el perfil de expresión génica (más abajo) y 3) los resultados de los ensayos de transplante / teratoma. Esperamos que las células "resistentes a la diferenciación" de estas poblaciones formen derivados de carcinoma embrionario maligno y expresen conjuntamente los marcadores de las células diferenciadas y no diferenciadas en las células individuales.
imagen49
Ejemplo 7: perfil de expresión génica a nivel de la célula individual
En las poblaciones de células pluripotentes, incluso después de una diferenciación durante 21 días, observamos líneas que no consiguen regular por disminución los marcadores clave de oncogenia TERT (véase la Figura 6). Además, hemos observado que aproximadamente el 50 % de nuestras líneas iPSC no consiguen regular por disminución los marcadores de pluripotencia tanto exógenos como endógenos, en el estado diferenciado. Esencialmente, esto sugiere una "guerra molecular" entre la diferenciación y la autorrenovación de la que podemos predecir un resultado de tendencia a oncogenia. Optimizaremos la lista de genes para la identificación de las células malignas en cultivos celulares de hESC y de iPSC mediante: 1) el ensayo de los genes sobreexpresados en las células EC (de carcinoma embrionario) con respecto a las hESC y las IPSC no diferenciadas y los blastómeros embrionarios humanos, 2) la referencia cruzada de la lista de genes para incluir a aquellos de Aim 1 (para la identificación de las células madre cancerosas) y 3) la adición de los genes de estirpes celulares diferenciadas somáticas y germinales (los últimos permanecen en células madre pluripotentes resistentes a la diferenciación). Después usaremos ensayos en ratones inmunodeficientes para evaluar el potencial oncogénico de las subpoblaciones diagnosticadas de acuerdo con el potencial de malignidad basándonos en la expresión génica basal de las células individuales.
Análisis de las CNV. Las variantes cromosómicas están relacionadas con la inestabilidad en las poblaciones de células madre humanas pluripotentes, observándose frecuentemente una pérdida y una ganancia de cromosomas. Sin embargo, pocos estudios han abordado métodos de alto rendimiento con una estructura más afinada para evaluar el número de copias en múltiples loci. Proponemos adaptar nuestra tecnología para la evaluación de las CNV en todo el genoma de las líneas celulares madre pluripotentes derivadas independientemente; los cambios en las CNV reflejarán una inestabilidad subcromosómica. Inicialmente podemos diseñar conjuntos de sondas específicos para añadirlos a nuestra lista de genes / loci que reconozcan duplicaciones a lo largo del genoma, incluyendo las observadas previamente en nuestro laboratorio (Figura 6). El SCAD puede acomodar análisis de hasta 1.000 marcadores en su diseño inicial. Los ensayos de las CNV están disponibles en el mercado y pueden ser correlacionados por la inestabilidad genómica en las hESCsIiPSCs.
Ejemplo 8: diseño de un dispositivo automatizado para la identificación y la cuantificación de las células madre cancerosas
Se diseña un dispositivo automatizado para la identificación de las células madre cancerosas y para calcular su frecuencia en los tumores basándose en una combinación del fenotipo de la superficie celular y la expresión génica. El uso de los análisis de los marcadores / genéticos optimizados descritos en el presente documento, se usó una estrategia similar para la identificación de las células con un potencial maligno, basándose en la expresión conjunta de los marcadores del estado diferenciado y no diferenciado en las células individuales. Este dispositivo elaborará una suspensión de células individuales de cuerpos embrionarios o de biopsias por punción de un tumor, aislará las subpoblaciones de células (epiteliales, diferenciadas, no diferenciadas) y después realizará una qRT-PCR de cientos de miles de células individuales y medirá el contenido en células madre de un tumor o de un cultivo de células pluripotentes. Dicho dispositivo totalmente automatizado eliminará las etapas de trabajo intenso necesarias actualmente para la clasificación mediante citometría de flujo de las células madre cancerosas y proporcionará una verdadera herramienta diagnóstica automática a pie de cama que necesitará menos de 100.000 células para aislar las suficientes células cancerosas para los ensayos mediante PCR para la cuantificación de las células madre cancerosas. El funcionamiento automatizado, la eficacia y el bajo coste asociado con la tecnología de los chips microfluidos harán posible unos rápidos diagnósticos genéticos individualizados.
En el corazón de este sistema hay un clasificador celular microfluido. Este dispositivo aísla las células vivas (las células epiteliales o las células pluripotentes cultivadas, o sus productos) de los desechos (las células necróticas y otras partículas), clasifica las células a partir de la suspensión de células individuales mediante el uso de las señales fluorescentes de hasta cinco marcadores de superficie diferentes, y las coloca en receptáculos individuales para los subsiguientes estudios genéticos.
En el sistema pueden incorporarse otras etapas previas tales como la digestión del tumor o del cultivo celular para obtener una suspensión de células, y la tinción de las células con marcadores de superficie fluorescentes. A continuación se ilustra cómo se usa el sistema para el análisis de tumores: una vez obtenida la biopsia, el médico colocará la muestra en el puerto de entrada de este sistema. Utilizando una interfaz informática sencilla, el médico establecerá los parámetros necesarios para la clasificación y el análisis genético, tal como el número y el tipo de marcadores de superficie, el número de ciclos necesarios de la PCR etc., y la máquina llevará a cabo el resto de las etapas sin intervención humana. Tomando como base las tecnologías demostradas previamente, el sistema proporcionará un rendimiento de clasificación de al menos 30 células/segundo.
Un dispositivo de análisis de células individuales (SCAD) puede ser modular (Fig. 7) y realizará las siguientes etapas de una forma integrada totalmente automatizada: 1) Digestión del tejido: el tejido se coloca en el puerto de entrada del dispositivo. Se introducen las enzimas apropiadas en el dispositivo y se hacen fluir para llevar a cabo la digestión de la matriz extracelular con objeto de obtener una suspensión de células. 2) Separación de las células vivas de los desechos: la suspensión contiene normalmente células vivas con un tamaño medio de entre 10 y 15 micrómetros y materiales de desecho con un tamaño medio de alrededor de 5 micrómetros. La cantidad de material muerto es a menudo relativamente alta en comparación con la de células vivas, por lo tanto es crítico eliminar por filtración el material muerto para un aislamiento eficiente de las células. Realizamos esto haciendo fluir la suspensión de tejido digerido a través de un “metamaterial” microfluido, que permite la división del flujo fluido de acuerdo con el tamaño de las partículas. 3) Tinción: la suspensión de células individuales filtrada se tiñe mediante el uso de los marcadores de superficie apropiados en un compartimento diferente del dispositivo microfluido. La tinción con hasta cinco marcadores diferentes puede ser útil para obtener una población de células cancerosas de elevada pureza. 4) Clasificación: la suspensión de células individuales teñidas se hace fluir al siguiente compartimento del dispositivo fluido para separar las células cancerosas del resto de las células. La estadística de Poisson y las simulaciones de Monte Carlo indican que solo se necesitan clasificar 2.000 - 20.000 células cancerosas con objeto de ser capaces de detectar unos cambios de dos veces en las en células madre cancerosas, con un nivel de confianza del 99 %. Dicho pequeño número de células actualmente no puede ser clasificado eficientemente mediante el uso de una citometría de flujo, ya que el tamaño de muestra inicial necesario para la FACS es de aproximadamente un millón de células. Conseguiremos esto mediante el uso de una clasificación microfluida para realizar ciclos indefinidos de la suspensión de células en un entorno hermético aislado de pequeño volumen que no desperdiciará las células.
imagen50
Clasificador celular microfluido basado en flujo: se ha mostrado un clasificador celular microfluido con un rendimiento de aproximadamente 50 células/segundo, en el que las células se hicieron fluir a alta velocidad a través de un haz de láser (véase Di Carlo et al. Lab Chip 2006; 6: 1445 -1449) y la luz dispersada fue detectada y analizada. Un equipo de obtención de imágenes electrónico más rápido y más eficiente permite una mejora del rendimiento de un orden de magnitud, que reducirá el tiempo de clasificación hasta menos de diez minutos.
Clasificación paralela: se está desarrollando un clasificador celular basado en la captura de células en una densa matriz bidimensional de cámaras microfluidas que pueden ser abordadas individualmente (Figuras 7 B y 7 C anteriores). Las células se hacen fluir hacia la matriz del clasificador y son capturadas por cestas microfabricadas. Previamente se demostró que dichas cestas tienen una eficacia de captura de células individuales mayor del 50 % en una suspensión que fluye libremente (Di carlo et al, supra). Una vez llenadas todas las cestas, se cierran las válvulas microfluidas y se obtiene una imagen de la matriz mediante el uso de una óptica controlada por ordenador diseñada de forma personalizada en los 5 colores fluorescentes necesarios para la identificación de las células oncogénicas. Este nuevo chip también permite la obtención de imágenes por contraste de fases, que puede resultar útil para el estudio de la morfología celular. Las células oncogénicas identificadas se hacen fluir hacia el siguiente módulo para su lisis, mientras el resto de las células se hacen fluir hacia fuera del chip. Este nuevo clasificador celular permite trabajar con un número inicial de células extremadamente pequeño, ya que las células pueden someterse a muchos ciclos, y por lo tanto no se desperdiciarán. La actual tecnología de chip microfluido nos permite colocar aproximadamente 10.000 de estos elementos en un área de 3 x 3 cm, que pueden ser rápidamente interrogados (de una vez) mediante el uso de los generadores de imágenes del estado de la técnica, tales como el usado por el sistema Fluidigm Biomark. Este clasificador celular tendrá un rendimiento de aproximadamente 30 células/segundo. Una ventaja del uso del sistema de clasificación paralela, por oposición al clasificador celular fluido, es que la obtención de imágenes durante la clasificación y la PCR puede ser realizada por el mismo generador de imágenes, permitiendo así relacionar los datos de fluorescencia y de morfología con los datos genéticos de las células individuales.
Lisis celular y captura del ARNm: las células madre cancerosas clasificadas se hacen fluir al siguiente módulo para su lisis en cámaras individuales. Dos ARNm pueden ser capturados sobre una columna de microesferas de oligo-dT, retrotranscritos sobre las microesferas como ya se ha mostrado (Marcus et al. Anal Chem 2006; 78: 3084 - 3089) y procesados fuera del chip a través de un nuevo protocolo de secuenciación génica desarrollado por el Heliscopio, o puede ser transferido a un pocillo macroscópico (en un intervalo de microlitros) y mezclarse con: reactivos para la preamplificación de un conjunto de genes siguiendo los protocolos actuales. Las muestras preamplificadas son transferidas a un módulo similar al chip de matriz Fluidigm Dynamic para la qRT-PCR y la determinación del contenido real en células madre cancerosas.
Tomando como base un análisis de células de mama normales y células madre sanguíneas, así como células madre cancerosas de colon, de cabeza y cuello y de mama, hemos identificado un nuevo ensayo de células individuales que por primera vez hace posible identificar de forma precisa e inequívoca, y contar, las células madre cancerosas en muestras de, y en poblaciones de, células madre pluripotentes cultivadas. Como prueba de principio, aplicamos este ensayo a un análisis de células de cáncer de colon individuales. Para hacerlo usamos una FACS para la clasificación de las células de cáncer de colon de la estirpe CD66+ CD44 a partir de xenoinjertos de paso temprano establecidos a partir de 2 pacientes diferentes. Estos marcadores permiten un enriquecimiento de aproximadamente 3 -5 veces en células madre cancerosas de colon (CoCSC) en un tumor. Hemos sospechado que las células cancerosas aisladas con estos marcadores estaban solo parcialmente enriquecidas en las CoCSC. Los análisis de la expresión génica de las células individuales y los posteriores estudios de oncogenia demostraron que de hecho las células de la estirpe CD66+ CD44+ son una mezcla de CoCSC y de células no oncogénicas, y que este ensayo puede ser usado para identificar de forma más precisa la frecuencia de las CoCSC en una muestra de biopsia. El análisis de las células individuales revela una estructura de desarrollo jerárquica en las células de cáncer de colon que es reminiscente de una cripta de colon normal. Notablemente, averiguamos que la mayoría de las células inmaduras del tumor de colon expresan el TERT, un componente del complejo de la telomerasa que es crítico para el mantenimiento a largo plazo de un tumor. La expresión del LGR5, que marca las células madre de colon normales, también está limitada a las células inmaduras. Por el contrario, los genes expresados por las células de la cripta de colon en maduración, incluyendo MUC2, 'CK20, CA-2 y especialmente CD66a, eran expresados por las células que no expresan conjuntamente los marcadores de las células inmaduras, muy notablemente el TERT. Esto sugiere que estas células, al igual que las células normales de la cripta epitelial en maduración, tienen unas limitaciones en su capacidad para experimentar amplias mitosis. De hecho, hemos trasplantado células de cáncer de colon CD66a+ (células de cáncer de colon diferenciadas) y CD66a"' en ratones inmunodeficientes. Las células CD66a' formaron tumores (5 de las 6 inyecciones) mientras que las células CD66+ no lo hicieron (0 de las 5 inyecciones). De forma análoga, en 2 tumores de cáncer de mama humanos que fueron ensayados, las células CD66ew estaban enriquecidas en células madre cancerosas cuando se ensayaron en el modelo de ratón inmunodeficiente. Estos resultados demuestran que los análisis de la expresión génica de las células individuales permiten la identificación y la cuantificación de las células madre cancerosas en biopsias y en cultivos.
imagen51
Ejemplo 9: una firma de expresión génica compartida por las células madre normales y las células madre cancerosas, tanto en sangre como en tejidos epiteliales de mama
En los últimos años se ha hecho evidente que las células madre cancerosas pueden surgir a partir de diferentes compartimentos celulares. Lo más probable es que surjan de una célula madre mutante que ha perdido las restricciones sobre: la expansión del grupo de células madre. Otras surgen a partir de una célula progenitora temprana más diferenciada que ha perdido el mecanismo de recuento que restringe normalmente el número de mitosis que puede experimentar. Por supuesto, muchos de los marcadores de las células cancerosas o leucémicas que surgen a partir de una célula madre o de una célula progenitora son diferentes. Independientemente del origen de la célula, sin embargo, las células madre conservarán su capacidad de autorrenovación. Hemos razonando que es probable que algunas de las rutas que regulan la autorrenovación en las células madre cancerosas que surgen a partir del compartimento de células madre o de una progenie parcialmente diferenciada, son compartidas entre sí y con las HSC normales. Para comprobar esta hipótesis analizamos si los genes expresados por las HSC normales de ratón y las células madre leucémicas murinas que surgen a partir de las células progenitoras (es decir, poblaciones con autorrenovación), pero no de las células progenitoras normales (es decir, poblaciones que no tienen autorrenovación) también son expresados por las células madre cancerosas de mama humanas pero no por sus equivalentes no oncogénicos.
Notablemente, las células madre cancerosas humanas, pero no sus equivalentes no oncogénicos, sobreexpresan estos genes (Fig. 8). También hemos generado otras 2 listas de genes para la identificación de otros potenciales candidatos: i) los genes expresados por las células madre cancerosas de mama y las células madre de mama normales, pero no por las células cancerosas no oncogénicas ni por las células progenitoras epiteliales de mama maduras, ii) los genes expresados por las HSC normales humanas y por las células madre cancerosas de mama humanas, pero no por las células progenitoras sanguíneas humanas ni por las células de mama no oncogénicas. Muchos de estos genes se han relacionado con la autorrenovación y el cáncer.
Éstos incluyen el compañero de unión del factor de crecimiento insulinoide IGFBP3, los miembros de la familia HOX HOXA3, HOXA5, ME1S1, así como factores de transcripción tales como ETS1, ETS2, RUNX2 y STAT3. Se ensayó si el factor de transcripción STAT3 es un regulador fiable de la célula madre cancerosa. El STAT3 juega un papel en el mantenimiento tanto de las células ES como de las HSC. El análisis genómico de células madre cancerosas tanto de ratón como de mama humanas reveló que muchos transcritos activados por el STAT3 eran sobreexpresados por las células madre cancerosas. A continuación, cuando examinamos el análisis inmunohistoquímico de los tumores de mama, las células positivas para el STAT3 tendían a estar concentradas en el borde invasivo del cáncer, y no se observaba la proteína en las células que parecían más diferenciadas en las partes interiores de los tumores. Finalmente, existen inhibidores de molécula pequeña del STAT3. Dichos inhibidores pueden ser ensayados en modelos de células madre cancerosas. Se ensayó el efecto del inhibidor del STAT3 cucurbitacina sobre la capacidad clonogénica de las células madre cancerosas de mama murinas. En resumen, una exposición de 24 horas al inhibidor redujo el número de colonias en un ~ 50 % (p < 0,02, prueba de la t). Estos resultados sugieren que el STAT3 juega un papel crítico en al menos algunas células madre cancerosas de mama.
Un segundo gen de interés es el MEIS1. El MEIS1 es expresado preferentemente por las células madre normales sanguíneas y de mama, por las células madre leucémicas y por las células madre de mama cancerosas. Los estudios genéticos han demostrado que la expresión del MEIS1 es absolutamente necesaria para la autorrenovación y el mantenimiento de las células madre sanguíneas normales y de sus equivalentes leucémicos. El MEIS1 puede regular la renovación de las células madre de cáncer de mama.
Algunos genes candidatos particularmente interesantes expresados por las células madre tanto normales como cancerosas incluyen CAV1, GAS1, MAP4K4 (cinasa), MYLK (cinasa), PTK2 (cinasa), DAPK1 (cinasa), LATS (cinasa), FOSL2, AKT3 (cinasa), PTPRC (fosfatasa de tirosina), MAFF (oncogén), RRAS2 (relacionado con el RAS), NFKB, ROBO1, IL6ST (actívate el STAT3), CR1M1, PLS3, SOX2, CXCL14, ETS1, ETS2, MEIS1 y STAT3, así como CD47. Algunos genes candidatos interesantes sobre expresados por las células madre cancerosas pero no por las células madre normales incluyen RGS4, CAV2, MAF (oncogén) WT1 (oncogén), SNAI2, FGFR2, MEIS2, 101, 103, ID4 y FOXC1.
imagen52
En este ejemplo buscamos usar el análisis del transcriptoma de células hematopoyéticas. En la Figura 9 se muestra un esquema general de esta forma de realización. En el presente ejemplo se aísla una población de células sospechosas de comprender células madre hematopoyéticas a partir de un sujeto de prueba. Después las células se preparan para un análisis mediante FACS exponiendo la población de células a anticuerpos fluorescentes contra los marcadores madre hematopoyéticos conocidos (por ejemplo, CD34, Thy1, etc.). Las células se clasifican en placas de 96 pocillos, de forma que cada pocillo no contenga más de una célula individual.
Las células individuales aisladas se lisan, y los lisados se dividen en dos porciones. La primera porción se somete a un análisis de la expresión génica de las células individuales mediante una PCR en tiempo real, esencialmente como se describe en el Ejemplo 1, mediante el uso de una selección de genes que permiten distinguir entre las HSC y las no HSC, ya sea por el nivel o por la presencia de expresión (por ejemplo, CD34+, CD 19-, CD 17-). Después de identificar las HSC en la población, se agrupan los listados procedentes de las células individuales identificadas como HSC. Se crea una biblioteca de ADNc mediante la amplificación del ARNm total mediante el uso de los métodos habituales. Después se secuencia el ADNc mediante el uso de un método de “siguiente generación”, tal como cualquiera de los descritos en el presente documento. El transcriptoma secuenciado se analiza después para determinar si hay presentes genes únicos y/o marcadores de superficie.
Después de la identificación de un marcador de superficie único de las HSC, se preparan anticuerpos que se unan específicamente a los marcadores de superficie mediante las técnicas disponibles comercialmente. Se confirman la especificidad y la eficacia de los anticuerpos (por ejemplo, la unión a una proteína aislada y/o recombinante). Después los anticuerpos se marcan con una fracción fluorescente. Entonces puede llevarse a cabo la clasificación y/o el análisis mediante FACS en otras poblaciones de células (por ejemplo, de los mismos sujetos o de sujetos diferentes) mediante el uso de los anticuerpos contra los recién descubiertos antígenos de superficie.
Ejemplo 11. Análisis de células oncogénicas
Se realizó un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen al ESA para la clasificación inicial mediante FACS. Se obtuvieron células oncogénicas a partir de un tumor de colon. Se llevaron a cabo dos análisis en chip, hm _1L y hm _1R (Fig. 11). Estos análisis en chip se prepararon bien como réplicas preamplificadas o bien como réplicas sobre el chip. En la Figura 12 se ilustra un mapa térmico combinado. De las 84 células ensayadas, se desecharon 9 células que no expresan los genes constitutivos y se seleccionaron 75 células para un análisis adicional (Fig. 13). Se realizó el agrupamiento jerárquico y en la Figura 14 se muestra una ilustración representativa de los resultados. El agrupamiento jerárquico para los genes seleccionados se ilustra en la Figura 15. Se realizó un agrupamiento jerárquico mediante el uso de las medias de k para los genes seleccionados, y los resultados se ilustran en la Figura
16. En estos experimentos de agrupamiento, se identificó la expresión antagonista de TCF4 y de TCF3 (Fig. 17). Por ejemplo, cuando se expresa el marcador epitelial de colon diferenciado terminalmente CK20, la expresión de TCF3 era mayor que la expresión de TCF4. Por el contrario, cuando se expresa un marcador candidato de célula madre LGR5, la expresión de TCF4 era mayor que la expresión de TCF3.
Ejemplo 12. Análisis estándar con transcripción inversa, amplificación mediante múltiples PCR y qPCR en chips M48
Se preparó ARN total a 7 diluciones diferentes que variaban desde una dilución de 10 veces hasta una dilución de 107 veces con un intervalo logarítmico. Después, las muestras diluidas se retrotranscribieron y se preamplificaron, se mezclaron con 96 conjuntos de cebadores (ensayos de expresión génica Taqman, elaborados por ABI Biosystems). Los experimentos se prepararon para 6 réplicas por dilución. Los ADNc de la preamplificación se cuantificaron después mediante el uso de dos chips M48. En la Figura 18 A se ilustra un mapa térmico representativo de varias diluciones y el control negativo. La linealidad de la amplificación es demostrada por la amplificación lineal de los genes seleccionados tales como ACTB, ARL5A, C13ORF15, CDKN1A, GNAI1, IGFBP4, KRT17, LABM3, LLGL1, NDFIP1, NOLA3, NUMB, RUVBL, SCRIB, TOP2A y VDR, según se ilustra en la Figura 19 y en la Figura 20. Se representa gráficamente la desviación típica sobre la media y se muestra en la Figura 21. Se estima un CT que corresponda lo más probablemente a una única molécula para cada gen en un intervalo de entre 22 y 25 (Figura 22). La variabilidad en la expresión génica entre las células individuales de tejido humano es mayor que la variabilidad de los estándares de ARN, según se ilustra en la Figura 23. Los histogramas de los diferentes ensayos demostraron que la variabilidad intracelular medida es mayor el ruido interno del protocolo de medida (Figuras 24 - 26).
Ejemplo 13. Análisis estándar con transcripción inversa, amplificación mediante múltiples PCR y qPCR en chips M48
Se preparó ARN total a 7 diluciones diferentes que variaban desde una dilución de 10 veces hasta una dilución de 107 veces con un intervalo logarítmico. Después, las muestras diluidas se retrotranscribieron y se preamplificaron, se mezclaron con 96 conjuntos de cebadores (ensayos de expresión génica Taqman, elaborados por ABI Biosystems). Los experimentos se prepararon para 6 réplicas por dilución. Los ADNc de la preamplificación se cuantificaron después mediante el uso de dos chips M48. En la Figura 18 A se ilustra un mapa térmico representativo de varias diluciones y el control negativo. La linealidad de la amplificación es demostrada por la amplificación lineal de los genes seleccionados tales como ACTB, ARL5A, C13ORF15, CDKN1A, GNAI1, IGFBP4, KRT17, LABM3, LLGL1, NDFIP1, NOLA3, NUMB, RUVBL, SCRIB, TOP2A y VDR, según se ilustra en la Figura 19 y en la Figura 20. Se representa gráficamente la desviación típica sobre la media y se muestra en la Figura 21. Se estima un CT que corresponda lo más probablemente a una única molécula para cada gen en un intervalo de entre 22 y 25 (Figura 22). La variabilidad en la expresión génica entre las células individuales de tejido humano es mayor que la variabilidad de los estándares de ARN, según se ilustra en la Figura 23. Los histogramas de los diferentes ensayos demostraron que la variabilidad intracelular medida es mayor el ruido interno del protocolo de medida (Figuras 24 - 26).
imagen53
Ejemplo 14. Análisis de células de cáncer de colon normales
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos para una clasificación inicial mediante FACS. Se analizaron células madre cancerosas de colon normales en un análisis múltiple en chip (Figura 27). En la Figura 28 se ilustra un mapa térmico combinado. De las 208 células ensayadas, se desecharon 44 células que no expresan los genes constitutivos y se seleccionaron 252 células. De las 208 células, se desechó adicionalmente 1 célula, y se seleccionaron 207 células para un análisis adicional (Figura 29). Se llevó a cabo el agrupamiento jerárquico y en la Figura 30 se muestra una ilustración representativa del resultado. Se determinaron las expresiones génicas correlacionadas con la expresión del TERT (Figura 31). Se identificaron los genes activados conjuntamente con el TERT (Figura 32). La Figura 33 muestra el grado de asociación con el TERT en un gráfico de barras. Se llevó a cabo el agrupamiento jerárquico para agrupar las células según sus patrones de expresión génica y tipos celulares (Figuras 34 - 37). El agrupamiento demostró que la expresión de NOTCH1, NOTCH2, EPHRB2 estaba asociada con los enterocitos madre o inmaduros. La expresión de F1ES6, PROX1 Y WNT6 estaba asociada con las células madre.
Ejemplo 15. Análisis de células de cáncer de colon
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos para una clasificación inicial mediante FACS. Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente. Las células de cáncer de colon se analizaron en un análisis múltiple en chip (Figura 38). En la Figura 39 A se ilustra un mapa térmico combinado. De las 462 células ensayadas, se desecharon 12 células que no expresan GAPDH, ACTB o EpCAM, y se seleccionaron 450 células para un análisis adicional (Figura 40). En la Figura 41 se ilustra un mapa térmico combinado después de la limpieza. Se llevó a cabo el agrupamiento jerárquico y en la Figura 42 se muestra una ilustración representativa del resultado. Se determinaron las expresiones génicas correlacionadas con la expresión del TERT (Figura 43). Se identificaron las expresiones génicas asociadas con la expresión del TERT (Figura 44). Usando los valores medianos, se identificaron las expresiones génicas asociadas con la expresión del TERT (Figura 45). Después se identificaron los genes expresados conjuntamente con el TERT (Figura 46). El agrupamiento demostró que AXIN, BMPR, C-MYC, CYCLIN-D1, EPHB, NOTCH y hasta un cierto punto TEC-3, TCF-4 y HATH, se expresaban conjuntamente con el TERT. Los genes tales como IHH, LIN, MET, NANOG, N-MYC, SOX, Notch1, no se expresaban conjuntamente con el (Figuras 47 - 62). En la muestra de colon 8, las células madre (TERT+ / LGR5+) también eran SURVIVIN+. NOTCH1, NOTCH2, EPHB2, AXIN2 y C-MYC, estaban asociadas con las poblaciones de células madre y en ciclo. Los SHH y TCF-4 estaban asociados con los enterocitos inmaduros. Los HES-1, 5, 6 estaban asociados con poblaciones tanto de madre y en ciclo como de enterocitos inmaduros (Figura 63).
Ejemplo 16. Análisis de la progenie no oncogénica y oncogénica
Se llevaron a cabo análisis en chip con células de una progenie no oncogénica (NTG) u oncogénica (TG) (Figura 64). En la Figura 65 se ilustra un mapa térmico combinado. Se representaron gráficamente ambas células TG y NTG en un diagrama de dispersión de acuerdo con los niveles de expresión de HPRT o de ACTB (Figura 66). Se obtuvieron las curvas de la qPCR para GCLM con diferentes números de ciclos de PCR, mostrando la correlación entre la identificación de las células activas y el valor de CT (Figura 67). A partir de las reacciones de qPCR se generaron curvas estándar (Figuras 68 -69). Se ilustran los histogramas que representan los niveles de expresión génica en células TG o NTG para los siguientes genes: GSS, GCLC, GCLM, GPX1, GPX4, GPX7, SLPI, PRNP, SOD1, SOD2, SOD3, CAT, NFKB1, FOXO1, FOXO3A, FOXO4, KRT19, STAT3, CHI311, TERT, HIF1A, EPAS1, HPRT y ACTB (Figuras 70 - 75). Se muestra el agrupamiento jerárquico de las células TG y NTG (Figuras 76 - 77). En las Figuras 78 y 79 se muestra la prueba de significación estadística de Kolmogorov-Smirnov para los genes expresados en células TG o NTG. Los agrupamientos jerárquicos de los genes relacionados únicamente con el glutatión se muestran en forma de un mapa térmico mediante el uso del método de agrupamiento de las medias de k (Figura 80). Se compararon las células TG y NTG en el agrupamiento medio de los genes relacionados con el glutatión (Figuras 81 -82). El agrupamiento medio-centrado-max-normalizado que compara las TG y NTG se muestra en dos representaciones diferentes (Figuras 83 - 84). El cálculo del “medio-centrado-max-normalizado” se muestra en la Figura 85. Los resultados del “medio-centrado-max-normalizado”, agrupados según el agrupamiento de las medias de k demostraban las expresiones diferenciales de GPX7, SOD3, NFKB1, EPAS1, FOXO1, GCLM, TERT, CHI311 y KRT19 entre las células TG y NTG (Figuras 86 - 87).
imagen54
Se llevó a cabo un análisis de la expresión génica de las células individuales esencialmente como se ha descrito anteriormente. Se muestran los mapas térmicos de 6 análisis en chip diferentes (Figuras 88 -93). En la Figura 94 se ilustra un mapa térmico combinado. De las 504 células ensayadas, se desecharon 56 células que no expresan el HPRT1 o cualquiera de las queratinas (KRT14-870, KRT17-207, KRT18-706, KRT19-980) y se seleccionaron 448 células para un análisis adicional (Figura 95). En la Figura 96 se muestran las curvas estándar que demuestran la linealidad de la pPCR. Se ilustran los histogramas que representan los niveles de expresión génica en las células TG
o NTG células para los siguientes genes: TGFB, SNAI, BMI1, KRT19, TRP63, CDH1, KRT17, KRT14, HPRT1, TCF3 y CTNNB1 (Figuras 97 - 99). En la Figura 100 se muestra la significación estadística de Kolmogorov-Smirnov para los genes expresados en las células TG o NTG. Se muestra el agrupamiento medio-centrado-max-normalizado que compara las TG y NTG en dos representaciones diferentes (Figuras 101 y 102). El agrupamiento de las medias de k demostraba que HIF1a y HPRT son expresados diferencialmente en las células TG y NTG (Figura 103).
Ejemplo 18. Análisis de muestras de cáncer de colon
Se muestran los mapas térmicos de 4 análisis en chip diferentes (Figura 104). En la Figura 105 se ilustra un mapa térmico combinado. De las 336 células ensayadas, se desecharon 68 células al examinar los niveles de expresión de GAPDH y de TACSTD1 y se seleccionaron y 268 células para un análisis adicional (Figura 106). El agrupamiento jerárquico mostró unas expresiones desiguales de BIRC5, MKI67, VEFGA, KRT19, CD66 y KRT20 entre las células (Figuras 107 - 110). Se llevó a cabo una segunda ronda de análisis en chip (Figura 111). Las curvas estándar que demuestran la linealidad de la qPCR se muestran en la Figura 112. Se muestran los resultados del agrupamiento con diferentes representaciones: Figura 113 (la ausencia de expresión está marcada con color gris); Figura 114 (poblaciones totales que contienen células que no existen en la población CD66+; y Figura 115 (poblaciones CD66+).
Ejemplo 19. Análisis de la mucosa normal de colon
Se tomaron células a partir de mucosa de colon normal. Las células se clasificaron mediante FACS con los marcadores de superficie EpCAM, CD44 y CD66a. Las células de colon no oncogénicas (NTCC no madre) se definieron como células EpCAM+ / CD44- / CD66a+. Las células madre cancerosas de colon (CoCSC) se definieron como células EpCAM+ / CD44+ / CD66a-. Se muestran los mapas térmicos de 4 análisis en chip diferentes (Figura 116). En la Figura 117 se ilustra un mapa térmico combinado. De las 924 células ensayadas, se desecharon 219 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1 y se seleccionaron 705 células para un análisis adicional (Figura 118). Se ilustran los histogramas que representan los niveles de expresión génica para los siguientes genes: ACTE, AQP9, BIRC5 (SURVIVIN), BIRC5 (EPR1), BMI1, CA2, CDK6, CDKN1A, CD66A, DKC1, DLL4, FOXO1, FSTL1, GAPDH, HES1, HES6, IHH, IL111IRA, KRT20, LFNG, LGR5, LLGL1, MAML2, MKI67, MUC2, MUC2-094, NOLA3, PCNA, PLS3, RETNLB, RFNG, RNF43, RUVBL2, SLCO3A1, SOX2, SOX9, TACSTD1, TCF7L2, TERT, TERT-669, TFF3, TINF2, TOP1, UGT8, UGT2B17, VDR, VEGFA y WWOX (Figuras 119 - 124). En la Figura 125 se muestra la significación estadística de Kolmogorov-Smirnov para los genes expresados en las células NTCC y CoCSC, demostrando que las células caliciformes no difieren mucho entre las poblaciones de NTCC y de CoCSC. Los genes se clasificaron mediante el uso de los valores medianos y se mostraron en un formato de gráfico (Figuras 126 y 127). Se muestra un mapa térmico para las 6 réplicas (Figura 128). El agrupamiento jerárquico demostró que los MUC2, MK167, TERT, LGR5, TFF3 y CA2 eran expresados diferencialmente en las células madre enriquecidas o en las células maduras enriquecidas (Figura 129 y Figura 130). Los genes correlacionados con el TERT son identificados en un análisis del componente principal (Figura 131). La Figura 132 muestra el grado de correlación del TERT en un gráfico de barras. La Figura 133 muestra el grado de asociación del TERT en un gráfico de barras. Mediante el uso de los valores medianos se identificaron las expresiones génicas asociadas con la expresión del TERT. (Figura 134). Después se identificaron los genes activados conjuntamente con el TERT (Figura 135). El agrupamiento demostró que CDK6, IFNG, UGT8 y WWOX eran expresados conjuntamente con el TERT. Los genes tales como DKC1, DLL4, HES6, PLS3, RFNG, TCF712 y TOP1 no eran expresados conjuntamente con el TERT (Figuras 136 - 146).
Ejemplo 20. Análisis de las células de un xenoinjerto de colon
Se recogieron células a partir del xenoinjerto de células de colon. Las células se clasificaron mediante FACS con los marcadores de superficie EpCAM, CD44 y CD66a. Las células madre cancerosas de colon (CoCSC) se definieron como células EpCAMhigh / CD44+ / CD 166+. Se muestran los mapas térmicos de 4 análisis en chip diferentes (Figura 147). En la Figura 148 se ilustra un mapa térmico combinado. De las 504 células ensayadas, se desecharon 21 al examinar los niveles de expresión génica de GAPDH y de TACSTD1 y se seleccionaron 483 células para un análisis adicional (Figura 149). Adicionalmente, para cada gen, cuando los valores de CT son mayores que el umbral dependiente del gen, las células se eliminaron (Figura 150). En la Figura 151 se ilustra un mapa térmico combinado después de la limpieza. Se llevaron a cabo un agrupamiento jerárquico y un agrupamiento de las medias de k para la identificación de los genes expresados diferencialmente entre la población madura y la población de madre / en proliferación (Figuras 152 -155). Se identificaron los patrones de expresión génica anti-correlacionados entre las poblaciones, por ejemplo, HES1 y TFF3, CDK6 y CDKN1A, y UGT8 y VEGFA (Figura 156). El agrupamiento de los genes mostró una diferencia entre las dos subpoblaciones (Figura 157). El agrupamiento después de la normalización con ACTB, GAPDH y TACSTD1 mostró una diferencia entre las dos subpoblaciones (Figura 158). El agrupamiento de las medias de k de los genes mostró una diferencia entre las dos subpoblaciones (Figura 159). El agrupamiento de las medias de k después de la normalización con ACTB, GAPDH y TACSTD1 mostró una diferencia entre las dos subpoblaciones (Figura 160). En la Figura 161 se muestra un mapa térmico de un análisis estándar. El agrupamiento jerárquico demostró que ciertos genes son expresados diferencialmente, por ejemplo, PCNA, MK167, TERT, CD66a, TFF3, KRT20, WWOX y BMI1 (Figuras 162 y 163). Se identificaron los genes correlacionados con el TERT en un análisis del componente principal (Figura 164). La Figura 165 muestra el grado de correlación del TERT en un gráfico de barras. La Figura 166 muestra el grado de asociación del TERT en un gráfico de barras. Los genes que tienen una diferencia significativa con el TERT se muestran en la Figura 167. El agrupamiento demostró que CDK6, IFNG, ILGL, HES1, RNF43, RUVB, SFCO, SOX9, TOP1, NOFA3, DKC1, UGT8, WWOX y HES6 eran expresados conjuntamente con el TERT. Los genes tales como DFF4, PCNA, UGT2B17, VEGFA, MAMF2 y IL11RA no eran expresados conjuntamente con el TERT. (Figuras 168 -187). El agrupamiento jerárquico que muestra únicamente el gen relacionado con el TERT se ilustra en las Figuras 188 y 189.
imagen55
Ejemplo 21. Comparación entre las células de colon normales y las células cancerosas
Se llevó a cabo un análisis de la expresión génica de las células individuales esencialmente como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM, a CD44 y a CD66a para una clasificación inicial mediante FACS. Las células normales se definieron como EpCAM+ / CD44- / CD66a+ y EpCAM+ / CD44+ / CD66a-. Las células cancerosas se definieron como EpCAMhigh / CD44+ / CD 166+. El agrupamiento jerárquico que muestra dos poblaciones normales (células CD44- / CD66a- o CD44- / CD66a+) se ilustra en la Figura 190. El agrupamiento jerárquico que muestra las células cancerosas se ilustra en la Figura 191. El agrupamiento jerárquico representaba los pares de genes anti-correlacionados tales como CDKN1A y CDK6, y KRT20 y UGT8 (Figura 192).
Ejemplo 22. Análisis de colon xenoinjerto células
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EGFP y a CD66a para una clasificación inicial mediante FACS. Se recogieron células a partir del xenoinjerto (m10) de células de colon. Las células se clasificaron mediante FACS con EGFP, CD44 y CD66a. Las células maduras no oncogénicas se definieron como células EGFP+ / CD44- / CD66a+. Las células CoCSC se definieron como células EGFP+ / CD44+. Se muestran los mapas térmicos de 8 análisis en chip diferentes (Figura 193). En la Figura 194 se ilustra un mapa térmico combinado. De las 336 células ensayadas, se desecharon 72 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1 y se seleccionaron 264 células. De las 264 células, se desecharon adicionalmente 5 células al examinar los niveles de expresión del EGFP y se seleccionaron 259 células para un análisis adicional (Figura 195). Adicionalmente, para cada gen, cuando los valores de CT son mayores que algunos umbrales dependientes de los genes, las células se eliminaron (Figura 196). Se confirmó que todas las células de colon expresan el EGFP (Figura 197). Se ilustran los histogramas que representan los niveles de expresión génica para los siguientes genes: EGFP, KRT20, CD66A, CA2, FGR5, TERT, OFFM4, MK167, LEFGY1 y LEFTY2 (Figuras 198 y 199). Se llevó a cabo un agrupamiento para la identificación de los genes expresados diferencialmente (Figura 200). La Figura 201 muestra el grado de correlación del TERT en un gráfico de barras. La Figura 202 muestra el grado de asociación del TERT en un gráfico de barras. Mediante el uso de los valores medianos se identificaron las expresiones génicas asociadas con la expresión del TERT (Figura 203). El agrupamiento demostró que los ARL5, CES3, CLDN7, DLG1, DFF4, ETS2, EZH2, ID2, IGFBP4, METTF3, MPP7, NUMB, OLFM4, PRKCZ, PTEN, SCRIB, SEC24, SEC62, SUZ12, UGT1A6, UGT2B17, UGT8 y hasta un cierto punto ERBB3, KIF12, NAVI y UTRN eran expresados conjuntamente con el TERT. Los genes tales como GNAI, HUNK, FAMB, LEFTY, NRN1, PDGFA, PROX1 y STC2 no eran expresados conjuntamente con el TERT. (Figuras 204 - 237). El agrupamiento jerárquico que ilustra la firma de los enterocitos inmaduros y los genes expresados diferencialmente en varios tipos celulares se muestra en las Figuras 238 y 239.
Ejemplo 23. Análisis del xenoinjerto de células de colon
Se llevó a cabo un análisis de la expresión génica de las células individuales esencialmente como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EGFP y a CD66a para una clasificación inicial mediante FACS. Se recogieron células a partir del xenoinjerto (m10) de células de colon. Las células maduras no oncogénicas se definieron como células EGFP+ / CD44- / CD66a+. Las células CoCSC se definieron como células EGFP+ / CD44+. Se muestran los mapas térmicos de 2 análisis en chip diferentes (Figuras 240 y 241). Se observó una diferencia entre el número de copias, según se ilustra en la Figura 242.
Ejemplo 24. Análisis del xenoinjerto de células de colon
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EGFP y a CD66a para una clasificación inicial mediante FACS. Se recogieron células a partir del xenoinjerto (m10) de células de colon. Las células maduras no oncogénicas se definieron como células EGFP+ / CD44- / CD66a+. Las células CoCSC se definieron como células EGFP+ / CD44+. Se muestran los mapas térmicos de 2 análisis en chip diferentes (Figura 243). En la Figura 244 se ilustra un mapa térmico combinado. La Figura 245 ilustra un mapa térmico que muestra un análisis simultáneo de un original y una copia de las muestras. Se observó una diferencia entre el número de copias, según se ilustra en la Figura 246. En la
imagen56
Ejemplo 25. Análisis de células de colon normales
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM y a CD66a para una clasificación inicial mediante FACS. Se tomaron células a partir de mucosa de colon normal. Las NTCC normales se definieron como células EpCAM+ / CD66a+. Las células CoCSC normales se definieron como células EpCAM+ / CD66alow. Se muestran los mapas térmicos de 4 análisis en chip diferentes para las muestras enriquecidas en madre o para las muestras enriquecidas en maduras (Figura 248). En la Figura 249 se ilustra un mapa térmico combinado. De las 328 células ensayadas, se desecharon 126 células al examinar los niveles de expresión génica de GAPDH y de ACTB, y se seleccionaron 202 células. De las 202 células, se desecharon adicionalmente 2 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1 y se seleccionaron 200 células para un análisis adicional (Figura 250). Adicionalmente, para cada gen, cuando los valores de CT son mayores que algún umbral dependiente del gen, las células se eliminaron (Figura 251). En la Figura 252 se ilustra un mapa térmico combinado después de la limpieza. En las Figuras 253 259 A se ilustra un agrupamiento jerárquico de todos los genes, el subgrupo 1, el subgrupo 2, el agrupamiento de las medias de k del subgrupo 2. Las expresiones génicas diferenciales entre los diversos tipos celulares están ilustradas en las Figuras 260 - 263. Los marcadores de las poblaciones inmaduras fueron identificados como LGR5, ASCL2, LEFTY1, TERT, PTPRO, OLFM, METTL3, LIF12, EZH2, UTRN, UGT8, AQP1, ETS2, LAMB1, CDKN1B, SUZ12, ESF1, CFTR, RBM25, CES3, VIL1, VEGFB, SEC62, MAST4 y DLL4. Las expresiones génicas de las poblaciones en ciclo inmaduras se identificaron como BIRC, TOP2A, MKI67 y GPSM2. Las expresiones génicas de las células caliciformes maduras se identificaron como TFF3 y MUC2. Las expresiones génicas de los enterocitos maduros se identificaron como KRT20, CEACAM1, CDKN1A, CA2 y VEGFA.
Ejemplo 26. Análisis de las células de colon normales
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM y a CD66a para una clasificación inicial mediante FACS. Se tomaron células a partir de mucosa de colon normal. Las NTCC normales se identificaron como células EpCAM+ / CD66a+. Las células CoCSC normales se definieron como células EpCAM+ / CD66alow. Se muestran los mapas térmicos de 2 análisis en chip diferentes para las muestras enriquecidas en madre o las muestras enriquecidas en maduras (Figura 264). En la Figura 265 se ilustra un mapa térmico combinado. De las 292 células ensayadas, se desecharon 38 células al examinar los niveles de expresión génica de GAPDH y de ACTB, y se seleccionaron 254 células. De las 254 células, se desecharon adicionalmente 10 células al examinar los niveles de expresión génica de GAPDH y de TACSTD1, y se seleccionaron 244 células para un análisis adicional (Figura 266). En la Figura 267 se ilustra un mapa térmico combinado después de la limpieza. Un agrupamiento representativo de la asociación con el TERT se ilustra en la Figura 268. Se lleva a cabo un agrupamiento jerárquico para la identificación de los genes expresados diferencialmente entre los grupos (Figuras 269 -271). Los genes correlacionados con el TERT están ilustrados en un gráfico de barras (Figura 272). Los genes asociados con el TERT están ilustrados en un gráfico de barras (Figura 273). Los genes que tienen una diferencia significativa en la mediana entre las células TERT+ y TERT- están ilustrados en la Figura 274. El agrupamiento demostró que AQP1, CDKN1B, CES3, CFTR, ESF1 ETS2, HNF1B, KIF12, LEFTY1, METTL3, MYO6, PTPRO, RBBP6, RBM25, SEC62, TOP1, UGT1A6, UGT2B17, UGT8, UTRN, VIL1 y CDK6 eran expresados conjuntamente con el TERT. Los genes tales como ACVR1B, ACVR1C, ACVR2A, ACVR2B, ADAM10, ID2, EZH2 y BRD7 no eran expresados conjuntamente con el TERT (Figuras 275 -306). El agrupamiento jerárquico que muestra únicamente el gen relacionado con el TERT se ilustra en las Figuras 307 -310. Se identificaron los genes correlacionados con el TERT en un análisis del componente principal (Figura 311). Se comparan las poblaciones de TG y NTG mediante el uso del valor mediano de CT para cada gen (Figuras 312 y 313). En las Figuras 314 -316 se muestra la prueba de significación estadística de Kolmogorov-Smirnov para los genes expresados en las células TG o NTG. En la Figura 317 se ilustra una representación del agrupamiento jerárquico por tipos celulares.
Ejemplo 27. Análisis del xenoinjerto de células de cáncer de colon
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM para una clasificación inicial mediante FACS. Se recogieron células a partir del xenoinjerto (m6). Las células CoCSC se definieron como células EpCAM+. Se muestran los mapas térmicos de 4 análisis en chip diferentes para muestras enriquecidas en madre o muestras enriquecidas en maduras (Figura 318). En la Figura 319 se ilustra un mapa térmico combinado. De las 335 células ensayadas, se desecharon 5 células al examinar los niveles de expresión génica de TACSTD1 y de ACTB y se seleccionaron 330 células. De las 330 células, no se desechó ninguna célula adicional al examinar los niveles de expresión génica de GAPDH y de ACTB y se seleccionaron las 330 células para un análisis adicional (Figura 320). En la Figura 321 se ilustra un mapa térmico combinado después de la limpieza. En las Figuras 322 -325 se ilustra un agrupamiento representativo normalizado estándar centrado en la media y un agrupamiento de un subconjunto. En estos experimentos, las expresiones génicas de la población inmadura se identificaron como FGR5, ASCF2, LEFTY1, TERT, PTPRO, OLFM, METTL3, LIF12, EZH2, UTRN, UGT8, AQP1, ETS2, LAMB, SUZ12, ESF1, CFTR, RBM25, ARF5A, HNF1A y SEC62. Las expresiones génicas de la población en ciclo inmadura se identificaron como BIRC, TOP2A, MKI67 y GPSM2. Los marcadores de los enterocitos maduros se identificaron como KRT20, CEACAM1, CDKN1A, CA2 y VEGFA. La Figura 326 muestra el grado de correlación del TERT en un gráfico de barras. La Figura 327 muestra el grado de asociación del TERT en un gráfico de barras. El agrupamiento demostró que LEFTY, EZH2, SUZ12, TOP1I y UTRN estaban correlacionados con el TERT; y la correlación de ACVR, ADAM10, AQP1, ARL5A, BRD7, CCND1, CDK2, CDK6, CES3, CFTR, DLL4, ESF1, ETS2, GPR, HNF1B, HUNK, KIF12, LAMB, METTL3, MYO6, OLFM4 PTPRO, RBBP6, RBM25, SEC62, UGT1A6, UGT2B17, UGT8 y VIL1 están ilustrados en las Figuras 328 -361. La población del compartimento TERT+ / en ciclo era positiva para la expresión de ARL5A, CCND1, CDK2, ESF1, ETS2, EZH2, LEFTY, METTL3, OLMF4, RBBP6, SUZ12, TOP1, UGT9, UTRN, BRD7, HUNK, GPR89B y hasta un cierto punto ADAM10, CDK6, CES3, CFTR, DLL4, HNF1B, MYO6, RBM25, SEC62, UGT1A6, UGT2B17 y VIL1. En las Figuras 362 y 363 se ilustra una representación del agrupamiento jerárquico por tipos celulares.
imagen57
Ejemplo 28. Análisis del xenoinjerto de células de mama
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a CD44 y a CD24 para una clasificación inicial mediante FACS. Se recogieron células a partir de la muestra de xenoinjerto (m4) de cáncer de mama. Las células Br-CSC se definieron como células CD44+ / CD24-. Las células no oncogénicas se definieron como células CD44low/-. En la Figura 364 se ilustra un mapa térmico combinado. De las 252 células ensayadas, se desecharon 19 células al examinar los niveles de expresión génica de GAPDH y de ACTB, y se seleccionaron 233 células para un análisis adicional (Figura 365). En la Figura 366 se ilustra un mapa térmico combinado después de la limpieza. En las Figuras 367 y 368 se ilustra un agrupamiento representativo. En la Figura 369 se ilustra una gráfica de correlación que muestra los genes que son expresados más diferencialmente. En la Figura 370 se ilustra una representación del agrupamiento únicamente con los genes que son expresados significativamente diferencialmente entre las células TG y NTG. En la Figura 371 se muestra el resultado de la prueba estadística de K-S. En la Figura 372 se ilustra una representación del agrupamiento únicamente con los genes que son expresados significativamente diferencialmente entre las células TG y NTG con un valor de p (K-S) menor de 0,05 / 96 pocillos. Los genes expresados diferencialmente son identificados como los siguientes: CDH1, CDH2, SOX9, CD109, METTL3, CD44, CDK6, PTEN, TOP1, SUZ12, BMI1, LEFTY1, LEFTY2, E-CADHERIN y N-CADHERIN. En la Figura 373 se muestra una representación del agrupamiento únicamente con la población de TG. En la Figura 374 se muestra una representación del agrupamiento únicamente con la población de NTG.
Ejemplo 29. Resumen de todos los experimentos con células individuales para las células de colon
En las Figuras 375 - 384 se ilustra una representación del agrupamiento jerárquico para varios tipos celulares.
Ejemplo 30. Análisis de células de una biopsia normal y cancerosa
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM, a CD44 y a CD166 para una clasificación inicial mediante FACS. Se tomaron células a partir de una biopsia de la mucosa normal o de un tumor primario. De las 335 células ensayadas, se desecharon 37 células al examinar los niveles de expresión génica de EPCAM y de ACTB, y se seleccionaron 298 células. De las 298 células, se desecharon adicionalmente 4 células al examinar los niveles de expresión génica de GAPDH y de ACTB, y se seleccionaron 294 células para un análisis adicional (Figura 385). En la Figura 386 se ilustra un mapa térmico combinado después de la limpieza. Se ilustran los histogramas que representan los niveles de expresión génica en la mucosa normal o en las células del tumor primario para los siguientes genes: ACTB, CA1, GAPDH, SHH, BIRC5, CDKN1A, GPSM2, PRPRO, CFTR, LEFTY1 y OLFM4 (Figura 387). La prueba de significación estadística de Kolmogorov-Smirnov para los genes expresados en las células normales o en las tumorales primarias identificó las muestras que expresan unos niveles significativamente mayores de cada gen (Figura 388). Los genes clasificados mediante el uso de las medianas están ilustrados en la Figura 389. En la Figura 390 se ilustra un agrupamiento jerárquico representativo para las muestras cancerosas y las muestras normales. En la Figura 391 se ilustran los agrupamientos de los grupos de células para la muestra cancerosa, y en la Figura 392 para la muestra normal. Según se muestra en estas figuras, la mayoría de los genes son expresados a unos niveles mayores en el tejido normal. Los LEFTY1, OLFM y CFTR eran mayores en el tumor. Ambas poblaciones celulares eran CD44+. En la Figura 393 se ilustra un agrupamiento jerárquico que muestra la expresión de CEACAM1 y de TERT en la muestra normal o tumoral.
Ejemplo 31. Análisis de las células de colon de ratón
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a CD44 para una clasificación inicial mediante FACS. Se tomaron células de dos muestras diferentes de colon de ratón. Ambas muestras se clasificaron mediante FACS para las células CD44high. Se muestran los mapas térmicos de 4 análisis en chip diferentes para ambas muestras (Figura 394). En la Figura 395 se ilustra un mapa térmico combinado. De las 168 células ensayadas, se desecharon 81 células al examinar los niveles de expresión génica de TACSTD1 y de ACTB y se seleccionaron 87 células. De las 87 células, se desecharon adicionalmente 30 células al examinar los niveles de expresión génica de HPRT y de ACTB y se seleccionaron 57 células para un análisis adicional (Figura 396). En la Figura 397 se ilustra un mapa térmico combinado después de la limpieza. En la Figura 398 se ilustra un agrupamiento representativo del estándar normalizado centrado en la media el subconjunto. Se identificaron algunos pares de genes anti-correlacionados, incluyendo TERT y CA2, KLF4 y KLF5, CD66 y TERT, BMI1 y LGF5, LGR5 y CD66, y CD66 y BMI1 (Figuras 399 y 400). En la Figura 401 se ilustra un agrupamiento jerárquico que muestra únicamente los LGR5, BMI1 y CD66a.
imagen58
Ejemplo 32. Análisis del tejido de mama primario normal
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM, a Lin y a CD49f para una clasificación inicial mediante FACS. Se tomaron células a partir de epitelio de mama normal. Las células epiteliales totales células se definieron como células EpCAM+ / Lin- / CD49f+. Las células estromales desconocidas se definieron como células EpCAM- / Lin- / CD49f-. Se muestran los mapas térmicos de 4 análisis en chip diferentes (Figura 402). En la Figura 403 se ilustra un mapa térmico combinado. De las 168 células ensayadas, se desecharon 9 células al examinar los niveles de expresión génica de GAPDH y de ACTB, y se seleccionaron 159 células para un análisis adicional (Figura 404). En la Figura 405 se ilustra un mapa térmico combinado después de la limpieza. En las Figuras 406 - 408 se ilustra un agrupamiento jerárquico representativo. En estos experimentos ninguna célula se identificó como TOP2A+ / BIRC5+ / MKI67+, TERT+ o CDH1 + / CD1-9 + / CDH1-. Se encontraron algunas células CDH1+ en la población luminal. Una subpoblación era EpCAM- / CD49f+ y la otra subpoblación era Thy1+. Estos datos pueden sugerir que las células basales expresan los KRT5, KRT14, KRT17 y EGFR, mientras que las células del epitelio luminal expresan los krt18, krt8, krt19 Y ELF5. Se descubrieron importantes marcadores de las células luminales en estos experimentos: NOTCH3, HER3 y EGF. Se descubrieron importantes marcadores de las células basales en estos experimentos: SNAI2, NGFR y LAMB1. En la Figura 409 se ilustra un agrupamiento jerárquico que muestra únicamente las células CD49f+. En la Figura 410 se ilustra un mapa térmico de las muestras obtenidas a partir del epitelio y del estroma, y su agrupamiento jerárquico se muestra en la Figura 411. Entre el epitelio y el estroma se observó un patrón de expresión antagonista entre VEGFA y VEGFC.
Ejemplo 33. Análisis del xenoinjerto de células de colon
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EGFP, a CD44 y a CD66a para una clasificación inicial mediante FACS. Se obtuvieron células a partir de un xenoinjerto (m10). Las células maduras no oncogénicas se definieron como células EGFP+ / CD44- / CD66a+. Las células CoCSC se definieron como células EGFP+ / CD44+. Las células clasificadas mediante FACS se sometieron a un conjunto de diferentes condiciones experimentales: 5 l de sort-mix con Tween-20 al 0,025 % (para analizar si la adición de Tween-20 es de alguna ayuda); calentadas a 65 ºC durante 10 minutos o a 95 ºC durante 5 minutos. La muestra se dividió entonces en un “original” y una “copia”. Los estándares se añadieron un día antes de los experimentos y se congelaron de nuevo. Se muestran los mapas térmicos de 3 análisis en chip diferentes para cada condición (a 65 ºC, 10 min o a 95 ºC, 5 min) (Figuras 412 - 414). Las curvas estándar que muestran la linealidad de la qPCR se muestran en la Figura 415. Se muestran los niveles de las expresiones génicas entre el original y la copia para ciertos genes, que incluyen GAPDH, ALCAM, ATOH1, AXIN2, CA2, NOTCH1, LGF5, HES5, KRT20, HES6, IHH, TACSTD1, SOX2, NOTCH2, RETNLB y CEACAM1 (Figuras 416 - 418). Los resultados de los experimentos se prepararon como el resultado obtenido en un conjunto de experimentos llevado a cabo independientemente (Figura 419). Se apreció que sin la división del ARNm, se observa una variabilidad similar entre las réplicas en la que CT es menor de 20 en los experimentos de dilución del ARN total estándar (Figura 420). Tomando como base estos experimentos se extrajeron las siguientes conclusiones: al contrario que en los experimentos previos, los genes constitutivos prácticamente no muestran sesgo; no hay diferencias significativas entre la condición a 65 ºC y la condición a 95 ºC; y otros genes sí que muestran un poco de sesgo hacia la placa original, especialmente a una elevada Cr.
Ejemplo 34. Análisis de las células de la mucosa de colon normal
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a EpCAM, a CD44 y a CD66a para una clasificación inicial mediante FACS. Se tomaron células a partir de mucosa de colon normal. Las células NTCC normales se definieron como células EpCAM+ / CD44- / CD66a+. Las células CoCSC normales se definieron como células EpCAM+ / CD44+ / CD66alow. En la Figura 421 se ilustra un mapa térmico combinado. De las 168 células ensayadas, se desecharon 46 células al examinar los niveles de expresión de GAPDH y de ACTB, y se seleccionaron 126 células. De las 126 células, se desecharon adicionalmente 9 células al examinar los niveles de expresión de EPCAM y de ACTB, y se usaron 117 células para un análisis adicional (Figura 422). En la Figura 423 se ilustra un mapa térmico combinado después de la limpieza. En las Figuras 424 - 426 se ilustra un agrupamiento representativo. En estos experimentos se identificó una posible corrección entre las expresiones de ZEB1 y de EZH2 en el compartimento de las células madre. Las células madre expresaban los ETS2, ASCL1, TERT y FGR5. Las células caliciformes expresaban el LYZ. Los RGMB, DLL4 y TERT eran expresados en las células madre y en las células caliciformes. Los AQP1 y LEFTY1 eran expresados en las madre y en los enterocitos inmaduros. Se identificó una población desconocida de células con la expresión de CFC1, PCGF6 y LEFTY1 en el compartimento maduro.
Ejemplo 35. Análisis de las células de la mucosa de colon de ratón
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a Esa, a CD45, a CD44 y a CD66a para una clasificación inicial mediante FACS. Se tomaron células a partir del colon de un ratón de raza FVB. Las células se agruparon en dos poblaciones; Esa+ / CD45- / CD44- / CD66ahi o Esa+ / CD45-/CD44+/CD66ahi/low. En la Figura 427 se ilustra un mapa térmico combinado. De las 336 células ensayadas, se desecharon 10 células al examinar los niveles de expresión de GAPDH y de ACTB, y se seleccionaron 326 células. De las 326 células, se desecharon adicionalmente 63 células al examinar los niveles de expresión de TACSTD1 y de ACTB, y se usaron 263 células para un análisis adicional (Figura 428). En la Figura 429 se ilustra un mapa térmico combinado después de la limpieza. En las Figuras 430 y 431 se ilustra un agrupamiento jerárquico representativo de todas las muestras. El agrupamiento jerárquico únicamente de las células CD44+ / CD66a- se ilustra en las Figuras 432 y 433. En estos experimentos, la expresión de BMI1 parecía ser mayor en las células maduras. La expresión de CA2 es mayor en las células madre. Se encontró Aqp1 en las células caliciformes.
imagen59
Ejemplo 36. Análisis estándar del ARN total
Se preparó ARN total y un control negativo en 7 diluciones diferentes que variaban entre una dilución de 10 veces hasta una dilución de 107 veces con un intervalo logarítmico. Las muestras diluidas se preamplificaron, se mezclaron con 48 conjuntos de cebadores (ensayos de expresión génica Taqman, elaborados por ABI Biosystems). Los experimentos se prepararon con 6 réplicas por dilución. En la Figura 434 se ilustra un mapa térmico representativo de varias diluciones y el control negativo. La eficacia de la PCR en los estándares se muestra en la Figura 435. La linealidad de la amplificación es demostrada por la amplificación lineal de los genes seleccionados tales como CAR1, GAPDH, GPSM2, KLF4, KRT20, MUC2, OLFM4, TACSTD1 y TFF3, ACTB, CA2, CLDN7, según se ilustra en las Figuras 436 - 438. En la Figura 439 se ilustra un agrupamiento jerárquico de genes con una elevada eficacia de PCR. Se identifican algunos genes sobreexpresados en las células CD44+ o CD44- (Figura 440).
Ejemplo 37. Análisis de las células del epitelio de mama normal de ratón
Se llevó a cabo un análisis de la expresión génica de las células individuales como se ha descrito anteriormente mediante el uso de anticuerpos que se unen a CD24, a CD49f, a CD49 y a Lin para una clasificación inicial mediante FACS. Se tomaron células a partir de epitelio de mama normal de ratón. Las células madre enriquecidas se definieron como CD24med / CD49fhi / Lin-. Las células progenitoras enriquecidas se definieron como CD24hi / CD49med / Lin-. De las 168 células ensayadas, se desecharon 8 células al examinar los niveles de expresión de ACTB, y se seleccionaron 160 células (Figura 441). En la Figura 442 se ilustra un mapa térmico combinado de las células madre enriquecidas. En las Figuras 443 y 444 se ilustra un agrupamiento jerárquico representativo de las células madre enriquecidas. En la Figura 445 se ilustra un mapa térmico combinado de las células progenitoras enriquecidas. Las células progenitoras se limpiaron al examinar las expresiones génicas de GAPDH y de ACTB (Figura 446). En las Figuras 447 y 448 se ilustra un agrupamiento jerárquico representativo de las células progenitoras enriquecidas.
Ejemplo 38. Análisis combinado de las células madre y caliciformes procedentes de mucosa de colon
En la Figura 449 se muestra un mapa térmico combinado de las células madre y caliciformes, y de los enterocitos maduros.
Ejemplo 39. Comparación de los análisis preamp 48 y preamp 96 en chips M48
Se llevó a cabo una qPCR en el chip M48 o en el chip M96 y los resultados se compararon entre sí (Figura 450). Se obtuvieron mapas térmicos a partir de cada análisis con fines comparativos (Figura 451). Las curvas estándar generadas a partir de estos análisis demostraron que están muy cercanas entre sí (Figura 452). La eficacia entre los chips M48 y M96 era comparable, con la excepción de un elevado ruido de fondo en el análisis de 96 preamp (Figura 453).
Ejemplo 40. Jerarquía celular del colon normal
Usamos la expresión génica de las células individuales de colon humano normal para definir la jerarquía celular del colon humano normal. Para llevar esto a cabo usamos varios genes que incluían aquellos i) relacionados con la función de las células madre normales en múltiples tejidos, especialmente telómeros ii) los genes de la citoqueratina, que pueden usarse para la identificación de las células luminales mioepiteliales y iii) los genes de desarrollo, que se sabe que están implicados en la diferenciación del colon y de otros tejidos. Realizamos en primer lugar estos análisis para identificar los genes que eran expresados conjuntamente con el TERT (Figura 466).
Después realizamos un análisis de agrupamiento basado en los genes expresados por el Tert e identificamos la célula madre, las células progenitoras de los enterocitos y los compartimentos celulares luminales (Figura 467). Los siguientes genes son expresados conjuntamente con la mayoría de la población de las células madre: AQP1, KIF12, PTPRO, METTL3 y LGR5. Nótese que las células madre TERT+ pueden ser divididas en dos grupos principales, aquellas que expresan el LGR5 y aquellas que no expresan el LGR5. Por lo tanto, parece que existen dos poblaciones distintas de células madre normales en el colon normal: una población LGR5+ y una población LGR5(Figura 467). Mediante el uso de esta estrategia de agrupamiento, podemos definir la jerarquía celular del colon normal, incluyendo las células madre intestinales (Figura 467).
imagen60
Estos hallazgos demuestran que puede usarse la tecnología de las células individuales para la identificación de la jerarquía celular del colon normal, incluyendo la identificación de las células madre de colon.
A continuación usamos la tecnología de células individuales para identificar la población de células madre cancerosas en tumores de colon humano. De nuevo, usamos el TERT para identificar las células madre en un tumor (QC8). En este tumor hay una característica población minoritaria de células madre cancerosas que expresan el TERT (Figura 468). Además, existe una segunda población de células cancerosas maduras que no son oncogénicas, no expresan el TERT y expresan los marcadores de las células de colon maduras, incluyendo TFF3, CK20 y CA2. Estas células no forman tumores cuando son trasplantadas en ratones inmunodeficientes. Nótese que, al igual que en el colon normal, hay una población de células LGR5+ que expresan el TERT y una población de células que no le expresan (Figura 468).
A continuación evaluamos los genes cuya expresión está correlacionada con el TERT.
Los siguientes genes están correlacionados: LGR5, MET, BMPR1A, AXIN2, c-MYC, EPHB2, CYCLIND1, NOTCH1 y NOTCH2 (Fig. 469). Además, los siguientes genes están correlacionados con las células no oncogénicas TFF1, IRS1, COX2, MUC2, CK20 y en un menor grado, CEACAM1 (Fig. 469).
El análisis del agrupamiento puede usarse para definir la jerarquía de las células cancerosas. En este ejemplo pueden observarse dos poblaciones distintas de células madre TERT+ en QC8. La primera población TERT+ expresa los genes de proliferación BIRC5 y MKI67, mientras que la segunda no lo hace (Fig. 470). Algunos marcadores que pueden usarse para la identificación de las células madre en ciclo incluyen los siguientes marcadores: GPSM2, SUZ12, OLFM, ETS2, CDK2, EZH2, AQP1, Lefty1 y PTPRO. Algunos marcadores que pueden usarse para la identificación de las células madre en ciclo lento incluyen los siguientes marcadores: LAMB1, LEFTY, AQP1, EZH2 y PTPRO. La expresión de EZH2 por parte de las células madre cancerosas es importante, ya que tanto TERT como EZH2 son importantes para el mantenimiento de las células madre normales. Notablemente, estas células parecen expresar los marcadores asociados con las células caliciformes y diferenciadas, aunque a unos niveles menores. Estos marcadores incluyen KRT20, TFF3, GNA1, CEACAM1 y CES3. Estos datos se muestran en la Fig. 470.
Como otro ejemplo se analizó el tumor de colon QC4. Esta tumor ha sido propagado en ratones inmunodeficientes, y tiene una frecuencia muy alta de células que crecen como un tumor cuando son inyectadas en ratones inmunodeficientes. Estos tumores crecen bastante rápidamente, con una tasa extremadamente rápida de tiempo de duplicación tumoral. Se lleva a cabo un análisis de las células individuales de este tumor. Este análisis reveló numerosos puntos importantes relativos a este tumor xenoinjertado. En primer lugar, hay una frecuencia mucho mayor de células que expresan los marcadores de la célula inmadura que incluyen LGR5, GPSM2 y LAMB1, pero estas células también expresan unos altos niveles de los marcadores de maduración que incluyen TFF3 y KRT20 (Fig. 471). Después se miden todas las poblaciones celulares, incluso las células maduras, que expresan unos niveles detectables de telomerasa y, al contrario que en el ejemplo previo, incluso las células que parecen más maduras están en proliferación, según se mire mediante la expresión de la expresión del MKI67. Esto demuestra cómo se pueden identificar tumores que son más agresivos, y permite la observación de las diferentes poblaciones de células cancerosas, y específicamente de células madre cancerosas, en un tumor.
Estos datos demuestran que relacionando la telomerasa con la expresión de los marcadores de maduración, se puede identificar la frecuencia de células madre cancerosas en un tumor en particular (desde baja hasta alta), las poblaciones celulares específicas que pueden autorrenovarse en un tumor en particular, es decir, la identidad de las células madre cancerosas, y los objetivos moleculares para la eliminación de las diferentes poblaciones de células cancerosas, incluyendo las células madre cancerosas.
Ejemplo 41: análisis de las células de mama normales y de cáncer de mama.
Los procedimientos experimentales son sustancialmente como se ha descrito anteriormente. Se llevó a cabo un análisis de las células individuales en las células normales y en las de cáncer de mama. Los resultados del análisis en las células de mama normales se muestran en las Figuras 456 - 469, y el análisis de agrupamiento se muestra en la Figura 461. El análisis de las células de cáncer de mama se muestra en la Figura 460 y el análisis de agrupamiento se muestra en la Figura 470.
Ejemplo 42: aparato de clasificación celular
Las investigaciones modernas sobre la biología del cáncer han demostrado pruebas acumuladas de que la progresión del cáncer está dirigida por una población minoritaria de “células madre cancerosas” que combina tanto características cancerosas como propiedades de las células madre. Como consecuencia, el hallazgo y la monitorización de estas células madre cancerosas en lugar de las diferenciadas será una forma eficaz para la detección y la evaluación del cáncer. Adicionalmente, la forma definitiva de curar el cáncer sería la eliminación de las células madre cancerosas. Con la capacidad de identificar las células madre cancerosas a partir de muestras clínicas, podemos mejorar tanto la investigación científica básica como los resultados clínicos.
Los actuales procedimientos de diagnóstico y pronóstico del cáncer consisten en la toma de una biopsia, seguida de un análisis histológico. Dicho método únicamente ofrece una idea general sobre la morfología celular. Una evaluación completa requiere el aislamiento de las células madre cancerosas seguido de un análisis genético y epigenético. El aparato de clasificación celular prevalente, el citómetro de flujo, ofrece un elevado rendimiento y una automatización total. Sin embargo, adolece de dos principales inconvenientes que no son compatibles con la identificación de células madre a partir de muestras primarias. En primer lugar requiere demasiada muestra para cada análisis. El consumo mínimo de muestra es de aproximadamente millones de células, lo que es difícil de cumplir cuando se están analizando muestras primarias. En segundo lugar, a pesar del sofisticado sistema óptico, un citometría de flujo solo puede estimar la morfología celular mediante una dispersión de la luz. Por lo tanto, nunca está garantizada la resolución de la célula individual.
imagen61
Para mejorar el rendimiento de la clasificación de muestras primarias hemos desarrollado un sistema de clasificación celular para procesar células vivas inmunoteñidas, medir las intensidades fluorescentes y clasificar automáticamente las células para un análisis de células individuales anterógrado con un mínimo consumo de muestra. La parte central del sistema de clasificación celular es un pequeño chip PDMS para el lavado y la presentación de las células (Figura 466). Consiste en 10.000 micropocillos en un formato de matriz. En el chip introducimos una suspensión de células individuales inmunoteñidas sin lavar y dejamos que las células sedimenten al azar en los pocillos. Los micropocillos con una elevada relación de aspecto pueden atrapar las células de su interior cuando añadimos tampón encima de ellos para lavarlos. Después, un escáner de micromatriz multicolor interroga las intensidades fluorescentes de la micromatriz de células. Como prueba de principio, tenemos una mezcla celular de fibroblastos y células epiteliales con anticuerpos específicos epiteliales (anti-ESA) y las lavamos en el chip. Las imágenes fluorescentes y de dispersión de la luz muestran un gran contraste y un fenotipo definido característico (Figura 467).
Adicionalmente construimos un dispositivo automático basado en un microscopio invertido (Figura 468) para clasificar las células de la micromatriz. La parte en acción es un manipulador microcelular controlado por etapas motorizadas tridimensionales y válvulas neumáticas solenoides. Otra fase automática bidimensional del microscopio mantiene las células objetivo en el centro de la visión para la obtención de imágenes en tiempo real. Después de la recogida, el manipulador puede inyectar directamente las células en los tubos de PCR llenados con medio o con tampón de lisis, para un análisis posterior.
Como demostración de clasificación, mezclamos células GFP+ con células GFP-en diferentes proporciones y clasificamos las células según las intensidades de GFP. Los ensayos de expresión génica Taqman de las células individuales verificaron los genotipos de las células clasificadas y mostraron unas tasas muy bajas de falsos positivos y de falsos negativos (Figura 469).
Para probar la capacidad de clasificar muestras raras, disociamos una muestra primaria de colon humano procedente del quirófano, y teñimos las células con anticuerpos específicos de células epiteliales (ESA) y de células madre (CD44). A continuación clasificamos las células según los resultados de la inmunotinción y realizamos una medida de la expresión génica de las células individuales para cada célula individual con ensayos -100 Taqman. El supuesto grupo de células madre enriquecidas mostró unos elevados niveles de expresión génica de los genes específicos de madre, tales como el de la telomerasa, lo que sugiere una clasificación celular con éxito. Adicionalmente usamos el sistema en un cultivo de células madre cancerosas in vitro, que tiene incluso menos células que las muestras primarias, y obtuvimos unas notables diferencias entre las células madre y las células maduras (Figura 470).
Como conclusión, construimos un clasificador automático de células que permite clasificar células individuales a partir de una muestra rara tal como una biopsia clínica y un cultivo de células madre, para un análisis anterógrado de las células individuales. El dispositivo tiene un chip de matriz de micropocillos para un lavado en el chip y la presentación de las células, y un recogedor automático dotado con capacidad de imagen en tiempo real y una verdadera resolución de célula individual. Las aplicaciones anteriores prueban que nuestro clasificador celular puede procesar tanto muestras clínicas como muestras raras de laboratorio, y medir el patrón de expresión génica de las células individuales para la identificación de las células madre.
Ejemplo 43. La caracterización de las células individuales del epitelio del colon murino adulto distingue nuevas poblaciones
En los mamíferos, el revestimiento epitelial del colon es sustituido de forma continua cada pocos días a lo largo de la vida del organismo. Este proceso está guiado por células madre autorrenovadoras que se cree que residen dentro o cerca de la base de la cripta. La progenie de estas células madre multipotentes migra hacia la luz al dividirse y se diferencia en los tres tipos principales de células maduras en el epitelio del colon: enterocitos de absorción, células caliciformes secretoras de mucosa y células enteroendocrinas secretoras de hormonas. Las células maduras son finalmente excluidas desde el epitelio hacia la luz.
La comprensión de los mecanismos subyacentes en este proceso es importante, dado que parece que las células madre juegan un papel en la recuperación de diversas causas de las lesiones epiteliales (químicas, infecciosas, autoinmunes o isquémicas), así como en el origen del adenocarcinoma de colon, una causa importante de las muertes relacionadas con el cáncer. Las células madre de colon son las únicas células del epitelio del colon que persisten a largo plazo en el tejido, y su importancia en la oncogénesis ha sido sugerida por experimentos en los que pueden inducirse tumores intestinales provocando cambios oncogénicos en las células madre.
imagen62
Recientemente se han identificado numerosos marcadores genéticos diferentes que son expresados por las células madre intestinales a largo plazo, según se demuestra mediante experimentos de rastreo de estirpe in vivo mediante el uso de la tecnología knock-in. Dichos marcadores incluyen Lgr5 (un receptor acoplado a proteínas G objetivo de Wnt y huérfano), Bmi1 (una policomb ring finger) y CD133 / Prominin1 (un marcador de la superficie celular implicado en la biología de las células madre). Además, de acuerdo con la predicción de que las células madre de colon experimentan numerosas mitosis a lo largo de la vida del organismo, el compartimento de células madre en la base de la cripta porta células con unos telómeros relativamente largos, y por lo tanto, probablemente tienen un mecanismo que mantiene la longitud del telómero, tal como la expresión de la telomerasa y de los otros componentes de la holoenzima telomerasa.
En este estudio utilizamos un análisis de expresión génica multiplexado de alta resolución (célula individual), una nueva metodología para la comprensión de la heterogeneidad tisular, junto con una metodología clásica que combina la citometría de flujo mediante el uso de los marcadores de la superficie celular ampliamente disponibles con un cultivo in vitro de las células clasificadas en teratomas de colon, para obtener un retrato en alta resolución sin precedentes del colon murino. Demostramos que puede usarse el CD44 y el CD24 para clasificar dos poblaciones clonogénicas distintas en la base de la cripta (CD44high CD24high y CD44med CD24low/neg) que expresan, ambas, la telomerasa, pero únicamente una de ellas contiene células que expresan Lgr5. Caracterizamos la expresión génica de las células de estas poblaciones a nivel de la célula individual, identificando varios marcadores conocidos y varios marcadores nuevos de los colonocitos inmaduros. Después usamos este análisis para demostrar que las células secretoras de la base de la cripta expresan varios factores tróficos (por ejemplo, activadores de Wnt, EGF, Indian Hedgehog (Ihh) y activadores de la ruta Notch-), incluyendo un factor de crecimiento (Nov /CCN3) que no había sido implicado previamente en la biología intestinal.
Métodos
Ratones
Los ratones se alimentaron con agua y pienso ad libitum y se mantuvieron en la instalación animal de la Stanford University Research de acuerdo con las directrices de la Universidad de Stanford. Las razas de ratón usadas incluían C57B16, FVB, pCx-GFP y Fgr5-CreER-GFP.
Preparación de los tejidos
Se extrajeron los colones (que consisten en colon ascendente, colon y transversal, colon descendente y recto, pero no incluye el ciego) de ratones adultos (de 4 - 16 semanas), se incubaron con PBS para eliminar los desechos y las sustancias fecales, se cortaron en trozos de 1 - 2 mm3 con una cuchilla y se lavaron con PBS. Después el tejido se digirió a 37 grados Celsius durante aproximadamente 2 horas con un pipeteado regular (cada 15 - 20 minutos) en DMEM avanzado exento de suero (Invitrogen) o RPMI-1640 complementado con L-glutamina 2 mM, 120 μg/ml de penicilina, 100 μg/ml de estreptomicina, 50 μg/ml de ceftazidima, 0,25 μg/ml de anfotericina-B, Hepes 20 mM, piruvato de sodio 1 mM, con 200 unidades/ml de colagenasa de tipo III (Worthington Lakewood, NJ) y 100 unidades/ml de DNasa I (Worthington). Una vez completada la digestión, las células se diluyeron con un volumen igual de PBS con EDTA 10 mM (concentración final de EDTA 5 mM), se pipetearon para disrumpir los agregados residuales y se filtraron con una malla de nailon de 40 μm (BD Biosciences, San José, CA). Los glóbulos rojos sanguíneos contaminantes se eliminaron mediante una lisis osmótica (es decir, la incubación en tampón hipotónico de cloruro de amonio y fosfato de potasio durante 5 min en hielo) y después las células se lavaron con PBS frío y se resuspendieron a una densidad de 0,5 -1 x 106 células por ml en tampón de tinción frío que consiste en HBSS complementado con un 2 % de de suero bovino inactivado por calor, Hepes 20 mM, piruvato de sodio 1 mM y antibióticos.
Tinción con anticuerpos y citometría de flujo
Para reducir la unión no específica, las células suspendidas en tampón de tinción fueron bloqueadas en hielo durante 10 minutos con 10 mg/ml de IgG de rata (Sigma, St. Louis, MO) a 1:1.000. Después las células se tiñeron (en la oscuridad, en hielo, durante 30 minutos) con anticuerpos después de determinar las concentraciones óptimas de los anticuerpos para cada anticuerpo mediante experimentos de valoración. Los anticuerpos usados incluyen: Esa-Alexa488 (clon G8.8, Biolegend™), Esa-Alexa647 (clon G8.8, Biolegend™), CD45-PECy5 (clon 30F-11, eBioscience™), CD44-PECy7 (clon IM7, eBioscience™), CD44-APC (clon IM7, eBioscience™), CD66a-PE (clon MAb-CCI, eBioscience™), CD24-PE (clon M1/69, Biolegend™), CD166-PE (eBioscience™, clon eBioALC48). Varios de los anticuerpos (incluyendo CD44, CD66a y CD45) se usaron ocasionalmente en forma biotinilada con una posterior etapa de tinción con Streptavidin APC-Cy7 o Streptavidin Pacific Blue (Invitrogen™). En dichos casos, las gráficas de la citometría de flujo no fueron muy diferentes con respecto a cuando se usaron los conjugados primarios. Las células viables fueron identificadas mediante una exclusión con DAPI (Molecular Probes) o con 7AAD (BD Biosciences™). La citometría de flujo se llevó a cabo con un BD FacsAria II con el programa informático FacsDiva. En todos los experimentos se usaron unos perfiles de dispersión lateral y de dispersión frontal para eliminar los desechos y los dobletes celulares. Las células muertas se eliminaron mediante la exclusión de las células DAPI+.
imagen63
Inmunohistoquímica
Se seccionaron los colores, se lavaron con PBS, se aclararon solamente con fijador (formalina tamponada al 10 %, Sigma, St. Louis, MO) y después se colocaron en fijador durante una noche a 4 grados Celsius. Al día siguiente el tejido se lavó con PBS y se colocó en sacarosa al 30 % para su crioprotección. Después el tejido se incluyó en OCT, se congeló y se seccionó. Después se permeabilizaron secciones finas (de 8 μM o menos) con PBS + un 0,1 % de Triton X-100 (PBS-T), se incubaron en bloque (suero de cabra normal al 5 % en PBS-T) durante 30 minutos a la temperatura ambiente y después se tiñeron con los anticuerpos diluidos en PBS-T durante 1 hora a la temperatura ambiente. En general, los mismos anticuerpos usados para la citometría de flujo fueron usados para la inmunohistoquímica. Para los experimentos de Nov, usamos anti-Nov biotinilado (clon CATZ01, R&D™). Después de un lavado intenso con PBS-T, los portaobjetos se lavaron con PBS-T con DAPI (1:1.000), se montaron en antiatenuadores (Molecular Probes™), se precintaron con laca de uñas y se visualizaron con un microscopio Leica DMI 6000B. Las imágenes fueron capturadas con una cámara CCD y procesadas con ImagePro 5.1™ y post-procesadas con Adobe Photoshop™.
Análisis de la expresión génica
El ARN de las células seleccionadas se recogió mediante el uso del método de Trizol™ como se ha descrito previamente. Se generó el ADNc mediante el uso del kit Superscript III™ (Invitrogen™) de acuerdo con las instrucciones del fabricante, y después se llevó a cabo una PCR en tiempo real con un termociclador ABI 7900HT mediante el uso de los ensayos Taqman (Applied Biosystems™) para los genes seleccionados.
Cultivo celular
Los teratomas de colon se hicieron crecer a partir de células primarias disociadas o clasificadas mediante el uso de una versión modificada de un método previamente publicado (Sato, et. al. Nature 2009). En resumen, el día anterior a la colocación en las placas, las células 3T3 se tripsinizaron y se irradiaron letalmente, se colocaron en los pocillos de cultivo de las placas con Advanced DMEM/F12 (Invitrogen™) y se dejaron adherir. Al día siguiente, las células primarias de colon de ratón disociado o las células de colon clasificadas se colocaron en las placas con factor de crecimiento reducido matrigel (BD Biosciences™) complementado con el péptido Jag-1 1 μM (AnaSpec™) y se cultivaron en DMEM/F12 avanzado (Invitrogen™) con suero bovino fetal inactivado por calor al 10 %, 1x de ITES (Gibco™), complementado con 500 ng/ml de hRspol o hRspo3 (Peprotech™), 50 ng/ml de hEGF recombinante (Peprotech™), 100 ng/ml de hNoggin (Peprotech™) y 10 μM Y-27632 (Sigma™). Las células se cultivaron a 37 grados Celsius en un 5 % de CO2. Al medio se le añadieron los factores de crecimiento cada 2 - 3 días, y se cambió semanalmente. Se añadió Nov / CCN3 recombinante (Peprotech™) a los cultivos a las concentraciones descritas.
Expresión génica de las células individuales
Para los estudios de expresión génica de las células individuales, todas las células se clasificaron por duplicado. La pureza final era > 95 % para todas las poblaciones analizadas. Las células individuales se clasificaron en los pocillos individuales de placas de 96 pocillos que contenían 5 microlitros de tampón de lisis (mezcla de qRT-PCR CellsDirect, Invitrogen™) e inhibidor de la ARNasa (Superasln, Invitrogen™). Después de la transcripción inversa, los genes se preamplificaron (20 ciclos) mediante el uso de los mismos cebadores Taqman usados para la cuantificación. El ADNc preamplificador resultante de cada pocillo se diluyó y después se cargó en la entrada de muestras del chip Fluidigm™ M48 o M96. Se cargaron los ensayos individuales Taqman (cebadores y sondas) en las entradas de ensayo de los chips Fluidigm M48 o M96. Esta carga se llevó a cabo mediante un robot de pipeteo Hamilton STARlet™. Los chips Fluidigm cargados experimentaron después un termociclado y una cuantificación fluorescente en un termociclador / lector Fluidigm Biomark. Para el análisis eliminamos los ensayos génicos de baja calidad, es decir, aquellos en los que las curvas de amplificación de la qPCR no mostraban unos aumentos exponenciales. Después eliminamos las células de baja calidad y las no epiteliales, es decir, las células que no expresaban genes constitutivos (Actb o GAPDH) o EpCAM. Después generamos un histograma de los valores de CT para cada ensayo en cada pocillo. Normalizamos los datos para llevar todos los genes al mismo intervalo dinámico y después agrupamos las células entre sí según su patrón de expresión génica, mediante el uso de algoritmos de agrupamiento tanto sin supervisión como supervisados. Se calcularon los valores de p para las diferentes células y genes para determinar si los agrupamientos observados se produjeron al azar.
Resultados
Formulamos la hipótesis de que podría usarse una citometría de flujo con los marcadores de la superficie celular ampliamente disponibles para aislar y caracterizar prospectivamente distintas poblaciones celulares de colon de ratón disociado. Mediante la tinción de las células de colon vivas disociadas individuales para ESA (también conocidas como EpCAM / Tacstd1 / CD326), una molécula de adhesión celular específica epitelial y CD45, un marcador de superficie específico hematopoyético, fuimos capaces de demostrar mediante un análisis de FACS que el colon total disociado consiste en tres poblaciones principales: células epiteliales ESA+ CD45-(60 - 80 %), células derivadas de hematopoyéticas ESA-CD45+ (5 - 10 %) y células no epiteliales no hematopoyéticas ESA-CD45-(10 35 %) (Fig. 475 A). De acuerdo con esto, la inmunohistoquímica con Esa y CD45 demostró que Esa marca la totalidad del epitelio del colon, mientras que CD45 marca una población estromal distinta (Fig. 475 B). La Figura 475 A muestra una representación gráfica de la citometría de flujo de células de colon de ratón vivas individuales teñidas para Esa (eje x) y CD45 (eje y) que revela tres nubes distintas: 1) ESA+ CD45-(epitelial), 2) ESA-CD45+ (hematopoyética) y 3) ESA-CD45-(estromales). La Figura 5 B muestra la inmunohistoquímica de colon de ratón fijado teñido para ESA (verde), CD45 (rojo) y DAPI (azul) muestra que CD45 y ESA tiñen las células no solapantes.
imagen64
A continuación aspiramos a separar la base de la cripta (enriquecida en células inmaduras) de la parte superior de la cripta (enriquecida en células maduras), dado que los estudios previos han demostrado que las células madre de colon residen en la base de la cripta. La tinción del colon murino para el gen objetivo Wnt CD44, un marcador bien establecido para la base de la cripta del colon, y para CEACAM1 / CD66a, un marcador de las células maduras en la parte superior de la cripta, confirmó que éramos capaces de teñir los extremos opuestos de las criptas con estos marcadores (Fig. 471 A, B). El CD44 marcó las membranas basolaterales, mientras que el CD66a marcó las membranas apicales.
A continuación aislamos el ARNm a partir de las células epiteliales clasificadas CD44+ CD66a-low (EsaCD45) y de las células epiteliales CD44-CD66ahigh (Fig. 1 D) y comparamos los patrones de expresión génica mediante el uso de un análisis en micromatriz así como de una PCR en tiempo real para varios marcadores conocidos de la base de la cripta y de la parte superior de la cripta. La Figura 471 A muestra que el colon de ratón fijado teñido para CD66a (rojo), ESA (verde) y DAPI (azul) muestra un gradiente de expresión de CD66a, con la tinción más fuerte cerca de la luz.
El CD66a tiñe las membranas apicales. La Figura 471 B muestra que el colon de ratón fijado teñido para CD44 (rojo), ESA (verde) y DAPI (azul) muestra un gradiente de expresión de CD44, con la tinción más fuerte en la base de la cripta. El CD44 tiñe las membranas basolaterales. La Figura 471 C muestra que el colon de ratón fijado teñido para CD24 (rojo), ESA (verde) y DAPI (azul) muestra un gradiente de expresión de CD24, con la tinción más fuerte en la base de la cripta. El CD24 tiñe las membranas apicales. La Figura 471 D muestra que la representación gráfica de la citometría de flujo de las células epiteliales de colon vivas individuales (ESA+ CD45-) teñidas para CD44 (eje x) y para CD66a (eje y) muestra las mismas poblaciones de dichas mediante la inmunohistoquímica. Una caja grande (P7) destaca las células de la base de la cripta (CD44+ CD66alow) mientras que una caja pequeña (P8) destaca las células próximas a la luz (CD44-CD66ahigh). La Figura 471 E muestra que la representación gráfica de la citometría de flujo de las células epiteliales de colon vivas individuales (ESA+ CD45-) teñidas para CD44 (eje x) y para CD24 (eje y) muestra las subpoblaciones de la base de la cripta que no son fácilmente apreciables en la inmunotinción:
CD44high CD24high, CD44med CD24high, CD44med CD24low/neg y CD44neg CD24pos.
La Figura 472 A muestra las células individuales clasificadas CD44+ CD66alow (marcadas como “base de la cripta”) y las células CD44-CD66ahigh (marcadas como “parte superior de la cripta”) que fueron caracterizadas mediante una qPCR de las células individuales. Cada fila indica una única célula y cada columna indica un gen. Rojo indica una expresión fuerte, verde indica una expresión débil, y gris indica ninguna expresión. El agrupamiento de las medias de k no supervisado (los dendrogramas están indicados en los ejes x e y) muestra distintos agrupamientos, según se indica: células LgrShigh, células Bmi1high, células caliciformes y enterocitos. La Figura 472 B muestra que el Nov / CCN3 es expresado en las células de la base de la cripta. Como se predijo mediante el análisis de la expresión génica de las células individuales, la inmunohistoquímica del colon de ratón adulto teñido con anti-Nov (A), ESA (B) y DAPI (C) muestra células Nov+ dispersas en la base de la cripta (superposición, D). Este análisis reveló que la población CD44+ CD66alow estaba muy enriquecida en los genes que se sabe que son regulados por aumento diferencialmente en la base de la cripta, incluyendo CD44, Lisozima, Lgr5, Ascl2, Axin2, Myc, Notch1, Hes1, Klf5, Mki67, Cdk4, Aqp1 y otros (algunos se muestran en la Figura 2 y 6). La Figura 6 muestra una representación logarítmica del número de veces de expresión de los genes seleccionados expresados diferencialmente (CD44+ CD66alow con respecto a CD44-CD66ahigh) muestra que los genes enriquecidos a las células CD44+ CD66alow (base de la cripta) incluyen: Aqp1, Myc, Mki67, Ascl2, Cdk4, Cftr, CD44, Dkc1, Lyz, Axin2, Lgr5 y Hes1. Los genes enriquecidos en las células CD44-CD66ahigh (parte superior de la cripta) incluyen Aqp8, Slc26a3 y Krt20.
Cabe destacar que la telomerasa (TERT) y Dkc1, la proteína holoenzima de la telomerasa esencial que se une al componente del ARN de la telomerasa (Terc), también eran expresados diferencialmente en esta población. Por otro lado, la población CD44-CD66ahigh estaba enriquecida para los genes que se sabe que son regulados por aumento en la parte superior de la cripta, incluyendo CD66a / Ceacam1, Klf4, Slc26a3, Krt20 y Aqp8 (algunos se muestran en las Figs. 472 y 476).
Debido a que en cualquier momento solo podían ensayarse unos pocos marcadores de superficie de las células, la citometría de flujo solo fue capaz de separar groseramente las células de la parte superior e inferior de la cripta, pero no pudo distinguir fácilmente los diferentes tipos de células de la parte superior o de la parte inferior de las criptas. Para definir rápidamente las diferentes poblaciones celulares a una elevada resolución (de célula individual) en el epitelio del colon normal (en estado estacionario), realizamos a continuación una expresión génica multiplexada de las células individuales de hasta 96 genes por célula. La caracterización transcripcional de las células individuales de las células CD44+ CD66alow/-y CD44-CD66ahigh (Figura 472) proporcionó una validación independiente de nuestros datos de micromatriz que muestra los genes expresados diferencialmente en la base de la cripta o en la parte superior de la cripta. También confirmó que había presentes células en ciclo (fuertemente positivas para mKi67) en las células CD44+ pero no en las células CD66ahigh (Fig. 472), en concordancia con los datos publicados.
imagen65
Importantemente, el análisis de la expresión génica de las células individuales identificó varios agrupamientos distintos de células con unos perfiles transcripcionales similares. Por ejemplo, puede identificarse un agrupamiento de células caliciformes mediante la expresión conjunta de Muc2, Tff3 y Spdef, todos los cuales se había demostrado previamente que eran genes de las células caliciformes. Notablemente, en la base de la cripta (en las células CD44+), pero no en la parte superior de la cripta, estas células mostraban una elevada expresión de diversos factores de crecimiento que habían sido implicados en la homeostasis de la cripta, incluyendo EOF, los ligandos de Notch D111 y D114 e Ihh. También eran fuertemente ESA+ (Fig. 472). Uno de estos genes expresado específicamente en este agrupamiento de células era Nov / CCN3, un gen que fue comprobado porque era uno de los más altamente expresados diferencialmente en las células CD44+ CD66alow con respecto a las células CD44-CD66ahigh, y había sido implicado en la regulación de la autorrenovación. Interesantemente, el Nov es un factor de crecimiento secretado que se ha demostrado que se une al Notch1, un receptor que es expresado por muchas células inmaduras de la base de la cripta, incluyendo las células columnares de la base de la cripta LgrS+.
Para comprobar la expresión de la proteína Nov, teñimos a continuación el colon de ratón fijado con un anticuerpo anti-Nov y averiguamos que marcaba un pequeño número de células ESA+ de base de la cripta (Fig. 473), como se predijo mediante el análisis de la expresión génica de las células individuales. La Figura 473 A muestra una sección de colon de un ratón knockin LgrS-GFP adulto teñida para DAPI que muestra varias células columnares de la base de la cripta GFP+ en la base de la cripta. La Figura 473 B muestra la representación gráfica de la citometría de flujo de las células GFPhigh a partir de colon LgrS-GFP teñido para ESA (eje x) y para CD44 (eje y) muestra que las células GFPhigh, es decir, las células LgrShigh, son ESAhigh y en su mayoría (> 80 %), CD44+. La Figura 473 C muestra la representación gráfica de la citometría de flujo de GFPhigh a partir de colon LgrS-GFP teñido para CD44 (eje x) y para CD24 (eje y) muestra que las células GFPhigh, es decir, las células LgrShigh, están excluidas del cuadrante de CD44med CD24low/-(caja roja). Véase la Fig. 471 E como referencia. La Figura 473 D muestra que la expresión génica de las células individuales para las células que expresan LgrS o Bmi1 muestra unos patrones de expresión distintos, resumidos en la Fig. 476 C. La Figura 473 E muestra un resumen de las diferencias entre las células LgrShigh y
Bmi1high.
Otra población de células que reveló el análisis de la expresión génica de las células individuales era un agrupamiento de enterocitos (que era especialmente abundante en la población CD66ahigh). Los enterocitos maduros pudieron ser identificados por la expresión de Krt20, Slc26a3 y Aqp8. Nuestro análisis en micromatriz y de las células individuales identificó el CD24a como un gen regulado por aumento en las células CD44+ CD66alow de la base de la cripta (Figura 472), por lo que a continuación nos preguntamos si podrían usarse CD24a y CD44 para subfraccionar la base de la cripta. Es de apreciar que se ha averiguado que el CD24 (también conocido como antígeno termoestable), marca las células madre cancerosas [[ así como la población clonogénica de células del intestino de ratón. La inmunohistoquímica con CD24 confirmó que esta proteína está enriquecida en la base de la cripta del colon, donde marca las membranas apicales (Fig. 471 C). Tomando como base la tinción y el análisis de la expresión génica de las células individuales, se eligió el CD24 como un potencial marcador para separar las diferentes poblaciones de células de colon. La citometría de flujo con CD24 y CD44 sobre las células epiteliales del colon (Esa+ CD45-) reveló cuatro poblaciones distintas que no son fácilmente apreciables a partir solo de la inmunohistoquímica (Fig. 471 E): CD44high CD24high, CD24+ CD44-, CD44med CD24low/-y CD44med CD24high. Estas poblaciones eran todas CD66alow, como se predijo a partir de la inmunohistoquímica que muestra que las células CD66ahigh están en la parte superior de la cripta.
Para identificar qué población(es) de la base de la cripta contienen células LgrS+, usamos a continuación nuestros marcadores de superficie para teñir el colon disociado de ratón knockin LgrS-GFP. Todas las células fuertemente positivas que expresaban la GFP (Fig. 474 A) eran fuertemente positivas para ESA, es decir, las células LgrShigh son ESAhigh (Fig. 474 A, B). Esto estaba en concordancia con nuestros datos de la expresión génica de las células individuales (Fig. 2). También, la gran mayoría de las células GFPhigh (> 80 %) eran positivas para CD44 (Fig. 474 B, C), también acuerdo con nuestros datos de las células individuales, así como con los datos de la micromatriz publicados previamente que demuestran que uno de los genes más altamente regulados por aumento en las células LgrShigh es CD44. Observamos que las células GFPhigh eran tanto CD44med como CD44high (Fig. 474 B, C). Interesantemente, todas las células LGRS-GFPhigh también eran CD24high; mientras que la población CD44med CD24low/-estaba desprovista de células GFPhigh (Fig. 474 C, caja roja). Por lo tanto, las células LgrShigh se restringen a las células CD44med CD24high y CD44high CD24high y están excluidas de la población las CD44med CD24low/-(Fig. 474 B, C). Esto se confirmó mediante un análisis de la expresión génica de las células individuales (datos no mostrados).
Una qRT-PCR de las células individuales permite un análisis preciso de la expresión génica de LgrS y de Bmi1 (Fig. 474 D), dos marcadores de las células madre intestinales cuya relación exacta era previamente desconocida. Interesantemente, las células con una mayor expresión de LgrS+ y Bmi1+ eran generalmente diferentes (Fig. 474 D). La Figura 474 A muestra unas imágenes de campo brillante representativas de los teratomas de colon (mostradas en los diferentes puntos temporales indicados) cultivadas a partir de las células individuales clasificadas. Todas las imágenes se tomaron con el mismo aumento. A los 3 días se habían formado esferoides multicelulares. A la semana pueden identificarse los teratomas con unas luces bien definidas y con unas excrecencias similares a la cripta. A las 2 semanas los teratomas son sustancialmente mayores con unas excrecencias similares a la cripta más complejas. La Figura 4 B muestra que se había fijado y teñido un teratoma de una semana cultivado a partir de células CD44+ clasificadas. Las imágenes de campo brillante (a la izquierda) muestran una excrecencia similar a la cripta, mientras que la inmunotinción (a la derecha) para CD44 (rojo), Esa (verde) y DAPI (azul) muestra que las células CD44+ están en la base de la excrecencia similar a la cripta pero no más arriba hacia la luz. La Figura 474 C muestra que la formación de colonias de las poblaciones indicadas CD24 / CD44 fue cuantificada una semana después de la colocación en placas de las células individuales clasificadas mediante FACS. Aunque las cuatro poblaciones dieron lugar a algunas colonias, únicamente las CD44high CD24high y CD44med CD24low/-eran capaces de generar teratomas con las características mostradas en la Fig. 475 A y B. La Figura 474 D muestra que la expresión génica de las células individuales de los teratomas producidos a partir de células CD44med CD24low/-(que carecen de células LgrShigh) revela todos los principales tipos celulares epiteliales de colon, incluyendo enterocitos, células caliciformes, células enteroendocrinas (ChromograninA+), células LgrS+ y células Bmi1+.
imagen66
La comparación entre las células que expresan LgrS o Bmi1 (Fig. 474) demostró que los dos genes estaban correlacionados inversamente (coeficiente de correlación de Pearson de -0,43, p < 0,0012). El análisis de la expresión génica de las células individuales de las células epiteliales de colon clasificadas a partir de LgrS-GLP de ratón produjo el mismo resultado. Estas dos poblaciones mostraban unos perfiles transcripcionales muy distintos. Las células Lgr5-high eran Esa-high, CD24-high, Actb-high y Gapdh-low, con una elevada proporción de células en ciclo (positivas para mKi67) (Fig. 476 A, C). Sin embargo, las células Bmi1-high eran Esa-low, CD24-low/neg, Actblow, Gapdh-high, con una baja proporción de células en ciclo. Es de destacar que se averiguó que las células Lgr5expresaban unos elevados niveles de varios de los genes encontrados previamente mediante el análisis en micromatriz que eran altamente expresados en esas células, incluyendo CD44, Tcf4, Axin2, Myc, Ptpro, Kifl2, Notch1 y CLTR (Fig. 472). Al contrario que las células Lgr5-high, las células Bmi1-high expresaban fuertemente Lefty1, Lefty2 y TDGF1 / Cripto (Fig. 472), miembros de una ruta de señalización que previamente habían sido implicados en el cáncer de colon. Por lo tanto, parece que en el colon, LgrShigh y Bmil1high marcan unos tipos celulares generalmente distintos con unos perfiles transcripcionales diferentes.
Para definir las características funcionales de las diferentes poblaciones clasificadas, empleamos a continuación un ensayo de formación de “teratomas” de colon en células epiteliales de colon clasificadas, mediante el uso de un protocolo modificado a partir de lo que se había publicado para los pequeños teratomas intestinales. A la semana de cultivo, las células de las placas formaron teratomas de colon identificables con una luz bien definida y unas estructuras similares a las de la cripta. Estas características se volvieron más pronunciadas a las dos semanas según crecían los teratomas y experimentaban una fisión de la cripta. La inmunotinción de estos teratomas reveló que conservaban la arquitectura de la cripta del colon normal, con las células CD44+ en la base de la cripta, y las células CD44-más cercanas a la luz. La clasificación de las células epiteliales de colon primario para CD44 demostró que las células CD44+ (las células de la base de la cripta) poseían una actividad generadora de teratomas, mientras que las células CD44-no la tenían. A continuación comparamos la actividad generadora de teratomas de las diferentes subpoblaciones de la base de la cripta mediante el uso de CD44 y CD24 (es decir, la comparación de
CD24low/
cuatro poblaciones: CD44high CD24high con respecto a CD44med CD24high con respecto a CD44med con respecto a CD44-CD24high). Aunque las cuatro poblaciones eran capaces hasta cierto punto de generar colonias (Fig. 475 C), las células CD44high CD24high eran las más eficaces en la formación de colonias. Adicionalmente, únicamente dos de las cuatro poblaciones eran capaces de generar verdaderos teratomas con una arquitectura similar a la de la cripta y una luz: CD44high CD24high (que portan células Lgr5-high) y CD44med CD24low/-(que carecen de células Lgr5-high).
CD24low/-
Para determinar si las células CD44med podrían generar teratomas con todos los tipos celulares diferenciados del colon normal - así como células LgrS+ - aislamos tres teratomas de un mes de edad cultivados a partir de células CD44med CD24low/-, los disociamos en una suspensión de células individuales, colocamos las células individuales en pocillos individuales de varias placas de 96 pocillos mediante el uso de un nuevo manipulador celular microscópico diseñado especialmente, y a continuación llevamos a cabo una caracterización de la expresión génica de las células individuales mediante el uso del sistema Fluidigm™. El análisis demostró que los teratomas contenían ambas células CD44+ y CD44-y tenían los diversos tipos celulares presentes en el colon normal, incluyendo células caliciformes (Muc2+ Tff3+ Spdef+), enterocitos (Aqp8+ Slc26a3+ Krt20+), células enteroendocrinas (ChromograninA+), células Lgr5+ y células Bmi1+. Debido a que se caracterizó el total de las células (sin clasificar), en lugar de las células clasificadas CD44+ CD66alow o CD44-CD66ahigh, las proporciones entre los diferentes tipos de células epiteliales de colon eran ligeramente diferentes de lo que se observó con las células CD44+ CD66a-low con respecto a CD44- CD66a-high (Fig. 472). El hecho de que las células sin la expresión de Lgr5 (células CD44med CD24low/-) sean capaces de dar lugar a células Lgr5+ sostiene que la autorrenovación no es una propiedad única de las células Lgr5+ del epitelio del colon.
Ejemplo 44. Las jerarquías celulares del epitelio normal y maligno de mama son reveladas mediante un análisis de la expresión génica de las células individuales
La sangre, el cerebro, la glándula mamaria, el intestino delgado y el colon son ejemplos de tejidos mantenidos por las células madre que experimentan una serie de divisiónes de maduración para producir células progenitoras, que finalmente se diferencian en las células maduras de vida corta en sus respectivos tejidos. Cada compartimento celular de tejido normal expresa un repertorio único de receptores y de componentes de la ruta de señalización que gobiernan cómo responden a las citocinas y a otros componentes del microentorno. La identificación de cada compartimento celular de un órgano o tejido permite la disección de los factores que gobiernan los procesos esenciales, tales como el autorrenovación, el mecanismo por el que las células madre se regeneran a sí mismas, la supervivencia, la diferenciación y la proliferación. Los cánceres contienen a menudo células que se parecen a las del órgano normal en el que surgen. Por lo tanto, la comprensión de la regulación molecular de estos procesos tiene unas ramificaciones importantes tanto en medicina regeneradora como en el desarrollo de nuevas terapias oncológicas.
imagen67
Tomando como base el modelo del sistema sanguíneo, la caracterización de la jerarquía celular en un tejido implica un amplio proceso en el que las células son aisladas mediante FACS según la expresión de las combinaciones de los marcadores de la superficie celular, y a continuación se someten a ensayos funcionales para evaluar su potencial de regeneración, de proliferación o de diferenciación. La mayoría de los marcadores que son expresados diferencialmente por un compartimento parcialmente enriquecido en células madre o progenitoras no permite un enriquecimiento adicional en las células de interés. Además, los análisis del ARN y proteómicos de las células parcialmente enriquecidas aisladas mediante citometría de flujo o microesferas magnéticas están enturbiados por las células progenitoras inmaduras, que pueden compartir en algunos casos los marcadores de expresión con las células madre. Estos ensayos poblacionales promediados pueden enmascarar una importante información sobre las células madre, dado que a menudo constituyen unas subpoblaciones de células pequeñas o raras. A pesar de estas dificultades, el esfuerzo para la identificación de las células en la jerarquía de diferenciación de algunos tejidos ha sido notablemente productivo. Por ejemplo, las metodologías clásicas de la biología de las células madre revelaron muchos compartimentos, tales como las células progenitoras mieloides y linfoides comunes del sistema sanguíneo. Además, la capacidad para identificar una célula madre (hematopoyética) sanguínea muy enriquecida (HSC) ha permitido la identificación de los reguladores críticos de las funciones de las HSC, tales como la autorrenovación.
En los tejidos epiteliales tales como el de mama, se ha caracterizado parcialmente la jerarquía celular y las pertinentes redes reguladoras. Dos grupos averiguaron que podrían usarse los marcadores de la superficie celular CD49f, CD29 y CD24 (integrina α6, integrina β1 y el antígeno del agrupamiento del carcinoma de pulmón microcítico 4, respectivamente) para enriquecer parcialmente en células madre de mama murinas (MRU) así como en una población de células luminales con un potencial clonogénico (MaCFCs). Weinberg y sus colegas encontraron unos mayores niveles de los genes asociados con una transición epitelial-mesenquimatosa de las células (EMT) en el subconjunto de poblaciones de células aisladas mediante el uso de los fenotipos asociados con las células de mama normales, y un subconjunto de células cancerosas enriquecidas en células que eran oncogénicas en ensayos de xenotrasplantes que en poblaciones más diferenciadas de células epiteliales de mama normales o malignas. Adicionalmente, averiguaron que la expresión obligatoria de los genes de la EMT Snail y Twist en células epiteliales de mama humanas inmortalizadas transformadas Her2 / neu producía células con el fenotipo de célula madre cancerosa. Sin embargo, no se sabe si todas las células de mama endógenas han experimentado una EMT. De forma análoga, el fenotipo de la célula madre de mama es confuso. Algunos grupos han sugerido que el fenotipo de las células progenitoras de mama humanas tempranas es CD49f+ EPCAM-/low, mientras que otras pruebas sugieren que podría ser CD49f+ EPCAM+.
La heterogeneidad celular de los cánceres de mama no es comprendida. Los análisis de micromatriz de los tumores completos revelan al menos 6 subtipos potencialmente diferentes de cáncer de mama basándose en los patrones de expresión génica. Existen 3 tipos de tumores que expresan el receptor de estrógenos y genes específicos del tipo de célula luminal (luminal A, B y C). Se ha especulado que estos tumores ER+ surgen a partir de una célula luminal. La observación de que la activación forzada de la ruta Notch dio lugar a la especificación y la proliferación de la célula luminal en células de mama de ratón reforzó la noción de que estos tumores están formados por células luminales transformadas ER+. Sin embargo, debido a que los compartimentos de células madre y progenitoras de mama no están bien definidos, no se sabe si las células de cáncer de mama ER+ son exclusivamente células luminales. Estos tumores pueden estar formados por una población enriquecida de células madre de mama o de células epiteliales luminales. De forma análoga, el origen de los tumores con un fenotipo de “célula basal”, observado habitualmente en los pacientes con mutaciones en el BRCA, es debatido activamente. Finalmente, se ha propuesto que el subtipo “claudin-low” es un tumor formado por células madre de mama, pero de nuevo esto no ha sido totalmente validado. Estas hipótesis sobre la célula de origen se basan en los estudios de expresión génica de tumores completos que asumen que el tumor está formado por una población homogénea de células derivadas a partir de una célula epitelial de mama detenida en un estadio de diferenciación en particular. Es posible que los tumores contengan poblaciones menores de células en otros estadios de diferenciación, y que el perfil de expresión génica refleje principalmente únicamente una mayoría de la población de células. Para obtener una visión adicional sobre las células madre de mama y la biología del tumor, llevamos a cabo un estudio para analizar poblaciones de células parcialmente enriquecidas a nivel de la célula individual. Demostramos que este sistema puede usarse con éxito en el descubrimiento de marcadores de células madre y permite conocer la arquitectura del tejido normal y maligno.
PROCEDIMIENTOS EXPERIMENTALES
Tejidos, disociación de mama y citometría de flujo
Todos los animales usados en el estudio eran ratones C57BL/6 o pCx-GFP que se mantuvieron en el Stanford Animal Facility de acuerdo con las directrices de ambos Institutional Animal Care Use Committees. Se obtuvo tejido humano normal y canceroso a partir de pacientes que lo consintieron según aprobó el Research Ethics Boards de la Universidad de Stanford. Se sacrificaron ratones de entre seis y diez semanas de edad, y se extrajeron quirúrgicamente todas las almohadillas grasas. El tejido se digirió con L-15 o DMEM/F12 durante 1,5 h y después se procesó como se ha descrito previamente. Las muestras de mama humana se disociaron mecánicamente y se incubaron con 200 unidades/ml de colagenasa de tipo III (Worthington) y 100 unidades/ml de DNasa I. Para los anticuerpos de ratón, los CD24-PE, CD24-Cyc Thy-1.1-APC, Thy-1.1-PE-Cy7, Thy-1.2-APC, Thy-1.2-PE-Cy7, CD66a-PE se obtuvieron en eBioscience™, los CD49f-Cyc, CD45-Bio, Ter119-Bio, CD31-Bio y CD140α se obtuvieron en BD Pharmingen™ y el Streptavidin-Pacific Blue™ se obtuvo en Invitrogen™. Para las muestras humanas, la citometría de flujo se llevó a cabo como se ha descrito realizó previamente. Los CD49f-FITC y EpCam-APC se obtuvieron en BD. La citometría de flujo de todos los experimentos se llevó a cabo mediante el uso de un BD FACSAria™ o de un FACSAria II™ equipado con un láser UV.
imagen68
Ensayos de formación de colonias in vitro
Los ensayos de formación de colonias de NIH3T3 in vitro se llevaron a cabo como se ha descrito previamente. En resumen, las células NIH3T3 irradiadas se colocaron en placas de cultivo tisular de 24 pocillos (Costar™) en medio Epicult™ más un 5 % de FBS (Stem cell Technologies™). Después, las células clasificadas se colocaron placas y se cambió el medio por medio exento de suero 24 h después. Después de 7 días, las colonias se tiñeron con Wright Giemsa y se contaron. Para los ensayos en 3D / 2D, se prepararon portaobjetos de cultivo con cámaras de 8 pocillos (BD™) con una capa alimentadora de células NIH3T3 irradiadas recubierta con 100 μl de factor de crecimiento reducido Matrigel (BD™). Después las células clasificadas se colocaron en placas con medio líquido según se ha descrito previamente, excepto porque se usaron 250 ng/ml de Rspo I (R&D Systems™) y un 10 % de FBS. Después de 10 días, las colonias se fijaron con un 4 % de PFA y se tiñeron como se ha descrito previamente. Todas las imágenes se produjeron con un microscopio de fluorescencia invertido Feica DMI6000B™ con el programa informático Image Pro.
Transplantes in vivo
Las poblaciones de células clasificadas se recogieron en medio de tinción y se resuspendieron en 10 μl de PBS estéril por trasplante antes de ser inyectadas en las almohadillas grasas extraídas de los ratones receptores C57B1/6 de 21 - 28 días de edad como se ha descrito previamente. Para todas las inyecciones de 600 células y por debajo, los recuentos se verificaron mediante el uso de un recuento de tinción nuclear (1 % de Trypan Blue / 0,1 % de Triton-X 100 en PBS) o un recuento celular por GFP+. Para las inyecciones de células individuales, las células GFP+ se clasificaron en 4 μl de factor de crecimiento reducido Matrigel al 25 % (BD™) en placas Terasaki, y cada pocillo se puntuó y se confirmó visualmente antes del transplante. Después del trasplante se comprobaron de nuevo los pocillos vacíos bajo un microscopio para verificar la administración de la célula. Las células se inyectaron en volúmenes de 10 o de 5 μl mediante el uso de una jeringa Hamilton de 25 μl. Todos los trasplantes se dejaron crecer durante al menos 5 semanas pero no más de 10 semanas antes del análisis. En el caso de trasplantes secundarios, se seccionaron las glándulas completas bajo fluorescencia para obtener fragmentos de 1 -2 mm de tejido que contenían las estructuras ductales GFP+ que fueron trasplantadas en los ratones receptores.
Aislamiento del ARN y qRT-PCR
Las poblaciones celulares clasificadas se recogieron directamente en medio de tinción y después se centrifugaron a
5.000 rpm durante 5 min a 4C. Después se extrajo cuidadosamente el sobrenadante del sedimento de células, que inmediatamente se congeló en N2 líquido y se almacenó a -80 ºC hasta la extracción del ARN. El ARN se extrajo a partir de los sedimentos celulares congelados con Trizol. Para la RT-PCR, el ARN se convirtió a continuación en ADNc mediante el uso del sistema Superscript III Reverse Transcriptase (Invitrogen™). Después se llevó a cabo la qRT-PCR sobre el ADNc reciente con la mezcla maestra 2X Taqman (Applied Biosystems™) de acuerdo con las instrucciones del fabricante con los cebadores Taqman frente a Thy-1 (Mm01174153_ml, Applied Biosystems™) en una máquina de PCR en tiempo real 7900HT (Applied Biosystems™).
Expresión génica de las células individuales
Los experimentos de expresión génica de las células individuales se llevaron a cabo como se ha descrito previamente. En resumen, usamos los chips microfluidos de qPCR M48 y M96 DynamicArray (Fluidigm™) con 48
(96) genes y 48 (96) entradas para muestras. Las células individuales se clasificaron mediante FACS en placas de 96 pocillos que contenían una mezcla de PCR (CellsDirect, Invitrogen™) e inhibidor de la RNasa (Superaseln, Invitrogen™). Las células se lisaron en el entorno hipotónico y las placas se congelaron inmediatamente. Después descongelamos los lisados celulares, añadimos las enzimas de la RT-qPCR (Superscript III RT/Platinum Taq, Invitrogen™) y también una mezcla que contenía un conjunto de ensayos diluido (cebadores / sondas) de una lista de 96 genes predeterminados. El ARNm de los lisados celulares se retrotranscribió (15 minutos a 50 ºC, 2 minutos de 95 ºC) y se preamplificó durante 20 ciclos de PCR (cada ciclo: 15 s a 95 ºC, 4 minutos a 60 ºC). Los controles de ARN total (ARN embrionario total de ratón o ARN de Hela; Applied Biosystems™) se analizaron en paralelo para validar los resultados. El ADNc amplificado resultante de cada una de las células se insertó en las entradas para muestras del chip con la mezcla de qPCR Taqman (Applied Biosystems™). Los ensayos individuales (cebadores / sondas) se insertaron en las entradas para muestras del chip. El chip se cargó durante una hora en un cargador de chips (Nanoflex, Fluidigm™) y después se transfirió a un lector (Biomark, Fluidigm™) para el termociclado y la cuantificación fluorescente. Los datos de la expresión génica de las células individuales se analizaron adicionalmente mediante el uso de MATLAB (MathWorks™).
imagen69
Análisis de los datos de las células individuales
Se analizaron los datos de la qPCR de cientos de células individuales. Eliminamos las células que no expresaban los genes constitutivos ACTB (Beta-actina) y GAPDH (deshidrogenasa de gliceraldehído-3-fosfato) sobre la asunción de que estas células estarían muertas o dañadas; éstas eran una minoría, y suponían el 5 % de las células de ratón,
5 el 15 % de las células humanas y el 5 % de las células cancerosas. Los genes se estandarizaron mediante un centrado de la media y dividiendo por la desviación típica de las células en expresión, y agrupando mediante el uso de las herramientas estándar de la caja de herramientas bioinformática MATLAB. Se llevó a cabo el agrupamiento jerárquico de ambos, tanto de los genes como de las células, con una distancia euclídea y una unión completa. El agrupamiento reveló distintos grupos de células, caracterizado cada uno por su propio perfil de expresión génica.
10 Estos grupos se corresponden con los diferentes fenotipos celulares del tejido. Para los datos de mama de ratón, usamos el paquete R pamr (análisis predicho para micromatrices para R) para realizar una validación cruzada de los perfiles de expresión génica de las células individuales con los fenotipos de la citometría de flujo. Refinamos el marcaje del fenotipo de célula de ratón de acuerdo con los datos de la citometría de flujo y de la expresión génica. Usamos el paquete R clusterRepro™ para asignar marcajes a los datos de las células individuales humanas de
15 acuerdo con los tipos celulares de ratón y para calcular los valores de p para la reproducibilidad del tipo celular.
Análisis de los datos de la expresión génica publicados previamente sobre tumores de mama voluminosos
Se analizaron los datos de la micromatriz Affymetrix de las muestras de tumores de mama voluminosos GSE145 6, GSE3494 y GSE19615. Descargamos los archivos CEL raw del NCBI Gene Expression Omnibus y preprocesamos los tres conjuntos de datos por separado con una arquitectura idéntica. Normalizamos los datos con el algoritmo GC20 RMA y combinamos las matrices HG-Ul33A y HG-Ul33B mediante el cálculo de la media de conjuntos de sondas idénticos. Cartografiamos las sondas con respecto a los genes mediante el uso del programa informático
Bioconductor (http://www.bioconductor.org) y elegimos para cada gen el conjunto de sondas individual con la mayor desviación típica. Los valores de control negativo se calcularon como la media de 24 conjuntos de sondas (3 de cada uno para LysX, PheX, ThrX TrpnX, Bs-dap, Bs-lys, Bs-phe y Bs-thr). Seleccionamos tumores positivos para ER
25 a partir de cada conjunto de datos basándonos en las anotaciones clínicas disponibles y el agrupamiento jerárquico aplicado, con la unión promedio basada en la expresión de los marcadores luminales y basales conocidos.
RESULTADOS
Análisis de las células individuales de células epiteliales de mama de ratón y humanas
La jerarquía celular del epitelio de mama solo se ha definido parcialmente. Nos preguntamos si podríamos
30 desarrollar un perfil de células individuales para analizar y definir mejor los diferentes compartimentos celulares. Se usó una citometría de flujo para separar las células epiteliales de mama de ratón en los siguientes compartimentos: CD24med CD49fhi (MRU), CD24hi CD49fmed (MaCFC), CD24low CD49fmed (MYO) y CD24med CD49f/low (Figura 48). La Figura 482 muestra que las células epiteliales de mama de ratón disociadas se tiñeron para los anticuerpos de estirpe (CD45, CD31 y Ter119). Se analiza la expresión de las células Lineage-de CD24 y CD49f.
35 Se han dibujado las clasificaciones para indicar el fenotipo de las células MRU, MYO, MaCFC y CD24med CD49f/low.
Clasificamos las células individuales procedentes de cada uno de estos compartimientos y las analizamos con una PCR en tiempo real multiplexada microfluidamente. El agrupamiento jerárquico de los datos de las células individuales sobre la base de una lista selectiva de 31 ensayos de expresión génica demostró que el dendrograma resultante es muy coherente con los 4 compartimentos de mama de ratón según la citometría de flujo (Tabla 5). En
40 la tabla 5, la matriz de confusión de validación cruzada muestra que los marcadores de clasificación de la FACS son coherentes con el agrupamiento de la expresión génica mediante el uso de un panel extendido de 53 genes para la mayoría de las clases (índice de error < 0,09), aparte de las MRU y de las MYO, que no están muy bien separadas. El índice de error global es de 0,107. Se lleva a cabo una validación cruzada de K veces (K = 10) mediante el uso del paquete “pamr” R.
45 Tabla 5: los perfiles de expresión génica de las células individuales separan groseramente 4 fenotipos clasificados mediante FACS en tejido de mama de ratón.
Pred: CD24med CD49f/low
Pred: MaCFC Pred: MRU Pred: MYO Índice de error para este tipo de células
Real: CD24med CD49f/low
148 11 0 0 0,06918239
Real: MaCFC
7 153 1 3 0,06707317
Real: MRU
4 3 144 7 0,08860759
Real: MYO
0 2 22 56 0,30000000
imagen70
5
10
15
20
25
Coherentes con los informes previos, las queratinas eran expresadas diferencialmente entre las células del compartimento basal (MRU y MYO) y luminal (MaCFC y CD24med CD49f/low). Un informe previo demostró la dificultad para distinguir entre las dos poblaciones que forman el compartimento basal mediante un análisis en micromatriz. En nuestros datos, las MRU tienen una elevada expresión de Krt5, Itgb1 (CD29), Actb, Hes6, Dock9 e Itga6 (CD49f) mientras que las MYO expresaban unos mayores niveles de Gapdh, Egfr, Dsgla y Mfhas1 (Figura 486). La Figura 486 muestra La columna coloreada “marcaje para la clasificación mediante FACS” se corresponde con los tipos celulares de mama de ratón definidos por la citometría de flujo. La columna coloreada de “marcaje manual” se corresponde con los tipos celulares que fueron marcados de forma manual de acuerdo con el agrupamiento de la expresión génica de las células individuales y los fenotipos de la citometría de flujo (Figura 471). (Marcaje manual: CD24med CD49f/low -Amarillo, MRU Zebl+-Cian, desconocida / estromal -Negro, MYO -Verde, MRU ZebF -Azul, MaCFC -Rojo; marcaje para la clasificación mediante FACS: CD24med CD49f/low -Amarillo, MYO -Verde, MRU -Azul, MaCFC - Rojo).
Estos genes eran expresados significativamente diferencialmente entre los compartimentos de MRU y de MYO de mama clasificados mediante FACS, con un valor de p < 0,0009 (véase la Tabla 6 y 18). En la tabla 6, si una de las dos medianas eran iguales o si una prueba estadística dio significación (es decir, a un valor bajo de p) y la otra no, comprobamos visualmente los histogramas. La mayoría de los valores de p están muy por debajo de 0,0009, que es el umbral de significación con la corrección de Bonferroni para 55 genes. En la Figura 488, el Gapdh, por ejemplo, es muy expresado en las MYO debido a que hay una mayor fracción de células MYO que expresan unos ciclos umbral de qPCR menores que las MRU. El Fles6 es muy expresado en las MRU debido a que hay una mayor fracción de MRU que expresan unos ciclos umbral de qPCR menores que las MYO.
Tabla 6: genes que se averiguó que eran expresados diferencialmente entre los compartimentos de MRU y de MYO de mama clasificados mediante FACS
Compartimento Valor de p
Nombre del Mediana Mediana Valor de p
con la mayor (Kolmogorov-Notas
gen (MYO) (MRU) (Wilcoxon)
expresión génica Smirnov)
Suz12
21,9582 22,8171 MYO 0,001171461 0,000366734 Cercano a la significación
Mfhas1
23,6298 27,6984 MYO 0,000880318 0,000109467 Significativo
Krt5
19,1204 17,4047 MRU 1,3855 E-08 5,73459 E-14 Significativo
Itgb1
17,7798 17,0602 MRU 1,2911 E-08 2,2413 E-08 Significativo
Itga6
18,9102 18,19 MRU 0,000167178 0,000147685 Significativo
Hes6
40 40 MRU 3,91471 E-08 2,04173 E-05 También de acuerdo con los histogramas
Gapdh
16,3425 19,3483 MYO 3,09622 E-25 5,91433 E-26 Significativo
Egff
22,7161 26,8397 MYO 4,91702 E-08 8,46838 E-10 Significativo
Dsg1a
40 40 MYO 0,00053549 0,000756916 También de acuerdo con los histogramas
Dock9
40 24,5234 MRU 5,40548 E-06 3,72054 E-05 Significativo
Cdkn2a
40 40 MYO 0,4439157 9,8621 E-05 También de acuerdo con los histogramas
Actb
14,9435 14,0226 MRU 8,68264 E-08 4,71069 E-07 Significativo
Dos publicaciones recientes informaron de que las células con el fenotipo CD24med CD49f/low pueden tener una capacidad funcional diferente en comparación con las MaCFC. Tomando como base el análisis de las células individuales, parece que las MaCFC y las CD24med CD49f/low tienen unas firmas de expresión génica diferentes. Las MaCFC expresaban unos niveles mayores de TbxS, Prkar2b, Trim24, ErbbS, Krt19, Cdh1, Actb, Itgb1 e Itga6 (Figura 486). Con respecto a las células MaCFC, las células CD24med CD49f/low tienen una elevada expresión de Dock9 y de Egfr, lo que sugiere que este fenotipo está enriquecido en un tipo distinto de célula luminal. Estos genes eran significativamente diferencialmente expresados entre los compartimentos de MaCFC y de CD24med CD49f/low de mama clasificados mediante FACS con un valor de p < 0,0009 (véase la Tabla 7 y la Figura 489). En la tabla 7, si alguna de las dos medianas eran iguales comprobamos visualmente los histogramas. La mayoría de los valores de p están muy por debajo de 0,0009, que es el umbral de significación con la corrección de Bonferroni para 55 genes.
imagen71
Tabla 7: genes que se averiguó que eran expresados diferencialmente entre los compartimentos de MaCFC y de CD24med CD49f/low de mama clasificados mediante FACS
Nombre del gen
Mediana (CD24med CD49f/low) Mediana (MaCFC) Compartimento con la mayor expresión génica Valor de p (Wilcoxon) Valor de p (Kolmogorov-Smirnov) Notas
Trim24
40 20,6554 MaCFC 1,81818 E-22 2,17019 E-18 Significativo
Tbx3
40 19,9284 MaCFC 8,41071 E-38 5,84983 E-38 Significativo
Prkar2b
40 19,1424 MaCFC 3,85283 E-40 1,94057 E-40 Significativo
Krt19
18,486 15,7842 MaCFC 1,22132 E-36 1,99648 E-37 Significativo
Itgb1
18,8572 17,7852 MaCFC 4,60042 E-24 4,08945 E-18 Significativo
Itga6
20,7919 18,3212 MaCFC 2,57968 E-39 1,3924 E-36 Significativo
Erbb3
21,2842 18,0199 MaCFC 5,59807 E-41 3,91214 E-40 Significativo
Egfr
40 40 CD24med CD49f 8,83815 E-15 2,94421 E-12 También de acuerdo con los histogramas
Dsg1a
27,3583 34,9702 CD24med CD49f 0,002027662 0,001301938 Cercano a la significación
Dock9
24,1156 40 CD24med CD49f 7,31942 E-06 3,65688 E-06 Significativo
Ceacam1
19,8382 20,4104 CD24med CD49f 0,02848461 0,00259607 Marginalmente significativo
Cdh1
17,3463 16,0728 MaCFC 1,74142 E-21 6,05545 E-21 Significativo
Actb
15,1494 13,3641 MaCFC 2,15836 E-26 4,95824 E-24 Significativo
Informes recientes han demostrado que el epitelio de mama humano también está organizado jerárquicamente. Las poblaciones que se han descrito mediante el uso de la citometría de flujo son MRU, MaCFC y células luminales 10 diferenciadas. EstaspoblacionesteníanunosfenotiposCD49FhiEPCAM-/ow, CD49F+EPCAM+yCD49F-/low EPCAM+, respectivamente. Para investigar si una lista de expresión génica podría distinguir las poblaciones similares como observamos en el epitelio de mama de ratón, analizamos una muestra de células de mama humanas a nivel de las células individuales. Las células se clasificaron mediante el uso de una estrategia de "L-gate invertida" según la expresión de CD49f y de EpCam para eliminar las células estromales. El análisis mostró que los agrupamientos de 15 células con unas firmas similares a los fenotipos de células de ratón también están presentes en los datos humanos con una elevada significación estadística (Tabla 5). Añadimos la expresión de EpCam (Tacstd1) independiente de los genes usados para el agrupamiento, para la validación de los fenotipos de los distintos agrupamientos de
EPCAMmRNA/low
células. Las células basales CD49FmRNahl expresaban los genes NOTCH2, CEACAM1, CDH1, GAPDH, SUZ12, ACTB, ITGB1, EGFR, KRT17, KRT14, KRT5 y KRT8 a un nivel entre alto el intermedio. En el 20 compartimento luminal se observaron dos agrupamientos distintos de células luminales: células CD49FARNm+
EPCAMmRNAhi+ y CD49FmRNA/low EPCAMmRNAmed/low EpCAMmRNmed/low
. Las células CD49FmRNA-expresaban unos
EPCAMmRNhi+
elevados niveles de KRT19, KRT18 y GAPDH. Las células CD49FARNm+ expresaban NOTCH1, NOTCH2, DOCK9, CEACAM1, TRIM24, ERBB3, KRT19, CDH1, KRT18, GAPDH, SUZ12, ITGBI, LRIG1 y KRT8 a un elevado nivel. Estos resultados demuestran que puede usarse un análisis de la expresión génica cuantitativa
25 múltiple de las células individuales para la identificación de las células en la jerarquía de diferenciación del epitelio de mama de ratón y humano. Además, nuestros datos muestran la sorprendente similitud entre el epitelio de mama de ratón y humano.
El análisis de las células individuales del fenotipo enriquecido de células madre de mama clasificadas mediante citometría de flujo identifica múltiples compartimentos distintos de células madre y progenitoras
30 Varios grupos han mostrado que ~ 1 / 64 células epiteliales de mama de ratón individuales aisladas mediante el uso de una citometría de flujo mediante el uso de los marcadores que definen su fenotipo MRU, pueden producir una excrecencia ductal. La razón por la que no todas las MRU pueden producir excrecencias ductales podría ser debido a las limitaciones técnicas del procedimiento del transplante y/o a la heterogeneicidad de los tipos celulares que expresan los marcadores “MRU”. Nuestro análisis de las células individuales sugirió que las MRU son una población heterogénea tanto en la mama de ratón como en la humana. Se analizaron las células clasificadas por duplicado para comprobar la expresión de múltiples genes para cada célula. El dendrograma de la izquierda muestra el agrupamiento jerárquico de las células basándose en la similitud del perfil de expresión génica. El dendrograma superior muestra el agrupamiento de la expresión del ensayo del gen para todas células. La expresión del gen Esrl se muestra independientemente en la columna de la derecha, dado que no se usó para el agrupamiento de las células. El fenotipo de la citometría de flujo de cada célula está codificado por colores y se muestra en la columna de “marcadores de la FACS” y en la leyenda anexa. La asignación de cada célula a uno de los seis tipos celulares se muestra en la columna de “asignación manual” y en la leyenda anexa. Las líneas continuas negras muestran las divisiones entre los agrupamientos celulares. El enriquecimiento para un tipo celular asignado manualmente en un agrupamiento de células está descrito por las etiquetas de texto de la derecha. Las etiquetas inferiores muestran el símbolo oficial del gen. El (los) círculo(s) coloreado(s) por debajo de un símbolo del gen indica(n) que el tipo celular asignado manualmente expresa ese gen a un elevado nivel, según se describe mediante las comparaciones en el texto principal. La barra de escala muestra el gradiente de expresión representado en el mapa térmico. Las células clasificadas por duplicado se analizaron para comprobar la expresión de un conjunto de genes similares a los usados en el análisis de ratón. El dendrograma de la izquierda muestra el agrupamiento jerárquico de las células basándose en la similitud del perfil de expresión génica. Los dos ensayos marcados como “Independientes” (Esr1, Tacstd1) no fueron usados para el agrupamiento. Sobre la base de la correlación con uno de los 6 centroides computados en los datos de ratón, se asigna cada célula a un tipo celular con el que es más similar según el perfil de expresión génica (columna “etiquetas asignadas a partir de ratón” y leyenda anexa). Se averiguó que cada uno de estos 6 tipos de células de ratón estaba significativamente presente en el tejido normal humano. Tomando como base el agrupamiento jerárquico de las células y las asignaciones de las células, las células se dividieron en los grupos mostrados por las líneas discontinuas. El enriquecimiento de un tipo celular está descrito por las etiquetas de texto a la derecha del mapa térmico. Las etiquetas inferiores muestran el símbolo oficial del gen. El (los) círculo(s) coloreado(s) por debajo de un símbolo del gen indica(n) que el agrupamiento celular expresa ese gen a un elevado nivel, según se describe mediante las comparaciones de texto principal. La barra de escala muestra el gradiente de expresión representado en el mapa térmico.
imagen72
Para investigar si podría usarse un análisis de la expresión génica mediante una RT-PCR cuantitativa multiplexada para descubrir marcadores que enriquecen en células madre de mama, cribamos la expresión de los marcadores de la superficie de la célula. Averiguamos que el Thy-1, un marcador que previamente habíamos encontrado marcado en las células madre cancerosas en los tumores de mama de ratones transgénicos MMTV-Wnt-1, marcaba un subconjunto de células basales en la mama humana (Figura 483). En la figura 483 se muestran los histogramas de los ciclos umbral de la qPCR para THY-1 a partir de una población de células individuales basales (CD49f++ / EpCam-/low) y luminales (CD49f-/low EpCam++). Una fracción mayor de las células basales expresaba unos niveles significativamente mayores de ARNm (menores ciclos umbral) de THY-1. Tanto la prueba de Kolmogorov-Smirnov (para comprobar la diferencia entre dos distribuciones) como la de suma de rangos de Wilcoxon (para comprobar la diferencia entre las dos medianas) proporcionaron unos valores de p < 0,001.
La Figura 478 muestra la expresión génica de las células individuales de las células epiteliales de mama humanas normales que incluyen el Thy-1. La flecha indica el ensayo de expresión para el Thy-1. Las células se agruparon jerárquicamente según la similitud de su perfil de expresión génica (dendrograma de la izquierda). Los ensayos (etiquetas inferiores) también se agruparon jerárquicamente (dendrograma superior). Las etiquetas de la derecha y la línea de color púrpura delimitan los agrupamientos de células que expresan las queratinas basales y luminales. La barra de escala muestra el gradiente de expresión representado en el mapa térmico. La Figura 478 B muestra una expresión de la PCR en tiempo real del Thy-1 en poblaciones epiteliales de ratón clasificadas por duplicado aisladas mediante una citometría de flujo de acuerdo con los fenotipos indicados. Los datos representan tres experimentos independientes. Las barras de error son ± la desviación típica. La Figura 478 C muestra a la izquierda la representación gráfica de la citometría de flujo que muestra la expresión del Thy-1 en el compartimento de las MRU. El histograma de linaje muestra la separación para eliminar las células no epiteliales (CD45+ CD31+ Ter119+). Se muestran unas imágenes representativas de las excrecencias ductales de GFP+ en un trasplante primario, secundario y terciario (donde sea aplicable). Todas las imágenes están tomadas con un aumento de 100X. La Figura 478 D muestra la imagen de un trasplante de células individuales primarias producidas a partir del fenotipo GFP+ Thy-1+ CD24med CD49fhi. E. Representaciones gráficas representativas de la citometría de flujo de una excrecencia ductal secundaria GFP+ Thy-1+ CD24med CD49fhi basada en la expresión de CD24, de CD49f y de Thy-1. Las gráficas están seleccionadas para las células de la estirpe GFP+.
Nos preguntamos si el Thy-1 podría enriquecer adicionalmente para las células madre de mama mediante el uso de un trasplante. Las células de mama de ratón inmaduras tenían una expresión diferencial del Thy-1 a nivel del ARNm y de la proteína (Figura 478 B, 478 C). Mediante el uso de una citometría de flujo se subdividieron las células epiteliales de mama de ratón en células Thy-1+ CD24med CD49fhi y Thy-1-CD24med CD49fhi y se trasplantaron a una dilución limitante (Tabla 8). En la tabla 8, las células procedentes de la población indicada (etiquetas superiores) se clasificaron por duplicado y se trasplantaron a una dilución limitante en las almohadillas grasas extraídas de los
imagen73
5
10
15
20
ratones receptores naturales. Los trasplantes están representados como excrecencias positivas / transplantes totales.
Tabla 8. Injerto de las poblaciones de mama de ratón fenotípicas aisladas mediante una citometría de flujo
Volumen
Lin- CD24med CD49fhi (MRU) Thy-1+ CD24med CD49 fhi Thy-1-CD24med CD49fhi
250K
1 / 1 - - - -
133K
2 / 2 - - - -
100K
3 / 4 - - - -
50K
- 3 / 3 - - -
25K
4 / 8 11 / 18 - -
20K
- 5 / 7 - - -
10K
- 13 / 22 2 / 2 - -
5K
- 1 / 4 - - -
3K
- - 2 / 3 2 / 2 1 / 2
1K
- - 4 / 4 3 / 7 1 / 3
600 células
- - - 1 / 2 0 / 2
400 células
- - - 2 / 4 0 / 4
300 células
- - 2 / 3 3 / 6 1 / 3
250 células
- - - 2 / 2 0 / 3
200 células
- - 5 / 11 5 / 11 0 / 5
100 células
- - 4 / 13 25 / 44 2 / 30
50 células
- - - 13 / 31 1 / 24
30 células
- - - 12 / 15 0 / 9
5 células
- - 2 / 14 7 / 29 2 / 30
1 célula
- - - 4 / 35 -
Las células Thy-1+ CD24med CD49fhi dieron lugar a excrecencias ductales que podrían ser trasplantadas sucesivamente (Figura 478 C, 478 E). Estas células también eran capaces de una diferenciación alveolar, demostrando que pueden producir un epitelio ductal funcional (Figura 484). En la figura 484, secciones de epitelio trasplantado primario, secundario y de embarazada derivado de células Thy-1+ CD24med CD49fhi. Los paneles de la parte superior de la Figura 484 A muestran la tinción con hematoxilina y eosina para demostrar que el epitelio trasplantado tenía una morfología similar comparado con el del tipo natural. Las imágenes de inmunofluorescencia de la parte inferior muestran secciones teñidas para Krt8 (verde, para marcar las células luminales) y Krt14 (rojo, para marcar las células mioepiteliales). La tinción muestra que el epitelio trasplantado contiene ambos tipos de compartimentos celulares. Todas las imágenes están tomadas con un aumento de 200X. La Figura 484 B muestra que el epitelio trasplantado es capaz de una diferenciación alveolar. Los paneles superiores muestran la tinción con hematoxilina y eosina del epitelio trasplantado natural y secundario en hembras de ratón embarazadas. Los paneles de la tinción de inmunofluorescencia de la parte superior para Krt14 (rojo), Krt8 (verde) y DAPI nuclear (azul) muestran que el epitelio trasplantado se parece a una morfología de tipo natural. Nótese la leche roja autofluorescente en el interior de la luz de los ductos. Todas las imágenes están tomadas con un aumento de 200X. El trasplante de células individuales demostró que 1 de 8 células Thy-1+ CD24med CD49fhi podría producir una excrecencia ductal (Figura 478 D). Por el contrario, las células Thy-1-CD24med CD49fhi tenían una reducida capacidad proliferativa y de autorrenovación (Figura 478 C, Tabla 9). Por lo tanto, el sistema de PCR de las células individuales identificó con éxito un nuevo marcador de célula madre de mama.
imagen74
Tabla 9. Transplante de autorrenovación de epitelio primario de donante
Población original trasplantada
Injertada / Transplantada Eficacia
25K Lineage-(n = 3)
10 / 11 91 %
600 células Thy-1lo CD24med CD49fhi (n = 1)
5 / 6 83 %
100 células Thy-1lo CD24med CD49fhi (n = 5)
6 / 10 60 %
30 células Thy-1lo CD24med CD49fhi (n = 3)
6 / 9 67 %
100 células Thy-1hi CD24med CD49fhi (n = 4)
6 / 8 75 %
células Thy-1-CD24med CD49fhi (n = 3)
1 / 9 11 %
Varios grupos han demostrado que la EMT puede estar relacionada con las células madre de mama. Sin embargo, se desconoce si todas las células madre o únicamente un subconjunto de las mismas han experimentado una EMT. 5 Usamos un análisis de las células individuales para distinguir entre estas dos posibilidades.
El compartimento inmaduro de mama normal humana tiene dos subpoblaciones: células ZEB1mRNAhi CDH1mRNA-/low
ZEB1mRNA-CDH1mRNA+
CEACAM1mRNA-EPCAMmRNA-y células CEACAM1mRNA+ EPCAMmRNA+ . Existen dos subpoblaciones similares en el compartimento de MRU de ratón (Figura 479 A). Estudios previos han demostrado que el Zeb1 promueve la EMT en parte mediante la represión de la expresión de Cdh1 (E-cadherina), lo que sugiere 10 que hay células de mama inmaduras que han experimentado una EMT y células que no lo han hecho. Debido a que no hemos encontrado un anticuerpo contra la E-cadherina de ratón que pueda usarse en una citometría de flujo, usamos Ceacam1 (CD66a) como herramienta para separar las poblaciones Zeb1mRNA+ Cdh1mRNA-/low (expresión similar a la del gen de EMT) y Zeb1mRNA-Cdh1mRNA+, permitiendo el análisis de la actividad de las células madre en las dos subpoblaciones. Se tiñeron las células de mama de ratón disociadas con anticuerpos contra CD24, CD49f, 15 Ceacam1 (CD66a) y EpCam para evaluar la expresión de la proteína CD66a en las células MRU, MaCFC, MYO y CD24med CD49f/low (Figura 479 C). Los resultados muestran que la CD66a es expresada a un elevado nivel en las células luminales MaCFC y CD24med CD49f/low (Figura 479 C y 477 A). Las células MYO eran en su mayoría CD66a/low y CD66amed, con una pequeña población de CD66ahi. Aunque la mayoría de las células MRU eran CD66amed , aproximadamente el 13 % de las células eran CD66a/low y el 22 % eran CD66ahi (Figura 479 B, 479 C). Esto se 20 corresponde con los tres niveles de expresión del ARNm de la CD66a observados en los análisis de la expresión génica de las células individuales (Figura 479 A). La Figura 479 A muestra la expresión génica de las células individuales MRU inmaduras humanas y de ratón para Zeb1, Ceacam1 (CD66a) y Cdh1 (E-cadherina). Las células se agruparon jerárquicamente por la similitud de su perfil de expresión génica (dendrograma de la izquierda). Los ensayos (etiquetas de la parte inferior) también se agruparon jerárquicamente (dendrograma de la parte superior). 25 La barra de escala muestra el gradiente de expresión representado en un mapa térmico. La Figura 479 B muestra una representación gráfica de la citometría de flujo de las células de ratón Lineage-CD24med CD49fhi (MRU) separadas según la expresión de CD66a y de EpCam que muestra que CD66a y EpCam están correlacionadas. C. Expresión de CD66a en células MRU, MYO, MaCFC y CD24med CD49f/low mostrada por el análisis del histograma de la citometría de flujo. Las clasificaciones dibujadas en cada gráfica indican las células CD66low, CD66med y CD66hi en
30 cada población. Los porcentajes de células que expresan CD66a en cada población (incluyendo Lineage-) se muestran en la tabla anexa.
Cuando transplantamos células CD66hi, CD66med y CD66-/low Lineage-no observamos una ventaja de injerto en ninguna de las poblaciones (Tabla 2). En la tabla 2 se muestra el número de excrecencias positivas / trasplantes totales para cada población celular indicada. Para cada población celular, la “Frecuencia” se derivó mediante el
35 agrupamiento de los datos procedentes de varios experimentos de dilución limitante analizados mediante la aplicación de una estadística de Poisson al modelo de impacto único.
Tabla 10. Trasplantes de CD66a de células epiteliales de mama de ratón
20.000 células 200 células 100 células
Población Frecuencia
trasplantadas trasplantadas trasplantadas CD66-/low Lineage-2 / 3 --1 por 18.205 CD66med Lineage-3 / 3 --1 por 14.427 CD66hi Lineage-2 / 3 --1 por 18.205 CD66-/low CD24med CD49fhi -2 / 4 1 / 5 1 por 343
imagen75
CD66med CD24med CD49fhi -1 / 3 2 / 4 1 por 260 CD66hi CD24med CD49fhi -2 / 4 1 / 4 1 por 309
A continuación aislamos las células MRU con el fenotipo CD66hi, CD66med y CD66-/low a partir de epitelio de mama de ratón GFP+ y llevamos a cabo un estudio de transplantes de dilución limitante para determinar si cualquiera de estos fenotipos enriquecían en células formadoras de ductos (Tabla 10). De nuevo, los tres fenotipos tenían un potencial de injerto similar y producían excrecencias con un tamaño y una morfología similares (datos no mostrados). Sin embargo, apreciamos que en ambas series de experimentos de trasplantes, las células CD66med se comportaban marginalmente peor que las células CD66-/low y CD66hi, pero estas diferencias no eran estadísticamente significativas según se determinó mediante dos pruebas de la t bilaterales (datos no mostrados). Por lo tanto, el análisis de las células individuales nos permitió identificar las células madre que habían experimentado una EMT y aquellas que no. Nuestros datos de los trasplantes sugieren que ambos subtipos de células son células madre que tienen una capacidad de injerto similar.
El análisis de las células individuales identificó a diferentes poblaciones de células luminales Esr1mRNA+ y Esr1mRNA-
Aunque el receptor de estrógenos (ER) es expresado en el compartimento Luminal, no todas las células epiteliales luminales expresan la proteína. La diferencia entre las células positivas y negativas para el ER es poco comprendida salvo por su respuesta a la estimulación de los estrógenos. Para caracterizar adicionalmente el compartimento luminal del epitelio de mama para la expresión del receptor de estrógenos, usamos nuestro sistema de PCR para ensayar el Esr1 (receptor de estrógenos α) en células humanas y de ratón (Figura 477). En el ratón, las células luminales MaCFC expresaron unos elevados niveles de Esr1 pero las células luminales CD24med CD49f/low tenían una expresión despreciable. Mediante el uso de la expresión génica de las células individuales se examinó el compartimento luminal con más detalle. Los análisis agrupados encontraron cinco poblaciones distintas de células luminales humanas (Figura 480 C). Había una población CD49fmRNAmed EpCarnmRNAmed que contenía las células que expresaban MYCmRNA+ GAPDHmRNAhi, KRT18mRNAhi KRT19mRNAhi SUZ12mRNA+ y contenía células que expresaban el ESR1 a un bajo nivel (Figura 480 A). Había una población CD49fmRNA-/low EpCammRNA-/low que expresaba queratinas luminales a bajos niveles (Figura 480 A). Entre las células CD49fmRNA-/low EpCammRNA-/low había una subpoblación de
CFC1mRNA+ NODALmRNA+ THY-1mRNA+ TDGF1mRNA+ ELFmRNA+
células que expresaban KRT8mRNA+ LEFTY2mRNA+ (Figura 480 A). Ambas de estas poblaciones expresaban poco o ningún ESR1detectable. También encontramos que las dos siguientes poblaciones estaban enriquecidas con células que expresaban el ESR1. Las células CD49fmRNAhi
EpCammRNAhi GATA3mRNA+ MAML2mRNA+ FOXO1mRNA+
expresaban TCF7L2mRNA+ TCF7L1mRNA+ CEACAM1mRNA+
ELF5mRNA+ BX3mRNA+
CYR61mRNA+ (Figura 480 A). Las células CD49fmRNA-EpCammRNA+ expresaban PGRmRNA+ STC2mRNA+ ERBBmRNA+ TFF3mRNA+ KIF12mRNA+ MUC1mRNA+ MUSTN1mRNA+ METTLmRNA+ (Figura 480 A). Es probable que esta última población luminal ERBB4mRNA+ esté formada por células que han recibido una señal estrogénica, dado que expresaban el PGR. La Figura 474 A muestra el análisis de las células individuales de las células enriquecidas en luminales procedentes de células de mama normales humanas. El dendrograma de la izquierda muestra el agrupamiento jerárquico de las células basado en la similitud del perfil de expresión génica. El dendrograma de la parte superior muestra el agrupamiento de la expresión del ensayo del gen para todas las células. Las etiquetas numeradas destacan los agrupamientos celulares que se describen en el texto principal. Las líneas discontinuas muestran la división entre los agrupamientos de células numerados. Las etiquetas inferiores corresponden a los genes que se ensayaron. Los genes usados para describir la determinación del fenotipo del ARNm de los marcadores de la citometría de flujo están en cajas. La barra de escala muestra el gradiente de expresión representado como un mapa térmico. B. Resultados de los ensayos de formación de colonias de NIH3T3 in vitro de las células en placas MRU, MaCFC y CD24med CD49f/low (EPI). Los resultados son el promedio de tres experimentos independientes. Las barras de error indican ± la desviación típica.
La expresión de Esr1 únicamente en las células MaCFC apoyaba nuestros datos previos de que las células CD24med CD49f/low enriquecían en un tipo distinto de célula. A continuación colocamos en placas las células MRU, MaCFC y CD24med CD49f/low en ensayos de formación de colonias para comprobar el potencial de proliferación y de diferenciación de cada población. Nuestros datos indican que las células luminales CD49f/low CD24med de ratón tienen un potencial proliferativo (Figura 480 B), pero son aproximadamente la mitad de eficientes en la formación de colonias en comparación con las células MaCFC (aproximadamente 1 por 10 con respecto a 1 por 5, respectivamente). La Figura 479 B muestra que los marcadores de la izquierda indican la población a partir de la cual crecieron las colonias. Las imágenes de la izquierda muestran una colonia en 3-d a partir de cada población. Los paneles de la derecha muestran una colonia en 2-D a partir de cada población. Las colonias se tiñeron para Krt14 (rojo) para indicar las células basales / mioepiteliales, y para Krt8 (verde) para indicar las células luminales. Imágenes en 3-D tomadas a 200X e imágenes en 2-D tomadas a 100X.
Está células también pueden formar colonias en 3D y en 2D que tienen una expresión de queratina basal y luminal similar a las células MRU y MaCFC (Figura 480 C). Mediante el uso de una citometría de flujo, colocamos en placas las células CD49F-EPCAM-, CD49F-/low EPCAM+, CD49F+ EPCAM+ y CD49F-EPCAM+ para investigar la capacidad de formación de colonias de cada población. De forma similar al ratón, averiguamos que las células CD49F-/low EPCAM+ tenían una frecuencia de formación de colonias reducida en comparación con las células CD49F+ EPCAM+ (datos no mostrados). Tomados conjuntamente, nuestros análisis de las células individuales eran capaces de distinguir una población progenitora negativa para el receptor de estrógenos que tenía un perfil de expresión génica distintivo, y una capacidad para formar colonias in vitro en comparación con las células luminales positivas para el receptor de estrógenos caracterizadas previamente.
imagen76
5 El análisis de las células individuales de un tumor de mama ER+ identifica las distintas poblaciones celulares cancerosas ER+ y ER-
El cáncer es una enfermedad definida por la pérdida progresiva de las restricciones proliferativas de una célula en el tejido a partir del cual se forma el tumor. En la mama, el tipo más común de células en el cáncer de mama expresan el receptor de estrógenos (ER).
10 Es bien conocido que la expresión del ER es heterogénea en las muestras de tumores. Dado que hay células ductales de mama inmaduras ER-y células luminales ER-, las células ER-de un tumor podrían representar cualquiera o ambas de estas poblaciones. Para comenzar a entender los orígenes de las células ER-, llevamos a cabo una investigación en la base de datos de cánceres de mama ER+ y averiguamos que la mayoría de los tumores expresaban ambos marcadores de las células luminales (basándonos en KRT19, ERBBS, ERBB4, ESR1) y las
15 citoqueratinas basales (basándonos en KRT5, KRT14 KRT17) (Figura 481 A). Hay dos posibles explicaciones para estos datos. En primer lugar es posible que las células cancerosas hayan perdido su identidad de desarrollo y expresen conjuntamente unos elevados niveles de ambas citoqueratinas basales y luminales. En segundo lugar, es posible que el tumor haya conservado parte de su potencial de desarrollo y que esto suponga al menos parte de la heterogeneidad en la expresión del marcador. La Figura 481 A muestra la expresión absoluta de los marcadores de
20 la estirpe basal y luminal en tumores de mama positivos para el receptor de estrógenos. Los datos de la micromatriz Affymetrix disponibles públicamente fueron normalizados mediante el uso del algoritmo GC-RMA, y después se agruparon jerárquicamente. Los valores de control negativo representan la media de 24 conjuntos de sondas de control de Affymetrix. Los tumores de mama ER+ expresan tanto las citoqueratinas basales (KRT5, KRT14, KRT17) como los marcadores de las células luminales (ERBB4, ERBB3, ESR1, KRT19). La Figura 481 B muestra múltiples
25 análisis de PCR de las células individuales del tumor de mama humano positivo para el receptor de estrógenos. El dendrograma de la izquierda muestra el agrupamiento jerárquico de las células basado en la similitud del perfil de expresión génica. El dendrograma de la parte superior muestra el agrupamiento de la expresión del gen ensayado en todas las células. Los dos ensayos etiquetados como “Independientes” no fueron usados para el agrupamiento. Las etiquetas de la derecha se corresponden con el enriquecimiento de la expresión de Esr1 para ese grupo de
30 células (dividido por una línea negra). La columna coloreada “etiquetas asignadas de ratón” y la leyenda anexa muestran la asignación de cada célula a los 6 tipos de células de ratón, en la que cada célula fue asignada según su máxima correlación con el centroide del tipo celular. Las líneas discontinuas muestran los agrupamientos celulares que están enriquecidos en un tipo celular asignado. La mayoría de los tipos de células de ratón están significativamente presentes en este tejido (Tabla 11), aparte de las células CD24med / CD49f"/low que no estaban
35 significativamente presentes en este tumor (valor de p = 0,312). En la tabla 11, basándonos en la proporción por grupo (IGP), todos los fenotipos están significativamente presentes en el tejido normal humano. En la muestra tumoral no existen pruebas de la presencia del fenotipo “CD24med CD49f/low“ (valor de p = 0,31). El valor de p para el fenotipo “MYO” se aproxima a la significación. Los valores de p fueron computados mediante la realización de
50.000 permutaciones mediante el uso del paquete clusterRepro R™. Nótese también que las MYO (valor de p =
40 0,085) son menos fáciles de identificar como un grupo distinto de las células MRU Zeb1mRNAm-. El ITGA6, que marca las células madre, es muy expresado en una población de células que se parece fenotípicamente a una mezcla de células MRU Zeb1+, MRU Zeb1-MYO. El patrón de expresión génica de estos 2 grupos de células se parece al de las células epiteliales de mama de ratón inmaduras. La barra de escala muestra el gradiente de expresión representado como un mapa térmico.
45 Tabla 11: valores de p para el grado en el que está presente cada tipo celular en los datos de ratón en los datos de humanos normales y tumorales
MRU Zeb-
Desconocido / Estromal MRU Zeb1+ MYO MaCFC CD24med CD49f/low
Normal humano
0,00673968 0,00000000 0,00000000 0,01850781 0,04371585 0,02339803
Tumor 1
0,02092479 0,06105834 0,01042069 0,08598774 0,00000000 0,31236937
Por lo tanto, los estudios de expresión génica de las células individuales se realizaron para comprender la heterogeneicidad celular en un tumor de mama ER+. En primer lugar analizamos las células cancerosas disociadas a 50 partir de un cáncer de mama ER+ PR+ Her2-y una muestra de mama no tumoral apareada mediante una citometría de flujo, tiñendo para CD49F y EPCAM (Figura 485). En la figura 485, se disoció un cáncer de mama primario ER+ y una muestra de mama no tumoral apareada en sus células individuales, y se analizaron mediante una citometría de flujo para comprobar la expresión de EPCAM y de CD49F. Se muestran las células epiteliales basadas en la clasificación Lineage-. Nótese la similitud entre los fenotipos normal y canceroso. El cáncer tiene una población aumentada de CD49f/low EPCAM+. Los datos de flujo muestran que las células cancerosas tienen una distribución fenotípica similar en comparación con la muestra no tumoral (Tabla 11), pero que había una gran expansión de la población CD49F-/low EPCAM+ (el 5,8 % de las células epiteliales de mama normales, el 30 % de las células tumorales de este paciente, figura 485). De forma similar a las de mama normal, las células cancerosas 5 EPCAMmRNA+ expresaban los marcadores de las células luminales, incluyendo los KIF12, TBX3, PRKAR2B y ERBB3. Estas células cancerosas de tipo epiteliales luminales eran las células que expresaban el ESR1 (Figura 481 B). Había 3 poblaciones distintas de células ESR1mRNA-. Una población [Esr-1-(1)] se parecía a la humana y a la de ratón normal CD49FmRNAhi ZEB1mRNA+ (células madre cuyo patrón de expresión génica se parecía al de una célula EMT) y la otra [Esr-1-(2)] se parecía a la población CD49FmRNAhi ZEB1mRNA-cuya expresión génica se parecía a la de 10 las células madre normales basales y mioepiteliales de ratón. La tercera población ER-se parecía a la población humana normal KRT8mRNA+ LEFTY2mRNA+ CFC1mRNA+ NODALmRNA+ THY1mRNA+ TDGF1mRNA+ EEF5mRNA+ (Figura 487). En la figura 487, la columna de “marcadores asignados a partir de ratón” se obtuvo asignando cada célula al tipo celular para el que la correlación con su centroide es máxima. Los centroides fueron computados basándonos en los datos de ratón. El fenotipo “CD24med CD49f/low“, que se corresponde con células luminales diferenciadas de ratón, no
imagen77
15 está significativamente presente en este tumor (CD24med CD49f/low -Amarillo, MRU Zeb1+-Cian, desconocido / estromal -Negro, MYO -Verde, MRU Zeb1--Azul, MaCFC -Rojo). Tomados conjuntamente, estos resultados sugieren que existen células basales y luminales en el tumor de mama ER+ analizado similares a las poblaciones de células normales inmaduras y maduras.

Claims (9)

  1. imagen1
    REIVINDICACIONES
    1. Un método para el análisis de la biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende:
    i. particionar aleatoriamente las células de la biopsia en ubicaciones individuales, en las que las células son clasificadas antes de su partición de acuerdo con la presencia de uno o más marcadores en la superficie de la célula;
    ii. recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado;
    iii. llevar a cabo un análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente, en el que el análisis del transcriptoma se utiliza para categorizar las células aisladas en grupos que muestran similitudes en su perfil de expresión; y
    iv. usar los datos del transcriptoma para la identificación de uno o más objetivos terapéuticos para el tratamiento de dicho tumor heterogéneo, en el que los perfiles de expresión obtenidos se comparan con un perfil de referencia o de control para la elaboración de un diagnóstico, de un pronóstico o de un análisis de la eficacia farmacológica,
    en el que el uno o más objetivos terapéuticos son una metiltransferasa de ADN, una metiltransferasa de ARN, una enzima similar a una metiltransferasa, una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona, una desmetilasa de histona, una cinasa de proteína.
  2. 2.
    El método de la reivindicación 1, en el que uno o más de los objetivos terapéuticos es BRD7.
  3. 3.
    El método de la reivindicación 1, en el que uno o más de los objetivos terapéuticos es BMI1.
  4. 4.
    El método de la reivindicación 1, en el que uno o más de los objetivos terapéuticos es TRIM 24.
  5. 5.
    Un método para el análisis de la biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende:
    i. particionar aleatoriamente las células de la biopsia en ubicaciones individuales, en las que las células son clasificadas antes de su partición de acuerdo con la presencia de uno o más marcadores en la superficie de la célula;
    ii. recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado;
    iii. llevar a cabo un análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente, en el que el análisis del transcriptoma se utiliza para categorizar las células aisladas en grupos que muestran similitudes en su perfil de expresión; y
    iv. usar los datos del transcriptoma para la identificación de uno o más marcadores diagnósticos presentes en la biopsia tumoral para la detección del cáncer y la evaluación del estadio del cáncer, en el que los perfiles de expresión obtenidos se comparan con un perfil de referencia o de control para la elaboración de un diagnóstico, de un pronóstico o de un análisis de la eficacia farmacológica,
    en el que el uno o más marcadores diagnósticos son una metiltransferasa de ADN, una metiltransferasa de ARN, una enzima similar a una metiltransferasa, una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona, una desmetilasa de histona, una cinasa de proteína.
  6. 6. Un método para el análisis de la biopsia de un tumor heterogéneo procedente de un sujeto humano, que comprende:
    i. particionar aleatoriamente las células de la biopsia en ubicaciones individuales, en las que las células son clasificadas antes de su partición de acuerdo con la presencia de uno o más marcadores en la superficie de la célula;
    ii. recoger las células particionadas individualmente a partir de las ubicaciones individuales mediante el uso de un dispositivo automatizado;
    iii. llevar a cabo un análisis del transcriptoma de al menos 50 genes de las células particionadas individualmente, en el que el análisis del transcriptoma se utiliza para categorizar las células aisladas en grupos que muestran similitudes en su perfil de expresión; y
    iv. usar los datos del transcriptoma para la identificación de uno o más marcadores diagnósticos para la evaluación de la eficacia del tratamiento de dicho tumor heterogéneo, en el que los perfiles de expresión obtenidos se comparan con un perfil de referencia o de control para la elaboración de un diagnóstico, de un pronóstico o de un análisis de la
    79
    imagen2
    eficacia farmacológica,
    en el que el uno o más marcadores diagnósticos son una metiltransferasa de ADN, una metiltransferasa de ARN, una enzima similar a una metiltransferasa, una metiltransferasa de lisina de histona, una metiltransferasa de arginina de histona, una desmetilasa de histona, una cinasa de proteína.
  7. 7.
    El método de la reivindicación 5 o 6, en el que uno o más de los marcadores diagnósticos es BRD7.
  8. 8.
    El método de la reivindicación 5 o 6, en el que uno o más de los marcadores diagnósticos es BMI1.
  9. 9.
    El método de la reivindicación 5 o 6, en el que uno o más de los marcadores diagnósticos es TRIM 24.
    80
ES11810302.7T 2010-07-19 2011-07-19 Métodos y sistemas para el análisis de células individuales Active ES2549752T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US39997310P 2010-07-19 2010-07-19
US399973P 2010-07-19
PCT/US2011/044574 WO2012012458A1 (en) 2010-07-19 2011-07-19 Methods and systems for analysis of single cells

Publications (1)

Publication Number Publication Date
ES2549752T3 true ES2549752T3 (es) 2015-11-02

Family

ID=45497156

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11810302.7T Active ES2549752T3 (es) 2010-07-19 2011-07-19 Métodos y sistemas para el análisis de células individuales

Country Status (7)

Country Link
US (1) US9850483B2 (es)
EP (1) EP2596006B1 (es)
AU (1) AU2011282233B2 (es)
CA (1) CA2806632A1 (es)
ES (1) ES2549752T3 (es)
NZ (1) NZ607234A (es)
WO (1) WO2012012458A1 (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9404864B2 (en) 2013-03-13 2016-08-02 Denovo Sciences, Inc. System for imaging captured cells
US10466160B2 (en) 2011-08-01 2019-11-05 Celsee Diagnostics, Inc. System and method for retrieving and analyzing particles
EP2739587B1 (en) 2011-08-01 2020-05-27 Denovo Sciences Cell capture system
RU2679226C2 (ru) 2012-12-13 2019-02-06 Конинклейке Филипс Н.В. Картридж и устройство для подготовки биологического образца
US9752181B2 (en) 2013-01-26 2017-09-05 Denovo Sciences, Inc. System and method for capturing and analyzing cells
US9707562B2 (en) 2013-03-13 2017-07-18 Denovo Sciences, Inc. System for capturing and analyzing cells
US9856535B2 (en) 2013-05-31 2018-01-02 Denovo Sciences, Inc. System for isolating cells
US10391490B2 (en) 2013-05-31 2019-08-27 Celsee Diagnostics, Inc. System and method for isolating and analyzing cells
DE102016107900B4 (de) * 2016-04-28 2020-10-08 Carl Zeiss Industrielle Messtechnik Gmbh Verfahren und Vorrichtung zur Kantenermittlung eines Messobjekts in der optischen Messtechnik
EP3651903A4 (en) 2017-08-29 2021-06-16 Bio-Rad Laboratories, Inc. SYSTEM AND METHOD FOR ISOLATING AND ANALYZING CELLS
TWI637146B (zh) * 2017-10-20 2018-10-01 曦醫生技股份有限公司 Cell classification method
US12012599B2 (en) * 2018-04-13 2024-06-18 Cz Biohub Sf, Llc Compositions and methods for modulating left-right differentiation factor (LEFTY) and bone morphogenic factor (BMP)
US10633693B1 (en) 2019-04-16 2020-04-28 Celsee Diagnostics, Inc. System and method for leakage control in a particle capture system
US11273439B2 (en) 2019-05-07 2022-03-15 Bio-Rad Laboratories, Inc. System and method for target material retrieval from microwells
CN114072490A (zh) 2019-05-07 2022-02-18 伯乐实验室有限公司 用于自动化的单细胞加工的系统和方法
US11724256B2 (en) 2019-06-14 2023-08-15 Bio-Rad Laboratories, Inc. System and method for automated single cell processing and analyses
US11959057B2 (en) 2019-10-17 2024-04-16 New Jersey Institute Of Technology Automated addressable microfluidic technology for minimally disruptive manipulation of cells and fluids within living cultures
US11504719B2 (en) 2020-03-12 2022-11-22 Bio-Rad Laboratories, Inc. System and method for receiving and delivering a fluid for sample processing
CN114107449B (zh) * 2020-08-31 2024-04-09 中山大学孙逸仙纪念医院 一种单细胞内原位qPCR方法
US11541116B1 (en) 2022-01-07 2023-01-03 Kojin Therapeutics, Inc. Methods and compositions for inducing ferroptosis in vivo

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1409727B1 (de) 2001-09-06 2005-11-09 Adnagen AG Verfahren zum qualitativen und/oder quantitativen nachweis von zellen
JP2008518610A (ja) * 2004-11-03 2008-06-05 アルマック ダイアグノスティックス リミテッド トランスクリプトームマイクロアレイ技法およびそれを使用する方法
EP1832661A1 (en) * 2006-03-09 2007-09-12 Adnagen AG Method for the individual staging of tumor diseases
EP2041575A2 (en) * 2006-03-31 2009-04-01 Ordway Research Institute Prognostic and diagnostic method for cancer therapy
US20090093374A1 (en) * 2007-01-25 2009-04-09 Kahp-Yang Suh Method of arraying cells at single-cell level inside microfluidic channel and method of analysing cells using the same, and cell analysis chip used for carrying out the same
CA2696402A1 (en) * 2007-08-21 2009-02-26 Nodality, Inc. Methods for diagnosis, prognosis and methods of treatment
CN102333891A (zh) * 2009-01-20 2012-01-25 利兰·斯坦福青年大学托管委员会 用于药靶诊断、预后和鉴别的单细胞基因表达

Also Published As

Publication number Publication date
EP2596006B1 (en) 2015-09-02
NZ607234A (en) 2014-08-29
US9850483B2 (en) 2017-12-26
EP2596006A1 (en) 2013-05-29
EP2596006A4 (en) 2014-04-16
WO2012012458A1 (en) 2012-01-26
CA2806632A1 (en) 2012-01-26
US20130225435A1 (en) 2013-08-29
AU2011282233A1 (en) 2013-03-07
AU2011282233B2 (en) 2014-11-27

Similar Documents

Publication Publication Date Title
ES2549752T3 (es) Métodos y sistemas para el análisis de células individuales
ES2560209T3 (es) Expresión genética en células individuales para el diagnóstico, pronóstico e identificación de dianas farmacológicas
Izar et al. A single-cell landscape of high-grade serous ovarian cancer
US20210222253A1 (en) Identification of biomarkers of glioblastoma and methods of using the same
Jean et al. Molecular changes in mesothelioma with an impact on prognosis and treatment
Bansal et al. Feasibility of microRNAs as biomarkers for Barrett's esophagus progression: a pilot cross-sectional, phase 2 biomarker study
Liu et al. Spatial maps of T cell receptors and transcriptomes reveal distinct immune niches and interactions in the adaptive immune response
US20190292601A1 (en) Methods of diagnosing cancer using cancer testis antigens
JP2009529880A (ja) 原発細胞の増殖
US20210005283A1 (en) Techniques for bias correction in sequence data
CN113528663A (zh) 使用基因组特异性探针的循环肿瘤和肿瘤干细胞检测
WO2020110127A1 (en) Methods of activating dysfunctional immune cells and treatment of cancer
US20230235400A1 (en) Methods of detecting mitochondrial diseases
Zhang et al. Identification of five cytotoxicity-related genes involved in the progression of triple-negative breast cancer
WO2013163134A2 (en) Biomolecular events in cancer revealed by attractor metagenes
Lopez-Munoz et al. Markers of circulating breast cancer cells
AU2015202186B2 (en) Single cell gene expression for diagnosis, prognosis and identification of drug targets
US20240009172A1 (en) Compostions and methods for treating prostate cancer
Vladoiu Tracing Developmental Origins of Pediatric Posterior Fossa Tumours
CN111909999B (zh) miRNA组合及其在制备DLBCL预后的标记物中的应用
Zhou et al. Single-cell multi-omics in the study of digestive system cancers
Liu et al. Spatially mapping T cell receptors and transcriptomes reveals distinct immune niches and interactions underlying the adaptive immune response
Alqahtani Monitoring Exceptional Responses in Patients with B-cell Malignancies
Blacklock Application of Genomics to Identify Novel Prognostic Biomarkers for Cancers in Dogs
Kumar Mutational Heterogeneity in Cancer