ES2767696T3 - Método para identificar patrones de CDR3 asociados a enfermedades en un repertorio inmunitario - Google Patents

Método para identificar patrones de CDR3 asociados a enfermedades en un repertorio inmunitario Download PDF

Info

Publication number
ES2767696T3
ES2767696T3 ES16762365T ES16762365T ES2767696T3 ES 2767696 T3 ES2767696 T3 ES 2767696T3 ES 16762365 T ES16762365 T ES 16762365T ES 16762365 T ES16762365 T ES 16762365T ES 2767696 T3 ES2767696 T3 ES 2767696T3
Authority
ES
Spain
Prior art keywords
group
linklets
disease
subjects
identify
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16762365T
Other languages
English (en)
Inventor
Jian Han
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Irepertoire Inc
Original Assignee
Irepertoire Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Irepertoire Inc filed Critical Irepertoire Inc
Application granted granted Critical
Publication of ES2767696T3 publication Critical patent/ES2767696T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Toxicology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)

Abstract

Un método para desarrollar una prueba de diagnóstico para una enfermedad en particular, comprendiendo el método las etapas de: en una muestra recogida de cada uno de los múltiples sujetos en un grupo de pacientes y un grupo de control, en donde el grupo de pacientes comprende sujetos que tienen la misma enfermedad y el grupo de control comprende sujetos que están sanos; amplificar y secuenciar el repertorio inmunitario de cada sujeto en cada uno de los dos grupos para identificar cada secuencia de CDR3 exclusiva presente en las muestras y determinar la frecuencia de aparición de cada secuencia de CDR3 exclusiva; identificar secuencias de CDR3 que se comparten entre al menos dos sujetos en cada uno de los grupos de control y el grupo de pacientes; clasificar las secuencias de CDR3 por orden de frecuencia de aparición; identificar los Linklets de cada grupo; e identificar los Linklets que están asociados en un grado estadísticamente significativo con el grupo de pacientes para proporcionar una firma de la enfermedad.

Description

DESCRIPCIÓN
Método para identificar patrones de CDR3 asociados a enfermedades en un repertorio inmunitario
Campo de la invención
La invención se refiere a métodos para reconocer repertorios inmunitarios asociados a enfermedades en sujetos humanos y/o animales y para el uso de tales métodos para el diagnóstico de enfermedades y para el estudio de procesos de enfermedades.
Antecedentes de la invención
Los diversos receptores de antígenos de los linfocitos T y B se producen por recombinación somática de un número limitado pero grande de segmentos de genes. Estos segmentos de genes - V (variable), D (diversidad), J (unión) y C (constante) - determinan la especificidad de unión y las aplicaciones posteriores de inmunoglobulinas y receptores de linfocitos T (TCR). La porción reordenada V(D)J del receptor, denominada la región V, es de gran interés, ya que es responsable del reconocimiento de epítopos. Cuando el V(D)J se traduce en una secuencia de aminoácidos, la región V puede subdividirse en varias partes que consisten en la secuencia líder, la región marco conservada (FR) 1, la región determinante de complementariedad 1 (CDR1), FR2, CDR2, FR3, CDR3, FR4 y los dominios C.
La CDR3 es de particular interés porque los estudios han indicado que esta región está asociada con la especificidad antigénica. En comparación con los sujetos normales, los pacientes con diversas enfermedades pueden experimentar cambios cuantitativos y/o cualitativos en su repertorio inmunitario. Los cambios cuantitativos pueden ser evidentes a medida que aumenta y disminuye la diversidad del repertorio inmunitario. Los cambios cualitativos pueden presentarse como un mayor intercambio de CDR3 específicas de enfermedades en los linfocitos T o B.
El sistema inmunitario monta una respuesta a diversas afecciones, tales como cáncer, infecciones bacterianas, infecciones víricas e infecciones fúngicas. Adicionalmente, en algunos sujetos, en realidad puede producir una respuesta nociva a los tejidos del cuerpo, dando como resultado, por ejemplo, una enfermedad autoinmunitaria o el rechazo de injertos. Los tipos y grados de estas respuestas inmunitarias potencialmente podrían, si se accede con precisión, ser uno de los indicadores más importantes y precisos de la presencia o ausencia de una enfermedad en particular o de respuestas inmunitarias indeseables.
Sin embargo, se estima que los seres humanos tienen hasta 1015-1025 linfocitos T diferentes, debido al número de posibles reordenamientos de VDJ, adiciones de n y combinaciones de cadenas alfa-beta. Suponiendo que, para una enfermedad en particular, solo hay 103 CDR3 específicas de la enfermedad que pueden cambiar cuantitativamente (a través de regulación positiva o negativa) o cualitativamente (a través de ganancia o pérdida), la relación señal/ruido en estas circunstancias es muy débil. Por lo tanto, los métodos convencionales no son prácticos para evaluar esta información con fines de diagnóstico.
Lo que se necesita son métodos mejorados para la evaluación de la respuesta inmunitaria y para el desarrollo de pruebas de diagnóstico basadas en dicha respuesta inmunitaria y el repertorio inmunitario resultante.
Sumario de la invención
En una realización, la presente divulgación se refiere a un método para desarrollar una prueba de diagnóstico usando el repertorio inmunitario, comprendiendo el método las etapas de: (a) recoger una muestra de cada uno de los múltiples sujetos en un grupo de pacientes y un grupo de control, en donde el grupo de pacientes comprende sujetos que tienen la misma enfermedad y el grupo de control comprende sujetos que se clasifican como sanos; (b) amplificar y secuenciar el repertorio inmunitario de cada sujeto en cada uno de los dos grupos para identificar cada secuencia de CDR3 exclusiva presente en la muestra y determinar la frecuencia de aparición de cada secuencia de CDR3 exclusiva; (c) identificar secuencias de CDR3 que se comparten entre al menos dos sujetos en cada uno de los grupos de control y el grupo de pacientes; (d) clasificar las secuencias de CDR3 identificadas por orden de frecuencia de aparición; (e) identificar Linklets de cada grupo; y (f) identificar los Linklets que están asociados en un grado estadísticamente significativo con el grupo de pacientes para proporcionar una firma de la enfermedad.
En determinadas realizaciones, la muestra es sangre periférica. En otras realizaciones, la muestra es tejido. En determinadas realizaciones, se identifican menos de 1.000 secuencias de CDR3 como compartidas entre al menos dos sujetos. En otras realizaciones, se identifican al menos 1.000 secuencias de CDR3 como compartidas entre al menos dos sujetos. En determinadas realizaciones, se identifican al menos aproximadamente 106 Linklets de cada grupo. En otras realizaciones, se identifican menos de 106 Linklets de cada grupo.
Breve descripción de las figuras
La divulgación se puede entender mejor con referencia a las siguientes figuras.
La figura 1 es una viñeta que ilustra el concepto básico del método divulgado, donde los datos de la secuencia de polinucleótidos de las células del sistema inmunitario se procesan utilizando un software diseñado para clasificar y contar las secuencias, clasificarlas por números de frecuencia, generar valores de p y otros criterios, para producir una firma de diagnóstico de los Linklets designados como "Linklets significativos".
La figura 2 es una tabla que ilustra la clasificación de las CDR3 por número de clones presentes en una muestra. Por lo general, un resultado de secuenciación de una muestra generará hasta 400.000 CDR3. Cada CDR3 está asociada con un recuento de lectura; debido a la naturaleza semicuantitativa del método de amplificación (arm-PCR), el recuento de lectura también refleja la abundancia relativa del clon. El análisis de software elimina los errores y clasifica las CDR3 para producir un archivo de salida como se muestra en la tabla.
La figura 3 es una tabla que ilustra cómo se detectan los Linklets en las secuencias obtenidas de las muestras de sangre. Las secuencias de CDR3 se contaron para proporcionar una lista de las secuencias de CDR3 que están presentes en mayor número en una muestra de sangre. Entre esas secuencias de CDR3, los Linklets representan pares de CDR3 que están presentes dentro de la misma muestra, a un nivel que es más alto que un nivel de corte designado.
La figura 4 es una lista representativa de algunos de los Linklets identificados durante un estudio de cáncer de mama (comparación entre Linklets detectados en dos grupos de estudio: un primer grupo de sujetos que se habían diagnosticado con cáncer de mama y un segundo grupo de sujetos que se designaron como controles sanos). La figura 5 enumera los Linklets públicos detectados en el estudio de cáncer de mama, en función de sus valores de p. El Linklet mejor clasificado, por ejemplo, es el par de CDR3 'ASSYSR-GEEF' y 'ASSLGRTHQPQH', y este Linklet se compartió en 32 de las 98 muestras de pacientes con cáncer de mama, mientras que solo 1 de las 106 muestras de control lo tenía. El valor de p fue 0. Solo aquellos Linklets con un valor de p <0,05 se incluyen en la lista final que representa una firma de diagnóstico de cáncer de mama. Se identificaron un total de 101.902 Linklets significativos.
La Fig. 6 es un diagrama de dispersión que ilustra los resultados para sujetos en tres grupos: control, cáncer de mama y CMV (citomegalovirus). Un análisis de la curva de característica operativa del receptor (ROC, por sus siglas en inglés) sugirió un valor de corte de 600 DSL. De los 103 pacientes con cáncer de mama, 98 tenían más de 600 Linklets significativos; de los 110 controles, solo 7 tenían más de 600 Linklets significativos. La sensibilidad y especificidad diagnóstica fueron, por lo tanto, del 95 % y del 93 %, respectivamente. Cuando se estudiaron 188 muestras de cáncer no de mama (de pacientes inscritos en un estudio de CMV) contra la firma de la enfermedad de cáncer de mama, solo 3 muestras fueron positivos falsos con más de 600 Linklets significativos, dando una especificidad del 98,4 %.
Descripción detallada
La presente divulgación generalmente se refiere a un método para desarrollar pruebas de diagnóstico que se basan en la respuesta inmunitaria y el repertorio inmunitario resultante. El método divulgado actualmente aumenta la señal y reduce el fondo para permitir la identificación de CDR3 compartidas que pueden usarse para producir una firma de enfermedad. El método divulgado actualmente puede usarse para desarrollar una prueba de diagnóstico para diferentes enfermedades que incluyen, pero sin limitación, cáncer, enfermedad autoinmunitaria, enfermedad inflamatoria y enfermedad infecciosa.
Como se usa en el presente documento, "enfermedad" incluye enfermedad diagnosticada y otras alteraciones, diagnosticadas y no diagnosticadas, de la salud normal de un sujeto.
Como se usa en el presente documento, "sano" significa que actualmente no presenta síntomas de, y actualmente no está diagnosticado con, una enfermedad.
Como se usa en el presente documento, un "repertorio inmunitario" comprende los linfocitos T y B funcionalmente diversos de un sujeto.
Como se usa en el presente documento, un "Linklet" es un par de CDR3 exclusivas que están presentes en la misma muestra. Cuando dos o más personas comparten un Linklet en particular, es un "Linklet Público". Si un Linklet solo se detecta en un sujeto, es un "Linklet privado". Los Linklets públicos provienen de CDR3 públicas (es decir, CDR3 que se detectan en más de un sujeto). Hablando en general, el repertorio de cada sujeto es en gran parte "privado" y solo un pequeño porcentaje del repertorio inmunitario de ese sujeto representa CDR3 compartidas. Por lo tanto, los Linklets Públicos están presentes en un nivel mucho más bajo que los Linklets Privados, un hecho que dificulta la identificación de las firmas de enfermedad. Por lo tanto, es importante utilizar un enfoque que reduzca el fondo para permitir la identificación del repertorio significativo de CDR3 que constituye una o más firmas de enfermedad.
Como se usa en el presente documento, "muestra" comprende sangre y tejido. En determinadas realizaciones, la sangre es sangre periférica recogida de un sujeto. En determinadas realizaciones, el tejido es una biopsia obtenida a partir de un sujeto.
Como se usa en el presente documento, "sujeto" significa un ser humano o animal.
En determinadas realizaciones, el método divulgado actualmente reduce el fondo mediante el uso de "Linklets Positivos". Cuando se secuencian dos secuencias de CDR3, A y B, también se obtiene información cuantitativa, representada por los recuentos de lecturas. Si el método de amplificación del repertorio inmunitario utilizado es semicuantitativo (arm-PCR), y si CDR3-A se expresa en una muestra a un nivel más alto que CDR3-B, se obtendrán más recuentos de lecturas de secuencia para A que para B. En tal escenario, el par A-B se designa como un Linklet Positivo, mientras que el par B-A se designaría como un Linklet Negativo. En determinadas realizaciones del método divulgado actualmente, solo se usan los Linklets Positivos para análisis adicional. El uso de Linklets Positivos enriquece la señal de diagnóstico, ya que ayuda a filtrar el ruido experimental.
Biológicamente, más de un antígeno o epítopo está asociado, generalmente, con una enfermedad en particular. Por lo tanto, los receptores de linfocitos T y B relevantes generalmente aparecerían en las muestras de los pacientes como grupos. La información cuantitativa proporcionada por los Linklets Positivos (y los Linklets Negativos) puede reflejar el perfil de expresión de antígenos específicos de la enfermedad.
Los procedimientos experimentales pueden introducir "ruido" adicional en los datos generados. Por ejemplo, es una práctica común agrupar muchas muestras de diferentes sujetos en una ejecución de secuenciación para reducir el coste (el repertorio inmunitario se amplifica por separado usando cebadores con código de barras). Sin embargo, si una CDR3 es muy dominante en una muestra, aparecerá en el chip de secuenciación varias veces. Ese clon dominante tendrá una probabilidad de 1/8.000 de ser asignado al código de barras incorrecto y ser "compartido" por todas las otras muestras en la misma ejecución. Si se usa la CDR3 como la unidad analítica básica, estas secuencias "contaminadas" se considerarían biológicamente compartidas y se usarían como señales de diagnóstico. El uso de Linklets permite que estos ruidos se filtren, ya que las CDR3 asignadas de forma incorrecta generalmente tienen una frecuencia muy baja, y la probabilidad de que formen parte de uno o más Linklets Positivos se reduce (con una mayor probabilidad de que formen Linklets negativos). Al considerar solo los Linklets Positivos, el ruido se puede filtrar. Además, si solo se usan las CDR3 mejor clasificadas de una muestra (tal como, por ejemplo, 5.000 o entre 1.000 y 50.000 de las CDR3 mejor clasificadas), no se considerarán, generalmente, las CDR3 asignadas de forma incorrecta, debido a sus bajas frecuencias.
Cuando se descubre que un grupo de Linklets Públicos está asociado en mayor grado con un grupo de sujetos que tienen una enfermedad en particular en común, esos Linklets Públicos se pueden tratar como Linklets específicos de la enfermedad, o "Linklets significativos". Por lo tanto, un grupo de Linklets Significativos asociados con una enfermedad en particular puede constituir una "firma de la enfermedad". Por lo tanto, si se encuentra que la muestra de un sujeto tiene una superposición estadísticamente significativa con la firma de la enfermedad, se puede hacer un diagnóstico de dicha enfermedad para ese sujeto.
El método actualmente divulgado comprende las siguientes etapas: (1) recoger muestras de sujetos asignados a un grupo de pacientes y un grupo de control; (2) amplificar y secuenciar un repertorio inmunitario para cada muestra; (3) identificar las secuencias de CDR3 exclusivas del repertorio inmunitario de cada muestra; (4) contar el número de veces que se detecta una secuencia de CDR3 individual (exclusiva) en el repertorio inmunitario, identificando de ese modo aquellos clones que son dominantes (determinado clasificándolos en orden de mayor frecuencia de aparición a menor frecuencia de aparición); (5) comparar los repertorios inmunitarios de los sujetos para identificar CDR3 que se comparten entre al menos dos sujetos ("CDR3 públicas"); (6) clasificar las CDR3 públicas en función de sus frecuencias de aparición; (7) generar una lista de Linklets Positivos a partir de las CDR3 mejor clasificadas; (8) filtrar los Linklets Privados y conservar los Linklets Públicos; y (9) identificar Linklets Públicos que están asociados con pacientes en el grupo de enfermedad diana, pero no con el grupo de control.
En determinadas realizaciones, se asignan al menos aproximadamente 100 sujetos a cada grupo. En determinadas realizaciones, el repertorio inmunitario se amplifica utilizando el método de arm-PCR (descrito en el documento WO2009/124293). En determinadas realizaciones, los 5.000 clones principales se identifican como dominantes. En determinadas realizaciones, la lista de Linklets Positivos incluye las 1.000 a 20.000 CDR3 mejor clasificadas. En determinadas realizaciones, el valor de confianza para los Linklets Públicos asociados con el paciente en el grupo de enfermedad diana, pero no con el grupo de control, es p < 0,05.
La lista de Linklets Públicos que están asociados con pacientes (Linklets asociados con enfermedad o DSL), pero no con el grupo de control, constituye un grupo designado como "Linklets de Firma". En determinadas realizaciones, se puede obtener una firma analizando alrededor de 100 pacientes y un número igual de controles. Después se determina un valor de corte de Linklet de Firma de Enfermedad (DSL, por sus siglas ne inglés). Las muestras desconocidas pueden analizarse mediante secuenciación seguida por recuento de los DSL. Si el número de DSL cumple o excede el valor de corte, se realiza un diagnóstico para una enfermedad en particular.
Por ejemplo, en determinadas realizaciones para obtener los datos de secuencia para el análisis, la sangre completa de un sujeto (p. ej., ser humano o animal, grupo de enfermedad o control (sano)) se trata con Ficoll® para extraer células mononucleares de sangre periférica o PBMC, para obtener la mayor concentración de linfocitos. Cada tipo de linfocito tiene un identificador específico llamado marcador CD, o grupo de marcadores de diferenciación, que está numerado. Por ejemplo, los linfocitos T citotóxicos tienen un marcador CD8, y los linfocitos T auxiliares tienen un marcador CD4. Las perlas magnéticas, que se han marcado con un marcador anti-CD específico, se pueden añadir a la suspensión celular. Después de aplicar la columna a un campo magnético, las células unidas a las perlas quedarán atrapadas, o se seleccionarán positivamente, mientras permiten que fluyan los otros tipos de células. El flujo continuo, o la suspensión celular seleccionada negativamente, se puede usar para aislar adicionalmente otras poblaciones celulares en aplicaciones posteriores. En otras realizaciones, la muestra puede ser un tejido, que puede procesarse, usando métodos conocidos en la técnica, para aislar linfocitos.
Debido a que hay subpoblaciones dentro de determinadas poblaciones de linfocitos T (p. ej., los linfocitos T reguladores son una subpoblación de los linfocitos T auxiliares), si es necesario separar las subpoblaciones, se pueden añadir reactivos de liberación a las células unidas a las perlas CD4 para liberar la perla, de modo que otra perla magnética pueda unirse a la célula. Ene l caso de los linfocitos T reguladores, por ejemplo, se puede añadir una microperla de selección CD25+ a la suspensión celular para extraer la población de linfocitos T reguladores de la población de linfocitos T auxiliares.
El aislamiento de polinucleótidos (ARN o ADN) se puede realizar por medios conocidos por los expertos en la materia (véase, por ejemplo, Murray, BMC Res Notes. 1 de Noviembre de 2013;6:440). La amplificación de secuencias puede realizarse usando el método descrito en el documento WO2009/124293 (arm-PCR), que proporciona la sensibilidad y especificidad que es necesaria para lograr resultados superiores en el método divulgado actualmente.
La secuenciación también puede realizarse usando métodos conocidos en la técnica. Dado el número de secuencias que deben determinarse, generalmente se emplean métodos de secuenciación de alto rendimiento, tal como, por ejemplo, la Secuenciación de Nueva Generación de Illumina, usando cebadores de secuenciación Illumina.
Se generan grandes cantidades de datos que deben analizarse y manipularse como resultado de la secuenciación, contando el número de veces que aparece una secuencia particular (que representa un clon individual), clasificando los clones en orden según la frecuencia de aparición y otros análisis descritos en el presente documento. Esto se realiza de manera más conveniente y eficaz utilizando programas de análisis de datos de secuencias. Uno de estos programas es Álgebra CDR3, que realiza la ordenación, clasificación y emparejamiento del investigador. El análisis estadístico, como el cálculo de los valores de p, también se puede realizar utilizando dichos programas.
El método actualmente divulgado se presta al desarrollo de pruebas de diagnóstico para una variedad de enfermedades que incluyen, pero sin limitación, cáncer, enfermedad autoinmunitaria, infecciones bacterianas, infecciones víricas e infecciones fúngicas, brindando, así, a los investigadores y médicos una herramienta valiosa para el diagnóstico y estudio de una enfermedad de interés.
El método actualmente divulgado puede describirse adicionalmente por medio de los siguientes ejemplos no limitantes.
Ejemplos
Aislamiento de Células Mononucleares de Sangre Periférica (PB-MC) de Sangre Completa
La sangre completa de sujetos sanos (grupo de control) y de pacientes diagnosticados previamente con cáncer de mama (grupo de pacientes) se diluyó con tampón PBS a 2-4 veces el volumen original. Se transfirieron 10 ml de sangre completa recogida en heparina de sodio a un tubo cónico de 50 ml y se diluyó con tampón a la línea de 35 ml. La suspensión celular diluida (35 ml) se colocó cuidadosamente sobre 15 ml de Ficoll-Paque® en un tubo cónico separado de 50 ml. El tubo se centrifugó a 400 x g durante 30 minutos a 20 grados Celsius en un rotor de cubeta oscilante sin freno.
La capa superior que contenía tampón PBS y plasma se aspiró cuidadosamente para eliminarla. La capa de células mononucleares turbia se transfirió cuidadosamente a un tubo cónico nuevo de 50 ml. Después se llenó el tubo con tampón hasta la marca de 50 ml y se centrifugó a 300 x g durante 20 minutos a 20 grados Celsius. Se retiró el sobrenadante transparente y se volvió a suspender el sedimento celular en 8 ml de tampón.
Aislamiento de Monocitos a partir de PBMC aisladas
Las células se contaron usando un hemocitómetro y la muestra se centrifugó a 300 x g durante 10 minutos a temperatura ambiente. El sobrenadante se eliminó por aspiración. Las células se resuspendieron en 80 pl de tampón por 107 células.
Se añadieron veinte microlitros de microperlas CD14 por 1 x 107 células, y la mezcla se realizó pipeteando suavemente hacia arriba y hacia abajo. La mezcla microperla/célula se incubó a 4 °C durante 15 minutos. Las células se lavaron añadiendo 2 ml de tampón por 1 x 107 células y después se centrifugaron a 300 x g durante 10 minutos.
El sobrenadante se aspiró completamente y se resuspendió en tampón (108 células en 500 pl de tampón). Se colocó una columna magnética LS sobre el imán y se lavó con 3 ml de tampón. Se descartó el tampón de flujo continuo. La suspensión celular se aplicó a la columna y las células no marcadas que atraviesan se recogieron en un tubo cónico de 15 ml marcado. La columna se lavó 3 veces con 3 ml de tampón, y se añadió un nuevo tampón solo cuando el depósito de la columna estaba vacío.
Se colocó un nuevo tubo cónico limpio de 15 ml etiquetado como "Monocito" debajo de la columna y la columna se retiró del imán. El tampón (5 ml) se pipeteó en la columna y las células marcadas magnéticamente se expulsaron inmediatamente empujando firmemente el émbolo hacia la columna.
Ambos tubos se centrifugaron durante 10 minutos a 300 x g, y el sobrenadante se aspiró por completo. Para el tubo etiquetado como "Monocito", las células se resuspendieron en 2 ml de tampón. Se pipetearon veinte microlitros para utilizarlos en el protocolo de recuento celular, y el tubo se centrifugó a 300 x g durante 10 minutos. Las células se resuspendieron en 500 pl de RNAprotect® y se almacenaron a 4 °C para su posterior extracción de ARN. Para el tubo etiquetado como "CD14 -", las células se resuspendieron en 80 pl de tampón por 107 células.
Extracción de ARN
Las células se centrifugaron durante 3 minutos a 3.000 rpm a 20 °C, se retiró el sobrenadante y se soltó el sedimento celular moviendo el tubo. Se añadió tampón BME (350 pl) a la muestra, y el sedimento celular se disolvió completamente mediante agitación con formación de vórtice.
La muestra se transfirió a una columna QIAshredder y se homogeneizó por centrifugación durante 2 minutos a 10.000 rpm. Se descartó la columna y se guardó el flujo continuo. Se añadió etanol (70 %, 350 pl) al flujo continuo y la muestra se mezcló por pipeteo. La muestra (700 pl) se transfirió a una columna de centrifugación RNeasy® y se colocó en un tubo de recogida de 2 ml. La muestra se centrifugó durante 15 segundos a 10.000 rpm. Se descartó el flujo continuo. En los casos en que había más de 700 pl de muestra, esta etapa se repitió usando la misma columna.
Se añadieron 700 pl de tampón RW1 a la columna de centrifugación y la muestra se centrifugó a 10.000 rpm durante 15 segundos, descartando el flujo continuo. Se añadieron 500 pl de tampón RPE a la columna de centrifugación y la muestra se centrifugó a 10.000 rpm durante 15 segundos, descartando el flujo continuo.
Se añadieron 500 pl de tampón RPE a la columna de centrifugación y la muestra se centrifugó durante 2 minutos a 10.000 rpm. La columna de centrifugación se colocó en un nuevo tubo de recogida de 2 ml y se centrifugó durante 1 minuto a 10.000 rpm para secar la membrana de la columna. La columna de centrifugación se colocó en un nuevo tubo de recogida de 1,5 ml. Se añadieron 25 pl de agua sin RNasa a todas las muestras, excepto a las muestras que contienen linfocitos T reguladores aislados. A las muestras con linfocitos T reguladores, se añadieron 20 pl de agua sin RNasa. La muestra se dejó reposar a temperatura ambiente durante 1 minuto. La muestra se centrifugó durante 1 minuto a 10.000 rpm y la columna se descartó.
Amplificación de secuencias de CDR3 Utilizando la Reacción en Cadena de la Polimerasa
La amplificación por PCR de las secuencias de CDR3 se realizó usando el método de arm-PCR divulgado en el documento WO2009/124293 (Han). Generalmente se recomienda un mínimo de 100 ng de ARN o ADNg (dependiendo del sistema de reactivo seleccionado) con un 260/280 de 1,8 o mayor como material de partida para obtener la mejor diversidad de la biblioteca del repertorio inmunitario por arm-PCR. Durante la primera ronda de PCR, se usaron cebadores específicos de genes anidados dirigidos a cada uno de los genes V y J (o C). Los cebadores directos, Fo (directo-hacia fuera) y Fi (directo-hacia dentro), se dirigieron a los genes V. Los cebadores inversos, Ro (inverso-hacia fuera) y Ri (inverso-hacia dentro), se dirigieron a cada uno de los genes J o C. Los cebadores Fi y Ri también incluyeron adaptadores de secuenciación B y A, respectivamente, para las plataformas Illumina® (HiSeq, MiSeq y GAIIx) para la secuenciación de extremos emparejados. La segunda ronda de PCR se llevó a cabo utilizando los cebadores comunales (comunes) B y A. Después de la purificación en gel, el producto resultante estaba listo para la secuenciación de alto rendimiento con las plataformas Illumina®. La primera ronda de PCR introdujo códigos de barras y cebadores de secuenciación en los productos de PCR.
La fase exponencial de la amplificación se logró mediante los cebadores comunales en la segunda ronda de PCR; por lo tanto, el repertorio inmunitario diana se amplificó de manera uniforme y semicuantitativa, sin introducir sesgos de amplificación adicionales.
Identificación de la Firma del Cáncer de Mama
Se recogieron un total de 213 muestras, incluidas 103 de pacientes con cáncer de mama y 110 de controles. Se identificaron un total de 14.666.172 CDR3 de las 213 muestras, con un promedio de 68.855 CDR3 de cada muestra. Se encontraron 8.301.648 CDR3 exclusivas de las 213 muestras. Después de eliminar las CDR3 privadas, se identificaron un total de 98.076 CDR3 públicas (es decir, compartidas por al menos dos sujetos) y dominantes (es decir, clasificadas entre las primeras 5.000 CDR3 en cada muestra) de las 213 muestras, utilizando el software iRepertoire (Huntsville, Alabama, EE. UU.) disponible a través del sitio web de la empresa (por ejemplo, Álgebra CDR3). Se generaron un total de 287.198.206 Linklets Positivos a partir de las 213 muestras, con un promedio de 1.003.236 Linklets de cada muestra. Después de eliminar los Linklets Privados, quedaron 16.921.605 Linklets que se compartieron con al menos otra persona. Para cada Linklet compartido, se obtuvo un valor de p para identificar aquellos compartidos preferentemente entre los pacientes. Se identificó un total de 117.069 Linklets como Linklets Significativos con p < 0,05, proporcionando una "firma" para las enfermedades. Un total de 6.171 CDR3 contribuyeron a 117.069 Linklets de firma de la enfermedad. Usando un valor de corte de 600 Linklets Significativos, se pudo diagnosticar el 95 % de los cánceres de mama, con un 93,6 % de especificidad. Cuando se estudiaron 188 muestras de cáncer no de mama, solo tres muestras fueron positivos falsos (con más de 600 DSL), dando una especificidad del 98,4 %.
El método divulgado actualmente aumenta la señal y reduce el fondo para permitir la identificación de CDR3 compartidas que pueden usarse para producir una firma de enfermedad, que no es posible, de otra manera, utilizando métodos convencionales. Como resultado, el método actualmente divulgado tiene el beneficio de permitir el desarrollo de una prueba de diagnóstico para diferentes enfermedades que incluyen, pero sin limitación, cáncer, enfermedad autoinmunitaria, enfermedad inflamatoria y enfermedad infecciosa.
Las metodologías y las diversas realizaciones de las mismas descritas en el presente documento son ejemplares. Son posibles otras realizaciones diferentes de las metodologías descritas en el presente documento.

Claims (8)

REIVINDICACIONES
1. Un método para desarrollar una prueba de diagnóstico para una enfermedad en particular, comprendiendo el método las etapas de:
en una muestra recogida de cada uno de los múltiples sujetos en un grupo de pacientes y un grupo de control, en donde el grupo de pacientes comprende sujetos que tienen la misma enfermedad y el grupo de control comprende sujetos que están sanos;
amplificar y secuenciar el repertorio inmunitario de cada sujeto en cada uno de los dos grupos para identificar cada secuencia de CDR3 exclusiva presente en las muestras y determinar la frecuencia de aparición de cada secuencia de CDR3 exclusiva;
identificar secuencias de CDR3 que se comparten entre al menos dos sujetos en cada uno de los grupos de control y el grupo de pacientes;
clasificar las secuencias de CDR3 por orden de frecuencia de aparición;
identificar los Linklets de cada grupo; e
identificar los Linklets que están asociados en un grado estadísticamente significativo con el grupo de pacientes para proporcionar una firma de la enfermedad.
2. El método de la
Figure imgf000008_0001
reivindicación 1, en donde la muestra es sangre.
3. El método de la
Figure imgf000008_0002
reivindicación 1, en donde la muestra es tejido.
4. El método de la reivindicación 1, en donde se identifican al menos aproximadamente 1.000 secuencias de CDR3 que se comparten entre al menos dos sujetos en cada uno del grupo de control y del grupo de pacientes.
5. El método de la
Figure imgf000008_0003
reivindicación 1, en donde se identifican al menos aproximadamente 106 Linklets de cada grupo.
6. El método de la reivindicación 1, en donde se establece un número mínimo de Linklets asociados con la firma de la enfermedad como un número de diagnóstico, de modo que cuando al menos se identifica ese número de Linklets en la muestra de sangre de un sujeto, se diagnostica que el sujeto tiene la enfermedad.
7. El método de la reivindicación 6, en donde el número de diagnóstico es al menos aproximadamente 500.
8. Un método para desarrollar una prueba de diagnóstico para una enfermedad en particular, comprendiendo el método las etapas de:
en una muestra de sangre recogida de cada uno de los múltiples sujetos en un grupo de pacientes y un grupo de control, en donde el grupo de pacientes comprende sujetos que tienen la misma enfermedad y el grupo de control comprende sujetos que se clasifican como sanos;
amplificar y secuenciar el repertorio inmunitario de cada sujeto en cada uno de los dos grupos para identificar cada secuencia de CDR3 exclusiva presente en las muestras de sangre y determinar la frecuencia de aparición de cada secuencia de CDR3 exclusiva;
identificar al menos aproximadamente 1.000 secuencias de CDR3 que se comparten entre al menos dos sujetos en cada uno del grupo de control y del grupo de pacientes;
clasificar las al menos aproximadamente 1.000 secuencias de CDR3 por orden de frecuencia de aparición; identificar al menos aproximadamente 106 Linklets de cada grupo; e
identificar los Linklets que están asociados en un grado estadísticamente significativo con el grupo de pacientes para proporcionar una firma de la enfermedad;
en donde se establece un número mínimo de Linklets asociados con la firma de la enfermedad como un número de diagnóstico, de modo que cuando al menos se identifica ese número de Linklets en la muestra de sangre de un sujeto, se diagnostica que el sujeto tiene la enfermedad.
ES16762365T 2015-03-09 2016-03-09 Método para identificar patrones de CDR3 asociados a enfermedades en un repertorio inmunitario Active ES2767696T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562130512P 2015-03-09 2015-03-09
PCT/US2016/021430 WO2016144996A1 (en) 2015-03-09 2016-03-09 Method for identifying disease-associated cdr3 patterns in an immune repertoire

Publications (1)

Publication Number Publication Date
ES2767696T3 true ES2767696T3 (es) 2020-06-18

Family

ID=56879019

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16762365T Active ES2767696T3 (es) 2015-03-09 2016-03-09 Método para identificar patrones de CDR3 asociados a enfermedades en un repertorio inmunitario

Country Status (14)

Country Link
US (2) US20160333409A1 (es)
EP (1) EP3268488B1 (es)
JP (1) JP6959138B2 (es)
KR (1) KR102607652B1 (es)
CN (1) CN107406871B (es)
AU (2) AU2016229866A1 (es)
BR (1) BR112017019267B1 (es)
CA (1) CA2978880C (es)
ES (1) ES2767696T3 (es)
HK (1) HK1245847A1 (es)
PT (1) PT3268488T (es)
RU (1) RU2715633C2 (es)
SG (1) SG11201706830TA (es)
WO (1) WO2016144996A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180325931A1 (en) 2017-01-21 2018-11-15 Ningbo Zhiming Biotechnology Co., Ltd. Use of paeoniflorin-6'-o-benzenesulfonate in treatment of sjögren's syndrome
WO2024089689A1 (en) * 2022-10-25 2024-05-02 Clonal Ltd Methods for detection of breast cancer

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITRM20070429A1 (it) * 2007-08-06 2009-02-07 Uni Cattolica Del Sacro Cuor E Mezzi per la diagnosi la prevenzione e la cura dell'artrite reumatoide.
CN101225441B (zh) * 2007-12-05 2010-12-01 浙江大学 一种检测克隆特异性t淋巴细胞tcr bv cdr3基因组成的方法
CN102066578B (zh) * 2008-04-16 2016-07-06 哈森阿尔法生物技术研究院 用于评价和比较免疫组库的方法
WO2011106738A2 (en) * 2010-02-25 2011-09-01 Fred Hutchinson Cancer Research Center Use of tcr clonotypes as biomarkers for disease
AU2012315616C1 (en) * 2011-09-28 2016-11-03 Jian Han Identification of antigen-specific adaptive immune responses using Arm-PCR and high-throughput sequencing
CA2851923A1 (en) * 2011-10-14 2013-04-18 Accugenomics, Inc. Nucleic acid amplification and use thereof
EP2788509B1 (en) * 2011-12-09 2018-07-11 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
ES2798119T3 (es) * 2013-02-11 2020-12-09 Irepertoire Inc Método para evaluar un inmunorrepertorio
CN106103711A (zh) * 2013-11-21 2016-11-09 组库创世纪株式会社 T细胞受体和b细胞受体库分析系统及其在治疗和诊断中的应用

Also Published As

Publication number Publication date
RU2715633C2 (ru) 2020-03-02
CA2978880A1 (en) 2016-09-15
HK1245847A1 (zh) 2018-08-31
BR112017019267A2 (pt) 2018-07-24
EP3268488A1 (en) 2018-01-17
CN107406871A (zh) 2017-11-28
CN107406871B (zh) 2022-02-18
JP6959138B2 (ja) 2021-11-02
KR102607652B1 (ko) 2023-11-28
JP2018509155A (ja) 2018-04-05
BR112017019267B1 (pt) 2024-02-06
EP3268488A4 (en) 2018-08-15
AU2016229866A1 (en) 2017-09-21
SG11201706830TA (en) 2017-09-28
KR20170134427A (ko) 2017-12-06
RU2017132290A (ru) 2019-04-09
RU2017132290A3 (es) 2019-04-09
US20160333409A1 (en) 2016-11-17
EP3268488B1 (en) 2019-11-06
PT3268488T (pt) 2020-02-04
US20220170101A1 (en) 2022-06-02
WO2016144996A1 (en) 2016-09-15
AU2022203233A1 (en) 2022-06-02
CA2978880C (en) 2023-09-19

Similar Documents

Publication Publication Date Title
Ordovas-Montanes et al. Allergic inflammatory memory in human respiratory epithelial progenitor cells
ES2730980T3 (es) Método de evaluación de la inmunodiversidad y su uso
JP6189600B2 (ja) T細胞受容体v/d/j遺伝子内の反復配列によるクローン細胞の同定
Liu et al. Spatial maps of T cell receptors and transcriptomes reveal distinct immune niches and interactions in the adaptive immune response
CN104271759B (zh) 作为疾病信号的同种型谱的检测
CN110246539B (zh) 一种免疫力水平评估的方法及装置
CN103134938A (zh) 适体在蛋白质组学中的用途
CN108513660A (zh) 免疫组库正常性评估方法及其应用
CN113707316B (zh) 免疫状态评估方法及应用
US20220170101A1 (en) Method for identifying disease-associated cdr3 patterns in an immune repertoire
US20220112555A1 (en) Profiling microvesicle nucleic acids and uses thereof as signatures in diagnosis of renal transplant rejection
AU2019341745A1 (en) Phenotypic and molecular characterisation of single cells
JP2020521443A (ja) 微小胞核酸および/またはタンパク質、並びに腎移植拒絶反応マーカーとしてのその使用
CN110878350B (zh) 一种用于脓毒症诊断及预后评估的试剂盒
Sun et al. BCG vaccination impacts the epigenetic landscape of progenitor cells in human bone marrow
US20220148690A1 (en) Immunorepertoire wellness assessment systems and methods
RU2554746C1 (ru) Способ получения суммарной фракции внеклеточных нуклеиновых кислот из крови
CN108070644B (zh) 一种妊娠高血压的诊断系统
CN117286249A (zh) 用于肝癌预后评估的t细胞抗原受体标志物及其应用
Situ Profiling T Cell Activation Using