ES2593614T3 - Monitorización de estados de salud y enfermedad usando perfiles de clonotipos - Google Patents

Monitorización de estados de salud y enfermedad usando perfiles de clonotipos Download PDF

Info

Publication number
ES2593614T3
ES2593614T3 ES11777704.5T ES11777704T ES2593614T3 ES 2593614 T3 ES2593614 T3 ES 2593614T3 ES 11777704 T ES11777704 T ES 11777704T ES 2593614 T3 ES2593614 T3 ES 2593614T3
Authority
ES
Spain
Prior art keywords
sample
cells
clones
sequence
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11777704.5T
Other languages
English (en)
Inventor
Malek Faham
Thomas Willis
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adaptive Biotechnologies Corp
Original Assignee
Adaptive Biotechnologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44903937&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2593614(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Adaptive Biotechnologies Corp filed Critical Adaptive Biotechnologies Corp
Application granted granted Critical
Publication of ES2593614T3 publication Critical patent/ES2593614T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5047Cells of the immune system
    • G01N33/505Cells of the immune system involving T-cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5047Cells of the immune system
    • G01N33/5052Cells of the immune system involving B-cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Toxicology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un método para detectar la recurrencia de un neoplasma linfoide en un paciente con clonotipos de cáncer definidos que comprende las etapas de: (a) determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que comprende las etapas de: (i) amplificar moléculas de ácido nucleico de células T y/o células B de una muestra obtenida del paciente; (ii) aislar espacialmente moléculas individuales del ácido nucleico amplificado; y (iii) secuenciar las moléculas individuales del ácido nucleico por secuenciación de nueva generación para formar el perfil de secuencias de ADN recombinadas; (b) evaluar el perfil de secuencias de ADN recombinadas para determinar los niveles de los clonotipos de cáncer definidos y los clones que evolucionan a partir de éstos; y (c) usar los niveles para detectar la recurrencia del neoplasma linfoide.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
a los segmentos V y una pluralidad de cebadores complementarios a los segmentos C. En otro caso, dicha pluralidad de cebadores complementarios a los segmentos V comprende al menos tres cebadores diferentes para cada segmento V y la pluralidad de cebadores complementarios a los segmentos C comprenden al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, o al menos 6 cebadores. En otro caso, dichas células T o B son subconjuntos de las células T y B totales. En otro caso, dicho subconjunto de células T son células CD4+, CD8+, o células con CD27 alto. En otro caso, dicha muestra comprende al menos 100.000, al menos 500.000, al menos 750.000, de al menos 1.000.000 de células T. En otro caso, dicha secuenciación comprende al menos 1.000 de lecturas por operación, al menos 10.000 de lecturas por operación, al menos 100.000 de lecturas por operación, o al menos 1.000.000 de lecturas por operación. En otro caso, dicha secuenciación comprende generar aproximadamente 30 pb, aproximadamente 40 pb, aproximadamente 50 pb, aproximadamente 60 pb, aproximadamente 70 pb, aproximadamente 80 pb, aproximadamente 90 pb, aproximadamente 100 pb, aproximadamente 110, o aproximadamente 120 pb por lectura. En otro caso, dicha muestra se toma cuando el sujeto está en un estado de crisis de una enfermedad autoinmune. En otro caso, dicha muestra se toma de un sujeto que tiene o se sospecha que tiene lupus eritematoso sistémico. Se proporciona un método para determinar uno o más clonotipos que se correlacionan en un sujeto que comprende: generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas individuales aisladas espacialmente de al menos una muestra del sujeto, en el que la al menos una muestra está relacionada con un primer estado de la enfermedad, y determinar uno o más clonotipos que se correlacionan en el sujeto sobre la base de uno o más perfiles de clonotipos. En un caso, dicha al menos una muestra es de un tejido afectado por la enfermedad. En otro caso, dicha determinación de uno o más clonotipos que se correlacionan comprende comparar los perfiles de clonotipos de al menos dos muestras. En otro caso, el primer estado de la enfermedad es un estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están presentes en el estado de pico de la enfermedad, En otro caso, dichos uno o más clonotipos que se correlacionan están ausentes en el estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están altos en el estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están bajos en el estado de pico de la enfermedad. En otro caso, dicha muestra comprende células T y/o células B. En otro caso, dichas células T y/o células B comprenden un subconjunto de células T y/o células B. En otro caso, dicho subconjunto de células T y/o células B está enriquecido por interacción con un marcador. En otro caso, dicho marcador es un marcador de superficie celular en el subconjunto de células T y/o células B. En otro caso, dicho subconjunto de células T y/o células B interacciona con un antígeno presente específicamente en la enfermedad. En otro caso, la enfermedad es lupus eritematoso sistémico o esclerosis múltiple. Se describe un método para desarrollar un algoritmo que puede predecir uno o más clonotipos que se correlacionan en cualquier muestra de un sujeto con una enfermedad, que comprende: a) generar una pluralidad de perfiles de clonotipos de un conjunto de muestras, en el que las muestras son relevantes para la enfermedad, b) identificar uno o más clonotipos que se correlacionan del conjunto de muestras, c) usar parámetros de secuencia y/o datos funcionales de uno o más clonotipos que se correlacionan identificados en b) para desarrollar el algoritmo que puede predecir clonotipos que se correlacionan en cualquier muestra de un sujeto con la enfermedad. En un caso, el conjunto de muestras se toma de uno o más tejidos afectados por la enfermedad. En otro caso, dicha identificación de uno o más clonotipos que se correlacionan comprende comparar perfiles de clonotipos de al menos dos muestras. En otro caso, dichos datos funcionales incluyen la capacidad de unión de marcadores en la superficie de células T y/o células B o interacción con antígeno por una célula T o célula B. En otro caso, dichos parámetros de secuencia comprenden secuencia de ácido nucleico y secuencia de aminoácidos predicha. En otro caso, las muestras son de uno o más individuos en un estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están presentes e el estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están a un alto nivel en el estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están a un bajo nivel en el estado de pico de la enfermedad. En otro caso, el uno o más clonotipos que se correlacionan están ausentes en el estado de pico de la enfermedad. En otro caso, la enfermedad es lupus eritematoso sistémico o esclerosis múltiple. En otro caso, se proporciona un método para descubrir uno o más clonotipos que se correlacionan para un individuo, que comprende introducir un perfil de clonotipos de una muestra del individuo en un algoritmo, y usar el algoritmo para determinar uno o más clonotipos que se correlacionan para el individuo. En un caso, se proporciona el algoritmo que es un algoritmo que puede predecir uno o más clonotipos que se correlacionan en cualquier muestra de un sujeto con una enfermedad, que comprende, desarrollar dicho algoritmo por: a) generación de una pluralidad de perfiles de clonotipos de un conjunto de muestras, en el que las muestras son relevantes para la enfermedad, b) identificación de uno o más clonotipos que se correlacionan del conjunto de muestras, c) uso de parámetros de secuencia y/o datos funcionales de uno o más clonotipos que se correlacionan identificados en b) para desarrollar un algoritmo que puede predecir clonotipos que se correlacionan en cualquier muestra de un sujeto con la enfermedad. En un caso, dicha muestra se toma en un estado de pico de la enfermedad. En otro caso, la muestra se toma de tejido afectado por la enfermedad. Se describe un método para generar una algoritmo que calcula una puntuación de la actividad de una enfermedad, que comprende: desarrollar un algoritmo que usa un conjunto de factores para combinar niveles de clonotipos que se correlacionan en una puntuación de actividad de la enfermedad, comparar la puntuación de actividad de la enfermedad con datos clínicos respecto al estado de la enfermedad, y
8
optimizar los factores con el fin de maximizar la correlación entre los datos clínicos y la puntuación de actividad de la enfermedad. En un caso, se proporciona un método para monitorizar el estado de la enfermedad de un individuo, que comprende: a) determinar un perfil de clonotipos de una muestra del individuo, b) introducir la información del perfil de clonotipos de a) en un algoritmo que calcula una puntuación de actividad de la enfermedad, en el que el algoritmo se genera desarrollando un algoritmo que usa un conjunto de factores para combinar niveles de clonotipos que se correlacionan en una puntuación de actividad de la enfermedad, comparar la puntuación de actividad de la enfermedad con datos clínicos respecto al estado de la enfermedad, y optimizar los factores con el fin de maximizar la correlación entre los datos clínicos y la puntuación de actividad de la enfermedad, y c) usar el algoritmo que calcula una puntuación de actividad de la enfermedad para generar una puntuación predictiva del estado de la enfermedad del individuo. En otro caso, el método para monitorizar el estado de la enfermedad de un individuo comprende además determinar uno o más clonotipos que se correlacionan en el individuo, e introducir la información del uno o más clonotipos que se correlacionan en el algoritmo. En otro caso, dicha determinación de uno o más clonotipos que se correlacionan en el individuo comprende a) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas individuales aisladas espacialmente de al menos una muestra del sujeto, en el que la al menos una muestra está relacionada con un primer estado de la enfermedad, y b) determinar uno o más clonotipos que se correlacionan en el sujeto sobre la base del uno o más perfiles de clonotipos. En otro caso, dicha determinación de uno o más clonotipos que se correlacionan en el individuo comprende a) introducir un perfil de clonotipos de una muestra del individuo en un algoritmo que puede predecir uno o más clonotipos que se correlacionan, en el que dicho algoritmo que puede predecir uno o más clonotipos que se correlacionan se desarrolla por i) generación de una pluralidad de perfiles de clonotipos de un conjunto de muestras, en el que las muestras son relevantes para la enfermedad, ii) identificación de uno o más clonotipos que se correlacionan del conjunto de muestras, iii) uso de parámetros de secuencia y/o datos funcionales de uno o más clonotipos que se correlacionan identificados en ii) para desarrollar el algoritmo que puede predecir clonotipos que se correlacionan en cualquier muestra de un sujeto con la enfermedad, y c) uso del algoritmo que puede predecir uno o más clonotipos que se correlacionan para determinar uno
o más clonotipos que se correlacionan para el individuo. En otro caso, la enfermedad es lupus eritematoso sistémico o esclerosis múltiple. Se describe un método para determinar uno o más clonotipos de células T
o B que se correlacionan, que comprende: a) dividir una muestra de células de un sujeto en al menos dos muestras, b) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de una de las muestras de células del sujeto, c) enriquecer otra muestra de células de ese sujeto sobre la base de al menos un parámetro molecular de las células, d) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de la muestra enriquecida del sujeto, y e) identificar al menos un clonotipo sobre la base de clonotipos cuya abundancia en la muestra se ha alterado entre la muestra enriquecida y la muestra no enriquecida. En otro caso, el parámetro molecular es un marcador de la superficie celular. En otro caso, el enriquecimiento se hace capturando células usando un marcador de afinidad inmovilizado en una fase sólida. En otro caso, la superficie sólida es un conjunto de lechos. En otro caso, la superficie sólida es una columna. En otro caso, el marcador se marca usando un resto fluorescente. En otro caso, el enriquecimiento se consigue por citometría de flujo usando el marcador fluorescente. En otro caso, las células son linfocitos B y el enriquecimiento se hace usando antígenos que se unen al receptor de células
B.
En otro caso, el enriquecimiento se hace mediante captura en una superficie sólida en la que se inmovilizan los antígenos. En otro caso, el antígeno se usa para marcar los linfocitos B y el enriquecimiento se consigue usando citometría de flujo usando este marcador. En otro caso, las células son linfocitos T y el enriquecimiento se hace usando un método que permite marcar las células T que reaccionan con un antígeno específico y enriquecer usando citometría de flujo. En otro caso, las células T se marcan usando el método de tinción intracelular de citoquinas. En otro caso, las células T se marcan usando el método de captura de citoquinas. En otro caso, el parámetro molecular es el receptor de células B que es capaz de unirse al menos a un antígeno que es específico para un patógeno. En otro caso, el parámetro molecular es el receptor de células T que es capaz de unirse al menos a un antígeno que es específico para un patógeno. En otro caso, la muestra se toma de un paciente que se ha expuesto a un patógeno en un primer punto de tiempo. Se describe un método para determinar un conjunto de clonotipos en un individuo que se correlacionan con una reacción inmune a un patógeno, que comprende: a) dividir una muestra de células de un sujeto en al menos dos muestras, b) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de una muestra de células del sujeto, c) enriquecer otra muestra de células de ese sujeto sobre la base de la capacidad de las células de unirse al menos a un antígeno del patógeno, d) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de la muestra enriquecida del sujeto y, e) identificar al menos un clonotipo que se correlaciona sobre la base de clonotipos cuya abundancia en la muestra se ha alterado entre la muestra enriquecida y la muestra no enriquecida. Se describe un método para determinar un conjunto de clonotipos en un individuo que se correlaciona con una reacción inmune a un tumor, que comprende: a) dividir una muestra de células de un sujeto en al menos dos muestras, b) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de una muestra de células del sujeto, c) enriquecer otra muestra de células de ese sujeto sobre la base de la capacidad de las células de unirse al menos a un autoantígeno presente en el tumor, d) generar uno o más perfiles de clonotipos por
9
secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de la muestra enriquecida del sujeto, e) identificar al menos un clonotipo que se correlaciona sobre la base de clonotipos cuya abundancia en la muestra se ha alterado entre la muestra enriquecida y la muestra no enriquecida. En otro caso, se usan los niveles de clonotipos que se correlacionan para evaluar el riesgo de que el individuo tenga un tumor. En otro caso, se sabe que los antígenos están presentes en un tumor que ya ha ocurrido en ese individuo y los clonotipos que se correlacionan se usan para evaluar el riesgo de recurrencia del tumor. En otro caso, se sabe que los antígenos están presentes en tumores en otros individuos y los clonotipos se usan para evaluar el riesgo de cáncer en un paciente que no ha tenido un tumor detectado previamente. Se describe un método para determinar un conjunto de clonotipos en un individuo que se correlaciona con una reacción inmune a un material liberado en la corriente sanguínea por daño a un órgano, que comprende: a) dividir una muestra de células de un sujeto en al menos dos muestras, b) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de una muestra de células del sujeto, c) enriquecer otra muestra de células de ese sujeto sobre la base de la capacidad de las células de unirse al menos a un autoantígeno presente en los órganos dañados, d) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de la muestra enriquecida del sujeto y, e) identificar al menos un clonotipo que se correlaciona sobre la base de clonotipos cuya abundancia en la muestra se ha alterado entre la muestra enriquecida y la muestra no enriquecida. En otro caso, se usan los niveles de clonotipos que se correlacionan para evaluar el riesgo de que el individuo tenga daño orgánico. Se describe un método para determinar un conjunto de clonotipos en un individuo que se correlaciona con una reacción inmune a un agente terapéutico, que comprende: a) dividir una muestra de células de un sujeto en al menos dos muestras, b) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de una muestra de células del sujeto, c) enriquecer otra muestra de células de ese sujeto sobre la base de la capacidad de las células de unirse al menos a un antígeno contenido en el agente terapéutico, d) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de la muestra enriquecida del sujeto y, e) identificar al menos un clonotipo que se correlaciona sobre la base de clonotipos cuya abundancia en la muestra se ha alterado entre la muestra enriquecida y la muestra no enriquecida. En otro caso, se usan los niveles de clonotipos que se correlacionan para evaluar el riesgo de que el individuo esté presentando hipersensibilidad a un agente terapéutico. Se describe un método para determinar un conjunto de clonotipos en un individuo que se correlaciona con una reacción inmune frente a una placa arterial, que comprende: a) dividir una muestra de células de un sujeto en al menos dos muestras, b) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de una muestra de células del sujeto, c) enriquecer otra muestra de células de ese sujeto sobre la base de la capacidad de las células de unirse al menos a un antígeno presente en la placa arterial, d) generar uno o más perfiles de clonotipos por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de la muestra enriquecida del sujeto y, e) identificar al menos un clonotipo que se correlaciona sobre la base de clonotipos cuya abundancia en la muestra se ha alterado entre la muestra enriquecida y la muestra no enriquecida. En otro caso, se usan los niveles de clonotipos que se correlacionan para evaluar el riesgo de que el individuo tenga una enfermedad cardiovascular. En otro caso, se usan los niveles de clonotipos que se correlacionan para evaluar el riesgo de que la placa arterial sea inestable. Se describe un método para determinar un identificador de secuencia encontrado en células implicadas en un neoplasma linfoide, que comprende: a) obtener una muestra de células del individuo afectado en la que se sabe que existen las células cancerosas, b) generar uno o más perfiles de clonotipos relacionados con al menos una reorganización genómica de células inmunes por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de las células en la muestra, c) identificar el identificador de secuencia como la secuencia del clonotipo asociado con el tumor. En otro caso, la muestra es de la médula ósea del paciente. En otro caso, la muestra es de la sangre del paciente. En otro caso, la muestra es de una biopsia de un tumor linfoide sólido. En otro caso, la reorganización genómica de células inmunes es una reorganización VDJ de IgH en una célula B. En otro caso, la reorganización genómica de células inmunes es una reorganización DJ de IgH en una célula B. En otro caso, la reorganización genómica de células inmunes es una reorganización VJ de IgK en una célula B. En otro caso, la reorganización genómica de células inmunes es una reorganización VJ de IgL en una célula B. En otro caso, la reorganización genómica de células inmunes es una reorganización VDJ de TCR β en una célula T. En otro caso, la reorganización genómica de células inmunes es una reorganización DJ de TCR β en una célula T. En otro caso, la reorganización genómica de células inmunes es una reorganización VJ de TCR α en una célula T. En otro caso, la reorganización genómica de células inmunes es una reorganización VJ de TCR λ en una célula T. En otro caso, la reorganización genómica de células inmunes es una reorganización VDJ de TCR δ en una célula T. En otro caso, la reorganización genómica de células inmunes es una reorganización VD de TCR δ en una célula T. En otro caso, la reorganización genómica de células inmunes es una translocación de un segmento J de IgH a otra región del genoma. En otro caso, la reorganización genómica de células inmunes es una translocación de cualquier segmento J a otra región del genoma. En otro caso, la identificación del clonotipo asociado a tumor se hace por frecuencia de clonotipo. En otro caso, la identificación del clonotipo asociado a tumor se hace por frecuencia de clonotipo. En otro caso, la identificación del clonotipo asociado a tumor se hace por la detección de reorganización cruzada de linaje. En otro caso, la
10
identificación del clonotipo asociado a tumor se hace por la identificación de reorganizaciones no funcionales. En otro caso, la identificación del clonotipo asociado a tumor se hace por la asociación de clonotipos celulares con al menos un marcador molecular asociado con el tumor. Se describe un método para determinar los niveles de células tumorales linfoides circulantes en un individuo cuyo tumor se ha asociado con un único identificador de secuencia en un primer punto de tiempo, que comprende: a) obtener una muestra de células del paciente, b) generar uno o más perfiles de clonotipos relacionados con al menos una reorganización genómica de células inmunes por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de las células en la muestra, c) determinar los niveles de células tumorales a partir del nivel de los clonotipos asociados con el identificador de secuencia. Se describe un método para determinar los niveles de células tumorales linfoides circulantes en un individuo cuyo tumor se ha asociado con un único identificador de secuencia en un primer punto de tiempo, que comprende: a) obtener una muestra de células del paciente, b) enriquecer las células sobre la base de al menos un marcador molecular, c) generar uno o más perfiles de clonotipos relacionados con al menos una reorganización genómica de células inmunes por secuenciación de ácido nucleico de moléculas aisladas espacialmente individualmente de las células en la muestra, d) determinar los niveles de células tumorales a partir del nivel de clonotipos asociados con el identificador de secuencia. En otro caso, la muestra es una muestra de sangre. En otro caso, la muestra es una muestra de médula ósea. En otro caso, la muestra es una muestra de linfa. En otro caso, la muestra es una muestra de tejido. En otro caso, las células se marcan fluorescentemente y se enriquecen usando citometría de flujo. En otro caso, las células se enriquecen mediante la unión a un soporte sólido. En otro caso, el clonotipo se define como el clonotipo que contiene el único identificador de secuencia. En otro caso, se determina que los clonotipos son aquellos clonotipos que probablemente hayan resultado de mutaciones y reorganizaciones en el identificador de secuencia. En otro caso, se usan los niveles de células tumorales circulantes y/o el cambio en los niveles de células tumorales circulantes en un algoritmo para producir una puntuación que se correlaciona con el riesgo de tener una recurrencia de tumor clínica. En otro caso, se usan los niveles de células tumorales circulantes y/o el cambio en los niveles de las células tumorales circulantes para tomar una decisión sobre el tratamiento.
II. Métodos para determinar perfiles de clonotipos
Los métodos descritos en la presente memoria pueden usarse para generar perfiles de secuencias de ADN recombinadas, o clonotipos, en una muestra de un sujeto. En un caso, se describe un método para determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que incluye obtener una muestra de un sujeto que comprende células T y/o células B, aislar moléculas individuales de ADN genómico de dichas células, secuenciar las moléculas individuales aisladas de ADN genómico, y determinar los niveles de diferentes secuencias de la muestra para generar dicho perfil de secuencias de ADN recombinadas. En otro caso, se describe un método para determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que incluye obtener una muestra de un sujeto que comprende células T y/o células B, aislar moléculas individuales de ADN genómico de las células, amplificar las moléculas individuales de ADN genómico, secuenciar el ADN amplificado, y determinar los niveles de diferentes secuencias de la muestra para generar dicho perfil de secuencias de ADN recombinadas. En otro caso, se describe un método para determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que incluye obtener una muestra de un sujeto que comprende células T y/o células B, amplificar el ADN genómico de las células, aislar moléculas individuales del ADN amplificado, secuenciar las moléculas individuales aisladas de ADN amplificado, y determinar los niveles de diferentes secuencias de la muestra para generar el perfil de secuencias de ADN recombinadas. En otro caso, se describe un método para determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que incluye obtener una muestra de un sujeto que incluye células T y/o células B, amplificar el ADN genómico de las células, aislar moléculas individuales del ADN amplificado, re-amplificar las moléculas de ADN amplificado, secuenciar las moléculas de ADN re-amplificado, y determinar los niveles de diferentes secuencias de la muestra para generar el perfil de secuencias de ADN recombinadas. En otro caso, se describe un método para determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que incluye obtener una muestra de un sujeto que comprende células T y/o células B, aislar el ARN de dicha muestra, transcribir de forma inversa el ARN de dichas células para formar ADNc, aislar moléculas individuales de dicho ADNc, opcionalmente re-amplificar dicho ADNc, secuencias dichas moléculas individuales aisladas de dicho ADNc o ADN re-amplificado, y determinar los niveles de diferentes secuencias de dicha muestra para generar dicho perfil de secuencias de ADN recombinadas. En otro caso, se describe un método para determinar un perfil de secuencias de ADN recombinadas en células T y/o células B que incluye obtener una muestra de un sujeto que incluye células T y/o células B, aislar moléculas individuales de ARN de dicha muestra, secuenciar las moléculas individuales de ARN, y determinar los niveles de diferentes secuencias de dicha muestra para generar el perfil de secuencias de ADN recombinadas.
Sujetos y muestras
Los métodos de la invención proporcionada pueden usar muestras de sujetos o individuos (por ejemplo, pacientes). El sujeto puede ser un paciente, por ejemplo, un paciente con una enfermedad autoinmune. El sujeto puede ser un paciente con una enfermedad infecciosa o cáncer, tal como una leucemia o un linfoma. El sujeto puede ser un mamífero, por ejemplo, un ser humano. El sujeto puede ser macho o
11
imagen7
memoria). En un caso, se toma una muestra que contiene con una probabilidad de noventa y nueve por ciento cada clonotipo de una población presente a una frecuencia de 0,001 por ciento o mayor. En otro caso, se toma una muestra que contiene con una probabilidad de noventa y nueve por ciento cada clonotipo de una población presente a una frecuencia de 0,0001 por ciento o mayor. En una realización, una muestra de células B o células T incluye al menos medio millón de células, y en otra realización dicha muestra incluye al menos un millón de células. Siempre que una fuente de material de la que se toma una muestra es escasa, tal como, muestras de estudios clínicos, o semejantes, el ADN del material puede amplificarse por una técnica no sesgada, tal como amplificación de genoma completo (WGA), amplificación por desplazamiento múltiple (MDA); o técnica semejante, por ejemplo, Hawkins et al, Curr. Opin. Biotech., 13: 65-67 (2002); Dean et al, Genome Research, 11: 1095-1099 (2001); Wang et al, Nucleic Acids Research, 32: e76 (2004); Hosono et al, Genome Research, 13: 954-964 (2003); y semejantes. Las muestras de sangre tienen un interés particular, especialmente en la monitorización de neoplasmas linfoides, tales como linfomas, leucemias, o semejantes, y pueden obtenerse usando técnicas convencionales, por ejemplo, Innis et al, editores, PCR Protocols (Academic Press, 1990); o semejantes. Por ejemplo, las células sanguíneas blancas pueden separarse de las muestras de sangre usando técnicas convencionales, por ejemplo, kit RosetteSep (Stem Cell Technologies, Vancouver, Canadá). Las muestras de sangre pueden variar en volumen de 100 μL a 10 mL; en un aspecto, los volúmenes de la muestra de sangre están en el intervalo de 200, 100 μL a 2 mL. El ADN y/o ARN puede extraerse de dicha muestra de sangre usando técnicas convencionales para uso en métodos de la invención, por ejemplo, el kit de sangre y tejido DNeasy (Qiagen, Valencia, CA). Opcionalmente, pueden aislarse adicionalmente subconjuntos de células sanguíneas blancas, por ejemplo, linfocitos, usando técnicas convencionales, por ejemplo, separación de células activada por fluorescencia (FACS) (Becton Dickinson, San Jose, CA), separación de células activada magnéticamente (MACS) (Miltenyi Biotec, Auburn, CA), o semejantes. En otras realizaciones, los ácidos nucleicos se analizan de una muestra de un subconjunto de células. Puede emplearse un método para separar células, por ejemplo, usando un marcador de la superficie celular. Por ejemplo, las células pueden aislarse por citometría de flujo para separar células, separación por flujo, separación de células activada por fluorescencia (FACS), separación basada en lechos tal como separación de células magnética (MACS; por ejemplo, usando partículas magnéticas recubiertas de anticuerpo), separación basada en el tamaño (por ejemplo, un tamiz, una matriz de obstáculos, o un filtro), separación en un dispositivo de microfluido, separación basada en anticuerpo, sedimentación, adsorción por afinidad, extracción por afinidad, o centrifugación en gradiente de densidad. Las células pueden purificarse por microdisección con captura de láser. La separación puede basarse en el tamaño, morfología celular o en marcadores intracelulares o extracelulares. Los métodos para aislar o separar células tumorales se describen, por ejemplo, en Nagrath S. et al. (2007) Nature 450: 1235-1239; Patentes US nos. 6008002, 7232653, y 7332288; Publicación PCT No. WO2008157220A1; y Solicitudes de Patente US Nos. US20080138805A1 y US20090186065; y Rosenberg R. et al. (2002) Cytometry 49 150-158. El subconjunto de células puede ser un subconjunto de células T y/o células B. El subconjunto de células T puede ser células CD4+, CD8+, o altas en CD27. Las mezclas de anticuerpos para marcar y/o separar una gran variedad de subconjuntos de células T y células B están disponibles comercialmente de proveedores tales como Quest Diagnostic (San Juan Capistrano, CA); Dako (Dinamarca); y semejantes. Lo siguiente son ejemplos de kits disponibles para subconjuntos relacionados con enfermedad (en los que se lista la especificidad de antígeno de los anticuerpos: leucemia/linfoma linfoblástico de precursor de B (CD19, CD79a (citoplásmico), CD20, CD10, TDt, HLADR, CD34, IgM (citoplásmico)); linfoma de células B grandes difuso (CD20, CD19, CD22, CD79a, CD30); linfoma folicular (CD20, CD10, CD10, BCL2, BCL6); leucemia de células del manto (CD19, CD20, CD5, CD23-, BCL1); y semejantes. La separación de células activada por fluorescencia (FACS) usa características de dispersión de la luz y fluorescentes para separar células. Puede conferirse una propiedad fluorescente en una célula usando, por ejemplo, sondas de ácidos nucleicos o anticuerpos conjugados con un colorante fluorescente. Una suspensión celular puede formar una corriente de líquido que fluye. La corriente de células forma gotas que contienen aproximadamente una célula por gota. Antes de que la corriente forme gotas, se mide una característica fluorescente de cada célula. Se pone una carga en un anillo de carga eléctrica antes de la medición de la intensidad de fluorescencia y la carga opuesta es portada en la gota al desprenderse de la corriente. Las gotas cargadas pasan a través de dos placas de deflección de alto voltaje que desvían las gotas en diferentes contenedores sobre la base de su carga. La carga puede aplicarse directamente a la corriente y la gota que se desprende retiene la carga del mismo signo que la corriente. La corriente se vuelve a hacer neutra después de que la gota se desprenda. En FACS puede usarse inmunofluorescencia directa o indirecta. En la inmunofluorescencia directa, un anticuerpo se conjuga directamente con un colorante fluorescente, En la inmunofluorescencia indirecta, el anticuerpo primario no está marcado, y un anticuerpo secundario se conjuga con un colorante fluorescente. Como las recombinaciones de identificación están presentes en el ADN de las células de inmunidad adaptativa de cada individuo así como en sus transcritos de ARN asociados, bien el ARN o ADN puede secuenciarse en los métodos de la invención proporcionada. Una secuencia recombinada de una célula T
o célula B que codifica un receptor de células T o molécula de inmunoglobulina, o una parte de ésta, se refiere como un clonotipo. El ADN o ARN puede corresponder a secuencias de genes del receptor de células T (TCR) o genes de inmunoglobulina (Ig) que codifican anticuerpos. Por ejemplo, el ADN y ARN
13
imagen8
Sin embargo, un bajo número de copias usando PCR en tiempo real puede deberse bien a bajo número de copias o a efectos inhibidores, u otras condiciones subóptimas en la reacción. Otra estrategia que puede utilizarse es añadir una cantidad conocida de moléculas reorganizadas de receptor inmune únicas con una secuencia conocida, es decir, cantidades conocidas de uno o más estándares internos, al ADNc o ADN genómico de una muestra con una cantidad desconocida. Mediante el recuento del número relativo de moléculas que se obtiene de la secuencia conocida añadida comparado con el resto de las secuencias de la misma muestra, se puede estimar el número de moléculas de receptor inmune reorganizadas en la muestra de ADNc inicial. (Dichas técnicas para recuento molecular son muy conocidas, por ejemplo, Brenner et al, patente US 7.537.897. Los datos de la secuenciación de la secuencia única añadida pueden usarse para distinguir las diferentes posibilidades si también se está usando una calibración de PCR en tiempo real. Un número bajo de copias de receptor inmune reorganizado en el ADN (o ADNc) crearía una alta proporción entre el número de moléculas para la secuencia adicionada comparado con el resto de las secuencias de la muestra. Por otra parte, si el bajo número de copias medido por PCR en tiempo real se debe a ineficiencia en la reacción, la proporción no sería alta. En la presente memoria se describen métodos para medir la expresión de clonotipos a nivel cellar. Esto es, como se ha indicado anteriormente, los clonotipos pueden usarse para contar linfocitos; por lo tanto, midiendo los clonotipos derivados de ADN genómico y los mismos clonotipos derivados de ARN, puede determinarse la expresión de clonotipos basada en células. Un método para medir simultáneamente el número de linfocitos y los niveles de expresión de clonotipos en una muestra puede comprender las etapas de: (a) obtener de un individuo una muestra que comprende células T y/o células B; (b) secuenciar moléculas individuales aisladas espacialmente derivadas del ADN genómico de dichas células, comprendiendo dichas moléculas individuales aisladas espacialmente un número de clonotipos correspondiente a un número de linfocitos en la muestra; (c) secuenciar las moléculas individuales aisladas espacialmente derivadas de ARN de dichas células, comprendiendo dichas moléculas individuales aisladas espacialmente números de clonotipos correspondientes a los niveles de expresión de éstos en los linfocitos de la muestra; y (d) determinar los niveles de expresión de los clonotipos en los linfocitos de la muestra comparando para cada clonotipo el número determinado a partir de moléculas individuales aisladas derivadas del ADN genómico de dichas células y el número determinado a partir de moléculas individuales aisladas derivadas del ARN de dichas células. El ADN genómico y ARN se extraen fácilmente de la muestra usando kits disponibles comercialmente, tales como el mini kit AIIPrep DNA/RNA (Qiagen GmbH, Alemania). Como se ha mencionado anteriormente, en un caso, la etapa de determinación incluye además determinar dicho número de linfocitos en dicha muestra añadiendo una cantidad conocida de un estándar interno a dicho ADN genómico. En otro caso, cuando por ejemplo la muestra es sangre periférica, la muestra tiene un volumen definido que permite determinar una concentración de dichos linfocitos en dicha muestra. Típicamente, dicho volumen definido está en el intervalo de 1 mL a 50 mL, y más habitualmente, en el intervalo de 1 mL a 10 mL. En otro caso, los números del mismo clonotipo derivado de ADN genómico y ARN se comparan simplemente dividiendo el número de clonotipos determinado a partir de las moléculas individuales aisladas derivadas del ARN por el número de clonotipos determinado a partir de las moléculas individuales aisladas derivadas de dicho ADN genómico. Estos dos conjuntos de clonotipos se distinguen fácilmente en la misma ronda de secuenciación por el uso de marcadores, particularmente etiquetas de oligonucleótidos que se unen durante el proceso de preparación de las muestras. Para la secuenciación basada en Solexa, dichos marcadores pueden incorporarse con las etiquetas usadas para identificar diferentes muestras (por ejemplo) añadiendo un único nucleótido a la etiqueta para indicar ADN o ARN, o simplemente usando una etiqueta adicional de manera que la muestra de cada paciente se marca con dos etiquetas, una para la fracción de ADN genómico y una para la fracción de ARN. Así, dicha etapa de secuenciación de dichas moléculas individuales aisladas espacialmente derivadas de dicho ARN puede incluir el marcaje de cada una de dichas moléculas individuales aisladas espacialmente con un primer marcador que indica su origen de ARN y dicha etapa de secuenciación de dichas moléculas individuales aisladas espacialmente derivadas de dicho ADN genómico puede incluir el marcaje de cada una de dichas moléculas individuales aisladas espacialmente con un segundo marcador que indica su origen de ADN genómico de manera que el primer marcador es distinguible del segundo marcador. En un caso, dichos marcadores son etiquetas de oligonucleótido distintas que se identifican por secuenciación. Asimismo, los métodos descritos en la presente memoria pueden usarse para proporcionar simultáneamente (esto es, sobre la base de medidas en una única muestra), el número de linfocitos y la clonalidad. Dicho método puede implementarse con las etapas siguientes: (a) obtener de un individuo una muestra que comprende células T y/o células B; (b) secuenciar moléculas individuales aisladas espacialmente derivadas del ácido nucleico de dichas células, comprendiendo dichas moléculas individuales aisladas espacialmente un número de clonotipos correspondiente a un número de linfocitos en la muestra; (c) determinar el número de linfocitos a partir del número de moléculas individuales aisladas espacialmente; (d) determinar las abundancias de las diferentes secuencias de las moléculas individuales aisladas espacialmente para generar un perfil de clonotipos y una medida de la clonalidad basada en éste. El ácido nucleico de los linfocitos puede ser ADN genómico y/o ARN; sin embargo, preferiblemente el ácido nucleico es ADN genómico. De manera similar a anteriormente, en un caso, la etapa de determinar dicho número incluye además determinar dicho número de linfocitos en dicha muestra añadiendo una cantidad conocida de un estándar interno a dicho ADN genómico. Y, de manera
15
similar, cuando la muestra es una muestra de sangre periférica tiene un volumen definido de manera que se determina una concentración de dichos linfocitos en dicha muestra. En algunos casos de lo anterior, sólo se emplean células B y, en otras realizaciones, sólo se emplean células T.
Amplificación de poblaciones de ácido nucleico
Como se ha indicado anteriormente, los amplicones de poblaciones de ácidos nucleicos diana pueden generarse por una variedad de técnicas de amplificación. En un aspecto de la invención, se usa PCR múltiple para amplificar miembros de una mezcla de ácidos nucleicos, particularmente mezclas que comprenden moléculas inmunes recombinadas tales como receptores de células T, receptores de células B, o partes de éstos. La guía para llevar a cabo PCR múltiples de dichas moléculas inmunes se encuentra en las referencias siguientes: Morley, patente U.S. 5.296.351; Gorski, patente U.S. 5.837.447; Dau, patente U.S. 6.087.096; Von Dongen et al, publicación de patente U.S. 2006/0234234; publicación de patente europea EP 1544308B1; y semejantes. Las referencias anteriores describen la técnica referida como "espectrotipificación", en la que una población de moléculas inmunes se amplifica por PCR múltiple después de lo cual las secuencias del amplicón resultante se separan físicamente, por ejemplo, por electroforesis, con el fin de determinar si hay una clase con un tamaño predominante. Dicha clase indicaría una población clonal predominante de linfocitos que, a su vez, sería indicativa de estado de enfermedad. En la espectrotipificación, es importante seleccionar cebadores que presentan una pequeña
o ninguna reactividad cruzada (es decir, que no hibridan con sitios de unión de otros cebadores); de otra forma, puede haber una falsa representación de clases de tamaño en el amplicón. En la presente invención, siempre que los ácidos nucleicos de una población se amplifiquen uniformemente, la reactividad cruzada de los cebadores es permisible porque en la presente invención se analizan las secuencias de los ácidos nucleicos amplificados, no meramente sus tamaños. Como se describe más completamente más adelante, en un aspecto, la etapa de aislar espacialmente las moléculas de ácido nucleico individuales se consigue llevando a cabo una amplificación múltiple primaria de una región reorganizada somáticamente preseleccionada o parte de ésta (es decir, secuencias diana) usando cebadores directos e inversos que tienen cada uno colas no complementarias con las secuencias diana para producir un primer amplicón cuyas secuencias miembro tienen secuencias comunes en cada extremo para permitir manipulación adicional. Por ejemplo, dichos extremos comunes pueden incluir sitios de unión de cebador para amplificación continua usando sólo un único cebador directo y un único cebador inverso en lugar de varios de cada uno, o para amplificación en puente de moléculas individuales en una superficie sólida, o semejantes. Dichos extremos comunes pueden añadirse en una única amplificación como se ha descrito anteriormente, o pueden añadirse en un procedimiento de dos etapas para evitar las dificultades asociadas con la fabricación y ejercicio de control de calidad sobre las mezclas de cebadores largos (por ejemplo, 50-70 bases o más). En dicho proceso de dos etapas (descrito más completamente más adelante e ilustrado en las Figs. 4A-4B), la amplificación primaria se lleva a cabo como se ha descrito anteriormente, excepto que las colas del cebador están limitadas en longitud para proporcionar sólo sitios de unión de cebador directo e inverso en los extremos de las secuencias del primer amplicón. Entonces se lleva a cabo una amplificación secundaria usando cebadores de amplificación secundaria específicos para estos sitios de unión de cebador para añadir secuencias adicionales a los extremos de un segundo amplicón. Los cebadores de la amplificación secundaria tienen colas no complementarias con las secuencias diana, que forman los extremos del segundo amplicón y que pueden usarse en conexión con la secuenciación de los clonotipos del segundo amplicón. En una realización, dichas secuencias añadidas pueden incluir sitios de unión de cebador para generar lecturas de secuencia y sitios de unión de cebador para llevar a cabo la PCR en puente en una superficie sólida para generar poblaciones clonales de moléculas individuales aisladas espacialmente, por ejemplo, cuando se usa secuenciación basada en Solexa. En esta última estrategia, una muestra de secuencias del segundo amplicón se dispone en una superficie sólida que tiene unidos oligonucleótidos complementarios capaces de hibridar con secuencias de la muestra, después de lo cual se implementan ciclos de extensión de cebador, desnaturalización, hibridación hasta que se forman las poblaciones clonales de moldes. Preferiblemente, el tamaño de la muestra se selecciona de manera que (i) incluye una representación efectiva de clonotipos en la muestra original, y (ii) la densidad de las poblaciones clonales en la superficie sólida está en un intervalo que permite la determinación inequívoca de la secuencia de los clonotipos. Además de asegurar que la muestra contiene células suficientes para ser representativa de la muestra original, es importante que los amplicones generados por la reacción de PCR múltiple sea representativa de las células en la reacción. Con el fin de conseguir esto, las condiciones de cebador deben seleccionarse de manera que se produzca la amplificación de cada célula en la reacción. Las secuencias de TCR o BCR o partes de éstas pueden amplificarse a partir de ácido nucleico en una reacción múltiple usando al menos un cebador que hibrida con la región C y uno o más cebadores que puedan hibridar con uno o más segmentos V (como se ilustra en las Figs. 2A-2B y Figs. 4A-4B y se discute más completamente más adelante). El número de cebadores que hibridan con segmentos V en una reacción múltiple puede ser, por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, u 80. El número de cebadores que hibridan con segmentos V en una reacción múltiple puede ser, por ejemplo, 10-60, 20-50, 30-50, 40-50, 20-40, 30-40, ó 35-40. Los cebadores pueden hibridar con diferentes segmentos V. Para los genes de IgH, debido a la posibilidad de mutaciones somáticas en los segmentos V, pueden usarse múltiples cebadores que hibridan con cada segmento V;
16
por ejemplo, 1, 2, 3, 4, ó 5 cebadores por segmento V. El número de cebadores que hibridan con segmentos C en una reacción múltiple puede incluir, por ejemplo, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, ó 15. El número de cebadores que hibridan con segmentos C en una reacción múltiple puede ser 1-10, 2-9, 3-8, 4-7, 3-8, ó 3-6. La amplificación de genes de TCR o inmunoglobulina puede ocurrir como se describe en el Ejemplo 3 y/o Ejemplo 4. La región que se va a amplificar puede incluir la secuencia clonal completa o un subconjunto de la secuencia clonal, incluyendo la unión V-D, la unión D-J de un gen de inmunoglobulina o receptor de células T, la región variable completa de un gen de inmunoglobulina o receptor de células T, la región de reconocimiento de antígeno, o una CDR, por ejemplo, región determinante de la complementariedad 3 (CDR3). La secuencia de TCR o inmunoglobulina puede amplificarse usando una etapa de amplificación primaria y una secundaria. Cada una de las diferentes etapas de amplificación puede comprender diferentes cebadores. Los diferentes cebadores pueden introducir secuencia que no está originalmente presente en la secuencia del gen inmune. Por ejemplo, el procedimiento de amplificación puede añadir nuevos sitios de unión a cebador a los extremos de las secuencias diana para convertir una amplificación múltiple en una amplificación única o el procedimiento de amplificación puede añadir una o más etiquetas al extremo 5' y/o 3' de la secuencia amplificada de TCR o inmunoglobulina (como se ilustra en las Figs. 3A-3C). La etiqueta puede ser una secuencia que facilita la secuenciación posterior del ADN amplificado. La etiqueta puede ser una secuencia que facilita la unión de la secuencia amplificada a un soporte sólido. Otros métodos para la amplificación pueden no emplear ningún cebador en la región V. En lugar de esto, puede usarse un cebador específico del segmento C y un cebador genérico puede ponerse en el otro lado (5'). El cebador genérico puede adjuntarse en la síntesis de ADNc a través de diferentes métodos incluyendo los métodos bien descritos de intercambio de cadenas. De manera similar, el cebador genérico puede adjuntarse después de la preparación del ADNc a través de diferentes métodos incluyendo ligación. Otros medios para amplificar ácido nucleico que pueden usarse en los métodos de la invención proporcionada incluyen, por ejemplo, PCR de transcripción inversa, PCR en tiempo real, PCR en tiempo real cuantitativa, PCR digital (dPCR), PCR en emulsión digital (dePCR), PCR clonal, PCR de polimorfismo en la longitud del fragmento amplificado (AFLP PCR), PCR específica de alelo, PCR asimétrica (en la que se usa un gran exceso de cebadores para una cadena elegida), PCR de colonia, amplificación dependiente de helicasa (HDA), PCR de inicio caliente, PCR inversa (IPCR), PCR in situ, PCR larga (extensión de ADN mayor de aproximadamente 5 kilobases), PCR múltiple, PCR anidada (usa más de una pareja de cebadores), PCR de célula única, PCR "touchdown", PCR isotermal mediada por bucle (LAMP), y amplificación basada en la secuencia de ácido nucleico (NASBA). Otros esquemas de amplificación incluyen: reacción en cadena de la ligasa, amplificación de ADN ramificado, amplificación por círculo rodante, amplificación círculo a círculo, amplificación SPIA, amplificación de diana por amplificación de captura y ligación (TACL), y amplificación RACE. La información en ARN en una muestra puede convertirse en ADNc usando transcripción inversa. Pueden usarse cebadores poliA, cebadores aleatorios, y/o cebadores específicos de gen en las reacciones de transcripción inversa según protocolos convencionales. Después de la amplificación del ADN del genoma (o amplificación de ácido nucleico en la forma de ADNc por transcripción inversa del ARN), las moléculas de ácido nucleico individuales pueden aislarse, opcionalmente re-amplificarse, y después secuenciarse individualmente. Los protocolos de amplificación ejemplares pueden encontrarse en van Dongen et al, Leukemia, 17: 2257-2317 (2003) o van Dongen et al, publicación de patente U.S. 2006/0234234. Brevemente, un protocolo ejemplar es como sigue: tampón de reacción: tampón ABI II o tampón ABI Gold (Life Technologies, San Diego, CA); volumen final de reacción 50 μL; 100 ng de ADN de muestra; 10 pmoles de cada cebador (sujeto a ajustes para equilibrar la amplificación como se describe más adelante); dNTP a concentración final 200 μM; MgCl2 a concentración final 1,5 mM (sujeto a optimización dependiendo de las secuencias diana y la polimerasa); polimerasa Taq (1-2 U/tubo); condiciones de ciclado: preactivación 7 min a 950C; hibridación a 600C; tiempos de ciclado: 30s desnaturalización; 30s hibridación; 30s extensión. Las polimerasas que pueden usarse para la amplificación en los métodos de la invención están disponibles comercialmente e incluyen, por ejemplo, polimerasa Taq, polimerasa AccuPrime, o Pfu. La elección de polimerasa para usarse puede basarse en si se prefiere la fidelidad o eficiencia. Los métodos para el aislamiento de ácidos nucleicos de un conjunto incluyen separación espacial de las moléculas en dos dimensiones en un sustrato sólido (por ejemplo, portaobjetos de vidrio), separación espacial de las moléculas en tres dimensiones en una disolución en micelas (tal como se puede conseguir usando emulsiones de aceite con o sin la inmovilización de las moléculas en una superficie sólida tal como lechos), o usando cámaras de microreacción, por ejemplo, en chips microfluidos o nanofluidos. La dilución puede usarse para asegurar que de media una única molécula está presente en un volumen dado, región espacial, lecho, o cámara de reacción. La guía para dichos métodos de aislar moléculas de ácido nucleico individuales se encuentra en las referencias siguientes: Sambrook, Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory Press, 2001s); Shendure et al, Science, 309: 17281732 (incluyendo material suplementario) (2005); patente U.S. 6.300.070; Bentley et al, Nature, 456: 53-59 (incluyendo material suplementario) (2008); patente U.S. 7.323.305; Matsubara et al, Biosensors & Bioelectronics, 20: 1482-1490 (2005); patente U.S. 6.753.147; y semejantes. Las mediciones de PCR en tiempo real, tinción de picogreen, electroforesis en nanofluido (por ejemplo, LabChip) o absorción UV pueden usarse en una etapa inicial para juzgar la cantidad funcional de material
17
amplificable. Los métodos para la re-amplificación de ácidos nucleicos incluyen crecimiento bacteriano de colonias aisladas transformadas con ácido nucleico, amplificación en un portaobjetos (por ejemplo, colonias de PCR (polonias)), y amplificación en un lecho (por ejemplo, en una PCR de emulsión). El mismo método puede usarse para amplificar y re-amplificar el ácido nucleico o puede usarse un método diferente para amplificar y reamplificar el ácido nucleico. En determinadas realizaciones, las etapas de subclonación incluyen una etapa en la que un cebador común se une al ADN o ARN a través de una etapa de amplificación o ligación. Este cebador se usa entonces para amplificar los clones y como una secuencia de reconocimiento para la hibridación de un cebador para secuenciación (por ejemplo, como se ilustra en las Figs. 2A-2B y 4A-4B, y se discute más completamente más adelante). En un aspecto, las amplificaciones múltiples se llevan a cabo de manera que cantidades relativas de secuencias en una población de partida son sustancialmente las mismas que aquellas en la población amplificada, o amplicón. Esto es, las amplificaciones múltiples se llevan a cabo con sesgo mínimo de amplificación entre las secuencias miembro de una población de muestra. En una realización, dichas cantidades relativas son sustancialmente las mismas si cada cantidad relativa en un amplicón está en cinco veces su valor en la muestra de partida. En otra realización, dichas cantidades relativas son sustancialmente las mismas si cada cantidad relativa en un amplicón está en dos veces su valor en la muestra de partida. Como se discute más completamente más adelante, el sesgo de la amplificación en PCR puede detectarse y corregirse usando técnicas convencionales de manera que puede seleccionarse un conjunto de cebadores de PCR para un repertorio predeterminado que proporciona la amplificación no sesgada de cualquier muestra. Respecto a muchos repertorios basados en secuencias de TCR o BCR, una amplificación múltiple usa opcionalmente todos los segmentos V. La reacción se optimiza para intentar obtener una amplificación que mantiene la abundancia relativa de las secuencias amplificadas por diferentes cebadores de segmentos V. Algunos de los cebadores están relacionados, y por lo tanto muchos de los cebadores pueden "intercomunicarse", amplificando moldes que no concuerdan perfectamente con él. Las condiciones se optimizan de manera que cada molde puede amplificarse de una manera similar independientemente de qué cebador lo amplifique. En otras palabras, si hay dos moldes, entonces después de una amplificación de 1.000 veces, ambos moldes pueden amplificarse aproximadamente
1.000 veces, y no importa que para uno de los moldes la mitad de los productos amplificados porten un cebador diferente debido a la intercomunicación. En análisis posteriores de los datos de secuenciación, la secuencia de cebador se elimina del análisis, y por lo tanto no importa qué cebador se usa en la amplificación siempre que los moldes se amplifiquen igualmente. Como la cantidad de cada molde es desconocida en una población de ADNc generada a partir de ARNm, puede generarse un conjunto de estándares usando PCR únicas de una población de ADNc de clonotipos. Esto se llevó a cabo para un repertorio de clonotipos de TCRβ. El producto en cada una de 34 de dichas PCR (usando en las reacciones separadas cebadores del Ejemplo 3) comprendió una pluralidad de secuencias con un cebador de V. Los diferentes productos se cuantificaron cuidadosamente para crear un conjunto de estándares a la misma concentración. Se usó un combinado de todos los 34 cebadores y se realizaron 34 PCR en tiempo real usando el combinado de cebadores y cada una de las secuencias estándar como un molde. Idealmente, sin sesgo, todos los 34 estándares mostrarán una eficiencia de amplificación igual por PCR en tiempo real. Esto sugiere que cada secuencia se amplifica igualmente aunque la presencia de intercomunicación hace que no esté claro qué cebadores están llevando a cabo la amplificación, Esta optimización es consistente con el objetivo de tener una amplificación igual independientemente de los cebadores reales que se incorporan en el producto de amplificación. El incremento de la concentración total del combinado de cebadores redujo significativamente el rango dinámico como se esperaba a partir de incrementar la eficiencia de la amplificación. Además, para los moldes que parecían amplificar más eficientemente que la media, disminuyó la concentración de su cebador con concordancia perfecta en el combinado. A la inversa, para los moldes que se amplificaron de manera ineficiente, se incrementó la concentración de su cebador con concordancia perfecta. Esta optimización demostró que todos los moldes se amplifican en dos veces de la amplificación promedio. El sesgo de la amplificación también puede evitarse llevando a cabo una amplificación de dos etapas (como se ilustra en las Figs. 2A-2B) en la que se implementa un pequeño número de ciclos de amplificación en una primera etapa, o primaria, usando cebadores que tienen colas no complementarias con las secuencias diana. Las colas incluyen sitios de unión de cebador que se añaden a los extremos de las secuencias del amplicón primario de manera que dichos sitios se usan en una segunda etapa de amplificación usando sólo un único cebador directo y un único cebador inverso, eliminando de esta manera una causa primaria de sesgo de la amplificación. Preferiblemente, la PCR primaria tendrá un número de ciclos lo suficientemente pequeño (por ejemplo, 5-10) como para minimizar la amplificación diferencial por los diferentes cebadores. La amplificación secundaria se hace con una pareja de cebadores y por lo tanto el problema de amplificación diferencial es mínimo. Un uno por ciento de la PCR primaria se toma directamente para la PCR secundaria. Treinta y cinco ciclos (equivalente a ~28 ciclos sin la etapa de dilución de 100 veces) usados entre las dos amplificaciones fueron suficientes para mostrar una amplificación robusta independientemente de si la división de ciclos fue: un ciclo primario y 34 secundarios ó 25 primarios y 10 secundarios. Aunque idealmente haciendo sólo 1 ciclo en la PCR primaria puede disminuir el sesgo de la amplificación, hay otras consideraciones. Un aspecto de esto es
18
imagen9
ejemplo, Bentley et al, Nature, 456: 53-59 (2008) o secuenciación Complete Genomics, por ejemplo, Drmanac et al, Science, 327: 78-81 (2010)), matrices de pocillos, que pueden incluir moldes unidos a lechos o partículas (tales como con 454, por ejemplo, Margulies et al, Nature, 437: 376-380 (2005) o secuenciación Ion Torrent, publicación de patente U.S. 2010/0137143 ó 2010/0304982), membranas micromecanizadas (tales como con secuenciación SMRT, por ejemplo, Eid et al, Science, 323: 133-138 (2009)), o matrices de lechos (como con secuenciación SOLiD o secuenciación de polonias, por ejemplo, Kim et al, Science, 316: 1481-1414 (2007)). En otro aspecto, dichos métodos comprenden amplificar las moléculas aisladas bien antes o después de que sean aisladas espacialmente en una superficie sólida. La amplificación anterior puede comprender amplificación basada en emulsión, tal como PCR de emulsión, o amplificación por círculos rodantes. Es particularmente interesante la secuenciación basada en Solexa en la que moléculas molde individuales se aíslan espacialmente en una superficie sólida, después de lo cual se amplifican en paralelo por PCR en puente para formar poblaciones clonales separadas, o agrupaciones, y después se secuencian, como se describe en Bentley et al (citado anteriormente) y en las instrucciones del fabricante (por ejemplo, kit de preparación de muestras y hoja de datos TruSeq™, Illumina, Inc., San Diego, CA, 2010); y adicionalmente en las referencias siguientes: patentes U.S. 6.090.592; 6.300.070; 7.115.400; y EP0972081B1. En una realización, las moléculas individuales dispuestas y amplificadas en una superficie sólida forman agrupaciones en una densidad de al menos 105 agrupaciones por cm2; o en una densidad de al menos 5x105 por cm2; o en una densidad de al menos 106 agrupaciones por cm2. En una realización, se emplean químicas de secuenciación que tienen proporciones de error relativamente altas. En dichas realizaciones, las puntuaciones de calidad media producidas por dichas químicas son funciones que declinan monotónicamente de longitudes de lectura de secuencia. En una realización, dicha declinación corresponde a que 0,5 por ciento de las lecturas de secuencia tienen al menos un error en las posiciones 1-75; 1 por ciento de las lecturas de secuencia tienen al menos un error en las posiciones 76-100; y 2 por ciento de las lecturas de secuencia tienen al menos un error en las posiciones 101-125. En un aspecto, para cada muestra de un individuo, la técnica de secuenciación usada en los métodos de la invención genera secuencias de al menos 1.000 clonotipos por operación; en otro aspecto, dicha técnica genera secuencias de al menos 10.000 clonotipos por operación; en otro aspecto, dicha técnica genera secuencias de al menos 100.000 clonotipos por operación; en otro aspecto, dicha técnica genera secuencias de al menos 500.000 clonotipos por operación; y en otro aspecto, dicha técnica genera secuencias de al menos 1.000.000 clonotipos por operación. En otro aspecto más, dicha técnica genera secuencias de entre 100.000 a 1.000.000 clonotipos por operación por muestra individual. La técnica de secuenciación usada en los métodos de la invención proporcionada puede generar aproximadamente 30 pb, aproximadamente 40 pb, aproximadamente 50 pb, aproximadamente 60 pb, aproximadamente 70 pb, aproximadamente 80 pb, aproximadamente 90 pb, aproximadamente 100 pb, aproximadamente 110 pb, aproximadamente 120 pb por lectura, aproximadamente 150 pb, aproximadamente 200 pb, aproximadamente 250 pb, aproximadamente 300 pb, aproximadamente 350 pb, aproximadamente 400 pb, aproximadamente 450 pb, aproximadamente 500 pb, aproximadamente 550 pb,
o aproximadamente 600 pb por lectura. La técnica de secuenciación usada en los métodos de la invención proporcionada puede generar al menos 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 150, 200, 250, 300, 350, 400, 450, 500, 550, ó 600 pb por lectura. Un perfil de clonotipos basado en secuencia de un individuo puede obtenerse usando las etapas siguientes: (a) obtener una muestra de ácido nucleico de células T y/o células B del individuo; (b) aislar espacialmente la moléculas individuales derivadas de dicha muestra de ácido nucleico, comprendiendo las moléculas individuales conjuntos anidados de moldes generado cada uno de un ácido nucleico en la muestra y conteniendo cada uno una región reorganizada somáticamente o una parte de ésta, siendo capaz cada conjunto anidado de producir una pluralidad de lecturas de secuencia cada una extendiéndose en la misma dirección y cada una empezando a partir de una posición diferente en el ácido nucleico del que se generó el conjunto anidado; (c) secuenciar dichas moléculas individuales aisladas espacialmente; y (d) determinar las abundancias de diferentes secuencias de las moléculas de ácido nucleico de la muestra de ácido nucleico para generar el perfil de clonotipos. En una realización, la etapa de secuenciación incluye producir una pluralidad de lecturas de secuencia para cada uno de los conjuntos anidados. En otra realización, cada una de las regiones reorganizadas somáticamente comprende una región V y una región J, y cada una de la pluralidad de lecturas de secuencia empieza a partir de una posición diferente en la región V y se extiende en la dirección de su región J asociada. En otra realización, la etapa de secuenciación comprende secuenciar bidireccionalmente cada una de las moléculas individuales aisladas espacialmente para producir al menos una lectura de secuencia directa y al menos una lectura de secuencia inversa. Adicionalmente a la última realización, al menos una de las lecturas de secuencia directa y al menos una de las lecturas de secuencia inversa tiene una región de superposición de manera que las bases de dicha región de superposición se determinan por una relación de complementariedad inversa entre dichas lecturas de secuencia. En otra realización más, cada una de las regiones reorganizadas somáticamente comprende una región V y una región J y la etapa de secuenciación incluye además determinar una secuencia de cada una de las moléculas de ácido nucleico individuales a partir de una o más de sus lecturas de secuencia directa y al menos una lectura de secuencia inversa empezando a partir de una posición en una región J y extendiéndose en la dirección de su región V asociada. En otra realización, las moléculas individuales comprenden ácidos nucleicos seleccionados del grupo que consiste en moléculas de IgH completas, moléculas de IgH incompletas, IgK
20
completa, moléculas de IgK inactivas, moléculas de TCRβ, moléculas de TCRγ, moléculas de TCRδ completas, y moléculas de TCRδ incompletas. En otra realización, la etapa de secuenciación comprende generar las lecturas de secuencia que tienen puntuaciones de calidad que disminuyen monotónicamente. Adicionalmente a la última realización, las puntuaciones de calidad que disminuyen monotónicamente son tales que las lecturas de secuencia tienen proporciones de errores no mejores de las siguientes: 0,2 por ciento de lecturas de secuencia contienen al menos un error en las posiciones de base 1 a 50, 0,2 a 1,0 por ciento de lecturas de secuencia contienen al menos un error en las posiciones 51-75, 0,5 a 1,5 por ciento de lecturas de secuencia contienen al menos un error en las posiciones 76-100. Como se indica más adelante en la definición de repertorio, pueden secuenciarse diferentes regiones predeterminadas de los genes de inmunoglobulina o receptor de células T. En algunas realizaciones, puede secuenciarse la secuencia completa de las regiones variables para identificar y cuantificar un clonotipo. Puede secuenciarse un único subconjunto de las secuencias clonales completas. En algunas realizaciones, se secuencian nucleótidos que comprenden las uniones VD y DJ para identificar y cuantificar de manera única un clonotipo. En otras realizaciones, el fragmento que puede secuenciarse es la región variable completa. En otra realización más, se secuencia la región de reconocimiento de antígeno o la región determinante de la complementariedad 3 (CDR3). Un fragmento que contiene la CD3 completa o la región variable completa puede amplificarse para permitir la secuenciación de la CD3 que comprende partes de los segmentos V, D, y J. En una realización, sólo se amplifica y secuencia CDR3. La amplificación y secuenciación de CDR3 pueden conseguirse usando cebadores específicos de una o más secuencias de segmento V (así como uno o más cebadores en el otro lado del amplicón en el segmento C). Pueden utilizarse cebadores para cada uno de los segmentos V en una o más reacciones de amplificación dando lugar a la amplificación del repertorio completo de secuencias. Este repertorio de secuencias puede mezclarse entonces y someterse a separación, con o sin amplificación, y secuenciarse usando cualquiera de las técnicas de secuenciación descritas. Cuando la amplificación con los varios cebadores de V se hace en tubos separados, el número de moléculas que portan los diferentes segmentos V puede "normalizarse" debido a la saturación de la PCR. Por ejemplo, si un segmento V particular tuviera una o varias expansiones clonales dando lugar a su representación más que otros segmentos, esta información puede borrarse o disminuirse ya que la reacción de PCR para cada segmento puede dirigirse a saturación o cerca de ésta. La PCR en tiempo real puede usarse para cuantificar cuánto de cada segmento V está presente. Puede secuenciarse la CDR3 completa, o puede secuenciarse un subconjunto de la secuencia de CDR3. En una realización, sólo se analiza un subconjunto de clonotipos. Esto puede conseguirse amplificando con un cebador específico para el subconjunto de clonotipos, por ejemplo, un cebador que es específico para el segmento V. Los clonotipos únicos pueden identificarse por secuenciación con lecturas contiguas largas que proporcionan conectividad completa. En algunas realizaciones, cuando están presentes varias secuencias de interés, una longitud de lectura corta a lo largo de sólo una de las uniones puede generar etiquetas degeneradas que no son únicas para un clonotipo específico sino que están compartidas entre clonotipos múltiples. Por ejemplo, la secuenciación a lo largo de la unión V/J puede agrupar todas las secuencias con la misma V/J independientemente del segmento D como un clonotipo. La información sobre la conectividad completa de todos los segmentos permite distinguir secuencias que pueden compartir los mismos segmentos V y J pero que están conectadas a diferentes segmentos, por ejemplo.
Determinación de clonotipos a partir de datos de secuencia
En un aspecto de la invención, las secuencias de los clonotipos (incluyendo pero no limitado a aquellas derivadas de IgH, TCRα, TCRβ, TCRγ, TCRδ, y/o IgLκ (IgK)) pueden determinarse combinando la información de una o más lecturas de secuencia, por ejemplo, junto con las regiones V(D)J de las cadenas seleccionadas. En otro aspecto, las secuencias de los clonotipos se determinan combinando la información de una pluralidad de lecturas de secuencia. (Tal y como se usa en la presente memoria, una "lectura de secuencia" es una secuencia de datos generada por una técnica de secuenciación a partir de la cual se determina una secuencia de nucleótidos. Típicamente, las lecturas de secuencia se hacen extendiendo un cebador a lo largo de un ácido nucleico molde, por ejemplo, con una ADN polimerasa o una ADN ligasa. Los datos se generan registrando las señales, tales como señales ópticas, químicas (por ejemplo, cambio en el pH), o eléctricas, asociadas con dicha extensión). Dichas pluralidades de lecturas de secuencia pueden incluir una o más lecturas de secuencia a lo largo de una cadena con sentido (es decir, lecturas de secuencia "directas") y una o más lecturas de secuencia a lo largo de su cadena complementaria (es decir, lecturas de secuencia "inversas"). Cuando se generan múltiples lecturas de secuencia a lo largo de la misma cadena, se generan en primer lugar moldes separados mediante la amplificación de moléculas de muestra con cebadores seleccionados para las diferentes posiciones de las lecturas de secuencia. Este concepto se ilustra en la Fig. 4A, en la que los cebadores (404, 406 y 408) se emplean para generar amplicones (410, 412, y 414, respectivamente) en una única reacción. Dichas amplificaciones pueden llevarse a cabo en la misma reacción o en reacciones separadas. En un aspecto, siempre que se emplee la PCR, se usan reacciones de amplificación separadas para generar los moldes separados que, a su vez, se combinan y usan para generar múltiples lecturas de secuencia a lo largo de la misma cadena. Esta última estrategia es preferible para evitar la necesidad de equilibrar las concentraciones de cebadores (y/o otros parámetros de la reacción) para asegurar una amplificación igual de los múltiples moldes (algunas veces referido en la presente memoria como "amplificación equilibrada"
o "amplificación sin sesgo"). La generación de moldes en reacciones separadas se ilustra en las Figs. 4B
21
imagen10
imagen11
se expresan son aquellas cuyos marcos de codones de la región J y la región V están en marco entre sí y permanecen en marco a través de la región NDN. (Aquí, los marcos correctos de las regiones V y J se determinan a partir de las secuencias de referencia). Si se identifica una secuencia fuera de marco sobre la base de una o más llamadas de base de baja calidad, el clonotipo correspondiente está señalado para re-evaluación o como una anomalía relacionada con enfermedad potencial. Si la secuencia identificada está en marco y se basa en llamadas de base de alta calidad, entonces hay una mayor confianza de que el clonotipo correspondiente se haya llamado correctamente. De acuerdo con esto, en la presente memoria se describe un método para determinar clonotipos basados en V(D)J a partir de lecturas de secuencia bidireccionales que comprende las etapas de: (a) generar al menos una lectura de secuencia de la región J que empieza en una región J y se extiende en una región NDN y al menos una lectura de secuencia de la región V que empieza en las regiones V y se extiende hacia la región NDN tal que la lectura de secuencia de la región J y la lectura de secuencia de la región V se superponen en una región de superposición, y la región J y la región V tienen cada una una estructura de codones; (b) determinar si la estructura de codones de la región J extendida en la región NDN está en marco con la estructura de codones de la región V extendida hacia la región NDN. En un caso adicional, la etapa de generación incluye generar al menos una lectura de secuencia de la región V que empieza en la región V y se extiende a través de la región NDN hacia la región J, tal que la lectura de secuencia de la región J y la lectura de secuencia de la región V se superponen en una región de superposición. Análisis de las lecturas de secuencia. Coalescencia de lecturas de secuencia en clonotipos. La construcción de clonotipos a partir de datos de lecturas de secuencia depende en parte del método de secuenciación usado para generar dichos datos, ya que los diferentes métodos tienen diferentes longitudes de lectura y calidad de datos esperadas. En una estrategia, se emplea un secuenciador Solexa para generar datos de lecturas de secuencia para análisis. En una realización, se obtiene una muestra que proporciona al menos 0,5-1,0x106 linfocitos para producir al menos 1 millón de moléculas molde, lo que después de amplificación opcional puede producir poblaciones clonales correspondientes de un millón
o más de moléculas molde (o agrupaciones). Para la mayor parte de las estrategias de secuenciación de alto rendimiento, incluyendo la estrategia Solexa, dicho sobre muestreo a nivel de agrupación es deseable de manera que cada secuencia de molde se determina con un gran grado de redundancia para incrementar la exactitud de la determinación de la secuencia. Para las implementaciones basadas en Solexa, preferiblemente la secuencia de cada molde independiente se determina 10 veces o más. Para otras estrategias de secuenciación con diferentes longitudes de secuencia y calidad de datos esperadas, pueden usarse diferentes niveles de redundancia para una exactitud comparable en la determinación de la secuencia. Los expertos en la técnica reconocen que los parámetros anteriores, por ejemplo, tamaño de la muestra, redundancia, y semejantes, son elecciones de diseño relacionadas con aplicaciones particulares. La reducción de un conjunto de lecturas para una muestra dada en sus distintos clonotipos y el registro del número de lecturas para cada clonotipo sería un problema computacional trivial si la tecnología de secuenciación no tuviera errores. Sin embargo, en presencia de errores en la secuenciación, cada clonotipo está rodeado de una "nube" de lecturas con números variados de errores respecto a la secuencia verdadera del clonotipo. Cuanto mayor es el número de dichos errores menor es la densidad si la nube circundante, es decir, la densidad de la nube disminuye al movernos fuera del clonotipo en el espacio de la secuencia. Está disponible una variedad de algoritmos para convertir lecturas de secuencia en clonotipos. En un aspecto, la coalescencia de las lecturas de secuencia depende de tres factores: el número de secuencias obtenido para cada uno de los dos clonotipos de interés; el número de bases en el que se diferencian; y la calidad de la secuenciación en las posiciones en las que son discordantes. Se evalúa una proporción de probabilidad que se basa en las proporciones de error esperadas y la distribución binomial de errores. Por ejemplo, dos clonotipos, uno con 150 lecturas y el otro con 2 lecturas con una diferencia entre ellos en un área de baja calidad de secuenciación coalescerán probablemente ya que probablemente se generen por error de secuenciación. Por otra parte, dos clonotipos, uno con 100 lecturas y el otro con 50 lecturas con dos diferencias entre ellos no coalescen ya que se considera que es improbable que se generen por error de secuenciación. En una realización de los métodos de la invención, el algoritmo descrito más adelante puede usarse para determinar clonotipos a partir de lecturas de secuencia. Esta nube de lecturas que rodea a cada clonotipo puede modelarse usando distribución binomial y un modelo simple para la probabilidad de un único error de base. Este último modelo de error puede inferirse del mapeo de los segmentos V y J o del algoritmo de descubrimiento de clonotipo en sí mismo, mediante auto-consistencia y convergencia. Se construye un modelo para la probabilidad de una secuencia Y "nube" dada con cuenta de lectura C2 y errores E (respecto a la secuencia X) sea parte de una secuencia verdadera de clonotipo X con cuenta de lectura perfecta C1 bajo el modelo nulo de que X es el único clonotipo verdadero en esta región de espacio de secuencia. Se toma una decisión de si coalescer o no la secuencia Y en el clonotipo X según los parámetros C1, C2, y E. Para cualquier C1 y E dados, se precalcula un valor C2 máximo para decidir coalescer la secuencia Y. Los valores máximos para C2 se eligen de manera que la probabilidad de fracaso en la coalescencia de Y bajo la hipótesis nula que Y es parte del clonotipo X es menor de algún valor P después de integrar sobre todas las posibles secuencias Y con error E en la vecindad de la secuencia X. El valor P controla el comportamiento del algoritmo y hace que la coalescencia sea más o menos permisiva. Si una secuencia Y no coalesce en el clonotipo X porque su cuenta de lectura está por encima del umbral C2 para coalescer en el clonotipo X entonces se convierte en un candidato para sembrar clonotipos
24
deparados. El algoritmo también se asegura de que cualesquiera otras secuencias Y2, Y3, etc. que están "más cerca" de esta secuencia Y (que se ha considerado independiente de X) no se agreguen en X. Este concepto de "cercanía" incluye tanto cuentas de error respecto a Y y X como la cuenta de lectura absoluta de X e Y, es decir, se modela de la misma manera que el modelo anterior para la nube de secuencias de error alrededor del clonotipo X. De esta manera, las secuencias "nube" pueden atribuirse apropiadamente a su clonotipo correcto si aparecen "cerca" de más de un clonotipo. El algoritmo procede de manera arriba a abajo empezando con la secuencia X con la cuenta de lectura más alta. Esta secuencia siembra el primer clonotipo. Las secuencias vecinas se colaescen en este clonotipo si sus cuentas están por debajo de los umbrales precalculados (véase anteriormente), o se dejan solas si están por encima del umbral o "más cerca" de otra secuencia que no ha coalescido. Después de buscar todas las secuencias vecinas en una cuenta de error máxima, termina el proceso de coalescer lecturas en el clonotipo X. Sus lecturas y todas las lecturas que se han coalescido en él se tienen en cuenta y retiran de la lista de lecturas disponible para hacer otros clonotipos. La siguiente secuencia se mueve entonces con la cuenta de lectura más alta. Las lecturas vecinas se coalescen en este clonotipo como anteriormente y este proceso se continúa hasta que no hay más secuencias con cuentas de lectura por encima de un umbral dado, por ejemplo, hasta que todas las secuencias con más de 1 cuenta se han usado como semillas para clonotipos. En otra realización del algoritmo anterior, puede añadirse un ensayo adicional para determinar si coalescer una secuencia candidata Y en un clonotipo X existente, que tiene en cuenta la puntuación de calidad de las lecturas de secuencia relevantes. La o las puntuaciones de calidad medias se determinan para la o las secuencias Y (promediada a lo largo de todas las lecturas con secuencia Y) en la que las secuencias Y y X son diferentes. Si la puntuación media está por encima de un valor predeterminado entonces es más probable que la diferencia indique un clonotipo verdaderamente diferente que no debería coalescer y si la puntuación media está por debajo de dicho valor predeterminado entones es más probable que la secuencia Y esté causada por errores de secuenciación y por lo tanto debería coalescer en X. Árbol de secuencia. El algoritmo anterior de lecturas coalescentes en clonotipos depende de tener una manera eficiente de encontrar todas las secuencias con menos de errores E a partir de la misma secuencia de entrada X. Este problema se resuelve usando un árbol de secuencia. La implementación de este árbol tiene algunas características no habituales ya que los nodos del árbol no están restringidos a ser simples letras de ADN. Los nodos pueden tener secuencias arbitrariamente largas. Esto permite un uso más eficiente de la memoria del ordenador. Todas las lecturas de una muestra dada se ponen en el árbol de secuencia. Cada nodo de la hoja contiene punteros para sus lecturas asociadas. Corresponde a una única secuencia proporcionada atravesando hacia atrás el árbol desde la hoja hasta el nodo de la raíz. La primera secuencia se pone en un árbol simple con un nodo de raíz y un nodo de hoja que contiene la secuencia completa de la lectura. A continuación, se añaden secuencias una en una. Para cada secuencia añadida, se forma bien una nueva rama en el último punto de la secuencia común entre la lectura y el árbol existente o se añade la lectura a un nodo de hoja existente su el árbol ya contiene la secuencia. Habiendo puesto todas las lecturas en el árbol, es fácil usar el árbol para los propósitos siguientes: 1. Cuenta de lectura más alta: la separación de los nodos de hoja por cuenta de lectura nos permite encontrar el nodo de hoja (es decir, secuencia) con más lecturas. 2. Descubrimiento de hojas vecinas: para cualquier secuencia se pueden buscar todos los caminos a lo largo del árbol que tienen menos de errores X respecto a esta secuencia. Un camino empieza en la raíz y este camino se ramifica en caminos separados a lo largo del árbol. Se anota la cuenta de error actual de cada camino al proceder a lo largo del árbol. Cuando la cuenta de error supera los errores máximos permitidos el camino dado se termina. De esta manera, se recortan grandes partes del árbol tan pronto como es posible. Ésta es una manera eficiente de encontrar todos los caminos (es decir, todas las hojas) en errores X de cualquier secuencia dada. Hipermutaciones somáticas. En una realización, los clonotipos basados en IgH que han experimentado hipermutación somática se determinan como sigue. Una mutación somática se define como una base secuenciada que es diferente de la base correspondiente de una secuencia de referencia (del segmento relevante, habitualmente V, J o C) y que está presente en un número estadísticamente significativo de lecturas. En una realización, las lecturas de C pueden usarse para encontrar mutaciones somáticas respecto al segmento J mapeado y asimismo lecturas de V para el segmento V. Sólo se usan partes de las lecturas C y V que bien se mapearon directamente a segmentos J o V o que estaban dentro de la extensión de clonotipo hasta el límite de NDN. De esta manera, la región NDN se evita y la misma "información de secuencia" no se usa para el descubrimiento de mutaciones que se usó previamente para la determinación de clonotipos (para evitar clasificar erróneamente como mutaciones nucleótidos que son realmente sólo diferentes regiones NDN recombinadas). Para cada tipo de segmento, el segmento mapeado (alelo principal) se usa como un soporte y se considera que todas las lecturas que se han mapeado en este alelo durante la fase de mapeo de lectura. Cada posición de las secuencias de referencia en la que al menos una lectura se ha mapeado se analiza para mutaciones somáticas. En una realización, los criterios para aceptar una base no de referencia como mutación válida incluyen los siguientes: 1) al menos N lecturas con la base de mutación dada, 2) al menos una fracción dada de lecturas N/M (en la que M es el número total de lecturas mapeadas en esta posición de base) y 3) un corte estadístico basado en la distribución binomial, la puntuación Q media de las lecturas N en la base de
25
mutación así como el número (M-N) de lecturas con una base no de mutación. Preferiblemente, los parámetros anteriores se seleccionan de manera que la proporción de descubrimientos falsos de mutaciones por clonotipo es menos de 1 en 1.000, y más preferiblemente, menos de 1 en 10.000. Clonotipos filogénicos (clanes). En algunas enfermedades, tales como cánceres, incluyendo trastornos proliferativos linfoides, un único progenitor de linfocito puede dar lugar a mucha progenie de linfocitos relacionada, cada una poseyendo y/o expresando un TCR o BCR ligeramente diferente, y por lo tanto un clonotipo diferente, debido a hipermutación somática en curso o a mutación o mutaciones somáticas relacionadas con la enfermedad, tales como sustituciones de bases, reorganizaciones aberrantes, o semejantes. Las células que producen dichos clonotipos se refieren en la presente memoria como clones filogénicos, y un conjunto de dichos clones relacionados se refieren en la presente memoria como un "clan". Asimismo, los clonotipos de clones filogénicos se refieren como clonotipos filogénicos y un conjunto de clonotipos filogénicos puede referirse como un clan de clonotipos. En un aspecto, los métodos de la invención comprenden monitorizar la frecuencia de un clan de clonotipos (es decir, la suma de frecuencias de los clonotipos filogénicos constituyentes del clan), en lugar de una frecuencia de un clonotipo individual. (La expresión "uno o más clonotipos específicos de paciente" engloba el concepto de clanes). Los clonotipos filogénicos pueden identificarse por una o más medidas de existencia de relación con un clonotipo parental. En una realización, los clonotipos filogénicos pueden agruparse en el mismo clan por porcentaje de homología, como se describe más completamente más adelante. En otra realización, los clonotipos filogénicos se identifican por el uso común de regiones V, regiones J, y/o regiones NDN. Por ejemplo, un clan puede definirse por clonotipos que tienen regiones J y ND comunes pero diferentes regiones V (algunas veces referido como "reemplazo VH"); o pueden definirse por clonotipos que tienen las mismas regiones V y J (mutadas de forma idéntica por sustituciones de bases de sus secuencias de referencia respectivas) pero con diferentes regiones NDN; o pueden definirse por un clonotipo que ha experimentado una o más inserciones y/o deleciones de 1-10 bases, o de 1-5 bases, o de 1-3 bases, para generar miembros del clan. En otra realización, los clonotipos se asignan a algún clan si satisfacen los criterios siguientes: i) se mapean en los mismos segmentos V y J de referencia, con los mapeos ocurriendo en las mismas posiciones relativas en la secuencia del clonotipo, y ii) sus regiones NDN son sustancialmente idénticas. "Sustancial" en referencia a los miembros de un clan significa que se permiten algunas pequeñas diferencias en la región NDN porque se pueden haber producido mutaciones somáticas en esta región. Preferiblemente, en una realización, para evitar llamar de manera falsa a una mutación en la región NDN, si una sustitución de base se acepta como una mutación relacionada con el cáncer depende directamente del tamaño de la región NDN del clan. Por ejemplo, un método puede aceptar un clonotipo como un miembro del clan si tiene una diferencia de una base de la o las secuencias de NDN del clan como una mutación relacionada con cáncer si la longitud de la o las secuencias de NDN del clan es m nucleótidos o mayor, por ejemplo, 9 nucleótidos o mayor, de otra manera no se acepta, o si tiene una diferencia de dos bases de la o las secuencias de NDN del clan como mutaciones relacionadas con cáncer si la longitud de la o las secuencias de NDN del clan es n nucleótidos o mayor, por ejemplo, 20 nucleótidos o mayor, de otra manera no se acepta. En otra realización, los miembros de un clan se determinan usando los criterios siguientes: (a) la lectura V se mapea en la misma región V, (b) la lectura C se mapea en la misma región J, (c) la región NDN es sustancialmente idéntica (como se ha descrito anteriormente), y (d) la posición de la región NDN entre el límite V-NDN y el límite J-NDN es la misma (o de forma equivalente, el número de adiciones de bases aguas abajo a D y el número de adiciones de bases aguas arriba a D son las mismas). Tal y como se usa en la presente memoria, el término "lectura de C" puede referirse a una lectura generada a partir de un cebador de secuenciación que hibrida bien con una región C (en el caso de usar una muestra de ARN) o con una región J (en el caso de usar una muestra de ADN). Como se explica en otro lugar, esto es porque una región C se une con una región J en un proceso de corte y empalme posterior a la transcripción. Los clonotipos filogénicos de una única muestra pueden agruparse en clanes y los clanes de muestras sucesivas adquiridas a tiempos diferentes pueden compararse entre sí. En particular, en un aspecto de la invención, los clanes que contienen clonotipos correlacionados con un neoplasma linfoide se identifican entre los clonotipos determinados de cada muestra en cada punto de tiempo. El conjunto (o clan) de clonotipos que se correlacionan de cada punto de tiempo se compara con el de la muestra inmediatamente anterior para determinar el estado de la enfermedad, por ejemplo, determinando en clanes sucesivos si una frecuencia de un clonotipo particular se incrementa o disminuye, si aparece un nuevo clonotipo que se correlaciona que se sabe que se correlaciona a partir de estudios poblacionales o bases de datos, o semejantes. Un estado determinado podría ser remisión continua, recidiva incipiente, evidencia de evolución clonal adicional, o semejante. Uso de isotipos. Los perfiles de clonotipos pueden incluir información sobre el uso de isotipos. Siempre que se determinan los clonotipos basados en IgH o TCRβ a partir de ARN, el corte y empalme posterior a la transcripción une las regiones C a las regiones J, como se ilustra en la Fig. 3B. Los cebadores de secuenciación pueden usarse para generar lecturas de C (por ejemplo, 304) que hibridan con un sitio de unión de cebador predeterminado (302) en la región C (307) en la unión con la región J (309). Si el sitio de unión de cebador (302) se selecciona de manera que la lectura de C (304) incluye una parte (305) de la región C (307), entonces puede determinarse la identidad de la región C (307), que, a su vez, permite determinar el isotipo del BCR sintetizado. En una realización, el sitio de unión del cebador (302) se selecciona de manera que la lectura de C (304) incluye al menos seis nucleótidos de la región C (307); en otra realización, el sitio de unión del cebador (302) se selecciona de manera que la lectura de C (304)
26
incluye al menos 8 nucleótidos de la región C (307). Cada clonotipo determinado según esta realización incluye información de secuencia de parte (305) de su región C correspondiente y a partir de dicha información de secuencia se determina su isotipo correspondiente. Los clonotipos que se correlacionan pueden tener un primer isotipo en el momento en el que se determinan inicialmente, pero pueden cambiar a otro tipo de isotipo durante el tiempo en el que están siendo monitorizados. Esta realización es capaz de detectar dichos cambios percibiendo clonotipos previamente no registrados que tienen secuencias idénticas a los clonotipos que se correlacionan, excepto para la secuencia de parte (305) que corresponde a un isotipo diferente. Se espera que el error de la PCR se concentre en algunas bases que estaban mutadas en los ciclos tempranos de PCR. Se espera que el error de secuenciación esté distribuido en muchas bases aunque es totalmente aleatorio ya que el error probablemente tenga algún sesgo sistemático. Se asume que algunas bases tendrán error de secuenciación en una proporción mayor, por ejemplo 5% (5 veces la media). Dadas estas asunciones, el error de secuenciación se vuelve el tipo dominante de error. El distinguir los errores de PCR de la aparición de clonotipos altamente relacionados jugará un papel en el análisis. Dada la significancia biológica para determinar que hay dos o más clonotipos altamente relacionados, se toma una estrategia conservadora para hacer dichas llamadas. Se considera la detección de bastantes de los clonotipos menores de manera que se asegura con una confianza alta (por ejemplo, 99,9%) que hay más de un clonotipo. Por ejemplo, de los clonotipos que están presentes a 100 copias/1.000.000, la variante menor se detecta 14 o más veces para designarla como un clonotipo independiente. De forma similar, para los clonotipos presentes a 1.000 copias/1.000.000 la variante menor puede detectarse 74 o más veces para designarla como un clonotipo independiente. Este algoritmo puede potenciarse usando la puntuación de calidad de base que se obtiene con cada base secuenciada. Si la relación entre la puntuación de calidad y la proporción de error se valida por encima, entonces en lugar de emplear la proporción de error conservativa del 5% para todas las bases, la puntuación de calidad puede usarse para decidir el número de lecturas que es necesario que estén presentes para llamar un clonotipo independiente. La puntuación de calidad mediana de la base específica en todas las lecturas puede usarse, o de forma más rigurosa, la probabilidad de siendo un error pueda computarse dada la puntuación de calidad de la base específica en cada lectura, y entonces las probabilidades pueden combinarse (asumiendo independencia) para estimar el número probable de error de secuenciación para esa base. Como resultado, hay diferentes umbrales para rechazar la hipótesis del error de secuenciación para diferentes bases con diferentes puntuaciones de calidad. Por ejemplo, para un clonotipo presente a 1.000 copias por 1.000.000, la variante menor se designa independiente cuando se detecta 22 y 74 veces si la probabilidad de error fuera 0,01 y 0,05, respectivamente.
III.
Clonotipos que se correlacionan y algoritmos médicos En la presente memoria se describen métodos para identificar clonotipos cuya presencia, ausencia y/o nivel está correlacionado con un estado de enfermedad y para usar dicha información para tomar decisiones de diagnóstico o pronóstico. En un método, la información de perfiles de clonotipos, que puede acoplarse con otra información médica, tal como niveles de expresión de genes no TCR o no BCR, condición fisiológica, o semejantes, se presenta a los pacientes o responsables sanitarios en el contexto de un algoritmo; esto es, un conjunto de una o más etapas en el que se evalúan los resultados de ensayos y/o exámenes y (i) bien se determina un curso de acción o se toma una decisión respecto al estado de salud o enfermedad o (ii) se toma una serie de decisiones según un diagrama de flujo, o estructura de toma de decisión semejante, que da lugar a un curso de acción, o una decisión respecto al estado de salud o enfermedad. Los algoritmos descritos en la presente memoria pueden variar ampliamente en formato. Por ejemplo, un algoritmo puede sugerir simplemente que un paciente debe tratarse con un fármaco, si un determinado clonotipo, o subconjunto de clonotipos, supera una proporción predeterminada en un perfil de clonotipos, o se incrementa en proporción en más de una proporción predeterminada entre las medidas de monitorización. Incluso de forma más simple, un algoritmo puede indicar meramente que existe una correlación positiva entre un estado de enfermedad y un nivel de uno o más clonotipos y/o una función de TCR o BCR codificada por uno o más clonotipos. Los algoritmos más complejos pueden incluir información fisiológica del paciente además de información a partir de uno o más perfiles de clonotipos. Por ejemplo, en trastornos complejos, tales como algunos trastornos autoinmunes, la información del perfil de clonotipos puede combinarse en un algoritmo con otros datos del paciente tales como curso de tratamiento anterior, presencia, ausencia o intensidad de los síntomas, por ejemplo, erupción, inflamación articular, expresión de genes particulares, o semejantes. En un caso, un algoritmo para uso con la monitorización de trastornos linfoides proporciona un valor fraccionado predeterminado por encima del cual la proporción de un clonotipo (y/o clonotipos relacionados evolutivamente) en un perfil de clonotipos de una muestra (tal como una muestra de sangre) indica una recidiva de la enfermedad o una resistencia a un tratamiento. Dichos algoritmos pueden consistir en o incluir medidas convencionales de clonalidad de TCR o BCR. En otro caso, un algoritmo para uso con la monitorización de trastornos autoinmunes proporciona uno o más valores fraccionados predeterminados por encima de los cuales una proporción de clonotipos en un perfil de clonotipos que codifica TCR o BCR específicos para uno o más antígenos predeterminados, respectivamente, indica el inicio de una crisis autoinmune.
A.
Clonotipos que se correlacionan frente a los que no se correlacionan Los métodos descritos en la presente memoria proporcionan medios para distinguir a) clonotipos que se correlacionan (que pueden ser aquellos clonotipos cuyo nivel se correlaciona con enfermedad) de b) clonotipos que no se correlacionan (que pueden ser aquellos clonotipos cuyos niveles no se correlacionan
27
imagen12
imagen13
correlacionan identificados en b) para desarrollar un algoritmo que pueda predecir clonotipos que se correlacionan en cualquier muestra de un sujeto con la enfermedad. En un caso, el conjunto de muestras se toma de uno o más tejidos afectados por la enfermedad. En otro caso, la identificación de uno o más clonotipos que se correlacionan comprende comparar los perfiles de clonotipos de al menos dos muestras. En otro caso, los datos funcionales incluyen la capacidad de unión de los marcadores en las células T y/o células B o interacción con antígeno por una célula T o célula B. En otro caso, dichos parámetros de secuencia comprenden secuencia de ácido nucleico y secuencia de aminoácidos predicha. En otro caso, las muestras son de uno o más individuos en un estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están presentes en el estado de pico de la enfermedad. En otro caso, dichos uno o más clonotipos que se correlacionan están a un nivel alto en el estado de pico de la enfermedad. En otro caso, uno o más clonotipos que se correlacionan están a un nivel bajo en el estado de pico de la enfermedad. En otro caso, uno o más clonotipos que se correlacionan están ausentes en el estado de pico de la enfermedad. En un caso, la enfermedad es una enfermedad autoinmune. En otro caso, la enfermedad autoinmune es lupus eritematoso sistémico, esclerosis múltiple, artritis reumatoide, o espondilitis anquilosante. Se describe un método para descubrir uno o más clonotipos que se correlacionan para un individuo, que comprende a) introducir un perfil de clonotipos de una muestra del individuo en un algoritmo, y b) usar el algoritmo para determinar uno o más clonotipos que se correlacionan para el individuo. El algoritmo puede ser un algoritmo desarrollado por: a) generación de una pluralidad de perfiles de clonotipos de un conjunto de muestras, en el que las muestras son relevantes para la enfermedad, b) identificación de uno o más clonotipos que se correlacionan del conjunto de muestras, y c) uso de parámetros de secuencia y/o datos funcionales de uno o más clonotipos que se correlacionan identificados en b) para desarrollar el algoritmo que puede predecir clonotipos que se correlacionan en cualquier muestra de un sujeto con la enfermedad. En algunos casos, los clonotipos que se correlacionan son clonotipos identificados presentes en poblaciones que se han expuesto a un antígeno que tiene relevancia para un estado distinto de un estado de enfermedad. Este estado podría incluir exposición a antígenos no causantes de enfermedad, tales como reacciones alérgicas sub-sintomáticas a pólenes locales. Esto podría usarse para identificar si un individuo ha viajado recientemente a una localización geográfica que contenía el antígeno. Los estados podrían incluir exposición a un antígeno relacionado con un proceso industrial o la fabricación o producción de agentes de bioterrorismo.
D. Descubrimiento de clonotipos que se correlacionan y no se correlacionan usando un ensayo de calibración combinado con un estudio poblacional. Los clonotipos que se correlacionan pueden identificarse usando un ensayo de calibración combinado con un estudio poblacional. El estudio poblacional no resulta en un algoritmo que permita predecir los clonotipos en ninguna muestra sino que permite desarrollar un algoritmo para predecir clonotipos que se correlacionan en cualquier muestra de un sujeto para el que se ha generado un perfil de clonotipos de calibración particular. Un ejemplo de esto podría ser el desarrollo de un algoritmo que predeciría los clonotipos que se correlacionan en un paciente con lupus sobre la base del perfil de clonotipos medido de una muestra de sangre en cualquier estadio de la enfermedad después de haber sido sometido en primer lugar a un ensayo de sangre durante un estado de crisis clínica que se usó para calibrar el algoritmo. Así, los clonotipos que se correlacionan pueden identificarse en etapas: (a) generar perfiles de clonotipos de un conjunto de muestras de tejidos relevantes para o afectados por una enfermedad para identificar un conjunto de clonotipos asociados con la enfermedad bien por nivel y/o por función y para identificar una relación entre dicho nivel y/o función y el estado de la enfermedad; (b) medir un perfil de clonotipos de una muestra de un tejido de un primer estado de la enfermedad; (c) determinar un clonotipo que se correlaciona a partir de la relación de la etapa (a). Los clonotipos que se correlacionan pueden identificarse en etapas: (a) generar perfiles de clonotipos de un conjunto de muestras de tejidos relevantes para o afectados por una enfermedad para identificar un conjunto de clonotipos asociados con la enfermedad bien por nivel y/o por función y para identificar una relación entre dicho nivel y/o función y el estado de la enfermedad; (b) medir un perfil de clonotipos de calibración en un nuevo sujeto en un estadio relevante de la enfermedad en un estadio de pico o de tejido afectado por la enfermedad o en un estado caracterizado funcionalmente; (c) determinar un clonotipo que se correlaciona a partir de la relación de la etapa (a). En la presente memoria se describen métodos para identificar clonotipos que se correlacionan y no se correlacionan secuenciando el repertorio de células inmunes en un estudio de muestras de pacientes de enfermedad o enfermedades y opcionalmente controles sanos a diferentes tiempos y, en el caso de los pacientes con una enfermedad, a diferentes (y conocidos) estados del curso de la enfermedad caracterizado por datos clínicos. Los clonotipos que se encuentran a diferente frecuencia (o nivel) en el primer estado que en el segundo estado se usan entonces para desarrollar un algoritmo que predice cuáles de las secuencias encontradas en los repertorios de cada individuo en el primer estado de la enfermedad se correlacionarán con la enfermedad en el estado posterior en cada individuo que es distinto de aquellos que no se correlacionarán con la enfermedad en ese individuo. A diferencia del caso del ensayo de calibración solo, las secuencias que se correlacionan pueden ser un subconjunto de todas las secuencias que se ha encontrado que son diferentes entre los estados de la enfermedad. También es posible que los clonotipos que se correlacionan no se encuentren en la muestra de calibración pero se predice sobre la base del algoritmo que se correlacionan si aparecen en una muestra futura. Como un ejemplo, un clonotipo que codifica la misma secuencia de aminoácidos que un clonotipo encontrado en
30
imagen14
imagen15
clonotipos de a) en un algoritmo, y c) usar el algoritmo para generar una puntuación predictiva del estado de enfermedad del individuo. El algoritmo puede ser un algoritmo generado por a) desarrollo de un algoritmo que usa un conjunto de factores para combinar los niveles de los clonotipos que se correlacionan en una puntuación de la actividad de la enfermedad, b) comparación de la puntuación de la actividad de la enfermedad con datos clínicos respecto al estado de la enfermedad, y c) optimización de los factores con el fin de maximizar la correlación entre los datos clínicos y la puntuación de la actividad de la enfermedad.
2.
Monitorización de la enfermedad usando un ensayo de calibración Los clonotipos que se correlacionan y el algoritmo de carga inmune pueden determinarse usando un ensayo de calibración o un ensayo de calibración y un estudio poblacional. La carga inmune puede usarse en clínica realizando en primer lugar un ensayo de calibración. Este ensayo puede hacerse cuando el paciente está en un estado que es similar al primer estado usado en el estudio que generó los clonotipos que se correlacionan y que no se correlacionan que se usan en el algoritmo de carga inmune. Por ejemplo, este estado puede ser un estado de crisis de una enfermedad autoinmune si así es cómo se derivó el algoritmo de carga inmune. Este ensayo de calibración puede usarse entonces para generar los clonotipos que se correlacionan y no se correlacionan específicos para usarse en los ensayos de monitorización de la enfermedad posteriores. En un punto posterior en el tratamiento de este paciente, se hace otro ensayo en el paciente y la carga inmune puede calcularse usando el algoritmo generado en el estudio de descubrimiento, y la lista de los niveles de clonotipos generada en este ensayo de calibración especifico del paciente. Esta puntuación de carga inmune puede usarse clínicamente. En un caso, un ensayo de monitorización usando un ensayo de calibración comprende las etapas siguientes: (a) ensayar un paciente en el estado de enfermedad 1 con el fin de determinar un perfil de clonotipos; (b) medir los clonotipos de un paciente en un momento posterior (el momento en el que el paciente se va a monitorizar); (c) usar el algoritmo de monitorización para generar una puntuación de la enfermedad que refleje un estado de la enfermedad a partir del perfil de clonotipos del estado de la enfermedad 1 del ensayo de calibración e información de un ensayo en un momento posterior. Se describe un método para monitorizar el estado de la enfermedad de un individuo, que comprende: a) determinar un perfil de clonotipos de una muestra de un sujeto, b) introducir la información del perfil de clonotipos de a) en un algoritmo, y c) usar el algoritmo para generar una puntuación predictiva del estado de la enfermedad del individuo. El algoritmo puede ser un algoritmo generado por a) desarrollo de un algoritmo que usa un conjunto de factores para combinar los niveles de los clonotipos que se correlacionan en una puntuación de la actividad de la enfermedad, b) comparación de la puntuación de la actividad de la enfermedad con datos clínicos respecto al estado de la enfermedad, y c) optimización de los factores con el fin de maximizar la correlación entre los datos clínicos y la puntuación de la actividad de la enfermedad. En otro caso, el método puede comprender además determinar uno o más clonotipos que se correlacionan en el individuo por cualquiera de los métodos descritos en la presente memoria, e introducir la información del uno o más clonotipos que se correlacionan en el algoritmo. En un caso, la enfermedad es una enfermedad autoinmune. En otro caso, la enfermedad autoinmune es lupus eritematoso sistémico, esclerosis múltiple, artritis reumatoide, o espondilitis anquilosante.
3.
Otros factores relacionados con el uso de carga inmune La misma carga inmune puede significar diferentes cosas para diferentes pacientes. Para uno, es necesario considerar la imagen clínica completa de un paciente. Desde una perspectiva de ensayo, se puede considerar la velocidad (proporción de cambio de la carga inmune en el tiempo) y la aceleración (proporción de cambio de la velocidad en el tiempo) además del nivel de carga inmune para tomar decisiones clínicas. Por ejemplo, si la puntuación de carga autoinmune se incrementa (alta velocidad) puede ser predictiva de una crisis incipiente en una enfermedad autoinmune. Los ensayos adicionales que pueden integrarse en la puntuación de carga, por ejemplo, una puntuación de carga autoinmune, incluyen, por ejemplo, velocidad de sedimentación de eritrocitos (ESR), niveles de proteína C reactiva (CRP), anti-ADNds, otras titulaciones de autoanticuerpos, niveles de complemento, niveles de proteína en orina, proporción proteína en orina/creatinina, niveles de creatinina, niveles de nitrógeno de urea en la sangre (BUN), niveles de plaquetas, recuentos WBC, hematocrito (Hct), Hb, resultados de análisis de orina. Otros ensayos que están relacionados con SLE que pueden integrarse incluyen, por ejemplo, nivel de CD27, nivel celular de CD27++, genes que responden a INF (Baechler, EC et al. (2003) Proc. Natl. Acad. Sci. 100: 2610-2615), y puntuación de quimioquinas (Bauer JW et al. (2009) Arthritis Rheum. 60: 3098-3107). Otros ensayos no relacionados con lupus incluyen, por ejemplo, ensayo de la hormona estimulante de tiroides (TSH), ensayo de triyodotironina (T3), ensayo de tiroxina (T4), ensayos de función hepática (LFT), otros autoanticuerpos, ensayo de calprotectina, ensayo de lactoferrina, y análisis del fluido sinovial. Los ensayos adicionales pueden incluir ensayo de formación de imágenes, incluyendo, por ejemplo, MRI, escaneo CT, rayos X, y ultrasonidos.
I. El uso de tecnologías de secuenciación en combinación con enriquecimientos celulares parciales como parte de una etapa de calibración para encontrar clonotipos que se correlacionan. Existen varias tecnologías que pueden usarse para separar células en la sangre o tejido sobre la base de marcadores celulares. Éstas incluyen separaciones en fase sólida tales como lechos o columnas en las que se inmovilizan reactivos de afinidad específicos tales como anticuerpos. La separación en fase líquida puede conseguirse usando técnicas tales como citometría de flujo en la que reactivos marcados que se unen específicamente a marcadores celulares seleccionados se usan para dirigir un dispositivo de flujo seleccionado en el que pueden usarse marcadores fluorescentes específicos para separar las células así
33
imagen16
imagen17
imagen18
imagen19
imagen20
imagen21
imagen22
imagen23
imagen24
imagen25
imagen26
imagen27
imagen28
imagen29
imagen30
imagen31
imagen32
imagen33
imagen34
imagen35
imagen36
imagen37
imagen38
imagen39
imagen40
imagen41
imagen42
imagen43
imagen44
imagen45
imagen46
imagen47
imagen48
imagen49
imagen50
imagen51
imagen52
imagen53
imagen54
imagen55
imagen56
imagen57
imagen58
imagen59
imagen60
imagen61
imagen62
imagen63
imagen64
imagen65
imagen66
imagen67
imagen68
imagen69
imagen70
imagen71
imagen72
imagen73
imagen74
imagen75
imagen76
imagen77
imagen78
imagen79
imagen80
imagen81
imagen82
imagen83
imagen84

Claims (1)

  1. imagen1
ES11777704.5T 2010-05-06 2011-05-04 Monitorización de estados de salud y enfermedad usando perfiles de clonotipos Active ES2593614T3 (es)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US33217510P 2010-05-06 2010-05-06
US332175P 2010-05-06
US45574310P 2010-10-25 2010-10-25
US455743P 2010-10-25
US201161446822P 2011-02-25 2011-02-25
US446822P 2011-02-25
PCT/US2011/000791 WO2011139371A1 (en) 2010-05-06 2011-05-04 Monitoring health and disease status using clonotype profiles

Publications (1)

Publication Number Publication Date
ES2593614T3 true ES2593614T3 (es) 2016-12-12

Family

ID=44903937

Family Applications (2)

Application Number Title Priority Date Filing Date
ES16183402T Active ES2740802T3 (es) 2010-05-06 2011-05-04 Monitorización del estadio de neoplasia linfoide usando perfiles de clonotipo
ES11777704.5T Active ES2593614T3 (es) 2010-05-06 2011-05-04 Monitorización de estados de salud y enfermedad usando perfiles de clonotipos

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES16183402T Active ES2740802T3 (es) 2010-05-06 2011-05-04 Monitorización del estadio de neoplasia linfoide usando perfiles de clonotipo

Country Status (9)

Country Link
EP (4) EP2567226B1 (es)
JP (4) JP6085249B2 (es)
CN (2) CN104673899A (es)
AU (1) AU2011249041B2 (es)
CA (1) CA2798431C (es)
DK (2) DK2567226T3 (es)
ES (2) ES2740802T3 (es)
SG (2) SG185128A1 (es)
WO (2) WO2011139372A1 (es)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9365901B2 (en) 2008-11-07 2016-06-14 Adaptive Biotechnologies Corp. Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
US8691510B2 (en) 2008-11-07 2014-04-08 Sequenta, Inc. Sequence analysis of complex amplicons
US9528160B2 (en) 2008-11-07 2016-12-27 Adaptive Biotechnolgies Corp. Rare clonotypes and uses thereof
US8628927B2 (en) 2008-11-07 2014-01-14 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9394567B2 (en) 2008-11-07 2016-07-19 Adaptive Biotechnologies Corporation Detection and quantification of sample contamination in immune repertoire analysis
SG195652A1 (en) 2008-11-07 2013-12-30 Sequenta Inc Methods of monitoring conditions by sequence analysis
HUE029424T2 (en) 2009-01-15 2017-02-28 Adaptive Biotechnologies Corp Adaptive immunity profiling and a method for producing monoclonal antibodies
JP2012531202A (ja) 2009-06-25 2012-12-10 フレッド ハチンソン キャンサー リサーチ センター 適応免疫を測定する方法
US9043160B1 (en) 2009-11-09 2015-05-26 Sequenta, Inc. Method of determining clonotypes and clonotype profiles
DK2652155T3 (en) 2010-12-16 2017-02-13 Gigagen Inc Methods for Massive Parallel Analysis of Nucleic Acids in Single Cells
KR20210131432A (ko) 2010-12-30 2021-11-02 파운데이션 메디신 인코포레이티드 종양 샘플의 다유전자 분석의 최적화
WO2012097374A1 (en) * 2011-01-14 2012-07-19 Cb Biotechnologies, Inc. Immunodiversity assessment method and its use
US10385475B2 (en) 2011-09-12 2019-08-20 Adaptive Biotechnologies Corp. Random array sequencing of low-complexity libraries
EP2768982A4 (en) 2011-10-21 2015-06-03 Adaptive Biotechnologies Corp QUANTIFICATION OF ADAPTIVE IMMUNOCELL GENOMES IN A COMPLEX MIX OF CELLS
EP2788509B1 (en) * 2011-12-09 2018-07-11 Adaptive Biotechnologies Corporation Diagnosis of lymphoid malignancies and minimal residual disease detection
US9499865B2 (en) 2011-12-13 2016-11-22 Adaptive Biotechnologies Corp. Detection and measurement of tissue-infiltrating lymphocytes
JP2015504661A (ja) * 2011-12-20 2015-02-16 シーケンタ インコーポレイテッド 免疫レパートリー解析による、濾胞性リンパ腫からびまん性大細胞型b細胞リンパ腫への形質転換のモニタリング
EP2823060B1 (en) 2012-03-05 2018-02-14 Adaptive Biotechnologies Corporation Determining paired immune receptor chains from frequency matched subunits
WO2013155119A1 (en) * 2012-04-13 2013-10-17 Sequenta, Inc. Detection and quantitation of sample contamination in immune repertoire analysis
DK2831276T3 (da) 2012-05-08 2016-08-01 Adaptive Biotechnologies Corp Sammensætninger og fremgangsmåde til at måle og kalibrere amplifikations-bias i multipleks-PCR-reaktioner
WO2013181428A2 (en) * 2012-05-31 2013-12-05 Sequenta, Inc. Predicting relapse of chronic lymphocytic leukemia patients treated by allogeneic stem cell transplantation
AU2013273987B2 (en) * 2012-06-15 2018-08-09 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
EP2882870A4 (en) * 2012-08-10 2016-03-16 Sequenta Inc HIGHLY SENSITIVE DETECTION OF MUTATIONS BY SEQUENCE TAGS
ES2749118T3 (es) 2012-10-01 2020-03-19 Adaptive Biotechnologies Corp Evaluación de la inmunocompetencia por la diversidad de los receptores de inmunidad adaptativa y caracterización de la clonalidad
US20150247198A1 (en) * 2012-10-19 2015-09-03 Sequenta, Inc. Monitoring clonotypes of plasma cell proliferative disorders in peripheral blood
WO2015160439A2 (en) 2014-04-17 2015-10-22 Adaptive Biotechnologies Corporation Quantification of adaptive immune cell genomes in a complex mixture of cells
EP2909348A4 (en) * 2012-10-22 2016-07-06 Adaptive Biotechnologies Corp MONITORING COAT CLINOTYPES IN PERIPHERAL BLOOD AFTER IMMUNTRANSPLANTATION
JP6460343B2 (ja) * 2013-02-11 2019-01-30 アイレパートリー インコーポレイテッド 免疫レパートリーを評価するための方法
AU2014218910A1 (en) * 2013-02-22 2015-08-20 Adaptive Biotechnologies Corp. Rare clonotypes and uses thereof
KR20150132479A (ko) * 2013-03-15 2015-11-25 어댑티브 바이오테크놀로지스 코포레이션 복합 유전자 세트에서의 독특하게 태그되고 재배열된 적응 면역 수용체 유전자
GB2584364A (en) 2013-03-15 2020-12-02 Abvitro Llc Single cell bar-coding for antibody discovery
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
JP6164759B2 (ja) * 2013-11-21 2017-07-19 Repertoire Genesis株式会社 T細胞受容体およびb細胞受容体レパトアの解析システムならびにその治療および診断への利用
WO2015134787A2 (en) 2014-03-05 2015-09-11 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10066265B2 (en) 2014-04-01 2018-09-04 Adaptive Biotechnologies Corp. Determining antigen-specific t-cells
US10202640B2 (en) 2014-05-07 2019-02-12 The Board Of Trustees Of The Leland Stanford Junior University Single cell analysis of T cells using high-throughput multiplex amplification and deep sequencing
US10590483B2 (en) 2014-09-15 2020-03-17 Abvitro Llc High-throughput nucleotide library sequencing
CA2966201A1 (en) 2014-10-29 2016-05-06 Adaptive Biotechnologies Corp. Highly-multiplexed simultaneous detection of nucleic acids encoding paired adaptive immune receptor heterodimers from many samples
US10246701B2 (en) 2014-11-14 2019-04-02 Adaptive Biotechnologies Corp. Multiplexed digital quantitation of rearranged lymphoid receptors in a complex mixture
US11066705B2 (en) 2014-11-25 2021-07-20 Adaptive Biotechnologies Corporation Characterization of adaptive immune response to vaccination or infection using immune repertoire sequencing
EP3227464B1 (en) 2014-12-05 2022-04-20 Foundation Medicine, Inc. Multigene analysis of tumor samples
AU2016222788B2 (en) 2015-02-24 2022-03-31 Adaptive Biotechnologies Corp. Methods for diagnosing infectious disease and determining HLA status using immune repertoire sequencing
AU2016242967B2 (en) 2015-04-01 2021-07-01 Adaptive Biotechnologies Corp. Method of identifying human compatible T cell receptors specific for an antigenic target
US9422547B1 (en) 2015-06-09 2016-08-23 Gigagen, Inc. Recombinant fusion proteins and libraries from immune cell repertoires
CN106557536B (zh) * 2015-09-30 2021-12-21 松下知识产权经营株式会社 控制方法
US10130658B2 (en) * 2015-12-18 2018-11-20 Provectus Pharmatech, Inc. Method of ex vivo enhancement of immune cell activity for cancer immunotherapy with a small molecule ablative compound
US10428325B1 (en) 2016-09-21 2019-10-01 Adaptive Biotechnologies Corporation Identification of antigen-specific B cell receptors
CN107955831A (zh) * 2016-10-13 2018-04-24 深圳华大基因研究院 用于淋巴细胞定量检测的标记物和淋巴细胞定量检测方法
GB201618485D0 (en) * 2016-11-02 2016-12-14 Ucl Business Plc Method of detecting tumour recurrence
KR102209364B1 (ko) * 2016-12-09 2021-02-01 리제너론 파아마슈티컬스, 인크. T 세포 수용체를 시퀀싱하기 위한 시스템 및 방법 및 이의 용도
RU2674994C2 (ru) * 2016-12-29 2018-12-14 Федеральное государственное бюджетное учреждение науки институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова Российской академии наук (ИБХ РАН) Способ определения маркеров наличия опухолевых т-лимфобластов
EP4212631A1 (en) 2017-09-01 2023-07-19 Life Technologies Corporation Compositions and methods for immune repertoire sequencing
CN111448312A (zh) 2017-10-10 2020-07-24 国立大学法人广岛大学 使用效应T细胞(Teff)抗原受体的抗原特异性调节性T细胞(Treg)的制作技术
JP7207661B2 (ja) 2017-10-10 2023-01-18 国立大学法人広島大学 Platinum TALENを用いたT細胞受容体の完全置換技術
US11254980B1 (en) 2017-11-29 2022-02-22 Adaptive Biotechnologies Corporation Methods of profiling targeted polynucleotides while mitigating sequencing depth requirements
WO2019196088A1 (en) * 2018-04-13 2019-10-17 Syz Cell Therapy Co. Methods of obtaining tumor-specific t cell receptors
CN112292600A (zh) * 2018-06-15 2021-01-29 豪夫迈·罗氏有限公司 用于鉴定被表达在肿瘤浸润性淋巴细胞上的t细胞受体识别的抗原的系统
CN109002689B (zh) * 2018-07-23 2020-10-09 西安交通大学医学院第一附属医院 T细胞数据处理方法及装置
WO2020102721A1 (en) * 2018-11-16 2020-05-22 Rapa Therapeutics, Llc Immune monitoring of neuro-inflammatory amyotrophic lateral sclerosis (als)
EP3941491A4 (en) 2019-03-21 2023-03-29 Gigamune, Inc. ENGINEERED CELLS EXPRESSING ANTIVIRAL T-CELL RECEPTORS AND METHODS OF USE
CN110988364A (zh) * 2019-12-31 2020-04-10 天津美瑞特医疗科技有限公司 一种应用流式细胞术检测移植后gvhd相关细胞因子的方法及检测试剂盒
CN111808195A (zh) * 2020-06-30 2020-10-23 中国科学院心理研究所 抗n-甲基-d-天冬氨酸受体脑炎的b细胞抗体基因获取方法及其免疫组库研究
CN111524548B (zh) * 2020-07-03 2020-10-23 至本医疗科技(上海)有限公司 用于检测igh重排的方法、计算设备和计算机存储介质
CA3214486A1 (en) 2021-03-24 2022-09-29 Genentech, Inc. Efficient tcr gene editing in t lymphocytes
CN113637741B (zh) * 2021-09-29 2023-12-01 成都二十三魔方生物科技有限公司 一种早发性白发遗传风险基因检测试剂盒、以及一种早发性白发遗传风险评估系统和方法

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4942124A (en) 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5296351A (en) 1988-10-20 1994-03-22 Alexander A. Morley Method for diagnosis of monoclonality in leukaemia and lymphoma
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
JP3080178B2 (ja) 1991-02-18 2000-08-21 東洋紡績株式会社 核酸配列の増幅方法およびそのための試薬キット
US5981179A (en) 1991-11-14 1999-11-09 Digene Diagnostics, Inc. Continuous amplification reaction
US5837447A (en) 1992-04-15 1998-11-17 Blood Center Research Foundation, Inc., The Monitoring an immune response by analysis of amplified immunoglobulin or T-cell-receptor nucleic acid
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US6090592A (en) 1994-08-03 2000-07-18 Mosaic Technologies, Inc. Method for performing amplification of nucleic acid on supports
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5635363A (en) 1995-02-28 1997-06-03 The Board Of Trustees Of The Leland Stanford Junior University Compositions and methods for the detection, quantitation and purification of antigen-specific T cells
US6087096A (en) 1995-11-13 2000-07-11 Dau; Peter C. Method of intrafamily fragment analysis of the T cell receptor α and β chain CDR3 regions
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
KR19990087749A (ko) * 1996-03-13 1999-12-27 시오노 요시히코 류마티스성 관절염에 특이적인 인간 티 세포 클론
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
CA2257152C (en) * 1996-06-03 2009-01-27 Linda M. Pilarski Methods for detection of rearranged dna
US6174670B1 (en) 1996-06-04 2001-01-16 University Of Utah Research Foundation Monitoring amplification of DNA during PCR
US5846928A (en) 1996-08-01 1998-12-08 Pasken Products Co., Ltd. Method for treating cancer patients
ES2277358T3 (es) 1996-09-06 2007-07-01 Ortho-Mcneil Pharmaceutical, Inc. Purificacion de celulas t especificas de antigeno.
GB9626815D0 (en) * 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
AU6846698A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid amplification
US6008002A (en) 1997-09-29 1999-12-28 Bodey; Bela Immunomagnetic detection and isolation of cancer cells
AU760560B2 (en) 1998-02-12 2003-05-15 Board Of Regents, The University Of Texas System Methods and reagents for the rapid and efficient isolation of circulating cancer cells
DE19833738A1 (de) 1998-07-27 2000-02-03 Michael Giesing Verfahren zur Isolierung von Krebszellen aus zellhaltigen Körperflüssigkeiten sowie Sets zur Durchführung dieses Verfahrens
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6300070B1 (en) 1999-06-04 2001-10-09 Mosaic Technologies, Inc. Solid phase methods for amplifying multiple nucleic acids
US6440706B1 (en) 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
EP1227321A1 (en) 2000-12-28 2002-07-31 Institut für Bioanalytik GmbH Reversible MHC multimer staining for functional purification of antigen-specific T cells
GB0128153D0 (en) 2001-11-23 2002-01-16 Bayer Ag Profiling of the immune gene repertoire
ATE483822T1 (de) * 2002-10-11 2010-10-15 Univ Erasmus Primer für nukleinsäureamplifikation in pcr- basierten klonalitätsstudien
WO2004069849A2 (en) 2003-01-29 2004-08-19 454 Corporation Bead emulsion nucleic acid amplification
AU2003902299A0 (en) 2003-05-13 2003-05-29 Flinders Medical Centre A method of analysing a marker nucleic acid molecule
DE60326052D1 (de) 2003-12-15 2009-03-19 Pasteur Institut Ermittlung des Repertoires von B-Lymphozyten Populationen
EP1784646B1 (en) 2004-08-11 2012-06-13 Albert Einstein College Of Medicine Of Yeshiva University Method for identifying metastasis in motile cells
US8426146B2 (en) * 2005-06-03 2013-04-23 University of Pittsburgh—of the Commonwealth System of Higher Education Multiparameteric method for assessing immune system status
US7993821B2 (en) 2005-08-11 2011-08-09 University Of Washington Methods and apparatus for the isolation and enrichment of circulating tumor cells
US7375211B2 (en) * 2005-11-18 2008-05-20 Kou Zhong C Method for detection and quantification of T-cell receptor Vβ repertoire
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
CN101225441B (zh) * 2007-12-05 2010-12-01 浙江大学 一种检测克隆特异性t淋巴细胞tcr bv cdr3基因组成的方法
US11051733B2 (en) 2008-01-18 2021-07-06 Wake Forest University Health Sciences Isolating and purifying cells for therapy
EP2088205A1 (en) * 2008-02-11 2009-08-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) PSMB10: A diagnosis marker and therapeutic target of chronic rejection.
US20090226975A1 (en) * 2008-03-10 2009-09-10 Illumina, Inc. Constant cluster seeding
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
SG195652A1 (en) 2008-11-07 2013-12-30 Sequenta Inc Methods of monitoring conditions by sequence analysis
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
WO2011106738A2 (en) * 2010-02-25 2011-09-01 Fred Hutchinson Cancer Research Center Use of tcr clonotypes as biomarkers for disease

Also Published As

Publication number Publication date
AU2011249041A1 (en) 2012-11-22
JP2013524848A (ja) 2013-06-20
CA2798431C (en) 2018-10-23
DK2567226T3 (en) 2016-10-10
EP4219759A2 (en) 2023-08-02
EP2567226A1 (en) 2013-03-13
EP3144673B1 (en) 2019-07-10
CN103097888A (zh) 2013-05-08
JP2013524849A (ja) 2013-06-20
CA2798431A1 (en) 2011-11-10
CN103097888B (zh) 2016-03-09
EP2567226A4 (en) 2013-08-28
JP6085249B2 (ja) 2017-02-22
JP6246971B2 (ja) 2017-12-13
AU2011249041B2 (en) 2014-10-30
SG185128A1 (en) 2012-12-28
JP2017205112A (ja) 2017-11-24
JP6533272B2 (ja) 2019-06-19
WO2011139372A1 (en) 2011-11-10
EP2567226B1 (en) 2016-08-10
JP2018068300A (ja) 2018-05-10
EP3456847A1 (en) 2019-03-20
JP6158080B2 (ja) 2017-07-05
WO2011139371A1 (en) 2011-11-10
ES2740802T3 (es) 2020-02-06
EP3144673A1 (en) 2017-03-22
SG10201503534RA (en) 2015-06-29
EP4219759A3 (en) 2023-09-06
CN104673899A (zh) 2015-06-03
DK3144673T3 (da) 2019-09-09

Similar Documents

Publication Publication Date Title
ES2593614T3 (es) Monitorización de estados de salud y enfermedad usando perfiles de clonotipos
US11591652B2 (en) System and methods for massively parallel analysis of nucleic acids in single cells
ES2699653T3 (es) Detección y medición de linfocitos infiltrados en los tejidos
ES2662128T3 (es) Determinación de cadenas de receptor inmunitario emparejadas a partir de la frecuencia de subunidades coincidentes
US10155992B2 (en) Monitoring health and disease status using clonotype profiles
ES2811520T3 (es) Análisis biomolecular a gran escala con marcadores de secuencia
US9365901B2 (en) Monitoring immunoglobulin heavy chain evolution in B-cell acute lymphoblastic leukemia
ES2748204T3 (es) Procedimiento para seleccionar clonotipos raros
US20130324422A1 (en) Detecting disease-correlated clonotypes from fixed samples
US20150275308A1 (en) Monitoring diffuse large b-cell lymphoma from peripheral blood samples
US20150299800A1 (en) Monitoring mantle cell lymphoma clonotypes in peripheral blood after immunotransplant
US20150247198A1 (en) Monitoring clonotypes of plasma cell proliferative disorders in peripheral blood
US20150154352A1 (en) System and Methods for Genetic Analysis of Mixed Cell Populations
US20130078633A1 (en) Detection of Isotype Profiles as Signatures for Disease