MX2014004712A - Metodos para mejorar el diagnostico de enfermedad inflamatoria intestinal. - Google Patents

Metodos para mejorar el diagnostico de enfermedad inflamatoria intestinal.

Info

Publication number
MX2014004712A
MX2014004712A MX2014004712A MX2014004712A MX2014004712A MX 2014004712 A MX2014004712 A MX 2014004712A MX 2014004712 A MX2014004712 A MX 2014004712A MX 2014004712 A MX2014004712 A MX 2014004712A MX 2014004712 A MX2014004712 A MX 2014004712A
Authority
MX
Mexico
Prior art keywords
sample
ibd
antibody
markers
disease
Prior art date
Application number
MX2014004712A
Other languages
English (en)
Other versions
MX352274B (es
Inventor
Sharat Singh
Fred Princen
Steven Lockton
Lisa J Croner
Frederick A Fletcher
Thomas Stockfisch
Original Assignee
Nestec Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nestec Sa filed Critical Nestec Sa
Publication of MX2014004712A publication Critical patent/MX2014004712A/es
Publication of MX352274B publication Critical patent/MX352274B/es

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • G01N33/54306Solid-phase reaction mechanisms
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6854Immunoglobulins
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/46Assays involving biological materials from specific organisms or of a specific nature from animals; from humans from vertebrates
    • G01N2333/47Assays involving proteins of known structure or function as defined in the subgroups
    • G01N2333/4701Details
    • G01N2333/4737C-reactive protein
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/475Assays involving growth factors
    • G01N2333/49Platelet-derived growth factor [PDGF]
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70525ICAM molecules, e.g. CD50, CD54, CD102
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70542CD106
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/775Apolipopeptides
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/06Gastro-intestinal diseases
    • G01N2800/065Bowel diseases, e.g. Crohn, ulcerative colitis, IBS
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Primary Health Care (AREA)

Abstract

La presente invención proporciona métodos y sistemas para predecir y diagnosticar enfermedad inflamatoria intestinal (IBD) y subtipos tales como colitis ulcerosa (CU) y enfermedad de Crohn (EC) al detectar la presencia, ausencia, nivel y/o genotipo de uno o más de marcadores inflamación de sero-genéticos. Adecuadamente, con la presente invención, es posible proporcionar un diagnóstico de IBD frente a no-IBD, para descartar IBD que no sea concluyente para CD y UC, y para diferenciar entre EC y CU con una mayor precisión.

Description

MÉTODOS PARA MEJORAR EL DIAGNÓSTICO DE ENFERMEDAD INFLAMATORIA INTESTINAL Referencias cruzadas a solicitudes relacionadas La presente solicitud reclama prioridad de la solicitud provisional de E.U.A.
No. 61/550,293, presentada el 21 de octubre de 2011 , solicitud provisional de E.U.A. No. 61/553,853, presentada el 31 de octubre de 201 1 , solicitud provisional de E.U.A. No. 61/567,096, presentada el 5 de diciembre de 2011 y solicitud provisional de E.U.A. No. 61/570,271 , presentada el 13 de diciembre de 2011 , las descripciones de las cuales se incorporan en la presente por referencia en su totalidad para todos los propósitos.
Antecedentes de la invención La enfermedad intestinal inflamatoria (IBD), que se presenta a nivel mundial y afecta a millones de personas, es el término colectivo usado para describir tres trastornos gastrointestinales de etiología desconocida: enfermedad de Crohn (CD), colitis ulcerosa (UC) y colitis indeterminada (IC). IBD, Junto con el síndrome del intestino irritable (IBS), afectarán a la mitad de todos los norteamericanos durante su tiempo de vida, a un costo de más de 2.6 mil millones de dólares para IBD y más de 8 mil millones de dólares para IBS. Una determinante primaria de estos altos costos médicos es la dificultada de diagnosticar enfermedades digestivas y cómo progresarán estas enfermedades. El costo de IBD e IBS es agravado por pérdida de productividad, ya que las personas que sufren de estos trastornos faltan al menos 8 días más al trabajo anualmente que el promedio nacional.
La enfermedad intestinal inflamatoria tiene muchos síntomas en común con el síndrome del intestino irritable, incluyendo dolor abdominal, diarrea crónica, pérdida de peso y calambres, haciendo un diagnóstico definitivo extremadamente difícil. De las cinco millones de personas que se sospecha sufren de IBD en los Estados Unidos, sólo un millón son diagnosticadas como teniendo IBD. La dificultada para diagnosticar diferencialmente IBD y determinar su resultado obstaculiza un tratamiento temprano y efectivo de estas enfermedades. De esta manera, existe una necesidad por métodos de prueba rápidos y sensibles para determinar IBD y sus subtipos.
Con el paso de los años, se ha hecho poco progreso en diagnosticar de manera precisa los subtipos clínicos de IBD. Así, existe una urgente necesidad por métodos mejorados para diagnosticar a un individuo con IBD, y para determinar el subtipo, tal como enfermedad de Crohn (CD) o colitis ulcerosa. Ya que 70% de los pacientes de CD finalmente requerirán de una operación quirúrgica gastrointestinal, la capacidad de diagnosticar a esos pacientes temprano en su estado de enfermedad para mitigar cirugía innecesaria en el futuro es importante. La presente invención satisface esas necesidades y proporciona ventajas relacionadas también.
Breve descripción de la Invención La presente invención proporciona métodos y sistemas para el diagnóstico de enfermedad intestinal inflamatoria (IBD) y/o la determinación de subtipos incluyendo colitis ulcerosa (UC) y enfermedad de Crohn (CD) o para clasificar la muestra como no concluyente (por ejemplo, muestra de IBD que no es conclusiva para CD y UC). Adecuadamente, con la presente invención, es posible diagnosticar pacientes con IBD, y si el paciente tiene IBD, diagnosticar ya sea UC o CD.
En ciertos aspectos, la presente invención proporciona un modelo de diagnóstico que comprende dos bosques aleatorios separados, uno para IBD vs. no IBD y el otro para UC vs. CD. En otra modalidad, la presente invención proporciona un modelo que comprende cuatro resultados de clase (no IBD, CD, UC, no concluyente). En aún otra modalidad, la presente invención proporciona un solo modelo que comprende un resultado de tres clases (no IBD, CD, UC).
En modalidades particulares, la presente invención proporciona métodos y sistemas para diagnosticar IBD o no IBD y/o para diferenciar entre subtipos clínicos de IBD tales como UC y CD o clasificar la muestra como no concluyente al analizar una muestra para determinar la presencia o ausencia de uno, dos, tres, cuatro o más alelos variantes (por ejemplo, polimorfismos de un solo nucleótido o SNPs) en los genes ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs3737240 y rs13294), NKX2-3 (por ejemplo, rs1 190140, rs10883365 y rs6584283) y/o STAT3 (por ejemplo, rs744166). En ciertos aspectos de estas modalidades, la presente invención puede incluir además analizar una muestra para determinar la presencia (o ausencia) o nivel de concentración de uno o más marcadores serológicos y de inflamación tales como, por ejemplo, ASCA-A, ASCA-G, anti-OmpC, anti-CBir1 , anti-Fla2, anti-FlaX, VEGF, CRP, SAA, ICAM, VCAM, ANCA (por ejemplo, por ELISA) y/o pANCA (por ejemplo, mediante uno o más ensayos de anticuerpos fluorescentes indirectos (IFA) para detectar un patrón perinuclear pANCA específico de IBD y/o sensibilidad a DNAsa de pANCA), pANCA2 para diagnosticar IBD o no IBD, y/o para diferenciar entre subtipos clínicos de IBD tales como IC, UC y CD o categorizar la muestra como no concluyente.
En una modalidad, la presente invención proporciona un método para diagnosticar enfermedad intestinal inflamatoria (IBD) y/o un subtipo clínico de la misma en un individuo, en donde el subtipo clínico es colitis ulcerosa (UC) o enfermedad de Crohn (CD) o no concluyente, el método comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serológico, un marcador genético, un marcador de inflamación y una combinación de los mismos en la muestra para obtener un perfil de marcador; (b) aplicar un primer análisis estadístico de bosque aleatorio al perfil de marcadores para obtener una decisión de si el perfil de marcadores es una muestra de IBD o una muestra no IBD; (c) aplicar opcionalmente un árbol de decisiones o conjunto de reglas a la muestra designada como una muestra de IBD para determinar si la muestra de IBD es una muestra no concluyente; y (d) aplicar opcionalmente un segundo análisis estadístico de bosque aleatorio a la muestra de IBD para determinar un subtipo clínico.
En ciertas modalidades, el ensayo de diagnóstico de IBD comprende un nodo inicial para determinar si una muestra es pANCA2 negativa como una primera etapa para dirigir especímenes individuales ya sea a un Método de Arbol de Decisiones o al Algoritmo de Bosques Aleatorios dependiendo de su valor pANCA2. En ciertos casos, muestras de pANCA2 ya sea con una determinación de pANCA negativa (0 o "no detectada") o débil (+1) se retiran y someten a una matriz de decisiones o conjunto de reglas para hacer una predicción clínica de IBD.
En otra modalidad, la presente invención proporciona el diagnóstico de enfermedad intestinal inflamatoria (IBD) y/o a un subtipo clínico de la misma en un individuo, en donde el subtipo clínico es colitis ulcerosa (UC) o enfermedad de Crohn (CD) o no concluyente, el método comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serológico, un marcador genético, un marcador de inflamación y una combinación de los mismos en la muestra para obtener un perfil de marcadores; (b) aplicar un primer análisis estadístico de bosque aleatorio al perfil de marcadores para obtener una decisión de si el perfil de marcadores es una muestra de IBD o una muestra de no IBD, (c) aplicar un árbol de decisiones o conjunto de reglas a la muestra designada como una muestra de IBD para determinar si la muestra de IBD es una muestra no concluyente; y (d) si la muestra no es no concluyente, pero es una muestra de IBD, aplicar un segundo análisis estadístico de bosque aleatorio a la muestra de IBD para determinar un subtipo clínico.
Estos y otros aspectos, objetivos y modalidades se volverán más aparentes cuando se lean con la siguiente descripción detallada y figuras.
Breve descripción de los dibujos La figura 1 ilustra un diagrama de flujo para una modalidad ejemplar de un ensayo de diagnóstico de IBD de la invención que comprende un algoritmo de bosque aleatorio de dos etapas.
La figura 2 ilustra un diagrama de flujo para otra modalidad ejemplar de un ensayo de diagnóstico de IBD de la invención que comprende un algoritmo de bosque aleatorio de dos etapas (vía derecha) y un árbol de decisiones pANCA separado (vía izquierda).
La figura 3 ilustra una modalidad ejemplar de un sistema de clasificación de enfermedad (DCS) de la presente invención.
La figura 4 ilustra el patrón de tinción pANCA por inmunofluorescencia seguido por tratamiento con DNAsa en neutrófilos fijos.
La figura 5 ilustra características de cohortes de entrenamiento y validación y el área bajo la curva ROC para el algoritmo sgi y para marcadores individuales.
La figura 6 ilustra una modalidad ejemplar de un modelo de regresión logística para predecir diagnóstico de IBD.
La figura 7A ilustra que el modelo de IBD es un buen sistema clasificador para predecir IBD. La figura 7B ilustra que el modelo de UC es un buen sistema clasificador para predecir UC.
La figura 8A ilustra una gráfica de dispersión de valores p predichos para un modelo logístico de IBD versus un modelo de bosque aleatorio de IBD creado en R. La figura 8B ilustra una gráfica dispersora de un modelo de bosque aleatorio de IBD creado en Matlab versus un modelo lógico de IBD.
La figura 9 ¡lustra una gráfica de densidad de valores p predichos para un modelo logístico de IBD y dos modelos de bosque aleatorio de IBD. La gráfica compara las similitudes de los modelos para predecir no IBD, CD y UC.
La figura 10A ¡lustra una gráfica dispersora de valores p predichos para un modelo logístico de UC y un modelo de bosque aleatorio de UC creado en R. La figura 10B ilustra una gráfica dispersora de valores p predichos para un modelo logístico de UC y un modelo de bosque aleatorio de UC creado en Matlab.
La figura 1 1 ilustra una gráfica de densidad de valores p predichos para un modelo lógico de UC y dos modelos de bosque aleatorio de UC. La gráfica compara las similitudes de los modelos para predecir no IBD, CD y UC.
La figura 12 ilustra una gráfica dispersora de modelado logístico versus modelado de bosque aleatorio para predecir IBD versus no IBD.
La figura 13 ilustra una gráfica dispersora de modelado logístico versus modelado de bosque aleatorio para predecir UC vs. CD.
La figura 14 ilustra una gráfica dispersora para dos modelos de IBD vs. no IBD por bosque aleatorio creados ya sea en R o Matlab.
La figura 15 ilustra una gráfica dispersora de dos modelos de UC vs. CD de bosque aleatorio creados ya sea en R o Matlab.
La figura 16 ilustra marcadores serológicos de la cohorte sgi de IBD.
La figura 17 ilustra marcadores inflamatorios de la cohorte sgi de IBD.
La figura 18 ilustra una modalidad en donde más pacientes de IBD que no IBD son positivos para dos o más marcadores genéticos.
La figura 19 ilustra una modalidad de una comparación entre sgi de IBD y serología 7 de IBD para diferenciar CD de UC.
La figura 20 ilustra una comparación del rendimiento de diagnóstico genera entre sgi de IBD y serología 7 de IBD para IBD vs. no IBD y CD vs. UC.
Descripción detallada de la invención I. Introducción La presente invención se basa, en parte, en el sorprendente descubrimiento de que la precisión de diagnosticar enfermedad intestinal inflamatoria (IBD) y subtipos de la misma puede mejorarse sustancialmente al detectar la presencia, nivel o genotipo de ciertos marcadores en una muestra biológica de un individuo. De eta manera, en una modalidad, la presente invención proporciona plataforma de diagnóstico a base de un panel serológico y/o genético de marcadores.
La presente invención proporciona métodos y sistemas para mejorar el diagnóstico de IBD y subgrupos de la misma tales como, por ejemplo, colitis indeterminada (IC), colitis ulcerosa (UC), enfermedad de Crohn (CD) e no concluyente para CD y UC ("no concluyente"). En algunos casos, los métodos descritos en la presente predicen en forma precisa IBD, una enfermedad que se sabe es muy difícil de diagnosticar y predecir su resultado. En otros casos, los métodos descritos aquí utilizan varios marcadores serológicos, de proteínas y/o genéticos, solos o en combinación con uno o más algoritmos u otros tipos de análisis estadísticos, para proporcionar a los médicos con conocimiento valioso de diagnóstico o pronóstico. En algunos casos, los métodos y sistemas de la presente invención proporcionan una indicación de la respuesta proyectada de un paciente a terapia biológica. En otros casos, los métodos y sistemas de la presente invención utilizan varios marcadores (por ejemplo, serológicos, proteínicos y/o genéticos) en conjunto con análisis estadístico (por ejemplo, análisis de cuartiles) para proporcionar valor de pronóstico al identificar pacientes con enfermedad complicada o un riesgo de desarrollar complicaciones de enfermedad (por ejemplo, estricturación interna o enfermedad de penetración interna) y/o la necesidad de intervención quirúrgica, ayudando también al mismo tiempo a evaluar el índice de progresión de la enfermedad. En ciertos casos, los métodos hacen posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos de IBD que incluye IC, UC y CD. Además, los métodos guían decisiones terapéuticas de pacientes con enfermedad avanzada. En otros casos, el uso de varios marcadores (por ejemplo, serológicos, proteínicos y/o genéticos) proporciona la capacidad de distinguir a respondedores de no respondedores y orienta a opciones de tratamiento iniciales (por ejemplo, si se prescribe o no un tratamiento agresivo), con el potencial de cambiar el patrón de la enfermedad.
La figura 1 ilustra un diagrama de flujo para una modalidad ejemplar de un ensayo de diagnóstico de IBD de la presente invención que comprende un algoritmo de bosque aleatorio de dos etapas. En ciertas modalidades, el ensayo de diagnóstico de IBD aplica las mediciones de 17 marcadores biológicos de inflamación sero-genéticos (sgi) (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, ant¡-A4-Fla2, pANCA, anti-OmpC, anti-Cbirl , ATG16L1 , CRP, SAA, ICAM, VCAM, ECM1 , STAT3, VEGF, NKX2-3, y combinaciones de los mismos) y calcula una puntuación con base en un primer modelo de bosque aleatorio para predecir IBD vs. no IBD (110). El primer modelo de bosque aleatorio determina si un paciente tiene IBD. Si la puntuación es menor que el límite de IBD vs. no IBD (por ejemplo, < 0.64), se predice que la forma es de un paciente que tiene IBD (125). De otro modo, la muestra se predice que es de un paciente que no tiene IBD (120). Los pacientes que se predijo tienen IBD proceden a la siguiente etapa del algoritmo, que es un árbol de decisiones o conjunto de reglas diseñado para descartar categorizar la muestra como no concluyente (130). Si una muestra coincide con el patrón para cualquiera de las reglas "indeterminadas", el algoritmo predice la muestra como teniendo IBD, pero es no concluyente para UC y CD (135). De otra manera, la muestra procede a la siguiente etapa del algoritmo (140), que es un segundo modelo de bosque aleatorio para predecir UC vs. CD (150). El ensayo de diagnóstico de IBD aplica las mediciones de 11 marcadores biológicos sgi (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-A4-Fla2, pANCA, anti-OmpC, anti-CBir1 , ECM1, STAT3, VEGF y combinaciones de los mismos) para calcular una puntuación modelo con base en el segundo modelo de bosque aleatorio para predecir UC vs. CD. Si la puntuación es menor que el límite de UC vs. CD (por ejemplo, 0.35), el algoritmo predice la muestra como teniendo CD (153). Si no, el algoritmo predice la muestra como teniendo UC (155).
La figura 2 ilustra un diagrama de flujo para otra modalidad ejemplar de un ensayo de diagnóstico de IBD de la invención que comprende un algoritmo de bosque aleatorio de dos etapas (vía derecha) y un árbol de decisiones pANCA separado (vía izquierda). En ciertas modalidades, el ensayo de diagnóstico de IBD comprende un nodo inicial (201) para determinar si una muestra en pANCA2 negativa como una primera etapa para dirigir especímenes individuales ya sea al Método de Arbol de Decisiones (205) o el Algoritmo de Bosque Aleatorio (210), dependiendo de su valor pANCA2. En ciertos casos, muestras de pANCA2 ya sea con una determinación de pANCA negativa (0 o "no detectada") o débil (+1) son retiradas de la cola del algoritmo sgi (vía derecha) y sujetas a una matriz de decisión o conjunto de reglas para hacer una predicción clínica de IBD (207). Un ejemplo de matriz de decisión para predecir IBD después del análisis de árbol de decisiones pANCA se describe en el ejemplo 9. De esta manera, en ciertos aspectos, el árbol de decisiones pANCA (205) puede ser implementado como una vía alternativa para hacer diagnósticos de IBD predictivos en especímenes clínicos con resultados de ensayo pANCA2 (-).
La figura 2 también ilustra una trayectoria ejemplar para analizar muestras positivas pANCA2 (vía derecha). En ciertas modalidades, muestras de pANCA2 con una determinación de pANCA positiva (+2, +3 o +4) se procesan usando un ensayo de diagnóstico de IBD y se someten a un algoritmo de bosque aleatorio de dos etapas análogo al algoritmo de bosque aleatorio de dos etapas descrito en la figura 1. En ciertos casos, el ensayo de diagnóstico de IBD aplica las mediciones de 17 marcadores biológicos de inflamación sero-genéticos (sgi) (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-A4-Fla2, pANCA, anti-OmpC, anti-CBir1 , ATG16L1 , CRP, SAA, ICAM, VCAM, ECM1 , STAT3, VEGF, NKX2-3, y combinaciones de los mismos) y calcula una puntuación con base en un primer modelo de bosque aleatorio para predecir IBD vs. no IBD (210). El primer modelo de bosque aleatorio determina si un paciente tiene IBD. Si la puntuación es menor que el límite de IBD vs. no IBD (por ejemplo, < 0.64), se predice que la muestra es de un paciente que tiene IBD (225). De otra manera, se predice que la muestra es de un paciente que no tiene IBD (220). Las muestras que se predice tienen IBD proceden a la siguiente etapa del algoritmo, que es un árbol de decisiones o un conjunto de reglas diseñado para descartar categorizar la muestra como no concluyeme (230). Si un a muestra coincide con el patrón para cada una de las reglas "indeterminadas", el algoritmo predice la muestra como teniendo IBD, pero es no concluyente para UC y CD (235). De otro modo, la muestra procede a la siguiente etapa del algoritmo (240), que es un segundo modelo de bosque aleatorio para predecir UC vs. CD (250). El ensayo de diagnóstico de IBD aplica las mediciones de 11 marcadores biológicos sgi (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-A4-Fla2, pANCA, anti-OmpC, anti-CBir1 , ECM1 , STAT3, VEGF, y combinaciones de los mismos) para calcular una puntuación modelo con base en el segundo modelo de bosque aleatorio para predecir UC vs. CD. Si la puntuación es menor que el límite UC vs. CD (por ejemplo, 0.35), el algoritmo predice la muestra como teniendo CD (253). Si no, el algoritmo predice la muestra como teniendo UC (255).
En ciertos casos, los métodos y sistemas de la presente invención comprenden una etapa que tiene una "transformación" o "máquina" asociada con la misma. Por ejemplo, se puede llevar a cabo una técnica de ELISA para medir la presencia o nivel de concentración de muchos de los marcadores descritos aquí. Un ELISA incluye transformación del marcador, por ejemplo, un auto-anticuerpo, en un complejo entre el marcador (por ejemplo, autoanticuerpo) y un agente de unión (por ejemplo, antígeno), que luego se puede medir con un anticuerpo secundario marcado. En muchos casos, el marcador es una enzima que transforma un substrato en un producto detectable. La medición del producto detectable puede llevarse a cabo usando un lector de placa tal como un espectrofotómetro. En otros casos, marcadores genéticos se determinan usando varias técnicas de amplificación tales como PCR. Las etapas de método que incluyen amplificación tales como PCR se traducen en la transformación de cadenas individuales o dobles de ácido nucleico en varias cadenas para detección. La detección puede incluir el uso de un fluoróforo, que se lleva a cabo usando una máquina tal como un fluorómetro.
En ciertas modalidades, los métodos comprenden además comparar los resultados del análisis estadístico (es decir, perfil de diagnóstico) con una referencia (es decir, modelo de diagnóstico) para ayudar en el diagnóstico de IBD. En modalidades particulares, los métodos utilizan varios marcadores serológicos, proteínicos y/o genéticos para proporcionar a los médicos conocimiento de diagnóstico valioso.
Adecuadamente, mediante el uso de un perfil de diagnóstico compuesto de varios marcadores (por ejemplo, serológicos, genéticos, inflamatorios, etc.) solos o en conjunto con análisis estadístico, los métodos y sistemas de ensayo de la presente invención proporcionan valor diagnóstico al identificar a pacientes que tengan IBD y subgrupos de IBD tales como IC, UC, CD y no concluyentes. En ciertos casos, la presente invención hace posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos de IBD incluyendo, pero no limitados a, IC, UC, CD e no concluyente.
II. Definiciones Según se usa en la presente, los siguientes términos tienen los significados adscritos a ellos a menos que se especifique lo contrario.
El término "clasificar" incluye "asociar" o "categorizar" una muestra o un individuo con un estado de enfermedad o pronóstico. En ciertos casos, "clasificar" se basa en evidencia estadística, evidencia empírica o ambas. En ciertas modalidades, los métodos y sistemas de clasificación usan un llamado conjunto de entrenamiento de muestras de individuos con estados o pronósticos de enfermedad conocidos. Una vez establecido, el conjunto de datos de entrenamiento sirve como una base, modelo o plantilla contra la cual se comparan las características de una muestra desconocida de un individuo, para poder clasificar el estado de enfermedad desconocido o proporcionar un pronóstico del estado de enfermedad en el individuo. En algunos casos, "clasificar" es equivalente a diagnosticar el estado de enfermedad y/o diferencia del estado de enfermedad de otro estado de enfermedad. En otros casos, "clasificar" es equivalente a proporcionar un pronóstico del estado de enfermedad en un individuo diagnosticado con el estado de enfermedad.
El término "enfermedad intestinal inflamatoria" o "IBD" incluye trastornos gastrointestinales tales como, por ejemplo, enfermedad de Crohn (CD), colitis ulcerosa (UC), colitis indeterminada (IC) e IBD que es no concluyente para CD vs. UC ("no concluyente"). Las enfermedades intestinales inflamatorias (por ejemplo, CD, UC, IC e no concluyente) se distinguen de todos los demás otros trastornos, síndromes y anormalidades del tracto gastroenterológico, incluyendo síndrome del intestino irritable (IBS). La patente de E.U.A. No. 7,873,479, titulada "Métodos para Diagnosticar Enfermedad Intestinal Inflamatoria" se incorpora en la presente por referencia en su totalidad para todos los propósitos.
El término "muestra" incluye cualquier espécimen biológico obtenido de un individuo. Las muestras adecuadas para usarse en la presente invención incluyen, sin limitación, sangre entera, plasma, suero, saliva, orina, heces, lágrimas, cualquier otro fluido corporal, muestras de tejido (por ejemplo, biopsia) y extractos celulares de las mismas (por ejemplo, extracto de glóbulos rojos). En una modalidad preferida, la muestra es una muestra de suero. El uso de muestras tales como suero, saliva y orina se conoce bien en la técnica (véase, por ejemplo, Hashida et al., J. Clin. Lab. Anal., 11 :267-86 (1997)). Un experto en la técnica apreciará que muestras tales como muestras de suero pueden ser diluidas antes del análisis de niveles de marcadores.
El término "marcador" incluye cualquier marcador bioquímico, marcador serológico, marcador genético u otras características clínicas o ecográficas que se puedan usar en el diagnóstico de IBD, en la predicción del probable curso y resultado de IBD y/o en la predicción de la probabilidad de recuperación de la enfermedad. Ejemplos no limitativos de estos marcadores incluyen marcadores serológicos tales como un anticuerpo anti-neutrófilos (por ejemplo, ANCA, pANCA y similares), un anticuerpo anti-Saccharomyces cerevisiae (por ejemplo, ASCA-lgA, ASCA-lgG), un anticuerpo antimicrobiano (por ejemplo, anticuerpo anti-OmpC, anticuerpo anti-12, anticuerpo anti-Fla2, anticuerpo anti-FlaX, anticuerpo anti-CBir1 ), una proteína de fase aguda (por ejemplo, CRP), una apolipoproteína (por ejemplo, SAA), una defensina (por ejemplo, defensina ß), un factor de crecimiento (por ejemplo, EGF, VEGF), una citosina (por ejemplo, TWEAK, IL-1 ß, IL-6), una caderina (por ejemplo, E-caderina), una molécula de adhesión celular (por ejemplo, ICAM-1 , VCAM-1); marcadores genéticos (por ejemplo, SNPs) tales como ATG16L1 , ECM1 , NKX2-3, STAT3 y NOD2/CARD15; y combinaciones de los mismos. Ejemplos no limitativos de marcadores genéticos incluyen alelos variantes en los genes GLI1 (por ejemplo, rs2228224 y/o rs2228226), MDR1 (por ejemplo, rs2032582), ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs751 1649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1190140, rs10883365, rs6584283), STAT3 (por ejemplo, rs744166) y NOD2 CARD 5 (por ejemplo, rs2066847, rs2066845, rs5743293). En algunas modalidades, los marcadores se utilizan en combinación con uno o más (por ejemplo, una pluralidad de) análisis estadísticos para ayudar o proporcionar un diagnóstico o pronóstico de IBD en un individuo. En ciertos casos, el diagnóstico puede ser IBD o un subtipo clínico de la misma tal como enfermedad de Crohn (CD), colitis ulcerosa (UC), colitis indeterminada (IC) o IBD no concluyente. En ciertos otros casos, el pronóstico puede ser la necesidad de cirugía (por ejemplo, la probabilidad o riesgo de requerir cirugía de intestino delgado), desarrollo en un subtipo clínico de CD o UC (por ejemplo, la probabilidad o riesgo de ser susceptible a un subtipo clínico particular de CD o UC tal como el subtipo de CD constrictivo, penetrante o inflamatorio), desarrollo de uno o más factores clínicos (por ejemplo, la probabilidad o riesgo de ser susceptible a un factor clínico particular), desarrollo de cáncer intestinal (por ejemplo, la probabilidad o riesgo de ser susceptible a cáncer intestinal), o recuperación de la enfermedad (por ejemplo, la probabilidad de remisión).
La presente invención se basa, en parte, en determinar la presencia (o ausencia) o nivel (por ejemplo, concentración) de al menos un marcador en una muestra obtenida de un individuo. Según se usa aquí, el término "detectar la presencia de al menos un marcador" incluye determinar la presencia de cada marcador de interés usando cualquier ensayo cuantitativo o cualitativo conocido por un experto en la técnica. En ciertos casos, los ensayos cualitativos que determinan la presencia o ausencia de un rasgo, variable, genotipo y/o sustancia bioquímica o serológica particular (por ejemplo, proteína o anticuerpo) son adecuados para detectar cada marcador de interés. En ciertos otros casos, los ensayos cuantitativos que determinan la presencia o ausencia de ADN, ARN, proteína, anticuerpo o actividad son adecuados para detectar cada marcador de interés. Según se usa aquí, el término "detectar el nivel de al menos un marcador" incluye determinar el nivel de cada marcador de interés usando cualquier ensayo cuantitativo directo o indirecto conocido por un experto en la técnica. En ciertos casos, los ensayos cuantitativos que determinan, por ejemplo, la cantidad relativa o absoluta de ADN, ARN, proteína, anticuerpo o actividad son adecuados para detectar el nivel de cada marcador de interés. Un experto en la técnica apreciará que cualquier ensayo útil para detectar el nivel de un marcador también es útil para detectar la presencia o ausencia del marcador.
El término "perfil de marcadores" incluye 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 30, 35, 40, 45, 50, o más marcadores de diagnóstico y/o pronóstico, en donde los marcadores pueden ser un marcador serológico, un marcador proteínico, un marcador genético y similares. En algunas modalidades, el perfil de marcadores junto con un análisis estadístico pueden proporcionar a los médicos y cuidadores valioso conocimiento de diagnóstico y pronóstico. En otras modalidades, el perfil de marcadores con opcionalmente un análisis estadístico proporciona una respuesta proyectada a terapia biológica. Mediante el uso de varios marcadores (por ejemplo, serológicos, proteínicos, genéticos, etc.) en conjunto con análisis estadísticos, los ensayos descritos aquí proporcionan valor de diagnóstico, pronóstico y terapéutico al identificar pacientes con IBD o un subtipo clínico de la misma, predecir el riesgo de desarrollar enfermedad complicada, ayudar a evaluar la velocidad de progresión de la enfermedad (por ejemplo, velocidad de progresión a enfermedad complicada o cirugía) y ayudar en la selección de terapia.
El término "perfil de diagnóstico" incluye 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 30, 35, 40, 45, 50, o más marcadores de un individuo, en donde los marcadores pueden ser un marcador serológico, un marcador proteínico, un marcador genético y similares. Un análisis estadístico transforma el perfil de marcadores en un perfil de diagnóstico. Un análisis estadístico que se prefiere es una puntuación de cuartiles y la puntuación de cuartiles para cada uno de los marcadores puede ser sumada para generar una puntuación de suma de cuartiles.
El término "modelo de diagnóstico" incluye modelos serológicos, modelos genéticos, modelos inflamatorios serogenéticos y una combinación de los mismos. En un aspecto preferido, un análisis retrospectivo se lleva a cabo en una cohorte de resultados de enfermedad conocidos con complicaciones conocidas y procedimientos quirúrgicos llevados a cabo. En un aspecto, se puede llevar a cabo un análisis de regresión (por ejemplo, regresión logística) sobre la presencia o nivel de concentración de uno o más marcadores serológicos y/o el genotipo de uno o más marcadores genéticos para desarrollar un modelo de diagnóstico. El modelo puede ser ilustrado o mostrado en, por ejemplo, una tabla de consulta, gráfica u otra presentación visual. Un perfil de diagnóstico de un individuo puede ser luego comparado con un modelo de diagnóstico y el diagnóstico ser determinado (por ejemplo, el riesgo o probabilidad de tener una enfermedad).
El término "individuo", "sujeto", o "paciente" incluye típicamente humanos, pero también incluye otros animales tales como, por ejemplo, otros primates, roedores, caninos, felinos, equinos, ovinos, porcinos y similares.
Según se usa en la presente, el término "sustancialmente la misma secuencia de aminoácidos" incluye una secuencia de aminoácidos que es similar, pero no idéntica a, la secuencia de aminoácidos de origen natural. Por ejemplo, una secuencia de aminoácidos, es decir, polipéptido, que tenga sustancialmente la misma secuencia de aminoácidos que una proteína 12 puede tener una o más modificaciones tales como adiciones, supresiones o sustituciones de aminoácidos con relación a la secuencia de aminoácidos de la proteína 12 de origen natural, siempre que el polipéptido modificado conserve sustancialmente al menos una actividad biológica de 12 tal como inmunorreactividad. La comparación para similitud sustancial entre secuencias de aminoácidos se lleva a cabo normalmente con secuencias de entre aproximadamente 6 y 100 residuos, de preferencia entre alrededor de 10 y 100 residuos, y muy preferiblemente entre alrededor de 25 y 35 residuos. Una modificación particularmente útil de un polipéptido de la presente invención, o un fragmento del mismo, es una modificación que confiere, por ejemplo, estabilidad incrementada. La incorporación de uno o más D- aminoácidos es una modificación útil para incrementar la estabilidad de un polipéptido o fragmento de polipéptido. De manera similar, la supresión o sustitución de residuos de lisina puede incrementar la estabilidad al proteger al polipéptido o fragmento de polipéptido contra degradación.
El término "factor clínico" incluye un síntoma en un individuo que está asociado con IBD. Ejemplos de factores clínicos incluyen, sin limitación, diarrea, dolor abdominal, calambres, fiebre, anemia, pérdida de peso, ansiedad, depresión y combinaciones de los mismos. En algunas modalidades, un diagnóstico o pronóstico de IBD se basa en una combinación de analizar una muestra obtenida de un individuo para determinar la presencia, nivel o genotipo de uno o más marcadores al aplicar uno o más análisis estadísticos y determinar si el individuo tiene uno o más factores clínicos.
El término "síntoma" o "síntomas" y variantes de los mismos incluye cualquier sensación, cambio o cambio percibido en función corporal que se experimente por un individuo y esté asociado con enfermedades particulares o que acompañe una enfermedad y se considere como una indicación de la enfermedad. La enfermedad para la cual los síntomas en el contexto de la presente invención puede ser asociada incluyen enfermedad intestinal inflamatoria (IBD), colitis ulcerosa (UC) o enfermedad de Crohn (CD).
En un aspecto preferido, los métodos de la invención se usan después de que un individuo ha sido diagnosticado con IBD. Sin embargo, en otros casos, los métodos pueden usarse para diagnosticar IBD o se pueden usar como una "segunda opinión" si, por ejemplo, se sospecha IBD o se ha diagnosticado previamente usando otros métodos. En aspectos preferidos, los métodos pueden usarse para diagnosticar UC o diferenciar entre UC y CD. El término "diagnosticar IBD" y variantes del mismo incluye el uso de los métodos y sistemas descritos aquí para determinar la presencia o ausencia de IBD. El término "diagnosticar UC" incluye el uso de los métodos y sistemas descritos en la presente para determinar la presencia o ausencia de UC, así como para diferenciar entre UC y CD. Los términos también pueden incluir evaluar el nivel de actividad de enfermedad en un individuo. En algunas modalidades, se usa un análisis estadístico para diagnosticar una forma leve, moderada, severa o fulminante de IBD o UC con base en los criterios desarrollados por Truelove et al., Br. Med. J., 12:1041 -1048 (1955). En otras modalidades, se usa un análisis estadístico para diagnosticar una forma leve a moderada, moderada a severa o severa a fulminante de IBD o UC con base en los criterios desarrollados por Hanauer er a/., Am. J. Gastroenterol., 92:559-566 (1997). Un experto en la técnica conocerá otros métodos para evaluar la severidad de IBD o UC en un individuo.
En ciertos casos, los métodos de la invención se usan para diagnosticar IBD, diagnosticar UC o diferenciar IC de UC y/o CD y diferenciar entre UC y CD o categorizar la muestra como no concluyente. Los métodos pueden usarse para monitorear la enfermedad, tanto progresión como regresión. El término "monitorear la progresión o regresión de IBD o UC" incluye el uso de los métodos y perfiles de marcadores para determinar el estado de enfermedad (por ejemplo, presencia o severidad de IBD o la presencia de UC) de un individuo. En ciertos casos, los resultados de un análisis estadístico se compara con aquellos resultados obtenidos del mismo individuo en un momento inicial. En algunos aspectos, los métodos de la presente invención también se pueden usar para predecir la progresión de IBD o UC, por ejemplo, al determinar una probabilidad de que IBD o UC progrese ya sea rápidamente o lentamente en un individuo con base en la presencia o nivel de por lo menos un marcador en una muestra. En otros aspectos, los métodos de la presente invención también se pueden usar para predecir la regresión de IBD o UC, por ejemplo, al determinar una probabilidad de que IBD o UC regrese ya sea rápidamente o lentamente en un individuo con base en la presencia o nivel de al menos un marcador en una muestra.
El término "gen" se refiere al segmento de ADN implicado en producir una cadena de polipéptidos; incluye regiones que preceden y siguen a la región de codificación, tales como la región promotora y 3' no traducida, respectivamente, así como secuencias de intervención (intrones) entre segmentos de codificación individuales (exones).
El término "genotipo" se refiere a la composición genética de un organismo, incluyendo, por ejemplo, si un organismo diploide es heterocigótico u homocigótico para uno o más alelos variantes de interés.
El término "polimorfismo" se refiere a la ocurrencia de dos o más secuencias o alelos alternativos genéticamente determinados en una población. Un "sitio polimórfico" se refiere al locus en el cual se presenta divergencia. Los sitios polimórficos preferidos tienen al menos dos alelos, cada uno presentándose a una frecuencia particular en una población. Un locus polimórfico puede ser tan pequeño como un par de bases (es decir, polimorfismo de un solo nucleótido o SNP). Los marcadores polimórficos incluyen polimorfismos de longitud de fragmentos de restricción, número variable de repeticiones en tándem (VNTRs), regiones hipervariables, minisatélites, repeticiones de dinucleótidos, repeticiones de trinucleótidos, repeticiones de tetranucleótidos, repeticiones de secuencia simple y elementos de inserción tales como Alu. El primer alelo identificado se designa arbitrariamente como el alelo de referencia, y otros alelos se designan como alelos alternativos, "alelos variantes" o "varianzas". El alelo que se presente más frecuentemente en una población seleccionada algunas veces es denominado el alelo "tipo silvestre". Los organismos diploides pueden ser homocigóticos o heterocigóticos para los alelos variantes. El alelo variante puede o no producir una característica física o bioquímica observable ("fenotipo") en un individuo que porte el alelo variante. Por ejemplo, un alelo variante puede alterar la actividad enzimática de una proteína codificada por un gen de interés.
El término "polimorfismo de un solo nucleótido (SNP)" y variantes del mismo se refiere a un cambio de un solo nucleótido con un polinucleótido, incluyendo dentro de un alelo. Esto puede incluir el reemplazo de un nucleótido por otro, así como la supresión o inserción de un solo nucleótido. Más típicamente, SNPs son marcadores bialélicos aunque marcadores tri- y tetra-alélicos pueden existir también. A manera de ejemplo no limitativo, una molécula de ácido nucleico que comprenda SNP A/C puede incluir una C o A en la posición polimórfica. Para combinaciones de SNPs, el término "haplotipo" es usado, por ejemplo, el genotipo de los SNPs en una sola hebra de ADN que esté ligada entre sí. En algunas modalidades, el término "haplotipo" puede usarse para describir una combinación de alelos de SNP, por ejemplo, los alelos de los SNPs encontrados juntos en una sola molécula de ADN. En modalidades adicionales, los SNPs en un haplotipo pueden estar en desequilibrio de enlace entre sí.
El término "específico" o "especificidad" y variantes del mismo, cuando se usan en el contexto de polinucleótidos capaces de detectar alelos variantes (por ejemplo, polinucleótidos que son capaces de discriminar entre alelos diferentes) incluye la capacidad de unirse o hibridar o detectar un alelo variante sin unirse o hibridar o detectar el otro alelo variante. En algunas modalidades, la especificidad puede referirse a la capacidad de un polinucleótido para detectar el alelo tipo silvestre y no el mutante o variante. En otras modalidades, la especificidad puede referirse a la capacidad de un polinucleótido para detectar el alelo mutante o variante y no el alelo tipo silvestre.
Según se usa aquí, el término "anticuerpo" incluye una población de moléculas de inmunoglobulina, las cuales pueden ser policlonales o monoclonales y de cualquier isotipo, o un fragmento inmunológicamente activo de una molécula de inmunoglobulina. Este fragmento inmunológicamente activo contiene las regiones variables de la cadena pesada y ligera, las cuales constituyen la porción de la molécula de anticuerpo que se una específicamente a un antígeno. Por ejemplo, un fragmento inmunológicamente activo de una molécula de inmunoglobulina conocida en la técnica como Fab, Fab' o F(ab')2 se incluye dentro del significado del término anticuerpo.
En análisis de cuartiles, hay tres números (valores) que dividen una gama de datos en cuatro partes iguales. El primer cuartil (también llamado el 'cuartil inferior') es el número debajo del cual descansa el 25 por ciento de los datos inferiores. El segundo cuartil (el 'medio') divide el intervalo en medio y tiene 50 por ciento de los datos debajo de éste. El tercer cuartil (también llamado el 'cuartil superior') tiene 75 por ciento de los datos debajo de éste y el 25 por ciento superior de los datos arriba de éste. Como un ejemplo no limitativo, el análisis de cuartiles puede aplicarse al nivel de concentración de un marcador tal como un anticuerpo u otro marcador de proteína descrito en la presente, de tal manera que un nivel de marcador en el primer cuartil (<25%) le sea asignado un valor de 1 , a un nivel de marcador en el segundo cuartil (25-50%) le sea asignado un valor de 2, a un nivel de marcador en el tercer cuartil (51% -< 75%) le sea asignado un valor de 3 y a un nivel de marcador en el cuarto cuartil (75% - 100%) le sea asignado un valor de 4.
Según se usa aquí, "puntuación de suma de cuartiles" o "QSS" incluye la suma de puntuaciones de cuartiles para todos los marcadores de interés. Como un ejemplo no limitativo, una puntuación de suma de cuartiles para un panel de 6 marcadores (por ejemplo, serológicos, proteínicos y/o genéticos) puede variar de 6-24, en donde cada uno de los marcadores individuales sea asignado a una puntuación de cuartil (Q) de 1-4 con base en la presencia o ausencia del marcador, el nivel de concentración del marcador o el genotipo del marcador.
III. Descripción de las modalidades En una modalidad, la presente invención proporciona un método para diagnosticar enfermedad intestinal inflamatoria (IBD) y/o un subtipo clínico de la misma en un individuo, el método comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serológico, un marcador genético, un marcador de inflamación, y una combinación de los mismos en la muestra para obtener un perfil de marcadores; (b) aplicar un primer algoritmo (por ejemplo, un bosque aleatorio o regresión logística) al perfil de marcadores para obtener una decisión de si el perfil de marcadores es una muestra de IBD o una muestra no IBD; (c) aplicar opcionalmente un árbol de decisiones o conjunto de reglas a la muestra designada como una muestra de IBD para determinar si la muestra de IBD es una muestra no concluyente; y (d) aplicar opcionalmente un segundo algoritmo (por ejemplo, un bosque aleatorio o regresión logística) a la muestra de IBD para determinar un subtipo clínico.
En una segunda modalidad, la presente invención proporciona el diagnóstico de enfermedad intestinal inflamatoria (IBD) y/o un subtipo clínico de la misma en un individuo, el método comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serológico, un marcador genético, un marcador de inflamación y una combinación de los mismos en la muestra para obtener un perfil de marcadores; (b) aplicar un primer algoritmo tal como un bosque aleatorio al perfil de marcadores para obtener una decisión de si el perfil de marcadores es una muestra de IBD o una muestra no IBD; (c) aplicar un árbol de decisiones o conjunto de reglas a la muestra designada como una muestra de IBD para determinar si la muestra de IBD es una muestra no concluyente; y (d) si la muestra no es no concluyente, pero una muestra de IBD, aplicar un segundo algoritmo tal como un bosque aleatorio a la muestra de IBD para determinar un subtipo clínico.
En ciertas modalidades, los métodos comprenden además comparar los resultados del análisis estadístico (es decir, perfil de diagnóstico) con una referencia (es decir, modelo de diagnóstico) para ayudar en el diagnóstico de IBD. En modalidades particulares, los métodos utilizan varios marcadores serológicos, proteínicos y/o genéticos para proporcionar a los métodos conocimiento de diagnóstico valioso.
En ciertas modalidades, los métodos y sistemas de la presente miden un primer marcador serológico de pANCA para determinar un valor de pANCA2. En ciertos aspectos, a pANCA se le asigna un valor de 0 cuando no se detecta o cuando es sensible a DNAsa citoplásmica. A pANCA se le asigna un valor de 1 cuando es DNAsa sensible 1 +P, DNAsa sensible 2+P, DNAsa sensible 3+P o DNAsa sensible 4+P, en donde 1+P a 4+P indican cantidades cada vez más altas e intensidad de marcador de fluorescencia con base en la evaluación visual. Por ejemplo, si los niveles de pANCA son +2, +3 o +4 en una muestra, entonces el valor pANCA2 es positivo.
En ciertos otros aspectos, a pANCA2 se le asigna un valor de 0 (negativo) cuando pANCA es detectado, pANCA es sensible a DNAsa citoplásmica, o DNAsa sensible 1 +P. A pANCA se le da un valor de 1 (positivo), cuando pANCA es sensible a DNAsa 2+P, sensible a DNAsa 3+P o sensible a DNAsa 4+P.
Como se explica en detalle aquí, cuando pANCA2 es negativo, los métodos y sistemas comprenden además: a) determinar si la muestra negativa para pANCA2 es directamente predictiva de enfermedad de Crohn al medir un panel de marcadores de suero, en donde el panel de marcadores en suero es un miembro del grupo que consiste en ASCA-lgA, ASCA-lgG y OmpC-lgA y comparar cada uno de los marcadores de suero del panel de marcadores de suero con un valor límite para determinar si la muestra coincide con la enfermedad de Crohn; o b) determinar si la muestra negativa para pANCA2 coincide con la enfermedad de Crohn al medir un panel de recuento de CD, en donde el panel de recuento de CD es un miembro del grupo que consiste en ASCA-lgA, ASCA-lgG, OmpC-lgA, CBir1-lgG, A4-Fla2-lgG y FlaX-lgG para formar un valor de recuento de CD, en donde cuando el valor de recuento de CD es mayor que o igual a 2, la muestra coincide con la enfermedad de Crohn; o c) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de cero coincide o no coincide con IBD al medir el ELISA ANCA y comparar el valor de ELISA ANCA con un valor de referencia y designar la muestra como siendo coincidente o no coincidente con IBD con base en el valor de ELISA ANCA; o d) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de cero coincide con IBD o es no concluyente de IBD al medir ELISA ANCA y comparar el valor de ELISA ANCA y considerar el valor de recuento de CD para determinar si la muestra coincide o no coincide con IBD o coincide con IBD y es no concluyente para enfermedad de Crohn o colitis ulcerosa; o e) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de uno coincide o no coincide con IBD al medir ELISA ANCA y comparar el valor de ELISA ANCA con un valor límite para determinar si la muestra coincide con IBD o es inconsistente con IBD.
En ciertos casos, si el valor para ASCA-lgA en la parte a arriba es mayor que o igual a 69 EU/mL, entonces la muestra es consistente con la enfermedad de Crohn.
En otros casos, si el valor de ASCA-lgG en la parte a arriba es mayor que o igual a 40 EU/mL, entonces la muestra es consistente con la enfermedad de Crohn.
En aún otros casos, si el valor para OmpC-lgA en parte a arriba es mayor que o igual a 60 EU/mL, entonces la muestra es consiste con la enfermedad de Crohn.
Además, los sistemas y métodos proporcionan la asignación de un valor de recuento de enfermedad de Crohn (CD). Por ejemplo, en la parte b arriba, el valor de recuento de CD se determina usando las siguientes reglas. i. si ASCA-lgA es mayor que o igual a 8.5 EU/mL (por arriba del intervalo de referencia de ASCA-lgA), entonces sumar +1 al valor de recuento de CD; ii. si ASCA-lgG es mayor que o igual a 17.8 EU/mL (por arriba del intervalo de referencia de ASCA-lgG), entonces sumar +1 al valor de recuento de CD; iü. si OmpC-lgA es mayor que o igual a 10.9 EU/mL (por arriba del intervalo de referencia de OmpC-lgA), entonces sumar +1 al valor de recuento de CD; iv. si dos o más marcadores de flagelina están por arriba de sus intervalos de referencia respectivos, entonces sumar +1 al valor de recuento de CD; v. si cualquier flagelina es mayor que o igual a 100 EU/mL, entonces sumar +1 al valor de recuento de CD; y si el valor de recuento de CD total es mayor que o igual a 2, designar entonces que la muestra es consistente con la enfermedad de Crohn.
En ciertos casos, el valor de referencia para CBir1 -lgG es mayor que o igual a 78.4 EU/mL.
En ciertos otros casos, el valor de referencia para A4-Fla2-lgG es mayor que o igual a 44.8 EU/mL.
En otros casos más, el valor de referencia para FlaX-lgG es mayor que o igual a 33.4 EU/mL.
En ciertos otros aspectos, los métodos y sistemas de la presente comprenden además que en la parte c arriba, si pANCA es cero (no detectado), entonces: i. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es menor que 20 EU/mL; o ii. designar la muestra como siendo consistente con colitis ulcerosa si ANCA ELISA es mayor que 27.4 EU/mL; o iü. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es mayor que o igual a 20 y menor que o igual a 27.4 EU/mL y el valor de recuento de CD es cero; o iv. designar la muestra como siendo consistente con IBD pero no concluyente para enfermedad de Crohn o colitis ulcerosa si ANCA ELISA es mayor que o igual a 20 y menor que o igual a 27.4 EU/mL y el valor de recuento de CD es uno.
En otros aspectos más, los métodos y sistemas de la presente comprenden además que cuando pANCA sea uno de: i. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es menor que 13.7 EU/mL; o i¡. designar que la muestra es consistente con colitis ulcerosa si ANCA ELISA es mayor que o igual a 13.7 EU/mL.
La presente invención proporciona métodos y sistemas para diagnóstico mejorado de enfermedad intestinal inflamatoria (IBD) y para diferenciar colitis ulcerosa (UC) y enfermedad de Crohn (CD). En ciertos casos, los métodos y sistemas hacen posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos de IBD en lugar de simplemente CD o UC. En ciertos casos, los métodos categorizan la muestra como siendo no concluyente. Al identificar pacientes con enfermedad complicada y ayudar a evaluar el tipo de enfermedad específico, los métodos y sistemas descritos aquí proporcionan información invaluable para evaluar la severidad de la enfermedad y opciones de tratamiento. En algunas modalidades, aplicar un análisis estadístico a un perfil de marcadores seroiógicos, proteínicos y/o genéticos mejora la precisión de predecir IBD, UC y CD, y también hace posible la selección de opciones de tratamiento adecuadas, incluyendo terapia, tal como biológica, convencional, cirugía o alguna combinación de las mismas.
La presente invención proporciona métodos y sistemas mejorados para el diagnóstico de colitis ulcerosa (UC) y para diferenciar entre UC y enfermedad de Crohn (CD). En ciertos casos, los métodos y sistemas hacen posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos IBD en lugar de simplemente como CD o UC. Al identificar pacientes con enfermedad complicada y ayudar a evaluar el tipo de enfermedad específico, los métodos y sistemas descritos aquí proporcionan información invaluable para evaluar la severidad de la enfermedad y opciones de tratamiento. En algunas modalidades, aplicar un análisis estadístico a un perfil de marcadores seroiógicos, proteínicos y/o genéticos mejora la precisión de predecir UC, y también hace posible la selección de opciones de tratamiento adecuadas, incluyendo terapia tal como biológica, convencional, cirugía o alguna combinación de las mismas.
La presente invención proporciona métodos y sistemas para diagnóstico mejorado de enfermedad de Crohn (CD) y para diferenciar entre UC y CD. En ciertos casos, los métodos y sistemas hacen posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos de IBD en lugar de simplemente como CD o UC. Al identificar pacientes con enfermedad complicada y ayudar a evaluar el tipo de enfermedad específico, los métodos y sistemas descritos aquí proporcionan información invaluable para evaluar la severidad de la enfermedad y opciones de tratamiento. En algunas modalidades, aplicar un análisis estadístico a un perfil de marcadores serológicos, proteínicos y/o genéticos mejora la precisión de predecir CD, y también hace posible la selección de opciones de tratamiento adecuadas, incluyendo terapia tal como biológica, convencional, cirugía o alguna combinación de las mismas.
La presente invención proporciona métodos y sistemas para diagnóstico mejorado de enfermedad intestinal inflamatoria (IBD) y para diferenciarla de no IBD. La presente invención también proporciona métodos y sistemas para diagnosticar enfermedad intestinal no inflamatoria (no IBD) y para diferenciarla de IBD. En ciertos casos, los métodos y sistemas hacen posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos de IBD en lugar de simplemente como CD o UC. Al identificar pacientes con enfermedad complicada y ayudar a evaluar el tipo de enfermedad específico, los métodos y sistemas descritos aquí proporcionan información invaluable para evaluar la severidad de la enfermedad y opciones de tratamiento. En algunas modalidades, aplicar un análisis estadístico a un perfil de marcadores serológicos, proteínicos y/o genéticos mejora la precisión de predecir IBD y no IBD, y también hace posible la selección de opciones de tratamiento adecuadas, incluyendo terapia tal como biológica, convencional, cirugía o alguna combinación de las mismas.
La presente invención proporciona métodos y sistemas para diagnóstico mejorado de no concluyente así como para diferenciarlo de UC y CD. En ciertos casos, los métodos y sistemas hacen posible la clasificación de la severidad de la enfermedad a lo largo de un continuo de subgrupos de IBD en lugar de simplemente como CD o UC. Al identificar pacientes con enfermedad complicada y ayudar a evaluar el tipo de enfermedad específico, los métodos y sistemas descritos aquí proporcionan información invaluable para evaluar la severidad de la enfermedad y opciones de tratamiento. En algunas modalidades, aplicar un análisis estadístico a un perfil de marcadores serológicos, proteínicos y/o genéticos mejora la precisión de predecir subtipos, y también hace posible la selección de opciones de tratamiento adecuadas, incluyendo terapia tal como biológica, convencional, cirugía o alguna combinación de las mismas.
En algunas modalidades, el método de la presente invención se lleva a cabo en un individuo con síntomas de UC. En modalidades adicionales, los síntomas de UC incluyen, pero no están limitados a, inflamación rectal, sangrado rectal, dolor rectal, diarrea, calambres abdominales, dolor abdominal, fatiga, pérdida de peso, fiebre, ruptura de colon y combinaciones de los mismos.
En algunas modalidades, el método de la presente invención implica el análisis de una muestra biológica seleccionada del grupo que consiste en sangre entera, tejido, saliva, células de cachete, pelo, fluido, plasma, suero, fluido cerebroespinal, frotis bucales, moco, orina, heces, espermatozoides, secreciones vaginales, linfa, fluido amniótico, líquido pleural, lágrimas y combinaciones de los mismos.
En algunos aspectos, la presente invención proporciona métodos y sistemas para diagnosticar IBD y para diferenciar entre subtipos de IBD tales como UC y CD. En modalidades particulares, los métodos y sistemas de la presente invención utilizan uno o una pluralidad de (por ejemplo), varios marcadores genéticos, solos o en combinación con uno o una pluralidad de marcadores serológicos y/o proteínicos, y solos o en combinación con uno o una pluralidad de algoritmos (por ejemplo, modelo de bosque aleatorio y árbol de decisiones o conjunto de reglas) u otros tipos de análisis estadístico (por ejemplo, análisis de cuartiles), para ayudar o asistir el identificar pacientes con IBD, CD y/o UC y proporcionar a los médicos conocimiento de diagnóstico valioso.
En algunas modalidades, el método para diagnosticar IBD comprende la detección del alelo variante NKX2-3 (rs1190140). En otras modalidades, el método para diagnosticar IBD emplea de preferencia la detección del alelo variante NKX2-3 (rs10883365). En otras modalidades más, el método para diagnosticar IBD emplea la detección del alelo variante NKX2-3 (rs6584283). En algunas modalidades preferidas, el método para diagnosticar IBD comprende la detección del alelo variante ATG16L1 (rs2241880). En modalidades adicionales, el método para diagnosticar IBD comprende la detección del alelo variante ATG16L1 (rs3828309). En algunas modalidades, el método para diagnosticar IBD emplea la detección del alelo variante ECM1 (rs7511649). En otras modalidades preferidas, el método para diagnosticar IBD comprende la detección del alelo variante ECM1 (rs373240). En otras modalidades más, el método para diagnosticar IBD comprende la detección del alelo variante ECM1 (rs13294). En algunas modalidades preferidas, el método para diagnosticar IBD comprende la detección del alelo variante STAT3 (rs744166).
En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante NKX-3 (rs1190140). En otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante NKX2-3 (rs10883365). En aún otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante NKX2-3 (rs6584283). En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante ATG16L1 (rs2241880). En modalidades adicionales, el método para diagnosticar UC comprende la detección del alelo variante ATG16L1 (rs3828309). En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante ECM1 (rs7511649). En otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante ECM1 (rs373240). En aún otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante ECM1 (rs13294). En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante STAT3 (rs744166).
En algunas modalidades, el método para diagnosticar CD comprende la detección del alelo variante NKX-3 (rs1 190140). En otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante NKX2-3 (rs10883365). En aún otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante NKX2-3 (rs6584283). En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante ATG16L1 (rs2241880). En modalidades adicionales, el método para diagnosticar UC comprende la detección del alelo variante ATG16L1 (rs3828309). En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante ECM1 (rs7511649). En otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante ECM1 (rs373240). En aún otras modalidades, el método para diagnosticar UC comprende la detección del alelo variante ECM1 (rs13294). En algunas modalidades, el método para diagnosticar UC comprende la detección del alelo variante STAT3 (rs744166).
En otras modalidades, el método para diagnosticar IBD comprende la detección de uno o más alelos variantes seleccionados del grupo que consiste en ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1 190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166).
En otras modalidades, el método para diagnosticar IC y/o categorizar una muestra como siendo no concluyente comprende la detección de uno o más alelos variantes seleccionados del grupo que consiste en ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166).
En otras modalidades, el método para diagnosticar UC comprende la detección de uno o más alelos variantes seleccionados del grupo que consiste en ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs751 1649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1 190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166).
En otras modalidades, el método para diagnosticar CD comprende la detección de uno o más alelos variantes seleccionados del grupo que consiste en ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs751 1649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166).
La presencia o ausencia de un alelo variante en un marcador genético puede ser determinado usando un ensayo descrito aquí. Los ensayos que pueden usarse para determinar el estado de alelos variantes incluyen, pero no están limitados a, ensayos de análisis electroforético, ensayos de análisis de polimorfismo de longitud de restricción, ensayos de análisis de secuencia, ensayos de análisis de hibridación, ensayos de análisis de PCR, hibridación específica de alelo, alargamiento/ligación específico de alelo de ligación de oligonucleótidos, amplificación específica de alelos, extensión de bases individuales, sonda de inversión molecular, corte invasivo, terminación selectivo, polimorfismo de longitud de restricción, secuenciación, polimorfismo de conformación de hebra individual (SSCP), polimorfismo de cadena de hebra individual, corte no coincidente, electroforesis en gel de gradiente de desnaturalización y combinaciones de los mismos. Estos ensayos han sido bien descritos y los métodos estándares se conocen en la técnica. Véase, por ejemplo, Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc. New York (1984-2008), capítulo 7 y Supplement 47; Theophilus et al., "PCR Mutation Detection Protocols," Humana Press, (2002); Innis et al., PCR Protocols, San Diego, Academic Press, Inc. (1990); Maniatis, et al., Molecular Cloning: A Laboratory Manual, Coid Spring Harbor Lab., Nueva York, (1982); Ausubel et al., Current Protocols in Genetics and Genomics, John Wiley & Sons, Inc. Nueva York (1984-2008); and Ausubel et al., Current Protocols in Human Genetics, John Wiley & Sons, Inc. Nueva York (1984-2008); todos incorporados en la presente por referencia en su totalidad para todos los propósitos.
En modalidades particulares, el método descrito en la presente mejora el diagnóstico de UC en comparación con métodos a base de ANCA y/o pANCA para diagnosticar UC.
En otras modalidades, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD comprende una etapa adicional de analizar la muestra biológica para la presencia o nivel de un marcador serológico, en donde la detección de la presencia o nivel del marcador serológico en conjunto con la presencia de uno o más alelos variantes mejora más el diagnóstico de IBD y/o subgrupos incluyendo UC y CD.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD comprende la detección de un marcador serológico seleccionado de un anticuerpo anti-neutrófilos, un anticuerpo anti- Saccharomyces cerevisiae, un anticuerpo antimicrobiano, una proteína de fase aguda, una apolipoproteína, una defensina, un factor de crecimiento, una citosina, una cadherina, una molécula de adhesión celular o cualquier combinación de los marcadores descritos en la presente.
En modalidades adicionales, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza un anticuerpo anti-neutrófilos que se selecciona de uno de ANCA y pANCA, o una combinación de ANCA y pANCA. En una modalidad, el anticuerpo anti-neutrófilos comprende un anticuerpo citoplásmico anti-neutrófilos (ANCA) tal como ANCA detectado por un inmunoensayo (por ejemplo, ELISA), un anticuerpo citoplásmico anti-neutrófilos perinuclear (pANCA) tal como pANCA detectado por un ensayo inmunohistoquímico (por ejemplo, IFA) o un ensayo inmunohistoquímico sensible a DNAsa, o una combinación de los mismos.
En modalidades adicionales más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza un anticuerpo anti- Saccharomyces cerevisiae que se selecciona del grupo que consiste en inmunoglobulina A ar\t\- Saccharomyces cerevisiae (ASCA-lgA), inmunoglobulina G anti- Saccharomyces cerevisiae (ASCA-lgG), y combinaciones de las mismas.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza un anticuerpo antimicrobiano que se selecciona del grupo que consiste en un anticuerpo anti-proteína C de membrana exterior (anti-OmpC), un anticuerpo anti-12, un anticuerpo anti-flagelina (por ejemplo, anticuerpo anti-CBi , anticuerpo anti-Fla2 (es decir, anti-A4-Fla2), y anticuerpos anti-FlaX), y una combinación de los mismos.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza una proteína de fase aguda tal como, pero no limitada a proteína C reactiva (CRP).
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza una apolipoproteína tal como, pero no limitada a amiloide A de suero (SAA).
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza una defensina que se selecciona del grupo que consiste en ß defensina (BD1), ß defensina-2 (BD2), o combinaciones de las mismas.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza un factor de crecimiento que se selecciona del grupo que consiste en factor de crecimiento epidérmico (EGF), factor de crecimiento endotelial vascular (VEGF), o combinación de los mismos.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza una citocina que se selecciona del grupo que consiste en inductor de apoptosis débil relacionado con TNF (TWEAK), IL-?ß, IL-6, o una combinación de los mismos.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza una cadherina tal como, pero no limitada a, E-cadherina.
En otras modalidades más, el método para diagnosticar IBD y/o subgrupos incluyendo UC y CD utiliza una molécula de adhesión celular seleccionada del grupo que consiste en molécula de adhesión intercelular 1 (ICAM-1 o ICAM), molécula de adhesión celular vascular 1 (VCAM-1 o VCAM), o combinación de los mismos.
En otras modalidades, el marcador serológico comprende o consiste en ANCA, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC (OmpC), anticuerpo anti-CBir-1 (CBi ), anticuerpo anti-Fla2 (Fla2 o A4-Fla2), anticuerpo anti-FlaX (FlaX), o una combinación de los mismos.
En otras modalidades, el marcador de inflamación comprende o consiste en VEGF, CRP, SAA, ICAM, VCAM, o una combinación de los mismos.
La presencia o nivel (concentración) del marcador serológico o el marcador de inflamación puede detectarse (por ejemplo, determinarse, medirse, analizarse, etc.) con un ensayo de hibridación, ensayo a base de amplificación, inmunoensayo, ensayo inmunohistoquímico o una combinación de los mismos. Ejemplos no limitativos de ensayos, técnicas y kits para detectar o determinar la presencia o nivel de uno o más marcadores serológicos en una muestra se describen en la presente. Ejemplos no limitativos de ensayos, técnicas y kits para detectar o determinar la presencia o nivel de uno o más marcadores de inflamación en una muestra se describen en la presente.
En modalidades particulares, los métodos y sistemas de la presente invención utilizan uno o una pluralidad de (por ejemplo, varios) marcadores genéticos, solos o en combinación con uno o una pluralidad de marcadores serológicos y/o de inflamación.
En un aspecto, la presente invención proporciona un método para diagnosticar colitis ulcerosa (UC) en un individuo diagnosticado con enfermedad intestinal inflamatoria (IBD) y/o que se sospeche tenga UC. En algunas modalidades, el método comprende: (i) analizar una muestra biológica obtenida del individuo para determinar la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos en una muestra biológica, en donde el gen es uno o más de ATG16L1 , ECM1 , STAT3 o NKX2-3, el marcador serológico es uno o más de ANCA, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBir-1 , anticuerpo anti-Fla2, anticuerpo FlaX, y el marcador de inflamación es uno o más de VEGF, CRP, SAA, ICAM-1 o VCAM-1 , en la muestra para obtener un perfil de marcadores; y (ii) aplicar un análisis estadístico al perfil de marcadores para obtener un perfil de diagnóstico para el individuo para ayudar en el diagnóstico de UC.
En otro aspecto, la presente invención proporciona un método para diagnosticar enfermedad de Crohn (CD) en un individuo diagnosticado con enfermedad intestinal inflamatoria (IBD) y/o sospechoso de tener CD. En algunas modalidades, el método comprende: (i) analizar una muestra biológica obtenida del individuo para determinar la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos en una muestra biológica, en donde el gen es uno o más de ATG16L1 , ECM1 , STAT3 o NKX2-3, el marcador serológico es uno o más de ANCA, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBir-1 , anticuerpo anti-Fla2, anticuerpo FlaX, y el marcador de inflamación es uno o más de VEGF, CRP, SAA, ICAM-1 o VCAM-1 , en la muestra para obtener un perfil de marcadores; y (ii) aplicar un análisis estadístico al marcador para obtener un perfil de diagnóstico para el individuo para ayudar en el diagnóstico de CD.
En otro aspecto, la presente invención proporciona un método para diagnosticar colitis no determinada (IC) en un individuo diagnosticado con enfermedad intestinal inflamatoria (IBD) y/o sospechoso de tener IC. En algunas modalidades, el método comprende: (i) analizar una muestra biológica obtenida del individuo para determinar la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos en una muestra biológica, en donde el gen es uno o más de ATG16L1 , ECM1 , STAT3 o NKX2-3, el marcador serológico es uno o más de ANCA, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBir-1 , anticuerpo anti-Fla2, anticuerpo FlaX, y el marcador de inflamación es uno o más de VEGF, CRP, SAA, ICAM-1 o VCAM-1 , en la muestra para obtener un perfil de marcadores; y (ii) aplicar un análisis estadístico al marcador para obtener un perfil de diagnóstico para el individuo para ayudar en el diagnóstico de IC.
En algunas modalidades, el método de la presente invención incluye una etapa adicional que comprende asociar el perfil de diagnóstico para el individuo con un modelo de diagnóstico para ayudar en el diagnóstico de UC, CD o IC.
En algunas modalidades, el método para diferenciar entre IBD y no IBD incluye la detección de la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos en una muestra biológica. En modalidades particulares, la detección de la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos es indicadora de IBD y no indicadora de no IBD.
En modalidades particulares, el método para diferenciar entre UC y CD implica la detección de la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos en una muestra biológica de un paciente que se determine tenga IBD. En algunas modalidades, la detección de la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos es indicadora de UC y no indicadora de CD. En otras modalidades, la detección de la presencia, ausencia o nivel de una pluralidad de marcadores de inflamación sero-genéticos es indicadora de CD y no indicadora de UC.
En otras modalidades, la presente invención proporciona métodos para detectar la asociación de al menos un marcador de inflamación sero-genético seleccionado del grupo que consiste en un marcador serológico tal como un anticuerpo anti-neutrófilos, un anticuerpo anti- Saccharomyces cerevisiae, un anticuerpo antimicrobiano, una proteína de fase aguda, una apolipoproteína, una defensina, un factor de crecimiento, una citocina, una cadherina; un marcador genético tal como variantes génicas de ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1 190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166); y cualquier combinación de los marcadores con la presencia de colitis ulcerosa (UC) en un grupo de individuos. En algunas modalidades específicas, el método comprende: (i) obtener muestras biológicas de un grupo de individuos diagnosticados con IBD y/o que se sospeche tengan UC; (ii) analizar las muestras biológicas para determinar la presencia, ausencia o nivel de al menos un marcador de inflamación sero-genético seleccionado del grupo que consiste en un marcador serológico tal como un anticuerpo anti-neutrófilos, un anticuerpo anti-Saccharomyces cerevisiae, un anticuerpo antimicrobiano, una proteína de fase aguda, una apolipoproteína, una defensina, un factor dé crecimiento, una citocina, una cadherina; un marcador genético tal como variantes génicas de ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166); y cualquier combinación de los mismos; y (iii) evaluar si uno o más de los marcadores serológicos muestra una distribución estadísticamente significativa que se incline hacia un grupo de individuos diagnosticados con IBD y/o sospechosos de tener UC, en donde la comparación es entre un grupo de individuos diagnosticados con IBD y/o sospechosos de tener UC y un grupo de individuos de control.
En otras modalidades más, la presente invención proporciona métodos para detectar la asociación de por lo menos un marcador de inflamación sergoenético seleccionado del grupo que consiste en un marcador serológico tal como un anticuerpo anti-neutrófilos, un anticuerpo anW-Saccharomyces cerevisiae, un anticuerpo antimicrobiano, una proteína de fase aguda, una apolipoproteína, una defensina, un factor de crecimiento, una citocina, una cadherina; un marcador genético tal como variantes génicas de ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1 190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166); y cualquier combinación de los marcadores con la presencia de enfermedad de Crohn (CD) en un grupo de individuos. En algunas modalidades específicas, el método comprende: (i) obtener muestras biológicas de un grupo de individuos diagnosticados con IBD y/o que se sospeche tengan CD; (ii) analizar las muestras biológicas para determinar la presencia, ausencia o nivel de al menos un marcador de inflamación sero-genético seleccionado del grupo que consiste en un marcador serológico tal como un anticuerpo anti-neutrófilos, un anticuerpo anti-Saccharomyces cerevisiae, un anticuerpo antimicrobiano, una proteína de fase aguda, una apolipoproteína, una defensina, un factor de crecimiento, una citocina, una cadherina; un marcador genético tal como variantes génicas de ATG16L1 (por ejemplo, rs2241880, rs3828309), ECM1 (por ejemplo, rs7511649, rs373240, rs13294), NKX2-3 (por ejemplo, rs1190140, rs10883365, rs6584283) y STAT3 (por ejemplo, rs744166); y cualquier combinación de los mismos; y (iii) evaluar si uno o más de los marcadores serológicos muestra una distribución estadísticamente significativa que se incline hacia un grupo de individuos diagnosticados con IBD y/o sospechosos de tener cd, en donde la comparación es entre un grupo de individuos diagnosticados con IBD y/o sospechosos de tener cd y un grupo de individuos de control.
En otras modalidades, el marcador genético es al menos uno de los genes mostrados en las tablas A-E (por ejemplo, tabla A, B, C, D y/o E). En algunas modalidades, el marcador genético es NKX2-3. En otras modalidades, el marcador genético es ATG16L1. En otras modalidades, el marcador genético es ECM1. En ciertas modalidades, el marcador genético es STAT3. El genotipo del marcador genético puede detectarse (por ejemplo, determinarse, analizarse, etc.) al genotipificar un individuo para la presencia o ausencia de uno o más alelos variantes tales como, por ejemplo, uno o más polimorfismos de un solo nucleótido (SNPs) en uno o más marcadores genéticos. En algunas modalidades, el SNP es al menos uno de los SNPs mostrados en las tablas B-E (por ejemplo, tabla B, C, D y/o E). Ejemplos no limitativos de técnicas para detectar o determinar el genotipo de uno o más marcadores genéticos en una muestra se describen en la presente. En ciertas modalidades, el marcador genético es ATG16L1 , ECM1 , NKX2-3 y/o STAT3. En ciertos casos, la presencia o ausencia de uno o más de ATG16L1 , ECM1 , NKX2-3 /o STAT3 SNPs se determina en combinación con la presencia o nivel de uno o más marcadores seleccionados del grupo que consiste en un anticuerpo anti-neutrófilos, un anticuerpo anti- Saccharomyces cerevisiae, un anticuerpo antimicrobiano, una proteína de fase aguda, una apolipoproteína, una defensina, un factor de crecimiento, una citocina, una cadherina, una molécula de adhesión celular y una combinación de los mismos. Ejemplos no limitativos incluyen ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBir-1 , anticuerpo anti-flagelina, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), CRP, SAA, ANCA, VEGF, ICAM, VCAM, o una combinación de los mismos.
En aspectos adicionales, puede construirse un panel para medir uno o más de los marcadores descritos en la presente y proporcionar información relevante relacionada con el enfoque de la invención para diagnosticar IBD y/o diferenciar UC y CD. Este panel puede construirse para detectar o determinar la presencia (o ausencia) o nivel de al menos 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15,1 6, 17, 18, 19, 20, 25, 30, 35, 40, o más marcadores individuales tales como marcadores genéticos, bioquímicos, serológicos, proteínicos, inflamatorios u otros descritos en la presente. Un perfil de marcadores de la presente invención comprende la medición de uno o más de los marcadores descritos aquí. El análisis de un solo marcador o subconjuntos de marcadores también se puede llevar a cabo por un experto en la técnica en varios entornos clínicos. Estos incluyen, pero no están limitados a, entornos de análisis ambulatorios, de cuidado urgente, cuidado crítico, cuidado intensivo, unidad de monitoreo, pacientes internos, pacientes externos, consultorio médico, clínica médica y salud.
En algunas modalidades, el análisis de marcadores podría llevarse a cabo en una variedad de formatos físicos. Por ejemplo, placas de microtitulación o automatización podrían usarse para facilitar el procesamiento de grandes números de muestras de prueba. Como alternativa, formatos de una sola muestra podrían desarrollarse para facilitar el tratamiento, diagnóstico y pronóstico de una forma puntual.
En ciertas modalidades, los métodos comprenden además comparar los resultados del análisis estadístico (es decir, perfil de diagnóstico) con una referencia (es decir, modelo de diagnóstico) para ayudar en el diagnóstico de IBD. En modalidades particulares, los métodos utilizan varios marcadores serológicos, proteínicos y/o genéticos para proporcionar a los médicos un valioso conocimiento de diagnóstico.
En los métodos de la presente invención, el perfil de marcadores puede determinarse al detectar la presencia, nivel o genotipo de al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19 ó 20 marcadores. En modalidades particulares, la muestra es suero, plasma, sangre entera y/o heces. En otras modalidades, el individuo es diagnosticado con enfermedad de Crohn (CD), colitis ulcerosa (UC) o no concluyente.
El análisis estadístico aplicado al perfil de marcadores puede comprender cualquiera de una variedad de métodos estadísticos, modelos y algoritmos descritos en la presente. En modalidades particulares, el análisis estadístico es un análisis de cuartiles. En algunos casos, el análisis de cuartiles convierte la presencia, nivel o genotipo de cada marcador en una puntuación de cuartiles. Como un ejemplo no limitativo, el diagnóstico de IBD puede hacerse con base en una puntuación de suma de cuartiles (QSS) para el individuo que se obtenga al sumar la puntuación de cuartiles para cada uno de los marcadores. En otras modalidades, el análisis estadístico comprende uno o más sistemas clasificadores estadísticos de aprendizaje como los descritos en la presente. En modalidades particulares, el análisis estadístico comprende una combinación de al menos dos sistemas clasificadores estadísticos de aprendizaje. Un ejemplo no limitativo de esta combinación incluye un árbol de decisiones/clasificaciones (por ejemplo, un árbol de clasificación y regresión (C&RT), un bosque aleatorio, etc.) y una red neural, por ejemplo, aplicada en tándem. En ciertos casos, los métodos comprenden aplicar un primer análisis estadístico (por ejemplo, un árbol de decisión/clasificación o un bosque aleatorio) a la presencia, nivel o genotipo determinado para cada uno de los marcadores para generar una predicción o valor de probabilidad, y luego aplicar un segundo análisis estadístico (por ejemplo, un árbol de decisión/clasificación o un bosque aleatorio) a la predicción o valor de probabilidad y la presencia, nivel o genotipo determinado para cada uno de los marcadores para ayudar en el diagnóstico de IBD (por ejemplo, al clasificar la muestra como una muestra de IBD o muestra no IBD) y/o diferenciar UC y CD. En ciertas modalidades, se aplica un primer bosque aleatorio a un perfil de marcadores, seguido por un árbol de decisión o conjunto de reglas, seguido por otro bosque aleatorio más.
En otras modalidades, el perfil de diagnóstico es una puntuación de suma de cuartiles (QSS) para el individuo y el QSS se compara con un modelo de diagnóstico (por ejemplo, un modelo serológico, un modelo inflamatorio sero-genético, escala de riesgos estandarizada, etc.). En ciertas modalidades, se predice que el individuo tiene una probabilidad más alta de enfermedad cuando la QSS es mayor que 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15,1 6, 17, 18, 19, 20, 21 , 22, 23, 24, etc. (por ejemplo, de preferencia mayor que 10).
En ciertas modalidades, el modelo de diagnóstico se establece usando una cohorte retrospectiva con resultados conocidos de un subtipo clínico de IBD (por ejemplo, CD o UC). En modalidades preferidas, el modelo de diagnóstico se selecciona del grupo que consiste en un modelo serológico, un modelo inflamatorio sero-genético, un modelo genético y una combinación de los mismos. En una modalidad particular, el modelo serológico se deriva al aplicar análisis de regresión logística a la presencia o nivel de uno o más marcadores serológicos determinados en la cohorte retrospectiva. En otra modalidad particular, el modelo inflamatorio sero-genético se deriva al aplicar análisis de regresión logística a la presencia o nivel de uno o más marcadores serológicos y el genotipo de uno o más marcadores genéticos determinados en la cohorte retrospectiva. En otras modalidades, el modelo inflamatorio sero-genético se deriva al aplicar un modelo de bosque aleatorio a la presencia o nivel de uno o más marcadores serológicos y el genotipo de uno o más marcadores genéticos determinado en la cohorte retrospectiva.
En modalidades particulares, los métodos descritos en la presente proporcionan una predicción de diagnóstico de UC o CD a una velocidad de (al menos) aproximadamente 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100% (o cualquier intervalo en los mismos) con base en un perfil de diagnóstico del individuo, por ejemplo, la QSS del individuo, opcionalmente en combinación con la presencia o ausencia de uno o más alelos variantes en uno o más marcadores genéticos, por ejemplo, ATG16L1 , STAT3, ECM1 y/o NKX2-3, y el nivel de uno o más marcadores serológicos, por ejemplo, ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBir, anticuerpo anti-flagelina, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), CRP, SAA, ANCA, VEGF, ICAM, VCAM, o una combinación de los mismos.
En ciertas modalidades, el nivel de referencia (concentración) corresponde a un nivel (concentración) de uno de los marcadores en una muestra de un individuo que no tiene CD (por ejemplo, individuo sano, individuo no CD, individuo no IBD, individuo UC, etc.). En ciertas otras modalidades, el genotipo de referencia corresponde a un genotipo tipo silvestre (por ejemplo, alelo no variante o SNP) de uno de los marcadores genéticos.
En modalidades particulares, los métodos descritos en la presente proporcionan una predicción de enfermedad a una tasa de (al menos) aproximadamente 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81 %, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100% (o cualquier intervalo en los mismos) con base en el perfil de diagnóstico de un individuo, tal como, por ejemplo, la QSS de un individuo, opcionalmente en combinación con la presencia o ausencia de uno o más alelos variantes en uno o más marcadores genéticos, por ejemplo, ATG16L1 , STAT3, ECM1 y/o NKX2-3, y el nivel de uno o más marcadores serológicos, por ejemplo, ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBir, anticuerpo anti-flagelina, pANCA (por ejemplo, pANCA IFA y/o pANCA IFA sensible a DNAsa), CRP, SAA, ANCA, VEGF, ICAM, VCAM, o una combinación de los mismos.
En ciertas modalidades, el nivel de referencia (concentración) corresponde a un nivel (concentración) de uno de los marcadores en una muestra de un individuo que no tiene IBD (por ejemplo, individuo sano, individuo no IBD, individuo no CD, individuo no UC, etc.). En ciertas otras modalidades, el genotipo de referencia corresponde a un genotipo tipo silvestre (por ejemplo, alelo no variante o SNP) de uno de los marcadores genéticos.
En modalidades particulares, los métodos descritos en la presente proporcionan una probabilidad de IBD (o un subtipo clínico de la misma) de (al menos) aproximadamente 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 100% (o cualquier intervalo en los mismos) con base en los niveles de marcadores de un individuo y/o genotipos.
En ciertas modalidades, los métodos comprenden además comparar los resultados del análisis estadístico (es decir, perfil de diagnóstico) con una referencia (es decir, modelo de diagnóstico) para ayudar en el diagnóstico de IBD. En algunos casos, el modelo de diagnóstico comprende una presentación visual, impresión y/o reporte tal como una tabla de consulta o gráfica. En otros casos, el perfil de diagnóstico es una puntuación de suma de cuartiles (QSS) para el individuo y la QSS se compara con un modelo de diagnóstico. En algunas modalidades, se predice que el individuo tiene una probabilidad más alta de tener IBD cuando la QSS es mayor que 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, etc.
En ciertas modalidades preferidas, el algoritmo de diagnóstico de IBD de la presente invención usa mediciones de 17 marcadores biológicos inflamatorios sero-genéticos (por ejemplo, ANCA, ASCA-A, ASCA-G, pANCA, FlaX, SAA, Fla2, ICAM, OmpC, CBirl , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 y VEGF) para calcular una puntuación modelo con base en el primer modelo de bosque aleatorio para predecir IBD vs. no IBD (110). El primer modelo aleatorio determina si la muestra de un paciente es una muestra IBD o una no IBD. Si la puntuación es menor que el límite de IBD vs. no IBD (por ejemplo, < 0.64), se predice que la muestra es de un paciente que tiene IBD, es decir, una muestra IBD (125). De otro modo, se predice que la muestra es de un paciente que tiene no IBD (120). Las muestras que se predice tienen IBD, proceden a la siguiente etapa del algoritmo, que es un árbol de decisión o conjunto de reglas diseñado para descartar colitis indeterminada (IC) o descartar categorizar la muestra como no concluyente (130). Si una muestra coincide con el patrón para cualquiera de las reglas IC, el algoritmo predice que la muestra de IBD es IC o categoriza la muestra como no concluyente (135). De otro modo, la muestra procede a la siguiente etapa del algoritmo (140), que es un segundo modelo de bosque aleatorio para predecir UC o CD (150). El algoritmo de diagnóstico de la presente invención usa mediciones de 11 marcadores biológicos inflamatorios sero-genéticos (por ejemplo, ANCA, ASCA-A, ASCA-G, FlaX, Fla2, pANCA, OmpC, CBirl , ECM1 , STAT3, VEGF y combinaciones de los mismos) para calcular una puntuación modelo con base en el segundo modelo de bosque aleatorio para predecir UC o CD. Si la puntuación es menor que el límite UC vs. CD (por ejemplo, 0.35), el algoritmo predice la muestra como teniendo CD (153). Si la puntuación es mayor que el límite, el algoritmo predice la muestra como teniendo UC (155).
En ciertas modalidades, una regla IC o regla no concluyente puede ser ANCA > Q3, pANCA2 positiva, y cualquier anticuerpo anti-Cbir1 o anticuerpo anti-Fla2 o anticuerpo anti-FlaX > Q3. En otras modalidades, una regla IC puede ser pANCA2 positiva, y cualquiera dos de los marcadores de anticuerpo anti-flagelina (por ejemplo, anticuerpo anti-Cbir1 o anticuerpo anti-Fla2 o anticuerpo anti-FlaX) > Q3. En ciertos aspectos, la regla IC también es una regla no concluyente.
Un experto en la técnica conocería que los métodos de la presente invención comprenden usar 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16 ó 17 marcadores de inflamación sero-genéticos para una prueba de diagnóstico de IBD, en donde la prueba de diagnóstico comprende un algoritmo de diagnóstico, en donde el algoritmo se desarrolla a partir de un conjunto de muestra (por ejemplo, conjunto de entrenamiento) que comprende 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16 ó 17 marcadores inflamatorios sero-genéticos. Ejemplos no limitativos de marcadores sero-genéticos incluyen, por ejemplo, ANCA, ASCA-A, ASCA-G, pANCA, FlaX, SAA, Fla2, ICAM, OmpC, CBirl , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , VEGF y combinaciones de los mismos.
En algunas modalidades, el modelo de diagnóstico comprende una presentación visual, impresión y/o reporte tal como una tabla de consulta o gráfica. En modalidades particulares, la tabla de consulta o gráfica proporciona una probabilidad acumulativa de que el individuo tenga o no tenga IBD. En ciertas otras modalidades, la tabla de consulta o gráfica proporciona una probabilidad acumulativa de que el individuo tenga o no tenga IBD. En ciertas otras modalidades, la tabla de consulta o gráfica proporciona una probabilidad acumulativa de que el individuo tenga o no tenga IC. En otras modalidades, la tabla de consulta o gráfica proporciona una probabilidad acumulativa de que el individuo tenga o no tenga CD. La tabla de consulta o gráfica también pueden proporcionar una probabilidad acumulativa de que el individuo tenga o no tenga UC.
IV. Subtipos clínicos de IBD La enfermedad intestinal inflamatoria (IBD) es un grupo de condiciones inflamatorias del intestino grueso e intestino delgado. Las principales formas de IBD son enfermedad de Crohn (CD) y colitis ulcerosa (UC). Otras formas menos comunes de IBD incluyen, por ejemplo, colitis indeterminada (IC), colitis colagenosa, colitis linfocítica, colitis isquémica, colitis de diversión, síndrome de Behcet, colitis infecciosa y similares. IBD Que es no concluyeme para CD y UC también se incluye en la presente como una forma de IBD.
A. Enfermedad de Crohn La enfermedad de Crohn (CD) es una enfermedad de inflamación crónica que puede incluir cualquier parte del tracto gastrointestinal. Comúnmente, la porción distal del intestino delgado, es decir, el íleon, y el ciego son afectadas. En otros casos, la enfermedad se confina al intestino delgado, colon o región anorrectal. CD Ocasionalmente incluye el duodeno y estómago, y más raramente el esófago y cavidad oral.
Las manifestaciones clínicas variables de CD son, en parte, un resultado de la ubicación anatómica variable de la enfermedad. Los síntomas más frecuentes de CD son dolor abdominal, diarrea y fiebre recurrente. CD Está comúnmente asociada con obstrucción intestinal o fístula, un pasaje anormal entre las asas enfermas del intestino. CD También incluye complicaciones tales como inflamación del ojo, articulaciones y piel, enfermedad hepática, piedras renales y amiloidosis. Además, CD está asociada con un riesgo incrementado de cáncer intestinal.
Varias funciones son características de la patología de CD. La inflamación asociada con CD, conocida como inflamación transmural incluye todas las capas de la pared intestinal. Engrosamiento y edema, por ejemplo, típicamente también se presentan a lo largo de la pared intestinal, con fibrosis presente en las formas de larga duración de la enfermedad. La característica de inflamación de CD es discontinua ya que los segmentos de tejido inflamado, conocidos como "lesión de salto", son separados por intestino aparentemente normal. Además, ulceraciones lineales, edema e inflamación del tejido interventor llevan a una apariencia "empedrada" de la mucosa intestinal, que es distintiva de CD.
Una característica de CD es la presencia de agregaciones discretas de células inflamatorias, conocidas como granulomas, que se encuentran generalmente en la submucosa. Algunos casos de CD presentan granulomas discretos típicos, mientras que otros muestran una reacción granulomatosa difusa o una inflamación transmural no específica. Como resultado, la presencia de granulomas discretos es indicadora de CD, aunque la ausencia de granulomas también es consistente con la enfermedad. Así, la inflamación transmural o discontinua, en lugar de la presencia de granulomas, es un indicador de diagnóstico preferido de CD (Rubin y Farber, Pathology (segunda edición), Philadelphia, J.B. Lippincott Company ( 994)).
La enfermedad de Crohn puede categorizarse por el comportamiento de la enfermedad mientras progresa. Esto se formalizó en la clasificación de Viena de la enfermedad de Crohn. Véase, Gasche et al., Inflamm. Bowel Dis., 6:8-15 (2000). Hay tres categorías de presentación de enfermedad en la enfermedad de Crohn: (1) constrictiva, (2) penetrante y (3) inflamatoria. La enfermedad constrictiva causa angostamiento del intestino que puede llevar a obstrucción intestinal o cambios en el calibre de las heces. La enfermedad penetrante crea conductos de paso anormales (fístulas) entre el intestino y otras constricciones tales como la piel. La enfermedad inflamatoria (también conocida como enfermedad no constrictiva, no penetrante) causa inflamación sin causar constricciones o fístulas.
De esta manera, la enfermedad de Crohn representa un número de subtipos de enfermedad heterogéneos que afectan el tracto gastrointestinal y pueden producir síntomas similares. Según se usa en la presente con referencia a CD, el término "subtipo clínico" incluye una clasificación de CD definida por un conjunto de criterios clínicos que distinguen una clasificación de CD de otra. Como ejemplos no limitativos, los sujetos con CD pueden ser clasificados como teniendo enfermedad constrictiva (por ejemplo, constricción interna), penetrante (por ejemplo, penetración interna) o inflamatoria como se describe en la presente, o estos sujetos pueden como alternativa o además clasificarse como teniendo enfermedad fibrostenótica, enfermedad del intestino delgado, enfermedad de perforación interna, enfermedad de fistulización perianal, enfermedad tipo UC, la necesidad de cirugía de intestino delgado, la ausencia de características de UC, o combinaciones de las mismas.
En ciertos casos, los sujetos con CD pueden clasificarse como teniendo CD complicada, la cual es un subtipo clínico caracterizado por fenotipos constrictivos o penetrantes. En ciertos otros casos, los sujetos con CD pueden ser clasificados como teniendo una forma de CD caracterizada por una o más de las siguientes complicaciones: fibrostenosis, enfermedad perforante interna y la necesidad de cirugía de intestino delgado. En casos adicionales, los sujetos con CD pueden clasificarse como teniendo una forma agresiva de enfermedad fibrostenótica requiriendo cirugía del intestino delgado. Los criterios relacionados con estos subtipos han sido descritos, por ejemplo, en Gasche et al., Inflamm. Bowel Dis., 6:8-15 (2000); Abreu et al., Gastroenterology, 123:679-688 (2002); Vasiliauskas et al., Gut, 47:487-496 (2000); Vasiliauskas et al., Gastroenterology, 110:1810-1819 (1996); y Greenstein er a/., Gut, 29:588-592 (1988).
El "subtipo fibrostenótico" de CD es una clasificación de CD caracterizada por una o más características aceptadas de enfermedad fibroestenosante. Estas características de enfermedad fibroestenosante incluyen, pero no están limitadas a, obstrucción intestinal persistente documentada o una resección intestinal para una obstrucción intestinal. El subtipo fibrostenótico de CD puede estar acompañado por otros síntomas tales como perforaciones, abscesos o fístulas, y además puede caracterizarse por síntomas persistentes de bloqueo intestinal tales como náusea, vómito, distensión abdominal e incapacidad para comer alimentos sólidos. Rayos X intestinales de pacientes con subtipo fibrostenótico de CD pueden mostrar, por ejemplo, distensión del intestino antes del punto de bloqueo.
La necesidad de cirugía de intestino delgado en un sujeto con el subtipo fibrostenótico de CD puede indicar una forma más agresiva de este subtipo. Subtipos adicionales de CD también se conocen en la técnica y pueden identificarse usando criterios clínicos definidos. Por ejemplo, la enfermedad perforante interna es un subtipo clínico de CD definido por evidencia actual o previa de fístulas entero-entéricas o entero-vesiculares, abscesos intra-abdom ¡nales o perforación del intestino delgado. La enfermedad perforante perianal es un subtipo clínico de CD definido por evidencia previa o actual ya sea de fístulas perianales o abscesos o fístulas rectovaginales. El subtipo clínico tipo UC de CD puede definirse por evidencia actual o previa de implicación colónica del lado izquierdo, síntomas de sangrado o urgencia y abscesos de cripta en biopsias colónicas. La ubicación de la enfermedad puede clasificarse con base en uno o más estudios endoscópicos, radiológicos o patológicos.
Un experto en la técnica entiende que puede existir superposición entre subtipos clínicos de CD y que un sujeto que tenga CD puede tener más de un subtipo clínico de CD. Por ejemplo, un sujeto que tenga CD puede tener el subtipo fibrostenótico de CD y también puede cumplir criterios clínicos para un subtipo clínico caracterizado por la necesidad de cirugía de intestino delgado o el subtipo de enfermedad de perforación interna. Similarmente, los marcadores descritos aquí pueden asociarse con más de un subtipo clínico de CD.
B. Colitis ulcerosa La colitis ulcerosa (UC) es una enfermedad del intestino grueso caracterizada por diarrea crónica con calambres, dolor abdominal, sangrado rectal, descargas flojas de sangre, pus y moco. Las manifestaciones de UC varían ampliamente. Un patrón de exacerbaciones y revisiones tipifica el curso clínico para aproximadamente 70% de los pacientes de UC, aunque los síntomas continuos sin remisión están presentes en algunos pacientes con UC. Las complicaciones locales y sistémicas de UC incluyen artritis, inflamación ocular tal como uveítis, úlceras de piel y enfermedad hepática. Además, UC y especialmente la forma extensa y de larga duración de la enfermedad está asociada con un riesgo incrementado de carcinoma de colon.
UC es una enfermedad difusa que normalmente se extiende desde la parte más distal del recto por una distancia variable proximalmente. El término "colitis del lado izquierdo" describe una inflamación que incluye la porción distal del colon, extendiéndose tan lejos como la flexión esplénica. La reducción del recto o la implicación del lado derecho (porción proximal) del colon sola es inusual en UC. El proceso inflamatorio de UC está limitado al colon y no incluye, por ejemplo, el intestino delgado, estómago o esófago. Además, UC se distingue por una inflamación superficial de la mucosa que generalmente reduce las capas más profundas de la pared intestinal. Abscesos tipo cripta, en los cuales criptas intestinales degeneradas son llenadas con neutrófilos, también son típicos de UC (Rubín y Farber, citado arriba).
En ciertos casos, con respecto a UC, la variabilidad de síntomas reflejan diferencias en el grado de enfermedad (es decir, la cantidad de colon y recto que están inflamadas) y la intensidad de la inflamación. La enfermedad inicia en el recto y se mueve "hacia arriba" al colon para incluir más del órgano. UC puede categorizarse por la cantidad de colon implicada. Típicamente, los pacientes con inflamación confinada al recto y un segmento corto del colon adyacente al recto tienen síntomas más leves y un mejor pronóstico que los pacientes con una inflamación más difundida del colon.
En comparación con CD, que es una enfermedad tipo irregular con frecuente reducción del recto, UC se caracteriza por una inflamación continua del colon que normalmente es más severa distalmente que proximalmente.
La inflamación en UC es superficial toda vez que normalmente está limitada a la capa mucosa y se caracteriza por una infiltración inflamatoria aguda con neutrófilos y abscesos de cripta. En contraste, CD afecta el espesor completo de la pared intestinal con granulomas comúnmente, aunque no siempre, presentes. La enfermedad que termina en la válvula íleocecal, o en el colon distal a ésta, es indicadora de UC, aunque la implicación del íleon terminal, una apariencia tipo empedrado, úlceras discretas o fístulas sugieren CD.
Los diferentes tipos de colitis ulcerosa se clasifican de acuerdo con la ubicación y el grado de inflamación. Según se usa en la presente en referencia a UC, el término "subtipo clínico" incluye una clasificación de UC definida por un conjunto de criterios clínicos que distinguen una clasificación UC de otra. Como ejemplos no limitativos, los sujetos con UC pueden ser clasificados como teniendo proctitis ulcerosa, proctosigmoiditis, colitis del lado izquierdo, pancolitis, colitis fulminante y combinaciones de los mismos. Los criterios relacionados con estos subtipos han sido descritos, por ejemplo, en Kornbluth et al., Am. J. Gastroenterol., 99:1371-85 (2004).
La proctitis ulcerosa es un subtipo clínico de UC definido por inflamación que se limita al recto. La proctosigmoiditis es un subtipo clínico de UC que afecta al recto y el colon sigmoide. La colitis del lado izquierdo es un subtipo clínico de UC que afecta el lado izquierdo completo del colon, desde el recto hasta el lugar en donde el colon se flexiona cerca del bazo y empieza a correr a través del abdomen superior (la flexión esplénica). La pancolitis es un subtipo clínico de UC que afecta el colon completo. La colitis fulminante es una forma rara pero severa de pancolitis. Los pacientes con colitis fulminante son extremadamente enfermos con deshidratación, dolor abdominal severo, diarrea protraída con sangrado e incluso choque.
En algunas modalidades, la clasificación de un subtipo clínico de UC es importante para planear un curso de tratamiento efectivo, aunque la proctitis ulcerosa, proctosigmoiditis y colitis del lado izquierdo pueden tratarse con agentes locales introducidos a través del ano, incluyendo enemas y espumas a base de esferoides y otros, la pancolitis debe tratarse con medicamento oral de tal manera que ingredientes activos puedan alcanzar todas las porciones afectadas del colon.
Un experto en la técnica entiende que puede existir superposición entre subtipos clínicos de UC y que un sujeto que tenga UC puede tener más de un subtipo clínico de UC. Similarmente, los marcadores pronósticos descritos en la presente pueden ser asociados con más de un subtipo clínico de UC.
C. Colitis indeterminada La colitis indeterminada (IC) es un subtipo clínico de IBD que incluye ambas características de CD y UC. Tal superposición en los síntomas de ambas enfermedades puede presentarse temporalmente (por ejemplo, en las etapas iniciales de la enfermedad) o persistentemente (por ejemplo, a lo largo de la progresión de la enfermedad) en pacientes con IC. Clínicamente, IC se caracteriza por dolor abdominal y diarrea con o sin sangrado rectal. Por ejemplo, colitis con ulceraciones múltiples intermitentes separadas por mucosa normal se encuentra en pacientes con la enfermedad. Histológicamente, existe un patrón de ulceración severa con inflamación transmural. El recto está típicamente libre de la enfermedad y las células inflamatorias linfoides no muestran agregación. Aunque fisuras tipo hendidura profundas se observan con focos de miocitolisis, la mucosa interventora es típicamente congestionada en forma mínima con la preservación de células de copa y en pacientes con IC. En ciertos aspectos, el conjunto de reglas o árbol de decisiones o conjunto de reglas categoriza la muestra como no concluyente o IC.
V. Marcadores de IBD Una variedad de marcadores de IBD, incluyendo marcadores bioquímicos, marcadores serológicos, marcadores proteínicos, marcadores genéticos y otras características clínicas o ecográficas, son adecuados para usarse en los métodos de la presente invención para diagnosticar o predecir IBD, o para ayudar o mejorar el diagnóstico o predicción de IBD. Véase, por ejemplo, publicación de E.U.A. No. 20110045476 y solicitud de PCT No. PCT/US201 1/039174, cuyas descripciones se incorporan en la presente por referencia en su totalidad para todos los propósitos. En ciertos aspectos, los métodos de diagnóstico descritos en la presente utilizan la aplicación de un algoritmo (por ejemplo, análisis estadístico) para la presencia, nivel de concentración o genotipo determinado para uno o más de los marcadores de IBD para ayudar o asistir en el diagnóstico o predicción de IBD.
Ejemplos no limitativos de marcadores de IBD incluyen: (i) marcadores bioquímicos, serológicos y proteínicos tales como, por ejemplo, citocinas, factores de crecimiento, anticuerpos anti-neutrófilos, anticuerpos anti- Saccharomyces cerevisiae, anticuerpos antimicrobianos, proteínas de fase aguda, apolipoproteínas, defensinas, cadherinas, moléculas de adhesión celular y combinaciones de los mismos; (ii) marcadores genéticos tales como, por ejemplo, cualquiera o una combinación de los genes mostrados en las tablas A-E; y (iii) una combinación de marcadores serológicos y genéticos.
A. Citocinas La determinación de la presencia o nivel de al menos una citocina en una muestra puede ser útil en la presente invención. Según se usa aquí, el término "citocina" incluye cualquiera de una variedad de polipéptidos o proteínas secretados por células inmunes que regulan una gama de funciones del sistema inmunológico y abarcan citocinas pequeñas tales como quimiocinas. El término "citocina" también incluye adipocitocinas, las cuales comprenden un grupo de citocinas secretadas por adipocitos que funciona, por ejemplo, en la regulación del peso corporal, hematopoyesis, angiogénesis, sanación de heridas, resistencia a insulina, la respuesta inmune y la respuesta inflamatoria.
En ciertos aspectos, se determina en una muestra la presencia o nivel de al menos una citocina incluyendo, pero no limitada a, TNF-cc, inductor débil relacionado con TNF de apoptosis (TWEAK), osteoprotegerina (OPG), IFN-a, IFN-ß, IFN-?, IL-1a, IL-1 p, antagonista del receptor de IL-1 (IL-1 ra), IL-2, IL-4, IL-5, IL-6, receptor de IL-6 soluble (sIL-6R), IL-7, IL-8, IL-9, IL-10, IL-12, IL-13, IL-15, IL-17, IL-23, y IL-27. En ciertos otros aspectos, se determina en una muestra la presencia o nivel de por lo menos una quimiocina, tal como, por ejemplo, CXCL1/GR01/GROa, CXCL2/GR02, CXCL3/GR03, CXCL4/PF-4, CXCL5/ENA-78, CXCL6/GCP-2, CXCL7/NAP-2, CXCL9/MIG, CXCL10/IP-10, CXCL11/I-TAC, CXCL12/SDF-1 , CXCL13/BCA-1 , CXCL14/BRAK, CXCL15, CXCL16, CXCL17/DMC, CCL1 , CCL2/MCP-1 , CCL3/MIP-1a, < ?4/???-1 ß, CCL5/RANTES, CCL6/C10, CCL7/MCP-3, CCL8/MCP-2, CCL9/CCL10, CCL11/Eotaxina, CCL12/MCP-5, CCL13/MCP-4, CCL14/HCC-1 , CCL15/MIP-5, CCL16/LEC, CCL17 TARC, CCL18/MIP-4, CCL19/MIP-3 , CCL20/MIP-3a, CCL21/SLC, CCL22/MDC, CCL23/MPIF1 , CCL24/Eotaxina-2, CCL25 TECK, CCL26/Eotaxina-3, CCL27/CTACK, CCL28/MEC, CL1 , CL2, y CX3CL1. En ciertos aspectos adicionales, se determina en una muestra la presencia o nivel de al menos una adipocitocina incluyendo, pero no limitada a, leptina, adiponectina, resistina, inhibidor de activador de plasminógeno activo total-1 (PAI-1), visfatina y proteína de unión a retinol 4 (RBP4).
En ciertos casos, la presencia o nivel de una citocina particular se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de una citocina particular se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA) o un ensayo inmunohistoquímico. Los kits de ELISA adecuados para determinar la presencia o nivel de una citocina en una muestra tal como una muestra de suero, plasma, saliva u orina están disponibles de, por ejemplo, R&D Systems, Inc. (Minneapolis, MN), Neogen Corp. (Lexington, KY), Alpco Diagnostics (Salem, NH), Assay Designs, Inc. (Ann Arbor, MI), BD Biosciences Pharmingen (San Diego, CA), Invitrogen (Camarillo, CA), Calbiochem (San Diego, CA), CHEMICON International, Inc. (Temecula, CA), Antigenix America Inc. (Huntington Station, NY), QIAGEN Inc. (Valencia, CA), Bio-Rad Laboratories, Inc. (Hercules, CA), y/o Bender MedSystems Inc. (Burlingame, CA).
B. Factores de crecimiento La determinación de la presencia o nivel de uno o más factores de crecimiento en una muestra puede ser útil en la presente invención. Según se usa aquí, el término "factor de crecimiento" incluye cualquiera de una variedad de péptidos, polipéptidos o proteínas que son capaces de estimular proliferación celular y/o diferenciación celular.
En ciertos aspectos, se determina en una muestra la presencia o nivel de al menos un factor de crecimiento, incluyendo, pero no limitado a, factor de crecimiento epidérmico (EGF), factor de crecimiento epidérmico de unión a heparina (HB-EGF), factor de crecimiento endotelial vascular (VEGF), factor derivado de epitelio de pigmento (PEDF; conocido también como SERPINF1 ), anfirregulina (AREG; conocida también como factor de crecimiento derivado de schwannoma (SDGF)), factor de crecimiento de fibroblastos básicos (bFGF), factor de crecimiento de hepatocitos (HGF), factor de crecimiento por transformación a (TGF-a), factor de crecimiento por transformación-ß (TGF-ß), proteínas morfogenéticas de hueso (por ejemplo, BMP1-BMP15), factor de crecimiento derivado de plaquetas (PDGF), factor de crecimiento de nervio (NGF), factor de crecimiento de nervio ß (ß-NGF), factores neurotróficos (por ejemplo, factor neurotrófico derivado del cerebro (BDNF), neurotrofina 3 (NT3), neurotrofina 4 (NT4), etc.), factor de diferenciación de crecimiento 9 (GDF-9), factor estimulador de colonia de granulocitos (G-CSF), factor estimulador de colonia de granulocitos-macrófagos (GM-CSF), miostatina (GDF-8), eritropoyetina (EPO) y trombopoyetina (TPO). De preferencia, se determina la presencia o nivel de VEGF.
VEGF es codificado por el gen de factor de crecimiento endotelial vascular (VEGF; Entrez GeneID: 7422) y se produce después de el empalme diferencial del transcripto (véase, por ejemplo, Genbank No. de registro: NM_001025366.2 (isoforma a), NM_003376.5 (isoforma b), NM_001025367.2 (isoforma c), NM_001025368.2 (isoforma d), NM_001025369.2 (isoforma e), NM_001025370.2 (isoforma f), NM_001033756.2 (isoforma g), NM_001171622.1 (isoforma h), NM_001 171623.1 (isoforma i), NM_001171624.1 (isoforma j), NM_001171625.1 (isoforma k), NM_001171626.1 (isoforma I), NM_001171627.1 (isoforma m), NM_001171628.1 (isoforma n), NM_001171629.1 (isoforma o), NM_001171630.1 (isoforma p), NM_001204384.1 (isoforma q), and NM_001204385.1 (isoforma r)), y procesamiento de la isoforma de empalme de polipéptidos precursores (Genbank No. de registro NP_001020537.2 (isoforma a), NP_003367.4 (isoforma b), NP_001020538.2 (isoforma c), NP_001020539.2 (isoforma d), NP_001020540.2 (isoforma e), NP_001020541.2 (isoforma f), NP_001028928.1 (isoforma g), 001 165093.1 (isoforma h), NP_001165094.1 (isoforma i), NP_001165095.1 (isoforma j), NP_001165096.1 (isoforma k), NPJ301165097.1 (isoforma I), NP_001165098.1 (isoforma m), NP_001165099.1 (isoforma n), NP_001165100.1 (isoforma o), NP_001165101.1 (isoforma p), NP_001 191313.1 (isoforma q), y NPJ30191314.1 (isoforma r)).
En ciertos casos, la presencia o nivel de un factor de crecimiento particular se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de un factor de crecimiento particular se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA) o un ensayo inmunohistoquímico. Los kits de ELISA adecuados para determinar la presencia o nivel de un factor de crecimiento en una muestra tal como una muestra de suero, plasma, saliva u orina están disponibles de, por ejemplo, Antigenix America Inc. (Huntington Station, NY), Promega (Madison, Wl), R&D Systems, Inc. (Minneapolis, MN), Invitrogen (Camarillo, CA), CHEMICON International, Inc. (Temecula, CA), Neogen Corp. (Lexington, KY), PeproTech (Rocky Hill, NJ), Alpco Diagnostics (Salem, NH), Pierce Biotechnology, Inc. (Rockford, IL), y/o Abazyme (Needham, MA).
C. Anticuerpos anti-neutrófilos La determinación de los niveles de ANCA y/o la presencia o ausencia de pANCA en una muestra puede ser útil en la presente invención. Según se usa aquí, el término "anticuerpo citoplásmico anti-neutrófilo" o "ANCA" incluye anticuerpos dirigidos a componentes citoplásmicos y/o nucleares de neutrófilos. La actividad ANCA puede dividirse en varias categorías amplias con base en el patrón de tinción ANCA en neutrófilos: (1) tinción de neutrófilos citoplásmicos sin resalte perinuclear (cANCA); (2) tinción perinuclear alrededor del borde exterior del núcleo (pANCA); (3) tinción perinuclear alrededor del borde interior del núcleo (NSNA) y (4) tinción difusa con moteado a través del neutrófilo completo (SAPPA). En ciertos casos, la tinción de pANCA es sensible al tratamiento con DNasa. El término ANCA abarca todas las variedades de reactividad anti-neutrófilos, incluyendo, pero no limitada a, cANCA, pANCA, NSNA y SAPPA. Similarmente, el término ANCA abarca todos los isotipos de inmunoglobulina incluyendo, sin limitación, inmunoglobulina A y G. De preferencia, la presencia o nivel de IgG de ANCA es determinada. En modalidades particulares, tanto la presencia como la ausencia de un patrón de tinción pANCA perinuclear y la presencia o ausencia de tinción pANCA que es sensible a tratamiento con DNasa son detectadas, por ejemplo, usando ensayos de anticuerpos fluorescentes indirectos (IFA) separados.
Los niveles de ANCA en una muestra de un individuo pueden ser determinados, por ejemplo, usando un inmunoensayo tal como un ensayo inmunoabsorbente ligado a enzimas (ELISA) con neutrófilos fijos en alcohol. La presencia o ausencia de una categoría particular de ANCA tal como pANCA puede ser determinada, por ejemplo, usando un ensayo inmunohistoquímico tal como un ensayo de anticuerpos fluorescentes indirectos (IFA). En ciertas modalidades, la presencia o ausencia de pANCA en una muestra se determina usando un ensayo de inmunofluorescencia con neutrófilos fijos y tratados con DNasa. Además de neutrófilos fijos, anticuerpos dirigidos contra anticuerpos humanos pueden ser usados para detección. Antígenos específicos para ANCA también son adecuados para determinar los niveles de ANCA, incluyendo, sin limitación, extractos de neutrófilos no purificados o parcialmente purificados, proteínas purificadas, fragmentos de proteínas o péptidos sintéticos tales como histona Hl o fragmentos reactivos con ANCA de la misma (véase, por ejemplo, patente de E.U.A. No. 6,074,835), antígenos tipo histona H1 , antígenos de porina, antígenos bacteroides, o fragmentos reactivos con ANCA de los mismos (véase, por ejemplo, patente de E.U.A. No. 6,033,864); antígenos de vesícula secretora o fragmentos reactivos con ANCA de los mismos (véase, por ejemplo, solicitud de patente de E.U.A. No. 08/804,106); y anticuerpos idiotípicos anti-ANCA. Un experto en la técnica apreciará que el uso de antígenos adicionales específicos para ANCA está dentro del alcance de la presente invención.
En ciertas modalidades, el biomarcador pANCA es una variable binaria en lugar de numérica toda vez que su valor es ya sea positivo o negativo. En algunas modalidades, un estado positivo a pANCA está asociado con una tasa más baja y/o riesgo de complicaciones (por ejemplo, enfermedad de estricturación interna, enfermedad de penetración interna y/o cirugía. En algunos casos, la puntuación por cuartiles de pANCA es invertida, de tal manera que un estado positivo se califique como "1" y un estado negativo se califique como "4".
D. Anticuerpos attti-Saccharomyces cerevisiae La determinación de la presencia o nivel de ASCA (por ejemplo, ASCA-lgA, ASCA-lgG, ASCA-lgM, etc.) en una muestra también puede ser útil en la presente invención. El término "inmunoglobulina A ant\-Saccharomyces cerevisiae?' o "ASCA-lgA" incluye anticuerpos del isotipo A de inmunoglobulina que reaccionan específicamente con S. cerevisiae. Similarmente, el término "inmunoglobulina G ant -Saccharomyces cerevisiaé' o "ASCA-lgG" incluye anticuerpos del isotipo G de inmunoglobulina que reaccionan específicamente con S. cerevisiae.
La determinación de si una muestra es positiva para ASCA-lgA o ASCA-lgG se hace usando un anticuerpo específico para secuencias de anticuerpos humanos o un anticuerpo específico para ASCA. Este antígeno puede ser cualquier antígeno o mezcla de antígenos que se una específicamente por ASCA-lgA y/o ASCA-lgG. Aunque los anticuerpos ASCA fueron inicialmente caracterizados por su capacidad para unirse a S. cerevisiae, aquellos de capacidad en la técnica entenderán que un antígeno que se una específicamente por ASCA puede ser obtenido de S. cerevisiae o de una variedad de otras fuentes siempre y cuando el antígeno sea capaz de unirse específicamente a anticuerpos ASCA. En consecuencia, ejemplos de fuentes de un antígeno específico para ASCA, que se pueden usar para determinar los niveles de ASCA-lgA y/o ASCA-lgG en una muestra, incluyen, sin limitación, células de levadura asesinadas enteras tales como células de Saccharomyces o Candida; mañano de pared celular de levadura tal como fosfopeptidomanano (PPM); oligosacáridos tales como oligomanósidos; neoglicolípidos; anticuerpos idiotípicos anti-ASCA; y similares. Diferentes especies y cepas de levadura, tales como S. cerevisiae cepa Su1 , Su2, CBS 1315 o BM 156, o Candida albicans cepa VW32, son adecuadas para usarse como un antígeno específico para ASCA-lgA y/o ASCA-lgG. Antígenos purificados y sintéticos específicos para ASCA también son adecuados para usarse en determinar los niveles de ASCA-lgA y/o ASCA-lgG en una muestra. Ejemplos de antígenos purificados incluyen, sin limitación, antígenos de oligosacáridos purificados tales como oligomanósidos. Ejemplos de antígenos sintéticos incluyen, sin limitación, oligomanósidos sintéticos tales como aquellos descritos en la patente de E.U.A. No. de publicación 2003010500, por ejemplo, D-Man ß(1 -2) D-Man ß(1 -2) D-Man ß(1-2) D-Man-OR, D-Man a(1-2) D-Man a(1 -2) D-Man a(1 -2) D-Man-OR, y D-Man a(1-3) D-Man a(1 -2) D-Man a(1 -2) D-Man-OR, en donde R es un átomo de hidrógeno, un alquilo de Ci a C20 o un grupo conector marcado opcionalmente.
Preparaciones de mananos de pared celular de levadura, por ejemplo, PPM, pueden usarse para determinar los niveles de ASCA-lgA y/o ASCA-lgG en una muestra. Estos antígenos de superficie hidrosolubles pueden prepararse mediante cualquier técnica de extracción adecuada conocida en la técnica incluyendo, por ejemplo, por autoclave, o se pueden obtener comercialmente (véase, por ejemplo, Lindberg et al., Gut, 33:909-913 (1992)). La fracción estable en ácido de PPM también es útil en los algoritmos estadísticos de la presente invención (Sendid er a/., Clin. Diag. Lab. Immunol., 3:219-226 (1996)). Un ejemplo de PPM que es útil para determinar los niveles de ASCA en una muestra se derivan de S. uvarum cepa ATCC # 38926.
Antígenos de oligosacáridos purificados tales como oligomanósidos también pueden ser útiles para determinar los niveles de ASCA-lgA y/o ASCA-lgG en una muestra. Los antígenos de oligomanósido purificados se convierten de preferencia en neoglicolípidos como se describe en, por ejemplo, Faille et al., Eur. J. Microbio!. Infect. Dis., 11 :438-446 (1992). Un experto en la técnica entiende que la reactividad de este antígeno de oligomanósido con ASCA puede optimizarse al variar la longitud de la cadena de manosilo (Frosh et al., Proc. Nati. Acad. Sci. E.U.A., 82:1194-1198 (1985)), la configuración anomérica (Fukazawa et al., In "Immunology of Fungal Disease," E. Kurstak (ed.), Marcel Dekker Inc., Nueva York, páginas 37-62 (1989); Nishikawa et al., Microbio!. Immunol., 34:825-840 (1990); Poulain et al., Eur. J. Clin. Microbiol., 23:46-52 (1993); Shibata er a/., Arch. Biochem. Biophys., 243:338-348 (1985); Trinel et al., Infect. Immun., 60:3845-3851 (1992)); o la posición del enlace (Kikuchi et al., Planta, 190:525-535 (1993)).
Oligomanósidos adecuados para usarse en los métodos de la presente invención incluyen, sin limitación, un oligomanósido que tiene la manotetraosa Man(1 -3) Man(1 -2) Man(1 -2) Man. Este oligomanósido puede purificarse de PPM como se describe en, por ejemplo, Faille et al., citado arriba. Un ejemplo de neoglicolípido específico para ASCA puede construirse al liberar el oligomanósido de su PPM respectiva y posteriormente acoplar el oligomanósido liberado a 4-hexadecilanilina o similares.
E. Anticuerpos anti-microbianos La determinación de la presencia o nivel de un anticuerpo anti-OmpC en una muestra puede ser útil en la presente invención. Según se usa aquí, el término "anticuerpo anti-proteína C de membrana exterior" o "anticuerpo anti-OmpC" incluye anticuerpos dirigidos a una porina de membrana exterior bacteriana como los descritos en, por ejemplo, patente de E.U.A. No. 7,138,237 y publicación de patente de PCT No. WO 01/89361. El término "proteína C de membrana exterior" o "OmpC" se refiere a una porina bacteriana que es inmunorreactiva con un anticuerpo anti-OmpC. El término anticuerpo anti-OmpC abarca todos los isotipos de inmunoglobulina incluyendo, sin limitación, inmunoglobulina A y G. De preferencia, se determina la presencia o nivel de anti-OmpC IgA.
El nivel de un anticuerpo anti-OmpC presente en una muestra de un individuo puede determinarse usando una proteína OmpC o un fragmento de la misma tal como un fragmento inmunorreactivo de la misma. Los antígenos OmpC adecuados útiles para determinar niveles de anticuerpos anti-OmpC en una muestra incluyen, sin limitación, una proteína OmpC, un polipéptido OmpC que tiene sustancialmente la misma secuencia de aminoácidos que la proteína OmpC, o un fragmento del mismo tal como un fragmento inmunorreactivo del mismo. Según se usa aquí, un polipéptido OmpC describe generalmente polipéptidos que tienen una secuencia de aminoácidos con más de aproximadamente 50% de identidad, de preferencia más de alrededor de 60% de identidad, muy preferiblemente más de aproximadamente 70% de identidad, aún más preferiblemente más de alrededor de 80%, 85%, 90%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia de aminoácidos con una proteína OmpC, la identidad de aminoácidos siendo determinada usando un programa de alineación de secuencias tal como CLUSTALW. Estos antígenos pueden prepararse, por ejemplo, mediante purificación a partir de bacterias entéricas tales como E. coli, por expresión recombinante de un ácido nucleico tal como Genbank No. de registro K00541 , por medios sintéticos tales como síntesis de péptidos en solución o fase sólida, o usando despliegue de fagos. La determinación de los niveles de anticuerpos anti-OmpC en una muestra se puede hacer usando un ensayo de ELISA o un ensayo histológico.
La determinación de la presencia o nivel de anticuerpo anti-12 en una muestra también puede ser útil en la presente invención. Según se usa aquí, el término "anticuerpo anti-12" incluye anticuerpos dirigidos a un antígeno microbiano que comparte homología con reguladores de transcripción bacterianos como los descritos en, por ejemplo, patente de E.U.A. No. 6,309,643. El término "12" se refiere a un antígeno microbiano que es inmunorreactivo con un anticuerpo anti-12. La proteína 12 microbiana es un polipéptido de 100 aminoácidos que comparte cierta homología débil en similitud con la proteína 4 predicha de C. pasteurianum, Rv3557c de Mycobacterium tuberculosis, y un regulador de transcripción de Aquifex aeolicus. Las secuencias de ácido nucleico y proteínas para la proteína 12 se describen en, por ejemplo, patente de E.U.A. No. 6,309,643.
El nivel de anticuerpo anti-12 presente en una muestra de un individuo puede determinarse usando la proteína 12 o un fragmento de la misma tal como un fragmento inmunorreactivo de la misma. Antígenos 12 adecuados útiles para determinar los niveles de anticuerpos anti-12 en una muestra incluyen, sin limitación, una proteína 12, un polipéptido 12 que tenga sustancialmente la misma secuencia de aminoácidos que la proteína 12, o un fragmento del mismo tal como un fragmento inmunorreactivo del mismo. Estos polipéptidos 12 exhiben mayor similitud de secuencia con la proteína 12 que con la proteína 4 de C. pasteurianum e incluyen variantes de isotipo y homólogos de las mismas. Según se usa en la presente, un polipéptido 12 describe generalmente polipéptidos que tienen una secuencia de aminoácidos con más de aproximadamente 50% de identidad, de preferencia más de aproximadamente 60% de identidad, muy preferiblemente más de alrededor de 70% de identidad, aún más preferiblemente más de alrededor de 80%, 85%, 90%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia de aminoácidos con una proteína 12 de origen natural, la identidad de aminoácidos siendo determinada usando un programa de alineación de secuencias tal como CLUSTALW. Estos antígenos 12 pueden ser preparados, por ejemplo, por purificación a partir de microbios, por expresión recombinante de un ácido nucleico que codifique para un antígeno 12, por medios sintéticos tales como síntesis de péptidos en solución o fase sólida, o mediante el uso de despliegue de fagos. La determinación de los niveles de anticuerpo anti-12 en una muestra puede hacerse por un ensayo histológico o un ensayo ELISA como el descrito en, por ejemplo, patente de E.U.A. No. 7,873,479.
La determinación de la presencia o nivel de anticuerpo anti-flagelina en una muestra puede ser también útil en la presente invención. Según se usa aquí, el término "anticuerpo anti-flagelina" incluye anticuerpos dirigidos a un componente proteínico de flagelos bacterianos como se describe en, por ejemplo, patente de E.U.A. No. 7,361 ,733 y publicación de patente de PCT No. WO 03/053220. El término "flagelina" se refiere a una proteína de flagelo bacteriana que es inmunorreactiva con un anticuerpo anti-flagelina. Las flagelinas microbianas son proteínas que se encuentran en flagelo bacteriano que se disponen ellas mismas en un cilindro hueco para formar el filamento.
El nivel de anticuerpo anti-flagelina presente en una muestra de un individuo puede determinarse usando una proteína de flagelina o un fragmento de la misma tal como un fragmento inmunorreactivo de la misma. Antígenos de flagelina adecuados útiles para determinar niveles de anticuerpos anti-flagelina en una muestra incluyen, sin limitación, una proteína flagelina tal como flagelina CBirl , flagelina A4-Fla2 (Fla2), flagelina X (FlaX), flagelina A, flagelina B, fragmentos de las mismas y combinaciones de las mismas, un polipéptido de flagelina que tiene sustancialmente la misma secuencia de aminoácidos que la proteína de flagelina, o un fragmento del mismo tal como un fragmento inmunorreactivo del mismo. Según se usa en la presente, un polipéptido de flagelina describe generalmente polipéptidos que tienen una secuencia de aminoácidos con más de aproximadamente 50% de identidad, de preferencia más de aproximadamente 60% de identidad, muy preferiblemente más de alrededor de 70% de identidad, aún más preferiblemente más de aproximadamente 80%, 85%, 90%, 95%, 96%, 97%, 98% o 99% de identidad de secuencia de aminoácidos con una proteína flagelina de origen natural, la identidad de aminoácidos siendo determinada usando un programa de alineación de secuencias tal como CLUSTALW. Estos antígenos de flagelina pueden prepararse, por ejemplo, por purificación a partir de bacterias tales como Helicobacter Bilis, Helicobacter mustelae, Helicobacter pylori, Butyrivibrio fibrisolvens, y bacterias encontradas en el ciego, por expresión recombinante de un ácido nucleico que codifique para un antígeno de flagelina, por medios sintéticos tales como síntesis de péptidos en solución o fase sólida, o mediante el uso de despliegue de fagos. La determinación de los niveles de anticuerpo anti-flagelina (por ejemplo, anti-CBir1 , anti-Fla2 y/o anti-FlaX) en una muestra se puede hacer usando un ensayo de ELISA o un ensayo histológico. De preferencia, se determina la presencia o nivel de anti-CBir1 IgG, anti-Fla2 IgG y/o anti-FlaX IgG.
F. Proteínas de fase aguda La determinación de la presencia o nivel de una o más proteínas de fase aguda en una muestra puede ser útil en la presente invención. Las proteínas de fase aguda son una clase de proteínas cuyas concentraciones en plasma se incrementan (proteínas de fase aguda positivas) o se reduce (proteínas de fase aguda negativa) en respuesta a inflamación. Esta respuesta es llamada la reacción de fase aguda (también llamada respuesta de fase aguda). Ejemplos de proteínas de fase aguda positivas incluyen, pero no están limitadas a, proteína C reactiva (CRP), proteína de dímero D, proteína de unión a mañosa, alfa 1 -antitripsina, alfa 1 -antiquimiotripsina, alfa 2-macroglbulína, fibrinógeno, protrombina, factor VIII, factor de von Willebrand, plasminógeno, factores de complemento, ferritina, componente amiloide P de suero, amiloide A de suero (SAA), orosumucoide (glicoproteína ácida alfa-1 , AGP), ceruloplasmina, haptoglobina y combinaciones de las mismas. Ejemplos no limitativos de proteínas de fase aguda negativas incluyen albúmina, transferrina, transtiretina, transcortina, proteína de unión a retinol y combinaciones de las mismas. De preferencia, la presencia o nivel de CRP y/o SAA se determina.
En ciertos casos, la presencia o nivel de una proteína de fase aguda particular se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de una proteína de fase aguda tal como CRP o SAA se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA o un ensayo de inmuno electroquimioluminiscencia) o un ensayo inmunohistoquímico. Por ejemplo, se puede usar un ensayo de ELISA colorimétrico de emparedado disponible de AIpco Diagnostics (Salem, NH) para determinar el nivel de CRP en una muestra de suero, plasma, orina o heces. De manera similar, un kit de ELISA disponible de Biomeda Corporation (Foster City, CA) puede usarse para detectar niveles de CRP en una muestra. Otros métodos para determinar niveles de CRP en una muestra se describen en, por ejemplo, patentes de E.U.A. Nos. 6,838,250 y 6,406,862; y publicaciones de patente de E.U.A. Nos. 20060024682 y 20060019410. Métodos adicionales para determinar niveles de CRP incluyen, por ejemplo, ensayos de inmunoturbidimetría, ensayos de inmunodifusión rápida y ensayos de aglutinación visual.
La proteína C reactiva (CRP) es una proteína encontrada en la sangre en respuesta a inflamación (una proteína de fase aguda). CRP Se produce típicamente por el hígado y por células grasas (adipocitos). Es un miembro de la familia pentraxina de proteínas. La secuencia de polipéptidos de CRP humana se muestra en, por ejemplo, Genbank No. de registro NP_000558. La secuencia de ARNm de CRP humana (codificación) se muestra en, por ejemplo, Genbank No. de registro NM_000567. Un experto en la técnica apreciará que CRP se conoce también como PTX1 , MGC88244 y MGC149895.
G. Apol i proteínas La determinación de la presencia o nivel de una o más apolipoproteínas en una muestra puede ser útil en la presente invención. Las apolipoproteínas son proteínas que se unen a grasas (lípidos). Forman lipoproteínas, las cuales transportan grasas dietarias a través del torrente sanguíneo. Las grasas dietarias son digeridas en el intestino y llevadas al hígado. Las grasas son también sintetizadas en el propio hígado. Las grasas son almacenadas en células grasas (adipocitos). Las grasas son metabolizadas según se requiera para energía en el músculo esquelético, corazón y otros órganos y se secretan en leche materna. Las apolipoproteínas sirven también como cofactores enzimáticos, ligandos receptores y portadores de transferencia de lípidos que regulan el metabolismo de lipoproteínas y su absorción en tejidos. Ejemplos de apolipoproteínas incluyen, pero no están limitados a, ApoA (por ejemplo, ApoA-l, ApoA-ll, ApoA-IV, ApoA-V), ApoB (por ejemplo, ApoB48, ApoBlOO), ApoC (por ejemplo, ApoC-l, ApoC-ll, ApoC-lll, ApoC-IV), ApoD, ApoE, ApoH, amiloide sérico A (SAA), y combinaciones de los mismos. De preferencia, la presencia o nivel de SAA se determina.
En ciertos casos, la presencia o nivel de una apolipoproteína particular se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de una apolipoproteína particular tal como SAA se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA o un ensayo de inmunoelectroquimioluminiscencia) o un ensayo inmunohistoquímico. Los kits de ELISA adecuados para determinar la presencia o nivel de SAA en una muestra tal como suero, plasma, saliva, orina o heces están disponibles de, por ejemplo, Antigenix America Inc. (Huntington Station, NY), Abazyme (Needham, MA), USCN Life (Missouri City, TX), y/o U.S. Biological (Swampscott, MA).
Las proteínas amiloide A sérico (SAA) son una familia de apolipoproteínas asociadas con lipoproteína de alta densidad (HDL) en plasma. Diferentes isoformas de SAA son expresadas constitutivamente (SAAs constitutivas) a diferentes niveles o en respuesta a estímulos inflamatorios (SAAs de fase aguda). Estas proteínas se producen predominantemente por el hígado. La conservación de estas proteínas a través de invertebrados y vertebrados sugiere que las SAAs juegan un papel altamente esencial en todos los animales. Las proteínas amiloide A sérico de fase aguda (A-SAAs) son secretadas durante la fase aguda de inflamación. La secuencia de polipéptidos de SAA humana se muestra en, por ejemplo, Genbank No. de registro NP_000322. La secuencia de ARNm (codificación) de SAA humana se muestra, por ejemplo, Genbank No. de registro NM_000331. Un experto en la técnica apreciará que SAA también se conoce como PIG4, TP53I4, MGC111216 y SAA1.
H. Defensinas La determinación de la presencia o nivel de una o más defensinas en una muestra puede ser útil en la presente invención. Las defensinas son proteínas catiónicas ricas en cisteína pequeñas encontradas tanto en vertebrados como en invertebrados. Son activas contra bacterias, hongos y pueden ser virus de cápside o no cápside. Típicamente consisten en 18-45 aminoácidos, incluyendo 6 (invertebrados) a 8 residuos de cisteína conservados. Las células del sistema inmunológico contienen estos péptidos para ayudar a mater bacterias fagocitizadas, por ejemplo, en granulocitos neutrófilos y casi todas las células epiteliales. La mayoría de las defensinas funcionan al unirse a membranas de célula microbiana, y una vez insertadas, forman defectos de membrana tipo poro que permiten el flujo de iones y nutrientes esenciales. Ejemplos no limitativos de defensinas incluyen a-defensinas (por ejemplo, DEFA1 , DEFA1A3, DEFA3, DEFA4), ß-defensinas (por ejemplo, ß defensina-1 (DEFB1 ), ß defensina-2 (DEFB2), DEFB103A/DEFB103B a DEFB107A/DEFB107B, DEFB110 a DEFB133) y combinaciones de las mismas.
En ciertos casos, la presencia o nivel de una defensina particular se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de una defensina particular se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA o un ensayo de inmunoelectroquimioluminiscencia) o un ensayo inmunohistoquímico. Los kits de ELISA adecuados para determinar la presencia o nivel de defensinas en una muestra tal como suero, plasma, saliva, orina o heces están disponibles de, por ejemplo, AIpco Diagnostics (Salem, NH), Antigenix America Inc. (Huntington Station, NY), PeproTech (Rocky Hill, NJ), y/o Alpha Diagnostic Intl. Inc. (San Antonio, TX).
Las ß-defensinas son péptidos antimicrobianos implicados en la resistencia de superficies epiteliales a colonización microbiana. Son las más ampliamente distribuidas de todas las defensinas, siendo secretadas por leucocitos y células epiteliales de muchos tipos. Por ejemplo, se pueden encontrar en la lengua, piel, córnea, glándulas salivales, ríñones, esófago y tracto respiratorio. La secuencia de polipéptidos de DEFB1 humana se muestra en, por ejemplo, Genbank No. de registro NP_005209. La secuencia de ARNm (codificación) de DEFB1 humana se muestra en, por ejemplo, Genbank No. de registro NM_005218: Un experto en la técnica apreciará que DEFB1 también se conoce como BD1 , HBD1 , DEFB-1 , DEFB101 y MGC51822. La secuencia de polipéptido de DEFB2 humana se muestra en, por ejemplo, Genbank No. de registro NP_004933. La secuencia de ARNm (codificación) de DEFB2 humana se muestra en, por ejemplo, Genbank No. de registro NM_004942. Un experto en la técnica apreciará que DEFB2 también se conoce como SAP1 , HBD-2, DEFB-2, DEFB102 y DEFB4.
I. Cadherinas La determinación de la presencia o nivel de una o más cadherinas en una muestra puede ser útil en la presente invención. Las cadherinas son una clase de proteínas de transmembrana tipo 1 que juegan papeles importantes en la adhesión celular, asegurando que las células dentro de los tejidos se aglutinen juntas. Son dependientes de iones, de calcio (Ca2+) para funcionar. La superfamilia de cadherina incluye cadherinas, protocadherinas, desmogleínas y desmocolinas, y más. En estructura, comparten repeticiones de cadherina, las cuales son los dominios de unión a Ca2+ extracelulares. Las cadherinas adecuadas para usarse en la presente invención incluyen, pero no están limitadas a, CDH1 -E-cadherina (epitelial), CDH2-N-cadherina (neural), CDH12-cadherina 12, (N-cadherina 2) tipo 2, CDH3-P-cadherina (placental),CDH4-R-cadherina (retinal), CDH5-VE-cadherina (vascular endotelial),CDH6-K-cadherina (riñon), CDH7-cadherina 7, tipo 2, CDH8-cadherina 8, tipo 2, CDH9-cadherina 9, (T1-cadherina) tipo 2, CDH10-cadher¡na 10, (T2-cadherina) tipo 2, CDH1 1 -OB-cadherina (osteoblasto), CDH13-T-cadherina-H-cadherina (corazón), CDH15-M-cadherina (miotúbulo), CDH16-KSP-cadherina, CDH17-LI cadherina (hígado-intestino), CDH18-cadherina 18, tipo 2, CDH19-cadherina 19, tipo 2, CDH20-cadherina 20, tipo 2, y CDH23-cadherina 23, (epitelio neurosensorial).
En ciertos casos, la presencia o nivel de una cadherina particular se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de una cadherina particular se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA o un ensayo de electroquimioluminiscencia) o un ensayo inmunohistoquímico. Los criterios adecuados para determinar la presencia o nivel de cadherinas en una muestra tal como suero, plasma, saliva, orina o heces están disponibles de, por ejemplo, R&D Systems, Inc. (Minneapolis, MN) y/o GenWay Biotech, Inc. (San Diego, CA).
E-cadherina es una cadherina clásica de la superfamilia de cadherina. Es una glicoproteína de adhesión de célula a célula dependiente de calcio que comprende cinco repeticiones de cadherina extracelulares, una región de transmembrana y una cola citoplásmica altamente conservada. El ectodominio de la E-cadherina media la adhesión bacteriana a células de mamífero y el dominio citoplásmico se requiere para internalización. La secuencia de polipéptidos de E-cadherina humana se muestra en, por ejemplo, Genbank No. de registro NP_004351. La secuencia de ARNm (codificación) de E-cadherina humana se muestra en, por ejemplo, Genbank No. de registro NM_004360. Un experto en la técnica apreciará que E-cadherina también se conoce como UVO, CDHE, ECAD, LCAM, Arc-1 , CD324 y CDH1.
J. Moléculas de adhesión celular (IgSF CAMs) En la presente invención puede ser útil la determinación de la presencia o nivel de una o más moléculas de adhesión celular de la superfamilia de inmunoglobulina. Según se usa aquí, el término "molécula de adhesión celular de la superfamilia de inmunoglobulina" (IgSF CAM) incluye cualquiera de una variedad de polipéptidos y proteínas ubicados sobre la superficie de una célula que tienen uno o más dominios de doblez tipo inmunoglobulina, y que funcionan en adhesión intercelular y/o transducción de señales. En otros casos, las IgSF CAMs son proteínas de transmembrana. Ejemplos no limitativos de IgSF CAMs incluyen Moléculas de Adhesión a Células Neurales (NCAMs; por ejemplo, NCAM-120, NCAM-125, NCAM-140, NCAM-145, NCAM-180, NCAM-185, etc.), Moléculas de Adhesión Intercelulares (ICAMs, por ejemplo, ICAM-1 , ICAM-2, ICAM-3, ICAM-4 e ICAM-5), Molécula de Adhesión de Células Vasculares-1 (VCAM-1 ), Molécula de Adhesión de Células de Plaquetas-Endoteliales-1 (PECAM-1), Molécula de Adhesión a Células L1 (L1 CAM), molécula de adhesión celular con homología a L1CAM (homólogo cercano de L1 ) (CHL1), lectinas tipo Ig de unión a ácido siálico (SIGLECs; por ejemplo, SIGLEC-1 , SIGLEC-2, SIGLEC-3, SIGLEC-4, etc.), nectinas (por ejemplo, nectina-1 , nectina-2, nectina-3, etc.), y moléculas tipo nectina (por ejemplo, Necl-1 , Necl-2, Necl-3, Necl-4 y Necl-5). De preferencia, se determina la presencia o nivel de ICAM-1 y/o VCAM-1. 1. Molécula de adhesión intercelular- 1 (ICAM-1) ICAM-1 es una proteína de adhesión celular de transmembrana que está presente continuamente en bajas concentraciones en las membranas de leucocitos y células endoteliales. Después de la estimulación de citocinas, las concentraciones se incrementan ampliamente. ICAM-1 Puede ser inducida por IL-1 y TNFa y se expresa por el endotelio vascular, macrófagos y linfocitos. En IBD, las citocinas proinflamatorias causan inflamación al sobrerregular la expresión de moléculas de adhesión tales como ICAM-1 y VCAM-1. La expresión incrementada de moléculas de adhesión recluta más linfocitos al tejido infectado, dando como resultado inflamación tisular (véase, Goke et al., J., Gastroenterol., 32:480 (1997); y Rijcken et al., Gut, 51 :529 (2002)). ICAM-1 Es codificada por el gen de molécula de adhesión intercelular 1 (ICAM1 ; Entrez GenelD:3383; Genbank No. de registro NM_000201 ) y se produce después del procesamiento del polipéptido precursor de molécula de adhesión intercelular 1 (Genbank No. de registro NP_000192). 2. Molécula de adhesión de células vasculares-1 (VCAM- 1) VCAM-1 Es una proteína de adhesión celular de transmembrana que media la adhesión de linfocitos, monocitos, eosinófilos y basófilos a endotelio vascular. La sobrerregulacion de VCAM-1 en células endoteliales por citocinas se presenta como resultado de transcripción génica incrementada (por ejemplo, en respuesta a factor de necrosis tumoral alfa (TNFa) e interleucina-1 (IL-1 )). VCAM-1 Es codificada por el gen de la molécula de adhesión de células vasculares 1 (VCAM1 ; Entrez GenelD:7414) y se produce después del empalme diferencial del transcripto (Genbank No. de registro NM_001078 (variante 1 ) o NM_080682 (variante 2)), y procesamiento de la isoforma de empalme de polipéptido precursor (Genbanck No. de registro NP_001069 (isoforma) o NP_542413 (isoforma b)).
En ciertos casos, la presencia o nivel de una IgSF CAM se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de una IgSF CAM tal como ICAM-1 o VCAM-1 se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA o un ensayo inmuno electroquimioluminiscente o un ensayo inmunohistoquímico. Los anticuerpos y/o kits de ELISA adecuados para determinar la presencia o nivel de ICAM-1 y/o VCAM-1 en una muestra tal como una muestra de tejido, biopsia, suero, plasma, saliva, orina o heces están disponibles de, por ejemplo, Invitrogen (Camarillo, CA), Santa Cruz Biotechnology, Inc. (Santa Cruz, CA), y/o Abcam Inc. (Cambrdige, MA).
K. Marcadores genéticos También es útil en la presente invención la determinación de la presencia o ausencia de variantes alélicas en uno o más marcadores genéticos en una muestra. Ejemplos no limitativos de marcadores genéticos incluyen, pero no están limitados a, cualquiera de los genes mostrados en las tablas A-E o una combinación de los mismos. De preferencia, se detecta la presencia o ausencia de por lo menos un polimorfismo de un solo nucleótido (SNP) en uno o más de los genes ATG16L1 , STAT3, NKX2-3 y ECM1.
La tabla A proporciona una lista ejemplar de genes de IBD, UC y CD en los que la genotipificación para la presencia o ausencia de una o más variantes alélicas (por ejemplo, SNPs) en los mismos es útil en los métodos de diagnóstico de la invención. La tabla B proporciona ejemplos adicionales de marcadores genéticos y SNPs correspondientes que pueden ser genotipificados de acuerdo con los métodos de diagnóstico de la invención. Las tablas C-E proporcionan ejemplos adicionales de marcadores genéticos de IBD, UC y CD y SNPs correspondientes que pueden ser genotipificados de acuerdo con los métodos de diagnóstico descritos en la presente.
Tabla A Genes de IBD. CD v UC Tabla B Genes de IBP. CP v UC v SNPs 5 10 15 20 25 10 15 20 15 20 20 25 15 20 15 5 10 15 20 25 SNPs adicionales útiles en la presente invención incluyen, por ejemplo, rs2188962, rs9286879, rs11584383, rs7746082, rs1456893, rs1551398, rs17582416, rs3764147, rs1736135, rs4807569, rs7758080 y rs8098673. Véase, por ejemplo, Barrett et al., Nal Genet. 40:955-62 (2008). 1. ATG16L1 ATG16L1 , conocida también como 16 relacionada con autofagia tipo 1 , es una proteína implicada en el proceso intracelular de suministrar componentes citoplásmicos a lisosomas, un proceso llamado autofagia. La autofagia es un proceso usado por las células para reciclar componentes celulares. Los procesos de autofagia también están implicados en la respuesta inflamatoria y facilitan la destrucción por el sistema inmunológico de las bacterias. La proteína ATG16L1 es un componente que contiene repeticiones WD de un complejo de proteínas grande y se asocia con la membrana de aislamiento autofágica a través de formación de autofagosomas (Mizushima et al., Journal of Cell Science 116(9): 1679-1688 (2003) y Hampe et al., Nature Genetics 39:207-211 (2006)). ATG16L1 Ha estado implicada en enfermedad de Crohn (Rioux et al., Nature Genetics 39(5):596-604 (2007)). Véase también, por ejemplo, Márquez et al., Inflamm. Bowel Disease 15(11 ): 1697-1704 (2009); Mizushima et al., J. Cell Science 116: 1679-1688 (2003); y Zheng et al., DNA Sequence: The J of DNA Sequencing and Mapping 15(4): 303-5 (2004)).
La determinación de la presencia o ausencia de variantes alélicas tales como SNPs en el gen ATG16L1 es particularmente útil en la presente invención. Según se usa en la presente, el término "variante de ATG16L1" o variante del mismo incluye una secuencia de nucleótidos de un gen de ATG16L1 que contiene uno o más cambios en comparación con el gen de ATG16L1 tipo silvestre o una secuencia de aminoácidos de un polipéptido ATG16L1 que contiene uno o más cambios en comparación con la secuencia de polipéptidos de ATG16L1 tipo silvestre. ATG16L1 , conocida también como 16 relacionada con autofagia tipo 1 , se ha ubicado en el cromosoma humano 2.
Información de ubicación génica para ATG16L1 se muestra en, por ejemplo, GenelD:55054. Las secuencias de ARNm (codificación) y polipéptidos de ATG16L1 humana se muestran en, por ejemplo, NM_017974.3 o NM_030803.6 y NP_060444.3 o NP_110430.5 respectivamente. Además, la secuencia completa del cromosoma 2 humano (2q37.1), ensamble de referencia primario GRCh37, que incluye ATG16L1 , se muestra en, por ejemplo, GenBank No. de registro NT_005120.16. Además, la secuencia de ATG16L1 de otras especies puede encontrarse en la base de datos de GenBank.
El SNP rs2241880 que encuentra uso en los métodos de la presente invención se ubica en la posición de nucleótido 1098 de NM_017974.3, como una transición de A a G, que corresponde a un cambio de treonina a alanina en la posición 281 de NP_060444.3 o en la posición 1155 de NM_030803.6, como una transición de A a G, que corresponde a un cambio de treonina a alanina en la posición 300 de NP_1 10430.5. La presencia del SNP rs2241880 ATG16L1 y otras variantes puede detectarse, por ejemplo, mediante ensayos de discriminación alélica o análisis de secuencia. 2. ECM1 ECM1 , conocida también como proteína de matriz extracelular, es una glicoproteína expresada en los intestinos grueso y delgado. Interactúa con la membrana de basamento e inhibe la metaloproteinasa de matriz 9. ECM1 También activa fuertemente señalización de NF-??, que es un regulador clave de la respuesta inmune.
La determinación de la presencia o ausencia de variantes alélicas tales como SNPs en el gen de ECM1 es particularmente útil en la presente invención. Según se usa aquí, el término "variante de EC 1" o variantes del mismo incluye una secuencia de nucleotidos de un gen de ECM1 que contiene uno o más cambios en comparación con el gen de ECM1 tipo silvestre o una secuencia de aminoácidos de un polipéptido ECM1 que contiene uno o más cambios en comparación con la secuencia de polipéptidos de EC 1 tipo silvestre. El gen de ECM1 ha sido ubicado en el cromosoma humano 1q21 (Fisher et al., Nature Genetics., 40:710-712 (2008)).
Información de ubicación génica para ECM1 se muestra en, por ejemplo, GenelD:1893. Las secuencias de ARNm (codificación) de ECM1 humano se muestran en, por ejemplo, NM_001202858.1 , NM_022664.2 y NM_004425.3. Las secuencias de polipéptido respectivas se muestran en NP_001189787.1 , NP_004416.2 y NP_073155.2. Además, la secuencia completa del ensamble de referencia primario del cromosoma 1 humano (1q21) GRCh37.p5, que incluye ECM1 , se muestra en, por ejemplo, GenBank No. de registro NC_000001.10. Además, la secuencia de ECM1 de otras especies puede encontrarse en la base de datos GenBanck.
Varios SNPs cerca y dentro del gen ECM1 han sido descritos previamente. Por ejemplo, los SNPs de ECM1 , identificados en un escaneo de SNP no sinónimos para colitis ulcerosa, han sido asociados con UC (Fisher et al., Nature Genetics, 40:710-712 (2008)). Ejemplos no limitativos de SNPs de ECM1 incluyen rs3737240, rs7511649, rs13294, rs12724450, rs11205386, rs11205387, rs9661040, rs875514 y rs11810419. La presencia del SNP rs373240 de ECM1 y otras variantes puede detectarse, por ejemplo, por ensayos de discriminación alélica o análisis de secuencia. 3. N X2-3 NKX2-3, un miembro de la familia NKX de factores de transcripción que contienen homeodominio, ha estado implicada en el desarrollo del intestino, bazo y tejido linfoide asociado con intestino.
La determinación de la presencia o ausencia de variantes alélicas tales como SNPs en el gen NKX2-3 es particularmente útil en la presente invención. Según se usa en la presente, el término "variante de NKX2-3" o variantes del mismo incluye una secuencia de nucleótidos de un gen NKX2-3 que contiene uno o más cambios en comparación con el gen NKX2-3 tipo silvestre o una secuencia de aminoácidos de un polipéptido NKX2-3 que contiene uno o más cambios en comparación con la secuencia de polipéptidos de NKX2-3 tipo silvestre. El gen NKX2-3 ha sido ubicado en el cromosoma humano 10q24.2.
Información de ubicación génica para NKX2-3 se muestra en, por ejemplo, GeneID: 159296. La secuencia de ARIMm (codificación) y la secuencia de polipéptidos correspondiente de NKX2-3 humana se muestran en, por ejemplo, NM_145285.2 y NP_660328.2 respectivamente. Además, la secuencia completa del ensamble de referencia primario GRCh37.p5 del cromosoma 10 humano (10q24.2), que incluye NKX2-3, se muestra en, por ejemplo, BenBank No. de registro NC_000010.10. Más aún, la secuencia de NKX2-3 de otras especies puede encontrarse en la base de datos GenBank.
Varios SNPs cerca y dentro del gen NKX2-3 han sido descritos previamente. Por ejemplo, el SNPrsI 0883365 de NKX2-3 ha estado asociado con UC y CD en la población japonesa (Arai et al., Hum. Immunol., 72:587-91 (2011 ) y con susceptibilidad de CD en la población de Europa Occidental (Meggyesi et al., World J. Gastroenterol., 16:5233-5240 (2010)). Ejemplos no limitativos de SNPs de NKX2-3 incluyen rs10883365, rs6584283, rs11190140, rs888208, rs11596008, rs791 1680, rs7908704, rs41290504, rs7893840, rs884144, rs10082511 , rs60505509 y rs59754112. La presencia del SNP rs10883365 de NKX2-3 y otras variantes puede detectarse, por ejemplo, por ensayos de discriminación alélica y análisis de secuencia. 4. STAT3 El activador de transcripción y transductor de señales 3 (STAT3), un miembro de la familia de proteínas STAT, es un factor de transcripción que regula la expresión de una variedad de genes implicados en muchos procesos celulares tales como crecimiento celular, apoptosis, motilidad celular y producción de citosinas. En respuesta a citosinas y factores de crecimiento, STAT3 es activado por cinasas JAK y se transloca al núcleo para actuar como un activador de transcripción. Los estudios han demostrado que STAT3 juega un papel importante en varios trastornos ¡nmunológicos incluyendo la patogénesis de enfermedad intestinal inflamatoria (véase, por ejemplo, Sugimoto, World J. Gastroenterol., 14:51 10-5114, (2008)).
Información de ubicación génica para STAT3 se muestra en, por ejemplo, en GenelD:6774. Las secuencias de ARNm (codificación) y las secuencias de polipéptidos correspondientes de STAT3 humana se muestran en, por ejemplo, NM_139276.2, NM_003150.3 y NM_213662.1 y NP_644805.1 , NP_003141.2 y NP_998827.1 , respectivamente. Además, la secuencia completa del ensamble primario del cromosoma humano 17q21.31 GRCh37.p5, que incluye STAT3, se muestra en, por ejemplo, GenBank No. de registro NC_000017.10. Más aún, la secuencia de STAT3 de otras especies puede encontrarse en la base de datos de GenBank.
Varios SNPs cerca y dentro del gen STAT3 han sido descritos previamente (véase, Franke et al., Nature Genetics, 40:713-715 (2008); Sato et al., J. Clin. Immunol., 29:815-25 (2009); Ferguson er al., Mutat. Res., 690:108-15 (2010)); Boland eí al., Dig. Dis., 28:590-5 (2010)). Ejemplos no limitativos de SNPs de STAT3 incluyen rs744166, rs11547455, rs957970, rs2291281 , rs1064111 , rs10775, rs9912773, rs2306580, rs1905340, rs12947808, rs12949918, rs34460718, rs1064110, rs1053004, rs3736164, rs721 1777, rs1064118, rs12721576, rs35499754, rs4796644, rs3736163, rs3809758, rs3744483, rs17885291 , rs6503698 and rs77479856. La presencia del SNP rs744166 de STAT3 y otras variantes puede detectarse, por ejemplo, mediante ensayos de discriminación alélica o análisis de secuencia. 5. NOD2/CARD15 La determinación de la presencia o ausencia de variantes alélicas tales como SNPs en el gen NOD2/CARD15 es particularmente útil en la presente invención. Según se usa en la presente, el término "variante de NOD2/CARD15" o "variante NOD2" incluye una secuencia de nucleótidos de un gen de NOD2 que contiene uno o más cambios en comparación con el gen NOD2 tipo silvestre o una secuencia de aminoácidos de un polipéptido NOD2 que contiene uno o más cambios en comparación con la secuencia de polipéptidos de NOD2 tipo silvestre. NOD2, También conocido como CARD15, ha sido ubicado en el locus IBD1 en el cromosoma 16 e identificado por clonación de posición (Hugot er a/., Nature, 411 :599-603 (2001)) así como una estrategia de genes candidatos de posición (Ogura er a/., Nature, 411 :603-606 (2001); Hampe er a/., Lancet. 357:1925-1928 (2001 )). El locus IBD1 tiene una alta calificación de enlace multipuntos (MLS) para enfermedad inflamatoria intestinal (MLS = 5.7 en marcador D16S411 en 16q12). Véase, por ejemplo, Cho et al., Inflamm Bowel Dis., 3:186-190 (1997) ; Akolkar et al., Am. J. Gastroenterol., 96:1127-1132 (2001 ); Ohmen et al., Hum. Mol. Genet, 5:1679-1683 (1996); Parkes et al., Lancet, 348:1588 (1996); Cavanaugh et al., Ann. Hum. Genet, 62:291-8 (1998); Brant et al., Gastroenterology, 115:1056-1061 (1998) ; Curran er a/., Gastroenterology, 115:1066-1071 (1998); Hampe er a/., Am. J. Hum. Genet, 64:808-816 (1999); y Annese er a/., Eur. J. Hum. Genet, 7:567-573 (1999).
Las secuencias de polipéptidos y (codificación) de ARNm de NOD2 humano se muestran en, por ejemplo, Genbank Nos. de registro NM_022162 y NP_071445, respectivamente. Además, la secuencia completa del clon RP1 1-327F22 del cromosoma 16 humano, que incluye NOD2, se muestra en, por ejemplo, Genbank No. de registro AC007728. Más aún, la secuencia de NOD2 de otras especies puede encontrarse en la base de datos GenBank.
La proteína NOD2 contiene dominios de reclutamiento de caspasa amino-terminal (CARDs), los cuales pueden activar NF-kappa B (NF-kB), y varios dominios de repetición ricos en leucina carboxi-terminales (Ogura et al., J. Biol. Chem., 276:4812-4818 (2001)). NOD2 Tiene homología estructural con el regulador de apoptosis Apaf-1/CED-4 y una clase de productos génicos resistentes a enfermedades vegetales (Ogura et al., citado arriba). En forma similar a los productos génicos resistentes a enfermedades vegetales, NOD2 tiene un dominio efector amino-terminal, un dominio de unión a nucleótido y repeticiones ricas en leucina (LRRs). NOD2 Tipo silvestre activa factor nuclear NF-kappa B, haciéndolo sensible a lipopolisacáridos bacterianos (LPS; Ogura et al., citado arriba; Inohara et al., J. Biol. Chem., 276:2551 -2554 (2001). NOD2 Puede funcionar como un receptor intercelular para LPS, con las repeticiones ricas en leucina requeridas para capacidad de respuesta.
Las variaciones en tres polimorfismos de un solo nucleótido en la región de codificación de NOD2 han sido descritas previamente. Estos tres SNPs, designados R702W ("SNP 8"), G908R ("SNP 12") y 1007fs ("SNP 13"), se ubican en la región carboxi-terminal del gen NOD2 (Hugot et al., citado arriba). Una descripción adicional de SNP 8, SNP 12 y SNP 13, así como de SNPs adicionales en el gen NOD2 adecuado para usarse en la invención, se puede encontrar en, por ejemplo, patentes de E.U.A. Nos. 6,835,815, 6,858,391 ; y 7,592,437; y patentes de E.U.A. Nos. de publicación 20030190639, 20050054021 y 20070072180.
En algunas modalidades, una variante de NOD2 se ubica en una región de codificación de locus de NOD2, por ejemplo, dentro de una región que codifica para varias repeticiones ricas en leucina en la porción carboxi-terminal del polipéptido NOD2. Estas variantes de NOD2 ubicadas en la región de repetición rica en leucina de NOD2 incluyen, sin limitación, R702W ("SNP 8") y G908R ("SNP 12"). Una variante de NOD2 útil en la invención también puede codificar para un polipéptido NOD2 con capacidad reducida para activar NF-kappa B en comparación con la activación de NF-kappa B por un polipéptido NOD2 tipo silvestre. Como un ejemplo no limitativo, la variante de NOD2 1007fs ("SNP 13") se traduce en un polipéptido NOD2 truncado que tiene capacidad reducida para inducir NF-kappa B en respuesta a estimulación con LPS (Ogura er a/., Nature, 411 :603-606 (2001)).
Una variante de NOD2 útil en la invención puede ser, por ejemplo, R702W, G908R o 1007fs. R702W, G908R y 1007fs se ubican dentro de la región de codificación de NOD2. En una modalidad, un método de la invención se practica con la variante de NOD2 R702W. Según se usa en la presente, el término "R702W" incluye un polimorfismo de un solo nucleótido dentro del exón 4 del gen NOD2, el cual se presenta dentro de un triplete que codifica para el aminoácido 702 de la proteína NOD2. El alelo de NOD2 tipo silvestre contiene un residuo de citosina (c) en la posición 138,991 de la secuencia de AC007728, que se presenta dentro de un triplete que codifica para una arginina en el aminoácido 702. La variante NOD2 de R702W contiene un residuo de timina (t) en la posición 138,991 de la secuencia de AC007728, dando como resultado una sustitución de arginina (R) por triptófano (W) en el aminoácido 702 de la proteína NOD2. En consecuencia, esta variante de NOD2 es indicada "R702W" o "702W" y también se puede indicar "R675W" con base en el sistema de numeración inicial de Hugot et al., citado arriba. Además, la variante R702W también se conoce como el alelo "SNP 8" o un alelo "2" en SNP 8. El número de identificación del SNP NCBI para R702W o SNP 8 es rs2066844. La presencia de la variante NOD2 de R702W y otras variantes de NOD2 puede detectarse convenientemente, por ejemplo, por ensayos de discriminación alélica o análisis de secuencias.
Un método de la invención también se puede llevar a la práctica con la variante NOD2 G908R. Según se usa en la presente, el término "G908R" incluye un polimorfismo de un solo nucleótido dentro del exón 8 del gen NOD2, el cual se presenta dentro de un triplete que codifica para el aminoácido 908 de la proteína NOD2. El aminoácido 908 se ubica dentro de la región de repetición rica en leucina del gen NOD2. El alelo NOD2 tipo silvestre contiene un residuo de guanina (g) en la posición 128,377 de la secuencia de AC007728, el cual se presenta dentro de un triplete que codifica para glicina en el aminoácido 908. La variante NOD2 G908R contiene un residuo de citosina (c) en la posición 128,377 de la secuencia de AC007728, dando como resultado una sustitución de glicina (G) por arginina (R) en el aminoácido 908 de la proteína NOD2. En consecuencia, esta variante de NOD2 es indicada "G908R" o "908R" y también se puede indicar "G881 R" con base en el sistema de numeración inicial de Hugot et al., citado arriba. Además, la variante G908R también se conoce como el alelo "SNP 12" o un alelo "2" en SNP 12. El número de identificación SNP de NCBI para SNP 12 G908R es rs2066845.
Un método de la invención también se puede llevar a la práctica con la variante NOD2 1007fs. Esta variante es una inserción de un solo nucleótido que resulta en un desplazamiento de cuadro en la décima repetición rica en leucina de la proteína NOD2 y es seguido por un codón de paro prematuro. El truncamiento resultante de la proteína NOD2 parece impedir la activación de NF-kappaB en respuesta a lipopolisacáridos bacterianos (Ogura et al., citado arriba). Según se usa en la presente, el término "1007fs" incluye un polimorfismo de un solo nucleotido dentro del exón 11 del gen NOD2, el cual se presenta en un triplete que codifica para el aminoácido 1007 de la proteína NOD2. La variante 1007fs contiene una citosina que ha sido añadida en la posición 121 ,139 de la secuencia de AC007728, dando como resultado una mutación por desplazamiento de cuadro en el aminoácido 1007. En consecuencia, esta variante NOD2 es llamada "1007fs" y también puede ser llamada "3020insC" o "980fs" con base en el sistema de numeración inicial de Hugot er a/., citado arriba. Además, la variante NOD2 de 1007fs se conoce también como el alelo "SNP 13" o un alelo "2" en SNP 13. El número ID SNP NCBI para 1007fs o SNP 13 es rs2066847.
Un experto en la técnica reconoce que un alelo de variante NOD2 particular u otro alelo polimórfico puede definirse convenientemente, por ejemplo, en comparación con un individuo de referencia del Centre-d'Etude du Polymorphisme Humain (CEPH) tal como el individuo designado 1347-02 (Dib et al., 380:152-154 (1996)), usando ADN de referencia disponible comercialmente obtenido, por ejemplo, de PE Biosystems (Foster City, CA). Además, información específica sobre SNPs puede obtenerse del dbSNP del Centro Nacional para Información de Biotecnología (NCBI).
Una variante de NOD2 también se puede ubicar en una región no codificadora del locus NOD2. Las regiones no codificadoras incluyen, por ejemplo, secuencias de intrones así como secuencias no traducidas 5' y 3'. Un ejemplo no limitativo de un alelo de variante NOD2 ubicada en una región no codificadora del gen NOD2 es la variante JW1 , la cual se describe en Sugimura et al., Am. J. Hum. Genet, 72:509-518 (2003) y patente de E.U.A. No. de publicación 20070072180. Ejemplos de alelos de variante de NOD2 ubicados en la región no traducida 3' del gen NOD2 incluyen, sin limitación, los alelos variantes JW15 y JW16, los cuales se describen en la patente de E.U.A. No. de publicación 20070072180. Ejemplos de alelos de la variante NOD2 ubicados en la región no traducida 5' (por ejemplo, región promotora) del gen NOD2 incluyen, sin limitación, los alelos variantes JW17 y JW18, los cuales se describen en la patente de E.U.A. No. de publicación 20070072180.
Según se usa en la presente, el término "alelo variante JW1" incluye una variación genética en el nucleótido 158 de la secuencia de intervención 8 (intrón 8) del gen NOD2. En relación con la secuencia AC007728, el alelo variante JW1 se ubica en la posición 128,143. La variación genética en el nucleótido 158 del intrón 8 puede ser, pero no está limitada a, una sustitución de un solo nucleótido, sustituciones de varios nucleótidos o una supresión o inserción de uno o más nucleótidos. La secuencia tipo silvestre del intrón 8 tiene una citosina en la posición 158. Como ejemplos no limitativos, un alelo variante JW1 puede tener una sustitución de citosina (c) por adenina (a), citosina (c) por guanina (g) o citosina (c) por timina (t) en el nucleótido 158 del intrón 8. En una modalidad, el alelo variante JW1 es un cambio de una citosina (c) por una timina (t) en el nucleótido 158 del intrón 8 de NOD2.
El término "alelo variante JW15" incluye una variación genética en la región no traducida 3' de NOD2 en la posición de nucleótido 118,790 de la secuencia AC007728. La variación genética en el nucleótido 118,790 puede ser, pero no está limitada a, una sustitución de un solo nucleótido, sustituciones de varios nucleótidos o una supresión o inserción de uno o más nucleótidos. La secuencia tipo silvestre tiene una adenina (a) en la posición 118,790. Como ejemplos no limitativos, un alelo variante JW15 puede tener una sustitución de adenina (a) por citosina (c), adenina (a) por guanina (g), o adenina (a) por timina (t) en el nucleótido 118,790. En una modalidad, el alelo variante JW15 es un cambio de una adenina (a) por una citosina (c) en el nucleótido 118,790.
Según se usa en la presente, el término "alelo variante JW16" incluye una variación genética en la región no traducida 3' de NOD2 en la posición de nucleótido 118,031 de la secuencia AC007728. La variación genética en el nucleótido 118,031 puede ser, pero no está limitada a, una sustitución de un solo nucleótido, sustituciones de varios nucleótidos o una supresión o inserción de uno o más nucleótidos. La secuencia tipo silvestre tiene una guanina (g) en la posición 1 18,031. Como ejemplos no limitativos, un alelo variante JW16 puede tener una sustitución de guanina (g) por citosina (c), guanina (g) por adenina (a) o guanina (g) por timina (t) en el nucleótido 118,031. En una modalidad, el alelo variante JW16 es un cambio de una guanina (g) por una adenina (a) en el nucleótido 118,031.
El término "alelo variante JW1 ' incluye una variación genética en la región no traducida 5' de NOD2 en la posición de nucleótido 154,688 de la secuencia AC007728. La variación genética en el nucleótido 154,688 puede ser, pero no está limitada a, sustituciones de varios nucleótidos o una supresión o inserción de uno o más nucleótidos. La secuencia tipo silvestre tiene una citosina (c) en la posición 154,688. Como ejemplos no limitativos, un alelo variante JW17 puede tener una sustitución de citosina (c) por guanina (g), citosina (c) por adenina (a) o citosina (c) por timina (t) en el nucleótido 154,688. En una modalidad, el alelo variante JW17 es un cambio de una citosina (c) por una timina (t) en el nucleótido 154,688.
Según se usa en la presente, el término "alelo variante JW18" incluye una variación genética en la región no traducida 5' de NOD2 en la posición de nucleótidos 154,471 de la secuencia AC007728. La variación genética en el nucleótido 154,471 puede ser, pero no está limitada a, una sustitución de un solo nucleótido, sustituciones de varios nucleótidos o una supresión o inserción de uno o más nucleótidos. La secuencia tipo silvestre tiene una citosina (c) en la posición 154,471. Como ejemplos no limitativos, un alelo variante JW18 puede tener una sustitución de citosina (c) por guanina (g), citosina (c) por adenina (a) o citosina (c) por timina (t) en el nucleótido 154,471. En una modalidad, el alelo variante JW18 es un cambio de una citosina (c) por una timina (t) en el nucleótido 154,471.
Se entiende que los métodos de la invención pueden llevarse a la práctica con estos u otros alelos variantes NOD2 ubicados en una región de codificación o región no codificadora (por ejemplo, región de intrón o promotor) del locus NOD2. Se entiende además que los métodos de la invención pueden incluir determinar la presencia de una, dos, tres, cuatro o más variantes de NOD2, incluyendo, pero no limitadas a, los alelos SNP-8, SNP-12 y SNP-13, y otras variantes de región de codificación así como de no codificación.
L. Otros marcadores de diagnóstico Los marcadores de diagnóstico adicionales adecuados para usarse en la presente invención incluyen, pero no están limitados a, lactoferrina, anticuerpos anti-lactoferrina, elastasa, calprotectina, hemoglobina y combinaciones de los mismos.
La determinación de la presencia o nivel de lactoferrina en una muestra puede ser útil en la presente invención. En ciertos casos, la presencia o nivel de lactoferrina se detecta al nivel de expresión de ARNm con un ensayo tal como, por ejemplo, un ensayo de hibridación o un ensayo a base de amplificación. En ciertos otros casos, la presencia o nivel de lactoferrina se detecta al nivel de expresión de proteínas usando, por ejemplo, un inmunoensayo (por ejemplo, ELISA) o un ensayo inmunohistoquímico. Un kit de ELISA disponible de Calbiochem (San Diego, CA) puede usarse para detectar lactoferrina humana en una muestra de plasma, orina, lavado broncoalveolar o fluido cerebroespinal. Similarmente, un kit de ELISA disponible de U.S. Biological (Swampscott, MA) puede usarse para determinar el nivel de lactoferrina en una muestra de plasma. Asimismo, kits de ELISA disponibles de TECH LAB, Inc. (Blacksburg, VA) se pueden usar para determinar el nivel de lactoferrina en una muestra de heces. Adicionalmente, la patente de E.U.A. No. de publicación 20040137536 describe un ensayo de ELISA para determinar la presencia de niveles elevados de lactoferrina en una muestra de heces, y la patente de E.U.A. No. de publicación 20040033537 describe un ensayo de ELISA para determinar la concentración de lactoferrina endógena en una muestra de heces, moco o bilis. En algunas modalidades, la presencia o nivel de anticuerpos anti-lactoferrina puede detectarse en una muestra usando, por ejemplo, proteína lactoferrina o un fragmento de la misma.
Además, hemocultivo, sangre oculta fecal, comúnmente es indicadora de enfermedad intestinal, y se han desarrollado varios kits para monitorear sangrado gastrointestinal. Por ejemplo, Hemoccult SENSA, un producto de Beckman Coulter, es un auxiliar de diagnóstico para sangrado gastrointestinal, deficiencia de hierro, úlceras pépticas, colitis ulcerosa y, en algunos casos, en el análisis para cáncer colorrectal. Este ensayo particular se basa en la oxidación de guayaco por peróxido de hidrógeno para producir un color azul. Un ensayo colorimétrico similar está disponible comercialmente de Helena Laboratories (Beaumont, TX) para la detección de sangre en muestras de heces. Otros métodos para detectar sangre oculta en una muestra de heces al determinar la presencia o nivel de actividad de hemoglobina o heme se describen por ejemplo, en las patentes de E.U.A. Nos. 4,277,250, 4.920,045, 5,081 ,040 y 5,310,684.
La calprotectina es una proteína de unión a calcio y zinc encontrada en todas las células, tejidos y fluidos en el cuerpo. La calprotectina es una proteína principal en granulocitos y macrofagos neutrofílicos y equivale a tanto como 60% de la proteína total en la fracción citosólica de estas células. Es por lo tanto un marcador sustituto de la renovación de neutrofilos. Su concentración en heces se correlaciona con la intensidad de infiltración de neutrofilos de la mucosa intestinal y con la severidad de inflamación. La calprotectina puede medirse con un ELISA usando pequeñas (50-100 mg) muestras fecales (véase, por ejemplo, Johne et al., Scand J Gastroenterol., 36:291-296 (2001)).
VI. Ensayos Cualquiera de una variedad de ensayos, técnicas y kits conocidos en la técnica pueden usarse para detectar o determinar la presencia o nivel de uno o más marcadores de IBD en una muestra para diagnosticar IBD y para clasificar el diagnóstico de IBD (por ejemplo, IC, CD o UC).
La presente invención se basa, en parte, en determinar la presencia o nivel de al menos un marcador en una muestra obtenida de un individuo. Según se usa aquí, el término "detectar la presencia de al menos un marcador" incluye determinar la presencia de cada marcador de interés usando cualquier ensayo cuantitativo o cualitativo conocido por alguien de capacidad en la técnica. En ciertos casos, los ensayos cualitativos que determinan la presencia o ausencia de un rasgo, variable o sustancia bioquímica o serológica (por ejemplo, proteína o anticuerpo) particular son adecuados para detectar cada marcador de interés. En ciertos otros casos, ensayos cuantitativos que determinan la presencia o ausencia de ARN, proteína, anticuerpo o actividad son adecuados para detectar cada marcador de interés. Según se usa en la presente, el término "detectar el nivel de al menos un marcador" incluye determinar el nivel de cada marcador de interés usando cualquier ensayo cuantitativo directo o indirecto conocido por alguien de capacidad en la técnica. En ciertos casos, ensayos cuantitativos que determinan, por ejemplo, la cantidad relativa o absoluta de ARN, proteína, anticuerpo o actividad son adecuados para detectar el nivel de cada marcador de interés. Un experto en la técnica apreciará que cualquier ensayo útil para detectar el nivel de un marcador también es útil para detectar la presencia o ausencia del marcador.
Según se usa en la presente, el término "anticuerpo" incluye una población de moléculas de inmunoglobulina, que pueden ser policlonales o monoclonales y de cualquier isotipo, o un fragmento inmunológicamente activo de una molécula de inmunoglobulina. Este fragmento inmunológicamente activo contiene las regiones variables de las cadenas pesada y ligera, las cuales constituyen la porción de la molécula de anticuerpo que se une específicamente a un antígeno. Por ejemplo, un fragmento inmunológicamente activo de una molécula de inmunoglobulina conocida en la técnica como Fab, Fab' o F(ab')2 está incluido dentro del significado del término anticuerpo.
Se puede usar citometría de flujo para detectar la presencia o nivel de uno o más marcadores en una muestra. Estos ensayos citométricos de flujo, incluyendo inmunoensayos a base de esferas, se pueden usar para determinar, por ejemplo, niveles de marcadores de anticuerpo de la misma manera que la descrita para detectar anticuerpos en suero contra Candida albicans y proteínas de VIH (véase, por ejemplo, Bishop y Davis, J. Immunol. Methods, 210:79-87 (1997); McHugh et al., J. Immunol. Methods, 116:213 (1989); Scillian et al., Blood, 73:2041 (1989)).
Tecnología de despliegue de fagos para expresar un antígeno recombinante específico para un marcador también se puede usar para detectar la presencia o nivel de uno o más marcadores en una muestra. Partículas de fago que expresen un antígeno específico para, por ejemplo, un marcador de anticuerpo pueden ser ancladas, si se desea, a una placa de varios pocilios usando un anticuerpo tal como un anticuerpo monoclonal anti-fagos (Felici er al., "Phage-Displayed Peptides as Tools for Characterization of Human Sera" in Abelson (Ed.), Methods in Enzymol., 26, San Diego: Academic Press, Inc. (1996)).
Una variedad de técnicas de inmunoensayo, incluyendo inmunoensayos competitivos y no competitivos, se puede usar para detectar la presencia o nivel de uno o más marcadores en una muestra (véase, por ejemplo, Self and Cook, Curr. Opin. Biotechnol., 7:60-65 (1996)). El término inmunoensayo abarca técnicas que incluyen, sin limitación, inmunoensayos enzimáticos (EIA) tales como técnica de inmunoensayo multiplicada por enzimas (EMIT), ensayo inmunoabsorbente ligado a enzimas (ELISA), ELISA de captura de antígenos, ELISA de emparedado, ELISA de captura de anticuerpos IgM (MAC ELISA) e inmunoensayo enzimático de micropartículas (MEIA); inmunoensayos de electroforesis capilar (CEIA); radioinmunoensayos (RIA); ensayos inmunorradiométricos (IRMA); inmunoensayos de polarización por fluorescencia (FPIA) y ensayos de quimioluminiscencia (CL). Si se desea, estos inmunoensayos pueden ser automáticos. Inmunoensayos también se pueden usar en conjunto con fluorescencia inducida con láser (véase, por ejemplo, Schmalzing y Nashabeh, Electrophoresis, 18:2184-2193 (1997); Bao, J. Chromatogr. B. Biomed. ScL, 699:463-480 (1997)). Inmunoensayos de liposomas, tales como inmunoensayos de liposomas de inyección de flujo e inmunosensores de liposomas, también son adecuados para usarse en la presente invención (véase, por ejemplo, Rongen et al., J. Immunol. Methods, 204:105-133 (1997)). Además, ensayos de nefelometría, en los cuales la formación de complejos proteína/anticuerpo se traduce en dispersión de luz incrementada que se convierte en una señal de índice pico como una función de la concentración de marcadores, son adecuados para usarse en la presente invención. Los ensayos de nefelometría están disponibles comercialmente de Beckman Coulter (Brea, CA; Kit # 449430) y se pueden llevar a cabo usando un Analizador Nefelómetro Behring (Fink et al., J. Clin. Chem. Clin. Biol. Chem., 27:261-276 (1989)).
ELISA de captura de antígenos también puede ser útil para detectar la presencia o nivel de uno o más marcadores en una muestra. Por ejemplo, en un ELISA de captura de antígenos, un anticuerpo dirigido a un marcador de interés es unido a una fase sólida y se añade muestra de tal manera que el marcador sea unido por el anticuerpo. Después de que las proteínas no unidas son eliminadas por lavado, la cantidad de marcador unido puede ser cuantificado usando, por ejemplo, un radioinmunoensayo (véase, por ejemplo, Harlow y Lañe, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Nueva York, 1988)). ELISA De emparedado también puede ser adecuado para usarse en la presente invención. Por ejemplo, en un ensayo de emparedado de dos anticuerpos, un primer anticuerpo es unido a un soporte sólido, y el marcador de interés se deja unir al primer anticuerpo. La cantidad del marcador se cuantifica al medir la cantidad de un segundo anticuerpo que se une al marcador. Los anticuerpos pueden ser inmovilizados sobre una variedad de soportes sólidos, tales como partículas de matriz magnéticas o cromatográficas, la superficie de una placa de ensayo (por ejemplo, pocilios de microtitulación), piezas de un material de substrato sólido o membrana (por ejemplo, plástico, nylon, papel), y similares. Una tira de ensayo se puede preparar al recubrir el anticuerpo o una pluralidad de anticuerpos en una disposición sobre un soporte sólido. Esta tira puede ser luego sumergida en la muestra de prueba y procesada rápidamente a través de lavados y etapas de detección para generar una señal medible, tal como un punto coloreado.
Un radioinmunoensayo que usa, por ejemplo, un anticuerpo secundario marcado con yodo 125 (125l) (Harlow y Lañe, citado arriba) también es adecuado para detectar la presencia o nivel de uno o más marcadores en una muestra. Un anticuerpo secundario marcado con un marcador quimioluminiscente también puede ser adecuado para usarse en la presente invención. Un ensayo de quimioluminiscencia usando un anticuerpo secundario quimioluminiscente es adecuado para una detección sensible y no radiactiva de niveles de marcadores. Estos anticuerpos secundarios pueden obtenerse comercialmente de varias fuentes, por ejemplo, Amersham Lifesciences, Inc. (Arlington Heights, IL).
Los inmunoensayos descritos arriba son particularmente útiles para detectar la presencia o nivel de uno o más marcadores en una muestra. Como un ejemplo no limitativo, una ELISA de neutrófilos fijos es útil para determinar si una muestra es positiva para ANCA o para determinar niveles de ANCA en una muestra. En forma similar, un ELISA usando fosfopeptidomanano de paredes de células de levadura es útil para determinar si una muestra es positiva para ASCA-lgA y/o ASCA-lgG, o para determinar los niveles de ASCA-lgA y/o ASCA-lgG en una muestra. Un ELISA que usa proteína OmpC o un fragmento de la misma es útil para determinar si una muestra es positiva para anticuerpos anti-OmpC, o para determinar los niveles de anticuerpos anti-OmpC en una muestra. Un ELISA que usa proteína 12 o un fragmento de la misma es útil para determinar si una muestra es positiva para anticuerpos anti-12, o para determinar niveles de anticuerpos anti-12 en una muestra. Un ELISA que usa proteína flagelina (por ejemplo, flagelina Cbir-1 , flagelina Fla2, flagelina FlaX) o un fragmento de la misma es útil para determinar si una muestra es positiva para anticuerpos anti-flagelina, o para detectar niveles de anticuerpos anti-flagelina en una muestra. Además, los inmunoensayos descritos arriba son particularmente útiles para detectar la presencia o nivel de otros marcadores en una muestra.
La unión inmunológica específica del anticuerpo al marcador de interés puede detectarse directa o indirectamente. Los marcadores directos incluyen etiquetas fluorescentes o luminiscentes, metales, colorantes, radionúclicos y similares, unidos al anticuerpo. Un anticuerpo marcado con yodo-125 (125l) se puede usar para determinar los niveles de uno o más marcadores en una muestra. Un ensayo de quimioluminiscencia usando un anticuerpo quimioluminiscente específico para el marcador es adecuado para detección sensible y no radioactiva de niveles de marcadores. Un anticuerpo marcado con fluorocromo también es adecuado para determinar los niveles de uno o más marcadores en una muestra. Ejemplos de fluorocromos incluyen, sin limitación, DAPI, fluoresceína, Hoechst 33258, R-ficocianina, B-ficoeritrina, R-ficoeritrina, rodamina, rojo Texas y lisamina. Anticuerpos secundarios ligados a fluorocromos pueden obtenerse comercialmente, por ejemplo IgG-FITC anti-humana F(ab')2 de cabra está disponible de Tago Immunologicals (Burlingame, CA).
Los marcadores indirectos incluyen varias enzimas bien conocidas en la técnica, tales como peroxidasa de rábano (HRP), fosfatasa alcalina (AP), ß-galactosidasa, ureasa y similares. Un sistema de detección de peroxidasa de rábano puede usarse, por ejemplo, con el substrato cromogénico tetrametilbencidina (TMB), el cual crea un producto soluble en presencia de peróxido de hidrógeno que es detectable a 450 nm. Un sistema de detección de fosfatasa alcalina puede usarse con el substrato cromogénico fosfato de p-nitrofenilo, por ejemplo, el cual crea un producto soluble fácilmente detectable a 405 nm. Similarmente, un sistema de detección de ß-galactosidasa puede usarse con el substrato cromogénico o-nitrofenil- -galactopiranósido (ONPG), el cual crea un producto soluble detectable a 410 nm. Un sistema de detección de ureasa puede usarse con un substrato tal como púrpura de urea-bromocresol (Sigma Immunochemicals; St. Louis, MO). Un anticuerpo secundario útil ligado a una enzima puede obtenerse de un número de fuentes comerciales, por ejemplo, IgG anti-humana F(ab')2 de cabra-fosfatasa alcalina se puede comprar de Jackson ImmunoResearch (West Grave, PA.).
Una señal proveniente del marcador directo o indirecto puede ser analizada, por ejemplo, usando un espectrofotómetro para detectar color proveniente de un substrato cromogénico; un contador de radiación para detectar radiación tal como contador gamma para la detección de 125l; o un fluorómetro para detectar fluorescencia en presencia de luz de cierta longitud de onda. Para la detección de anticuerpos ligados a enzimas, un análisis cuantitativo de la cantidad de niveles de marcadores puede hacerse usando un espectrofotómetro tal como un lector de microplaca EMAX (Molecular Devices; Menlo Park, CA) de acuerdo con las instrucciones del fabricante. Si se desea, los ensayos descritos en la presente pueden ser automáticos o llevarse a cabo robóticamente, y la señal proveniente de las diferentes muestras puede ser detectada simultáneamente.
Western blotting cuantitativo también se puede usar para detectar o determinar la presencia o nivel de uno o más marcadores en una muestra. Los Western blots pueden cuantificarse mediante métodos bien conocidos tales como densitometría de escaneo o formación de imágenes con fósforo. Como un ejemplo no limitativo, muestras de proteínas son sometidas a electroforesis en geles de Laemmli de 10% SDS-PAGE. Anticuerpos monoclonales de murino primarios se hacen reaccionar con el blot, y la unión a anticuerpo puede confirmarse como lineal usando un experimento de transferencia en ranura preliminar. Los anticuerpos acoplados a peroxidasa de rábano anti-ratón de cabra (BioRad) se usan como el anticuerpo secundario, y la detección de señal llevada a cabo usando quimioluminiscencia, por ejemplo, con el kit de quimioluminiscencia Renaissance (New England Nuclear; Boston, MA) de acuerdo con las instrucciones del fabricante. Autorradiografías de los blots se analizan usando un densitómetro de escaneo (Molecular Dynamics; Sunnyvale, CA) y se normalizan hasta un control positivo. Los valores se reportan, por ejemplo, como una relación entre el valor real al control positivo (índice densitométrico). Estos métodos se conocen bien en la técnica como se describe, por ejemplo, en Parra er a/., J. Vasc. Surg., 28:669-675 (1998).
Como alternativa, se puede usar una variedad de técnicas de ensayo inmunohistoquímico para detectar o determinar la presencia o nivel de uno o más marcadores en una muestra. El término "ensayo inmunohistoquímico" abarca técnicas que utilizan la detección visual de colorantes fluorescentes o enzimas acopladas (es decir, conjugadas) a anticuerpos que reaccionan con el marcador de interés usando microscopia fluorescente o microscopia de luz e incluye, sin limitación, ensayo de anticuerpos por fluorescencia directa, ensayo de anticuerpos por fluorescencia indirecta (IFA), ensayos de inmunofluorescencia de anticomplemento, inmunofluorescencia de avidina-biotina e inmunoperoxidasa. Un ensayo IFA, por ejemplo, es útil para determinar si una muestra es positiva para ANCA, el nivel de ANC en una muestra, si una muestra es positiva para pANCA, el nivel de pANCA en una muestra y/o un patrón de tinción de ANCA (por ejemplo, patrón de tinción de cANCA, pANCA, NSNA y/o SAPPA). La concentración de ANCA en una muestra puede ser cuantificada, por ejemplo, a través de titulación de punto final o a través de la medición de la intensidad visual de la fluorescencia en comparación con un estándar de referencia conocido.
Como alternativa, la presencia o nivel de un marcador de interés puede determinarse al detectar o cuantificar la cantidad del marcador purificado. La purificación del marcador puede lograrse, por ejemplo, mediante cromatografía de líquidos de alta presión (HPLC), sola o en combinación con espectrometría de masas (por ejemplo, MALDI MS, MALDI-TOF/MS, SELDI-TOF/ S, tándem MS, etc.). La detección cualitativa o cuantitativa de un marcador de interés también se puede determinar mediante métodos bien conocidos incluyendo, sin limitación, ensayos de Brdford, tinción con azul de Coomassie, tinción de plata, ensayos para proteína radiomarcada y espectrometría de masas.
El análisis de una pluralidad de marcadores puede llevarse a cabo por separado o simultáneamente con una muestra de prueba. Para el ensayo separado o secuencial de marcadores, aparatos adecuados incluyen analizadores de laboratorio clínicos tales como los sistemas de inmunoensayo ElecSys (Roche), AxSym (Abbott), el Access (Beckman), el ADVIA®, el CENTAUR® (Bayer), y el NICHOLS ADVANTAGE® (Nichols Institute). Los aparatos preferidos o chips de proteínas llevan a cabo ensayos simultáneos de una pluralidad de marcadores sobre una sola superficie. Los formatos físicos particularmente útiles comprenden superficies que tienen una pluralidad de ubicaciones discretas y dirigibles para la detección de una pluralidad de marcadores diferentes. Estos formatos incluyen microdisposiciones de proteínas, o "chips de proteínas" (véase, por ejemplo, Ng eí al., J. Cell Mol. Med., 6:329-340 (2002)) y ciertos dispositivos capilares (véase, por ejemplo, patente de E.U.A. No. 6,019,944). En estas modalidades, cada ubicación de superficie discreta puede comprender anticuerpos para inmovilizar uno o más marcadores para su detección en cada lugar. Las superficies pueden comprender como alternativa una o más partículas discretas (por ejemplo, micropartículas o nanopartículas) inmovilizadas en lugares discretos de una superficie, en donde las micropartículas comprenden anticuerpos para inmovilizar uno o más marcadores para detección.
Además de los ensayos descritos arriba para detectar la presencia o nivel de varios marcadores de interés, análisis de niveles de ARNm de marcadores usando técnicas de rutina tales como análisis Northern, reacción en cadena de la polimerasa por transcriptasa inversa (RT-PCR), o cualquier otro método a base de hibridación a una secuencia de ácido nucleico que sea complementaria a una porción de la secuencia de codificación del marcador (por ejemplo, hibridación de transferencia en ranura) también están dentro del alcance de la presente invención. Técnicas de amplificación por PCR aplicables se describen en, por ejemplo, Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, Inc. Nueva York (1999), capítulo 7 y suplemento 47; Theophilus et al., "PCR Mutation Detection Protocols," Humana Press, (2002); and Innis et al., PCR Protocols, San Diego, Academic Press, Inc. (1990). Los métodos de hibridación de ácido nucleico generales se describen en Anderson, "Nucleic Acid Hybridization," BIOS Scientific Publishers, 1999. La amplificación o hibridación de una pluralidad de secuencias de ácido nucleico transcriptas (por ejemplo, ARNm o ADNc) también se pueden llevar a cabo a partir de secuencias de ARNm o ADNc dispuestas en una microdisposición. Los métodos de microdisposición se describen generalmente en Hardiman, "Microarrays Methods and Applications: Nuts & Bolts," DNA Press, 2003; and Baldi et al., "DNA Microarrays and Gene Expression: From Experimente to Data Analysis and Modeling," Cambridge University Press, 2002.
Varios marcadores de interés pueden ser combinados en una prueba para un procesamiento eficiente de varias muestras. Además, un experto en la técnica reconocería el valor de probar varias muestras (por ejemplo, en puntos de tiempo sucesivos, etc.) del mismo sujeto. Estas pruebas de muestras en serie pueden permitir la identificación de cambios en niveles de marcadores con el tiempo. Incrementos o reducciones en niveles de marcadores, así como la ausencia de cambio en niveles de marcadores, también pueden proporcionar información de pronóstico y predictiva útil para facilitar el tratamiento de IBD.
Un panel para medir uno o más de los marcadores descritos arriba puede construirse para proporcionar información relevante relacionada con el enfoque de la invención para diagnosticar IBD, para predecir el curso y resultado probables de IBD, y para predecir la probabilidad de respuesta a terapia de IBD. Este panel puede construirse para detectar o determinar la presencia o nivel de 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, o más marcadores individuales. El análisis de un solo marcador o subconjuntos de marcadores también se puede llevar a cabo por un experto en la técnica en varios entornos clínicos. Estos incluyen, pero no están limitados a, entornos de análisis ambulatorios, de urgencias, de cuidado crítico, de terapia intensiva, de unidad de monitoreo, de pacientes internos, de pacientes externos, de consultorios médicos, de clínicas médicas y de salud.
El análisis de marcadores podría llevarse a cabo en una variedad de formatos físicos también. Por ejemplo, el uso de placas de microtitulación o automatización podría usarse para facilitar el procesamiento de grandes números de muestras de prueba. Como alternativa, formatos de muestra individual podrían ser desarrollados para facilitar el tratamiento, diagnóstico y pronóstico de una forma puntual.
En vista de lo anterior, un experto en la técnica se da cuenta de que los métodos de la invención para proporcionar información de diagnóstico con respecto a IBD o subtipos clínicos de la misma, para proporcionar información de pronóstico y predictiva con respecto al resultado y curso de progresión de IBD, y para proporcionar información relacionada con la selección de un régimen terapéutico adecuado para el tratamiento de IBD (por ejemplo, al determinar la presencia o nivel de concentración de uno o más marcadores de IBD como los descritos en la presente) puede llevarse a la práctica usando uno o cualquier combinación de los ensayos bien conocidos descritos arriba u otros ensayos conocidos en la técnica.
VII. Métodos de genotipificación Se puede usar una variedad de medios para genotipificar un individuo en un sitio polimorfico en un gen o cualquier otro marcador genético descrito en la presente para determinar si una muestra (por ejemplo, una muestra de ácido nucleico) contiene un alelo variante o haplotipo específico. Por ejemplo, la amplificación enzimática de ácido nucleico de un individuo puede usarse convenientemente para obtener ácido nucleico para análisis subsecuente. La presencia o ausencia de un alelo variante o haplotipo específico en uno o más marcadores genéticos de interés también se puede determinar directamente a partir del ácido nucleico del individuo sin amplificación enzimática. En algunas modalidades preferidas, un individuo es genotipificado en el locus ATG16L1. En otras modalidades preferidas, un individuo es genotipificado en el locus NKX2-3. En otras modalidades preferidas más, un individuo es genotipificado en el locus STAT3. En modalidades preferidas adicionales, un individuo es genotipificado en el locus ECM1.
La genotipificación de ácido nucleico de un individuo, ya sea amplificado o no, puede llevarse a cabo usando cualquiera de varias técnicas. Las técnicas útiles incluyen, sin limitación, análisis a base de reacción en cadena de la polimerasa (PCR), análisis de secuencia y análisis electroforéticos, que se pueden usar solos o en combinación. Según se usa en la presente, el término "ácido nucleico" significa un polinucleótido tal como una molécula de ADN o ARN de una sola o de doble hebra incluyendo, por ejemplo, ADN genómico, ADNc y ARNm. Este término abarca moléculas de ácido nucleico de origen tanto natural como sintético así como moléculas de configuración lineal, circular o ramificada que representan cualquiera de la hebra en sentido o antisentido, o ambas, de una molécula de ácido nucleico nativa. Se entiende que estos ácidos nucleicos pueden ser purificados, no purificados o unidos, por ejemplo, a un material sintético tal como una esfera o matriz de columna.
Material que contiene ácido nucleico se obtiene rutinariamente de individuos. Este material es cualquier material biológico del cual se pueda preparar ácido nucleico. Como ejemplos no limitativos, el material puede ser sangre entera, suero, plasma, saliva, frotis de cachete, esputo u otro fluido o tejido corporal que contenga ácido nucleico. En una modalidad, un método de la presente invención se practica con sangre entera, que se puede obtener fácilmente por medios no invasivos y usarse para preparar ADN genómico. En otra modalidad, la genotipificación incluye la amplificación del ácido nucleico de un individuo usando la reacción en cadena de la polimerasa (PCR). El uso de PCR para la amplificación de ácidos nucleicos se conoce bien en la técnica (véase, por ejemplo, Mullís et al., (Eds.), The Polymerase Chain Reaction, Birkháuser, Boston, (1994)). En otra modalidad más, la amplificación por PCR se lleva a cabo usando uno o más cebadores marcados fluorescentemente. En una modalidad más, la amplificación por PCR se lleva a cabo usando uno o más cebadores marcados o no marcados que contienen un ligando de unión al surco menor de ADN.
Cualquiera de una variedad de cebadores diferentes puede usarse para amplificar el ácido nucleico de un individuo por PCR para determinar así la presencia o ausencia de un alelo variante en uno o más genes u otro marcador genético en el método de la invención. Ejemplos no limitativos de genes incluyen ATG16L1 , STAT3, ECM1 y NKX2-3. Por ejemplo, los cebadores de PCR pueden usarse para amplificar regiones específicas del locus ATG16L1. Como se entiende por alguien de capacidad en la técnica, cebadores adicionales para análisis de PCR pueden diseñarse con base en el flanqueo de secuencia del sitio o sitios polimórficos de interés en el gen ATG16L1 u otro marcador genético. Como un ejemplo no limitativo, un cebador de secuencia puede contener de aproximadamente 15 a alrededor de 30 nucleótidos de una secuencia hacia el extremo 5' o hacia el extremo 3' del sitio polimórfico de interés en el gen ATG16L1 u otro marcador genético. Estos cebadores se diseñan generalmente para tener suficiente contenido de guanina y citosina como para lograr una alta temperatura de fusión que permita una etapa de fijación estable en la reacción de amplificación. Varios programas de computadora, tales como Primer Select, están disponibles para ayudar en el diseño de cebadores de PCR.
Un ensayo de discriminación alélica Taqman disponible de Applied Biosystems puede ser útil para genotipificar un individuo en un sitio polimórfico y de esta manera determinar la presencia o ausencia de un alelo variante o haplotipo particular en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético descrito en la presente. En un ensayo de discriminación alélica Taqman®, se construye una sonda marcada con colorante fluorescente específica para cada alelo. Las sondas contienen diferentes colorantes reporteros fluorescentes tales como FAM y VIC para diferenciar la amplificación de cada alelo. Además, cada sonda tiene un colorante extintor en un extremo que extingue la fluorescencia mediante transferencia de energía por resonancia de fluorescencia. Durante PCR, cada sonda se fija específicamente a secuencias complementarias en el ácido nucleico del individuo. La actividad nucleasa 5' de polimerasa Taq se usa para cortar sólo sondas que hibriden al alelo. El corte separa al colorante reportero del colorante extintor, dando como resultado fluorescencia incrementada por el colorante reportero. Así, la señal de fluorescencia generada por amplificación por PCR indica qué alelos están presentes en la muestra. Las no coincidencias entre una sonda y alelo reducen la eficiencia tanto de la hibridación como del corte de la sonda por polimerasa Taq, dando como resultado muy poca a ninguna señal fluorescente. Los expertos en la técnica entienden que especificidad mejorada en ensayos de discriminación alélica puede lograrse al conjugar un grupo de ligandos de unión al surco menor (MGB) de ADN con una sonda de ADN como se describe, por ejemplo, en Kutyavin et al., Nuc. Acids Research 28:655-661 (2000). Los ligandos de unión al surco menor incluyen, pero no están limitados a, compuestos tales como tripéptido de dihidrociclopirroloindol (DPI3). Ejemplos de sondas Taqman® adecuadas para detectar las variantesd alélicas en los genes ATG16L1 , STAT3, NKX2-3 y ECM1 están disponibles comercialmente de Applied Biosystems. Ejemplos no limitativos incluyen los números de catálogo: C_9095577_20 y C_11530586_10 (ATG16L1); C_29560274_10, C_25803068_10 y C_8690827_20 (EC 1); C_3140282_10 (STAT3); C_3018644_10, C_31657361 _10 y C_3018642_10 (NKX2-3).
En algunas modalidades, las sondas para detectar SNP rs2241880 de ATG16L1 comprenden las siguientes secuencias: CCCAGTCCCCCAGGACAATGTGGATACTCATCCTGGTTCTGGTAAAGAAGT; y CCCAGTCCCCCAGGACAATGTGGATGCTCATCCTGGTTCTGGTAAAGAAGT; ambas derivadas de CCCAGTCCCCCAGGACAATGTGGAT[A/G]CTCATCCTGGTTCTGGTAAAGAAGT; en donde la anotación [A/G] representa la ubicación del SNP rs2241880.
En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo A y la segunda sonda es FAM™ marcado y contiene el alelo G. Para detectar la presencia o la ausencia del SNP rs2241880, una señal FAM/FAM (G/G) o una señal VIC/VIC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo mutante heterocigótico.
En algunas modalidades, las sondas para detectar el SNP rs744166 de STAT3 comprende las siguientes secuencias: CTGTTTGTTCTATAAATTACTGTCAAGCTCGATTCCCTCAAGACATTACAG; y CTGTTTGTTCTATAAATTACTGTCAGGCTCGATTCCCTCAAGACATTACAG; ambas derivadas de CTGTTTGTTCTATAAATTACTGTCA[A/G]GCTCGATTCCCTCAAGACATTACAG, en donde la anotación [A/G] representa la ubicación del SNP rs744166. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo A y la segunda sonda es FAM™ marcado y contiene el alelo G. Para detectar la presencia o la ausencia del SNP rs744166, una señal FAM/FAM (G/G) o una señal VIC/VIC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo mutante heterocigótico.
En algunas modalidades, las sondas para detectar SNP rs3737240 de ECM1 comprende las siguientes secuencias: CCCACTGTTTTCCCCATTCCAGGAACGCCAGCTCCATTTGGGGACCAGAGC; y CCACTGTTTTCCCCATTCCAGGAATGCCAGCTCCATTTGGGGACCAGAGC; ambas derivadas de CCCACTGTTTTCCCCATTCCAGGAA[C/T]GCCAGCTCCATTTGGGGACCAGAGC; en donde la anotación [C T] representa la ubicación del SNP rs3737240. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo C y la segunda sonda es FAM™ marcado y contiene el alelo T. Para detectar la presencia o la ausencia del SNP rs3737240, una señal FAM/FAM (T/T) o una señal VIC/VIC (C/C) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo mutante heterocigótico.
En algunas modalidades, las sondas para detectar SNP rs13294 de ECM1 comprenden las siguientes secuencias: CCGGGACATCTTGACCATTGACATCAGTCGAGTCACCCCCAACCTCATGGG; y CCGGGACATCTTGACCATTGACATCGGTCGAGTCACCCCCAACCTCATGGG; ambas derivadas de CCGGGACATCTTGACCATTGACATC[A/G]GTCGAGTCACCCCCAACCTCATGGG; en donde la anotación [A/G] representa la ubicación del SNP rs13294. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo A y la segunda sonda es FAM™ marcado y contiene el alelo G. Para detectar la presencia o la ausencia del SNP rs13294, una señal FAM/FAM (G/G) o una señal VIC/VIC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo muíante heterocigótico.
En algunas modalidades, las sondas para detectar SNP rs10883365 de NKX2-3 comprenden las siguientes secuencias: TTTCGTTCTCAG ACG GTTTG AAG GTATTTGTGCC AACGTG ACCCCCG G GG A; y TTTCGTTCTCAGACGGTTTGAAGGTGTTTGTGCCAACGTGACCCCCGGGGA; ambas derivadas de TTTCGTTCTCAGACGGTTTGAAGGT[A/G]TTTGTGCCAACGTGACCCCCGGGGA; en donde la anotación [A/G] representa la ubicación del SNP rs10883365. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo A y la segunda sonda es FAM™ marcado y contiene el alelo G. Para detectar la presencia o la ausencia del SNP rs10883365, una señal FAM/FAM (G/G) o una señal VIC/VIC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo muíante heterocigótico.
En algunas modalidades, las sondas para deíectar SNP rs6584283 de NKX2-3 comprenden las siguientes secuencias: CTGCAGAGCGTCTGTGGGCGTGTATCGGCGATCAGGCGCTGGAGGGGCGCT; y CTGCAGAGCGTCTGTGGGCGTGTATTGGCGATCAGGCGCTGGAGGGGCGCT; ambas derivadas de CTGCAGAGCGTCTGTGGGCGTGTAT[C/T]GGCGATCAGGCGCTGGAGGGGCGCT; en donde la anotación [C T] representa la ubicación del SNP rs6584283. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo C y la segunda sonda es FAM™ marcado y contiene el alelo T. Para detectar la presencia o la ausencia del SNP rs6584283, una señal FAM/FAM (T/T) o una señal VICA IC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo mutante heterocigótico.
En algunas modalidades, las sondas para detectar SNP rs7511649 de ECM1 comprenden las siguientes secuencias: TTTCTGACTTCTCCCTGTAAATCTTCTTCTGTATGATTTATTTTGGTAGAT; y TTTCTGACTTCTCCCTGTAAATCTTTTTCTGTATGATTTATTTTGGTAGAT; ambas derivadas de TTTCTGACTTCTCCCTGTAAATCTT[C/T]TTCTGTATGATTTATTTTGGTAGAT; en donde la anotación [C/T] representa la ubicación del SNP rs751 1649. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo C y la segunda sonda es FAM™ marcado y contiene el alelo T. Para detectar la presencia o la ausencia del SNP rs7511649, una señal FAM/FAM (T/T) o una señal VICA/IC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo mutante heterocigótico.
En otras modalidades, las sondas para detectar SNP rs11190140 de NKX2- 3 comprenden las siguientes secuencias: CATTCAGGCTCCTGATTTCAATAGGCGGAAAAGAAGGCTGCCAAGGCTGGG; y CATTCAGGCTCCTGATTTCAATAGGTGGAAAAGAAGGCTGCCAAGGCTGGG; ambas derivadas de CATTCAGGCTCCTGATTTCAATAGG[C/T]GGAAAAGAAGGCTGCCAAGGCTGGG; en donde la anotación [C/T] representa la ubicación del SNP rs1 1190140. En modalidades adicionales, la primera sonda es colorante VIC™ marcado y contiene el alelo C y la segunda sonda es FAM™ marcado y contiene el alelo T. Para detectar la presencia o la ausencia del SNP rs11190140, una señal FAM/FA (T T) o una señal VIC/VIC (A/A) indicaría un genotipo homocigótico; y una señal VIC/FAM indicaría un genotipo muíante heterocigótico.
El análisis de secuencia también puede ser útil para genotipificar a un individuo de acuerdo con los métodos descritos en la presente para determinar la presencia o ausencia de un alelo variante o haplotipo particular en el gen NOD2 u otro marcador genético. Como se conoce por aquellos expertos en la técnica, un alelo variante de interés puede detectarse mediante análisis de secuencia usando los cebadores adecuados, los cuales se diseñan con base en la secuencia que flanquea al sitio polimórfico de interés en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético. Cebadores de secuencia adicionales o alternativos pueden contener alrededor de 15 a aproximadamente 30 nucleótidos de una secuencia que corresponda a una secuencia de alrededor de 40 a aproximadamente 400 pares de bases hacia el extremo 5' o hacia el extremo 3' del sitio polimórfico de interés en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético. Estos cebadores se diseñan generalmente para tener suficiente contenido de guanina y citosina para lograr una alta temperatura de fusión que permita una etapa de fijación estable en la reacción de secuenciación.
El término "análisis de secuencia" incluye cualquier proceso manual o automático mediante el cual el orden de nucleótidos en un ácido nucleico sea determinado. Como un ejemplo, se puede usar análisis de secuencia para determinar la secuencia de nucleótidos de una muestra de ADN. El término análisis de secuencia abarca, sin limitación, métodos químicos y enzimáticos tales como métodos disdesoxienzimáticos incluyendo, por ejemplo, secuenciación de Maxam-Gilbert y Sanger así como variaciones de la misma. El término análisis de secuencia abarca además, pero no está limitado a, secuenciación de ADN de disposición capilar, que se basa en electroforesis capilar y detección por fluorescencia inducida con láser y se puede llevar a cabo usando instrumentos tales como el MegaBACE 1000 o ABI 3700. Como ejemplos no limitativos adicionales, el término análisis de secuencia abarca secuenciación por ciclo térmico (véase, Sears et al., Biotechniques 13:626-633 (1992)); secuenciación en fase sólida (véase, Zimmerman er a/., Methods Mol. Cell Bioo. 3:39-42 (1992); y secuenciación con espectrometría de masas, tal como espectrometría de masas por desorción láser asistida con matriz/tiempo de vuelo de ionización (véase, MALDI-TOF MS; Fu et al., Nature Biotech. 16:381-384 (1998)). El término análisis de secuencia incluye además, pero no está limitado a, secuenciación por hibridación (SBH), que se basa en una disposición de todos los oligonucleótidos cortos posibles para identificar un segmento de secuencia (véase, Chee et al., Science 274:610-614 (1996); Drmanac et al., Science 260:1649-1652 (1993); y Drmanac er a/., Nature Biotech, 16:54-58 (1998)). Un experto en la técnica entiende que éstas y variaciones adicionales son abarcadas por el término análisis de secuencia según se define en la presente.
Análisis electroforético también puede ser útil para genotipificar un individuo de acuerdo con los métodos de la presente invención para determinar la presencia o ausencia de un alelo variante o haplotipo particular en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético. "Análisis electroforético" según se usa en la presente en referencia a uno o más ácidos nucleicos tales como fragmentos amplificados incluye un proceso con el cual moléculas cargadas son movidas a través de un medio estacionario bajo la influencia de un campo eléctrico. La migración electroforética separa ácidos nucleicos principalmente con base en su carga, que es en proporción a su tamaño, con moléculas más pequeñas migrando más rápidamente. El término análisis electroforético incluye, sin limitación, análisis usando electroforesis en gel de placa, tal como electroforesis en gel de agarosa o poliacrilamida, o electroforesis capilar. El análisis electroforético capilar generalmente se presenta dentro de un capilar de cuarzo de diámetro pequeño (5-100 m) en presencia de altos voltajes separadores (a nivel kilovoltios) con tiempos de separación de pocos minutos. Usando análisis electroforético capilar, ácidos nucleicos son detectados convenientemente por absorción UV o marcado fluorescente, y resolución de base individual puede obtenerse en fragmentos de hasta varios cientos de pares de bases. Estos métodos de análisis electroforético, y variaciones de los mismos, se conocen bien en la técnica, como se describe, por ejemplo, en Ausubel et al., Current Protocole in Molecular Biology capítulo 2 (suplemento 45) John Wiley & Sons, Inc. Nueva York (1999).
El análisis de polimorfismo de longitud de fragmento de restricción (RFLP) también puede ser útil para genotipificar un individuo de acurdo con los métodos de la presente invención para determinar la presencia o ausencia de un alelo variante o haplotipo particular en el gen NOD2 u otro marcador genético (véase, Jarcho et ai, in Dracopoli et al., Current Protocols in Human Genetics páginas 2.7.1-2.7.5, John Wiley & Sons, Nueva York; Innis et al., (Ed.), PCR Protocols, San Diego: Academic Press, Inc. (1990)). Según se usa en la presente "análisis de polimorfismo de longitud de fragmento de restricción" incluye cualquier método para distinguir alelos polimórficos usando una enzima de restricción, que es una endonucleasa que cataliza la degradación de ácido nucleico después del reconocimiento de una secuencia de base específica, generalmente un palíndromo o repetición invertida. Un experto en la técnica entiende que el uso de análisis RFLP depende de una enzima que puede diferenciar un alelo variante de un alelo tipo silvestre u otro en un sitio polimórfico.
Además, hibridación de oligonucleótidos específica de alelo puede usarse para genotipificar un individuo en los métodos descritos aquí para determinar la presencia o ausencia de un alelo variante o haplotipo particular en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético. La hibridación de oligonucleótidos específica de alelos se basa en el uso de una sonda de oligonucleótidos marcada que tiene una secuencia perfectamente complementaria, por ejemplo, a la secuencia que abarca el alelo variante. Bajo condiciones adecuadas, la sonda específica de alelo variante híbrida a un ácido nucleico que contiene el alelo variante pero no híbrida al uno o más de otros alelos, los cuales tienen una o más no coincidencias de nucleótidos en comparación con la sonda. Si se desea, una segunda sonda de oligonucleótidos específica de alelo que coincida con un alelo alterno (por ejemplo, tipo silvestre) también puede ser usada. En forma similar, la técnica de amplificación de oligonucleótidos específica de alelos puede usarse para amplificar selectivamente, por ejemplo, un alelo variante usando un cebador de oligonucleótidos específico de alelo que sea perfectamente complementario a la secuencia de nucleótidos del alelo variante pero que tenga una o más no coincidencias en comparación con otros alelos (Mullís et al., citado arriba). Un experto en la técnica entiende que la una o más no coincidencias de nucleótidos que distinguen entre el alelo variante y otros alelos comúnmente se ubican en el centro de un cebador de olígonucleótido específico de alelo que se usará en la hibridación de oligonucleótidos específica de alelos. En contraste, un cebador de olígonucleótido específico de alelo que se usará en amplificación por PCR generalmente contiene la una o más no coincidencias de nucleótidos que distinguen entre el alelo variante y otros en el extremo 3' del cebador.
Un ensayo de movilidad de heterodúplex (HMA) es otro ensayo bien conocido que se puede usar para genotipificar en los métodos de la presente invención para determinar la presencia o ausencia de un alelo variante o haplotipo particular en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético. HMA Es útil para detectar la presencia de un alelo variante toda vez que un dúplex de ADN que porta una no coincidencia tiene movilidad reducida en un gel de poliacrilamida en comparación con la movilidad de un dúplex apareado en bases perfectamente (véase, Delwart et al., Science, 262:1257-1261 (1993); White et al., Genomics, 12:301-306 (1992)).
La técnica de polimorfismo conformacional de hebra individual (SSCP) también puede ser útil para genotipificar en los métodos descritos aquí para determinar la presencia o ausencia de un alelo variante o haplotipo particular en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético (véase, Hayashi, Methods Applic, 1 :34-38 (1991 )). Esta técnica se usa para detectar alelos variantes con base en diferencias en la estructura secundaria de ADN de hebra individual que producen una movilidad electroforética alterada después de electroforesis en gel no desnaturalizante. Alelos variantes son detectados por comparación del patrón electroforético del fragmento de prueba con fragmentos estándares correspondientes que contengan alelos conocidos.
Electroforesis en gel con gradiente de desnaturalización (DGGE) también puede ser útil en los métodos de la invención para determinar la presencia o ausencia de un alelo variante o haplotipo particular en uno o más de los genes ATG16L1 , ECM1 , STAT3, NKX2-3, u otro marcador genético. En DGGE, ADN de doble hebra se le somete a electroforesis en un gel que contiene una concentración cada vez más alta de desnaturalizante; fragmentos de doble hebra constituidos de alelos no coincididos tienen segmentos que se fusionan más rápidamente, causando que estos fragmentos migren diferentemente en comparación con secuencias perfectamente complementarias (véase, Sheffield et al., "Identifying DNA Polymorphisms by Denaturing Gradient Gel Electrophoresis" in Innis er a/., citado arriba, 1990).
Otros métodos moleculares útiles para genotipificacion de un individuo se conocen en la técnica y son útiles en los métodos de la presente invención. Estos enfoques de genotipificacion bien conocidos incluyen, sin limitación, secuenciación automática y técnicas de no coincidencia de RNasa (véase, Winter et al., Proc. Nati. Acad. Sci., 82:7575-7579 (1985)). Además, un experto en la técnica entiende que, cuando la presencia o ausencia de varios alelos variantes vaya a ser determinada, alelos variantes individuales pueden detectarse por cualquier combinación de métodos moleculares. Véase, en general, Birren et al. (Eds.) Genome Analysis: A Laboratory Manual volumen 1 (Analyzing DNA) Nueva York, Cold Spring Harbor Laboratory Press (1997). Además, un experto en la técnica entiende que varios alelos variantes pueden detectarse en reacciones individuales o en una sola reacción (un ensayo "múltiple").
En vista de lo anterior, un experto en la técnica se da cuenta de que los métodos de la invención para proporcionar información de diagnóstico con respecto a IBD o subtipos clínicos de la misma, para proporcionar información de pronóstico y predictiva con respecto al resultado y curso de progresión de IBD, y para proporcionar información con relación a la selección de un régimen terapéutico adecuado para el tratamiento de IBD (por ejemplo, al determinar la presencia o ausencia de uno o más alelos variantes de genes tales como, pero no limitados a, ATG16L1 , STAT3, ECM1 y NKX2-3) puede llevarse a la práctica usando uno o cualquier combinación de los ensayos de genotipificacion bien conocidos descritos arriba u otros ensayos conocidos en la técnica.
VIII. Análisis estadístico En algunos aspectos, la presente invención proporciona métodos y sistemas para diagnosticar IBD o no IBD, para clasificar el diagnóstico de IBD (por ejemplo, CD, UC o no concluyente para CD o UC), para clasificar el subtipo de IBD como UC, CD o IC, o para diferenciar entre UC y CD. En algunas modalidades, uno o más sistemas clasificadores estadísticos de aprendizaje se aplican a la presencia, nivel y/o genotipo de uno o más marcadores de IBD determinados por cualquiera de los ensayos descritos en la presente para diagnosticar IBD o para determinar el subtipo de la misma. En otras modalidades, análisis de cuantiles se aplican a la presencia, nivel y/o genotipo de uno o más marcadores de IBD determinados por cualquiera de los ensayos descritos en la presente para diagnosticar IBD o para determinar el subtipo de la misma. Como se describe en la presente, los análisis estadísticos de la invención proporcionan adecuadamente sensibilidad y especificidad mejorada, valor predictivo negativo, valor predictivo positivo y/o precisión general para diagnosticar IBD o para determinar el subtipo de la misma.
El término "análisis estadístico" o "algoritmo estadístico" o "proceso estadístico" incluye cualquiera de una variedad de métodos y modelos estadísticos usados para determinar relaciones de entre variables. En la presente invención, las variables son la presencia, nivel o genotipo de al menos un marcador de interés. Cualquier número de marcadores puede analizarse usando un análisis estadístico descrito en la presente. Por ejemplo, la presencia o nivel de 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, o más marcadores puede incluirse en un análisis estadístico. En una modalidad, se usa relación logística. En otra modalidad, se usa regresión lineal. En ciertas modalidades, los análisis estadísticos de la presente invención comprenden una medición de cuantiles de uno o más marcadores, por ejemplo, dentro de una población dada, como una variable. Los cuantiles son un conjunto de "puntos de corte" que dividen una muestra de datos en grupos que contienen (lo más posible) números iguales de observaciones. Por ejemplo, los cuartiles son valores que dividen una muestra de datos en cuatro grupos que contienen (en la medida de lo posible) números iguales de observaciones. El cuartil inferior es el valor de datos un cuarto arriba hasta el conjunto de datos ordenado; el cuartil superior es el valor de datos un cuarto abajo hasta el conjunto de datos ordenados. Los quintiles son valores que dividen una muestra de datos en cinco grupos que contienen (en la medida de lo posible) números iguales de observaciones. La presente invención también puede incluir el uso de intervalos porcentuales de niveles de marcadores (por ejemplo, terciles, cuartiles, quintiles, etc.), o sus índices acumulativos (por ejemplo, sumas de cuartiles de niveles de marcadores para obtener puntuaciones de suma de cuartiles (QSS), etc.) como variables en los análisis estadísticos (al igual que con las variables continuas).
En ciertas modalidades, la presente invención incluye detectar o determinar la presencia, nivel (por ejemplo, magnitud) y/o genotipo de uno o más marcadores de interés usando análisis de cuartiles. En este tipo de análisis estadístico, el nivel de un marcador de interés se define como estando en el primer cuartil (<25%), segundo cuartil (25-50%), tercer cuartil (51%->75%) o cuarto cuartil (75-100%) en relación con una base de datos de muestras de referencia. A estos cuartiles se les puede asignar una puntuación de cuartil de 1 , 2, 3 y 4, respectivamente. En ciertos casos, un marcador que no sea detectado en una muestra le es asignado una puntuación de cuartil de 0 ó 1 , mientras que un marcador que se detecte (por ejemplo, presente) en una muestra (por ejemplo, la muestra sea positiva para el marcador) se le asigne una puntuación de cuartil de cuatro. En algunas modalidades, el cuartil 1 representa muestras con los niveles de marcador más bajos, mientras que el cuartil 4 representa muestras con los niveles de marcador más altos. En otras modalidades, el cuartil 1 representa muestras con un genotipo de un marcador particular (por ejemplo, el haplotipo silvestre), mientras que el cuartil 4 representa muestras con otro genotipo de marcador particular (por ejemplo, variante alélica). La base de datos de muestras de referencia puede incluir un gran espectro de pacientes de IBD (por ejemplo, CD y/o UC). A partir de esa base de datos, se pueden establecer límites de cuartiles. Un ejemplo no limitativo de análisis de cuartiles adecuado para usarse en la presente invención se describe en, por ejemplo, Mow et al., Gastroenterology 126:414-24 (2004).
En modalidades preferidas, los análisis estadísticos de la invención comprenden uno o más sistemas clasificadores estadísticos de aprendizaje. Según se usa en la presente, el término "sistema clasificador estadístico de aprendizaje" incluye una técnica algorítmica de aprendizaje con máquina capaz de adaptarse a conjuntos de datos complejos (por ejemplo, panel de marcadores de interés) y de tomar decisiones con base en estos conjuntos de datos. En algunas modalidades, se usa un solo sistema clasificador estadístico de aprendizaje tal como un árbol de decisión/clasificación (por ejemplo, bosque aleatorio (RF) o árbol de clasificación y regresión (C&RT)). En otras modalidades, se usa una combinación de 2, 3, 4, 5, 6, 7, 8, 9, 10, o más sistemas clasificadores estadísticos de aprendizaje, de preferencia en tándem. Ejemplos de sistemas clasificadores estadísticos de aprendizaje incluyen, pero no están limitados a, aquellos que usan aprendizaje inductivo (por ejemplo, árboles de decisión/clasificación tales como árboles de clasificación y regresión (C&RT), árboles reforzados, etc.), aprendizaje probablemente aproximadamente correcto (PAC), aprendizaje conexionista (por ejemplo, redes neurales (NN), redes neurales artificiales (ANN), redes neuro difusas (NFN), estructuras de red, perceptrones tales como perceptrones de capas múltiples, redes de alimentación hacia adelante de capas múltiples, aplicaciones de redes neurales, aprendizaje Bayesiano en redes de creencia, etc.), aprendizaje de refuerzo (por ejemplo, aprendizaje pasivo en un ambiente conocido tal como aprendizaje naive, aprendizaje dinámico adaptivo y aprendizaje de diferencia temporal, aprendizaje pasivo en un ambiente desconocido, aprendizaje activo en un ambiente desconocido, funciones de acción-valor de aprendizaje, aplicaciones de aprendizaje de refuerzo), y algoritmos genéticos y programación evolutiva. Otros sistemas clasificadores estadísticos de aprendizaje incluyen máquinas de vectores de soporte (por ejemplo, métodos de Kernel), estrías de regresión adaptiva multivariada (MARS), algoritmos de Levenberg-Marquardt, algoritmos de Gauss-Newton, mezclas de gaussianos, algoritmos descendentes de gradiente y cuantificación de vectores de aprendizaje (LVQ).
Los bosques aleatorios son sistemas clasificadores estadísticos de aprendizaje que se construyen usando un algoritmo desarrollado por Leo Breiman y Adele Cutler. Los bosques aleatorios usan un gran número de árboles de decisión individuales y deciden la clase al seleccionar el modo (es decir, que ocurra más frecuentemente) de las clases según se determina por los árboles individuales. El análisis de bosque aleatorio puede llevarse a cabo, por ejemplo, usando el software RandomForest disponible de Salford Systems (San Diego, CA). Véase, por ejemplo, Breiman, Machine Learning, 45:5-32 (2001); y http://stat-wvvw.berkeley.edu/usersA)reiman/RandomForests/cc_home.htm, para una descripción de bosques aleatorios.
Los árboles de clasificación y regresión representan una alternativa intensa en computadora para ajustar modelos de regresión clásicos y se usan típicamente para determinar el mejor modelo posible para una respuesta categórica o continua de interés con base en uno o más predictores. El análisis de árboles de clasificación y regresión puede llevarse a cabo, por ejemplo, usando el software C&RT disponible de Salford Systems o el software de análisis de datos Statistica disponible de StatSoft, Inc. (Tulsa, OK), Una descripción de árboles de clasificación y regresión se encuentra, por ejemplo, en Breiman et al. "Classification and Regression Trees," Chapman y Hall, New York (1984); y Steinberg et al., "CART: Tree-Structured Non-Parametric Data Analysis," Salford Systems, San Diego, (1995).
Las redes neurales son grupos interconectados de neuronas artificiales que usan un modelo matemático o computacional para procesamiento de información con base en un enfoque conexionista para computación. Típicamente, las redes neurales son sistemas adaptivos que cambian su estructura con base en la información externa o interna que fluye a través de la red. Ejemplos específicos de redes neurales incluyen redes neurales de alimentación delantera tales como perceptrones, perceptrones de capa individual, perceptrones de capas múltiples, redes de retropropagación, redes ADALINE, redes MADALINE, redes Leammatrix, o redes de función de base radial (RBF) y mapas de auto-organización o redes de auto-organización de Kohonen; redes neurales recurrentes tales como redes recurrentes simples y redes de Hopfield; redes neurales estocásticas tales como máquinas de Boltzman; redes neurales modulares tales como comité de máquinas y redes neurales asociativas; y otros tipos de redes tales como redes neurales entrenadas instantáneamente, redes neurales de picos, redes naturales dinámicas y redes neurales en cascada. El análisis de redes neurales puede llevarse a cabo, por ejemplo, usando el software de análisis de datos Statistica disponible de StatSoft, Inc. Véase, por ejemplo, Freeman eí al., In "Neural Networks: Algorithms, Applications and Programming Techniques," Addison-Wesley Publishing Company (1991); Zadeh, Information and Control, 8:338-353 (1965); Zadeh, "IEEE Trans. on Systems, Man and Cybernetics," 3:28-44 (1973); Gersho et al., In "Vector Quantization and Signal Compression," Kluywer Academic Publishers, Boston, Dordrecht, Londres (1992); and Hassoun, "Fundamentáis of Artificial Neural Networks," MIT Press, Cambridge, Massachusetts, London (1995), para una descripción de redes neurales.
Las máquinas de vectores de soporte son un conjunto de técnicas de aprendizaje supervisadas relacionadas usadas para clasificación y regresión y se describen, por ejemplo, en Cristianini et al., "An Introduction to Support Vector Machines and Other Kernel-Based Learning Methods," Cambridge University Press (2000). El análisis de máquinas de vectores de soporte puede llevarse a cabo, por ejemplo, usando el software, SN/M"9"' desarrollado por Thorsten Joachims (Cornell University) o usando el software LIBSVM software desarrollado por Chih-Chung Chang and Chih-Jen Lin (National Taiwan University).
Los diferentes métodos y modelos estadísticos descritos en la presente pueden ser entrenados y probados usando una cohorte de muestras (por ejemplo, muestras serológicas y/o genómicas) de individuos sanos y de pacientes con IBD (por ejemplo, CD y/o UC). Por ejemplo, muestras de pacientes diagnosticados por un médico, y de preferencia por un gastroenterólogo, como teniendo IBD o un subtipo clínico de la misma usando una biopsia, coronoscopia o un inmunoensayo como el descrito en, por ejemplo, patente de E.U.A. No. 6,218,129, son adecuadas para usarse en entrenamiento y prueba de los métodos y modelos estadísticos de la presente invención. Muestras de pacientes diagnosticados con IBD también se pueden estratificar en enfermedad de Crohn o colitis ulcerosa usando un inmunoensayo como se describe en, por ejemplo, patentes de E.U.A. Nos. 5,750,355 y 5,830,675. Muestras de individuos sanos pueden incluir aquellas que no fueron identificadas como muestras de IBD. Un experto en la técnica reconocerá técnicas y criterios de diagnóstico adicionales para obtener una cohorte de muestras de pacientes que se puedan usar en entrenamiento y prueba de los métodos y modelos estadísticos de la presente invención.
Según se usa en la presente, el término "sensibilidad" se refiere a la probabilidad de que un método, sistema o código de diagnóstico o predictivo de la presente invención dé un resultado positivo cuando la muestra sea positiva, por ejemplo, tenga el diagnóstico predicho. La sensibilidad se calcula como el número de resultados verdaderos positivos dividido entre la suma de los verdaderos positivos y falsos negativos.
La sensibilidad es esencialmente una medida de qué tan bien la presente invención identifica correctamente a aquellos que tengan el diagnóstico predicho de aquellos quienes no tengan el diagnóstico predicho. Los métodos y modelos estadísticos pueden seleccionarse de tal manera que la sensibilidad sea de al menos aproximadamente 60%, y puede ser, por ejemplo, de al menos aproximadamente 65%, 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, O 99%.
El término "especificidad" se refiere a la probabilidad de que un método, sistema o código de diagnóstico o predictivo de la presente invención dé un resultado negativo cuando la muestra no sea positiva, por ejemplo, no tenga el diagnóstico predicho. Específicamente, se calcula como el número de resultados verdaderos negativos dividido entre la suma de los verdaderos negativos y falsos positivos. La especificidad es esencialmente una medida de qué tan bien la presente invención excluye aquellos que no tienen el diagnóstico predicho de aquellos quienes tienen el diagnóstico predicho. Los métodos y modelos estadísticos pueden seleccionarse de tal manera que la especificidad sea de al menos aproximadamente 60%, y puede ser, por ejemplo, de al menos alrededor de 65%, 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, O 99%.
Según se usa en la presente, el término "valor predictivo negativo" o "NPV" se refiere a la probabilidad de que un individuo identificado como no teniendo el diagnóstico predicho realmente no tenga el diagnóstico predicho. El valor predictivo negativo puede calcularse como el número de verdaderos negativos dividido entre la suma de verdaderos negativos y falsos negativos. El valor predictivo negativo se determina por las características del método, sistema o código de diagnóstico o predictivo así como la prevalencia de la enfermedad en la población analizada. Los métodos y modelos estadísticos pueden seleccionarse de tal manera que el valor predictivo negativo en una población que tenga una prevalencia de enfermedad esté en el intervalo de alrededor de 70% a aproximadamente 99% y puede ser, por ejemplo, al menos alrededor de 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99%.
El término "valor predictivo positivo" o "PPV" se refiere a la probabilidad de que un individuo identificado como teniendo el diagnóstico predicho realmente tenga el diagnóstico predicho. El valor predictivo positivo puede calcularse como el número de verdaderos positivos dividido entre la suma de los verdaderos positivos y falsos positivos. El valor predictivo positivo se determina por las características del método, sistema o código de diagnóstico o predictivo así como la prevalencia de la enfermedad en la población analizada. Los métodos y modelos estadísticos pueden seleccionarse de tal manera que el valor predictivo positivo en una población que tenga una prevalencia de enfermedad esté en el intervalo de aproximadamente 70% a alrededor de 99%, y puede ser, por ejemplo, al menos aproximadamente 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81 %, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99%.
Los valores predictivos, incluyendo valores predictivos negativos y positivos, son influenciados por la prevalencia de la enfermedad en la población analizada. En la presente invención, los métodos y modelos estadísticos pueden seleccionarse para producir un parámetro clínico deseado para una población clínica con una prevalencia de IBD particular. Por ejemplo, métodos y modelos estadísticos pueden seleccionarse para una prevalencia de IBD de hasta aproximadamente 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, o 70%, lo cual puede verse, por ejemplo, en el consultorio de un médico tal como en el consultorio de un gastroenterólogo o en el consultorio de un médico general.
Según se usa en la presente, el término "acuerdo total" o "precisión total" se refiere a la precisión con la cual un método, sistema o código de diagnóstico o predictivo de la invención diagnostica o predice IBD. La precisión total se calcula como la suma de los verdaderos positivos y verdaderos negativos dividida entre el número total de resultados de muestra y es afectada por la prevalencia de la enfermedad en la población analizada. Por ejemplo, los métodos y modelos estadísticos de la invención pueden seleccionarse de tal manera que la precisión total en una población de pacientes que tenga una prevalencia de enfermedad sea de al menos aproximadamente 40%, y puede ser, por ejemplo, de al menos alrededor de 40%, 41 %, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51 %, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81 %, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, o 99%.
En modalidades particulares, los métodos y modelos estadísticos descritos en la presente para modelado predictivo de marcadores de diagnóstico relacionados con IBD utilizan el método de bosque aleatorio para construcción de modelos. Un bosque aleatorio es generalmente un clasificador constituido de muchos árboles de decisión con un componente aleatorio para construir cada árbol. Cada árbol de decisión aborda el mismo problema de clasificación, pero con una colección diferente de ejemplos y un subconjunto diferente de características seleccionadas aleatoriamente a partir del conjunto de datos de ejemplos proporcionado.
En algunas modalidades, un solo árbol podría construirse usando 2/3 aleatorio de las muestras disponibles (por ejemplo, conjunto de entrenamiento), con un 2/3 aleatorio de las características seleccionadas para tomar una decisión dividida en cada nodo del árbol. Una vez que el bosque se construye durante el entrenamiento, nuevos ejemplos son clasificados al tomar un voto a través de todos los árboles de decisión. En el caso más simple para un clasificador de bosque aleatorio clase 2, la clase con la mayoría de los votos gana. En otros casos, el límite para un número ganador de votos, según se establezca durante el entrenamiento es preestablecido para optimizar mediciones de desempeño. En algunos casos, si falsos positivos son más costosos que falsos negativos, el límite podría establecerse más alto.
El método es muy robusto para modelar este tipo de datos estadísticos toda vez que es altamente preciso. Ya que cada árbol de decisión se construye a partir de un subconjunto diferente de los datos, es menos propenso a un sobre-ajuste de los datos que otros enfoques de aprendizaje con máquina. El método es también inherentemente resistente a sobre-entrenamiento gracias a su naturaleza de ensamble. Típicamente, un gran número de árboles son cultivados y entrenados a subconjuntos aleatorios de datos de entrenamiento y se hacen predicciones al promediar los resultados de árboles individuales. Cualquier sobre-ajuste o desempeño inferior por un árbol individual tiende a cancelarse cuando el promedio de ensamble se computa. Las ventajas del modelado por bosque aleatorio incluyen sobre-entrenamiento mínimo debido a cancelación, creación de regiones de forma arbitraria en el espacio predictor, creación de mapeos no lineales arbitrarios, importancia de variables y perifericidad. El método tiene la capacidad de clasificar la importancia de variables (marcadores) y tiene eficiencia computacional cuando hay un re-muestreo.
En algunos aspectos, el modelado por bosque aleatorio de la presente invención comprende un método de ensamble, en donde el bosque comprende miles de árboles de decisión. Un árbol de decisión puede usarse para predecir al generar una secuencia de preguntas (por ejemplo, divisiones). En un nodo dado en la secuencia, la pregunta (por ejemplo, división) que se hace depende de las respuestas a las preguntas previas. Un árbol selecciona la mejor división en cada nodo con base en qué tan bien separa las clases. Los árboles se producen al usar diferentes sub-muestras aleatorias de datos de entrenamiento. En otros casos, los árboles se producen usando diferentes sub-conjuntos aleatorios de marcadores en cada nodo. Durante el modo de predicción, la probabilidad de cada clase es una fracción de los árboles en el algoritmo que lo predice.
En algunas modalidades, las etapas generales de bosque aleatorio incluyen: (1 ) construir un árbol de división recursiva convencional a partir de casi 2/3 de los datos disponibles para entrenamiento, en donde no se emplee ninguna depuración o poda subsecuente; (2) considerar sólo un pequeño y diferente subconjunto de variables disponibles en cada nodo, en donde el subconjunto no sea mayor que la raíz cuadrada del número de variables; (3) repetir las etapas 1 y 2 una pluralidad de veces para crear varios árboles (un bosque); y (4) durante el modo de predicción, reportar una calificación que sea la fracción de árboles en el bosque que prediga una clase dada. Luego se puede emplear un límite para producir una predicción de clases (por ejemplo, diagnóstico de IBD, no IBD, IC, UC o CD o categorización de la muestra como no concluyente para CD y UC).
En ciertas modalidades, el algoritmo de diagnóstico de IBD se establece usando una cohorte retrospectiva de diagnósticos predichos con presencia, ausencia y/o niveles conocidos de marcadores de inflamación sero-genéticos (por ejemplo, ejemplos). En algunas modalidades, los ejemplos usados (por ejemplo, conjuntos de entrenamiento y prueba) para construir el bosque aleatorio provienen de estudios usando los métodos descritos en la presente.
En modalidades particulares, medidas a base de texto de la presencia, ausencia y/o niveles de marcadores de inflamación sero-genéticos y el diagnóstico de enfermedad conocido se asignan a un valor binario con base en reglas determinadas. En algunas modalidades, las mediciones pANCA determinadas como no detectadas o sensibles a DNAsa (citoplásmica) se les asigna un valor de 0. En otras modalidades, a las mediciones pANCA determinadas como sensibles a DNAsa 1 +P, 2+P, 3+P o 4+P se les asigna un valor de 1. En algunas modalidades, a las mediciones pANCA 2 determinadas como no detectadas, sensibles a DNAsa (citoplásmicas) o sensibles a DNasa 1 +P se les asigna un valor de 0. En otras modalidades, a las mediciones pANCA2 determinadas como sensibles a DNasa 2+P, 3+P o 4+P se les asigna un valor de 1.
En ciertas modalidades, correlaciones y asociaciones para todas las combinaciones por pares posibles de las variables (por ejemplo, marcadores genéticos, marcadores serológicos y diagnósticos de enfermedad conocidos) usados en alguna parte del algoritmo de diagnóstico de IBD fueron calculadas. Para pares de variables continuos y para pares de variables binarios continuos, coeficientes de correlación de Pearson y sus valores p pueden ser calculados. Para pares de variables binarios-binarios, la asociación puede evaluarse con el análisis de cuadrados Chi. Todos los cálculos también se pueden llevar a cabo usando el programa de software Matlab.
En algunas modalidades, el algoritmo de diagnóstico de IBD comprende un modelo de bosque aleatorio para predecir IBD vs. no IBD usando todos los datos de entrenamiento después de la remoción de la muestra, en donde las muestras que cumplan un criterio determinado son retiradas de los datos de entrenamiento, un bosque aleatorio para predecir UC vs. CD usa datos de entrenamiento a partir de sólo pacientes de IBD conocidos que no tengan IC, y un árbol de decisiones o conjunto de reglas se basa en las reglas "indeterminadas". En ciertas modalidades, cuando el algoritmo de diagnóstico de IBD está en el modo de predicción, puede predecir IBD vs. no IBD con el primer modelo (por ejemplo, bosque aleatorio para IBD vs. no IBD). Si no IBD se predice, el algoritmo está hecho. De otro modo, el algoritmo aplica las reglas "indeterminadas" en el árbol de decisiones o conjunto de reglas. Las muestras que no sean clasificadas como no concluyentes para CD y UC con base en las reglas "indeterminadas" son procesadas al aplicar un segundo modelo (por ejemplo, bosque aleatorio para UC vs. CD). El algoritmo de diagnóstico de IBD puede clasificar a un individuo como un paciente no IBD, CD o UC, o puede clasificar a un individuo con IBD como no concluyente para CD y UC.
En ciertas modalidades, las reglas "indeterminadas" o conjunto de reglas pueden ser ANCA > Q3, pANCA2 positivas, y ya sea anticuerpo anti-Cbir1 o anticuerpo anti-Fla2 o anticuerpo anti-FlaX > Q3. En otras modalidades, las reglas "indeterminadas" o conjunto de reglas pueden ser pANCA2 positivas, y cualquiera dos del anticuerpo anti-flagelina serológico (por ejemplo, anticuerpo anti-Cbirl o anticuerpo anti-Fla2 o anticuerpo anti-FlaX) marcadores > Q3.
En algunas modalidades, el algoritmo de diagnóstico de IBD incluye un método de validación interna, en donde se repiten iteraciones tanto de entrenamiento como de prueba (por ejemplo, re-muestreo). En ciertos casos, el re-muestreo se repite aproximadamente 100 veces para obtener estadísticas. La validación interna comprende dividir un conjunto de entrenamiento en 2/3 para hacer un conjunto de entrenamiento modelo y 1/3 para hacer un conjunto de prueba; construir un algoritmo (por ejemplo, un par de modelos de bosque aleatorio) usando un conjunto de entrenamiento modelo; y calcular el rendimiento usando el conjunto de prueba. En otras modalidades, la validación interna incluye aplicar las mismas reglas de remoción de muestra y reglas "indeterminadas" a un conjunto de validación según se aplique a un conjunto de entrenamiento y calcular el rendimiento del algoritmo. En ciertos casos, la falla en aplicar las mismas reglas de eliminación selectiva puede traducirse en una degradación de rendimiento de > 2%.
En algunas modalidades, una muestra se retira de modelos de bosque aleatorio para predecir ya sea IBD vs. no IBD o UC vs. CD: si una muestra es un paciente que finalmente experimentó síntomas más de 6 meses antes de la visita a un doctor; si una muestra es de un paciente cuyo último síntoma se describió como "no disponible" y se inscribió en el estudio antes de cierta fecha; si el paciente no cumplió los criterios de inclusión/exclusión del estudio; y si falta información con respecto a la duración de la enfermedad del paciente.
En algunas modalidades, una muestra se retira: si una muestra es de un paciente que acaba de experimentar síntomas más de 6 meses antes de la visita a un doctor; si una muestra es de un paciente cuyo último síntoma se describió como "no disponible" y que se inscribió en el estudio antes de cierta fecha; si el paciente no cumplió criterios de inclusión/exclusión del estudio; y si falta información con respecto a la duración de enfermedad del paciente. En otras modalidades, una muestra se retira del modelo de bosque aleatorio para el diagnóstico de UC vs. CD. En algunos casos, una muestra con las siguientes características se retira del conjunto de datos de entrenamiento usado para construir el modelo de bosque aleatorio de UC vs. CD. Las características incluyen: (1 ) diagnóstico de UC; (2) nivel de ANCA en < puntuación cuartil (Q) 3, pANCA2 negativo; y (3) dos o más marcadores (por ejemplo, ASCA-A, ACA-G, anti-OmpC, anti-CBirl , anti-Fla2, anti-FlaX) con una Q >3. Típicamente, 90% de estas muestras son de pacientes de CD. En algunos casos, una muestra que cumpla los siguientes criterios es eliminada: (1) diagnóstico de CD conocido; (2) ANCA <16.8 EU/ml, pANCA2 negativo; y (3) dos o más de estas condiciones satisfechas: ASCA-A >10.675 EU/ml, ASCA-G >14.175 EU/ml, anti-OmpC >9.4 EU/ml, anti-CBir1 >29.475 EU/ml, anti-Fla2 34.5 EU/ml, o anti-FlaX >28.875 EU/ml. En otros casos, la muestra de un sujeto se retira del conjunto de datos de entrenamiento usado para construir el modelo de bosque aleatorio de UC vs. CD si (1 ) el sujeto tiene un diagnóstico de UC; (2) ANCA >16.8 EU/ml; pANCA2 positivo; y (3) se satisfacen todas las siguientes condiciones: ASCA-A <20.675 EU/ml, ASCA-G <14.175 EU/ml, anti-OmpC < 9.4 EU/ml, anti-CBir1 <29.475 EU/ml, anti-Fla2 <34.5 EU/ml y anti-FlaX <28.875 EU/ml. 90% De estos sujetos típicamente son pacientes de UC. En otros casos más, una muestra se excluye del conjunto de entrenamiento (por ejemplo, conjunto de entrenamiento y validación) si cumple uno de los siguientes criterios: (1) tiene pANCA2=1 y ANCA < 11.9; (2) tiene pANCA2=0 y ANCA > 11.9; (3) es afectado por un error claro; y (4) se vuelve a probar normalmente.
En algunas modalidades, el algoritmo de clasificación de enfermedad de la presente invención usa el conjunto de entrenamiento completo para construir uno o una pluralidad de modelos de bosque aleatorio. Establece un límite para clasificar enfermedad de los límites promedio a partir de la fase de re-muestreo. El algoritmo valida internamente al dividir un conjunto de entrenamiento repetidamente en 1/3 para un conjunto de validación y 2/3 para ambos conjuntos de entrenamiento y prueba de modelo; creando un algoritmo en el conjunto de entrenamiento modelo y el conjunto de prueba usando valores límite promedio; calculando el rendimiento en el conjunto de validación y comparándolo con el rendimiento promedio en el conjunto de prueba; y comparando las probabilidades promedio en conjuntos de prueba con probabilidades finales en el conjunto de validación. Además, el rendimiento del conjunto de prueba se calcula a partir de un algoritmo a base de un par de modelos de bosque aleatorio creado a partir de un conjunto de entrenamiento de modelo y un conjunto de prueba que fue un sub-conjunto del conjunto de entrenamiento/prueba modelo que fue un subconjunto del conjunto de entrenamiento completo.
En ciertas modalidades, el algoritmo de diagnóstico de IBD de la presente invención usa mediciones a partir de 17 marcadores biológicos inflamatorios sero-genéticos (por ejemplo, ANCA, ASCA-A, ASCA-G, pANCA, anti-FlaX, SAA, anti-Fla2, ICAM, anti-OmpC, anti-CBirl , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , VEGF, y una combinación de los mismos) para calcular una puntuación modelo con base en el primer modelo de bosque aleatorio para predecir IBD vs. no IBD. El primer modelo aleatorio determina si un paciente tiene IBD. Si la puntuación es menor que el límite de IBD vs. no IBD (por ejemplo, <0.64), se predice que la muestra es de un paciente que tiene IBD. De otro modo, se predice que la muestra es de un paciente que tiene no IBD. Las muestras que se predice tienen IBD proceden a la siguiente etapa del algoritmo, que es un árbol de decisiones o conjunto de reglas diseñado para descartar no concluyentes con base en patrones de marcadores. Si una muestra coincide con el patrón ya sea para las reglas "indeterminadas", el algoritmo predice a la muestra como teniendo IBD, pero clasifica la muestra como no concluyente para CD y UC. De otra manera, la muestra procede a la siguiente etapa del algoritmo, que es un segundo modelo de bosque aleatorio para predecir UC vs. CD. El algoritmo de diagnóstico usa después mediciones de 11 marcadores biológicos inflamatorios sero-genéticos (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-Fla2, pANCA, anti-OmpC, anti-CBirl , ECM1 , STAT3, VEGF, y combinaciones de los mismos) para calcular una puntuación modelo con base en el segundo modelo de bosque aleatorio para predecir UC vs. CD. Si la puntuación es menor que el límite UC vs. CD (por ejemplo, 0.35), el algoritmo predice la muestra como teniendo CD. De otra manera, el algoritmo predice la muestra como teniendo UC.
En algunas modalidades, los marcadores de inflamación sero-genéticos usados en el modelo de IBD vs. no IBD se clasifican como por una medida de importancia. Los marcadores listados en orden descendente de importancia en el conjunto de entrenamiento son: ANCA, ASCA-A, ASCA-G, pANCA, anti-FlaX, SAA, anti-Fla2, ICAM, anti-OmpC, anti-CBir1 , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , and VEGF. En otras modalidades, los marcadores de inflamación sero-genéticos usados en el modelo de UC vs. CD son clasificados por una medida de importancia y se listan en orden de importancia descendente en el conjunto de entrenamiento: ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-Fla2, pANCA, anti-OmpC, anti-CBir1 , ECM1 , STAT3, y VEGF. La medida de importancia de un marcador se describe en la presente, véase ejemplo 3.
En ciertas otras modalidades, el algoritmo de diagnóstico de IBD de la presente invención comprende una etapa inicial de determinar si una muestra es pANCA2 negativa para dirigir una muestra ya sea al primer modelo de bosque aleatorio para predecir IBD vs. no IBD o a un análisis de árbol de decisiones de pANCA separado (véase figura 2 y ejemplo 9). En ciertos casos, muestras de pANCA2 ya sea con una determinación de pANCA negativa (0 o "no detectada") o débil (+1) son retiradas de la cola del algoritmo de bosque aleatorio de dos etapas y sujetas a una matriz de decisiones o conjunto de reglas para hacer una predicción clínica de IBD. Un ejemplo no limitativo de una matriz de decisiones para predecir IBD después de análisis de árbol de decisiones pANCA se describe en el ejemplo 9. De esta manera, en ciertos aspectos, el árbol de decisiones de pANCA puede implementarse como una trayectoria alternativa para hacer diagnósticos de IBD predictivos en muestras con resultados del ensayo pANCA2 (-).
IX. Sistema de clasificación de enfermedad La figura 3 ilustra un sistema de clasificación de enfermedad (DCS) (300) de acuerdo con una modalidad de la presente invención. Como se muestra ahí, un DCS incluye un módulo de inteligencia DCS (305), tal como una computadora, que tiene un procesador (315) y módulo de memoria (310). El módulo de inteligencia incluye también módulos de comunicación (no mostrados) para transmitir y recibir información sobre una o más conexiones directas (por ejemplo, USB, Firewire u otro interfaz) y una o más conexiones de red (por ejemplo, incluyendo un modem u otro dispositivo de interfaz de red). El módulo de memoria puede incluir dispositivos de memoria internos y uno o más dispositivos de memoria externos. El módulo de inteligencia también incluye un módulo de presentación visual (325), tal como un monitor o impresora. En un aspecto, el módulo de inteligencia recibe datos tales como resultados de pruebas de pacientes de un módulo de adquisición de datos tal como un sistema de prueba (350), ya sea a través de una conexión directa o por una red (340). Por ejemplo, el sistema de prueba puede configurarse para ejecutar pruebas de varios analitos en una o más muestras de pacientes (355) y proporcionar automáticamente los resultados de prueba al módulo de inteligencia. Los datos también pueden ser provistos al módulo de inteligencia por medio de entrada directa por un usuario o pueden ser descargados de un medio portátil tal como un disco compacto (CD) o un disco versátil digital (DVD). El sistema de prueba puede ser integrado con el módulo de inteligencia, acoplado directamente al módulo de inteligencia o puede ser acoplado remotamente con el módulo de inteligencia por la red. El módulo de inteligencia también puede comunicar datos hacia y desde uno o más sistemas de cliente (330) por la red como se conoce bien. Por ejemplo, un médico o proveedor de cuidados de salud solicitante puede obtener y ver un reporte del módulo de inteligencia, el cual recibir en un laboratorio u hospital, usando un sistema de cliente (330).
La red puede ser una LAN (red de área local), WAN (red de área ancha), red inalámbrica, red de punto a punto, red de estrella, red anular, red central o una configuración. Como el tipo más común de red en uso actual es una red de TCP/IP (Protocolo de Control de Transferencia y Protocolo de Internet) tal como la internet global de redes conocida comúnmente como "Internet" con una "I", que se usará en muchos de los ejemplos de la presente, pero se debe entender que las redes que la presente invención puede usar no están tan limitadas, aunque TCP/IP es el protocolo que se prefiere actualmente.
Varios elementos en el sistema mostrado en la figura 3 pueden incluir elementos convencionales y bien conocidos que no tengan que explicarse en detalle aquí. Por ejemplo, el módulo de inteligencia podría implementarse como una computadora personal de escritorio, estación de trabajo, computadora central, laptop, etc. Cada sistema cliente incluiría una computadora personal de escritorio, estación de trabajo, computadora portátil, PDA, teléfono celular o cualquier dispositivo habilitado por WAP o cualquier otro dispositivo de cómputo capaz de interconectarse directa o indirectamente con internet u otra conexión a red. Un sistema cliente típicamente ejecuta un cliente HTTP, por ejemplo, un programa de navegación, tal como navegador Microsoft, navegador Internet Explorer™, navegador Netscape™, navegador Opera o un navegador habilitado por WAP en el caso de un teléfono celular, PDA u otro dispositivo inalámbrico, o similar, permitiendo a un usuario del sistema cliente acceder, procesar y ver información y páginas disponibles para éste del módulo de inteligencia sobre la red. Cada sistema cliente también incluye típicamente uno o más dispositivos de interfaz de usuario, tal como un teclado, un ratón, pantalla táctil, pluma o similar, para interactuar con una interfaz gráfica (GUI) provista por el navegador en presentador visual (por ejemplo, pantalla de monitor, presentador visual LCD, etc.) (335) en conjunto con páginas, formas u otra información provista por el módulo de inteligencia. Como se describió arriba, la presente invención es adecuada para usarse con internet, que se refiere a una red de trabajo internacional global específica de redes. Sin embargo, se debe entender que otras redes pueden usarse en lugar de internet, tal como una intranet, una extranet, una red privada virtual (VPN), una red no a base de TCP/IP, cualquier LAN o WAN, o similares.
De acuerdo con una modalidad, cada sistema cliente y todos sus componentes son configurables por operador usando aplicaciones, tal como un navegador, incluyendo código de computadora ejecutado usando una unidad de procesamiento central tal como un procesador Intel® Pentium® o similar. En forma similar, el módulo de inteligencia y todos sus componentes pueden ser configurables por el operador usando aplicaciones que incluyan código de computadora ejecutado usando una unidad de procesamiento central (315) tal como un procesador Intel Pentium o similar, o varias unidades procesadoras. Código de computadora para operar y configurar el módulo de inteligencia para procesar datos y resultados de prueba como se describe en la presente es de preferencia descargado y almacenado en un disco duro, pero el código de programa completo, o porciones del mismo, también se puede almacenar en cualquier otro medio de memoria o dispositivo volátil o no volátil como se conoce bien, tal como una ROM o RAM, o proveerse en cualquier otro medio legible por computadora (360) capaz de almacenar código de programa, tal como un disco medio de compacto (CD), disco versátil digital (DVD), un disco flexible, ROM, RAM y similares.
El código de computadora para implementar varios aspectos y modalidades de la presente invención puede implementarse en cualquier lenguaje de programación que se pueda ejecutar en un sistema de computadora tal como, por ejemplo, en R, C, C++, C#, HTML, Java, JavaScript, o cualquier otro lenguaje de escritura, tal como VBScript. Se prefiere el lenguaje de programación R. Además, el código de programa completo, o porciones del mismo, puede incorporarse como un señal portadora, que se puede transmitir y descargar de una fuente de software (por ejemplo, servidor) por internet, o cualquier otra conexión de red convencional como se conoce bien (por ejemplo, extranet, VPN, LAN, etc.) usando cualquier medio y protocolos de comunicación (por ejemplo, TCP/I P, HTTP, HTTPS, Ethernet, etc.) como se conocen bien.
De acuerdo con una modalidad, el módulo de inteligencia implementa un proceso de clasificación de enfermedad para analizar resultados de prueba de pacientes para determinar un diagnóstico de IBD o un subtipo clínico de la misma tal como CD o UC. Los datos pueden ser almacenados en una o más mesas de datos u otras estructuras de datos lógicas en memoria (310) o en un almacenamiento o sistema de base de datos separado acoplado con el módulo de inteligencia. Uno o más análisis estadísticos o procesos son aplicados típicamente a un conjunto de datos incluyendo datos de prueba para un paciente particular. Por ejemplo, los datos de prueba podrían incluir un perfil de marcadores de diagnóstico, que comprenda datos que indiquen la presencia, nivel y/o genotipo de al menos uno o un panel de marcadores en una muestra del paciente. En una modalidad, un análisis estadístico tal como un bosque aleatorio se aplica a datos de prueba para un paciente particular, en donde los datos de prueba comprenden la presencia, nivel y/o genotipo de al menos uno o un panel de marcadores determinados en una muestra del paciente. Las decisiones derivadas estadísticamente pueden ser presentadas visualmente en un dispositivo de presentación visual asociado con o acoplado al módulo de inteligencia, o las decisiones pueden ser provistas a y presentadas visualmente en un sistema separado, por ejemplo, un sistema cliente (330). En modalidades particulares, las decisiones derivadas estadísticamente pueden ser presentadas visualmente en forma de un reporte o impresión, que opcionalmente puede incluir una tabla de consulta, gráfica, cuadro o modelo para hacer posible que un médico compare e interprete los resultados presentados visualmente para hacer un diagnóstico o predicción de IBD razonado.
X. Terapia y monitoreo terapéutico Una vez que un diagnóstico IBD ha sido clasificado o predicho de acuerdo con los métodos descritos en la presente, la presente invención puede comprender además recomendar un curso de terapia con base en la clasificación o predicción, en ciertos casos, la presente invención puede comprender además administrar al individuo una cantidad terapéuticamente efectiva de un agente terapéutico para IBD útil para tratar uno o más síntomas asociados con IBD, CD, UC, IC o IBD no concluyente. Para las aplicaciones terapéuticas, el agente terapéutico de IBD puede administrarse solo o coadministrarse en combinación con uno o más agentes terapéuticos de IBD adicionales y/o uno o más fármacos que reduzcan los efectos secundarios asociados con el agente terapéutico de IBD. Ejemplos de agentes terapéuticos de IBD incluyen, pero no están limitados a, agentes biológicos, fármacos convencionales y combinaciones de los mismos. De esta manera, la presente invención hace posible adecuadamente que un médico lleve a la práctica "medicina personalizada" al guiar decisiones de tratamiento e informar la selección de terapias para IBD de tal manera que el fármaco correcto se dé al paciente correcto en el momento correcto.
Los agentes terapéuticos de IBD pueden administrarse con un excipiente farmacéutico adecuado según sea necesario y pueden llevarse a cabo por medio de cualquiera de los modos de administración aceptados. De esta manera, la administración puede ser, por ejemplo, intravenosa, tópica, subcutánea, transcutánea, transdérmica, intramuscular, oral, bucal, sublingual, gingival, palatal, intra-articular, parenteral, intra- arteriolar, intradérmica, intraventricular, intracraneal, intraperitoneal, intralesional, intranasal, rectal, vaginal o por inhalación. Por "co-administrar" se intenta decir que un agente terapéutico de IBD se administra al mismo tiempo, justo antes de, o justo después de la administración de un segundo fármaco (por ejemplo, otro agente terapéutico de IBD, un fármaco útil para reducir los efectos secundarios del agente terapéutico de IBD, etc.).
Una cantidad terapéuticamente efectiva de un agente terapéutico de IBD puede administrarse repetidamente, por ejemplo, al menos 2, 3, 4, 5, 6, 7, 8 o más veces, o la dosis puede administrarse por infusión continua. La dosis puede tener la forma de formas de dosificación sólidas, semisólidas, polvo liofilizado o líquidas, tales como, por ejemplo, tabletas, pildoras, gránulos, cápsulas, polvos, soluciones, suspensiones, emulsiones, supositorios, enemas de retención, cremas, pomadas, lociones, geles, aerosoles, espumas, o similares, de preferencia en formas de dosis única adecuadas para administración simple de dosis precisas.
Según se usa en la presente, el término "forma de dosis única" incluye unidades físicamente discretas adecuadas como dosis unitarias para sujetos humanos y otros mamíferos, cada unidad contiene una cantidad predeterminada de un agente terapéutico de IBD calculada para producir el inicio, tolerabilidad y/o efectos terapéuticos deseados, en asociación con un excipiente farmacéutico adecuado (por ejemplo, una ampolleta). Además, formas de dosis más concentradas pueden prepararse, a partir de las cuales formas de dosis unitarias más diluidas puedan ser entonces producidas. Las formas de dosis más concentradas contendrán entonces sustancialmente más que, por ejemplo, al menos 1 , 2, 3, 4, 5, 6, 7, 8, 9, 10, o más veces la cantidad del agente terapéutico de IBD.
Los métodos para preparar estas formas de dosis se conocen por aquellos expertos en la técnica (véase REMINGTON'S PHARMACEUTICAL SCIENCES, 18a edición, Mack Publishing Co., Easton, PA (1990)). Las formas de dosis incluyen típicamente un portador o excipiente farmacéutico convencional y pueden incluir adicionalmente otros agentes medicinales, portadores, adyuvantes, diluyentes, potenciadores de permeación tisular, solubilizadores y similares. Los excipientes adecuados pueden diseñarse para la forma de dosis particular y ruta de administración mediante métodos bien conocidos en la técnica (véase, por ejemplo, REMINGTON's PHARMACEUTICAL SCIENCES, citado arriba).
Ejemplos de excipientes adecuados incluyen, pero no están limitados a, lactosa, dextrosa, sucrosa, sorbitol, manitol, almidones, goma acacia, fosfato de calcio, alginatos, tragacanto, gelatina, silicato de calcio, celulosa microcristalina, polivinilpirrolidona, celulosa, agua, solución salina, jarabe, metilcelulosa, etilcelulosa, hidroxipropilmetilcelulosa y ácidos poliacrílicos tales como Carbopols, por ejemplo, Carbopol 941 , Carbopol 980, Carbopol 981 , etc. Las formas de dosis pueden incluir además agentes lubricantes tales como talco, estearato de magnesio y aceite mineral; agentes humectantes; agentes emulsionantes; agentes de suspensión; agentes conservadores tales como hidroxibenzoatos de metilo, etilo y propilo (es decir, los parabenos); agentes de ajuste de pH tales como ácidos y bases inorgánicos y orgánicos; agentes edulcorantes y agentes saborizantes. Las formas de dosis también pueden comprender esferas poliméricas biodegradables, dextrano y complejos de inclusión de ciclodextrina.
Para administración oral, la dosis terapéuticamente efectiva puede estar en forma de tabletas, cápsulas, emulsiones, suspensiones, soluciones, jarabes, sprays, pastillas, polvos y formulaciones de liberación prolongada. Los excipientes adecuados para administración oral incluyen grados farmacéuticos de manitol, lactosa, almidón, estearato de magnesio, sacarina de sodio, talco, celulosa, glucosa, gelatina, sucrosa, carbonato de magnesio y similares.
En algunas modalidades, la dosis terapéuticamente efectiva adopta la forma de una pildora, tableta o cápsula, y de esta manera, la forma de dosis puede contener, junto con un agente terapéutico de IBD, cualquiera de los siguientes: un diluyeme tal como lactosa, sacarosa, fosfato dicálcico y similares; un desintegrante tal como almidón o derivados del mismo; un lubricante tal como estearato de magnesio y similares; y un aglutinante tal como un almidón, goma acacia, polivinilpirrolidona, gelatina, celulosa y derivados de los mismos. Un agente terapéutico de IBD también puede formularse en un supositorio dispuesto, por ejemplo, en un portador de polietilengicol (PEG).
Formas de dosis líquidas pueden prepararse al disolver o dispersar un agente terapéutico de IBD y opcionalmente uno o más adyuvantes farmacéuticamente aceptables en un portador tal como, por ejemplo, solución salina acuosa (por ejemplo, cloruro de sodio al 0.9% p/v), dextrosa acuosa, glicerol, etanol y similares, para formar una solución o suspensión, por ejemplo, para administración oral, tópica o intravenosa. Un agente terapéutico de IBD también se puede formular en un enema de retención.
Para administración tópica, la dosis terapéuticamente efectiva puede estar en forma de emulsiones, lociones, geles, espumas, cremas, jaleas, soluciones, suspensiones, pomadas y parches transdérmicos. Para administración por inhalación, un agente terapéutico de IBD puede suministrarse como un polvo seco o en forma líquida por medio de un nebulizador. Para administración parenteral, la dosis terapéuticamente efectiva puede estar en forma de soluciones inyectables estériles y polvos envasados estériles. De preferencia, soluciones inyectables se formulan a un pH de aproximadamente 4.5 a alrededor de 7.5.
La dosis terapéuticamente efectiva también puede ser provista en una forma liofilizada. Estas formas de dosis pueden incluir un regulador de pH, por ejemplo, bicarbonato, para reconstitución antes de administración, o el regulador de pH puede incluirse en la forma de dosis liofilizada para reconstitución con, por ejemplo, agua. La forma de dosis liofilizada puede comprender además un vasoconstrictor adecuado, por ejemplo, epinefrina. La forma de dosis liofilizada puede ser provista en una jeringa, opcionalmente empacada en combinación con el regulador de pH para reconstitución, de tal manera que la forma de dosis reconstituida pueda ser inmediatamente administrada a un individuo.
En uso terapéutico para el tratamiento de IBD o un subtipo clínico de la misma, un agente terapéutico de IBD puede administrarse a la dosis inicial de alrededor de 0.001 mg/kg a aproximadamente 1 ,000 mg/kg diariamente. Un intervalo de dosis diaria de alrededor de 0.01 mg/kg a aproximadamente 500 mg/kg, de alrededor de 0.1 mg/kg a aproximadamente 200 mg/kg, de alrededor de 1 mg/kg a aproximadamente 100 mg/kg, o de alrededor de 10 mg/kg a aproximadamente 50 mg/kg, puede ser usado. Sin embargo, las dosis pueden variarse dependiendo de las necesidades del individuo, la severidad de los síntomas de IBD y el agente terapéutico de IBD que esté siendo empleado. Por ejemplo, las dosis pueden determinarse empíricamente considerando el tipo y severidad de síntomas de IBD en un individuo clasificado como teniendo un subtipo clínico particular de IBD de acuerdo con los métodos descritos aquí. La dosis administrada a un individuo, en el contexto de la presente invención, debe ser suficiente para afectar una respuesta terapéutica benéfica en el individuo con el tiempo. El tamaño de la dosis también se puede determinar por la existencia, naturaleza y grado de cualquier efecto secundario adverso que pudiera acompañar la administración de un agente terapéutico de IBD particular en un individuo. La determinación de la dosis adecuada para una situación particular está dentro de la capacidad del practicante. Generalmente, el tratamiento se inicia con dosis más pequeñas que son menos que la dosis óptima del agente terapéutico de IBD. Posteriormente, la dosis se incrementa a incrementos pequeños hasta que se alcance el efecto óptimo bajo las circunstancias. Para conveniencia, la dosis diaria total puede dividirse y administrarse en porciones durante el día, si se desea.
Según se usa en la presente, el término "agente terapéutico de IBD" incluye todas las formas farmacéuticamente aceptables de un fármaco que sean útiles para tratar uno o más síntomas asociados con IBD. Por ejemplo, el agente terapéutico de IBD puede estar en una mezcla racémica o isomérica, un complejo sólido unido a una resina de intercambio iónico, o similares. Además, el agente terapéutico de IBD puede estar en una forma solvatada. El término también intenta incluir todas las sales farmacéuticamente aceptables, derivados y análogos del agente terapéutico de IBD que se esté describiendo, así como combinaciones de los mismos. Por ejemplo, las sales farmacéuticamente aceptables de un agente terapéutico de IBD incluyen, sin limitación, las formas de sal tartrato, succinato, tartarato, bitartarato, diclorhidrato, salicilato, hemisuccinato, citrato, maleato, clorhidrato, carbamato, sulfato, nitrato y benzoato, así como combinaciones de las mismas y similares. Cualquier forma de un agente terapéutico de IBD es adecuada para usarse en los métodos de la presente invención, por ejemplo, una sal farmacéuticamente aceptable de un agente terapéutico de IBD, una base libre de un agente terapéutico de IBD o una mezcla de los mismos. Ejemplos de agentes terapéuticos de IBD adecuados incluyen, pero no están limitados a, agentes biológicos, fármacos convencionales y combinaciones de los mismos.
Los agentes biológicos incluyen, por ejemplo, anticuerpos anti-citosinas y quimiocinas tales como anticuerpos anti-factor de necrosis tumoral alfa (TNFa). Ejemplos no limitativos de anticuerpos anti-TNFa incluyen: anticuerpos monoclonales quiméricos tales como infliximab (Remicade®) (Centocor, Inc.; Horsham, PA), que es un anticuerpo monoclonal anti-TNFa de lgG1 quimérico; anticuerpos monoclonales humanizados tales como CDP571 y el CDP870 PEGilado; anticuerpos monoclonales completamente humanos tales como adalimumab (Humira®) (Abbott Laboratories, Abbott Park, IL); proteínas de fusión p75 tales como etanercept (Enbrel®), (Amgen; Thousand Oaks, CA, Wyeth Pharmaceuticals Inc., Collegeville, PA), moléculas pequeñas (por ejemplo, inhibidores de cinasa MAP); y combinaciones de los mismos. Véase, Ghosh, Novartis Found Symp., 263:193-205 (2004).
Otros agentes biológicos incluyen, por ejemplo, anticuerpos anti-adhesión celular tales como natalizumab (Tysabri®) (Elan Pharmaceuticals, Inc.; Dublín, Irlanda; Biogen Idee; Cambridge, MA), el cual es un anticuerpo monoclonal humanizado contra la molécula de adhesión celular a4-integrina, y MLN-02 (Millennium Pharmaceuticals; Cambridge, MA), que es un anticuerpo monoclonal anti-integrina a-4ß7 de lgG1 humanizado; agentes anti-células T; anticuerpos anti-CD3 tales como visilizumab (Nuvion®) (PDL BioPharma; Incline Village, NV), que es un anticuerpo monoclonal anti-CD3 de lgG2 3 humanizado; anticuerpos anti-CD4 tales como priliximab (cM-T412) (Centocor, Inc.; Horsham, PA), que es un anticuerpo monoclonal anti-CD4 quimérico; anticuerpos anti-receptor de IL-2 alfa (CD25) tales como daclizumab Zenapax®) (PDL BioPharma; Incline Village, NV; Roche; Nutley, NJ), que es un anticuerpo monoclonal anti-CD25 de lgG1 humanizado, y basiliximab (Simulect®) (Novartis; Basilea, Suiza), que es un anticuerpo monoclonal anti-CD25 de lgG1 quimérica, y combinaciones de los mismos.
Además de los agentes biológicos anteriores, miRs o inhibidores de miRs son útiles en la presente invención. De esta manera, en ciertas modalidades, la presente invención proporciona tratamiento o prevención de IBD al introducir en o proporcionar a un paciente con IBD una cantidad efectiva de i) una molécula inhibidora de ARNmi o ii) una molécula de ARNmi.
Una formulación útil para el suministro de miRs son liposomas. Los liposomas y emulsiones son ejemplos bien conocidos de vehículos de suministro que se pueden usar para suministrar los ácidos nucleicos de la invención. Un ácido nucleico de la invención puede administrarse en combinación con un portador o lípido para incrementar la absorción celular. Por ejemplo, el oligonucleótido puede administrarse en combinación con un lípido catiónico. Ejemplos de lípidos catiónicos incluyen, pero no están limitados a, lipofectina, DOTMA, DOPE y DOTAP. La publicación de WO0071096, que se incorpora específicamente por referencia, describe diferentes formulaciones, tales como una formulación de DOTAP olesterol o derivado de colesterol que se puede usar efectivamente para terapia génica. Otras descripciones también describen diferentes formulaciones de lípidos o liposómicas incluyendo nanopartículas y métodos de administración. Estas incluyen, pero no están limitadas a, publicación de patente de E.U.A. 20030203865, 20020150626, 20030032615 y 20040048787, las cuales se incorporan en la presente por referencia en la medida en que describan formulaciones y otros aspectos relacionados de la administración y suministro de ácidos nucleicos. Los métodos usados para formar partículas también se describen en las patentes de E.U.A. Nos.: 5,844,107, 5,877,302, 6,008,336, 6,077,835, 5,972,901 , 6,200,801 y 5,972,900, las cuales se incorporan por referencia para esos aspectos. Los ácidos nucleicos también pueden administrarse en combinación con una amina catiónica tal como poli (L-lisina).
Ejemplos de fármacos convencionales incluyen, sin limitación, aminosalicilatos (por ejemplo, mesalazina, sulfasalazina y similares), corticosteroides (por ejemplo, prednisona), tiopurinas (por ejemplo, azatioprina, 6-mercaptopurina y similares), metotrexato, bases libres de los mismos, sales farmacéuticamente aceptables de los mismos, derivados de los mismos, análogos de los mismos y combinaciones de los mismos.
Un experto en la técnica conocerá de agentes terapéuticos de IBD adicionales adecuados para usarse en la presente invención (véase, por ejemplo, Sands, Surg. Clin. North Am., 86:1045-1064 (2006); Dáñese et al., Mini Rev. Med. Chem., 6:771 - 784 (2006); Domenech, Digestión, 73 (Suppl. 1):67-76 (2006); Nakamura et al., World J. Gastroenterol., 12:4628-4635 (2006); y Gionchetti er a/., World J. Gastroenterol., 12:3306-3313 (2006)).
Un individuo también puede ser monitoreado a intervalos de tiempo periódicos para evaluar la eficacia de cierto régimen terapéutico una vez que se haya obtenido información de diagnóstico y/o predictiva a partir de la muestra de individuo. Por ejemplo, la presencia o nivel de ciertos marcadores puede cambiar con base en el efecto terapéutico de un tratamiento tal como un fármaco. En ciertas modalidades, el paciente puede ser monitoreado para evaluar respuesta y entender los efectos de ciertos fármacos o tratamientos en un enfoque individualizado. Además, pacientes podrían no responder a un fármaco, pero los marcadores pueden cambiar, sugiriendo que estos pacientes pertenecen a una población especial (no sensible) que pueda identificarse por sus niveles de marcadores. Estos pacientes pueden ser descontinuados de su terapia actual y prescribirse tratamientos alternativos.
XI. Ejemplos La presente invención se describirá en mayor detalle a manera de ejemplos específicos. Los siguientes ejemplos se ofrecen para efectos ilustrativos, y no se intenta que limiten la invención de ninguna manera. Los expertos en la técnica reconocerán fácilmente una variedad de parámetros no críticos que pueden ser cambiados o modificados para producir esencialmente los mismos resultados.
Ejemplo 1.
Modelado por bosque aleatorio de diagnósticos de IBD usando marcadores de inflamación sero-genéticos (sgi) Este ejemplo ilustra un método de entrenamiento y validación de un sistema clasificador estadístico de aprendizaje que comprende uno o una pluralidad de modelos de bosque aleatorio. En algunas modalidades, el método para crear un modelo de bosque aleatorio para diagnosticar enfermedad comprende un método de mediciones a base de texto convertidas de marcadores de inflamación sero-genéticos (sgi) en variables binarias. En otras modalidades, un método para crear un modelo de bosque aleatorio para diagnosticar enfermedad comprende un método de eliminación variable por pasos con reclamación de muestra incompleta y estimación de error de rendimiento a través de re-muestreo. Este ejemplo también ilustra un método para crear un modelo de bosque aleatorio para diagnosticar enfermedad que comprende determinar la importancia de varios marcadores sgi para la previsibilidad del modelo.
En algunas modalidades, los métodos y modelos estadísticos descritos en la presente para modelado predictivo de marcadores de diagnóstico relacionados con IBD utilizan el método de bosque aleatorio de construcción de modelos. Un bosque aleatorio es un clasificador formado de muchos árboles de decisión con un componente aleatorio para construir cada árbol. Cada árbol de decisión aborda el mismo problema de clasificación, pero con una colección diferente de ejemplos y un diferente subconjunto de características seleccionados aleatoriamente a partir del conjunto de datos de ejemplos proporcionado. Por ejemplo, un solo árbol puede construirse usando un 2/3 aleatorio de los ejemplos disponibles, con un 2/3 aleatorio de las características seleccionadas para ser una división de decisión en cada nodo del árbol. Una vez que el bosque se construye durante entrenamiento, ejemplos nuevos se clasifican al tomar un voto a través de todos los árboles de decisión. En el caso más simple para un clasificador de bosque aleatorio clase 2, la clase con la mayoría de los votos gana. En otros casos, el límite para un número ganador de votos, según se establece durante el entrenamiento, es establecido para optimizar mediciones de rendimiento. En algunos casos, si falsos positivos son más costosos que falsos negativos, el límite podría establecerse más alto.
El análisis de bosque aleatorio es muy robusto para modelar este tipo de datos estadísticos debido a que es altamente preciso. Ya que cada árbol de decisión se construye a partir de un diferente subconjunto de los datos, los bosques aleatorios son menos propensos a ajuste excesivo de datos que otros enfoques de aprendizaje con máquina. Cualquier ajuste excesivo o rendimiento inferior por un árbol individual tiende a cancelarse cuando el promedio de ensamble es calculado.
En ciertas modalidades, un algoritmo de diagnóstico de IBD se establece usando una cohorte retrospectiva de diagnósticos predichos con presencia, ausencia y/o niveles conocidos de marcadores de inflamación sero-genéticos (sgi). En algunas modalidades, las muestras usadas (por ejemplo, conjunto de datos de entrenamiento y validación) para construir el bosque aleatorio son de estudios usando los métodos descritos en la presente. Brevemente, un conjunto de datos de entrenamiento se usa para entrenar el algoritmo y un conjunto de datos de validación se usa para determinar el rendimiento del algoritmo entrenado. El método de modelado de bosques aleatorios permite comparaciones de marcadores y así, la importancia del marcador para predecir el diagnóstico puede ser determinado.
A. Conversión de mediciones a base de texto de marcadores de inflamación sero-genéticos en variables binarias En algunos aspectos, valores binarios se definen con base en el conjunto de datos de muestras (véase, tabla 1). En ciertas modalidades, los conjuntos de datos comprenden datos de sujetos que se predice tienen IBD, CD, UC o Síndrome del Intestino Irritable (IBS), y sujetos de control sanos.
Tabla 1 Columnas binarias definidas añadidas a conjunto de datos B. Eliminación de variables por pasos con reclamación de muestra incompleta y estimación de error de rendimiento a través de re-muestreo En otras modalidades, un método para crear un modelo de bosque aleatorio para diagnosticar enfermedad comprende un método de eliminación variable por pasos con reclamación de muestra incompleta y estimación de error de rendimiento a través de re-muestreo. En ciertas modalidades, se usan métodos para determinar si los marcadores podrían mejorar las predicciones de diagnóstico. En algunos casos en los que haya datos limitados con entradas completas para todos los marcadores, todos los marcadores se usan durante el entrenamiento. Posteriormente, después de eliminar marcadores menos importantes, se reclaman muestras que carecían del marcador menos importante y se usan en el conjunto de datos de entrenamiento.
En algunos aspectos, las siguientes etapas del "Protocolo de Eliminación de Variables" son usadas: 1 ) Eliminar temporalmente hileras de datos incompletas. 2) Dividir datos aleatoriamente en un conjunto de datos de entrenamiento (2/3 de hileras) y un conjunto de datos de prueba (1/3 de hileras); Nota: esto se repetirá numerosas veces. 3) Crear un modelo de bosque aleatorio a partir del conjunto de datos de entrenamiento. 4) Determinar rendimiento usando predicciones sobre datos de prueba. a. Puntuación ROC b. Sensibilidad/especificidad usando un límite que maximice una función objetivo, en donde W es una ponderación fraccional ajustable establecida en 0.3: 1. W(1 -sensibilidad)2 + (1 -W)(1 -especificidad)2 5) Calcular medida de importancia de cada variable para el bosque dado. a. Permutar aleatoriamente valores de una variable para el bosque dado b. Determinar degradación resultante en precisión c. Repetir cada variable 6) Calcular error estándar a partir de las divisiones de datos aleatorios diferentes llevadas a cabo hasta el momento. 7) Si el error estándar es lo suficientemente pequeño o hemos excedido un número máximo permisible de iteraciones, se elimina una variable: a. Encontrar la variable cuya importancia promedio sobre las múltiples divisiones de datos se haga más pequeña b. Regresar el conjunto de datos antes de la última eliminación de hileras incompletas c. Borrar la variable "no importante" d. Si cualesquiera variables siguen regresar al inicio del protocolo El protocolo listado arriba se usa para determinar qué marcadores de inflamación sero-genéticos (sgi) mejoran la predicción de diagnóstico de IBD vs. no IBD. La tabla 2 ilustra la importancia de variables para diagnóstico de IBD vs. no IBD usando 23 marcadores de inflamación sero-genéticos, tales como ASCA-A, IRGM47, IRGM89, MDR1 , ECM1 , VEGF, CRP, NKX2-3, STAT3, ATG16L1 , SAA, GLI1 , MAGI2, anti-OmpA, ICAM, anti-Fla2, ASCA-G, ANCA, anti-FlaX, VCAM-1 , anti-Cbir1 , anti-OmpC, y pANCA. En este ejemplo de descripción de modelado de bosque aleatorio de diagnóstico de IBD, se requirieron los siguientes criterios: un número mínimo de re-muestreos de 5, un máximo de 20 y una meta de error estándar de 0.01 en la puntuación ROC en datos de prueba separados. El término "LeastJMP" se refiere a la variable que tiene la importancia promedio más pequeña. El término "OOB_ROC" se refiere a la puntuación ROC calculada en las predicciones fuera de bolsa durante el entrenamiento. El término "TEST_Roc" se refiere a la puntuación ROC en el conjunto de prueba separado, no usado para crear el bosque. Los términos "SENS" y "SPEC" se refieren a sensibilidad y especificad, respectivamente, en el conjunto de prueba. El término "NTRAI O" se refiere al número de muestras de entrenamiento con DxIBD igual a 0 (es decir, no IBD). El término "NTRAIN1" se refiere al número de muestras de entrenamiento con DxIBD igual a 1 (es decir, IBD). Los términos "NTESTO" y "NTEST1" son el número de muestras de prueba. Notablemente, todos los números en la siguiente tabla son promedios sobre redivisiones múltiples, y barras de error son errores estándar (es decir, estimados del error en medias). "NVAR" Se refiere a la importancia determinada de un marcador de inflamación sero-genético para el diagnóstico de IBD. La tabla 2 muestra que pANCA tiene la mayor importancia y ASCA-A tiene menos importancia en el algoritmo.
Tabla 2 Importancia de marcadores para IBP vs. no IBP usando marcadores de inflamación sero-qenéticos En algunos casos, el tamaño de los conjuntos de datos de entrenamiento y prueba se incrementó ya que variables menos importantes fueron eliminadas y se restablecieron hileras. En otros casos, una puntuación ROC en el conjunto de datos de prueba fue tan alta como 0.95. En ciertos casos, dos marcadores (es decir, VCAM y anti-FlaX) desplazaron dos marcadores serológicos (es decir, ASCA-G y ASCA-A) como uno de los marcadores más importantes. La tabla 3 muestra que pANCA fue el marcador más importante para predecir IBD vs. no IBD cuando se usaron sólo marcadores de serología, y ASCA-G fue menos importante en esta cohorte. En ciertos casos, la mejor puntuación ROC de prueba fue 0.8, lo cual indica que los marcadores probados pueden reducir considerablemente error.
Tabla 3 Importancia de marcadores para IBP vs. no IBP usando sólo marcadores de aerología El protocolo descrito arriba también se puede usar para determinar los marcadores de inflamación sero-genéticos que puedan ayudar a mejorar la predicción de UC vs. CD. La tabla 2 ilustra la importancia de los marcadores para el diagnóstico de UC vs. CD usando 23 marcadores de inflamación sero-genéticos, tales como ASCA-A, IRGM47, IRGM89, MDR1 , ECM1 , VEGF, CRP, NKX2-3, STAT3, ATG16L1 , SAA, GLI1 , MAGI2, anti-OmpA, ICAM, anti-Fla2, ASCA-G, ANCA, anti-FlaX, VCAM-1 , anti-Cbi , anti-OmpC, y pANCA. En algunos casos, los datos se limitaron en donde la cohorte no contiene muestras con todos los 23 marcadores y un diagnóstico de UC. En ciertos casos, cada marcador puede compararse con el número de diagnósticos en la cohorte y luego puede determinarse si una variable (por ejemplo, marcador) puede ser eliminada (véase, tabla 4).
Tabla 4 Número de diagnósticos de UC (NUC) y número de diagnósticos de CD (NCD) para cada marcador En este caso, el marcador ECM1 estuvo asociado con el menor número de diagnósticos de UC y de esta manera se eliminó del protocolo de eliminación de variables por pasos. Los métodos de la presente invención y un conjunto de datos de 22 marcadores de inflamación sero-genéticos para producir UC vs. CD pueden usarse para construir un clasificador de bosque aleatorio (véase tabla 5).
Tabla 5 Importancia de marcadores para la predicción de UC vs. CP para 22 marcadores excepto ECM1 La tabla 5 muestra que ASCA-G fue el marcador de inflamación sero-genético más importante para predecir UC vs. CD, y STAT3 fue menos importante cuando se usó el modelo de bosque aleatorio para la cohorte. En este caso, una puntuación ROC en el conjunto de prueba fue tan alta como 0.95 con los 7 marcadores determinados como teniendo la importancia de marcador más alta (por ejemplo, ASCA-G, ICAM, ASCA-A, anti-FlaX, ANCA y SAA). Notablemente, dos marcadores (es decir, VCAM y anti-FlaX) en las 6 variables más importantes superiores desplazaron dos marcadores serológicos.
Ya que los datos están limitados para todos los 22 marcadores juntos, las muestras que fueron reclamadas durante el entrenamiento como variables menos importantes fueron borradas. La importancia variable de usar sólo marcadores de serología (por ejemplo, ASCA-G, pANCA, anti-OmpC, ANCA, ASCA-A y anti-CBir1) se determinó usando los métodos descritos en la presente (véase tabla 6). La mejor puntuación ROC fue 0.89, que es significativamente menor que la puntuación de 0.95 observada para los 7 marcadores superiores.
Tabla 6 Importancia de marcadores para predicción de UC vs. CD usando sólo marcadores de serología Correlaciones y asociaciones para todas las combinaciones por pares posibles de los 17 marcadores usados en alguna parte del algoritmo sgi fueron calculadas. Para pares de variables continuos y para pares de variables binarios continuos, se calcularon los coeficientes de correlación de Pearson y sus valores P. Para pares de variables binarios-binarios, la asociación se evaluó con el análisis de cuadrados Chi. Todos los cálculos se hicieron el programa de software Matlab.
Los resultados se presentan en las tablas 7 y 8. La tabla 7 lista correlaciones por pares entre variables continuas y entre variables continuas y binarias, junto con sus valores p. Nótese que las asociaciones entre variables binarias transformadas a partir de datos a base de texto no se muestran aquí. La tabla 8 lista correlaciones por pares estadísticamente significativas. Se encontraron 42 correlaciones significativas. Ninguna incluyó asociaciones entre marcadores genéticos, pANCA o pANCA2. Todas menos una (ANCA y ASCA-G) mostraron correlaciones positivas.
C. Correlaciones por pares entre marcadores usados en el algoritmo sgi Se calcularon correlaciones usando todas las combinaciones por pares de variables continuas, y de variables continuas y binarias. Coeficientes de correlación de Pearson y el valor p para cada coeficiente de correlación son mostrados. El valor p representa el significado estadístico con relación a un coeficiente de correlación de 0; los valores p de 0.0000 son menores que 10'4.
Tabla 7 Correlaciones para todas las combinaciones por pares únicas 5 10 5 10 5 10 5 10 5 10 25 Se identificaron 42 correlaciones estadísticamente significativas entre un subconjunto de todas las combinaciones por pares únicas posibles de las 18 variables usadas en alguna parte del algoritmo sgi (véase tabla 8). Se muestran coeficientes de correlación y sus valores p. El valor p representa significado estadístico con relación a un coeficiente de correlación de 0; los valores p de 0.00E+00 están debajo del límite del software MATLAB. Se aplicó una corrección de Bonferroni para probar el significado estadístico a p<0.05 verdadero.
Tabla 8 Correlaciones estadísticamente significativas de todas las combinaciones por pares únicas 5 10 De esta manera, este ejemplo demuestra que el modelado de bosques aleatorios de acuerdo con la presente invención se particularmente útil para diagnosticar IBD vs. no IBD y distinguir entre UC y CD.
Ejemplo 2.
Modelado por bosques aleatorios de 3 clases para diagnósticos de IBD Este ejemplo ilustra un método de modelado por bosques aleatorios de diagnóstico de IBD en donde el conjunto de entrenamiento no contiene muestras de controles sanos. Este ejemplo ilustra entrenamiento de un algoritmo con un conjunto de datos que excluye muestras de control sanas. Este ejemplo también ilustra modelado por bosques aleatorios de 7 marcadores serológicos para predecir IBD vs. no IBD, en donde la cohorte de entrenamiento comprende pacientes de IBD y de síndrome del intestino irritable (IBS). Este ejemplo ilustra además modelado por bosques aleatorios para predecir clasificaciones de tres enfermedades, tales como no IBD, CD y UC. Este ejemplo también ilustra un modelo de bosque aleatorio para predecir sujetos con IBS vs. sanos.
A. Modelado por bosques aleatorios que excluyen controles sanos En algunas modalidades, un algoritmo de diagnóstico de IBD de una pluralidad de modelos de bosques aleatorios se entrena y valida usando conjuntos de datos de cohortes retrospectivas de diagnósticos predichos con presencia, ausencia y/o niveles de marcadores de inflamación sero-genéticos conocidos. En ciertos casos, los conjuntos de datos comprenden datos de sujetos que se predice tienen IBD, CD, UC o síndrome del intestino irritable (IBS) (véase tabla 9). En ciertos casos, datos de pacientes de control sanos se excluyen del modelado por bosques aleatorios. En algunos casos, conjuntos de datos incluyen 23 marcadores tales como, pero no limitados a, ASCA-A, ASCA-G, IRGM47, IRGM89, MAGI2, MDR1 , anti-OmpA, anti-OmpC, anti-CBir1 , anti-Fla2, anti-FlaX, VEGF, CRP, SAA, ICAM, VCAM, ANCA, pANCA, pANCA2, ATG16L1 , ECM1 , STAT3, y NKX2-3. La tabla 9 ilustra la importancia variable (por ejemplo, marcadores) para un diagnóstico de IBD vs. no IBD para 23 marcadores de inflamación sero-genéticos usando sólo pacientes de IBD e IBS (excluyendo controles sanos). En esta descripción ejemplar de modelado por bosque aleatorio de diagnóstico de IBD, se requirieron los siguientes criterios: un número mínimo de re-muestreos de 5, un máximo de 20, y una meta de error estándar de 0.01 en la puntuación ROC en datos de prueba separados. El término "LeastJMP" se refiere a la variable que tiene la importancia promedio más pequeña. El término "OOB_ROC" se refiere a la puntuación ROC calculada en las predicciones fuera de bolsa durante el entrenamiento. El término 'TEST_Roc" se refiere a la puntuación ROC en el conjunto de pruebas separado, no usado para crear el bosque. Los términos "SENS" y "SPECT" se refieren a sensibilidad y especificidad, respectivamente, en el conjunto de prueba. El término "NTRAINO" se refiere al número de muestras de entrenamiento con DxIBD igual a 0 (es decir, no IBD). El término "NTRAIN1" se refiere al número de muestras de entrenamiento con DxIBD igual a 1 (es decir, IBD). Los términos "NTESTO" y "NTEST1" son el número de muestras de prueba. Notablemente, todos los números en la siguiente tabla son promedios sobre varias redivisiones, y las barras de error son errores estándares (es decir, estimados del error en medias). La tabla 9 muestra que el marcador de inflamación sero-genético más importante para predecir IBD vs. no IBD es pANCA y que un marcador menos importante es ASCA-A, cuando el modelo de bosques aleatorios se construye sin muestras de la cohorte.
Tabla 9 Modelado para IBP vs. no IBP para 23 marcadores de inflamación sero-qenéticos usando sólo pacientes de IBP e IBS En otros casos, un modelo de bosque aleatorio para IBD vs. no IBD se determinó sólo para marcadores de serología usando sólo muestras de pacientes de IBD e IBS. La tabla 10 ilustra la importancia variable de diagnóstico de IBD vs. no IBD para los marcadores de serología. pANCA tiene la mayor importancia y ASCA-A tiene la menor importancia para predecir IBD vs. no IBD.
Tabla 10 Modelado para IBD vs. no IBD usando sólo marcadores de serología v sólo pacientes de IBD e IBS B. Modelado por bosques aleatorios de tres clasificaciones de enfermedad Para probar el rendimiento del algoritmo, se desarrolló un solo modelo con predicciones de clase 3 (por ejemplo, no IBD, CD y UC). El método de eliminación de variables y re-muestreo como el descrito en el "Protocolo de Eliminación de Variables" se ajustó de tal manera que dos valores límite para predicción fueran establecidos. Un valor límite se usó para IBD vs. no IBD, y el otro para UC vs. CD dado que IBD se determinó. En ciertos casos, el conjunto de datos de prueba completo puede usarse para el modelo de IBD vs. no IBD para encontrar un límite de probabilidad de no IBD, por arriba del cual se predice como no IBD y debajo del cual el algoritmo continúa al segundo límite. El primer valor límite puede usarse para determinar el valor ROC para IBD vs. no IBD. Para determinar el segundo límite, el conjunto de datos de prueba de pacientes con IBD conocidos puede usarse para encontrar un límite para p(UC)/(p(CD)+(UC)), en donde p(UC) y p(CD) son las probabilidades modelo para UC y CD, respectivamente. El segundo valor límite puede usarse para determinar el valor ROC para UC vs. CD. Una sola matriz de confusión para las 3 clases (por ejemplo, no IBD, CD y UC) con base en los dos límites se usaron para predecir el diagnóstico de cada muestra de prueba.
Se llevó a cabo una eliminación de variables por pasos en el modelo individual de 3 clases, en donde la variable "menos importante" se selecciona se elimina para el dominio de diagnóstico completo. Un modelo de bosques aleatorios de 3 clases se construyó a partir de 7 marcadores de serología para predecir no IBD, UC y CD para cada muestra (véase tabla 11). En la tabla 11 , la primera hilera incluye todos los 7 marcadores, la segunda hilera incluye todos menos el marcador menos importante, y así sucesivamente. El término "IBD_TEST_ROC" se refiere a usar la prueba no IBD vsVIímite de IBD (por ejemplo, primer limite) y el conjunto de datos de prueba completo. El término "UC_TEST_ROC" se refiere a usar el límite de UC vs. CD y sólo muestras para el conjunto de datos de prueba que se conoce es IBD. En algunos casos, las sensibilidades y selectividades restantes se determinan en el conjunto de datos de prueba completo. En un caso particular, el rendimiento de IBD en la última hilera de la tabla 11 es un artefacto en el programa estadístico R para el método de bosques aleatorios en una sola variable binaria y no debe considerarse más.
Tabla 11 Modelo de bosques aleatorios de tres clases para predecir no IBP. UC o CD para 7 marcadores de inflamación sero-qenéticos También se construyó un modelo de bosques aleatorios de 3 clases usando 22 marcadores de inflamación sero-genéticos para predecir no IBD, UC y CD para cada muestra. La tabla 12 muestra que en este modelo, el marcador más importante es pANCA y un marcador menos importante es MDR1.
Tabla 12 Modelo de bosques aleatorios de tres clases que predice no IBD. UC o CP para 22 marcadores de inflamación sero-qenéticos C. Modelado por bosques aleatorios para diagnosticar IBS vs. individuos sanos Para distinguir entre sujetos sanos y pacientes predichos con IBS, se creó otro modelo de bosques aleatorios. Los 7 marcadores de serología descritos arriba se usaron en el modelo (véase tabla 13).
Tabla 13 Modelo de bosques aleatorios para IBS vs. controles sanos La tabla 14 muestra otro modelo más de bosque aleatorio al modificar el modelo de bosque aleatorio para IBS vs. controles sanos. En esta modalidad, se incorporó un marcador a su vez en el modelo, iniciando con el marcador más importante. Se determinó que el modelo estaba completo cuando ya no había datos completos para una de las clases. La tabla 14 muestra las predicciones del modelo de bosque aleatorio para predecir IBS vs. sujetos sanos usando 17 marcadores de inflamación sero-genéticos.
Tabla 14 Modelo de bosques aleatorios para IBS vs. controles sanos usando 17 marcadores de inflamación sero-qenéticos De los 17 marcadores usados, el algoritmo muestra que los marcadores más importantes para predecir IBS vs. pacientes sanos son ICAM, anti-OmpC, anti-OmpA y anti-FlaX. En ciertos aspectos, modelado de bosques aleatorios de acuerdo con la presente invención puede ser útil en diagnosticar IBS al predecir pacientes como teniendo IBS vs. pacientes de control sanos.
Ejemplo 3.
Algoritmo de diagnóstico de inflamación sero-genética (sgi) para IBD Este ejemplo ilustra el desarrollo y validación del algoritmo de diagnóstico para inflamación sero-genética (sgi) de IBD. En ciertos aspectos, el algoritmo de diagnóstico es un componente de una prueba de diagnóstico de sgi para IBD que se puede usar para diagnosticar enfermedad intestinal inflamatoria (IBD) versus enfermedad intestinal no inflamatoria (no IBD) y/o subtipos de la misma incluyendo colitis ulcerosa (UC), enfermedad de Crohn (CD), colitis indeterminada (IC) e IBD no concluyente para CD y UC. Este ejemplo también ilustra métodos para predecir IBD, no IBD, UC, CD, IC y/o IBD no concluyente usando algoritmos descritos en la presente. Este ejemplo ilustra además métodos para crear algoritmos de diagnóstico.
El algoritmo de diagnóstico de sgi para IBD utiliza mediciones de 17 marcadores (18 valores ya que pANCA se mide dos veces). La tabla 15 describe los marcadores y ejemplos de métodos de ensayo para medir los marcadores.
Tabla 15 Marcadores de inflamación sero-qenética ísqi) del algoritmo de diagnóstico de IBD En ciertas modalidades, la prueba de diagnóstico de sgi para IBD también comprende un algoritmo computacional de análisis de datos. En ciertas modalidades, el resultado de prueba final es una puntuación de probabilidad que refleja una predicción del estado de IBD del paciente.
La prueba de diagnóstico de sgi para IBD de la presente invención usa adecuadamente datos serológicos, genéticos e inflamatorios para diagnosticar o ayudar a los médicos diagnosticar si un paciente tiene IBD y/o un subtipo tal como UC, CD, IC y/o IBD que sea no concluyente para CD y UC. En ciertas modalidades, la prueba de diagnóstico usa 13 biomarcadores serológicos inflamatorios y 4 marcadores genéticos para evaluar el perfil de riesgo de un paciente. En ciertas otras modalidades, la prueba toma las mediciones de los marcadores biológicos y usa un algoritmo computacional para predecir el estado de IBD de un paciente. En particular, la prueba puede predecir si un paciente tiene IBD o no IBD. La prueba también puede examinar las mediciones de marcadores del paciente que se predice tenga IBD y excluidas de tener colitis indeterminada (IC) y/o IBD no concluyente para CD y UC, y puede predecir si el paciente tiene UC o CD. La prueba de diagnóstico proporciona resultados detallados que ayudan a los médicos, opcionalmente en combinación con descubrimientos clínicos adicionales, a tomar las decisiones más informadas para el manejo de sus pacientes.
A. Medición de marcadores de inflamación sero-genética (sgi) La prueba de diagnóstico de sgi para IBD toma la medición de una pluralidad de marcadores de inflamación sero-genética (sgi) y usa un algoritmo computacional para predecir el estado de IBD de un paciente. Los métodos para medir marcadores de inflamación sero-genéticos (sgi) se describen, por ejemplo, en las patentes de E.U.A. Nos. 5,750,479; 5,830,675 y 7,873,479, patente de E.U.A. No. de publicación 2011/0045476 y solicitud de PCT No. PCT/US2011/039174, que se incorporan aquí por referencia en su totalidad para todos los propósitos.
B. Algoritmo de diagnóstico de sgi para IBD El algoritmo de diagnóstico de sgi para IBD toma ventaja de un algoritmo computacional (llamado algoritmo de inflamación sero-genética (sgi)) para predecir el estado de IBD de un paciente. Las etapas de una modalidad del algoritmo se ilustran en la figura 1. En primer lugar, el algoritmo usa un modelo de bosques aleatorios con base en datos de medición de 17 marcadores biológicos (marcadores serológicos, genéticos y de inflamación) y predice si un paciente tiene IBD o no tiene IBD (no IBD). Después, un árbol de decisiones o un conjunto de reglas se usa para determinar si un paciente que se predice tiene IBD tiene un patrón de biomarcadores consistente con un diagnóstico no concluyente (por ejemplo, un diagnóstico que sea no concluyente para CD vs. UC). Luego, otro algoritmo a base de bosques aleatorios que usa 11 mediciones de biomarcadores predice si el paciente que se predice tiene IBD tiene ya sea UC y CD. Así, el algoritmo de diagnóstico de sgi para IBD de la invención clasifica un paciente como teniendo no IBD, UC, CD o IBD que sea no concluyente para CD y UC.
C. Estrategia de modelado y conjunto de entrenamiento Los componentes del algoritmo sgi utilizan un tipo de clasificador computacional conocido como un modelo de bosques aleatorios, que está constituido de muchos árboles de decisiones con un componente aleatorio para construir cada árbol. Para el algoritmo sgi, bosques con 10,000 árboles se construyeron para cada una de las clasificaciones IBD vs. no IBD y UC vs. CD. Cada árbol de decisión en el bosque aborda el mismo problema de clasificación, pero con una colección diferente de ejemplos y un diferente subconjunto de características seleccionadas aleatoriamente del conjunto de datos de ejemplos proporcionado. Por ejemplo, un solo árbol podría construirse usando dos tercios aleatorios de los ejemplos disponibles, con dos tercios aleatorios de las características seleccionados para tomar una división de decisión en cada nodo del árbol. Una vez que el bosque se construya, nuevos ejemplos se clasifican al tomar un nuevo voto a través de todos los árboles de decisión. En el caso más simple, un clasificador de dos clases, la clase con la mayoría de votos gana. En algunos casos, el límite para un número ganador de votos es preestablecido para optimizar las mediciones de rendimiento. Por ejemplo, en casos cuando falsos positivos sean más costosos que falsos negativos, el límite se establece en un valor más alto.
Los clasificadores de bosques aleatorios del algoritmo sgi fueron construidos a partir de datos de entrenamiento que es una colección de muestras (conjunto de datos de muestras de cohortes de pacientes que tienen diagnósticos conocidos) con base en datos biológicos de pacientes no IBD, CD y UC conocidos. Las muestras fueron provistas en un formato estructurado que incluye datos acerca de características (por ejemplo, marcadores biológicos) que se sospeche están ligadas con la clasificación, junto con la verdadera clasificación para cada muestra. Este enfoque clasificador computacional se denomina un "aprendizaje por máquina supervisada", ya que (1) las verdaderas clases de los ejemplos se conocen de antemano (se supervisan); (2) la computadora hace el procesamiento (máquina) y (3) el algoritmo descubre y reconoce patrones característicos que distinguen las diferentes clases (aprendizaje). Después de que los patrones de características son aprendidos, el clasificador puede predecir las clasificaciones de ejemplos nuevos.
Un clasificador de bosques aleatorios de dos clases para predecir diagnóstico de IBD vs. no IBD se construyó a partir de una colección de datos de marcadores biológicos de inflamación sero-genética a partir de pacientes no IBD, CD y UC conocidos. Se consideraron originalmente 2,400 muestras con mediciones para 26 marcadores. Los marcadores biológicos inflamatorios sero-genéticos incluyen, pero no están limitados a, anticuerpos anXi-Saccharomyces cerevisiae (por ejemplo, ASCA-lgA, ASCA-lgG), anticuerpos anti-neutrófilos (por ejemplo, ANCA, pANCA tal como patrón perinuclear IFA y sensibilidad a DNasa), anticuerpos anti-microbianos y anti-flagelina (por ejemplo, anticuerpos contra OmpA, OmpC, CBirl , A4-Fla2, FlaX), factores de crecimiento (por ejemplo, VEGF), proteínas de fase aguda (por ejemplo, CRP), apolipoproteínas (por ejemplo, SAA), moléculas de adhesión celular (por ejemplo, ICAM-1 , VCAM-1), and SNPs (e.fif., ATG16L1 1155 (A>G), GLI1 2876 (G>A), IL10 (A>G), IRGM (A>G), IRGM (C>T), MAGI2 (C>G), TL1A (C>T) XBP1 (A>G), MDR1 2677 (G>T/A), ECM1 588 (C>T), NKX2-3 (A>G) y STAT3 (A>G)).
La estrategia de modelado se usa datos disponibles de muestras (pacientes) de un diagnóstico conocido para crear, probar y validar un algoritmo. Inicialmente los datos disponibles se dividieron en un conjunto de datos de entrenamiento y un conjunto de datos de validación. Para poder dar un recuento justo de la capacidad del algoritmo resultante para predecir nuevas muestras, toda la experimentación con técnica de modelado básica, selección de variable y arquitectura de modelo se restringió a sólo usar el conjunto de datos de entrenamiento. Durante las evaluaciones de efectividad de diferentes enfoques, el conjunto de datos de entrenamiento se dividió más en aleatorio en dos tercios de modelo de entrenamiento usado para crear un algoritmo, y conjunto de datos de prueba de un tercio usado para medir rendimiento. Todos los experimentos durante el modelado del algoritmo se repitieron a alrededor de 50-100 veces al re-dividir los conjuntos de datos de entrenamiento y prueba en aleatorio (un proceso llamado "re-muestreo"), comparando valores medios y asegurándose de que el error estándar en las medias fuera más pequeño que la diferencia en rendimiento.
Las muestras disponibles incluyeron datos de 26 marcadores biológicos. Para determinar su subconjuntos de marcadores tienen un valor predictivo más alto, se siguió un protocolo de eliminación de variables. Brevemente, el protocolo incluye determinar la importancia del error medio y estándar para cada marcador a través de re-muestreo, eliminar el marcador menos importante y repetir hasta que todos los marcadores tengan una importancia positiva mayor que su error estándar. El conjunto final de marcadores (por ejemplo, 17 marcadores) usado para construir el modelo IBD vs. no IBD se seleccionó al considerar importancia de variables, estabilidad de ensayo y disponibilidad. No todos estos marcadores probaron ser significativos para el modelo de UC vs. CD y así, sólo un subconjunto de los marcadores (por ejemplo, 1 1 marcadores) se usó para este modelo.
Después de establecer todos los criterios y marcadores de entrenamiento, se creó un modelo de IBD vs. no IBD usando todos los datos de entrenamiento. Luego, se creó un modelo de UC vs. CD en un subconjunto adecuado de estos datos.
Las muestras de CD y UC conocidas (por ejemplo, muestras de pacientes previamente diagnosticados como teniendo CD o UC) en el conjunto de datos de entrenamiento se estratificaron como sigue: diagnóstico como CD o UC, etnia/raza como judío o todas las demás, fuente de muestra como comunidad o académica, tiempo a partir de diagnóstico como < 5 años o > 5 años. Las muestras de control de enfermedad fueron estratificadas por diagnóstico de hepatitis, GERD o todas las demás, etnia/raza; y origen de muestra. Además, otras dos restricciones fueron aplicadas. En ciertos casos, no se usaron muestras de afroamericanos o pediátricas ni en los conjuntos de entrenamiento ni en los de validación. También, 174 muestras de CD de una cohorte particular no se usaron en el conjunto de validación toda vez que se usaron como parte de otro protocolo.
D. Transformación de texto en medida de marcadores numéricos discreta Ya que el algoritmo sgi requiere valores numéricos, datos a base de texto para cualquier marcador biológico se transforman en variables binarias al correlacionar un valor de 0 ó 1 con un conjunto de reglas (véase tabla 16).
Tabla 16 Reglas para transformar datos a base de texto en datos numéricos discretos (por ejemplo, variables binarias) para 6 marcadores biológicos inflamatorios sero- qenéticos Los datos de pANCA y pANCA2 se refieren a la cantidad y ubicación del marcador de fluorescencia para ANCA detectado en la muestra de paciente. El término "no detectado" indica que no se detectó marcador, y de esta manera la muestra se consideró negativa y se le asignó un valor de 0. Las muestras denominadas "resistente a DNAsa" indica que el marcador no puede desaparecer después del tratamiento con DNAsa y se consideraron "no detectadas". Se debe notar que este patrón de marcadores no se observó en el conjunto de muestra de datos usado para establecer el algoritmo sgi usado en este ejemplo. Sin embargo, las muestras "resistentes a DNAsa" normalmente se presentan en 2% del conjunto de muestras. El término "sensible a DNasa (citoplásmica)" indica que después del tratamiento con DNasa, el marcador fue distribuido con el citoplasma de células, y la muestra se consideró negativa. También se le asignó un valor de 0. Los términos "DNasa sensible 1 +P", "DNasa sensible 2+P", "DNasa sensible 3+P", "DNasa sensible 4+P", indicaron que el marcador se observó por evaluación visual como rodeando los núcleos de células (patrón perinuclear) con intensidad cada vez más alta y cantidad de marcador vista a partir de 1 +P a 4+P, en donde 4+P se correlaciona con la cantidad más grande de marcador. Para pANCA, estos marcadores se consideraron detectados y positivos, y de esta manera se les asignó un valor de 1. Para pANCA2, sólo marcadores de 2+P a 4+P se consideraron positivos y se les dio un valor de 1. Notablemente, pANCA y pANCA2 son dos mediciones determinadas independientemente de un solo marcador. La figura 4 muestra ejemplos de diferentes patrones de tinción de pANCA, incluyendo un patrón perinuclear, un patrón citoplásmico sensible a DNasa y un patrón resistente a DNAsa.
Para marcadores genéticos tales como ATG16L1 , ECM1 , NKX2-3 y STAT3, VIC y FAM se refiere a colorantes reporteros fluorescentes usados para marcar diferentes alelos de cada gen. Ya sea el VIC o el colorante FAM se usa para marcar el alelo de enfermedad para cada gen. Los datos de texto "VIC" "FAM", o "Both" indican si el alelo normal, el alelo de enfermedad o ambos alelos son vistos en la muestra. En algunas modalidades, si sólo el colorante para el alelo normal ("VIC" o "FAM", dependiendo del gen) es detectado, el paciente es homocigótico para el alelo normal y a los datos de marcadores se les asigna un valor de 0. En ciertos casos, si en el colorante para el alelo de enfermedad ("VIC" o "FAM", dependiendo del gen) se detecta, esto indica que el paciente es homocigótico para el alelo de enfermedad, y se le asigna un valor de 1. En otros casos, si ambos colorantes se detectan y describen como "Ambos", esto indica que el paciente es heterocigótico para el alelo de enfermedad y se le asigna un valor de 0.
E. Eliminación de muestras Para construir el algoritmo sgi, los datos disponibles para las muestras se revisaron y las muestras fueron eliminadas del conjunto de datos si estaban de acuerdo con un criterio definido. Ejemplos de un criterio definido incluyen: si una muestra es de un paciente que recién experimentó síntomas más de 6 meses antes de la visita a un doctor, o si una muestra es de un paciente cuyo último síntoma se describió como "no disponible" y quien se inscribió en el estudio antes. Otros ejemplos de pacientes que fueron excluidos son aquellos que no pudieron cumplir los criterios de inclusión y exclusión para el estudio y aquellos en los cuales la información relacionada con la longitud de la enfermedad está ausente. Muestras de pacientes que tenían pANCA2 positivo y un ANCA<11.9 EU/ml se eliminaron de los datos. Asimismo, aquellos con pANCA negativo y ANCA<11.9 EU/ml también fueron excluidos. Esto dejó 1 ,083 muestras para el conjunto de entrenamiento y 437 muestras para el conjunto de validación.
F. Primer modelado por bosques aleatorios para predecir diagnóstico de IBD vs. no IBD Todas las muestras restantes se usaron para construir el clasificador de bosques aleatorios de dos clases que predice el diagnóstico de IBD vs. no IBD usando un enfoque de aprendizaje con máquina supervisado, tal como el paquete RandomForest de R. Se usaron 17 marcadores de inflamación sero-genética (sgi) incluyendo anticuerpos anti-Saccharomyces cerevisiae (por ejemplo, ASCA-lgA y ASCA-lgG), anticuerpos anti-neutrófilos (por ejemplo, pANCA y ANCA), anticuerpos anti-microbianos y anti-flagelina (por ejemplo, anti-OmpC, anti-CBir1 , anti-Fla2 y anti-FlaX), factores de crecimiento (por ejemplo, VEGF), proteínas de fase aguda (CRP), apolipoproteínas (por ejemplo, SAA), moléculas de adhesión celular (por ejemplo, ICAM y VCAM), y SNPs (por ejemplo, ATG16L1 , ECM1 , NKX2-3 y STAT3). El límite de puntuación se estableció en 0.64 para lograr la compensación deseada entre sensibilidad y especificidad.
El algoritmo sgi usa puntuaciones de 17 marcadores biológicos de inflamación sero-genética para calcular una primera puntuación modelo para una nueva muestra en la prueba de diagnóstico. Si la puntuación es <0.64, se predice que la muestra es de un paciente que tiene IBD. De otro modo, se predice que la muestra es de un paciente que tiene no IBD. Las muestras que se predice tienen IBD proceden a la siguiente etapa del algoritmo, en donde un árbol de decisiones o un conjunto de reglas se utiliza para predecir una muestra no concluyente.
G. Árbol de decisiones o conjunto de reglas para determinar si la muestra es no concluyente En ciertas modalidades, un árbol de decisiones o conjunto de reglas se usa para determinar si una muestra, clasificada en el primer módulo de bosques aleatorios como teniendo IBD, tiene también patrones de marcadores ambiguos, de tal forma que la muestra pueda ser clasificada como no concluyente. Si ANCA es >16.8 EU/ml, la puntuación de pANCA2 es positiva, y una o más de las siguientes condiciones son ciertas: CBirl >29.475 EU/ml, Fla2 >34.5 EU/ml o FlaX >28.875 EU/ml, entonces la muestra se determina como "indeterminada" y el paciente es "no concluyente" para CD y UC. De manera similar, si la puntuación pANCA2 es positiva y cualquiera 2 o más de estas condiciones son ciertas: CBirl >29.475 EU/ml, Fla2 >34.5 EU/ml o FlaX >28.875 EU/ml, entonces la muestra también es "indeterminada" y el paciente es "no concluyente" para CD y UC. Valores de referencia en las clasificaciones y reglas descritas aquí son de los terceros cuartiles del conjunto de entrenamiento.
H. Segundo modelado por bosques aleatorios para predecir diagnóstico de UC vs. CD Un segundo modelo de bosques aleatorios para predecir UC vs. CD se creó a partir de un subconjunto del conjunto de datos de entrenamiento original. Las muestras determinadas como muestras no IBD conocidas, muestras indeterminadas y muestras que cumplían los criterios de violación de la regla 1 (también llamados grupo 1 ) o regla 2 (también llamados grupo 2) fueron excluidos del conjunto de datos de entrenamiento. Una descripción detallada de las violaciones de regla 1 y regla 2 se describe en la tabla 17.
Tabla 17 Criterios de violación usados para excluir muestras usadas en construir el segundo clasificador de bosques aleatorios para predecir UC vs. CP Debido a estos criterios de exclusión de muestras, 540 muestras fueron usadas para determinar un clasificador de bosques aleatorios de dos clases para predecir diagnóstico de UC vs. CD. Los mismos métodos de selección de marcadores usados en el modelo de bosques aleatorios de IBD vs. no IBD fueron usados. Los marcadores de inflamación sero-genética seleccionados fueron ASCA-lgA, ASCA-lgG, pANCA, ANCA, OmpC, CBirl , Fla2 and FlaX, VEGF, ECM1 y STAT3. El límite de puntuación para el segundo clasificador de bosques aleatorios se estableció en 0.35.
En ciertas modalidades, el algoritmo de diagnóstico de sgi aplica puntuaciones de 11 marcadores biológicos inflamatorios sero-genéticos para calcular una segunda puntuación modelo para una nueva muestra. Si la puntuación es <0.35, se predice que la muestra es de un paciente que tiene CD. De otro modo, se predice que la muestra es de un paciente que tiene UC.
I. Ejemplo de algoritmo para predecir diagnóstico en muestras nuevas En ciertas modalidades, el algoritmo de diagnóstico de sgi para IBD de la presente invención usa mediciones de 17 marcadores biológicos inflamatorios sero-genéticos (sgi) (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-A4-Fla2, pANCA, anti-OmpC, anti-CBir1 , ATG16L1 , CRP, SAA, ICAM, VCAM, ECM1 , STAT3, VEGF, NKX2-3, y combinaciones de los mismos) y calcula una puntuación con base en el primer modelo de bosques aleatorios para predecir IBD vs. no IBD (véase figura 1 , 110). El primer modelo de bosques aleatorios determina si un paciente tiene IBD. Si la puntuación es menor que el límite de IBD vs. no IBD (por ejemplo, <0.64), se predice que la muestra es de un paciente que tiene IBD (125). De otra manera, se predice que la muestra es de un paciente que tiene no IBD (120). Las muestras que se predice tienen IBD proceden a la siguiente etapa del algoritmo, que es un árbol de decisiones o conjunto de reglas diseñado para descartar clasificar la muestra como no concluyente (130). Si una muestra coincide con el patrón ya sea para cualquiera de las reglas "indeterminadas", el algoritmo predice que la muestra tiene IBD, pero es no concluyente para UC y CD (135). De otra manera, la muestra procede a la siguiente etapa del algoritmo (140), que es un segundo modelo de bosques aleatorios para predecir UC vs. CD (150). El algoritmo de diagnóstico de la presente invención usa mediciones de 11 marcadores biológicos inflamatorios sero-genéticos (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-A4-Fla2, pANCA, anti-OmpC, anti-CBir1 , ECM1 , STAT3, VEGF, y combinaciones de los mismos) para calcular una puntuación modelo con base en el segundo modelo de bosques aleatorios para predecir UC vs CD. Si la puntuación es menor que el límite de UC vs. CD (por ejemplo, 0.35), el algoritmo predice la muestra como teniendo CD (153). De otra manera, el algoritmo predice la muestra como teniendo UC (155).
J. Evaluación de rendimiento El rendimiento del algoritmo sgi se midió usando un conjunto de validación separado que satisfacía los mismos criterios de exclusión que los usados durante el entrenamiento. Después de aplicar el mismo conjunto de exclusiones usado para el entrenamiento del primer modelo de bosques aleatorios, el conjunto de validación consistía en 437 muestras. Las mismas reglas para exclusión que las aplicadas durante el entrenamiento del segundo modelo de bosques aleatorios (por ejemplo, pacientes indeterminados y también violaciones a la "regla 1 /regla 2") se usaron antes de determinar el rendimiento de las llamadas de UC vs. CD. Esto dejó 199 muestras como UC conocida o CD conocida. Los resultados se presentan en la tabla 18. Los datos demuestran que el algoritmo sgi predice IBD, CD y UC con alta sensibilidad y especificidad. La figura 5 proporciona características de cohortes de entrenamiento y validación e ilustra que el área bajo la curva ROC es mayor para el algoritmo sgi que para marcadores individuales solos. De esta manera, el algoritmo sgi de la invención adecuadamente (i) ayuda a distinguir entre IBD, no IBD y UC, (ii) tiene mejor rendimiento que pruebas de límites ASCA/ANCA, y (iii) identifica pacientes que tienen bajos niveles de marcadores IBD pero que aún son positivos para enfermedad.
Tabla 18 Resultados de rendimiento para algoritmo sgi en un conjunto de validación separado K. Importancia de marcadores El modelado de bosques aleatorios proporciona un método para determinar la importancia de variables (por ejemplo, marcadores). Esto se hace al aleatorizar las mediciones para un marcador entre todas las muestras y luego determinando la caída promedio en precisión en árboles en el bosque. De esta manera cualquier correlación significativa entre el marcador y el resultado predicho es probable que sea rota, mientras que al mismo tiempo se conservan todas las características de la distribución estadística del marcador. Sólo las muestras no usadas en el entrenamiento de un árbol particular ("fuera de la bolsa") se usan para la determinación de precisión. El procedimiento se repite entonces para cada uno de los demás marcadores. La puntuación reportada es la reducción promedio en precisión dividida entre esta varianza. Ya que dos modelos de bosques aleatorios están en el algoritmo sgi, se requieren dos conjuntos de importancia. Estos se muestran en las tablas 19 y 20. Nótese que todos los marcadores mantenidos para cada modelo tienen al menos alguna importancia. Junto con cuestiones prácticas tales como estabilidad de ensayo y costo, la importancia medida se usó para decidir qué marcadores se conservaban en los ensayos.
Tabla 19 Medición de importancia de marcadores usados en el modelo IBP vs. no IBP, en orden descendente de importancia en el conjunto de entrenamiento Tabla 20 Medición de importancia de marcadores usados en el modelo de UC vs. CP. en orden descendente de importancia en el conjunto de entrenamiento Un experto en la técnica entendería que de acuerdo con el valor de importancia, ANCA tiene la mayor importancia y VEGF tiene la menor importancia en el modelo de IBD vs. no IBD. De manera similar, ANCA tiene el valor de importancia más alto y VEGF tiene el valor de importancia más bajo en el modelo de UC vs. CD. Alguien de capacidad también sabría que un algoritmo usado para determinar o predecir un diagnóstico de IBD vs. no IBD puede incluir uno o una pluralidad de los marcadores listados en la tabla 19. Asimismo, alguien de capacidad sabría que un algoritmo usado para determinar o predecir un diagnóstico de UC vs. CD puede incluir uno o una pluralidad de los marcadores listados en la tabla 20.
Ejemplo 4.
Modelado por regresión logística de diagnósticos de IBD usando marcadores de inflamación sero-genética Este ejemplo ilustra un método para crear un algoritmo para diagnósticos de IBD con base en modelado por regresión logística. Este ejemplo ilustra además un método para construir un algoritmo que comprende dos modelos de regresión logística, en donde un modelo puede predecir un diagnóstico de IBD vs. no IBD, y otro modelo puede predecir un diagnóstico de CD vs. UC.
Un modelo de regresión logística (también denominado un modelo logístico o un modelo logit) se usa para la predicción de la probabilidad de ocurrencia de un evento al ajustar datos a una función logit de curva logística. En algunos casos, es un modelo lineal generalizado usado para regresión binomial.
En algunas modalidades, los modelos de regresión logística usan los mismos marcadores de inflamación sero-genética y la composición de cohortes que aquellos ilustrados para construir los modelos de bosques aleatorios descritos en el ejemplo 3. Los 17 marcadores de inflamación sero-genética incluyen, pero no están limitados a, anticuerpos anti- Saccharomyces cerevisiae (por ejemplo, ASCA-lgA y ASCA-lgG), anticuerpos anti-neutrófilos (por ejemplo, pANCA y ANCA), anticuerpos antimicrobianos y anti-flagelina (por ejemplo, anticuerpos para OmpC, CBirl , Fla2 y FlaX), factores de crecimiento (por ejemplo, VEGF), proteínas de fase aguda (CRP), apolipoproteínas (por ejemplo, SAA), moléculas de adhesión celular (por ejemplo, ICAM y VCAM), y SNPs (por ejemplo, ATG16L1 , ECM1 , NKX2-3 y STAT3).
Las muestras fueron seleccionadas para exclusión a partir de conjuntos de entrenamiento y validación siguiendo reglas similares a las descritas en el ejemplo 3. Los modelos de regresión logística fueron construidos a partir de 1083 muestras en el conjunto de entrenamiento. Los modelos fueron luego probados para rendimiento de predicción usando un conjunto de validación de 437 muestras de diagnósticos conocidos.
Los modelos logísticos fueron creados usando los mismos marcadores de inflamación sero-genética y composición de cohorte que aquellos usados para construir los modelos de bosques aleatorios descritos en el ejemplo 3. El método para desarrollar el algoritmo se ilustra en la figura 6. Para entrenar el modelo de regresión logística para predecir diagnóstico de IBD vs. no IBD (610), se usaron 17 marcadores de inflamación sero-genética que consistían en anticuerpos anti- Saccharomyces cerevisiae (por ejemplo, ASCA-lgA y ASCA-lgG), anticuerpos anti-neutrófilos (por ejemplo, pANCA y ANCA), y anticuerpos antimicrobianos y anti-flagelina (por ejemplo, anticuerpos para OmpC, CBirl , Fla2 y FlaX), factores de crecimiento (por ejemplo, VEGF), proteínas de fase aguda (CRP), apolipoproteínas (por ejemplo, SAA), moléculas de adhesión celular (por ejemplo, ICAM y VCAM), y SNPs (por ejemplo, ATG16L1 , ECM1 , NKX2-3 y STAT3). Así, se crea el algoritmo estadístico computacional que puede predecir si una muestra es de un paciente que se predice tiene IBD o no IBD (620).
Las muestras predichas como teniendo IBD se usan para crear el segundo modelo logístico después de que las muestras determinadas como muestras indeterminadas de IBD son retiradas (630). En forma similar al análisis por árboles de decisión descrito en el ejemplo 3, muestras indeterminadas se definen como aquellas que cumplen uno de los siguientes dos criterios: 1 ) una puntuación ANCA >16.8 EU/ml, puntuación pANCA2 positiva y una o más de las siguientes condiciones como siendo ciertas: CBirl > 29.475 EU/ml, Fla2 > 34.5 EU/ml o FlaX > 28.875 EU/ml; o pANCA2 positivas y cualquiera 2 o más de estas condiciones como siendo ciertas: CBirl > 29.475 EU/ml, Fla2 > 34.5 EU/ml o FlaX > 28.875 EU/ml. Si se predijo que una muestra tenía IBD de acuerdo con el modelo de regresión logística para IBD vs. no IBD, y se determinó que era un amuestra indeterminada o no concluyente, se predice que la muestra tiene colitis indeterminada (IC) o es no concluyente. Se usaron 11 marcadores de inflamación sero-genética (por ejemplo, ANCA, ASCA-A, ASCA-G, anti-FlaX, anti-Fla2, pANCA, anti-OmpC, anti-CBir1 , ECM1 , STAT3, VEGF y combinaciones de los mismos) para entrenar el segundo modelo logístico (630). El algoritmo entrenado y validado puede predecir si un paciente tiene CD vs. UC (640).
El rendimiento del algoritmo de modelo logístico puede analizarse al probar el algoritmo en un conjunto de validación de muestra de diagnósticos conocidos. Una comparación del rendimiento del algoritmo de bosques aleatorios descrito en el ejemplo 3 y el algoritmo de regresión logística descrito arriba muestra que el bosque aleatorio demuestra más especificidad para IBD, sensibilidad y especificidad para CD y especificidad para UC (tabla 21 ).
Tabla 21 Comparación de rendimientos de algoritmos La tabla 22 muestra el rendimiento del algoritmo para predecir IBD, CD y UC. La sensibilidad se calcula usando la siguiente ecuación: verdaderos positivos/(verdaderos positivos + falsos negativos). La especificad se calcula usando la ecuación: verdadero negativo/(verdadero negativo + falso positivo). La precisión se calcula con la fórmula: (verdadero positivo + verdadero negativo)/(verdadero positivo + verdadero negativo + falso positivo + falso negativo). La precisión se calcula a partir de la ecuación: verdadero positivo/(verdadero positivo + falso positivo). El algoritmo tiene alta sensibilidad y precisión para predecir UC.
Tabla 22 Rendimiento del algoritmo de regresión logística La sensibilidad del algoritmo puede analizarse y graficarse como dos curvas características operativas receptoras (ROC), una representando el modelo logístico de IBD y la otra representando el modelo lógico de UC. La figura 7A ilustra que el modelo de IBD es un buen sistema clasificador para predecir IBD. La figura 7B ilustra que el modelo de UC es un buen sistema clasificador para predecir UC.
La similitud de los algoritmos con base ya sea en el modelo logístico IBD o el modelo de bosques aleatorios de IBD puede compararse en una gráfica dispersora de valores predichos (figura 8) o una gráfica de densidad de valores p predichos medios (figura 9). La figura 9 ilustra que hay algunas diferencias entre el modelo de regresión logística y cualquiera de los modelos de bosques aleatorios.
Además, las similitudes de los algoritmos con base ya sea en el modelo logístico de UC o el modelo de bosques aleatorios de UC vs. CD pueden compararse en una gráfica dispersora de los valores predichos (figura 10) o una gráfica de densidad de los valores p predichos medios (figura 11). La figura 11 muestra que hay algunas diferencias entre el modelo de regresión logística y cualquiera de los modelos de bosques aleatorios.
Ejemplo 5.
Diagnósticos de IBD mejorados usando algoritmo sgi con base en dos modelos de bosques aleatorios Este ejemplo ilustra métodos para mejorar diagnóstico de IBD usando un algoritmo a base de marcadores de inflamación sero-genética (sgi) para predecir el estado de IBD de un paciente (por ejemplo, no IBD, UC, CD, IC o IBD pero no concluyente para UC y CD). En algunas modalidades, el algoritmo sgi comprende uno o una pluralidad de modelos de bosques aleatorios que usan mediciones de marcadores de inflamación sero-genética conocidos a partir de muestras de pacientes clasificados con no IBD, IC, UC o CD para construir un clasificador a base de computadora. En algunas modalidades, el algoritmo sgi puede tener un modelo de bosques aleatorios que prediga IBD vs. no IBD.
En otra modalidad, el algoritmo sgi puede tener un modelo de bosques aleatorios que prediga UC vs. CD.
Las etapas de una modalidad del algoritmo sgi para IBD de la presente invención se ilustran en la figura 1. En primer lugar, el algoritmo sgi usa un clasificador de bosques aleatorios con base en datos de medición de 17 marcadores biológicos (18 valores porque pANCA se mide dos veces) y predice si un paciente es no IBD o tiene IBD (110). Luego, un árbol de decisiones o conjunto de reglas se usa para determinar si un paciente que se predice tiene IBD tiene un patrón de biomarcadores que es consistente con un diagnóstico inconcluso (por ejemplo, un diagnóstico que sea inconcluso para CD vs. UC) (130). Después, otro algoritmo a base de bosques aleatorios que usa 11 mediciones de marcadores predice si el paciente que se predice que tiene IBO tiene ya sea UC o CD (150). Así, la prueba del algoritmo sgi clasifica una muestra como de un paciente no IBD (120), inconcluso (135), CD (153) o UC (155).
El algoritmo sgi se construye a través de una serie de etapas de entrenamiento, prueba y re-muestreo que utilizan un conjunto de datos de entrenamiento (por ejemplo, conjunto de entrenamiento) que contiene la medición de marcadores conocida a partir de muestras de pacientes de IBD, IC, UC y/o CD. El conjunto de entrenamiento se divide de tal manera que dos tercios comprendan el conjunto de entrenamiento de modelo y un tercio comprenda el conjunto de prueba.
En ciertos casos, una muestra del conjunto de datos de entrenamiento se elimina de análisis adicional si cumple cualquiera de los siguientes criterios: (1) la última experiencia de síntomas del sujeto fue más de 6 meses antes de una visita al doctor; (2) el último síntoma del sujeto se describió, "N/A" y el sujeto se inscribió en el estudio; (3) el sujeto no cumplió los criterios de inclusión/exclusión del estudio; y (4) el historial del sujeto carecía de información con respecto a la longitud de la flexión de la enfermedad.
En algunos casos, una muestra se retira del conjunto de datos de entrenamiento para el modelo de bosques aleatorios de UC vs. CD. En algunos casos, una muestra que cumple los siguientes criterios es eliminada: 1) diagnóstico de CD conocido; 2) ANCA <16.8 EU/ml; pANCA2 negativo; y 3) una o más de estas condiciones satisfechas: ASCA-A >10.675 EU/ml, ASCA-G >14.175 EU/ml, OmpC >9.4 EU/ml, CBirl >29.475 EU/ml, Fla2 >34.5 EU/ml, o FlaX >28.875 EU/ml. En otros casos, la muestra de un sujeto se retira del conjunto de datos de entrenamiento usado para construir el modelo de bosques aleatorios de UC vs. CD si: 1) el sujeto tiene un diagnóstico de UC; 2) ANCA >16.8 EU/ml; pANCA2 positive; y 3) todas de las siguientes condiciones son satisfechas: ASCA-A <20.675 EU/ml, ASCA-G <14.175 EU/ml, OmpC < 9.4 EU/ml, CBirl <29.475 EU/ml, Fla2 <34.5 EU/ml y FlaX <28.875 EU/ml. En otros casos más, una muestra se excluye del conjunto de entrenamiento si es una muestra de no IBD conocida, por ejemplo, diagnosticada previamente como teniendo no IBD. En algunos casos, una muestra determinada como indeterminada, en donde cumple cualquiera de las siguientes condiciones también se excluye del conjunto de entrenamiento. Una condición incluye: ANCA >16.8 EU/ml, pANCA2 positiva, y uno o más de estos criterios, en donde CBirl >29.475 EU/ml, Fla2 >34.5 EU/ml o FlaX >28.875 EU/ml. Otra condición incluye: pANCA2 positiva, y cualquiera dos o más de estos criterios, en donde CBirl >29.475 EU/ml, Fla2 >34.5 EU/ml o FlaX >28.875 EU/ml. En otros casos más, las muestras se excluyen si cumplen uno de los siguientes criterios: (1) pANCA2=1 y ANCA <11.9 EU/ml; (2) pANCA2=0 y ANCA >11.9 EU/ml; (3) es claramente afectada por un error; o (4) se vuelve a probar normalmente durante el modo de producción.
Este ejemplo ilustra un método para construir un algoritmo sgi para IBD usando un conjunto de entrenamiento a modelar. Este ejemplo ¡lustra también un método para validar un algoritmo sgi para IBD. En algunas modalidades, se establecen límites iniciales como los límites promedio a partir de la fase de re-muestreo del algoritmo. Probabilidades y predicciones en datos marcadores artificiales pueden hacerse de tal manera que un modelo final pueda compararse con modelos re-muestreados promedio. En algunos casos, datos de marcadores artificiales son un conjunto de datos que abarcan eficientemente el espacio clínico relevante de marcadores con distribuciones similares. En ciertas modalidades, un algoritmo crea un valor estadístico (por ejemplo, octil o un cuantil con 8 regiones) de los marcadores continuos y genera un valor de marcadores aleatorios al recoger un octil en aleatorio o al seleccionar un número aleatorio distribuido uniformemente dentro de ese octil. En el caso de marcadores de valores binarios, un octil puede seleccionarse en aleatorio, excepto si pANCA2 = 1 , entonces pANCA se establece en igual 1 , o si todos los demás marcadores se generan independientemente.
En algunos casos, una muestra se clasifica como de un paciente con colitis indeterminada (IC). En casos particulares, una muestra que se determine como teniendo IBD, un nivel ANCA > Q3, pANCA2 positiva, y anti-CBir1 o anti-Fla2 o anti-Flax >Q3, se predice que es de un paciente con IC. En otros casos, un paciente de IC puede ser un paciente que se determine tenga IBD quien también sea positivo para pANCA2 y exprese dos de los tres marcadores (por ejemplo, anti-CBin , anti-Fla2 y anti-FlaX) >Q3. La tabla 23 muestra el rendimiento del algoritmo sgi en comparación con el ensayo de "serología 7" (Prometheus Laboratories Inc., San Diego, CA). Notablemente, la tabla 23 muestra que el rendimiento del algoritmo sgi se mejora sobre el ensayo "serología 7".
Tabla 23 Rendimiento de algoritmo sqi La tabla 24 muestra el rendimiento del algoritmo SGI con un conjunto de validación (por ejemplo, conjunto de prueba) en comparación con el rendimiento con dos cohortes no usadas para entrenamiento o prueba del algoritmo. Se debe notar que la cohorte pediátrica es relativamente pequeña con 61 muestras después de que se siguen las reglas de exclusión de muestras. El rendimiento del algoritmo sgi en un conjunto de validación es mejor que en conjuntos de prueba de cohortes no usadas en el entrenamiento.
Tabla 24 Rendimiento de algoritmo sqi con conjunto de validación Los datos demuestran una comparación de los modelos de bosque aleatorio del algoritmo sgi con un modelo de regresión logística. La figura 12 ilustra una gráfica dispersora de los valores p de un modelo de regresión logística para IBD (véase ejemplo 4) a lo largo del eje y y los valores p de un modelo de bosques aleatorios para IBD creado en R a lo largo del eje x. La figura 13 ilustra una gráfica dispersora de los valores p de un modelo de regresión logística de UC vs. CD (véase ejemplo 4) a lo largo del eje y y los valores p de un modelo de bosques aleatorios para UC vs. CD a lo largo del eje x. Las figuras 14 y 15 ilustran las diferencias en rendimiento entre los dos algoritmos.
Los datos muestran una comparación del algoritmo sgi usando dos programas de análisis estadístico diferentes (por ejemplo, R y Matlab). La figura 14 muestra una comparación del modelo de IBD vs. no IBD. La figura 15 muestra una comparación entre el modelo de UC vs. CD. Los datos indican que los programas de software generaron resultados similares.
Ejemplo 6 Algoritmo de diagnóstico de sgi para IBD y conjuntos de datos para predecir diagnósticos de IBD Se crea un algoritmo de modelados por bosques aleatorios a través de un proceso de entrenamiento y del modelo computacional usando un conjunto de entrenamiento de datos de muestras de una cohorte. El algoritmo entrenado se valida usando un conjunto de datos de validación de muestras de una cohorte. Este ejemplo ilustra el uso de un conjunto de entrenamiento y un conjunto de validación en modelado por bosques aleatorios.
Este ejemplo ilustra un método para usar muestras con mediciones de marcadores biológicos para entrenar y validar un algoritmo de diagnóstico de modelado de aprendizaje con máquina por bosques aleatorios. Este ejemplo muestra que los métodos descritos aquí (véanse, por ejemplo, ejemplos 1-5) se pueden usar para predecir o diagnosticar no IBD, IBD, IC, CD, UC y/o IBD no concluyente para UC y UC. El ejemplo también ilustra que reglas para la exclusión de muestras pueden aplicarse en el algoritmo.
En algunas modalidades, los conjuntos de entrenamiento y validación comprenden mediciones de marcadores de inflamación sero-genética (sgi) (por ejemplo, ASCA-A, ASCA-G, pANCA, ANCA, anti-OmpC, anti-Fla2, anti-FlaX, VEGF, CRP, SAA, ICAM, VCAM, ATG16L1 , ECM1 , NKX2-3, y STAT3) de muestras con diagnósticos conocidos, tales como no IBD, CD y UC. El diagnóstico conocido de muestras en el conjunto de entrenamiento se lista en la columna "Dx3" de la tabla 29, en donde "0" se refiere al diagnóstico de no IBD, "1" se refiere a diagnóstico de CD y "2" se refiere a diagnóstico de UC. El término "diagnóstico conocido" se refiere al diagnóstico de un paciente usando un método que no comprende modelado de bosques aleatorios. En algunos casos, el diagnóstico conocido es determinado. La detección de marcadores biológicos de inflamación sero-genética en muestras de diferentes cohortes se llevó a cabo como se describe en la presente. La tabla 25 muestra mediciones de muestras #1 -14 del conjunto de entrenamiento (DataSet 1). DataSet 1 que tiene 14 muestras es simplemente un subconjunto representativo de un conjunto de datos mucho más grande que tiene un valor n de aproximadamente 1490 muestras. Datos de marcadores biológicos a base de texto se transformaron en variables numéricas discretas (véase, por ejemplo, ejemplo 3 y tabla 16). La tabla 26 abajo muestra las mediciones transformadas de marcadores tales como pANCA, ATG16L1 , ECM1 , NKX2-3 y STAT3.
Tabla 25 Marcadores biológicos en conjunto de entrenamiento Tabla 26 Variables binarlas de marcadores biológicos a base de texto en conjunto de entrenamiento El modelo de bosque aleatorio entrenado se validó usando el conjunto de validación de muestras listadas en las tablas 27 y tabla 28. De nuevo, el conjunto de validación mostrado aquí (muestras 15-28) es simplemente un subconjunto representativo de un conjunto de datos mucho más grande que tiene el valor de n de aproximadamente 679 muestras.
Tabla 27 Marcadores biológicos en conjunto de validación Tabla 28 Variables binarias de marcadores biológicos a base de texto en conjunto de validación La tabla 29 ilustra que el algoritmo de diagnóstico puede predecir diagnósticos de las muestras en el conjunto de entrenamiento y conjunto de validación. En particular, los valores en la columna "RF Dx4" describen el diagnóstico predicho como tal: "0" se refiere a no IBD; "1" se refiere a CD; "2" se refiere a UC y "3" se refiere a IC. La tabla 29 también muestra que muestras fueron excluidas o no excluidas (por ejemplo, incluidas) en los conjuntos de datos del algoritmo con base en criterios de eliminación de muestra, determinación de muestra indeterminada, violaciones de grupo 1 y violaciones de grupo 2 (véase, por ejemplo, ejemplos 1-4). La tabla 29 también muestra los diagnósticos conocidos de las muestras determinados antes del entrenamiento y validación del algoritmo de diagnóstico de la presente invención (véase columna "Dx3" en tabla 29).
Tabla 29 Diagnósticos predichos de muestras en conjunto de entrenamiento v conjunto de validación Las muestras #1 y 2 fueron excluidas del conjunto de entrenamiento usado para construir ambos modelos de bosques aleatorios del algoritmo sgi porque estas muestras cumplen una regla de exclusión. Las muestras #7 y 8 se usaron para construir el modelo de IBD vs. no IBD y se determinaron como muestras indeterminadas toda vez que cumplen las condiciones adecuadas. Las muestras #9, 10 y 11 fueron excluidas del conjunto de entrenamiento para construir el modelo de UC vs. CD toda vez que satisficieron las condiciones para una violación de grupo 1 (#9 y 10) o violación de grupo 2 (#11 y 12). Las muestras #5 y 6 estuvieron en el conjunto de entrenamiento y se predijo que tenían no IBD. Las muestras #13 y 14 se predijo que tenían IBD en el primer modelo de bosques aleatorios y CD en el segundo modelo. Las muestras #15-18 son del conjunto de validación. Las muestras #15-18 fueron excluidas toda vez que cumplen condiciones de exclusión. Las muestras #19 y 20 se predijo que tenían no IBD por el algoritmo sgi, el cual corresponde al diagnóstico conocido o anterior. Las muestras #21 y 22 se predijo que tenían IC, mientras que sus diagnósticos conocidos fueron UC y CD, respectivamente. Las muestras #27 y 28 tienen un diagnóstico conocido de CD, pero el algoritmo sgi predijo que #27 tiene no IBD y que #28 tiene CD.
Este ejemplo demuestra que el algoritmo sgi es un modelo válido para predecir un diagnóstico de no IBD, IC, UC o CD. Este ejemplo también demuestra que el uso combinatorio de marcadores serológicos, genéticos e inflamatorios proporciona una prueba de diagnóstico mejorada para distinguir entre subtipos de IBD tales como IC, UC y CD y para identificar IBD no concluyente para UC y CD.
Ejemplo 7.
Conjuntos de entrenamiento y validación de algoritmo de diagnóstico de sgi para IBD Este ejemplo ¡lustra el uso de un conjunto de entrenamiento y un conjunto de validación en modelado de bosques aleatorios. Un algoritmo de modelado de bosques aleatorios se crea a través de un proceso de entrenamiento del modelo computacional usando un conjunto de entrenamiento de datos de muestras de una cohorte. El algoritmo entrenado se valida usando un conjunto de validación de datos de muestras de una cohorte.
La figura 16 muestra el porcentaje de cada uno de los marcadores serológicos presentes en las cohortes de entrenamiento y/o validación. El diagrama de Venn en la izquierda muestra la superposición de anticuerpos Cbirl , Fla2 y FlaX en CD. El diagrama de Venn en la derecha muestra la superposición de anticuerpos CBirl , Fla2 y FlaX en no IBD.
La figura 17 muestra el porcentaje de cada uno de los marcadores inflamatorios presentes en las cohortes de entrenamiento y/o validación. El diagrama de Venn izquierdo muestra la superposición de CRP y SAA en IBD. El diagrama de Venn intermedio muestra la superposición de CRP y SAA en no IBD. El diagrama de Venn derecho muestra la superposición de CRP y SAA en controles sanos.
La figura 18 muestra el número de pacientes positivos para dos o más marcadores genéticos en las cohortes de entrenamiento y/o validación. Los resultados demuestran que el porcentaje de pacientes de IBD con dos o más marcadores genéticos es más alto que en pacientes no IBD. La tendencia es estadísticamente significativa.
Además, los resultados presentados en la presente demuestran que la patogénesis de IBD refleja una respuesta inmunológica desregulada a diversos antígenos (por ejemplo, levadura, bacterias, flagelinas, auto-anticuerpos) en una persona genéticamente susceptible dando como resultado inflamación y lesión tisular.
Un modelo de bosques aleatorios que analiza las interacciones complejas entre las tres clases de marcadores (serología, genética, inflamación) es más preciso para detectar patrones que diferencias pacientes de IBD vs. no IBD y pacientes CD vs. UC que usar una sola clase de marcadores (por ejemplo, serología).
Ejemplo 8.
Marcadores serologicos, genéticos e inflamatorios (sgi) combinados diferencian de manera precisa pacientes de no IBD, enfermedad de Crohn y colitis ulcerosa Este ejemplo ¡lustra el uso de los métodos de la presente invención para diferenciar en forma precisa entre no IBD, enfermedad de Crohn y colitis ulcerosa. Este ejemplo también describe un estudio que identificó una combinación de biomarcadores establecidos y nuevos que pueden mejorar la identificación y estratificación de IBD.
Un diagnóstico de IBD es complejo, a base de una combinación de examen clínico, formación de imágenes, endoscopia con histopalogía y pruebas de laboratorio. Los marcadores serologicos pueden proporcionar importante información auxiliar. El uso de serología para ayudar en el diagnóstico de IBD ha sido extensamente descrito en la literatura. Además de los auto-anticuerpos y anticuerpos antimicrobianos asociados típicamente con IBD, variantes genéticas y angiogénesis y moléculas de inflamación pueden ayudar a identificar mejor IBD. Una herramienta ideal para diagnóstico de IBD sería (1 ) distinguir a pacientes de IBD de pacientes con otros trastornos gastrointestinales (Gl), y (2) diferenciar UC de CD. En el estudio descrito aquí, la precisión de diagnóstico de un panel de biomarcadores serologicos (por ejemplo, ASCA-A, ASCA-G, ANCA, pANCA, anti-OmpC, y anti-CBir1 ) se comparó con un panel de 17 biomarcadores serologicos, genéticos e inflamatorios (sgi), incluyendo 4 variantes génicas (por ejemplo, ATG16L1 rs2241880, NKX2-3 rs10883365, ECM1 rs3737240, y STAT3 rs744166), marcadores inflamatorios (por ejemplo, CRP, SAA, ICAM, VCAM, y VEGF), y marcadores serologicos (por ejemplo, ASCA-A, ASCA-G, ANCA, pANCA, anti-OmpC, anti-CBir1 , anti-A4-Fla2, y anti-FlaX).
Muestras de pacientes bien caracterizadas fueron recolectadas de 8 prácticas académicas y 24 de comunidades médicas en Norteamérica. Muestras de 1 ,520 pacientes fueron incluidas: 572 de CD, 328 de UC, 183 de controles voluntarios sanos y 437 de controles de enfermedad no IBD incluyendo síndrome del intestino irritable, hepatitis, estreñimiento crónico, GERD, enfermedad celiaca, diverticulitis, etc. Se construyeron algoritmos de diagnóstico usando datos de un conjunto de entrenamiento de 1 ,083 pacientes seleccionado a partir de la cohorte completa. El rendimiento del algoritmo final se midió usando un conjunto de validación separado de 437 pacientes. Un área bajo la curva (AUC) característica operativa receptora (ROC) se calculó usando la puntuación de bosques aleatorios (por ejemplo, la proporción de árboles de decisiones para cada clasificación) como la variable continua. Puntuaciones límites seleccionadas durante el entrenamiento se aplicaron para calcular sensibilidad y especificidad.
Se usó análisis ROC para comparar la precisión de diagnóstico del panel de biomarcadores serológicos solo con el panel de 17 marcadores que también incluía 4 variantes génicas (por ejemplo, ATG16L1 rs2241880, NKX2-3 rs10883365, ECM1 rs3737240, STAT3 rs744166), cinco marcadores inflamatorios (por ejemplo, CRP, SAA, ICAM, VCAM, VEGF), y otros dos marcadores serológicos antimicrobianos (por ejemplo, anticuerpos contra A4-Fla2 y FlaX). Los marcadores adicionales incrementaron la discriminación de IBD vs. no IBD, AUC de 0.80 (I = 0.7682-0.8507) a 0.87 (95% Cl = 0.8442-0.9070) (p<0.001 ). La discriminación de UC vs. CD se incrementó de 0.78 (95% Cl = 0.7144-0.8403) a 0.93 (95% Cl = 0.8585-0.9354) (p<0.001). Véanse figuras 19 y 20. Ambos incrementos en la discriminación de IBD vs. no IBD y UC vs. CD se determinaron como estadísticamente significativos (p<0.001). Hubo reducciones en tasas de error de 18% para IBD, 18% para CD y 29% para UC. La sensibilidad en el rendimiento de identificar enfermedad posible fue de 74% para IBD, 89% para CD, y 98% para UC. La especificidad en el rendimiento de confirmar enfermedad fue 90% para IBD, 81% para CD, y 84% para UC.
Estos resultados demuestran que combinar marcadores de serología, genética e inflamación puede usarse para clasificar mejor a pacientes de IBD, CD y UC con mayor precisión que los marcadores de serología solos.
Ejemplo 9. Árbol de decisiones de pANCA Este ejemplo ilustra un árbol de decisiones que se desarrolló para mejorar predicciones de diagnóstico en una población de especímenes de pacientes negativos para pANCA2, por ejemplo, para minimizar el índice de predicción de IBD falso positivo. En ciertas modalidades, la definición de pANCA2 incluye todos los especímenes con una determinación de pANCA negativa (0 o "no detectada") o débil (+1). La metodología para desarrollar ese árbol de decisiones y sus características de rendimiento en un grupo grande de especímenes de pacientes caracterizados clínicamente y confirmados por biopsia se describen en la presente.
Metodología de desarrollo Los datos de laboratorio de los especímenes de entrenamiento y validación de pANCA2(-) originales que cumplieron criterios de inclusión/exclusión se analizaron en un nuevo archivo con el efecto de desarrollar, probar y validar el nuevo árbol de decisiones. Datos de laboratorio del subgrupo de sólo entrenamiento ANCA ELISA >1 1.9 EU/mL, de pANCA2(-) original se usaron para desarrollar el nuevo árbol de decisiones, mientras que el resto se reservaron para validación y calculación de métrica de rendimiento. Matrices de confusión comunes que comparaban predicciones de enfermedad contra resultados de biopsia (referencia) se usaron para evaluar el efecto de reglas potenciales dentro del árbol de decisiones. Es importante notar que una predicción de CD en un espécimen de UC conocido (y viceversa) se calificó como un falso positivo, mientras que una predicción de IBD no concluyente (IC) o en ya sea un espécimen de CD o UC conocido se calificó como un verdadero positivo para los efectos de valuación. Las reglas se desarrollaron con un intento por limitar las predicciones de IC a < 5% de todos los especímenes.
La característica principal que define este grupo de especímenes es evidencia serológica baja o indetectable para anticuerpos anti-nucleares neutrófilos (ANCA). Las reactividades de ANCA en los ensayos IFA o ELISA son los determinados primarios para una predicción de colitis ulcerosa (UC), de esta manera el enfoque de desarrollar un nuevo árbol de decisiones fue primero descartar una predicción de UC en cualquier espécimen particular al identificar patrones de no IBD y/o enfermedad de Crohn (CD) en ese espécimen antes de aplicar reglas definidas para hacer una predicción de UC.
Predicción de enfermedad de Crohn directa Primero, datos de los especímenes seleccionados fueron revisados y los valores potenciales para cada uno de los marcadores de CD individuales (por ejemplo, ASCA-A, ASCA-G, OmpC, Cbirl , Fla2 and FlaX) se evaluaron individualmente para su capacidad para conducir predicciones precisas. A través de una evaluación iterativa, se determinó que ciertos valores de ensayo para cualquiera de los ASCAs u OmpC, si se excedían, podrían usarse para hacer una predicción de CD. Si cualquiera de ASCA-lgA > 69 EU/mL, ASCA-lgG = 40 EU/mL u OmpC= 60 EU/mL, entonces el espécimen se predecía que era CD, y ese espécimen era retirado de consideración adicional.
Interferencia en CD mediante el uso de un "recuento" Después, combinaciones de varios marcadores de CD fueron evaluadas para su capacidad para conducir predicciones de CD. El concepto de un "recuento de CD" se utilizó para administrar efectivamente las múltiples combinaciones potenciales de marcadores de CD que podrían dar como resultado independientemente una predicción de CD. De nuevo, se usó un proceso altamente iterativo, dando como resultado un esquema bastante simple de calificación que se basó en intervalos de referencia indicados para cada ensayo. El procedimiento de recuento de CD final pondera los marcadores ASCA-A, ASCA-G y OmpC igualmente, mientras que requiere de al menos dos marcadores de flagelina para exceder su rango de referencia respectivo para tener un impacto positivo en el recuento de CD. Así, cualquier marcador de CD (o par de flagelinas) que iguale o exceda su límite de referencia superior respectivo se traduce en un incremento de +1 en el contador de CD. Además, si se encuentra que cualquier flagelina tiene un valor de ensayo = 100 EU/mL, entonces un +1 adicional se añade al contador de CD. No obstante del número de flagelinas que cumplen esta regla de = 100 EU/mL, el recuento total sólo se incrementa por +1. Cualquier espécimen con un recuento de CD final= 2 se designa como CD.
Especímenes negativos para pANCA Cualquier espécimen de entrenamiento restante, para el cual no se hizo una predicción de CD mediante el uso de los procedimientos anteriores, se dividió en subgrupos pANCA (-) (no detectado) y pANCA +1 (débilmente detectado) para análisis adicional. Se encontró que, en el grupo de pANCA (-), el uso del intervalo de referencia de ELISA de ANCA fue útil para designar especímenes no IBD. El límite para esta designación se estableció ligeramente arriba del intervalo de referencia superior indicado para equilibrar el rendimiento en esta predicción. También se determinó que un límite de valor de ELISA para ANCA podría establecerse para hacer predicciones de UC, aunque este valor deja una brecha entre las predicciones no IBD y UC directas. La brecha del valor de ELISA de ANCA, dentro de la cual una clara predicción de no IBD vs. UC no pudo hacerse, se encontró que incluía una mezcla complicada de especímenes de no IBD, CD y UC conocidos. Así, la designación de IBD no concluyente se aplicó a cualquier espécimen con un recuento CD = 1 , mientras que todos los demás en esta brecha fueron designados como no I BD .
Especímenes pANCA +1 Finalmente, datos de los especímenes pANCA +1 restantes fueron revisados. Se determinó que un valor ELISA para ANCA más bajo que el intervalo de referencia superior indicado podría usarse para diferenciar efectivamente predicciones no IBD de UC en este grupo. Árbol de decisiones La regla se establece como sigue - cualquier espécimen de paciente presentado para procesamiento sgi de IBD (serología, genética e inflamación) encontrado como pANCA2 negativo (es decir, pANCA = 0 o +1) fue retirado de la cola del algoritmo sgi y sujeto a la siguiente matriz de decisiones para hacer una predicción clínica: 1 ) Predicción de enfermedad de Crohn directa (CD). a. Si ASCA-lgA = 69 EU/mL, entonces designar resultado como "Patrón Consistente con IBD: Enfermedad de Crohn"; o b. Si ASCA-lgG = 40 EU/mL, entonces designar resultado como "Patrón Consistente con IBD: Enfermedad de Crohn"; o c. Si OmpC-lgA= 60 EU/mL, entonces designar resultado como "Patrón Consistente con IBD: Enfermedad de Crohn"; si no 2) Inferencia de CD mediante el uso de un "recuento". a. Determinar "recuento total" i. Si ASCA-lgA= 8.5 EU/mL (rango de referencia anterior) entonces sumar +1 al recuento de CD; ¡i. Si ASCA-lgG= 17.8 EU/mL (rango de referencia anterior) entonces sumar +1 al recuento de CD; iii. Si OmpC-lgA= 10.9 EU/mL iv. Si >2 marcadores de flagelina por arriba de sus rangos de referencia respectivos (Cbir1 -lgG= 78.4 EU/mL, A4-Fla2-lgG= 44.8 EU/mL, FlaX-lgG = 33.4 EU/mL), (rango de referencia anterior) entonces sumar +1 al recuento de CD; v. Si cualquier flagelina= 100EU/mL, entonces sumar +1 al recuento de CD. b. Si el recuento de CD total >2, entonces designar resultado como "Patrón Consistente con IBD: enfermedad de Crohn"; si no 3) Especímenes negativos para pANCA a. Si pANCA = 0 (no detectado) y ELISA de ANCA <20 EU/mL, entonces designar resultado como "Patrón No Consistente con IBD"; si no b. Si pANCA = 0 (no detectado) y ANCA de ELISA >27.4 EU/mL, entonces designar resultado como "Patrón Consistente con IBD: Colitis Ulcerosa"; si no c. Si pANCA = O (no detectado) y 20 < ELISA de ANCA <27.4 EU/mL y recuento de CD de 2b anterior = 0, entonces designar resultado como "Patrón No Consistente con IBD"; si no d. Si pANCA = 0 (no detectado) y 20 < ELISA de ANCA <27.4 EU/mL y recuento de CD de 2b anterior = 1 , entonces designar resultado como "Patrón Consistente con IBD: No concluyente para Enfermedad de Crohn vs. Colitis Ulcerosa"; si no 4) Especímenes pANCA +1. a. Si pANCA = +1 y ELISA de ANCA <13.7 EU/mL, entonces designar resultado como "Patrón No Consistente con IBD"; si no b. Si pANCA = +1 y ELISA de ANCA >13.7 EU/mL, entonces designar resultado como "Patrón Consistente con IBD: Colitis Ulcerosa".
Efecto de la regla El efecto acumulativo de la aplicación de las reglas descritas arriba en los conjuntos de datos intactos de especímenes de pANCA2 (-) se ilustra en las tablas 30 y 32. La tabla 30 demuestra el efecto de estas reglas en especímenes de validación con valores de ELISA de ANCA >1 1.9 EU/mL, mientras que la tabla 32 contiene datos de esos especímenes de validación con valores de ELISA de ANCA <11.9 EU/mL. La razón de esta distinción es que las predicciones de los especímenes con valores de ELISA para ANCA <11.9 EU/mL se incluyeron en el cálculo de métrica de rendimiento para el algoritmo sgi de IBD porque el rendimiento del algoritmo se consideró adecuado en esos especímenes, mientras que se acordó eliminar los especímenes con valores ELISA de ANCA >11.9 EU/mL de los cálculos de rendimiento y desarrollar métodos alternativos para hacer predicciones en ese grupo. No se debe considerar que este cambio implica que el algoritmo sgi de IBD no podría hacer predicciones en especímenes pANCA2 (-) con valores de ELISA para ANCA >11.9 EU/mL por varias razones. Debido a que la metodología de bosque aleatorio es esencialmente una herramienta de coincidencia de patrones que no se basa en ningún marcador individual, un algoritmo derivado a partir de esta metodología aún se puede usar para hacer predicciones de especímenes con un valor no preciso (o ausente) para un solo marcador componente. Además, el algoritmo sgi de IBD se entrenó con 17 marcadores y límites predictivos fueron establecidos altos en las curvas de AUC para reducir el efecto, si lo había, de marcadores individuales ausentes o imprecisos. Así, aunque las características de rendimiento derivadas a partir de los especímenes de validación no incluyen un subconjunto de los especímenes de validación de pANCA2 (-), la precisión total real del algoritmo sgi en los dos grupos pANCA (-), según se define por sus valores de ELISA para ANCA, es muy similar (véase, rendimiento para el algoritmo de bosque aleatorio en las tablas 31 y 33). De hecho, las sensibilidades de sgi para IBD calculadas y las tasas de falsos positivos entre estos dos grupos son virtualmente idénticas. Ya que el grupo pANCA2 (-), ANCA ELISA, 11.9 EU/mL se incluyó en la validación tanto de entrenamiento como de rendimiento del algoritmo de bosque aleatorio, el hecho de que el rendimiento de bosques aleatorios fuera esencialmente idéntico en el otro grupo no incluido en la validación de rendimiento implica que las predicciones clínicas hechas para el segundo grupo son tan confiables como aquellas hechas para el primer grupo.
Las siguientes tablas contienen matrices de confusión que demuestran el efecto de la predicción por árbol de decisiones (tabla 30) vs. la predicción hecha por el algoritmo de bosque aleatorio (tabla 31 ) en especímenes de pANCA2 (-) con valores de ensayo de ELISA para ANCA= 11.9 EU/mL.
Tabla 30 Rendimiento de árbol de decisión Sensibilidad= (Verdadero Positivo/(Verdadero Positivo + Falso Negativo))*100=78.9% Especificidad = (Verdadero Negativo/(Verdadero Negativo + Falso Positivo))*100=57% Precisión = ((Verdadero Positivo + Verdadero Negativo)/total)*100=70.2% índice de Falsos Positivos = (Falso Positivo/Falso Positivo + Verdadero Negativo)*! 00 = 43%.
Tabla 31 Rendimiento de bosque aleatorio Sensibilidad = (Verdadero Positivo/(Verdadero Positivo Negativo))*100=82.8% Especificidad = (Verdadero Negativo/(Verdadero Negativo + Falso Positivo))*100=34.9% Precisión = ((Verdadero Positivo + Verdadero Negativo)/total)*100=60.9% índice de Falsos Positivos = (Falso Positivo/Falso Positivo + Verdadero Negativo)*100 = 65.2%.
Se hace notar que, aunque la sensibilidad del árbol de decisiones es ligeramente más baja que el algoritmo de bosques aleatorios, la precisión total del árbol de decisiones es sustancialmente más alta, 70.2% vs. 60.9%, respectivamente y el índice de falsos positivos también se reduce sustancialmente en el método de árbol de decisiones en comparación con el algoritmo de bosques aleatorios, 43% vs. 65.2%, respectivamente.
La tabla 32 contiene matrices de confusión que demuestran el efecto de la predicción por árbol de decisiones vs. la predicción hecha por el algoritmo de bosques aleatorios (tabla 33) en especímenes pANCA2 (-) con valores de ensayo de ELISA para ANCA < 11.9 EU/mL.
Tabla 32 Rendimiento de bosque aleatorio Sensibilidad= (Verdadero Positivo/(Verdadero Positivo Negativo))*100=48.4% Especificidad = (Verdadero Negativo/(Verdadero Negativo + Falso Positivo))*100=91.6% Precisión = ((Verdadero Positivo + Verdadero Negativo)/total)*100=71.5% índice de Falsos Positivos = (Falso Positivo/Falso Positivo + Verdadero Negativo)*100 = 8.4%.
Tabla 33 Rendimiento de bosque aleatorio Sensibilidad= (Verdadero Positivo/(Verdadero Positivo + Falso Negativo))*100=42.6% Especificidad = (Verdadero Negativo/(Verdadero Negativo + Falso Positivo))*100=55.8% Precisión = ((Verdadero Positivo + Verdadero Negativo)/total)*100=50.3% índice de Falsos Positivos = (Falso Positivo/Falso Positivo + Verdadero Negativo)*100 = 44.2%.
En este grupo de especímenes, la sensibilidad del árbol de decisiones es ligeramente más alta que el algoritmo de bosques aleatorios, aunque la especificidad y precisión total del método de árbol de decisiones es sustancialmente más alta en comparación con el algoritmo de bosques aleatorios. El método de árbol de decisiones equilibra de manera efectiva las predicciones verdaderas negativas contra falsos positivos, mejorando dramáticamente la especificidad mientras minimiza el índice de falsos positivos.
Conclusiones Se concluye a partir de los datos anteriores que las reglas propuestas que comprenden el método de árbol de decisiones producen predicciones de sgi para IBD más precisas que el algoritmo de bosque aleatorio en la situación de sub-grupo específica de pANCA2 (-). Las tasas falsas positivas se reducen significativamente y la importancia de esta observación no debería ignorarse toda vez que los especímenes de interés aquí probablemente representan enfermedad muy temprana con reactividad sérica mínima a marcadores de IBD conocidos. Es importante minimizar la tasa a la cual falsas predicciones de IBD se hacen para evitar riesgos innecesarios (por ejemplo, de procedimiento de diagnóstico adicionales o intervenciones innecesarias) para el paciente que no tenga IBD.
En ciertos aspectos, el método de árbol de decisiones descrito en la presente puede implementarse como una trayectoria alternativa para hacer diagnósticos predictivos en especímenes clínicos con resultados del ensayo pANCA2 (-). En modalidades particulares, el algoritmo modificado comprendería un nodo inicial como una primera etapa para dirigir especímenes individuales ya sea al método de árbol de decisiones o al algoritmo de bosques aleatorios, dependiendo de su valor pANCA 2.
Ejemplo 10.
Descripciones de ensayo para marcadores genéticos, serológicos e inflamatorios Este ejemplo describe ejemplos de ensayos para detectar o medir los marcadores de inflamación sero-genéticos (sgi) usados en los algoritmos de diagnóstico de IBD de la presente invención.
A. Perspectiva general de la tecnología TaqMan para genotipificación de SNP.
En algunas modalidades, los ensayos de genotipificación de SNP en el panel de diagnóstico de sgi para IBD se basan en genotipificación SNP TaqMan. Los ensayos de genotipificación cualitativa pueden usar ADN genómico de sangre humana (ADNg) o muestras de lisados para ayudar en el diagnóstico y/o diagnóstico diferencial de IBD; específicamente CD y UC. Estos ensayos de PCR por discriminación alélica usan dos secuencias de oligonucleotidos específicas con dos colorantes fluorescentes diferentes en el extremo 5' de la secuencia (por ejemplo, sonda fluorogénica con colorante FAM o colorante VIC), cada uno de ellos teniendo un extintor no fluorescente en el extremo 3' de la secuencia enlazada con ligando de unión al surco menor (potenciador de temperatura de fusión).
Durante la amplificación por PCR, cada sonda se fija específicamente a su secuencia complementaria entre un cebador hacia adelante y hacia atrás en el ADN objetivo. Debido a que la ADN polimerasa tiene una actividad nucleasa 5' intrínseca, un corte selectivo de las sondas que hibridaron a la secuencia genómica se presenta. Esto se traduce en una fluorescencia incrementada debido a la separación del colorante reportero del extintor. Por lo tanto, el incremento selectivo de un colorante vs. otro (FAM vs. VIC) indica los alelos que están presentes en el ADN genómico estudiado.
B. Discriminación alélica Un genotipo de muestra puede determinarse por el examen de la intensidad de fluorescencia relativa del colorante de cada sonda. Usando software SDS de ABI, puede crearse una gráfica de las intensidades de los dos colorantes. El genotipo tipo silvestre homocigótico se determina por una intensidad relativamente alta de FAM (eje y) y muy baja intensidad de VIC (eje x). El genotipo muíante homocigótico exhibe un patrón similar propuesto con alta VIC (eje x), bajo FAM (eje y). Una vez que los datos han sido analizados, el alelo "Cali" se hace con el software ABI para determinar el genotipo para cada SNP.
En ciertas modalidades, el ensayo de genotipificación de SNP emplea un flujo de trabajo que combina el uso de ABI 7500 Fast para recolección de datos pre- y post-lectura con etapa de amplificación por PCR fuera de línea en Applied Biosystems Veriti 96-Well Fast Thermal Cycler (ABI Veriti). Esta combinación hace posible que un operador de laboratorio lleve a cabo simultáneamente varias corridas de genotipificación (hasta 96 muestras por placa) en varias máquinas ABI Veriti seguidas por una post-lectura rápida de cada placa de reacción en un instrumento ABI 7500 Fast. Para los ensayos de SNP, una vez que una mezcla de reacción de PCR se prepara en una placa de 96 pocilios ya sea por una estación de trabajo de automatización Tecan Freedom EVO 100 de manera automática o manual, y una pre-lectura se lleva a cabo en un sistema de PCR en tiempo real ABI 7500 Fast, la placa de reacción es luego transferida al ABI Veriti para etapas de amplificación fuera de línea. Cuando se completa la amplificación, la placa de reacción es transferida de regreso al instrumento ABI 7500 Fast para post-lectura y análisis de datos. Este flujo de trabajo hace posible que varias placas sean amplificadas simultáneamente usando un solo instrumento ABI 7500 Fast para mediciones pre- y postamplificación.
C. Reporte de datos de ensayo La prueba de diagnóstico de sgi para IBD incluye cuatro ensayos de genotipificación de SNP (véase tabla 34) para evaluar la susceptibilidad genética que influye en respuestas inmunes Tabla 34 Salida de datos de ensayo SNP D. Ensayo de genotipificación de ATG16L1 SNP rs2241880 El gen ATG16L1 se ubica en el cromosoma 2 y codifica para una proteína que se sabe está implicada en la formación de autofagosomas durante autofagia. El ATG16L1 1 155 ((A>G) SNP (SNP ID: rs2241880) se ubica dentro de la posición de la región de codificación 1155 A>G para secuencia de ADNc que es T300A para la posición AA. El ensayo de genotipificación de ATG16L1 SNP rs2241880 es una prueba desarrollada en laboratorio (LDT) para detectar el SNP ATG16L1 1155 (A>G) en pacientes de IBD usando ADN genómico (ADNg) o muestras de lisados preparadas a partir de muestras de sangre entera. Este ensayo de genotipificación cualitativa ayuda en el diagnóstico de IBD.
Para cada genotipo, lisado de sangre previamente genotipificados o muestras de ADNg se usan como controles para cada corrida de prueba. Los genotipos de estos controles se confirman por secuenciación en ambas hebras. Control no plantilla (NTC) también se incluye en cada corrida de prueba.
Controles de ADNg se preparan a partir de ADN aislado de muestras de sangre entera, o lisados de sangre se preparan a partir de las mismas muestras de sangre entera. Se corren tres controles en cada ensayo: - ATG16L1 1 155 (A>G) SNP Control de Ensayo de Genotipificación GG - ATG16L1 1 155 (A>G) SNP Control de Ensayo de Genotipificación AG - ATG16L1 1155 (A>G) SNP Control de Ensayo de Genotipificación AA E. Ensayo de genotipificación SNP ECM1 El gen ECM1 se ubica en el cromosoma 1 y codifica para proteína de matriz extracelular 1 que está implicada en el mantenimiento de la función de barrera de la pared intestinal y activa la vía inflamatoria de NF- ?. El ECM1 558 (C>T) SNP (SNP ID: rs3737240) se ubica dentro de la posición de la región de codificación 588 C>T para secuencia de ADNc, que es T130M para la posición AA.
El ensayo de genotipificación de ECM1 SNP rs3737240 es una prueba desarrollada en laboratorio (LDT) para detectar el genotipo ECM1 558 (C>T) SNP en pacientes de IBD usando un ADNg o muestras de lisados preparados a partir de muestras de sangre entera. Este ensayo de genotipificación cualitativa ayuda en el diagnóstico de IBD.
Para cada genotipo, lisados de sangre previamente genotipificados o muestras de ADNg se usan como controles para cada corrida de prueba. Los genotipos de estos controles se confirman por secuenciación en ambas hebras). Control No Plantilla (NTC) también se incluye en cada corrida de prueba. Controles de ADNg se preparan a partir de muestras de sangre entera o lisados de sangre se preparan a partir de las mismas muestras de sangre entera: - ECM1 558 (C>T) SNP Control de Genotipificación TT - ECM1 558 (C>T) SNP Control de Genotipificación CT - ECM1 558 (C>T) SNP Control de genotipoficación CC F. Ensayo de Genotipificación de SNP de NKX2-3 El gen NKX2-3 se ubica en el cromosoma 10. NKX2-3 (A>G) SNP (SNP ID: rs10883365) se ubica en el intrón (posición 101287764). El ensayo de genotipificación de NKX2-3 rs10883365 es una prueba desarrollada en laboratorio (LDT) para detectar el genotipo de NKX2-3 (A>G) SNP en pacientes de IBD usando ADN genómico (ADNg) o muestras de lisados preparadas a partir de muestras de sangre entera. Este ensayo de genotipificación cualitativa ayuda en el diagnóstico de IBD.
Para cada genotipo, lisados de sangre previamente genotipificados o muestras de ADNg se usan como controles para cada corrida de prueba. Los genotipos de estos controles se confirman por secuenciación en ambas hebras). Control No Plantilla (NTC) también se incluye en cada corrida de prueba. Controles de ADNg se preparan a partir de muestras de sangre entera o lisados de sangre se preparan a partir de las mismas muestras de sangre entera: - NKX2-3 (A>G) SNP Control de Ensayo de Genotipificación GG - NKX2-3 (A>G) SNP Control de Ensayo de Genotipificación AG - NKX2-3 (A>G) SNP Control de Ensayo de Genotipificación AA G. Ensayo de genotipificación de SNP de STAT3 El gen STAT3 se ubica en el cromosoma 17, y juega un papel importante en varios trastornos autoinmunes incluyendo enfermedades intestinales inflamatorias (IBDs). El STAT3 (A>G) SNP (SNP ID: rs744166) se ubica 5' la región de flanqueo del 3' UTR (posición 40514201). El ensayo de genotipificación de STAT3 rs744166 es una prueba desarrollada en laboratorio (LDT) para detectar el genotipo STAT3 (A>G) SNP en pacientes de IBD usando ADNg o muestras de lisados preparados a partir de muestras de sangre entera. Este ensayo de genotipificación cualitativa ayuda en el diagnóstico de IBD.
Para cada genotipo, lisados de sangre previamente genotipificados o muestras de ADNg se usan como controles para cada corrida de prueba. Los genotipos de esos controles se confirman por secuenciación tanto en - STAT3 (A>G) SNP Control de Ensayo de Genotipificación GG - STAT3 (A>G) SNP Control de Ensayo de Genotipificación AG - STAT3 (A>G) SNP Control de Ensayo de Genotipificación AA H. Ensayo de FlaX En algunas modalidades, el ensayo de FlaX emplea antígeno bacteriano FlaX recombinante para medir anticuerpos anti IgG FlaX en suero humano. El ensayo ayuda en el diagnóstico y diagnóstico diferencial de IBD, especialmente CD y UC.
En algunas modalidades, el ensayo es un ELISA indirecto automático corrido en un formato de placa de 96 pocilios estándar. Primero, el antígeno FlaX recombinante se recubre sobre la superficie de pared de la placa, seguido por bloqueo. Suero de paciente dividido (1/100) se añade al pocilio y se incuba. Después de enjuagar las moléculas no unidas, el anticuerpo de detección marcado con fosfatasa alcalina se incuba en el pocilio. Después de un segundo lavado, el substrato se añade para revelado de una señal colorimétrica. Luego de añadir la solución de paro, la placa se lee para densidad óptica (OD). La concentración de anticuerpo anti-FlaX se calcula a partir de una curva estándar y se reporta en unidades ELISA por mililitro de suero (EU/mL).
I. Ensayo de Fla2 En algunas modalidades, el ensayo Fla2 emplea antígeno bacteriano Fla2 recombinante para medir anticuerpos anti-Fla2 IgG en suero humano. El ensayo Fla2 ayuda en el diagnóstico y diagnóstico diferencia de IBD, especialmente CD y UC.
En algunas modalidades, el ensayo es un ELISA indirecto automático corrido en un formato de placa de 96 pocilios estándar. Primero, el antígeno Fla2 recombinante se recubre sobre la superficie de pared de la placa, seguido por bloqueo. Suero de paciente dividido (1/100) se añade al pocilio y se incuba. Después de enjuagar las moléculas no unidas, el anticuerpo de detección marcado con fosfatasa alcalina se incuba en el pocilio. Después de un segundo lavado, el substrato se añade para revelado de una señal colorimétrica. Luego de añadir la solución de paro, la placa se lee para densidad óptica (OD). La concentración de anticuerpo anti-Fla2 se calcula a partir de una curva estándar y se reporta en unidades ELISA por mililitro de suero (EU/mL).
J. Ensayo de VEGF En algunas modalidades, el kit de VEGF humano es un ensayo de ELISA de detección de antígenos por emparedado para medir VEGF humano en suero (Thermo Scientific Inc.)- El ensayo ayuda en el diagnóstico y diagnóstico diferencial de IBD, especialmente CD y UC.
En algunas modalidades, el ensayo se corre en un formato de placa de 96 pocilios estándar. La placa se recubre con anticuerpo anti-VEGF (anticuerpo de captura) por el fabricante. Cuando se hace la prueba, el suero de paciente diluido (1/2) se añade al pocilio para incubación de unión por captura de VEGF. Después de enjuagar las moléculas no unidas, el anticuerpo de detección biotinilado se añade y se une a un segundo sitio del VEGF. Después del segundo lavado, se añadió peroxidasa de rábano -estreptavidina que reacciona con 3,3',5,5'-tetrametilbencidina (TMB) para producir una señal colorimétrica medida por un lector de densidad óptica (OD). El valor de la OD se calcula contra la curva estándar para generar valor para la concentración de VEGF reportada en pictogramos por un mililitro de suero (pg/mL).
Con base en el protocolo recomendado del fabricante, este ensayo se automatizó al emplear el sistema Tecan Freedom EV0150.
K. Ensayos de CRP, SAA, ICA 1 y VCAM1 En algunas modalidades, el ensayo de Lesión Vascular Humana II es un ensayo de detección de antígenos por emparedado multiplexado a base de tecnología MULTI-ARRAY. El ensayo se usa para medir CRP, SAA, ICAM1 y VCAM1 (Meso Scale Discovery Inc.). El ensayo ayuda en el diagnóstico y diagnóstico diferencial de IBD, especialmente CD y UC.
En algunas modalidades, el ensayo emplea detección por electroquimioluminiscencia única y disposición en patrones en un formato de placa de 96 pocilios. La placa se recubre con cuatro anticuerpos de captura contra cada analito de CRP, SAA, ICAM1 y VCAM1 en el pocilio del electrodo superficial. Cuando se hace la prueba, el suero de paciente diluido (1/1000) se añade al pocilio para incubación de captura de antígenos. Después de enjuagar las moléculas no unidas, el anticuerpo de detección marcado por quimioluminiscencia (SULFO-TAG) se añade y se une a un segundo sitio de los analitos. Después del segundo lavado, la placa es leída al aplicar electroexcitación que convierte energía en señal de luz de emisión de luminiscencia medida por unidades de luminiscencia relativa (RLU). El valor RLU se calcula contra la curva estándar para generar valor para la concentración reportada en miligramos por litro de suero (mg/L) para CRP y SAA, o microgramos por mililitro (pg/mL) para VCAM1 e ICAM1.
Con base en el protocolo recomendado del fabricante, estos ensayos fueron automatizados al emplear el sistema Tecan Freedom EVO150 y sistema PerkinElmer Janus.
Ejemplo 11.
Rango de referencia y llamada de referencia para la prueba sgi de IBD Este ejemplo ilustra rangos de referencia y llamadas de referencia para cada uno de los marcadores de inflamación sero-genéticos (sgi) detectados o medidos en los algoritmos de diagnóstico de IBD de la presente invención. En ciertas modalidades, un rango o llamada de referencia corresponde a un valor límite, un punto de corte, la presencia o ausencia de una mutación, o la presencia o ausencia de un patrón IFA para un marcador sgi particular.
El rango de referencia llamado de referencia para la prueba sgi de IBD se determinaron con base en cada ensayo individual (véase tabla 35).
Tabla 35 El rango de referencia v llamada de referencia para ensayos sgi de IBD Para ensayos de marcadores de serología e inflamatorios, los rangos de referencia son los intervalos de confianza más bajos de 95% (LCI) a través de 10,000 estimados de los límites de rango de referencia superiores, en donde el límite de rango de referencia superior es el límite superior del 95% central de mediciones de marcadores. El LCI para cada límite de rango se determinó usando simulaciones que seleccionaron aleatoriamente 120 sujetos repetidamente de la base de datos de Control de Salud.
Ensayos genéticos (ATG16L1 SNP rs2241880, ECM1 SNP rs3737240, NKX2-3 SNP rs10883365 y STAT3 SNP rs744166) son ensayos de genotipificación cualitativos. Para ATG16L1 SNP rs2241880, un valor/llamada de referencia de A/A o A/G es equivalente a ninguna mutación detectada. Para ECM1 SNP rs3737240, un valor/llamada de referencia de C/C o C T es equivalente a ninguna mutación detectada. Para NKX2-3 SNP rs10883365, un valor/llamada de referencia de A/A o A/G es equivalente a ninguna mutación detectada. Para STAT3 SNP rs744166, un valor/llamada de referencia de G/G o A/G es equivalente a una mutación detectada.
Se debe entender que la anterior descripción intenta ser ilustrativa y no restrictiva. Muchas modalidades serán aparentes para aquellos de capacidad en la técnica después de la lectura de la anterior descripción. El alcance de la invención por lo tanto, debe determinarse no con referencia a la descripción anterior, sino en su lugar debe determinarse con referencia a las reivindicaciones anexas, junto con el alcance completo de equivalentes a los cuales estas reivindicaciones tienen derecho. Las divulgaciones de todos los artículos y referencias, incluyendo solicitudes de patente, patentes, publicaciones de PCT y números de registro de Genbank, se incorporan en la presente por referencia para todos los propósitos.

Claims (78)

REIVINDICACIONES
1. Un método para diagnosticar enfermedad intestinal inflamatoria (IBD) y/o un subtipo clínico de la misma en un individuo, el método se caracteriza porque comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serológico, un marcador genético, un marcador de inflamación y una combinación de los mismos en la muestra para obtener un perfil de marcadores; (b) aplicar un primer análisis estadístico de bosque aleatorio al perfil de marcadores para obtener una decisión de si el perfil de marcadores es una muestra de IBD o una muestra de no IBD; (c) aplicar opcionalmente un árbol de decisiones o conjunto de reglas a la muestra designada como una muestra de IBD para determinar si la muestra de IBD es categorizada como una muestra no concluyente; y (d) aplicar opcionalmente un segundo análisis estadístico de bosque aleatorio a la muestra de IBD para determinar un subtipo clínico de IBD.
2. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador de inflamación se selecciona del grupo que consiste en una proteína de fase aguda, una apolipoproteína, un factor de crecimiento, una molécula de adhesión celular, y una combinación de los mismos.
3. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador serológico se selecciona del grupo que consiste en un anticuerpo anti-neutrófilos, un anticuerpo anti- Saccharomyces cerevisiae, un anticuerpo antimicrobiano, y una combinación de los mismos.
4. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador genético se selecciona del grupo que consiste en ATG16L1 , ECM1 , NKX2-3, STAT3, y una combinación de los mismos.
5. El método de conformidad con la reivindicación 2, caracterizado porque el anticuerpo anti-neutrófilos se selecciona del grupo que consiste en un anticuerpo citoplásmico anti-neutrófilos (ANCA), anticuerpo citoplásmico anti-neutrófilos perinuclear (pANCA), pANCA2 y una de sus combinaciones.
6. El método de conformidad con la reivindicación 2, caracterizado porque el anticuerpo anti- Saccharomyces cerevisiae se selecciona del grupo que consiste en inmunoglobulina A anti- Saccharomyces cerevisiae (ASCA-lgA), inmunoglobulina G anti- Saccharomyces cerevisiae (ASCA-lgG), y una combinación de las mismas.
7. El método de conformidad con la reivindicación 2, caracterizado porque el anticuerpo antimicrobiano se selecciona del grupo que consiste en un anticuerpo anti-proteína C de membrana exterior (anti-OmpC), un anticuerpo anti-flagelina, y una combinación de los mismos.
8. El método de conformidad con la reivindicación 2, caracterizado porque la proteína de fase aguda es proteína C-reactiva (CRP).
9. El método de conformidad con la reivindicación 2, caracterizado porque la apolipoproteína es amiloide A sérico (SAA).
10. El método de conformidad con la reivindicación 2, caracterizado porque el factor de crecimiento es factor de crecimiento endotelial vascular (VEGF).
11. El método de conformidad con la reivindicación 2, caracterizado porque la molécula de adhesión celular se selecciona del grupo que consiste en molécula de adhesión inter-celular 1 (ICAM-1 ), molécula de adhesión celular vascular 1 (VCAM-1 ), y una combinación de las mismas.
12. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador serológico se selecciona del grupo que consiste en pANCA, pANCA2, ANCA, CRP, SAA, VEGF, ICAM-1 , VCAM-1 , y una combinación de los mismos.
13. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador serológico se selecciona del grupo que consiste en ASCA-lgA, ASCA-lgG, anticuerpo anti-OmpC, anticuerpo anti-CBIR-1 , anticuerpo anti-Fla2, anticuerpo anti-FlaX y una combinación de los mismos.
14. El método de conformidad con la reivindicación 1 , caracterizado porque la presencia o nivel del marcador serológico o marcador de inflamación se detecta con un ensayo de hibridación, ensayo basado en amplificación, inmunoensayo, o ensayo inmunohistoquímico.
15. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador genético es al menos uno de los genes establecidos en las Tablas A-E.
16. El método de conformidad con la reivindicación 1 , caracterizado porque el genotipo del marcador genético se detecta por genotipificación para la presencia o ausencia de un polimorfismo de un solo nucleótido (SNP) en el marcador genético.
17. El método de conformidad con la reivindicación 16, caracterizado porque el SNP es al menos uno de los SNPs establecidos en las Tablas B-E.
18. El método de conformidad con la reivindicación 16, caracterizado porque el marcador genético se selecciona del grupo que consiste en ATG16L1 , STAT3, NKX2-3, ECM1 , y una combinación de los mismos.
19. El método de conformidad con la reivindicación 1 , caracterizado porque el perfil de marcadores se determina mediante la detección de la presencia, nivel o genotipo de al menos dos, tres, cuatro, cinco, seis, siete, ocho, nueve, diez, once, doce, trece, catorce, quince, dieciséis, diecisiete o dieciocho marcadores.
20. El método de conformidad con la reivindicación 1 , caracterizado porque los marcadores para el primer algoritmo de bosque aleatorio se seleccionan del grupo que consiste en ANCA, ASCA-A, ASCA-G, pANCA, pANCA2, anticuerpo anti-FlaX, SAA, anticuerpo anti-Fla2, ICAM, anticuerpo anti-OmpC, anticuerpo anti-CBir1 , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , VEGF y una combinación de los mismos.
21. El método de conformidad con la reivindicación 1 , caracterizado porque la muestra se determina como una muestra no IBD.
22. El método de conformidad con la reivindicación 20, caracterizado porque después del primer algoritmo de bosque aleatorio la muestra se designa como una muestra de IBD, determinando además usar un árbol de decisiones o conjunto de reglas si la muestra tiene un nivel de ANCA > Q3, es pANCA2 positiva, y anticuerpo anti-CBir1 o anticuerpo anti-Fla2 o anticuerpo anti-FlaX > Q3, entonces designar la muestra de IBD como una muestra concluyente.
23. El método de conformidad con la reivindicación 20, caracterizado porque después del primer algoritmo de bosque aleatorio la muestra se designa como una muestra de IBD, determinar además usando un árbol de decisiones o conjunto de reglas si la muestra es positiva para pANCA2 y expresa dos de cada tres marcadores seleccionados de anticuerpo anti-CBir1 , anticuerpo anti-Fla2 y anticuerpo anti-FlaX > Q3, entonces designar la muestra de IBD como no concluyente.
24. El método de conformidad con la reivindicación 22 ó 23, caracterizado porque se determina que la muestra es una muestra concluyente.
25. El método de conformidad con la reivindicación 22 ó 23, caracterizado porque no concluyente se descarta para la muestra.
26. El método de conformidad con la reivindicación 20, caracterizado porque después del primer algoritmo de bosque aleatorio la muestra se designa como una muestra de IBD y no concluyente se descarta, que comprende además determinar si la muestra de IBD es enfermedad de Crohn (CD) o colitis ulcerosa (UC) usando un segundo algoritmo de bosque aleatorio.
27. El método de conformidad con la reivindicación 26, caracterizado porque los marcadores para el segundo algoritmo de bosque aleatorio se seleccionan del grupo que consiste en ANCA, ASCA-A, ASCA-G, pANCA, pANCA2, anticuerpo anti-FlaX, AEA, anticuerpo anti-Fla2, ICAM, anticuerpo anti-OmpC, anticuerpo anti-CBir1 , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , VEGF y una combinación de los mismos.
28. El método de conformidad con la reivindicación 27, caracterizado porque la determinación es CD.
29. El método de conformidad con la reivindicación 27, caracterizado porque la determinación es UC.
30. El método de conformidad con la reivindicación 1 , caracterizado porque la muestra se selecciona del grupo que consiste en suero, plasma, sangre entera y heces.
31. El método de conformidad con la reivindicación 1 , caracterizado porque el perfil de marcadores comprende una puntuación de suma de cuartiles (QSS) para el individuo obtenida al sumar la puntuación de cuartiles para cada uno del uno o más marcadores.
32. El método de conformidad con la reivindicación 31 , caracterizado porque el primero y/o segundo bosque aleatorio se establece usando una cohorte retrospectiva con resultados conocidos de IBD y/o un subtipo clínico de IBD.
33. El método de conformidad con la reivindicación 32, caracterizado porque el primero y/o segundo bosque aleatorio se basa en un modelo seleccionado del grupo que consiste en un modelo serologico, un modelo sero-genético-inflamatorio, y una combinación de los mismos.
34. El método de conformidad con la reivindicación 33, caracterizado porque el modelo serológico se deriva mediante la aplicación de un bosque aleatorio a la presencia o nivel de uno o más marcadores serológicos determinado en la cohorte retrospectiva.
35. El método de conformidad con la reivindicación 33, caracterizado porque el modelo sero-genético-inflamatorio se deriva mediante la aplicación de un bosque aleatorio a la presencia o nivel de uno o más marcadores serológicos y el genotipo de uno o más marcadores genéticos determinado en la cohorte retrospectiva.
36. El método de conformidad con la reivindicación 1 , caracterizado porque el marcador serológico es pANCA para luego determinar el valor de pANCA2.
37. El método de conformidad con la reivindicación 36, caracterizado porque cuando los valores de pANCA son 0 o +1 , el valor pANCA2 es negativo.
38. El método de conformidad con la reivindicación 36, caracterizado porque cuando los valores de pANCA son +2, +3 ó +4, el valor pANCA2 es positivo.
39. El método de conformidad con la reivindicación 37, caracterizado porque en la muestra pANCA2 negativa, comprende además: a) determinar si la muestra negativa para pANCA2 es directamente predictiva de enfermedad de Crohn al medir un panel de marcadores de suero, en donde el panel de marcadores en suero es un miembro del grupo que consiste en ASCA-lgA, ASCA-lgG y OmpC-lgA y comparar cada uno de los marcadores de suero del panel de marcadores de suero con un valor límite para determinar si la muestra coincide con la enfermedad de Crohn; o b) determinar si la muestra negativa para pANCA2 coincide con la enfermedad de Crohn al medir un panel de recuento de CD, en donde el panel de recuento de CD es un miembro del grupo que consiste en ASCA-lgA, ASCA-lgG, OmpC- IgA, CBir1-lgG, A4-Fla2-lgG y FlaX-lgG para formar un valor de recuento de CD, en donde cuando el valor de recuento de CD es mayor que o igual a 2, la muestra coincide con la enfermedad de Crohn; o c) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de cero, coincide o no coincide con IBD al medir el ELISA ANCA y comparar el valor de ELISA ANCA con un valor de referencia y designar la muestra como siendo coincidente o no coincidente con IBD con base en el valor de ELISA ANCA; o d) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de cero coincide con IBD o es no concluyente de IBD al medir ELISA ANCA y comparar el valor de ELISA ANCA y considerar el valor de recuento de CD para determinar si la muestra coincide o no coincide con IBD o coincide con IBD y es no concluyente para enfermedad de Crohn o colitis ulcerosa; o e) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de uno coincide o no coincide con IBD al medir ELISA ANCA y comparar el valor de ELISA ANCA con un valor límite para determinar si la muestra coincide con IBD o es inconsistente con IBD.
40. El método de conformidad con la reivindicación 39, caracterizado porque en la parte a anterior si el valor para ASCA-lgA es mayor que o igual a 69 EU/mL, entonces designar la muestra como siendo compatible con enfermedad de Crohn.
41. El método de conformidad con la reivindicación 39, caracterizado porque en la parte a anterior si el valor de ASCA-lgG es mayor que o igual a 40 EU/mL, entonces designar la muestra como siendo compatible con enfermedad de Crohn.
42. El método de conformidad con la reivindicación 39, caracterizado porque en la parte a anterior si el valor de OmpC-lgA es mayor que o igual a 60 EU/mL, entonces designar la muestra como siendo compatible con enfermedad de Crohn.
43. El método de conformidad con la reivindicación 39, caracterizado porque la parte b arriba comprende además asignar el valor de recuento de CD al determinar si: i. ASCA-lgA es mayor que o igual a 8.5 EU/mL, entonces sumar +1 al valor de recuento de CD; ii. ASCA-lgG es mayor que o igual a 17.8 EU/mL, entonces sumar +1 al valor de recuento de CD; iii. OmpC-lgA es mayor que o igual a 10.9 EU/mL, entonces sumar +1 al valor de recuento de CD; iv. dos o más marcadores de flagelina están por arriba de sus intervalos de referencia respectivos, entonces sumar +1 ai valor de recuento de CD; v. cualquier flagelina es mayor que o igual a 100 EU/mL, entonces sumar +1 al valor de recuento de CD; y si el valor de recuento de CD total es mayor que o igual a 2, designar entonces que la muestra es consistente con enfermedad de Crohn.
44. El método de conformidad con la reivindicación 43, caracterizado porque el valor de referencia para CBir1-lgG es mayor que o igual a 78.4 EU/mL.
45. El método de conformidad con la reivindicación 43, caracterizado porque el valor de referencia para A4-Fla2-lgG es mayor que o igual a 44.8 EU/mL.
46. El método de conformidad con la reivindicación 43, caracterizado porque el valor de referencia para FlaX-lgG es mayor que o igual a 33.4 EU/mL.
47. El método de conformidad con la reivindicación 39, caracterizado porque en la parte c anterior, si pANCA es cero (no detectado), comprende además: i. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es menor que 20 EU/mL; o ii. designar la muestra como siendo consistente con colitis ulcerosa si ANCA ELISA es mayor que 27.4 EU/mL; o iii. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es mayor que o igual a 20 y menor que o igual a 27.4 EU/mL y el valor de recuento de CD es cero; o iv. designar la muestra como siendo consistente con IBD pero no concluyeme para enfermedad de Crohn o colitis ulcerosa si ANCA ELISA es mayor que o igual a 20 y menor que o igual a 27.4 EU/mL y el valor de recuento de CD es uno.
48. El método de conformidad con la reivindicación 39, caracterizado porque cuando pANCA es uno, comprende además: i. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es menor que 13.7 EU/mL; o ii. designar que la muestra es consistente con colitis ulcerosa si ANCA ELISA es mayor que o igual a 13.7 EU/mL.
49. Un método para diagnosticar enfermedad intestinal inflamatoria (IBD) y/o un subtipo clínico de la misma en un individuo, el método se caracteriza porque comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serológico, un marcador genético, un marcador de inflamación y una combinación de los mismos en la muestra para obtener un perfil de marcadores; (b) aplicar un primer análisis estadístico de bosque aleatorio al perfil de marcadores para obtener una decisión de si el perfil de marcadores es una muestra de IBD o una muestra de no IBD, (c) aplicar un árbol de decisiones o conjunto de reglas a la muestra designada como una muestra de IBD para determinar si la muestra de IBD es una muestra no concluyente; y (d) si la muestra no es no concluyente, pero es una muestra de IBD, aplicar un segundo análisis estadístico de bosque aleatorio a la muestra de IBD para determinar un subtipo clínico.
50. El método de conformidad con la reivindicación 49, caracterizado porque los marcadores para el primer algoritmo de bosque aleatorio se seleccionan del grupo que consiste en ANCA, ASCA-A, ASCA-G, pANCA, pANCA2, anticuerpo anti-FlaX, SAA, anticuerpo anti-Fla2, ICAM, anticuerpo anti-OmpC, anticuerpo anti-CBi , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , VEGF y un combinación de los mismos.
51. El método de conformidad con la reivindicación 49, caracterizado porque después del primer algoritmo de bosque aleatorio la muestra se designa como una muestra de IBD, determinar además usando el árbol de decisión o conjunto de reglas si la muestra tiene un nivel de ANCA Q3, es pANCA2 positiva, y anticuerpo anti-CBir1 o anticuerpo anti-Fla2 o anticuerpo anti-FlaX > Q3, entonces designar la muestra de IBD como una muestra concluyente.
52. El método de conformidad con la reivindicación 49, caracterizado porque después del primer algoritmo de bosque aleatorio la muestra se designa como una muestra de IBD, determinar además usando un árbol de decisiones o conjunto de reglas si la muestra es positiva para pANCA2 y expresa dos de cada tres marcadores seleccionados de anticuerpo anti-CBir1 , anticuerpo anti-Fla2 y anticuerpo anti-FlaX > Q3, entonces designar la muestra de IBD como no concluyente.
53. El método de conformidad con la reivindicación 51 ó 52, caracterizado porque se determina que la muestra es una muestra concluyente.
54. El método de conformidad con la reivindicación 51 ó 52, caracterizado porque no concluyente se descarta para la muestra.
55. El método de conformidad con la reivindicación 49, caracterizado porque después del primer algoritmo de bosque aleatorio la muestra se designa como una muestra de IBD y no concluyente se descarta, que comprende además determinar si la muestra de IBD es enfermedad de Crohn (CD) o colitis ulcerosa (UC) usando un segundo algoritmo de bosque aleatorio.
56. El método de conformidad con la reivindicación 49, caracterizado porque los marcadores para el segundo algoritmo de bosque aleatorio se seleccionan del grupo que consiste en ANCA, ASCA-A, ASCA-G, pANCA, pANCA2, anticuerpo anti-FlaX, AEA, anticuerpo anti-Fla2, ICAM, anticuerpo anti-OmpC, anticuerpo anti-CBir1 , VCAM, CRP, NKX2-3, ATG16L1 , STAT3, ECM1 , VEGF y una combinación de los mismos.
57. El método de conformidad con la reivindicación 56, caracterizado porque la determinación es CD.
58. El método de conformidad con la reivindicación 56, caracterizado porque la determinación es UC.
59. El método de conformidad con la reivindicación 49, caracterizado porque la muestra se selecciona del grupo que consiste en suero, plasma, sangre entera y heces.
60. El método de conformidad con la reivindicación 49, caracterizado porque el perfil de marcadores comprende una puntuación de suma de cuartiles (QSS) para el individuo obtenida al sumar la puntuación de cuartiles para cada uno del uno o más marcadores.
61. El método de conformidad con la reivindicación 49, caracterizado porque el primero y/o segundo bosque aleatorio se establece usando una cohorte retrospectiva con resultados conocidos de IBD y/o un subtipo clínico de IBD.
62. El método de conformidad con la reivindicación 49, caracterizado porque el primero y/o segundo bosque aleatorio se basa en un modelo seleccionado del grupo que consiste en un modelo serológico, un modelo sero-genético-inflamatorio, y una combinación de los mismos.
63. El método de conformidad con la reivindicación 61 , caracterizado porque el modelo serológico se deriva mediante la aplicación de un bosque aleatorio a la presencia o nivel de uno o más marcadores serológicos determinado en la cohorte retrospectiva.
64. El método de conformidad con la reivindicación 61 , caracterizado porque el modelo sero-genético-inflamatorio se deriva mediante la aplicación de un bosque aleatorio a la presencia o nivel de uno o más marcadores serológicos y el genotipo de uno o más marcadores genéticos determinado en la cohorte retrospectiva.
65. El método de conformidad con la reivindicación 49, caracterizado porque el marcador serológico es pANCA para luego determinar el valor de pANCA2.
66. El método de conformidad con la reivindicación 65, caracterizado porque cuando los valores de pANCA son 0 o +1 , el valor pANCA2 es negativo.
67. El método de conformidad con la reivindicación 65, caracterizado porque cuando los valores de pANCA son +2, +3 ó +4, el valor pANCA2 es positivo.
68. El método de conformidad con la reivindicación 66, caracterizado porque en la muestra pANCA2 negativa, comprende además: a) determinar si la muestra negativa para pANCA2 es directamente predictiva de enfermedad de Crohn al medir un panel de marcadores de suero, en donde el panel de marcadores en suero es un miembro del grupo que consiste en ASCA-lgA, ASCA-lgG y OmpC-lgA y comparar cada uno de los marcadores de suero del panel de marcadores de suero con un valor límite para determinar si la muestra coincide con la enfermedad de Crohn; o b) determinar si la muestra negativa para pANCA2 coincide con la enfermedad de Crohn al medir un panel de recuento de CD, en donde el panel de recuento de CD es un miembro del grupo que consiste en ASCA-lgA, ASCA-lgG, OmpC-lgA, CBir1-lgG, A4-Fla2-lgG y FlaX-lgG para formar un valor de recuento de CD, en donde cuando el valor de recuento de CD es mayor que o igual a 2, la muestra coincide con la enfermedad de Crohn; o c) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de cero, coincide o no coincide con IBD al medir el ELISA ANCA y comparar el valor de ELISA ANCA con un valor de referencia y designar la muestra como siendo coincidente o no coincidente con IBD con base en el valor de ELISA ANCA; o d) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de cero coincide con IBD o es no concluyente de IBD al medir ELISA ANCA y comparar el valor de ELISA ANCA y considerar el valor de recuento de CD para determinar si la muestra coincide o no coincide con IBD o coincide con IBD y es no concluyente para enfermedad de Crohn o colitis ulcerosa; o e) determinar si la muestra negativa para pANCA2 que tiene un valor pANCA de uno coincide o no coincide con IBD al medir ELISA ANCA y comparar el valor de ELISA ANCA con un valor límite para determinar si la muestra coincide con IBD o es inconsistente con IBD.
69. El método de conformidad con la reivindicación 68, caracterizado porque en la parte a anterior si el valor para ASCA-lgA es mayor que o igual a 69 EU/mL, entonces designar la muestra como siendo compatible con enfermedad de Crohn.
70. El método de conformidad con la reivindicación 68, caracterizado porque en la parte a anterior si el valor de ASCA-lgG es mayor que o igual a 40 EU/mL, entonces designar la muestra como siendo compatible con enfermedad de Crohn.
71. El método de conformidad con la reivindicación 68, caracterizado porque en la parte a anterior si el valor de OmpC-lgA es mayor que o igual a 60 EU/mL, entonces designar la muestra como siendo compatible con enfermedad de Crohn.
72. El método de conformidad con la reivindicación 68, caracterizado porque la parte b arriba comprende además asignar el valor de recuento de CD al determinar si: i. ASCA-lgA es mayor que o igual a 8.5 EU/mL, entonces sumar +1 al valor de recuento de CD; ii. ASCA-lgG es mayor que o igual a 17.8 EU/mL, entonces sumar +1 al valor de recuento de CD; iii. OmpC-lgA es mayor que o igual a 10.9 EU/mL, entonces sumar +1 al valor de recuento de CD; iv. dos o más marcadores de flagelina están por arriba de sus intervalos de referencia respectivos, entonces sumar +1 al valor de recuento de CD; v. cualquier flagelina es mayor que o igual a 100 EU/mL, entonces sumar +1 al valor de recuento de CD; y si el valor de recuento de CD total es mayor que o igual a 2, designar entonces que la muestra es consistente con enfermedad de Crohn.
73. El método de conformidad con la reivindicación 72, caracterizado porque el valor de referencia para CBir1-lgG es mayor que o igual a 78.4 EU/mL.
74. El método de conformidad con la reivindicación 72, caracterizado porque el valor de referencia para A4-Fla2-lgG es mayor que o igual a 44.8 EU/mL.
75. El método de conformidad con la reivindicación 72, caracterizado porque el valor de referencia para FlaX-lgG es mayor que o igual a 33.4 EU/mL.
76. El método de conformidad con la reivindicación 68, caracterizado porque en la parte c anterior, si pANCA es cero (no detectado), comprende además: i. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es menor que 20 EU/mL; o ii. designar la muestra como siendo consistente con colitis ulcerosa si ANCA ELISA es mayor que 27.4 EU/mL; o iii. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es mayor que o igual a 20 y menor que o igual a 27.4 EU/mL y el valor de recuento de CD es cero; o iv. designar la muestra como siendo consistente con IBD pero no concluyente para enfermedad de Crohn o colitis ulcerosa si ANCA ELISA es mayor que o igual a 20 y menor que o igual a 27.4 EU/mL y el valor de recuento de CD es uno.
77. El método de conformidad con la reivindicación 68, caracterizado porque cuando pANCA es uno, comprende además: i. designar la muestra como siendo inconsistente con IBD si ANCA ELISA es menor que 13.7 EU/mL; o ii. designar que la muestra es consistente con colitis ulcerosa si ANCA ELISA es mayor que o igual a 13.7 EU/mL.
78. Un método para diagnosticar enfermedad intestinal inflamatoria (IBD) y/o un subtipo clínico de la misma en un individuo, el método se caracteriza porque comprende: (a) analizar una muestra obtenida del individuo para determinar la presencia, nivel o genotipo de uno o más marcadores seleccionados del grupo que consiste en un marcador serologico, un marcador genético, un marcador de inflamación, y una combinación de los mismos en la muestra para obtener un perfil de marcadores; (b) aplicar un análisis de regresión al perfil de marcadores para obtener una decisión sobre si el perfil de marcadores es una muestra de IBD o una muestra de no IBD; (c) aplicar un árbol de decisiones o un conjunto de reglas a la muestra designada como una muestra de IBD, para determinar si la muestra de IBD es una muestra concluyente; y (d) si la muestra no es concluyente, sino una muestra de IBD, aplicar un segundo análisis de regresión a la muestra de IBD para determinar un subtipo clínico.
MX2014004712A 2011-10-21 2012-10-19 Metodos para mejorar el diagnostico de enfermedad inflamatoria intestinal. MX352274B (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161550293P 2011-10-21 2011-10-21
US201161553853P 2011-10-31 2011-10-31
US201161567096P 2011-12-05 2011-12-05
US201161570271P 2011-12-13 2011-12-13
PCT/US2012/061202 WO2013059732A1 (en) 2011-10-21 2012-10-19 Methods for improving inflammatory bowel disease diagnosis

Publications (2)

Publication Number Publication Date
MX2014004712A true MX2014004712A (es) 2014-11-14
MX352274B MX352274B (es) 2017-11-16

Family

ID=48141435

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2014004712A MX352274B (es) 2011-10-21 2012-10-19 Metodos para mejorar el diagnostico de enfermedad inflamatoria intestinal.

Country Status (10)

Country Link
US (2) US8715943B2 (es)
EP (1) EP2769321B1 (es)
JP (1) JP2015502740A (es)
AU (1) AU2012325798B2 (es)
CA (1) CA2852954A1 (es)
HK (1) HK1200933A1 (es)
IL (1) IL232167A0 (es)
MX (1) MX352274B (es)
SG (1) SG11201401536QA (es)
WO (1) WO2013059732A1 (es)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010062960A2 (en) 2008-11-26 2010-06-03 Cedars-Sinai Medical Center METHODS OF DETERMINING RESPONSIVENESS TO ANTI-TNFα THERAPY IN INFLAMMATORY BOWEL DISEASE
WO2010120814A1 (en) 2009-04-14 2010-10-21 Prometheus Laboratories Inc. Inflammatory bowel disease prognostics
BR112013028808A2 (pt) 2011-05-10 2016-09-06 Nestec Sa métodos de caracterização de perfil de atividade de doença para a gestão de terapia personalizada
BR112015024752A2 (pt) 2013-03-27 2017-07-18 Cedars Sinai Medical Center mitigação e reversão da fibrose e inflamação através da inibição da função de tl1a e vias de sinalização relacionadas
WO2014182689A1 (en) * 2013-05-06 2014-11-13 Yacyshyn Bruce R Method of using biomarkers in predicting inflammatory bowel disease
KR20160013163A (ko) 2013-05-24 2016-02-03 네스텍 소시에테아노님 과민성 대장 증후군 진단을 예측하기 위한 경로 특이적 검정법
WO2015010108A1 (en) 2013-07-19 2015-01-22 Cedars-Sinai Medical Center Signature of tl1a (tnfsf15) signaling pathway
EP3094973B1 (en) 2013-11-07 2020-07-29 Diagnodus Limited Biomarkers
US11568982B1 (en) 2014-02-17 2023-01-31 Health at Scale Corporation System to improve the logistics of clinical care by selectively matching patients to providers
EP3167392A4 (en) * 2014-07-11 2018-08-01 Matatu Inc. Use of a gut microbiome as a predictor of animal growth or health
CN104131102B (zh) * 2014-08-07 2016-06-15 马飞 一种判断nsclc患者对吉非替尼治疗反应性的试剂盒
US11809501B2 (en) * 2014-08-28 2023-11-07 Ebay Inc. Systems, apparatuses, and methods for providing a ranking based recommendation
MX2017006959A (es) * 2014-12-02 2017-08-10 Nestec Sa Metodos para establecer un regimen de dosificacion de vedolizumab para tratar pacientes con enfermedad del intestino irritable.
AU2016209478B2 (en) 2015-01-20 2019-03-07 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer
CN107980162A (zh) * 2015-03-03 2018-05-01 南托米克斯有限责任公司 基于组合的研究建议系统和方法
US11037070B2 (en) * 2015-04-29 2021-06-15 Siemens Healthcare Gmbh Diagnostic test planning using machine learning techniques
US10295527B2 (en) 2016-03-14 2019-05-21 Bruce Yacyshyn Process and system for predicting responders and non-responders to mesalamine treatment of ulcerative colitis
US11946927B2 (en) 2016-03-14 2024-04-02 Musidora Biotechnology Llc Process and system for identifying individuals having a high risk of inflammatory bowel disease and a method of treatment
US11186872B2 (en) 2016-03-17 2021-11-30 Cedars-Sinai Medical Center Methods of diagnosing inflammatory bowel disease through RNASET2
WO2017201461A1 (en) * 2016-05-20 2017-11-23 Cedars-Sinai Medical Center Diagnosis of inflammatory bowel disease based on genes
JP7111322B2 (ja) 2016-12-02 2022-08-02 国立大学法人 東京大学 線維化関連分子に対する抗体およびその医療応用
US11978543B2 (en) 2016-12-14 2024-05-07 Astarte Medical Partners Inc. System and methods for developing and using a microbiome-based action component
EP3554362A4 (en) * 2016-12-14 2020-08-12 Warren, Tracy SYSTEM AND METHODS FOR DEVELOPING AND USING A MICROBIOME-BASED ACTION COMPONENT FOR PATIENT HEALTH
US10409734B1 (en) * 2017-03-27 2019-09-10 Symantec Corporation Systems and methods for controlling auxiliary device access to computing devices based on device functionality descriptors
CN108784666B (zh) * 2017-05-04 2023-01-13 深圳市生码医疗科技有限公司 连续监测心血管的精准医疗系统及数据处理方法
AU2018277256A1 (en) 2017-05-31 2020-01-30 Prometheus Biosciences, Inc. Methods for assessing mucosal healing in Crohn's disease patients
US11244454B2 (en) * 2018-04-03 2022-02-08 Boston Scientific Scimed, Inc. Systems and methods for diagnosing and/or monitoring disease
US11058345B2 (en) 2018-07-05 2021-07-13 Boston Scientific Scimed, Inc. Devices, systems, and methods for determining inflammation and/or fibrosis
CA3108719A1 (en) * 2018-08-21 2020-02-27 Bruce R. Yacyshyn Process and system for identifying individuals having a high risk of inflammatory bowel disease and a method of treatment
CA3121167A1 (en) * 2018-11-29 2020-06-04 Cedars-Sinai Medical Center Methods of stratifying and treating a sub-population of inflammatory bowel disease patients
WO2020117795A1 (en) * 2018-12-04 2020-06-11 Prometheus Biosciences, Inc. Assessment and monitoring of mucosal healing in children and adults with crohn's disease
CA3128973A1 (en) 2019-03-04 2020-09-10 Bhaskar Bhattacharyya Data compression and communication using machine learning
US20200342958A1 (en) * 2019-04-23 2020-10-29 Cedars-Sinai Medical Center Methods and systems for assessing inflammatory disease with deep learning
WO2020232262A1 (en) * 2019-05-16 2020-11-19 Procisedx Inc. Assay detection methods for vcam-1 and calprotectin
CN110373457B (zh) * 2019-06-20 2023-03-14 镇江市第一人民医院 一种用于溃疡性结肠炎诊断的mRNA标志物及其应用
CN111417124A (zh) * 2019-06-28 2020-07-14 西南交通大学 在认知无线网络环境下频谱感知的方法
US11610679B1 (en) * 2020-04-20 2023-03-21 Health at Scale Corporation Prediction and prevention of medical events using machine-learning algorithms
EP4162076A1 (en) * 2020-06-03 2023-04-12 Cedars-Sinai Medical Center Treatments for a sub-population of inflammatory bowel disease patients
US20230363695A1 (en) * 2020-09-16 2023-11-16 Northwestern University Classification of functional lumen imaging probe data
CA3194324A1 (en) * 2020-10-05 2022-04-14 Dermot MCGOVERN Methods and systems for stratifying inflammatory bowel disease patients
US20240044916A1 (en) * 2020-12-11 2024-02-08 Icahn School Of Medicine At Mount Sinai Methods of monitoring inflammatory bowel diseases
BR112023016445A2 (pt) * 2021-02-17 2023-12-12 Dr Falk Pharma Gmbh Anticorpos anti-cd30l e seus usos
WO2023047257A1 (en) * 2021-09-22 2023-03-30 Janssen Research & Development, Llc Automated estimation of ulcerative colitis severity from endoscopy videos using ordinal multi-instance learning
WO2023147139A1 (en) * 2022-01-28 2023-08-03 University Of Southern California Identifying non-disease patients using a disease related assay and analysis in the liquid biopsy

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4277250A (en) 1979-12-10 1981-07-07 Baylor College Of Medicine Methods for detecting and quantifying occult blood
JPH0684970B2 (ja) 1987-03-31 1994-10-26 株式会社京都医科学研究所 糞便中の潜血検出方法
US5081040A (en) 1987-06-29 1992-01-14 Helena Laboratories Corporation Composition and kit for testing for occult blood in human and animal excretions, fluids, or tissue matrixes
US6867195B1 (en) 1989-03-21 2005-03-15 Vical Incorporated Lipid-mediated polynucleotide administration to reduce likelihood of subject's becoming infected
JPH0736013B2 (ja) 1991-04-27 1995-04-19 一男 田畑 潜血検出用試薬
US6019944A (en) 1992-05-21 2000-02-01 Biosite Diagnostics, Inc. Diagnostic devices and apparatus for the controlled movement of reagents without membranes
DK0615129T3 (da) 1993-03-10 2000-08-07 Cedars Sinai Medical Center Fremgangsmåder til selektiv påvisning af perinukleært anti-neutrophilt cytoplasmatisk antistof fra ulcerativ colitis eller
US5830675A (en) 1993-03-10 1998-11-03 Cedars-Sinai Medical Center Methods for selectively detecting perinuclear anti-neutrophil cytoplasmic antibody of ulcerative colitis, primary sclerosing cholangitis, or type 1 autoimmune hepatitis
US5972901A (en) 1994-03-23 1999-10-26 Case Western Reserve University Serpin enzyme complex receptor--mediated gene transfer
US6077835A (en) 1994-03-23 2000-06-20 Case Western Reserve University Delivery of compacted nucleic acid to cells
US5844107A (en) 1994-03-23 1998-12-01 Case Western Reserve University Compacted nucleic acids and their delivery to cells
CA2186118C (en) 1994-03-23 2010-10-19 Richard W. Hanson Compacted nucleic acids and their delivery to cells
US6074835A (en) 1996-04-12 2000-06-13 Regents Of The Univ. Of California Diagnosis, prevention and treatment of ulcerative colitis, and clinical subtypes thereof, using histone H1
US5916748A (en) 1996-04-12 1999-06-29 Cedars-Sinai Medical Center Method of diagnosing a clinical subtype of crohn's disease with features of ulcerative colitis
US6033864A (en) 1996-04-12 2000-03-07 The Regents Of The University Of California Diagnosis, prevention and treatment of ulcerative colitis, and clinical subtypes thereof, using microbial UC pANCA antigens
US5932429A (en) 1996-04-12 1999-08-03 Cedars-Sinai Medical Center Methods of diagnosing clinical subtypes of crohn's disease
US5750479A (en) 1997-02-14 1998-05-12 Bandon Corp. Enclosed fluid system conditioner and process therefor
WO1998037415A1 (en) 1997-02-20 1998-08-27 The Regents Of The University Of California ULCERATIVE COLITIS pANCA SECRETORY VESICLE ANTIGEN AND METHODS OF USING SAME
US6218129B1 (en) 1998-05-15 2001-04-17 Prometheus Laboratories, Inc. Inflammatory bowel disease first step assay system
US6406862B1 (en) 1998-10-06 2002-06-18 The United States Of America As Represented By The Secretary Of The Army Dip-stick assay for C-reactive protein
US6309643B1 (en) 1999-04-30 2001-10-30 The Regents Of The University Of California IBD-associated microbial antigens and methods of using same
CA2371922C (en) 1999-05-24 2012-03-27 Introgen Therapeutics, Inc. Methods and compositions for non-viral gene therapy for treatment of hyperproliferative diseases
FR2802536B1 (fr) 1999-11-23 2003-06-13 Chru Lille Oligomannosides de synthese, leur preparation et leur utilisation a la detection d'anticorps et a la prevention d'infections
FR2806739B1 (fr) 2000-03-27 2005-02-18 Fond Jean Dausset Ceph Genes impliques dans les maladies inflammatoires de l'intestin et leur utilisation
US6838250B2 (en) 2000-03-31 2005-01-04 Ortho-Clinical Diagnostics, Inc. Immunoassay for C-reactive protein
US7138237B1 (en) 2000-05-19 2006-11-21 Cedars-Sinai Medical Center Diagnosis, prevention and treatment of Crohn's disease using the OmpC antigen
US20020042388A1 (en) 2001-05-01 2002-04-11 Cooper Mark J. Lyophilizable and enhanced compacted nucleic acids
US6821739B2 (en) 2000-10-13 2004-11-23 The Regents Of The University Of California Methods of diagnosing and treating Crohn's disease using Pseudomonas antigens
WO2002032396A2 (en) 2000-10-16 2002-04-25 Massachusetts Institute Of Technology Lipid-protein-sugar particles for delivery of nucleic acids
EP1330525B1 (en) 2000-10-30 2012-12-05 The Regents Of The University Of Michigan Nod2 nucleic acids and proteins
ES2486340T3 (es) 2000-10-30 2014-08-18 The Regents Of The University Of Michigan Ácidos nucleicos y proteínas Nod2
US7060442B2 (en) 2000-10-30 2006-06-13 Regents Of The University Of Michigan Modulators on Nod2 signaling
US20050164929A1 (en) 2000-11-06 2005-07-28 Lupine Logic, Inc. Methods of preventing and treating inflammatory bowel disease
AU2002902A (en) 2000-11-14 2002-05-27 Techlab Inc Method for differentiating irritable bowel syndrome from inflammatory bowel disease (ibd) and for monitoring persons with ibd using total endogenous lactoferrinas a marker
JP2004535388A (ja) 2001-04-30 2004-11-25 ターゲティッド ジェネティクス コーポレイション 脂質含有薬物送達複合体およびそれらの生成方法
ES2405405T3 (es) 2001-12-17 2013-05-31 Corixa Corporation Composiciones y procedimientos para la terapia y el diagnóstico de enfermedad inflamatoria del intestino
US20030204507A1 (en) 2002-04-25 2003-10-30 Li Jonathan Qiang Classification of rare events with high reliability
US20040053263A1 (en) 2002-08-30 2004-03-18 Abreu Maria T. Mutations in NOD2 are associated with fibrostenosing disease in patients with Crohn's disease
AU2003284187B2 (en) 2002-10-25 2009-10-01 Techlab, Inc. Inflammatory bowel disease and irritable bowel syndrome IBD-first chek diagnostic panel
AU2003298703A1 (en) 2002-11-22 2004-06-18 Emory University Diagnostic tests and methods for diagnosing inflammatory bowel disease
US7662569B2 (en) 2003-04-11 2010-02-16 Cedars-Sinai Medical Center Methods of assessing Crohn's disease patient phenotype by I2 serologic response
CN1777806B (zh) 2003-04-23 2010-09-01 卫材R&D管理有限公司 疾病预后模型的制作方法、使用该模型的疾病预后预测方法、利用该模型的预后预测装置以及其程序·存储介质
US20040242972A1 (en) 2003-05-28 2004-12-02 General Electric Company Method, system and computer product for prognosis of a medical disorder
US20050060295A1 (en) 2003-09-12 2005-03-17 Sensory Networks, Inc. Statistical classification of high-speed network data through content inspection
EP1687447A4 (en) 2003-11-03 2008-04-02 Univ Duke METHODS FOR IDENTIFYING INDIVIDUALS WITH PERIOPERATIVE RISK OF BLEEDING, RENAL DYSFUNCTION OR ICTUS
CA2554836A1 (en) 2004-02-05 2005-08-25 Medtronic, Inc. Methods and apparatus for identifying patients at risk for life threatening arrhythmias
US20060154276A1 (en) 2004-05-13 2006-07-13 Prometheus Laboratories Inc. Methods of diagnosing inflammatory bowel disease
US7759079B2 (en) 2004-05-13 2010-07-20 Prometheus Laboratories Inc. Methods of diagnosing inflammatory bowel disease
WO2006012472A1 (en) 2004-07-21 2006-02-02 Qualyst, Inc. Apparatus, kits and methods for evaluating binding interactions, for detecting and quantifying binding molecules, and for sample preparation
EP1819827B1 (en) 2004-12-08 2010-08-11 Cedars-Sinai Medical Center Methods for diagnosis of crohn's disease
US7873479B2 (en) 2005-12-01 2011-01-18 Prometheus Laboratories Inc. Methods of diagnosing inflammatory bowel disease
US20080085524A1 (en) * 2006-08-15 2008-04-10 Prometheus Laboratories Inc. Methods for diagnosing irritable bowel syndrome
US20100015156A1 (en) 2007-03-06 2010-01-21 Cedars-Sinai Medical Center Diagnosis of inflammatory bowel disease in children
US8153443B2 (en) 2007-05-10 2012-04-10 Cedars-Sinai Medical Center Characterization of the CBir1 antigenic response for diagnosis and treatment of Crohn's disease
CN101981739B (zh) 2008-03-27 2013-05-08 吉坤日矿日石能源株式会社 燃料电池系统及其负载跟踪运行方法
AU2009314259B2 (en) * 2008-11-11 2015-06-11 Nestec S.A. Methods for prediction of inflammatory bowel disease (IBD) using serologic markers
WO2010120814A1 (en) 2009-04-14 2010-10-21 Prometheus Laboratories Inc. Inflammatory bowel disease prognostics
CA2766157A1 (en) * 2009-06-25 2010-12-29 Hua Gong Methods for diagnosing irritable bowel syndrome
BR112012012513A2 (pt) * 2009-11-25 2017-01-10 Prometheus Lab Inc método para diagnosticar síndrome do intestino irritável em um paciente, método para monitorar a progressão ou regressão da síndrome do intestino irritável em um paciente, e para designar uma terapia contra síndrome do intestino irritável a um paciente em necessidade do mesmo
EP2576838A4 (en) 2010-06-04 2019-05-15 Nestec S.A. METHOD FOR IMPROVING DIAGNOSIS OF INFLAMMATORY ENDURANCE

Also Published As

Publication number Publication date
US20130225439A1 (en) 2013-08-29
WO2013059732A1 (en) 2013-04-25
EP2769321A4 (en) 2015-05-13
CA2852954A1 (en) 2013-04-25
EP2769321A1 (en) 2014-08-27
EP2769321B1 (en) 2016-06-01
AU2012325798A1 (en) 2013-05-16
MX352274B (es) 2017-11-16
US8715943B2 (en) 2014-05-06
JP2015502740A (ja) 2015-01-29
SG11201401536QA (en) 2014-05-29
HK1200933A1 (zh) 2015-08-14
US20150072879A1 (en) 2015-03-12
AU2012325798B2 (en) 2015-11-26
IL232167A0 (en) 2014-06-30

Similar Documents

Publication Publication Date Title
EP2769321B1 (en) Methods for improving inflammatory bowel disease diagnosis
US9732385B2 (en) Method for determining the risk of crohn&#39;s disease-related complications
US20120171672A1 (en) Inflammatory bowel disease prognostics
JP5571951B2 (ja) 試料が過敏性腸症候群と関連するか否かを決定する分類方法
US20130203053A1 (en) Methods for improving inflammatory bowel disease diagnosis
US20130005596A1 (en) Novel genomic biomarkers for irritable bowel syndrome diagnosis
JP5749652B2 (ja) 血清学的マーカーを用いた炎症性腸疾患(ibd)の予測方法
EP2710383B1 (en) Performance of a biomarker panel for irritable bowel syndrome
Schäffler et al. Mutations in the NOD2 gene are associated with a specific phenotype and lower anti‐tumor necrosis factor trough levels in Crohn's disease
JP2018504584A (ja) 過敏性腸疾患患者を治療するためのベドリズマブの投与計画を確立する方法
EP1613960B1 (en) Methods of assessing crohn&#39;s disease patient phenotype by i2, ompc and asca serologic response
WO2011060098A1 (en) Methods for predicting post-surgery risk associated with ileal pouch-anal anastomosis

Legal Events

Date Code Title Description
FG Grant or registration