MXPA01005513A - Metodos para reducir la variacion en estudios de tratamiento utilizando genotipificacion. - Google Patents

Metodos para reducir la variacion en estudios de tratamiento utilizando genotipificacion.

Info

Publication number
MXPA01005513A
MXPA01005513A MXPA01005513A MXPA01005513A MXPA01005513A MX PA01005513 A MXPA01005513 A MX PA01005513A MX PA01005513 A MXPA01005513 A MX PA01005513A MX PA01005513 A MXPA01005513 A MX PA01005513A MX PA01005513 A MXPA01005513 A MX PA01005513A
Authority
MX
Mexico
Prior art keywords
control
treated
treatment
subpopulations
polymorphic
Prior art date
Application number
MXPA01005513A
Other languages
English (en)
Inventor
Hugh Y Rienhoff Jr
Original Assignee
Dna Sciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dna Sciences Inc filed Critical Dna Sciences Inc
Publication of MXPA01005513A publication Critical patent/MXPA01005513A/es

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • A61K45/06Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente invención proporciona métodos, programas de computadora y sistemas computarizadosútiles para evaluar la eficacia de los varios tipos de procedimientos de tratamiento (por ejemplo, pruebas clínicas) como una función del genotipo de un subgrupo. Al igualar los grupos de tratamiento y de control genéticamente (100), los métodos y sistemas de la invención reducen la variación total del estudio, permitiendo asíque las pruebas que examinan la eficacia o efecto de los procedimientos de tratamiento sean conducidas con menos sujetos, con valores de confidencia incrementados, y/o con precisión o energía discriminatoria incrementada. Ciertos métodos de la invención involucran seleccionar subpoblaciones tratadas y de control de sujetos de poblaciones tratadas y de control para similitud en perfil polimórfico (102), en donde las poblaciones tratada y de control han sido tratadas con un procedimiento de tratamiento y de control, respectivamente. Después, se hace una determinación si existe una diferencia estadística importante (104) en un parámetro de prueba entre las subpoblaciones tratada y de control como una determinación del procedimiento de prueba (10

Description

MÉTODOS PARA REDUCIR LA VARIACION EN ESTUDIOS DE TRATAMIENTO UTILIZANDO GENOTIPIFICACION REFERENCIAS CRUZADAS A LAS SOLICITUDES RELACIONADAS Esta solicitud reclama el beneficio de la solicitud provisional de E. U. A. No. 60/110,668, presentada el 2 de diciembre de 1998, la cual se incorpora aquí por referencia en su totalidad para todos los propósitos.
CAMPO DE LA INVENCION La presente invención reside en los campos de medicina, genética y estadística.
ANTECEDENTES DE LA INVENCION La conducción y diseño de estudios para investigar la eficacia de tratamientos, tales como pruebas clínicas, se dirige a eliminar la desviación que surge de la influencia biológica "aleatoria" por ser genéticos o ambientales, así como la desviación introducida por el investigador adrede o de otra manera. Un aspecto para reducir la desviación es aleatorizar individuos en grupos de tratamiento o de control con el propósito de que si los individuos en los dos grupos no están relacionados genéticamente y viven independientes uno del otro, entonces las influencias tanto genéticas como ambientales en la prueba serán equilibradas en las dos ramas del estudio. Una consecuencia inmediata de la aleatorización de esta manera, sin embargo, es que la variación de la condición biológica medida es mayor que si cada caso es igualado para influencias genéticas y ambientales conocidas. Un método para determinar la variabilidad genética es a través de la determinación del perfil polimórfico. Los polimorfismos se refieren a la coexistencia de formas múltiples de una secuencia en una población. Se han reportados varios diferentes tipos de polimorfismos. Un polimorfismo de longitud de fragmento de restricción (RFLT), por ejemplo, representa una variación en la secuencia de ADN que altera la longitud de un fragmento de restricción (ver, por ejemplo, Botstein y otros, Am. J. Hum. Genet. 32:314-331 (1980)). Las repeticiones cortas en tándem (STRs), como el nombre lo indica, son repeticiones cortas en tándem que consisten de motivos de repetición de di-, tri- y tetra-nucleótido en tándem. Dichos polimorfismos también algunas veces son denominados como polimorfismos de repetición en tándem de número variable (VNTR), (ver, por ejemplo, patente de E. U. A. 5,075,217; Armour y otros, FEBS Lett 307:113-115 (1992); y Horn y otros, WO91/14003). A lo mucho, la forma más común de polimorfismo es aquella que implica variaciones de nucleotido individual entre individuos de la misma especie; tales polimorfismos son denominados como polimorfismos de nucleotido individual, o simplemente SNPs. Algunos "c 3 polimorfismos de nucleótido individual que ocurren en regiones de codificación de proteína da surgimiento a la expresión de la variante o proteínas defectuosas, y de esta manera son potencialmente la causa de una enfermedad genética. Aún más los polimorfismos de 5 nucleótido individual que ocurren en regiones que no son de codificación, sin embargo, pueden dar como resultado una expresión de proteína defectuosa (por ejemplo, causando separación defectuosa). Otros polimorfismos SNPs no tienen efectos fenotípicos. 10 COMPENDIO DE LA INVENCION Ciertos métodos de la invención están diseñados para proporcionar una determinación de la eficacia de un procedimiento de tratamiento. En general, tales métodos implican seleccionar 15 subpoblaciones tratadas y de control de poblaciones de sujetos tratadas y de control, en donde la población tratada ha sido tratada con un procedimiento de tratamiento y la población de control ha sido tratada con un procedimiento de control. Los sujetos tanto en las poblaciones tratadas como de control, han sido caracterizados 20 por el perfil polimórfico y han sido seleccionados ya que tienen perfiles polimórficos similares. Después, se hace una determinación de que si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones tratadas y de control. En general, dicha diferencia estadísticamente importante indica que 25 existe una correlación entre el tipo de tratamiento y una o más formas polimórficas dentro del perfil polimórfico, para el cual se seleccionaron subpoblaciones tratadas y de control. En algunos casos, especialmente cuando se encuentra una diferencia importante, los pasos de seleccionar y de determinar se repiten una o más veces. En tales ciclos adicionales, el perfil polimórfico para el cual se seleccionan los grupos tratados y de control, difiere del perfil polimórfico seleccionado en ciclos previos. El perfil polimórfico para el cual se seleccionan las subpoblaciones, puede variar en términos de números de formas polimórficas dentro del perfil y el grado de similitud en los perfiles entre los grupos tratados y de control. Por ejemplo, el perfil polimórfico puede incluir una sola morfa polimórfica, pero más típicamente incluye una pluralidad de formas polimórficas (por ejemplo, 10 o hasta 100 formas polimórficas o más). En la mayoría de los casos, los perfiles polimórficos de las subpoblaciones tienen por lo menos 10%, 50%, 75% o hasta 100% de identidad. Ciertos métodos de la invención están dirigidos a métodos para realizar pruebas clínicas. Algunos de estos métodos inicialmente implican tratar una población tratada y una población de control de pacientes que tienen la misma enfermedad con un fármaco y un procedimiento de control (por ejemplo, tratamiento con un placebo o con una cantidad diferente del fármaco o de acuerdo con un programa de tratamiento diferente), respectivamente. Una subpoblación de pacientes después se selecciona de cada una de las poblaciones tratadas y de control para similitud en un perfil polimórfico. Después se hace una determinación de que si el tratamiento con el fármaco se correlaciona con el estado de la enfermedad en las subpoblaciones para determinar la eficacia del fármaco para el tratamiento de la enfermedad. Con estos métodos también, una correlación indica que por lo menos una o más formas polimórficas dentro de los perfiles polimórficos se correlaciona con la eficacia del tratamiento. Algunos métodos de la invención son métodos computarizados. Por ejemplo, ciertos métodos de la invención incluyen proporcionar una base de datos capaz de almacenar: (1) designaciones para cada miembro de una población tratada, tratada de acuerdo con el procedimiento de tratamiento, y designaciones para cada miembro de una población de control tratada de acuerdo con un procedimiento de control, (2) designaciones para un perfil polimórfico para cada miembro de las poblaciones tratadas y de control, y (3) designaciones para un parámetro de prueba para cada miembro de las poblaciones tratada y de control. Utilizando la base de datos, se seleccionan subpoblaciones de cada una de las poblaciones tratada y de control para similitudes en perfil polimórfico. Después se hace una determinación para averiguar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones. El resultado del paso de determinación después es presentado en un dispositivo de salida (por ejemplo, un monitor o una pantalla de vídeo). En otro aspecto, la invención proporciona varios sistemas de computadora y programas. Por ejemplo, se proporcionan ciertos •productos de computadora para determinar un procedimiento de tratamiento. Algunos sistemas incluyen productos de programa que generalmente incluyen un código para proporcionar o recibir datos, en donde los datos incluyen: (1) designaciones para cada miembro de una población tratada, tratada de acuerdo con el procedimiento de tratamiento, y designaciones para cada miembro de una población de control tratada de acuerdo con un procedimiento de control, (2) designaciones para un perfil polimórfico para cada miembro de las poblaciones tratadas y de control, y (3) designaciones para un parámetro de prueba para cada miembro de las poblaciones tratada y de control. El programa también incluye un código para seleccionar una subpoblacion de cada una de las poblaciones de tratamiento y de control que tengan un perfil polimórfico similar, un código para determinar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones y un código para presentar un resultado que indique si se encontró una diferencia estadísticamente importante entre las subpoblaciones. El código típicamente es almacenado en un medio de almacenamiento legible por computadora. La invención además proporciona un sistema computarizado para determinar procedimientos de tratamiento. Algunos sistemas generalmente incluyen una memoria, una barra colectora de sistema y un procesador. El procesador está operati amente dispuesto para proporcionar o recibir datos, en donde los datos incluyen: (1) designaciones para cada miembro de una población tratada, tratada de acuerdo con el procedimiento de tratamiento, y designaciones para cada miembro de una población de control tratada de acuerdo con un procedimiento de control, (2) designaciones para un perfil polimórfico para cada miembro de las poblaciones tratadas y de control, y (3) designaciones para un parámetro de prueba para cada miembro de las poblaciones tratada y de control. El procesador además está dispuesto para seleccionar una subpoblacion de cada una de las poblaciones de tratamiento y de control que tengan un perfil polimórfico similar y determinar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones. El microprocesador es capas de desplegar un resultado o salida indicando si se encontró una diferencia estadísticamente importante entre las subpoblaciones.
BREVE DESCRIPCION DE LOS DIBUJOS Las Figuras 1 y 2 ilustran sistemas de computadora para implementar los métodos de la invención. La Figura 3 es un diagrama de flujo para un método para determinar un procedimiento de tratamiento de acuerdo con la presente invención.
DESCRIPCION DETALLADA I . Definiciones Un "procedimiento de tratamiento" se refiere a métodos o procesos que son realizados en un miembro de una población tratada o de tratamiento. En general, el procedimiento de tratamiento es un proceso realizado en un sujeto para afectar alguna condición biológica, susceptibilidad o resistencia del sujeto. Ejemplos de procedimientos de tratamiento incluyen, pero no se limitan a, tratamientos con compuestos farmacéuticos u otros biológicos (incluyendo, por ejemplo, proteínas recombinantemente producidas), procedimientos quirúrgicos y varias terapias de comportamiento (es decir, regímenes de dieta y/o ejercicio prescrito). Los procedimientos de tratamiento pueden ser profilácticos o terapéuticos. Por ejemplo, un procedimiento de tratamiento puede incluir miembros de tratamiento de una población de tratamiento con una vacuna. En una forma similar, un "procedimiento de control" se refiere a métodos que son realizados en un miembro de una población de control. El procedimiento de control puede diferir del procedimiento de tratamiento en aspectos cuantitativos o cualitativos. Por ejemplo, los miembros de una población de tratamiento pueden recibir una composición farmacéutica, mientras que la población de control recibe un placebo (es decir, ninguna composición farmacéutica). En otros casos, el procedimiento de control implica la administración de un fármaco a diferentes concentraciones que en el procedimiento de tratamiento, o puede involucrar un programa diferente de administración de la composición farmacéutica con relación al procedimiento de tratamiento. Un "estudio clínico" es una investigación en la causa y algunas veces el tratamiento de un fenotipo particular que está representado por al menos una variable aleatoria. Este fenotipo por lo general puede ser un estado de enfermedad o una medida de severidad de enfermedad. Un estudio clínico puede tomar la forma de un estudio de control de caso (para una variable aleatoria discreta, los grupos siendo individuos afectados y no afectados) o un solo estudio de población, en donde la causa del grado o severidad del fenotipo se está investigando (por ejemplo, un estudio cuantitativo puede examinar presión sanguínea, glucosa en la sangre, etc.). Un "estudio de tratamiento" es una investigación en el efecto o influencia que un procedimiento de tratamiento particular tiene sobre una condición biológica, susceptibilidad biológica o resistencia biológica de un sujeto. El estudio puede ser absolutamente estructurado, formal y extensivo en alcance, o puede ser relativamente no estructurado y de alcance limitado. Por ejemplo, un estudio de tratamiento puede ser una prueba clínica formal o estudio realizado en un grupo relativamente grande de sujetos, en donde el estudio realizado de acuerdo con líneas de guía fijadas (por ejemplo, reglamentos gubernamentales). Sin embargo, el estudio de tratamiento también puede ser un estudio preclínico, una prueba de campo de una población de planta o aún un estudio informal 1 o mediante un científico, veterinario o un médico de los efectos de un tratamiento en relativamente pocos sujetos. En un estudio de tratamiento, los sujetos son divididos en varios grupos (aunque por lo general sólo son dos). Estos pueden representar diferentes escalas de dosis o simplemente los sujetos tratados y los no tratados. En el estudio, la variable aleatoria es medida después de tratamiento. También se puede medir antes del tratamiento si existe un cambio en la variable con el tiempo que se está investigando (por ejemplo, densidad mineral en el hueso o presión sanguínea). Se prefiere que los sujetos no estén experimentando ningún otro tratamiento para su condición patológica. Sin embargo, si dicha restricción es no razonable, el estudio debe ser designado, de manera que los sujetos tanto en los grupos tratados como no tratados están experimentando el mismo tratamiento alternativo. Los sujetos del estudio de tratamiento pueden ser conducidos con cualquier tipo de organismo, incluyendo, por ejemplo, animales (incluyendo seres humanos), plantas, bacterias y virus. Una "condición biológica se refiere a la condición, susceptibilidad o resistencia del organismo en donde el estudio busca determinar si el procedimiento de tratamiento tiene un efecto. Típicamente, la condición biológica es una condición física o fisiológica del organismo. Por ejemplo, en algunos casos, la condición biológica es una condición patológica (es decir, un estado fisiológico que normalmente no existe, tal como una enfermedad, por ejemplo). Las condiciones patológicas típicamente estudiadas con los métodos de la invención son aquellas con una variación mínima ambiental (por ejemplo, altos niveles de colesterol en el suero), aunque esto no es requerido. Ejemplos de condiciones patológicas incluyen. SI DA, arteriesclerosis, cáncer y diabetes, presión sanguínea elevada, nivel elevado de colesterol en el suelo, o psicosis. Una condición biológica puede ser la susceptibilidad biológica o resistencia de un sujeto. Por ejemplo, el estudio de tratamiento puede involucrar una análisis del efecto de ciertos tratamientos en la susceptibilidad de una planta a un herbicida o susceptibilidad de una planta a daño por congelación. Alternativamente, el estudio puede ser dirigido hacia una respuesta de defensa del organismo (es decir, resistencia) para cierto tipo de ataque, por ejemplo. Una "variable aleatoria", ya sea discreta o continua, puede ser cualquier punto final biológico, fisiológico o bioquímico u observado, particularmente en el establecimiento de un estudio clínico. Esta incluye efectos medidos y observados de tratamientos, los cambios en aquellas observaciones y mediciones durante el curso del tiempo (la así llamada historia natural), o cualquier otra intervención que pueda alterar rasgos, signos o síntomas. Ejemplos de variables aleatorias incluyen condiciones patológicas susceptibles a tratamiento con, por ejemplo, compuestos farmacéuticos; biológicos, incluyendo proteínas recombinantemente producidas; técnicas quirúrgicas; dietas de restricción; y terapia de comportamiento. Por ejemplo, las concentraciones de colesterol en el suero, altura, masa del cuerpo, todas son variables aleatorias continuas. Esta noción puede extenderse a variables discretas tales como la presencia o ausencia de un rasgo o síntoma físico que incluyen, por ejemplo, nevus sobre la piel, quistes en el hígado, anticuerpos particulares en el suero, el grado de hinchazón de las articulaciones, el número de articulaciones afectadas, o el número de alucinaciones en un episodio sicótico. Un "parámetro de prueba" es la característica que es medida u observada para determinar el efecto o eficacia (o falta de los mismos) del procedimiento de tratamiento que está siendo evaluado y se utiliza para determinar si existe una diferencia estadísticamente importante en los protocolos de tratamiento y de control. El parámetro de prueba puede ser una variable aleatoria. Típicamente, el parámetro de prueba se expresa en términos cuantitativos, aunque en algunos casos, el parámetro de prueba puede ser evaluado en términos cualitativos. La naturaleza del parámetro de prueba varía de acuerdo con la condición biológica que está siendo estudiada. Si la condición biológica es una enfermedad, el parámetro de prueba proporciona una medida para el estado de la enfermedad. Por ejemplo, si la condición biológica es SIDA, el parámetro de prueba puede ser la concentración de VIH en la sangre de un sujeto. Si la condición biológica es ateroesclerosis, el parámetro de prueba puede ser la concentración de colesterol en el suero. El término "variación" se refiere a la variación, difusión, extensión o dispersión alrededor de la media aritmética. Esquemáticamente, la variación es el valor medio de las desviaciones cuadradas (Armitage, P., Statistical Methods in Medical Research, Blackwell Scientific, Oxford, United Kingdom (1981)). Una variación grande indica desviaciones grandes de la media aritmética. Por ejemplo, si el nivel de colesterol es el parámetro de prueba que se está midiendo, se determina un nivel medio de colesterol. La variación representa la desviación cuadrada promedio de todos los niveles de colesterol con relación a la media. Otras mediciones estadísticas de extensión o dispersión alrededor de una media, también pueden ser utilizadas. Típicamente, la distribución del parámetro de prueba toma la forma de una curva con forma de campana o una curva normal (Gausiana). Pictóricamente, la invención disminuye la variación y de esta manera estrecha la forma de campana de la curva normal o, descrito matemáticamente, la distribución se hace leptocúrtica. Típicamente, la variación se debe a diferentes efectos en los sujetos que tienen influencia en la condición biológica que está siendo analizada a través de métodos estadísticos, por ejemplo, variables de genética, ambientales y de medición. Por ejemplo, en la mayoría de los estudios de tratamiento, ya que los mismos estudios son utilizados para medir la condición biológica entre toda la población que se está estudiando, la variación se debe a diferencias genéticas entre sujetos individuales y el ambiente en donde viven los sujetos. Ejemplos de influencias ambientales incluyen dieta, patrones del dormir, ubicación geográfica y cultura. Un "polimorfismo" se refiere a la ocurrencia de dos o más secuencias alternativas genéticamente determinadas o alelos en una población que generalmente se dice que ocurre a una frecuencia mayor que 0.1%. Un marcador o sitio polimórfico es el sitio en donde ocurre la divergencia genética. Los marcadores preferidos tienen por lo menos dos alelos, cada uno ocurriendo a una frecuencia mayor que 1% en una población seleccionada. Un sitio polimórfico puede ser tan pequeño como un par de bases. Dichos sitio es denominado como un polimorfismo de nucleótido individual o simplemente SNP. Los marcadores polimórficos incluyen polimorfismos de longitud de fragmento de restricción, número variable de repeticiones en tándem (VNTR's), regiones hipervariables, minisatélites, repeticiones de dinucleótido, repeticiones de trinucleótido, repeticiones de tetranucleótido, repeticiones de secuencia simple y elementos de inserción tales como Alu. La primera forma alélica identificada es arbitrariamente designada como la forma de referencia y otras formas alélicas son designadas como alelos alternativos o variables. La forma alélica que ocurre más frecuentemente en una población seleccionada es algunas veces denominada como la forma de tipo silvestre o alelo, y las otras formas son denominadas como formas o alelos mutantes. Los organismos diploides pueden ser homocigotos o heterocigotos para formas alélicas. Un polimorfismo dialélico tiene dos formas. Un polimorfismo trialélico tiene tres formas. Un "polimorfismo de nucleótido individual" ocurre en un sitio polimórfico que está ocupado por un nucleótido individual, el cual es el sitio de variación entre secuencias alélicas. El sitio es usualmente precedido por y seguido por secuencias altamente conservadas del alelo (por ejemplo, secuencias que varían en menos de 1/100 o 1/1000 miembros de las poblaciones). Un polimorfismo de nucleótido individual (SNP) usualmente surge debido a la substitución de un nucleótido por otro en el sitio polimórfico. Una transición es el reemplazo de una purina por otra purina o una pirimidina por otra pirimidina. Una transversión es eel reemplazo de una purina por una pirimidina o viceversa. Los polimorfismos de nucleótido individual también pueden surgir de una eliminación de un nucleótido o una inserción de un nucleótido con relación a un alelo de referencia. Un "perfil polimórfico" se refiere a una o más formas polimórficas para la cual se caracteriza un sujeto. Una forma polimórfica se caracteriza identificando que nucleótido(s) está presente en un sitio polimórfico en una muestra de ácido nucleico adquirida de un sujeto. El perfil incluye por lo menos una forma polimórfica y preferiblemente incluye una pluralidad de formas polimórficas, tales como por lo menos 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 formas polimórficas o más. Los perfiles polimórficos son similares cuando los perfiles polimórficos que están siendo comparados comparten por lo menos una forma polimórfica y al menos un sitio polimórfico. Típicamente, los perfiles polimórficos similares comparten identidad de formas polimórficas en por lo menos un 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% o 100%, en al menos 10, 20, 30, 40, 50, 60, 70, 100 o 150 sitios polimórficos.
Las formas polimórficas son idénticas si el nucleótido(s) en un sitio polimórfico particular es igual. De esta manera, dos perfiles polimórficos, cada uno incluyendo 10 formas polimórficas, son 50% idénticos si 5 de las formas polimórficas en los dos perfiles son idénticos. Si el organismo es diploide, entonces las formas polimórficas en cada sitio polimórfico se considera que son idénticas en dos individuos si ambos individuos tienen los mismos dos alelos en el sitio polimórfico. Por ejemplo, un individuo que tienen alelos a1 y a2 en un sitio polimórfico A se considera que tiene el mismo perfil como un individuo que tiene los alelos a1 y a2, pero no con un individuo que tiene los alelos a1 y a1, o a2 y a2, o al y a3, etc. El término "enlazamiento" describe la tendencia de los genes, alelos, sitios o marcadores genéticos que son hereditarios conjuntamente como resultado de su ubicación en el mismo cromosoma, y puede ser medido por el porcentaje de recombinación entre los dos genes, alelos, sitios o marcadores genéticos. El "desequilibrio de enlazamiento" o "asociación alélica" representa la asociación preferencial de un alelo o marcador genético particular con una alelo específico, o marcador genético en una ubicación absolutamente cromosómica más frecuentemente que lo esperado por oportunidad (ver, por ejemplo, Weir, B., Genetic Data Analysis, Sinauer Associate Inc., 1996). Por ejemplo, si el sitio X tiene los alelos a y b, los cuales ocurren igual y frecuentemente, e Y de sitio enlazado tiene alelos c y d, los cuales ocurren igual y frecuentemente, uno puede esperar que ocurra la combinación ac con una frecuencia de 0.25. Si ac ocurre más frecuentemente, entonces los alelos a y c están en desequilibrio de enlazamiento. El desequilibrio de enlazamiento puede resultar de la selección natural de cierta combinación de alelos, o ya que un alelo ha sido introducido en una población también recientemente teniendo equilibrio alcanzado con alelos en lazados. Un marcador en desequilibrio de enlazamiento puede ser particularmente útil para detectar la susceptibilidad a la enfermedad (u otro fenotipo) sin considerar que el marcador no ocasione la enfermedad. Por ejemplo, un marcador (X) que por sí mismo no es un elemento causante de una enfermedad, pero el cual está en un desequilibrio de enlazamiento con un gen (incluyendo secuencias reguladoras) (Y) que es un elemento causante de un fenotipo, puede ser seleccionado para indicar la susceptibilidad a la enfermedad en circunstancias en donde el gen Y pudo no haber sido identificado o puede no ser fácilmente detectable. "Haplotipo" se refiere a una colección de marcadores polimórficos ya sea en estrecha cercanía física en un cromosoma individual, o físicamente no enlazado pero asociado conjuntamente, que confiere una propiedad biológica o asociación con un fenotipo.
Un "ácido nucleico" es un polímero de desoxirribonucleótido o ribonucleótído en forma de cadena ya sea individual o doble, incluyendo análogos conocidos de nucleótidos naturales a menos que se indique otra cosa. El término "genotipo" como se utiliza en la presente, ampliamente se refiere a la composición genética de un organismo, incluyendo, por ejemplo, si un organismo diploide es heterocigoto u homocigoto para uno o más alelos de interés. • El término "iniciador" se refiere a un oligonucleótido de estructura de cadena individual capaz de actuar como un punto de iniciación de la síntesis de ADN dirigida por plantilla bajo condiciones apropiadas (es decir, en respuesta de cuatro diferentes trifosfatos de nucleósido y un agente para polimerización, tal como polimerasa de ADN o ARN o transcriptasa inversa) en un regulador de pH apropiado y a una temperatura adecuada. La longitud apropiada de un iniciador depende del uso pretendido del iniciador, pero típicamente varía de 15 a 30 nucleótidos, aunque también se pueden utilizar iniciadores más cortos o más largos. Las moléculas de iniciador más corto generalmente requieren de temperaturas más frías para formar complejos híbridos suficientemente estables con la plantilla. Un iniciador no necesita reflejar la exacta secuencia de la plantilla, sino que más bien debe ser suficientemente complementario para hibridizar con una plantilla. El término "sitio de iniciador" se refiere al área del ADN objetivo en donde se hibridiza un iniciador. El término "par de iniciador" representa un grupo de iniciadores, incluyendo un iniciador corriente arriba 5' que hibridiza con el extremo 5' de la secuencia de ADN que será amplificada y un iniciador corriente abajo 3' que hibridiza con el complemento del extremo 3' de la secuencia que será amplificada. El término "sonda de ácido nucleico" se refiere a una molécula de ácido nucleico que se une a una secuencia o subsecuencia especifica de otra molécula de ácido nucleico. Una sonda es preferiblemente una molécula de ácido nucleico que se une a través de pares de base complementarios a toda la secuencia o a una subsecuencia de un ácido nucleico objetivo. Las sondas pueden unir secuencias objetivo de carezcan de complementariedad completa con la secuencia de sonda dependiendo de la severidad de las condiciones de hibridación. Las sondas típicamente son directamente marcadas como con isotipos, cromóforos, lumíforos, cromógenos, o indirectamente marcadas tales como con biotina, a la cual después se une un complejo de estreptavidina. Al analizar la presencia o ausencia de la sonda, la presencia o ausencia de la secuencia seleccionada o subsecuencia puede ser detectada. Una "marca" es una composición detectable a través de medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos o químicos. Por ejemplo, las marcas útiles incluyen 32P, colorantes fluorescentes, reactivos densos de electrones, enzimas (por ejemplo, como se utiliza comúnmente en ELISA), biotina, dioxigenina, o haptenos y proteínas para los cuales están disponibles antisueros o anticuerpos monoclonales (por ejemplo, incorporando una radiomarca en el péptido, y utilizados para detectar anticuerpos específicamente reactivos con el péptido). Una marca por lo general genera una señal medible, tal como radioactividad, luz fluorescente o actividad de enzima, que puede ser utilizada para cuantificar la cantidad de marca unida.
Una "sonda de ácido nucleico marcada" es una sonda de ácido nucleico que está unida, ya sea covalentemente, a través de un enlazador, o a través de enlaces de van der Waals o de hidrógeno iónicos a una marca de manera que la presencia de la sonda puede ser detectada detectando la presencia de la marca unida a la sonda.
La frase "selectivamente hibridiza a" se refiere a la unión, duplicación o hibridación de una molécula solamente a una molécula solamente a una secuencia de nucleótido particular bajo condiciones severas de hibridación cuando esa secuencia está presente en ADN o ARN de mezcla de complejo (por ejemplo, celular total). La frase "condiciones severas de hibridación" se refiere a condiciones bajo las cuales una sonda hibridiza a su secuencia objetivo, pero no a otras secuencias. Las condiciones severas son dependientes de secuencia y son diferentes en diferentes circunstancias. Las secuencias más largas hibridizan específicamente a temperaturas más altas. Una guía extensa de la hibridación de ácidos nucleicos se encuentra en Tijssen, Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Probes, "Overview of principies of hybridization and the strategy of nucleic acid assays" (1993). En general, las condiciones severas se seleccionan para que sean aproximadamente 5-10°C menores que el punto de fusión térmico (Tm) para la secuencia específica a un pH de resistencia iónica definido. La Tm es la temperatura (por debajo de la resistencia iónica definida, pH, y concentración nucleica) a la cual 50% de las sondas complementarias al objetivo hibridizan a la secuencia objetivo en equilibrio (ya que las secuencias objetivo están presentes en exceso, a Tm, 50% de la sondas están ocupadas en equilibrio) las condiciones severas son aquellas en donde la concentración de -sal es menor que aproximadamente 1.0 iones de sodio, típicamente alrededor de 0.01 a 1.0 M de concentración de ion de sodio (u otras sales) a un pH de 7.0 a 8.3, y la temperatura por lo menos es de aproximadamente 30°C para sondas cortas (por ejemplo de 10 a 50 nucleotidos) y por lo menos aproximadamente 60% para sondas largas (por ejemplo, mayores que 50 nucleotidos). Las condiciones severas también pueden ser logradas con la adición de agentes de desestabilización, tales como formamida. Si se desea una hibridación de degeneración, son necesarias condiciones severas menores. Por ejemplo, si se prefiere una desigualdad de nucleótido individual, las condiciones de hibridación serán relajadas con temperaturas más bajas y un contenido más alto de sal. El término "correlación estadística" se refiere a una asociación estadística entre dos variables o parámetros según medido por cualquier prueba estadística, incluyendo, por ejemplo, análisis chi-cuadrado, ANOVA o análisis de variables múltiples. La correlación entre una forma polimórfica de ADN y una variable aleatoria o parámetro de prueba se considera estadísticamente importante si la probabilidad del resultado que ocurre por oportunidad (el valor P) es menor que algún nivel predeterminado (por ejemplo, 0.05). El término "diferencia estadísticamente importante" se refiere a un nivel de confidencia estadístico, P, que es <0.05, de preferencia <0.01, y muy preferiblemente <0.001. Un "fármaco" o "agente farmacéutico" representa cualquier substancia utilizada en la prevención, diagnóstico, alivio, tratamiento cura de una enfermedad. Los términos incluyen una vacuna, por ejemplo. El término "sujeto" o "individuo" típicamente se refiere a seres humanos, pero también a mamíferos y otros animales, organismos multicelulares tales como plantas y organismos de una sola célula o virus. "Tejido" representa cualquier muestra tomada de cualquier paciente, preferiblemente un ser humano. Los tejidos incluyen sangre, saliva, orina, muestras de biopsia, piel o raspaduras bucales, y cabello. El término "paciente" se refiere a sujetos tanto seres humanos como veterinarios.
II. Aspecto General La presente invención proporciona métodos, programas de computadora y sistemas computarizados útiles para diseñar estudios de tratamiento y para evaluar la eficacia de varios tipos de procedimientos de tratamiento (por ejemplo, pruebas clínicas,) como una función del genotipo de un sujeto. Los métodos de la invención están diseñados para controlar factores genéticos subyacentes que pueden influenciar la respuesta a un tratamiento. La presente invención se basa, en parte, en la perspicacia de controlar ya sea, directa o indirectamente, factores genéticos que influencian una respuesta del paciente al tratamiento, que enormemente pueden incrementar la potencia de la prueba clínica. Algunos métodos están diseñados para reducir la diversidad genética de la población de pacientes, con el fin de incrementar la probabilidad de individuos que comparten los mismos alelos en genes involucrados en la respuesta al tratamiento. En casos en donde se sabe que los polimorfismos (usualmente en genes) están asociados con u ocasionen diferencias en respuesta al tratamiento, estos polimorfismos pueden ser usados directamente en el diseño de la prueba clínica. Por ejemplo, la invención proporciona métodos para reducir la variación en la condición biológica o fenotipo de interés controlando los factores genéticos que tienen influencia en ese fenotipo. En el contexto de una prueba clínica, el fenotipo de interés es la respuesta a un tratamiento. Los factores genéticos pueden ser controlados en un número de diferentes formas, pero el principio que subraya los métodos de la invención puede ser ilustrado por un ejemplo. Si el parámetro de prueba es medido en dos grupos, el primer grupo (el cual es de un tamaño n) es tratado, y el segundo grupo (de tamaño m) está no tratado, la media y variación de estas muestras pueden ser calculadas en la forma estándar (ver, por ejemplo Armitage & Berry, Statistical Methods in Medical Research, Blackwell Science, 1995). De esta manera, por ejemplo en un ejemplo, la media y la variación del grupo tratado son µ-^ y Si2 respectivamente, y la media y variación del grupo no tratado son µ2 y s22, respectivamente.
Después, un intervalo de confidencia aproximado a% (en donde, por ejemplo, a = 0.95) para la diferencia en respuesta entre los dos grupos es dado como: en donde Za 2 es el valor de una distribución normal estándar que es excedida por oportunidad en a/2% de los casos. Por lo tanto, cualquier método que reduzca la variación en cualquier muestra (es decir, que reduzca s o s22) necesariamente reduce el tamaño de intervalo de confidencia. Alternativamente, cuando la variación de una de ambas de las muestras se reduce, el tamaño del intervalo de confidencia puede ser mantenido constante con muy pocos pacientes enlistados en la prueba (es decir, n y/o m puede se reducido). De esta manera, la disminución de la variación en la respuesta puede conducir tanto a una mayor certeza de una diferencia (aquí encapsulado por un intervalo de confidencia más pequeño) o un tamaño de muestra reducido para la misma potencia estadística. La variación puede ser reducida en un número de diferentes formas como se describe en las siguientes secciones.
A. Inscripción Selectiva de Pacientes. Un aspecto es controlar los factores potencialmente enredados incrementando la homogeneidad de la población. En el contexto de genética, un grupo de marcadores polimórficos puede ser examinado en un grupo grandes de sujetos y aquellos con perfiles polimórficos similares enlistados en el estudio de tratamiento. La incorporación de factores genéticos (representados por el perfil polimórfico) a los criterios de inclusión/exclusión de un estudio de tratamiento, permite que el investigador reduzca la variación en respuesta debido a factores genéticos subyacentes.
B. División de población de pacientes en subgrupos genéticamente homogéneos. Un segundo aspecto es categorizar individuos en subgrupos dependiendo de que tan similares son los perfiles polimórficos ente sí. Dentro de cada subgrupo, los sujetos son aleatoriamente distribuidos en subpoblaciones de tratamiento o de control, ya que están en una prueba clínica estándar, por ejemplo. Este método de dividir a los sujetos, crea subgrupos que son genéticamente más homogéneos que una muestra aleatoria del mismo tamaño. Este diseño es equivalente para conducir varios estudios de tratamiento independientes, pequeño, cada uno de los cuales contienen pacientes que tienen perfiles polimórficos más similares que los esperados. Muchas variables ambientales pueden ser manifestaciones de factores genéticos subyacentes. Al examinar directamente polimorfismos genéticos, es posible no sólo reducir la variación debido a factores genéticos que nos son directamente observables, sino que también mejorar la estratificación basada en factores ambientales que está actuando como substitutos para los factores genéticos subyacentes que los controlan. Como se utiliza en la presente, estratificación se refiere a la relación de la muestra en subgrupos que son más similares que los esperados para un factor dado.
C. Igualación de pacientes para sus perfiles polimórf icos. Un aspecto alternativo es igualar a los sujetos en los grupos de tratamiento y de control. Es decir, pares de individuos con perfiles polimórficos similares son buscados y uno es distribuido al grupo de tratamiento mientras que el otro es colocado en el grupo de control. De esta manera, la diferencia en respuesta para cada par puede ser examinada, en donde los pares han sido igualados por su genética subyacente. De la misma manera como se describió en la sección B anterior, la igualación con base en los factores genéticos puede controlar nuevos casos previamente desconocidos de variación debido a factores genéticos y también proporcionar un poder discriminatorio mayor cuando se iguala por factores ambientales que tienen una causa genética subyacente.
D. Utilización de genes conocidos por influenciar la respuesta en el diseño de pruebas clínicas. Cuando uno o más polimorfismos conocidos se sabe que está asociado con la respuesta al tratamiento, estos pueden ser usados directamente para distribuir pacientes en grupos de tratamiento y de control. En el caso más simple, en donde un perfil polimórfico del sujeto indica si responderá o no al tratamiento, esta información puede ser utilizada como un criterio de exclusión/inclusión en el momento de la inscripción, reduciendo así el tamaño de la muestra necesaria para observar un nivel dado de- respuesta . Alternativamente, todos los sujetos pueden ser enlistados en el estudio de tratamiento con el tratamiento asignado en forma no aleatoria. Por ejemplo, aquellos que se consideran que no responden por su perfil polimórfico pueden ser tratados de acuerdo con un procedimiento de control (por ejemplo, administrar un placebo), mientras que aquellos que se considera que responden por su perfil polimórfico se les puede dar el procedimiento de tratamiento (por ejemplo, administrar un fármaco). Esto incrementa al máximo la diferencia en respuesta entre los grupos de tratamiento y de control. En forma inversa, los que no responden se les puede administrar el tratamiento y, los que responden el tratamiento. En este escenario, se puede evaluar la diferencia mínima entre sujetos tratados y no tratados.
E. Uso de genes que se sabe que tienen influencia en la respuesta para determinar la dosificación. Cuando se sabe que uno o más polimorfismos conocidos va a ser asociado con respuesta al tratamiento, esta información puede ser utilizada para distribuir la dosis más apropiada a los sujetos enlistada en un estudio de tratamiento, tal como una prueba clínica. Los perfiles polimórficos de pacientes pueden determinar el grado de respuesta de individuos para el tratamiento. De esta manera, puede ser posible distribuir diferentes dosis a diferentes pacientes dependiendo de sus perfiles polimórf icos. Por ejemplo, si un tratamiento potencialmente tiene efectos laterales, será deseable administrar la dosis mínima eficaz. Esto puede variar entre los sujetos con diferentes perfiles polimórf icos.
F. Análisis posteriores las pruebas y subdivisión. La presente invención también puede ser usada después del término de un estudio de tratamiento, tal como una prueba clínica. Los datos obtenidos de dicho estudio de tratamiento se vuelven a analizar en subgrupos de las poblaciones tratadas y de control seleccionadas por similitud de un perfil polimórfico entre sí. El análisis adicional de datos es realizado en subgrupos de individuos que comparten un perfil polimórfico similar e indica si el tratamiento alcanza una importancia estadística en individuos que tienen ese perfil. Si el perfil contiene una o más formas polímórficas asociadas de alguna manera con la condición biológica de interés (por ejemplo, enfermedad), el tratamiento puede lograr la importancia estadística en las subpoblaciones, en donde no está en las poblaciones de tratamiento iniciales. Si el perfil no contiene dichas formas de ADN polímórficas, entonces el análisis adicional de datos también muestra una falta de importancia estadística. En este punto, se realiza otro análisis más en donde las subpoblaciones adicionales de individuos de poblaciones tratadas y de control se seleccionan por su similitud en un segundo perfil polimórfico. Ya que los individuos ya han sido caracterizados por su perfil polimórfico, el segundo análisis adicional puede ser realizado sin el trabajo experimental adicional en una forma altamente automatizada e iterativa. Otra vez, el segundo análisis indica si el tratamiento llega a una importancia estadística en los individuos que tienen similitud de perfil polimórfico en donde subpoblaciones son seleccionadas en el segundo análisis. Se pueden realizar rondas subsecuentes de análisis de acuerdo con los mismos principios sin trabajo experimental adicional. Una computadora convenientemente programada puede realizar miles, millones o billones de ciclos de análisis en donde diferentes subpoblaciones de individuos se seleccionan con base en la similitud en diferentes perfiles polimórf icos. La realización de múltiples pruebas típicamente requiere de una evaluación adicional del valor p en donde un resultado se declara como estadísticamente importante para controlar el régimen de resultados falsos positivos. Si después de análisis exhaustivo, la importancia estadística no es alcanzada por ningún perfil polimórfico, se puede concluir con confidencia incrementada que el procedimiento de tratamiento (por ejemplo, administración de un fármaco) que se está probando es improbable que sea efectivo en alguna porción importante de la población, y que otra investigación no es justificada. Sin embargo, si se logra la importancia estadística para un perfil de ADN polimórfico particular, por lo menos dos conclusiones se presentan a continuación. Primero, en el caso de una prueba clínica en un fármaco, en donde el fármaco es efectivo por lo menos en una porción de la población, y el desarrollo adicional del fármaco puede ser justificado. En segundo lugar, se conoce la porción de la población general en donde el fármaco es efectivo, esta porción siendo definida por un perfil polimórfico. Este perfil puede ser utilizado como un diagnóstico para identificar pacientes apropiados para el tratamiento, cuando se hace la decisión de tratar o una elección de tratamiento. Como un ejemplo del método de la invención, se puede realizar una prueba clínica como sigue: 1. Identificación y selección de polimorfismos. Un grupo de polimorfismos es identificado que permite la división de los grupos de pacientes en subgrupos. Estos polimorfismos se sabe que están involucrados en el parámetro de prueba (por ejemplo, el fenotipo o punto final) es decir que va a ser medido o que puede ser seleccionado en forma aleatoria. (En el último caso, los subgrupos genéticos pueden mostrar resultados idénticos con respecto al fenotipo de interés. Esto implica que el método de agrupación no reduce la variación en el punto final y la población puede volver a ser analizada como un todo. De esta manera, la estratificación utilizando datos genéticos no tiene un efecto dañino en el experimento o prueba, aún en casos en donde no tenga influencia en el resultado). 2. Genotif icación del grupo. Algunos o todos los marcadores son genotipif icados en todo el grupo de pacientes enlistados en la prueba clínica. Estos datos después son utilizados ya sea como criterios de inclusión/exclusión (ver 3a a continuación) o dividir el grupo en subgrupos (ver 3b más adelante). 3a. Inclusión/exclusión de pacientes utilizando información genética. Si algunos o todos los polimorfismos se sabe que tienen influencia en el parámetro de prueba que va a ser medido, puede ser apropiado excluir individuos cuando se sabe, por anterioridad, que presentarán un fenotipo o punto final particular. En el contexto de una prueba clínica, esto puede representar la exclusión de aquellos individuos que, por la información obtenida del grupo de polimorfismos examinados, no responderán a la terapia. 3b. División de la prueba clínica en subgrupos. Se utiliza una métrica para determinar la similitud genética de pacientes en el grupo. Esta información es utilizada para dividir la población en subgrupos que tengan mayor similitud genética que la que podría esperarse por oportunidad. Es decir, los subgrupos son genéticamente más homogéneos que un subgrupo aleatorio del mismo tamaño. El método preciso para medir la similitud dependerá del número y tipo de marcadores usados. En el caso más simple, el número de marcadores en donde dos individuos tienen los mismos alelos, puede ser usado para determinar la similitud. Muchas otras métricas más complejas pueden ser empleadas, por ejemplo, dando pesos extras a marcadores que se sabe que son particularmente informativos o que tienen influencia en el parámetro de prueba de interés. Al alterar el método para determinar la similitud genética, el investigador puede controlar el número de grupos que necesitan ser formados. Para n individuos, esto puede variar de 1 (la población completa) a n (cada individuo está en un subgrupo separado). Se consideran tanto razones prácticas como científicas para determinar cuantos subgrupos son óptimos para un experimento o prueba dada. Con los métodos de la invención, pueden surgir grupos, en el último momento. 4. Distribución de tratamiento dentro de los subgrupos genéticos. Cuando los pacientes han sido agrupados en subgrupos genéticos con base en la información del grupo de polimorfismo descrito en (1), varias estrategias están disponibles para conducir un estudio de tratamiento, tal como una prueba clínica. Un método es para aleatorizar el tratamiento y placebo dentro de cada subgrupo. Esto es similar al tratamiento de cada subgrupo como un experimento o prueba clínica separada. Los resultados de cada subgrupo pueden ser analizados en forma separada o pueden ser combinados y después analizados. Alternativamente, el tratamiento puede ser distribuido en forma no aleatoria dentro de los subgrupos. Por ejemplo, esto puede ser apropiado cuando los polimorfismos se sabe que están asociados con el resultado o punto final de interés. Por ejemplo, en el contexto de una prueba clínica, si existen solamente dos subgrupos y uno de los subgrupos se sabe que contienen un alto número de respondedores y los otros un bajo número de respondedores para el tratamiento, distribuyendo el tratamiento al primer grupo y el placebo al segundo grupo para reducir al mínimo la diferencia entre la respuesta para individuos tratados y no tratados. En forma inversa, la distribución del placebo al primer grupo y el tratamiento al segundo grupo muestra la diferencia mínima entre individuos tratados y no tratados. Cualquiera de estos aspectos que sea apropiado depende el objetivo exacto del experimento o prueba clínica. 5. Uso de la información de un experimento en el diseño de estudios subsecuentes. La utilidad de estratificar utilizando un grupo de polimorfismos genéticos puede volverse a analizar a través de experimentos sucesivos de pruebas clínicas. Los polimorfismos no informativos pueden ser desechados y agregarse nuevos polimorfismos para incrementar la utilizad del grupo como un todo. El uso de estos polimorfismos en estudios de tratamientos subsecuentes o pruebas clínicas conduce a una mayor reproducibilidad de resultados y la necesidad de enlistar muy pocos sujetos en estudios de replicación.
Al identificar y correlacionar polimorfismos para un efecto particular de un fármaco, y de esta manera al reducir la variación debido a factores genéticos, un médico puede aconsejar pruebas clínicas que involucran pocos sujetos, reducir los intervalos de confidencia, o incrementar la presión o poder discriminatorio de una prueba dada. El médico puede decidir cual de estos tres aspectos del diseño de prueba o análisis cambiar mientras se mantienen los otros dos constantes. Además de alterar la estadística de variación, la cual a su vez puede afectar el número de sujetos, precisión o poder de un estudio, la utilización del análisis de marcadores polimórficos en una población de prueba clínica en la forma descrita aquí permite, después del análisis, la identificación de subgrupos de marcadores polimórficos que pueden correlacionarse con cualquiera de una respuesta sana, respuesta indiferente o excesiva a un tratamiento, una respuesta no deseada o tóxica a un tratamiento, y puede identificar en virtud de la indiferencia, un subgrupo clínico de pacientes que definen una enfermedad "diferente". En resumen, un análisis genético post facto correlacionado con un fenotipo clínico específico, tal como sensibilidad o indiferencia al fármaco, puede revelar diferentes mecanismos etiológicos para la enfermedad que se está tratando. Especialmente es probable en el caso de diferencias étnicas entre pacientes en donde cada grupo étnico tiene una respuesta distinta a un tratamiento. Finalmente, el análisis de marcadores fenotípicos puede proporcionar penetración en la diversidad genética de los sujetos que se están tratando permitiendo que el médico altere la inscripción en una prueba de fármaco para adaptar más o menos diversidad genética como sea científicamente prudente.
III. Métodos A. Aspecto General En los métodos de la invención, los miembros de una población tratada y de control (no tratada) teniendo una condición biológica de interés (por ejemplo, una enfermedad) son caracterizados por el perfil polimórfico y un parámetro de prueba que es una medida de la condición biológica, asumiendo que los miembros no han sido todavía así caracterizados. Los miembros en la población tratada han sido (o están) tratados de acuerdo con un procedimiento de tratamiento, mientras que los miembros de la población de control han sido (o están) tratados de acuerdo con un procedimiento de control. Para reducir la variación total en la determinación de tratamiento o estudio, se selecciona subpoblaciones de las poblaciones tratadas y de control para la composición genética similar, de manera que los miembros en las dos poblaciones tienen perfiles polimórficos similares o idénticos. El perfil polimórfico de las subpoblaciones incluye una o más formas polimórficas. Típicamente, el perfil polimórfico incluye una pluralidad de formas polimórficas, generalmente por lo menos 5, en otros casos al menos 10, y otros casos más por lo menos 100, o cualquier número entre estos. Para reducir al mínimo la variación genética entre las subpoblaciones tratadas y de control, los perfiles polimórficos para los dos grupos se selecciona que sean similares. Esto significa que existe por lo menos una forma polimórfica común entre las dos subpoblaciones, aunque típicamente hay más. Los perfiles polimórficos para las dos subpoblaciones son típicamente por lo menos 10% idénticos, en algunos casos por lo menos 50% idénticos, y en otros casos más de 75% idénticos, en otros casos 90% idénticos o más, y en otros casos 100% idénticos. El análisis de marcadores fenotípicos puede proporcionar penetración adicional en la diversidad genética de los sujetos que están siendo tratados y permitir que el investigador altere los miembros en un estudio para adaptar una diversidad más o menos genética. Los polimorfismos pueden ser seleccionados en tres formas diferentes. Primero, pueden ser elegidos en forma aleatoria. En segundo lugar, solamente aquellos polimorfismos que se sabe que están implicados o que tienen sospecha de estar implicados en el fenotipo de interés (respuesta al tratamiento en el caso de una prueba clínica) pueden ser seleccionados. En tercer lugar, la selección de polimorfismo de ADN puede ser conducida identificando polimorfismo que residen en regiones del genoma que previamente han mostrado que alojan un enlace genético con el rasgo(s) observable bajo estudio. En el primer caso, es improbable que los polimorfismos aleatorios estén directamente involucrados en las respuestas. Sin embargo, pueden ser utilizados para determinar la similitud genética de pacientes y, por lo tanto, ser utilizados para formar subgrupos que sean más genéticamente homogéneos que los esperados. Esta estrategia es particularmente efectiva cuando un gran número de genes (usualmente desconocidos) está involucrado en la determinación de una respuesta del individuo al tratamiento. Si existen polimorfismos que se sabe que están involucrados en la respuesta o que estarán asociados con genes (posiblemente desconocidos) involucrados en la respuesta, entonces estos preferencialmente pueden ser usados para determinar subgrupos de pacientes. No todos los polimorfismos serán igualmente informativos o útiles para determinar subgrupos. Factores tales como las frecuencias de alelo, si el polimorfismo es de codificación o no codificación de proteína, si el polimorfismo está en desequilibrio de enlazamiento con otro polimorfismo ya en el perfil polimórfico utilizado, si el polimorfismo está en desequilibrio de enlazamiento con un gen o genes que se sabe que están involucrados en la respuesta al tratamiento, todos pueden influenciar la utilizad de un polimorfismo dado. Observar que en algunos casos, puede ser deseable proporcionar más peso a algunos polimorfismo que a otros en la formación de los subgrupos. Es decir, los polimorfismos que se sabe que están asociados con sensibilidad pueden ser más importantes (y por lo tanto proporcionar más peso) que los polimorfismos aleatorios. Los polimorfismos pueden estar en ADN, ARN o ADNc genómico. Aunque cualquier polimorfismo puede ser usado, aquellos de interés particular son los polimorfismos en genes que codifican proteínas que directa o indirectamente tienen influencia en una trayectoria bioquímica que está correlacionada con la condición biológica que está siendo medida u observada. De esta manera, por ejemplo, si un estudio implica determinar la eficacia de métodos para tratar pacientes que tienen niveles elevados de colesterol en la sangre, el perfil polimórfico puede ser diseñado para incluir polimorfismos localizados en genes que se sabe que están involucrados en la síntesis y metabolismo del colesterol. Una vez que se ha seleccionado las subpoblaciones apropiadas, d manera que las subpoblaciones tengan el nivel deseado de similitud en el perfil polimórfico, se hace una determinación si existe una correlación entre el perfil polimórfico y la eficacia (o falta de la misma, del método de tratamiento averiguando si hay una diferencia estadísticamente importante en un parámetro de prueba entre las subpoblaciones tratadas y de control, en donde el parámetro de prueba es una medida o es una representación de la eficacia del tratamiento para la condición biológica compartida por los miembros de la subpoblación. Un hallazgo de una diferencia estadísticamente importante, indica que las formas polimórficas en el perfil polimórfico de la subpoblación tratada se correlacionan con la condición biológica (por ejemplo, el perfil polimórfico está correlacionado con una enfermedad particular) y que el método de tratamiento bajo estudio es útil (o no benéfico) para el tratamiento de sujetos con la condición biológica. Como se observó anteriormente, tales correlaciones son particularmente importantes, por ejemplo, en pruebas clínicas sobre un fármaco. En algunos casos, la correlación identifica un grupo de marcadores genéticos asociados con la enfermedad y de esta manera tiene valor de diagnóstico. En otros casos, la correlación identifica marcadores que están asociados con un resultado de tratamiento positivo y de esta manera son importantes desde un punto de vista terapéutico. Una diferencia estadísticamente importante en un parámetro de prueba entre las subpobíaciones de tratamiento y de control puede ser determinada utilizando métodos estándares de análisis estadístico. Los métodos incluyen por ejemplo, el análisis de variación, relación logística, análisis en grupo o racimo, estadísticas no paramétricas, prueba de tabla de contingencia y otras pruebas estadísticas estándares.
B. Repetición del Método El perfil polimórfico de la subpoblación inicialmente seleccionada, por lo general no se correlaciona con una diferencia estadísticamente importante en el parámetro de prueba que es utilizado para medir la eficacia del tratamiento. En tales casos, et método puede ser repetido con diferentes subpobíaciones creadas utilizando una definición o medida alternativa de similitud genética, o dividiendo la población en más o menos subpoblaciones. Esto refleja el hecho de que raramente existirá una forma única para agrupar pacientes. En realidad, para un estudio con N individuos, por lo general posible es formar cualquier número de subpoblaciones a partir de 1 (toda la población) a N (cada individuo en su propia subpoblación). La repetición del proceso por lo general es una forma efectiva para detectar que polimorfismos dentro del perfil polimórfico son particularmente informativos con respecto al parámetro de prueba de interés. Una vez que queda definida la correlación, se pueden repetir ciclos adicionales utilizando, por ejemplo, un subgrupo de las formas polimórficas utilizadas en un ciclo anterior para determinar si el subgrupo puede mostrar una correspondencia aún mayor con el parámetro de prueba y de esta manera la eficacia de tratamiento. Típicamente, las formas polimórficas dentro de un perfil polimórfico desarrolladas con el tiempo representan una proporción mayor del componente genético de la variación. Sin embargo, estas formas polimórficas generalmente no contribuyen en forma igual. Algunas representan más variación que otras; los marcadores que no se correlacionan con diferencias en procedimientos de tratamiento y de control son desechados del análisis. El grupo de marcadores como una colección tiene un valor distinto del de los marcadores individuales. Esta colección ha fomentado el valor para entender la contribución genética de una condición biológica distinta de interés.
Los marcadores individuales pueden tener utilizad de diagnóstico, así como los de colección. El análisis de datos de tratamiento o de prueba que implica grupos y subgrupos, se puede manejar tanto para métodos estadísticos paramétricos como no paramétricos (métodos libres de distribución).
C. Grupos de Tratamiento y de Control Los miembros de los grupos de tratamiento y de control todos comparten alguna condición biológica sobre la cual está diseñado el estudio para determinar si el procedimiento de tratamiento tiene un efecto diferente estadísticamente importante con relación al procedimiento de control. Los miembros de los grupos de tratamiento y de control esencialmente pueden ser cualquier tipo de organismo incluyendo, por ejemplo, humanos, animales que no son seres humanos, plantas, bacterias y virus. En algunos casos, los miembros son mamíferos (por ejemplo, seres humanos, primates) que son parte de una prueba clínica que involucra la prueba de un agente farmacéutico o terapia de comportamiento, por ejemplo. El número de miembros en las subpoblaciones seleccionadas del grupo de tratamiento y de control es por lo menos 1, pero generalmente es más de 1, típicamente por lo menos 5, en otros casos por lo menos 10, y en otros casos más por lo menos 100 o más, aunque cualquier número de miembros entre estos números también pueda ser seleccionado.
En algunos casos, los miembros de la subpoblación se seleccionan no solamente por tener perfiles polimórficos similares, sino que también por tener otras características comunes. La selección en base a otros grupos además puede reducir la variación total más allá de aquella lograda reduciendo la variación atribuible a factores genéticos. Por lo tanto, por ejemplo, también se pueden seleccionar miembros de las subpoblaciones de tratamiento y de control que hayan sido similarmente expuestos a un factor ambiental. Ejemplos de tales factores ambientales incluyen, pero no se limitan a, exposición a varios agentes tales como radiación, químicos y fumadores de segunda mano; ubicación geográfica; y características de estudio de vida tales como patrones del dormir, dieta, y cantidad de ejercicio. En algunos casos, es útil conducir estudios utilizando subpoblaciones que no hayan sido similarmente expuestas a factores ambientales; tales estudios pueden servir como un contra punto en los estudios en donde las subpoblaciones han sido seleccionadas por la exposición similar a ciertos factores ambientales. Además de los factores ambientales, También se pueden seleccionar miembros que sean del mismo grupo étnico o que compartan un rasgo fenotípico común (por ejemplo, agudeza visual, altura, peso, anormalidad física). Cuando los métodos de la invención son utilizados en pruebas clínicas, típicamente los sujetos en los dos grupos no van a experimentar ningún otro tratamiento para su condición patológica. En otros casos, el estudio es diseñado de manera que los sujetos en los grupos tanto tratados como no tratados estén experimentando el mismo tratamiento alternativo.
D. Procedimientos de tratamiento y de control. Los tipos de tratamiento y control varía de acuerdo con la condición biológica a la cual está dirigida el tratamiento. Como se observó anteriormente, las condiciones biológicas pueden ser cualquier número de condiciones, tal como una condición patológica o simplemente una susceptibilidad biológica, por ejemplo. Una variedad de diferentes procedimientos puede ser realizada cuando la condición biológica es una condición patológica. En muchos casos, los procedimientos implican administrar un agente farmacéutico, incluyendo, por ejemplo: 1) administrar un agente farmacéutico a miembros de la población tratada y dar a los miembros, en la población de control, un placebo o nada, 2) dar a los miembros de la población tratada una gente farmacéutico (o combinación de agentes farmacéuticos) y un diferente agente farmacéutico (o combinación de agentes farmacéuticos) a los miembros de control; 3) proporciona una cantidad de un agente farmacéutico a la población tratada, y una cantidad diferente a la población de control, o 4) administrar un agente farmacéutico a las poblaciones de tratamiento y de control de acuerdo con diferentes programas. En lugar de administrar un agente farmacéutico, el procedimiento de tratamiento puede incluir algún tipo de terapia de comportamiento. Ejemplos de dicha terapia incluyen, pero no se limitan a, un régimen de dieta particular (por ejemplo, con un bajo contenido en grasas, con un bajo contenido de sodio, con alto contenido de proteína, o una dieta de calorías restringida), un régimen de ejercicio prescrito (por ejemplo, hacer ejercicio durante cierto período de tiempo durante cierto número de veces a la semana, realizar ejercicios de bajo impacto, hacer ejercicio para lograr un ritmo cardiaco objetivo, terapias que trabajan con ciertos grupos de músculos), meditación, yoga y técnicas de reducción de tensión. Claro que, el procedimiento de tratamiento puede incluir combinaciones de los procedimientos anteriores también. Los miembros en los grupos de control pueden no experimentar terapia para nada o pueden ser tratados en una forma opuesta (o pueden estar ya acoplados en comportamientos contrarios). Por ejemplo, si el grupo de tratamiento es colocado en una dieta de bajas calorías, los miembros en el grupo de control pueden ser colocados en una dieta con un alto contenido calórico, o simplemente pueden ser seleccionados para aquellos de dieta normal que ya es una dieta con un alto contenido de calorías y de esta manera no son alterados. El procedimiento de tratamiento también puede ser dirigido a una susceptibilidad biológica o resistencia en lugar de a una condición patológica. De esta manera, por ejemplo, en el caso de plantas, las plantas pueden ser tratadas con varios agentes agrícolas utilizados para afectar el crecimiento o salud de la planta (por ejemplo, fertilizante u otros estimulantes del crecimiento, herbicidas, insecticidas, y agentes de alteración del valor de pH) para determinar el efecto de tales agentes en varias susceptibilidades o resistencias de plantas (por ejemplo, susceptibilidad al daño por congelación o hielo y resistencia a herbicidas). De la misma manera, los u otros organismos pueden ser tratados también con otros agentes, por ejemplo vacunas, para determinar el efecto de los agentes en varias susceptibilidades o resistencias.
E. Utilidad La reducción en la variación lograda a través de los métodos de la invención permite que los investigadores selectivamente optimicen estudios de tratamiento, por ejemplo, a medida que la variación genética se reduce, el nivel de confidencia del análisis estadístico se incrementa. De esta manera, con los métodos de la invención, los investigadores pueden atribuir con más confidencia diferencias en efectos como los vistos entre los sujetos tratados y los sujetos de control para el tratamiento administrado, en lugar de ser consecuencias de diferencias genéticas entre pacientes. Además, las diferencias entre los grupos de control y de prueba pueden ser apreciadas más rápidamente. Esto permite que se realicen estudios más pequeños, y menos costosos que tienen el mismo poder estadístico como muchos estudios más grandes que no coinciden con la genética subyacente. Alternativamente, un estudio en donde los pacientes son igualados en factores genéticos, será capaz de detectar una diferencia mucho más pequeña en respuesta entre individuos tratados y no tratados que en un estudio del mismo tamaño que ignora factores genéticos. Esto permite estudios menos costosos, una determinación más rápida con respecto a la confiabilidad y el deseo de estudios de tratamiento adicionales, y finalmente, en el caso de pruebas clínicas en compuestos farmacéuticos, por ejemplo, permite un venta más rápida de los productos farmacéuticos. Los métodos también permiten el diseño de estudios de tratamiento más eficientes. Por ejemplo, una vez que los polimorfismos, que se correlacionan con condiciones patológicas, han sido identificados, los sujetos que tienen los polimorfismos así como la adición biológica pueden ser identificados y enlistados en estudios adicionales para analizar el efecto que otros tratamientos tienen sobre la condición biológica de interés. Ya que los sujetos que no responderán al tratamiento no son enlistados, muy pocos sujetos necesitan ser enlistados. Alternativamente, si un grupo de polimorfismos emerge que, cuando se igualan entre pacientes en un brazo de control y de prueba de un análisis, es altamente correlativo con la condición biológica que está estudiando, otras pruebas de la eficacia de un tratamiento pueden ser realizadas con menos pacientes sin considerar la velocidad o régimen de respuesta si la condición biológica que se está midiendo tiene un componente genético. Además, cuando los polimorfismos asociados con respuestas diferenciales son identificados, puede ser posible diseñar la dosis que un paciente específico recibe para que esta sea óptima dado su perfil polimórfico. Particularmente será importante cuando existan efectos laterales no deseados del tratamiento y es deseable dar la dosis eficaz mínima. Además, como se observó anteriormente, los métodos de tratamiento aquí descritos permiten la identificación de subgrupos de formas polimórficas que se correlacionan ya sea con una respuesta favorable o indiferencia al tratamiento, o una respuesta no deseada o tóxica a un tratamiento. Las pruebas clínicas sobre la eficacia de ciertos tratamientos físicos pueden identificad individuos que sean indiferentes al tratamiento y, al hacer esto, en algunos casos puede dar como resultado la identificación de un subgrupo clínico de pacientes que definen una enfermedad "diferente". Dichas correlaciones también pueden ser usadas como una herramienta de pronóstico y/o diagnóstico para identificar sujetos que tienen o que probablemente adquieren una enfermedad o seleccionar procedimientos de tratamiento apropiados para un sujeto con base en la composición genética particular del sujeto. La información obtenida de las pruebas clínicas en donde los pacientes son genotipificados para un grupo de marcadores genéticos polimórficos también puede ser utilizada en otras etapas del descubrimiento y desarrollo del fármaco. Por ejemplo, los genes que muestran estar asociados con respuesta a través del perfil polimórfico de los pacientes pueden ser aptos para intervención y, por lo tanto, representar objetivos potenciales del fármaco. Además, la identificación de tratamientos que muestran una baja eficiencia (es decir, muchos no respondedores) o que tienen altos regímenes de eventos adversos, puede ser identificada examinando el perfil de polimorfismo de pacientes en pruebas de fase temprana. Esta información después puede ser utilizada en la decisión de que si se toma un tratamiento antes en análisis grandes y más costosos. Por ejemplo, si está asociada una parte que no es respuesta con un perfil de polimorfismo que es común en la población general, puede ser inapropiado utilizar el tratamiento en una prueba más grande.
IV. Sistemas y Programas de Computadora La Figura 1 ilustra un sistema de computadora 10 representativo adecuado para implementar ciertos métodos de la presente invención. Como se muestra en la Figura 1, el sistema de computadora 10 típicamente incluye una barra colectora 12 que interconecta subsistemas principales tales como un procesador central 14, una memoria de sistema 16, un controlador de entrada/salida 18, un dispositivo tal como una impresora 23 a través de un puerto paralelo 22, una pantalla de representación 24 a través de un adaptador de representación 26, un puerto en serie 28, un teclado 30, una unidad de disco fijo 32 a través de la interfase de almacenamiento 34, y una unidad de disco flexible 33 que opera para recibir un disco flexible 33A. Muchos otros dispositivos pueden ser conectados, tal como un explorador 60 (scanner) a través del controlador de entrada/salida 18, un ratón 36 (mouse) conectado al puerto en serie 28, un reproductor de CD ROM 40 que opera para recibir un CD ROM 42, o una interfase de red 44. el código de fuente para implementar la presente invención puede ser operablemente dispuesto en la memoria de sistema 16 o almacenado en un medio de almacenamiento tal como un disco fijo 32 o un disco flexible 33A. Otros dispositivos o subsistemas pueden ser conectados en una forma similar. Todos los dispositivos mostrados en la Figura 1 no son requeridos para practicar la presente invención. Los dispositivos y subsistemas también pueden ser interconectados en diferentes formas de aquella mostrada en la Figura 1. La operación de un sistema de computadora 10, tal como aquel mostrado en la Figura 1, es fácilmente conocida en la técnica; de esta manera, las operaciones del sistema no serán descritas aquí con detalle. La Figura 2 es una ilustración de un sistema de computadora 10 representativo de la Figura 1, adecuado para realizar los métodos de la presente invención; sin embargo, la Figura 2 ilustra un ejemplo de muchos tipos o configuraciones de computadora posibles capaces de ser utilizados con la presente invención. Como se ilustra en la Figura 2, el sistema de computadora 10 puede incluir una pantalla de representación 24, un gabinete 20, un teclado 30, un explorador 60 (scanner), un ratón 36 (mouse). El ratón 36 y el teclado 30 son ejemplos de (dispositivos de entrada de usuario). Otros ejemplos de dispositivos de entrada de usuario incluyen, pero no se limitan a, una pantalla táctil, una pluma de luz, una bola de guía, guante de datos. El ratón 36 puede tener uno o más botones, tales como los botones 37. el gabinete 20 aloja componentes de computadora familiares, tal como una unidad de disco flexible 33, un procesador 14 y un medio de almacenamiento (ver Figura 1). Como se utiliza en esta especificación "medio de almacenamiento" incluye cualquier dispositivo de almacenamiento capaz de almacenar datos que pueden ser utilizados con relación a un sistema de computadora. Ejemplos de tales dispositivos incluyen, pero no se limitan a, unidades de disco, cinta magnética, memoria de estado sólido y memorias de burbujas. El gabinete 20 puede incluir hardware adicional, tal como una interfase de entrada/salida (E/S) para conectar el sistema de computadora 10 a dispositivos externos, tal como un explorador 60, almacenamiento externo, u otras computadoras o dispositivos periféricos adicionales. En algunos casos, el sistema 10 incluye una computadora que tiene un microprocesador 14 Pentinum® que corre el sistema operativo WINDOWS® Versión 3.1, o WINDOWS95® o WINNDOWS98® por Microsoft Corporation. Sin embargo, los métodos de la invención fácilmente pueden ser adaptados a otros sistemas operativos (por ejemplo, UNIX) sin apartarse del alcance de la presente invención. La Figura 3 es un diagrama de flujo de pasos simplificados en un método computarizado de la invención para determinar un procedimiento de tratamiento. En el paso 100, se proporciona una base de datos que contiene una pluralidad de designaciones para cada miembro de una población que tanto ha sido tratado de acuerdo con un procedimiento de tratamiento como un procedimiento de control y que comparte una condición biológica común (la base de datos se describe más adelante). Por lo tanto, la población incluye tanto poblaciones de tratamiento como de control. Un grupo de designaciones es para identificar cada miembro de las dos poblaciones. Existe también típicamente designaciones separadas para un perfil polimórfico y un parámetro de prueba para cada miembro de la población. La subpoblaciones de las poblaciones tratadas y de control se seleccionan en un paso de selección 102 por similitud en el perfil polimórfico. En el paso de determinación 104, se hace una determinación de que si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones. Una diferencia estadísticamente importante indica que el perfil polimórfico de las subpoblaciones se correlaciona con la condición biológica y efecto del tratamiento. Finalmente, en un paso de representación 106, una salida del resultado del paso de determinación es desplegada en un dispositivo de salida para facilitar el análisis. En un paso de decisión opcional 108, si no hay ninguna diferencia estadísticamente importante en el parámetro de prueba para las dos subpoblaciones, el paso de seleccionar 102, el paso de determinar 104 y el paso de desplegar 106 son repetidos utilizando subpoblaciones que tienen un perfil polimórfico que es diferente de aquel de los ciclos anteriores. Por lo tanto, el microprocesador en el sistema de computadora de la presente invención está operativamente dispuesto con relación a la memoria de sistema, la barra colectora de sistema y la entrada/salida, con el fin de realizar las funciones anteriores. Por ejemplo, el procesador proporciona o recibe datos que comprenden designaciones para cada miembro de las poblaciones tratadas y de control así como designaciones para un perfil polimórfico y un parámetro de prueba para cada miembro de las dos poblaciones. El microprocesador también operativamente está dispuesto para seleccionar una subpoblación de cada una de las poblaciones de tratamiento y de control para la similitud en perfil polimórfico, determinar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones y desplegar una salida del resultado obtenido. El programa de computadora de la invención incluye un código para proporcionar o recibir datos comprendiendo las varias designaciones para la identidad de los miembros de las poblaciones de prueba y de control, sus perfiles polimórficos y resultados de parámetro de prueba. El programa también incluye el código necesario para realizar los pasos de seleccionar, determinar y desplegar, establecidos anteriormente.
V. Métodos para Determinar Perfiles Polimórficos A. Preparación de Muestras Se detectaron polimorfismos en un ácido nucleico objetivo de un individuo que se esta analizando. Para en ensayo de ADN genómico, virtualmente cualquier muestra biológica (diferente a glóbulos rojos puros) es adecuada. Por ejemplo, las muestras de tejido convenientes incluyen sangre entera, semen, saliva, lágrimas, orina, materia fecal, sudor, bucal, piel y cabello. Para en ensayo de ADNc o ARNm, la muestra de tejido debe ser obtenida de un órgano en donde esté expresado el ácido nucleico objetivo. Por ejemplo, si el ácido nucleico objetivo es un ADNc que codifica al citocromo P450, el hígado es una fuente adecuada. Muchos de los métodos descritos más adelante requieren de modificación de ADN de las muestras objetivo. Esto puede lograrse a través de, por ejemplo, PCR. Ver, en general, Technology: Principies and Applications for DNA Amplification (ed. H. A. Erlich, Freeman Press, N Y, NY, 1992); PCR Protocols; A Guide to Methods and Applications (eds. Innís, y otros, Academic Press, San Diego, CA, 1990); Mattila, y otros, Nucleic Acids Res. 19:4967 (1991); Eckert y otros, PCR Methods and Applications 1:17 (1991); PCR (eds. McPherson, y otros, IRL Press, Oxford); y patente de E. U. A. 4,683,202 (cada una de las cuales incorporada aquí por referencia para todos los propósitos). Otros métodos de amplificación adecuados incluyen la reacción de cadena de ligasa (LCR), (ver Wu & Wallace, Genomics 4:560 (1989), Landergren y otros, Science 241:1077 (1988), amplificación de transcripción (Kwoh y otros, Proc. Nati. Acad. Sci. USA 86:1173 (1989)) y replicación de secuencia independiente (Guatelli, y otros, Proc. Nati. Acad. Sci. USA 87:1874 (1990)), y amplificación se secuencia basada en ácido nucleico (NASBA). Los dos últimos métodos de amplificación involucran reacciones isotérmicas basadas en la transcripción isotérmica, las cuales producen tanto ARN de estructura de cadena individual (ssARN) y ADN de estructura de cadena doble (dsADN) como los productos de amplificación en una relación de aproximadamente 30 o 100 a 1, respectivamente.
B. Detección de Polimorfismos en ADN Objetivo Existen dos tipos diferentes de análisis dependiendo de que si un polimorfismo en cuestión ya ha sido caracterizado. El primer tipo de análisis algunas veces es denominado como caracterización de novo. Este análisis compara secuencias objetivo en diferentes individuos para identificar puntos de variación, es decir, sitios polimórficos. El segundo tipo de análisis involucra determinar que forma(s) de un polimorfismo caracterizado está presente en individuos bajo prueba. Existe una variedad de procedimientos adecuados para determinar formas polimórficas y sus perfiles polimórficos, incluyendo, por ejemplo, los métodos que siguen. 1. Hibridación Específica de Alelo (ASH) La tecnología de hibridación específica de alelo se basa en el calentamiento al rápido enfriamiento estable de una sonda de oligonucleótido corta, de estructura de cadena individual a un ácido nucleico objetivo de estructura de cadena individual completamente complementaria. La hibridación es detectada a partir de una marca radioactiva o no radiactiva en la sonda. Para cada polimorfismo, dos o más diferentes sondas son diseñadas para que tengan secuencias de ADN idénticas, excepto en los nucleótidos polimórficos. Cada sonda tiene la exacta homología con una secuencia de alelo, de manera que el complemento de sondas puede distinguir todas las secuencias de alelo alternativas. Con el diseño de sonda apropiado y condiciones severas, una desigualdad de base individual entre la sonda y el ADN objetivo evita la hibridación. De esta manera, solamente una de las sondas alternativas hibridiza una sonda objetivo que es homocigoto para un alelo (un alelo es identificado por la homología de ADN entre la sonda y el objetivo). Las muestras que contienen ADN que es heterocigoto para dos alelos hibridizan a las dos sondas alternativas. Los detalles con respecto a la hibridación ASH se describen por, por ejemplo, Saiki y otros, Nature 324:163-166 (1986); Dattagupta, EP 235,726; Saiki, WO 89/11548; y patente de E. U. A. 5,468,613. 2. Polimorfismos de Longitud de Fragmento de Restricción (RFLP) La frase "polimorfismo de longitud de fragmento de restricción" o "RFLP" se refiere a diferencias heredadas en sitios de enzima de restricción (por ejemplo, causados por cambios de base en el sitio objetivo), o condiciones o eliminaciones en la región flanqueada por el sitio de enzima de restricción que da como resultado diferencias en las longitudes de los fragmentos producidos por escisión con una enzima de restricción importante o pertinente. Una mutación de punto conduce tanto a fragmentos más largos si la mutación está dentro del sitio de restricción como a fragmentos más cortos si la mutación crea un sitio de restricción. Las adiciones y elementos de transposón conducen a fragmentos más largos y las eliminaciones conducen a fragmentos más cortos. Un polimorfismo de longitud de fragmento de restricción, RFLP, puede ser utilizado como un marcados genético en la determinación de segregación de alelos con fenotipos cuantitativos. En una modalidad de la invención, los fragmentos de restricción están enlazados a rasgos fenotípicos específicos. Más específicamente, la presencia de un fragmento de restricción particular puede ser usada para pronosticar la frecuencia de un rasgo fenotípico específico. 3. Secuenciación Directa Los polimorfismos pueden ser analizados directamente utilizando el método de terminación de cadena didesoxi tradicional o el método de Maxam-Gilbert (ver, Sambrook y otros, Molecular Cloning, A Laboratory Manual (2nd. Ed. CSHP, New York 1989); y Zyskind y otros, Recombínant DNA Laboratory Manual, (Acad. Press, (1988)). Otros métodos de secuenciación de ácido nucleico incluyendo, pero no limitándose a, técnicas a base de fluorescencia (patente de E. U. A. 5,171,534), espectroscopia de masa (patente de E. U. A. 5,174,862) y electroforesis capilar (patente de E. U. A. 5,728,282) también pueden ser utilizados. 4. Oligonucleótidos de Arrastre-Marcación para Electroforesis Los oligonucleótidos que tienen pociones químicas adicionales que ocasionan movilidades diferenciales en un sistema de separación electroforético pueden ser utilizados para analizar polimorfismos. La adición de una especie molecular incrementa el peso molecular aparente de una pieza de ADN amplificado, a un ADN que tenga solamente un polimorfismo de nucleótido individual presente. Las especies agregadas o marcas o etiquetas de arrastre, pueden ser anexadas covalente o no covalentemente al ácido nucleico, ya sea antes o después de la marcación (para la visualización de la banda electroforética). Cualquier carga asociada con las especies agregadas es bloqueada o neutralizada, de manera que la movilidad del ácido nucleico permanece dependiente del tamaño y no de la carga. Cualquier número de diferentes pociones puede ser anexado a un ácido nucleico para formar una pluralidad de productos de amplificación de tamaños diferentes. Ejemplos de dichas porciones incluyen, pero no se limitan a, monómeros de fosfato, acrilamida y polipéptido. De esta manera, por ejemplo, antes de la amplificación de un estiramiento polimórfico de ADN, las unidades de monómero de fosfato pueden ser unidas a cada monómero de nucleótido que va a ser utilizado en la reacción de PCR. Por ejemplo, asumir que un monómero de fosfato es agregado a dATP; dos monómeros de fosfato son agregados a dCTP; tres monómeros de fosfato son agregados a dGTP; y cuatro monómeros de fosfato son agregados a dTTP. Los ácidos nucleicos polimórficos amplificados resultantes contienen diferentes cantidades de monómeros de fosfato dependiendo del contenido de nucleótido. Por lo tanto, aunque los productos amplificados tienen los mismos números de pares de bases, las diferentes formas polimórficas, sin embargo, pueden ser separadas por tamaño en un gel electroforético debido a las diferencias en el contenido de monómero de fosfato. En una variación de este aspecto general, las unidades de monómero son agregadas después de la amplificación a nucleótidos específicos o a ácidos nucleicos no amplificados antes de la separación con base en el tamaño (por ejemplo, a través de electroforesis capilar). 5. Marcadores de Isozima Otras modalidades incluyen identificación de marcadores de isozima e hibridación específica de alelo. Las isozimas son un grupo de enzimas que catalizan la misma reacción, pero varían en propiedades físicas dando como resultado diferencias en secuencia de aminoácido (y por lo tanto, la secuencia de ácido nucleico). Algunas isozimas son enzimas multiméricas que contienen subunidades ligeramente diferentes. Otras isozimas son ya sea multiméricas o monoméricas, pero han sido separadas de la proenzima en sitios diferentes en la secuencia de aminoácido. La variación de ácido nucleico de isozimas puede ser determinada hibndizando iniciadores que flanquean una porción variable de una secuencia de ácido nucleico de isozima para activar ácidos nucleicos contenidos en una muestra obtenida de un organismo. La región variable es amplificada y secuenciada. A partir de la secuencia, las diferentes isozimas son determinadas y enlazadas a características fenotípicas. 6. Secuencias Variables Amplificadas Las secuencias variables amplificadas del genoma y sondas de ácido nucleico complementarias también pueden ser utilizadas como marcadores polimórficos. La frase "secuencias variables amplificadas" se refiere a secuencias amplificadas del genoma que exhiben una alta variabilidad de residuo de ácido nucleico entre miembros de la misma especie. Todos los organismos tienen secuencias genómicas variables y cada organismo (con la excepción de un clon) tiene un diferente grupo de secuencias variables. La presencia de una secuencia variable específica puede ser utilizada para pronosticar rasgos fenotípicos. Una secuencia variable de ADN puede ser amplificada (por ejemplo, utilizando las técnicas de amplificación listadas anteriormente) a través de la extensión dependiente de plantilla de los iniciadores que hibridizan para flanquear regiones del ADN obtenido de un sujeto. Los productos amplificados después pueden ser secuenciados. 7. Iniciadores Específicos de Alelo e Hibridación Un iniciador específico de alelo hibridiza un sitio en el ADN objetivo que traslapa un polimorfismo y solamente la amplificación de iniciadores de una forma alélica a la cual el iniciador exhibe una complementariedad perfecta. Este iniciador es utilizado junto con un segundo iniciador que hibridiza en un sitio distante. La amplificación precede de los dos iniciadores y produce un producto amplificado detectable que puede ser caracterizado para la forma alélica particular presente en una muestra de ácido nucleico. Ver, por ejemplo, Gibbs, Nucleic Acid Res. 17:2427-2448 (1989) y WO 93/22456. 8. Análisis de Polimorfismo de Conformación de Estructura de Cadena Individual Los alelos de secuencias objetivo pueden ser diferenciados utilizando el análisis de polimorfismo de conformación de estructura de cadena individual, el cual identifica diferencias de base a través de la alteración en migración electroforética de productos de PCR de estructura de cadena individual (ver, por ejemplo, Orita, y otros, Proc. Nati. Acad. Sci. USA 86:2766-2770 (1989). Típicamente, los productos de PCR amplificados son desnaturalizados (por ejemplo, de acuerdo con métodos químicos o térmicos conocidos) para formar productos de amplificación de estructura de cadena individual que pueden volver a plegarse o formar estructuras secundarias, dependiendo en parte de la secuencia de base del producto. Las diferentes movilidades electroforéticas de los productos de amplificación de estructura de cadena individual pueden relacionarse con la diferencia de secuencia de base entre alelos de secuencias objetivo. 9. Replicación de Secuencia Auto-Mantenida Los polimorfismos también pueden ser identificados por replicación de secuencia auto-mantenida. En este aspecto, las secuencias de ácido nucleico objetivo son amplificadas (replicadas) exponencialmente in vitro bajo condiciones isotérmicas utilizando tres actividades enzimáticas involucradas en la replicación retroviral: (1) transcriptasa inversa, (s) RNase H, y (3) una polimerasa de ARN dependiente de ADN (Guatelli, y otros, Nati. Acad. Sci. USA 87:1874 (1990)). Al simular la estrategia retroviral de la replicación de ARN a través de intermediarios de ADNc, se acumulan copias de ADNc y ARN del objetivo original. 10. Polimorfismos de Longitud de Fragmento Arbitrario (AFLP) Los polimorfismos de longitud de fragmento arbitrario (AFLP) también pueden ser usados como polimorfismos (Vos y otros, Nucí. Acids Res. 23:4407 (1995)). La frase "polimorfismo de longitud de Fragmento Arbitrario" se refiere a fragmentos de restricción seleccionados que son amplificados antes o después de la escisión a través de una endonucleasa de restricción. El paso de amplificación permite una detección más fácil de fragmentos de restricción específicos según comparado con la determinación del tamaño de todos los fragmentos de restricción y comparando los tamaños con un control conocido. El polimorfismo de longitud de fragmento arbitrario (AFLP) permite la detección de un gran número de marcadores polimórficos (ver, supra) y ha sido utilizado para la formación de mapas genéticos de plantas (Becker y otros, Mol. Gen. Genet. 249:65 (1995); y Meksem y otros, Mol. Gen. Genet. 249:74 (1995)) y para distinguir entre especies bacterianas estrechamente relacionadas (Huys y otros, Int'l J. Systematic Bacteriol. 46:572 (1996)). 11. Repeticiones de Secuencias Simples (SSR) Los métodos de repeticiones de secuencias simples, SSR, se basan en altos niveles de repeticiones en tándem de di, tri o tetra-nucleótido dentro de un genoma. Las repeticiones de dinucleótido han sido reportadas que ocurren en el genoma humano tantas veces como 50,000 veces con n variando de 10 a 60 (Jacob, y otros, Cell 67:213 (1991)). Los datos de las SSR son generados hibridizando iniciadores a regiones conservadas del genoma que flanquea la región de SSR. Las repeticiones de dinucleótido entre los iniciadores son amplificadas a través de PCR. Las secuencias amplificadas resultantes después son electroforeadas para determinar el tamaño, y por lo tanto el número de repeticiones de di, tri y tetra-nucleótido. 12. Electroforesis en Gel de Gradiente de Desnaturalización Los productos de amplificación generados utilizando la reacción de cadena de polimerasa pueden ser analizados a través del uso de electroforesis en gel de gradiente de desnaturalización. Diferentes alelos son identificados con base en las diferentes propiedades de fusión dependientes de secuencia y migración electroforé-tica de ADN en solución. Erich, ed. PCR Technology, Principies and Applications for DNA Amplification, (W.H. Freeman y Co, New York, 1992, Capítulo 7. 13. Métodos de Extensión de Base Individual Los polimorfismos también pueden ser detectados a través de extensión de base individual. Un iniciador es diseñado para hibridizar a una secuencia objetivo, de manera que el extremo 3' del iniciador inmediatamente topa pero no traslapa un sitio polimórfico. La secuencia objetivo después se pone en contacto con el iniciador, y por lo menos un nucleótido (típicamente marcado), que es complementario a la base que ocupa el sitio polimórfico en una forma alélica. Si esa forma alélica está presente, entonces el iniciador es extendido y queda marcado. En algunos métodos, los sitios polimórficos bialélicos son analizados incluyendo dos didesoxinucleótidos diferencialmente marcados, respectivamente complementarios a bases que ocupan el sitio polimórfico en las primera y segunda formas alélicas del objetivo. El análisis de la marca presente en el iniciador extendido indica si una o ambas de las formas alélicas están presentes en una muestra objetivo.
C. Clasificación de Alta Producción En algunos casos, la identificación de polimorfismos se realiza a través de clasificación de alta producción. En una modalidad, la clasificación de alta producción implica proporcionar una colección de formas polimórficas del ADN, incluyendo RFLPs, AFLPs, isozimas, alelos específicos y secuencias variables, incluyendo SSR. Tales "colecciones" después son clasificadas contra ADN genómico de los sujetos en el estudio de tratamiento. Una vez que los alelos polimórficos de un sujeto han sido identificados, se puede determinar un enlace entre el ADN polimórfico y el efecto de tratamiento a través de asociaciones estadísticas. Dicha clasificación de alta producción puede ser realizada en muchos formatos diferentes. Por ejemplo, para aquellos métodos que implican reacciones de hibridación, la hibridación puede realizarse en un formato de 96, 324 o 1024 cavidades o en una matriz sobre una oblea de silicio. En un formato a base de cavidades, se utiliza un aparato de tinción por puntos para depositar muestras de el ADN genómico fragmentado y desnaturalizado sobre una membrana de nylon o nitroceiulosa. Después del entrelazamiento, del ácido nucleico a la membrana, ya sea a través de la exposición a luz ultravioleta si se utilizan membranas de nylon o a través de calor si se utiliza nitroceiulosa, la membrana es incubada con una sonda de hibridación marcada. Las membranas son lavadas extensivamente para remover las sondas no hibridizadas y se determina la presencia de la marca en la sonda.
Las marcas son incorporadas en las sondas de ácido nucleico a través de cualquier número de métodos bien conocidos por aquellos expertos en la técnica. En algunos casos, una marca es simultáneamente incorporada durante el procedimiento de amplificación en la propagación de las sondas de ácido nucleico. De esta manera, por ejemplo, la reacción de cadena de polimerasa (PCR) con iniciadores marcados o nucleótidos marcados proporciona un producto de amplificación marcado. En otra modalidad, la amplificación de transcripción utilizando un nucleótido marcado (por ejemplo, UTP y/o CTP marcados con fluoresceína) incorpora una marca en las sondas de ácido nucleico transcritas. Las marcas detectables adecuadas para usarse en la presente invención incluyen cualquier composición detectable a través de medios espectroscópicos, radioisotópico, fotoquímico, bioquímico, inmunoquímico, eléctrico, óptico o químico. Las marcas útiles en la presente invención incluyen biotina para tinción con conjugado de estreptavidina marcada, perlas magnéticas, colorantes fluorescentes (por ejemplo, fluoresceína, rojo Texas, rodamina, proteína fluorescente verde, y similares), radiomarcas (por ejemplo, 3H, 125l, 35S, 14C, o 32P), enzimas (por ejemplo, peroxidasa de rábano, fosfatase alcalina y otros comúnmente utilizados en un ensayo de ELISA), y marcas colorimétricas tales como oro coloidal o perlas de vidrio o plástico de color (por ejemplo, poliestireno, polipropileno, látex, etc.). Las patentes que enseñan el uso de tales marcas incluyen las patentes de E. U. A. Nos. 3,817,837; 3,850,752; 3,939,350; 3,996,345; 4,277,437; 4,275,149; y 4,366,241. Los métodos para detectar dichas marcas también son conocidos por aquellos expertos en la técnica. De esta manera, por ejemplo, las radiomarcas son detectadas utilizando una película fotográfica o contadores de cintilación y los marcadores fluorescentes son detectados utilizando un fotodetector para detectar la luz emitida. Las marcas enzimáticas típicamente son detectadas proporcionando a la enzima un substrato y detectando el producto de reacción producido por la acción de la enzima en el substrato, y las marcas colorimétricas son detectadas simplemente visualizando la marca de color. Se ha desarrollado un número de sistemas robóticos bien conocidos para la clasificación de alta producción, particularmente en un formato de 96 cavidades). Estos sistemas incluyen estaciones de trabajo automatizadas como el aparato de síntesis automático desarrollado por Takeda Chemical Industries, LTD. (Osaka, Japón), y muchos sistemas robóticos que utilizan brazos robóticos (Zymate II, Zymark Corporation, Hopkinton, Mass; Orea, Hewlett-Packard, Palo Alto, Calif.) que simulan las operaciones sintéticas manuales realizadas por un químico. Cualquiera de los dispositivos anteriores es adecuado para utilizarse con la presente invención. La naturaleza e implementación a las modificaciones a estos dispositivos (si hay alguna), de manera que puedan operar como se discute en la presente, serán evidentes para aquellos expertos en la técnica. Además, los sistemas de clasificación de alta producción por sí mismos están comercialmente disponibles (ver, por ejemplo, Zymark Corp., Hopkinton, MA; Air Technical Industries, Mentor, OH; Beckman Instruments, Inc. Fullerton, CA; Precisión Systems, Inc. Natick, MA, etc.). Estos sistemas típicamente automatizan procedimientos completos incluyendo todas las muestras y aplicación de reactivo por pipeta, surtido de líquido, incubaciones durante un tiempo, y lecturas finales de la microplaca o membrana en el detector(s) apropiado para el ensayo. Estos sistemas conf igurables proporcionan una alta producción y un rápido inicio, así como un alto grado de flexibilidad y calidad. Los fabricantes de tales sistemas proporcionan protocolos detallados de varias altas producciones.
D. Disposiciones de Fase Sólida Las formas poliméricas del ADN también pueden ser identificadas a través de hibridación a disposiciones de ácido nucleico, algunos ejemplos de las cuales se describen por WO 95/11995 (incorporada aquí por referencia en su totalidad para todos los propósitos). En una variación de la invención, las disposiciones de fase sólida son adaptadas para la rápida y específica detección de múltiples ácidos nucleicos polimórficos. Típicamente, una sonda de ácido nucleico es enlazada a un soporte sólido y un ácido nucleico objetivo es hibridizado a la sonda. Ya sea la sonda, o el objetivo, o ambos, pueden ser marcados, típicamente con un fluoróforo. Si el objetivo es marcado, la hibridación se detecta detectando fluorescencia unida. Si la sonda es marcada, la hibridación típicamente es detectada extinguiendo la marca a través del ácido nucleico unido. Si tanto la sonda como el objetivo están marcados, la detección de la hibridación típicamente se realiza verificando un desplazamiento de color que resulta de la cercanía de las dos marcas unidas. La construcción y el uso de disposiciones de ácido nucleico de fase sólida para detectar ácidos nucleicos objetivo ha sido descrita extensamente en la literatura. Ver, Fodor y otros, Science 251:767 (1991); Sheldon y otros, Clin. Chem. 39(4):718 (1993); Kozal y otros, Nature Medicine 2(7):753 (1996) y Hubbell, patente de E. U. A. No 5,571,639. Ver también, Pinkel y otros, PCT/US95/16155 (WO 96/17958). Además de ser capaz de diseñar, construir y utilizar disposiciones de sonda utilizando técnicas disponibles, un experto en la técnica también puede ordenar disposiciones hechas para el cliente y dispositivos de lectura de disposición de fabricantes que se especializan en la fabricación de disposiciones. Por ejemplo, Affymetrix en Santa Clara CA fabrica disposiciones de DNA VLSIP™.
Se apreciará que el diseño de sonda se ve influenciado por la aplicación pretendida. Por ejemplo, cuando varias interacciones de sonda-objetivo van a ser detectadas en un solo ensayo, por ejemplo, en una oblea de ADN individual, es deseable tener temperaturas de fusión similares para todas las sondas. Por consiguiente, las longitudes de las sondas son ajustadas de manera que las temperaturas de fusión para todas las sondas en la disposición sean estrechamente similares (las longitudes diferentes para sondas diferentes pueden ser necesarias para lograr una Tm particular, en donde diferentes sondas tienen diferentes contenidos GC). Aunque la temperatura de fusión es una consideración principal en el diseño de sonda, otros factores son opcionalmente utilizados para ajusfar adicionalmente la construcción de sonda.
E. Electroforesis de Placa Capilar y de Microcanales Como se describió anteriormente, ciertos métodos para identificar polimorfismos involucran separaciones a base de tamaño (por ejemplo, RFLP y SSR). En tales casos, se puede utilizar electroforesis capilar para analizar el polimorfismo. Tales técnicas se describen con detalle en las patentes de E. U. A. Nos. 5,535,123 y 5,728,282, las cuales se incorporan aquí por referencia. En resumen, los tubos de electroforesis capilar son llenados con la matriz de separación. La matriz de separación contiene hidroxietilcelulosa, urea y opcionalmente formamida. Las muestras de RFLP o SSR son cargadas en el tubo capilar y electroforeadas. Debido a la pequeña cantidad de muestra y la matriz de separación requerida por la electroforesis capilar, las veces de operación son muy cortas. Los tamaños moleculares y, por lo tanto, el número de nucleótidos presentes en la muestra de ácido nucleico son determinados a través de las técnicas descritas aquí. La electroforesis también puede ser realizada en placas de microcanales. Estas placas tienen canales con un diámetro menor que 100 µ atacados y colocados sobre un substrato sólido. En virtud de sus dimensiones más pequeñas, permiten separaciones aún más rápidas de ácidos nucleicos en una matriz de separación. Al utilizar estas placas atacadas, se pueden evaluar muestras con un formato de alta producción. En otro formato de alta producción, múltiples tubos de capilares son colocados en un aparato de electroforesis capilar. Las muestras son cargadas en los tubos y la electroforesis de las muestras se corre simultáneamente. Ver, por ejemplo Mathies & Huang, Nature 359:167 (1992). Ya que la matriz de separación es de baja viscosidad, después de cada operación, los tubos capilares pueden ser vaciados y reutilizados. Los siguientes ejemplos son ofrecidos para ilustrar más aspectos específicos de la presente invención y no se deben interpretar como limitantes del alcance de la presente invención.
EJEMPLO 1 Efecto de la Igualdad Genética en el Tamaño de Muestra v Confidencia La invención puede ser ilustrada a través del ejemplo de estudiar colesterol en suero y los efectos que los fármacos pueden tener en esta condición biológica. Se ha establecido que hasta un 80% de la variación en el colesterol en el suero puede ser atribuida a la genética (ver, por ejemplo, R. A. King, J. I. Rotter & A. G. Motulsky, The Genetic Basis of Common Disease, Oxford University Press, 1992). La utilidad de pacientes igualados en los sitios genéticos es que la confidencia, tamaño de muestra o energía de discriminación de un estudio dado puede ser favorablemente afectada por la igualación genética. Por ejemplo, si se requiere que un estudio tenga un 80% de potencia para detectar una diferencia de 20 mg/dl al nivel de 5% y za = 1.645 (representando el valor de la distribución normal estándar que es excedida en 5% de los casos) y zb = 0.842 (el valor de la distribución normal estándar que es excedida en un 80% de los casos) el tamaño de muestra mínimo puede ser calculado como sigue: za<-qnorm (al)[.95@1.645] za<-qnorm (be)[.8@.842] Si la contribución genética a la variación de una variable de x es de 80% y la variación es de 1600 (la desviación estándar al cuadrado para colesterol) entonces el tamaño de muestra es: 2 x (za + zb)2 x variación (diferencia)2 o 2 x (2.49)2 x 1600 = ?600? (20)2 [400] o 50 De esta manera, 50 pacientes por brazo del estudio son necesarios para ver una diferencia de colesterol de 20 mg/dl. Si los pacientes son genéticamente igualados (es decir, se elimina el 80% de contribución a la variación), el número de pacientes para cada brazo se reduce a 10. [1600 x .80% = 1280, 1600- 1280 = 320; 320 400 = .8] La energía de la igualación genética puede ser realizada en otras dos formas. Por ejemplo, utilizando el mismo número de pacientes (50) en cada brazo, con igualación genética de la diferencia que puede ser resulta con la misma energía que cae de 20 a 8.8. Asimismo, la energía del estudio se incrementa de .8 a más de 0.99, asumiendo igualación genética y una diferencia de 20. Si la igualación genética no puede ser lograda totalmente, cierto grado de igualdad puede seguir teniendo un impacto favorable en tales estudios. Esto se ilustra en el Cuadro 1 a continuación.
CUADRO 1 % de Similitud Reducción de Variación n = Pacientes Variación Nueva 10 128 1472 45 20 256 1344 41 30 384 1216 37 40 512 1088 33 50 640 960 29 EJEMPLO 2 Uso del Análisis Genético para Reducir el Tamaño de Muestra Necesario en Pruebas Clínicas El siguiente ejemplo es ilustrativo del método para identificar factores genéticos subyacentes que tienen influencia en la respuesta y al tratamiento y el uso de esta información en el diseño de pruebas clínicas.
A. Subpoblaciones Genéticas En el caso de dos subpoblaciones genéticas distintas A y B, asociadas con una baja respuesta y una alta respuesta al tratamiento, respectivamente, la respuesta de individuos tratados de la primera subpoblación, A, tiene la media µ? y la variación s2?· En la segunda subpoblación, la media y la variación de respuesta son dadas por µ? y s2?, respectivamente. No se hace ninguna suposición con respecto a la forma de cualquier distribución (es decir, no tienen que ser normales). En los individuos de control quienes no recibieron el tratamiento (más bien recibieron un placebo), la media y la variación de respuesta es dada por (µ?, s2?) y (p_¡. s2ß) para poblaciones A y B, respectivamente. Cuando una muestra es tomada de una de estas poblaciones, la distribución de la media de la muestra es normalmente distribuida. Por ejemplo, si una muestra de tamaño N de individuos tratados es extraída de la subpoblación A, la media de la muestra tiene la distribución ??G??[µ?, s2?/?].
Si el antecedente genético de las subpoblaciones es ignorado, tanto las poblaciones tratadas (caso) como no tratadas (de control) incluyen una mezcla de individuos muestreados de las dos distribuciones. Cuando la probabilidad de un individuo que es elegido de la subpoblación genética A es p, y la probabilidad de un individuo que es elegido de la subpoblación genética B es q = 1-p, la distribución de la respuesta media de una muestra seleccionada de las dos poblaciones puede ser descrita. Por ejemplo, cuando N es el tamaño de población total y (XLX2 x N) es un grupo de variables aleatorias, cada una describiendo un individuo en la muestra, la espera de la respuesta media en la muestra es dada por: en donde ?[?|] = µ? con la probabilidad p y E[X¡] = b con la probabilidad q = 1-p. De esta manera, la media de la distribución de la media muestra es: E[x] = pMA + qMe- (2) La variación de la respuesta media en tal caso depende tanto de las variaciones de cada una de las dos distribuciones A y B como de la diferencia entre las medias de estas distribuciones. Esta variación puede ser esperada en términos de la suma de las variaciones de los individuos, Cuando una variable aleatoria Y es definida de manera que cuando Y=0, s2?, la espera de esta variación es entonces, E[V[x,|Y]]= ?s2? + ?s2?. (4) Además, E[X¡|Y = 0] = Ma y E[x¡| Y= 1 ] = µ?, por lo tanto, V[E[x,|Y]] = pM2A + qM2B-(PMA + qMB)2 = ??(µ?-µ?)2. (5) Por la teoría estándar, V[x¡] = E[V[x¡| Y]]+V[E[x¡| Y]] entonces, V[x]= Po2A + qo2 + pg(UA-uR¾2 N (6) De manera importante, V[x]>Min[o2A/N , s2?/?]. Es decir, la variación cuando las subpoblaciones son ignoradas siempre es mayor que la variación de una de las subpoblaciones. Esto intuitivamente puede ser visto a partir de la forma de la ecuación 6. La variación es la suma cargada de las dos variaciones específicas de población (s2?, s2?) más un término representando la diferencia entre las dos medias de población (µ?-µ?)2. De esta manera, la variación consiste tanto dentro de la variación de población como entre la variación de población . La distribución de la respuesta media de la muestra (cuando la relación de los individuos de las subpoblaciones A y B es p:q) es normal (a través del Teorema de Limite Central) y tiene la media y variación (PUA + OUR, ?s2? + ?s2?+?a(??-µ?)2). N B. Información de Marcador La determinación de cual de las dos subpoblaciones genéticas (A y B) pertenece a un individuo, puede hacerse examinando marcadores genéticos. Genéticamente, entre más marcadores son genotipif icados, mayor es la probabilidad de asignar un individuo al grupo correcto. En ausencia de información genética, una muestra representa una muestra aleatoria de las dos poblaciones con la relación p:q de individuos de las subpoblaciones A y B. Si dos antecedentes genéticos tienen la misma frecuencia, entonces p = q = 0.5 y la distribución de la media de la muestra se caracteriza como: En algunos casos, todos los individuos de la subpoblación son genotificados para k igualmente como marcadores informativos. Esto es algunas veces el caso cuando los marcadores son seleccionados en forma aleatoria (es decir, si no se sabe nada con respecto a los genes involucrados en la sensibilidad). Usualmente, los marcadores adicionales proporcionarán información reducida (es decir, aunque el marcador k + 1 th incrementa la probabilidad de asignar correctamente un individuo a una subpoblación, proporciona menos información que el marcador k th); esto necesariamente no tiene que ser el caso, pero por lo general es el caso. Por ejemplo, si existe un conocimiento anterior de los genes involucrados en la respuesta, éstos son típicamente examinados primero. Alternativamente, si no hay información con respecto a la genética subyacente de la respuesta, entonces la igualación genética se basa en la conexidad (es decir, el grado total de similitud genética en el genoma) y, por lo tanto, los primeros marcadores serán altamente informativos, disminuyéndose la información de cada marcador adicional. Considerar un modelo simple, en donde la probabilidad de asignar a un individuo la subpoblación genética correcta cuando los marcadores k han sido genotificados, es dada por: P[correcta|k]= 1_(+_k_) 2 k+1 (8) Ya que k tiende al infinito, la probabilidad de corregir la asignación asíntota en 1. Esta probabilidad puede ser usada en las ecuaciones anteriores para determinar la mezcla de la población muestreada. Para k ? 8, p- 1, en las ecuaciones 2 y 6, de manera que la media y la variación de la media de muestra es dada por (µ?, s2?/?) para la población A y (µ?, s2?/?) para la población B (utilizando la información para fijar p = 0 y así seleccionar no respondedores) según se espera.
C. Potencia de la Prueba Clínica con Igualación Genética En una prueba clínica que consiste de un grupo de pacientes, la mitad de estos se les da el tratamiento y a la otra mitad se les da un placebo, en donde las dos subpoblaciones genéticas son equi-frecuentes, entonces la respuesta en la muestra es normalmente distribuida con la media y la variación dada por (p A + q pB, o2A + qg2R + q(uA-UR)2) N (9) En la muestra de control (placebo), la distribución de la media otra vez es normal con la media y la variación: (ppA + qpB, a2A + qe2R + q(UA-UR)2) N (10) Por simpleza, las dos muestras son seleccionadas para que tengan un tamaño igual, pero esto no tiene que ser así. Cuando N es razonablemente mayor (>30), la teoría estándar de distribuciones normales puede ser usada para mostrar que el tamaño de muestra necesario para detectar una diferencia en respuesta entre los grupos tratados y de placebo al nivel a% con la energía ß es: en donde N es el número de cada brazo del análisis, dando 2N como el número total de individuos. A partir de esta ecuación, se puede ver que el tamaño de muestra se incrementa a medida que la diferencia entre las medias de los casos y controles se reduce (es decir, cuando las medias son idénticas µ? = µ? y MB = UB, el tamaño de muestra es infinito). El tamaño de la muestra también se incrementa a medida que las variaciones de las subpoblaciones se incrementan.
D. Ejemplo de muestra de poblaciones igualadas v desiguales En un caso, las dos subpoblaciones genéticas tienen las mismas características de respuesta cuando no se administra ningún tratamiento s?=s?=8) y la respuesta media al tratamiento de individuos del grupo A se describe por MA = 5, s? = 8. La respuesta al tratamiento para individuos del grupo B es igual como para el grupo de placebo (es decir, son no respondedores) con µß = 0, s? = 8. Además, en este ejemplo, un nivel importante de 5% (a=0.05) es utilizado y el tamaño de muestra representa el número mínimo de individuos necesarios para una potencia de 80% (ß = 0.8). El Cuadro 2 a continuación proporciona el número de marcadores (k), la probabilidad del individuo seleccionado que viene del grupo A (es decir, siendo correctamente identificado como un respondedor) (p), la variación de la media de muestra para la población tratada (V[x]) y el tamaño de muestra requerido en cada brazo del ensayo (N).
CUADRO 2 k P V[x] N 0 0.50 70 83 1 0.75 69 36 5 0.92 66 24 10 0.95 65 22 1.00 64 20 En este ejemplo, la variación de población interior se fija en 64 para ambas subpoblaciones genéticas y tanto en las muestras tratadas como no tratadas. El Cuadro 2 muestra que, cuando no se genotipifica ningún marcador, la variación es de 70. Este incremento en la variación es completamente debido a la diferencia en la respuesta debida al genotipo subyacente. Cuando esto es representado (cuando p?1), la variación regresa al valor esperado de 64. Esta inflación en la variación tiene un efecto marcado en el tamaño de muestra necesario (observar en la ecuación 11, el tamaño de muestra no se incrementa lineaímente incrementando la variación, sino que más bien con el cuadrado de la variación). Cuando 83 individuos son necesarios en cada brazo del ensayo o prueba, sin ninguna información genética está disponible, solamente 20 individuos son necesarios si los individuos pueden ser correctamente asignados como respondedores utilizando su perfil polimórfico.
EJEMPLO 3 Efectos de desequilibrio de enlazamiento y frecuencias de alelo de marcador en la potencia de una prueba clínica En este ejemplo, existen dos subpoblaciones genéticas A y B, y un polimorfismo de polinucleótido individual bialélico individual (SNP) que está presente en ambas subpoblaciones. Uno de los átelos, marcado con g, tiene la frecuencia p[g|A] = pA en la subpoblación A y p[g|B] = pB en la subpoblación B. En este ejemplo particular, las dos subpoblaciones tienen una frecuencia igual (es decir p(A) = p(B) = 0.5). En esta situación, la frecuencia amplia de población el alelo raro (es decir, el alelo del par que tiene la frecuencia más baja en la población general) es entonces P(9) = (PA + PB)/2. En este ejemplo, se ha mostrado que el alelo g está asociado con ia respuesta elevada al tratamiento. La respuesta elevada puede deberse a la función del mismo alelo, pero más usualmente surge debido a que el alelo está en desequilibrio de enlazamiento con un factor genético (desconocido) o mutación. La magnitud del desequilibrio de enlazamiento, d, es definida como dA=p(A&g)-p(A)p(g) para la subpoblación A y dB=p(B&g)-p(B)p(g) para la subpoblación B. Si el factor que ocasiona la respuesta elevada es más común en la subpoblación A y el marcador del V 82 polimorfismo de nucleótido individual está muy cerca, se espera que dA>dB. En este sentido, las subpoblaciones pueden ser consideradas como llevando alelos de alta respuesta (A) y de baja respuesta (B) del desconocido que. tiene influencia en la respuesta de un individuo 5 al tratamiento. En algunos casos, el polimorfismo de nucleótido individual yace en una región que es conocida por alojar un gen involucrado en la respuesta al tratamiento, y la subpoblación A consiste de un alto nivel de respondedores, mientras que la subpoblación B consiste de 10 un bajo nivel de respondedores. En casos tales como éste, el polimorfismo de nucleótido individual SNP, entonces puede ser usado para determinar de cual población viene un individuo y, por lo tanto, si está enlistado o no en una prueba clínica. Por ejemplo, cuando pA = .6 y pB = 2, esto implica que los individuos que llevan el alelo g 15 son tres veces con más probabilidad de que vengan de la subpoblación A y de la subpoblación B. Como tal, este marcador es informativo con respecto a que si un individuo responderá bien al tratamiento (es decir, si viene de la subpoblación A). Cuando las dos subpoblaciones son equi-frecuentes, entonces p(A&g) = 0.3 y 20 p(B&g) = 0.1 , por lo tanto dA = p(A&g)-p(A)p(g) = 0.3-0.5x0.4 = 0.1, (1) y dB = p(B&g)-p(B)p(G) = 0.1-0.5x0.4 = 0.1. (2) 25 Es decir, existe una asociación positiva entre el alelo g y un individuo perteneciente a la subpoblación A. De manera inversa, existe una asociación negativa entre g y la subpoblación B. Con estas mediciones de desequilibrio de enlazamiento, es posible calcular la probabilidad condicional de un individuo que es un alto respondedor (que viene de la subpoblación A) dado el individuo que lleva el alelo g. Esto es dado como: p[A|g]=_d^_+ p(A) = 0.75, (3) p(g) y similarmente, p[B|g]=_d_B_+ p(B) = 0.25, (4) p(g) Observar que substituyendo dA y db, estas probabilidad condicionales también pueden ser expresadas (utilizando el teorema de Bayes) como: p(A|gl = y p(B|g1 = pfB&ql P(g] Es decir, la resistencia de la asociación es encapsulada en la diferencia entre las frecuencias de alelo en las subpoblaciones. Utilizando la información en este polimorfismo de nucleótido individual se incrementa la probabilidad de seleccionar correctamente altos respondedores del nulo de 50% (dado que las dos subpoblaciones son igualmente frecuentes) al 75%. Esta probabilidad es una función de la frecuencia del alelo marcados asociado, la frecuencia del alelo que tiene influencia en la respuesta y el estiramiento del desequilibrio de enlazamiento entre los dos alelos. El tamaño de muestra necesario después puede ser calculado como se describió en la sección previa con p = 0.5 representando el muestreo aleatorio de individuos de las dos poblaciones y p = 0.75 representando el muestreo utilizando la información del marcador genético. Observar que el ejemplo anterior, se asume que las frecuencias de alelo en las dos poblaciones son conocidas. Esto por lo general será el caso si el polimorfismo ya es conocido y será implicado en la respuesta, pero generalmente puede no ser conocido. Sin embargo, por lo general puede ser el caso que se pueden utilizar pruebas previas para estimar las frecuencias de alelo en respondedores y no respondedores. Este método se extiende naturalmente a marcadores múltiples. En este caso, G€{gi,...,gk} representa el genotipo de un individuo en un grupo de marcadores bialélicos con frecuencias {?? , ., .,? } en la subpoblación A y {q, qk} en la subpoblación B. Entonces, a través del teorema de Bayes, r L 1 J r i ¿i r . i m _r m * * v ' />[GMM¿] + />[C?| *]/>[*] j^+ j^ en donde las subpoblaciones A y B son igualmente frecuentes. Similarmente p[B|G] puede ser expresado como: P[B\G)- Estos valores pueden ser utilizados como el único caso de sitio para determinar la probabilidad de distribuir un individuo a la subpoblación correcta y, por lo tanto, calcular el tamaño de la muestra. Por ejemplo, suponer que se genotipifican cinco marcadores y se sabe que para todos ellos el alelo raro tiene una frecuencia de 0.4 en la subpoblación A y 0.5 en la subpoblación B. El estudio es conducido con pacientes de las subpoblaciones A e individuos de la subpoblación B, estos últimos individuos se sabe que no responden al tratamiento. Los pacientes son enlistados dependiendo de la producción de los cinco marcadores. Utilizando las ecuaciones 7 y 8, la probabilidad de un individuo perteneciente a la subpoblación A, cuando el individuo tiene el alelo raro en n de los cinco marcadores, es como se muestra en el Cuadro 3.
CUADRO 3 El Cuadro 3 muestra que la probabilidad de asignar correctamente un individuo a la subpoblación correcta se incrementa rápidamente con el número de marcadores genotipificado. En ejemplo, los marcadores son aleatoriamente seleccionados (no se sabe si están asociados con un gen específico) y la diferencia en la frecuencia del alelo raro entre las dos subpoblaciones se selecciona para ser de 0.1. La información del tipo dado en el Cuadro 3 puede ser usada directamente para categorizar individuos en subpoblaciones o como un criterio para inscripción a una prueba. Por ejemplo, los individuos que tienen el alelo raro en 1 o 0 de los cinco polimorfismos, pueden ser incluidos en una prueba clínica. Esto eleva la probabilidad de la prueba que contiene individuos que responderán al tratamiento (en donde se asume que la subpoblación A responde al tratamiento y la subpoblación B no responde). En el caso de individuos sin ningún alelo raro, la probabilidad de pertenecer a la subpoblación A es de 0.713, y para individuos con un alelo raro, la probabilidad de pertenecer a la subpoblación A es de 0.620. Como tal, este criterio de selección enormemente eleva la proporción de individuos de la subpoblación A enlistados en la prueba clínica. Este método simple de selección es solamente ilustrativo y se pueden emplear muchos otros procedimientos más complejos (por ejemplo, análisis en grupo o racimo) dependiendo del número de polimorfismos y sus frecuencias de alelo respectivas.
EJEMPLO 4 Efectos del número de marcadores y sus frecuencias de alelo en la potencia del perfil polimórfico para discriminar entre grupos distintos de pacientes En este ejemplo, existen dos tipos de marcadores, aquellos con alelos comunes (es decir, los dos alelos están a una frecuencia similar) y aquellos con un alelo raro. Para el primer tipo de marcador, un alelo tiene la frecuencia pi = 0.5 en la subpoblación A (respondedores) y q^O.4 en la subpoblación B (no respondedores). Para el segundo tipo de marcadores, un alelo tiene la frecuencia p2 = 0.1 en la subpoblación A y q2 = 0.08 en la subpoblación B. En ambos casos, el alelo raro tiene un 20% de frecuencia menor en la subpoblación B comparado con la frecuencia en la subpoblación A. Un grupo de marcadores, en número, es genotipif icado en una muestra de 2000 pacientes quienes se sabe que pertenecen ya sea a la subpoblación A o a la subpoblación B (de una prueba clínica previa). Para cada uno de estos individuos, existen observaciones k Xi - X2, 3, · · ·, k, las cuales toman el valor de 0 si el alelo raro está presente y de 1 si es de otra manera. Estos individuos pueden ser clasificados en subpoblaciones con y = 0 si vienen de la subpoblación A, y de y = 1 si pertenecen a la subpoblación B. Utilizando dichos datos de entrenamiento, 2000 individuos fueron generados y asignados a una subpoblación o a la otra, utilizando un modelo logístico lineal (Christensen , Log Linear Models and Logistic Regression, Springer Verlag, New York, 1997) de la forma: Registro fP(y = 1 )l = Bn + RiXi + R?x? + ... + Bkxk P(y = 0) También se pueden utilizar otros métodos estadísticos (tales como aquellos descritos en la sección en el Ejemplo 3). Este modelo logístico lineal se seleccionó para ilustrar otro método de clasificación. El Cuadro 4 proporciona la probabilidad de asignar un individuo a la subpoblación correcta para 2, 5, 10, 20 y 50 marcadores. Los valores se dan para ambos tipos de marcadores y para una mezcla de los dos. En este ejemplo, se asume que todos los marcadores son independientes uno del otro. Si este no fuera el caso, se pueden aplicar otros métodos estadísticos más poderosos (por ejemplo, métodos de árboles de clasificación (Breiman y otros, Classif ¡catión and Regression Trees, CRC Press, 1984).
CUADRO 4 En estas simulaciones, los marcadores para los cuales los dos alelos tienen frecuencias similares, son más efectivos para determinar que grupo pertenece al individuo, que los marcadores con frecuencias de alelo muy diferentes. Una mezcla igual de marcadores de estas dos clases proporciona, según se espera, resultados intermediarios. En muchos casos, los datos de pruebas clínicas previas están disponibles, pero no existe ninguna información con respecto a cual de las dos subpoblaciones de los respondedores y no respondedores son extraídos. Dicho escenario es más manejable para análisis mediante métodos en grupo. Los datos de 2000 individuos fueron simulados utilizando las mismas frecuencias de alelo como se describió anteriormente. Estos datos fueron analizados utilizando agrupación de medios K (con K = 2) para investigar que también pueden ser definidas las subpoblaciones solamente por los marcadores. Ya que menos información está disponible, existe muy poca potencia en este método cuando se utilizan muy pocos marcadores (k<10). Los resultados se muestran en el Cuadro 5 para 10 o más marcadores.
CUADRO 5 En este ejemplo, los marcadores para los cuales ambos alelos son comunes trabajan mejor que aquellos para los cuales que un alelo es muy raro. Estos resultados utilizando análisis en grupo correctamente asignan individuos con una probabilidad más baja que en el Cuadro 4. Esto es de esperarse ya que menos información está disponible a priori para estas simulaciones. Como se ilustra en parte por los ejemplos anteriores y la descripción anterior, la presente invención tiene un número de usos con respecto a estudios de tratamiento en general, y pruebas clínicas en particular. Por ejemplo, la invención incluye el uso de un perfil polimórfico para conducir una prueba clínica en una población de pacientes teniendo la misma enfermedad, en donde el perfil polimórfico incluye por lo menos un sitio polimórfico que no se sabe que está asociado con la enfermedad. La invención también incluye el uso de un perfil polimórfico para conducir otro análisis más de datos de una prueba clínica en donde la importancia estadística es determinada en las subpoblaciones de grupos tratados y de control originales seleccionados para similitud del perfil polimórfico. La invención también incluye el uso de un perfil polimórfico para dividir una población de individuos sujetos a una prueba clínica en una pluralidad de subgrupos, los miembros de un subgrupo mostrando una similitud mayor del perfil polimórfico entre sí que los miembros en diferentes subgrupos. Se debe entender que los ejemplos y modalidades anteriormente descritos son solo para propósitos ilustrativos, y que varias modificaciones o cambios en vista de los mismos serán sugeridos para aquellos expertos en la técnica y serán incluidos dentro del espíritu y visión de esta solicitud y alcance de las reivindicaciones anexas. Todas las publicaciones, patentes y solicitudes de patentes citadas aquí se incorporan aquí expresamente por referencia en su totalidad para todos los propósitos al mismo grado como si cada publicación individual patente o solicitud de patente fuera específica e individualmente indicada para ser incorporada por referencia

Claims (1)

  1. REIVINDICACIONES 1. - Un método para determinar un procedimiento de tratamiento,, que comprende: (a) seleccionar subpoblaciones tratadas y de control de sujetos de poblaciones de sujetos tratados y de control, la población tratada siendo tratada con un procedimiento de tratamiento, y la población de control siendo tratada con un procedimiento de control; los sujetos tanto en las poblaciones tratadas y de control habiendo sido caracterizados por el perfil polimórfico, y los sujetos tanto en las subpoblaciones tratadas como de control siendo seleccionadas por similitud del perfil polimórfico; (b) determinar si existe una diferencia estadísticamente importante en un parámetro de prueba entre las subpoblaciones tratadas y de control como una determinación del procedimiento de tratamiento. 2. - El método de acuerdo con la reivindicación 1, que comprende además realizar un ciclo adicional de los pasos de selección y determinación en una segunda población tratada y de control. 3. - El método de acuerdo con la reivindicación 1, en donde las subpoblaciones tratada y de control son seleccionadas por similitud a un primer perfil polimórfico, y las segundas subpoblaciones tratadas y de control se seleccionan por similitud a un segundo perfil polimórfico. 4. - El método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende administrar un agente farmacéutico a los miembros de la población tratada. 5. - El método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende administrar un agente farmacéutico a los miembros de la población tratada y el procedimiento de control carece de administración del agente farmacéutico a los miembros de la población de control. 6. - El método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende administrar un agente farmacéutico a los miembros de la población tratada y el procedimiento de control comprende administrar un placebo a los miembros de la población de control. 7. - El método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende administrar un primer agente farmacéutico a los miembros de la población tratada y el procedimiento de control comprende administrar un segundo agente farmacéutico que difiere del primer agente farmacéutico a los miembros de la población de control. 8.- El método de acuerdo con la reivindicación 7, en donde cada uno de los primero y segundo agentes farmacéuticos son una combinación de agentes farmacéuticos. 9.- El método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende administrar una primera cantidad de un agente farmacéutico a los miembros de la población tratada, y el procedimiento de control comprende administrar una segunda cantidad del agente farmacéutico que difiere de la primera cantidad a los miembros de la población de control. 10. - El. método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende administrar un agente farmacéutico a los miembros de la población tratada de acuerdo con un primer programa, y el procedimiento de control comprende administrar el agente farmacéutico a los miembros de la población de control de acuerdo con un segundo programa que difiere del primer programa. 11. - El método de acuerdo con la reivindicación 1, en donde el procedimiento de tratamiento comprende una terapia de comportamiento. 12. - El método de acuerdo con la reivindicación 11, en donde la terapia de comportamiento comprende un régimen dietético. 13. - El método de acuerdo con la reivindicación 11, en donde la terapia de comportamiento comprende un régimen de ejercicio. 14. - El método de acuerdo con la reivindicación 1, en donde la población de prueba comprende una pluralidad de plantas y el procedimiento de tratamiento comprende administrar un agente agrícola a la pluralidad de plantas, el agente agrícola seleccionado del grupo que consiste de un herbicida, un insecticida y un agente estimulante del crecimiento. 15. - El método de acuerdo con la reivindicación 1, en donde las subpoblaciones son seres humanos, animales o plantas. 16. - El método de acuerdo con la reivindicación 15, en donde las subpoblaciones son seres humanos. 17. - El método de acuerdo con la reivindicación 15, en donde las subpoblaciones son plantas. 18.- El método de acuerdo con la reivindicación 1, en donde las subpoblaciones son bacterias. 19.- El método de acuerdo con la reivindicación 1, en donde las subpoblaciones de sujetos se seleccionan por haber sido similarmente expuestas a un factor ambiental. 20.- El método de acuerdo con la reivindicación 1, en donde las subpoblaciones de sujetos se seleccionan por haber sido diferencialmente expuestas a por lo menos un factor ambiental. 21. - El método de acuerdo con la reivindicación 1, en donde las subpoblaciones de sujetos se seleccionan por ser del mismo grupo étnico. 22. - El método de acuerdo con la reivindicación 1, en donde la subpoblación de sujetos se selecciona de rasgos fenotípicos comunes. 23. - El método de acuerdo con la reivindicación 1, en donde las subpoblaciones de las poblaciones de tratamiento y de control cada una incluye por lo menos 5 miembros. 24 - El método de acuerdo con la reivindicación 23, en donde las subpoblaciones cada una incluye por lo menos 10 miembros. 25.- El método de acuerdo con la reivindicación 24, en donde las subpoblaciones cada una incluye por lo menos 100 miembros. 26. - El método de acuerdo con la reivindicación 1, en donde el perfil poiimórfico para cada una de las subpoblaciones es una forma polimórfica individual. 27. - El método de acuerdo con la reivindicación 1, en donde el perfil poiimórfico para cada una de las subpoblaciones comprende una pluralidad de formas polimórficas. 28. - El método de acuerdo con la reivindicación 27, en donde las formas polimórficas están presentes en las regiones de codificación de una pluralidad de genes. 29.- El método de acuerdo con la reivindicación 28, en donde la pluralidad de genes codifican enzimas en una trayectoria metabólica. 30. - El método de acuerdo con la reivindicación 29, en donde el procedimiento de tratamiento es un método potencial para tratar una enfermedad y por lo menos un subgrupo de la pluralidad de genes está correlacionado con la enfermedad. 31. - El método de acuerdo con la reivindicación 29, en donde el procedimiento de tratamiento es un método potencial para tratar una enfermedad, y la trayectoria metabólica está correlacionada con la enfermedad. 32. - El método de acuerdo con la reivindicación 1, en donde el perfil poiimórfico para cada una de las subpoblaciones incluye por lo menos 10 formas polimórficas. 33. - El método de acuerdo con la reivindicación 32, en donde el perfil poiimórfico para cada una de las subpoblaciones incluye por lo menos 100 formas polimórf ¡cas. 34.- El método de acuerdo con la reivindicación 1, en donde los perfiles polimorficos para las subpoblaciones son por lo menos 10% idénticos. 35.- El método de acuerdo con la reivindicación 34, en donde los perfiles polimorficos para las subpoblaciones son por lo menos 50% idénticos. 36. - El método de acuerdo con la reivindicación 35, en donde los perfiles polimorficos para las subpoblaciones son por lo menos 75% idénticos. 37. - El método de acuerdo con la reivindicación 36, en donde los perfiles polimorficos para las subpoblaciones son idénticos. 38. - El método de acuerdo con la reivindicación 1, en donde el parámetro de prueba es una medida de una enfermedad. 39.- El método de acuerdo con la reivindicación 38, en donde la enfermedad es cáncer. 40.- El método de acuerdo con la reivindicación 38, en donde la enfermedad está correlacionada con un nivel elevado de colesterol en el suero. 41.- El método de acuerdo con la reivindicación 1, en donde las poblaciones de prueba y de control comprenden plantas y el parámetro de prueba se selecciona del grupo que consiste de una medida de susceptibilidad a herbicidas, susceptibilidad a insecticidas, susceptibilidad a una enfermedad y susceptibilidad a daño por congelación. 42. - Un método para conducir una prueba clínica, que comprende: (a) tratar una población tratada de pacientes teniendo una enfermedad con un fármaco, y tratar una población de control de pacientes que tienen la enfermedad de acuerdo con un procedimiento de control; (b) seleccionar una subpoblación de pacientes de cada una de las poblaciones tratadas y de control que tienen un perfil polimórfico similar; y (c) determinar si el tratamiento con el fármaco se correlaciona con el estado de la enfermedad en las subpoblaciones como una determinación de la eficacia del fármaco en el tratamiento de la enfermedad. 43. - El método de acuerdo con la reivindicación 42, en donde el paso de determinar comprende determinar si existe una diferencia estadísticamente importante en un parámetro de prueba entre la subpoblaciones. 44. - El método de acuerdo con la reivindicación 42, que comprende además determinar un perfil polimórfico para cada paciente en las poblaciones tratada y de control antes del paso de seleccionar. 45. - El método de acuerdo con la reivindicación 42, en donde el procedimiento de control involucra administrar un placebo a los miembros de la población y de control. 46.- El método de acuerdo con la reivindicación 42, en donde el fármaco es efectivo para tratar una enfermedad distinta a la enfermedad para cual se está realizando la prueba clínica. 47. - Un método para determinar un procedimiento de tratamiento, que comprende: (a) proporcionar una base de datos que comprende: (i) designaciones para cada miembro de una población tratada de acuerdo con un procedimiento de tratamiento y para cada miembro de una población de control tratada de acuerdo con un procedimiento de control; (ii) designaciones para un perfil polimórfico para cada miembro de las poblaciones tratada y de control; y (iii) designaciones para un parámetro de prueba para cada miembro de las poblaciones tratada y de control; (b) seleccionar una subpoblación de cada una de las poblaciones tratada y de control para la similitud de perfil polimórfico; y (c) determinar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones; y (d) desplegar una salida del resultado del paso de determinación. 48. - Un producto de programa de computadora para determinar un procedimiento de tratamiento, que comprende: (a) un código para proporcionar o recibir datos que comprenden: (i) designaciones para cada miembro de una población tratada de acuerdo con un procedimiento de tratamiento y para cada miembro de una población de control tratada de acuerdo con un procedimiento de control; (¡i) designaciones para un perfil polimórfico para cada miembro de las poblaciones tratada y de control; y (iii) designaciones para un parámetro de prueba para cada miembro de las poblaciones tratada y de control; (b) un código para seleccionar una subpoblacion de cada una de las poblaciones tratada y de control que tengan un perfil polimórfico similar; (c) un código para determinar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones; (d) un código para desplegar una salida del resultado del paso (c); y (e) un medio de almacenamiento legible por computadora para mantener los códigos. 49.- Un sistema para determinar un procedimiento de tratamiento, que comprende: (a) una memoria; (b) una barra colectora de sistema; y (c) un procesador operativamente dispuesto para: (i) proporcionar o recibir datos que comprenden: designaciones para cada miembro de una población tratada habiendo sido tratada de acuerdo con un procedimiento de tratamiento, y cada miembro de una población de control tratada de acuerdo con un procedimiento de control; designaciones para un perfil polimórfico para cada miembro de las poblaciones tratada y de control; y designaciones para un parámetro de prueba para cada miembro de las poblaciones tratada y de control; (ii) seleccionar una subpoblación de cada una de las poblaciones tratada y de control que tengan un perfil polimórfico similar; (iii) determinar si existe una diferencia estadísticamente importante en el parámetro de prueba entre las subpoblaciones; y (iv) desplegar una salida del resultado del paso (iii). 50.- Un método para conducir una prueba clínica que comprende: (a) determinar un perfil polimórfico para individuos para una población que tiene la misma enfermedad, en donde el perfil polimórfico incluye por lo menos una forma polimorfica en un sitio polimórfico que no se sabe que está asociado con la enfermedad; (b) seleccionar una subpoblación de individuos que tienen un perfil polimórfico similar de la población; (c) administrar un régimen de tratamiento a un grupo de tratamiento dentro de la subpoblación, y un régimen de control a un grupo de control dentro de la subpoblación; (d) determinar un parámetro de prueba en pacientes en el grupo de tratamiento y el grupo de control esperado para variar en respuesta a un régimen de tratamiento efectivo; y (e) determinar si el parámetro muestra una diferencia estadísticamente importante entre el grupo de tratamiento y el grupo de control. 51.- Un método para conducir una prueba clínica, que comprende: (a) determinar un perfil polimórfico para individuos para una población que tiene la misma enfermedad; (b) identificar subgrupos de individuos en la población, de manera que los individuos en el subgrupo muestran una similitud mayor en el perfil polimórfico que los individuos en diferentes subgrupos; (c) distribuir los miembros de cada subgrupo a las subpoblaciones de tratamiento y de control de las poblaciones, de manera que las subpoblaciones tratadas y de control cada una recibe por los menos un individuo de cada subgrupo; (d) administrar un régimen de tratamiento a la subpoblación de tratamiento y un régimen de control a una subpoblación de control; (e) determinar un parámetro de pacientes en la subpoblación de tratamiento y la subpoblación de control esperado para variar en respuesta a un régimen de tratamiento efectivo; y (f) determinar si el parámetro muestra una diferencia estadísticamente importante entre la subpoblación de tratamiento y la subpoblación de control. 52.- El método de acuerdo con la reivindicación 51, en donde los subgrupos son pares de individuos.
MXPA01005513A 1998-12-02 1999-12-01 Metodos para reducir la variacion en estudios de tratamiento utilizando genotipificacion. MXPA01005513A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11066898P 1998-12-02 1998-12-02
PCT/US1999/028582 WO2000033161A2 (en) 1998-12-02 1999-12-01 Methods to reduce variance in treatment studies using genotyping

Publications (1)

Publication Number Publication Date
MXPA01005513A true MXPA01005513A (es) 2003-07-14

Family

ID=22334245

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA01005513A MXPA01005513A (es) 1998-12-02 1999-12-01 Metodos para reducir la variacion en estudios de tratamiento utilizando genotipificacion.

Country Status (6)

Country Link
EP (1) EP1155361A2 (es)
JP (1) JP2003501005A (es)
AU (1) AU3108200A (es)
CA (1) CA2350069A1 (es)
MX (1) MXPA01005513A (es)
WO (1) WO2000033161A2 (es)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058517B1 (en) 1999-06-25 2006-06-06 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
US6931326B1 (en) 2000-06-26 2005-08-16 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
DK2463388T3 (en) 2005-11-29 2018-02-26 Cambridge Entpr Ltd Markers for breast cancer
EP2438193B1 (en) 2009-06-01 2015-07-22 Genetic Technologies Limited Methods for breast cancer risk assessment
JP5656159B2 (ja) * 2009-08-24 2015-01-21 独立行政法人理化学研究所 インターフェロン療法の効果予測用マーカー
JP6114584B2 (ja) * 2013-03-14 2017-04-12 株式会社スタージェン 測定データに関する基準値の決定方法、基準値を用いた測定データの評価方法
KR102334702B1 (ko) 2014-09-30 2021-12-06 지네틱 테크놀로지스 리미티드 유방암 발생 위험의 평가 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4582788A (en) * 1982-01-22 1986-04-15 Cetus Corporation HLA typing method and cDNA probes used therein
US5075217A (en) * 1989-04-21 1991-12-24 Marshfield Clinic Length polymorphisms in (dC-dA)n ·(dG-dT)n sequences
US5840746A (en) * 1993-06-24 1998-11-24 Merck Frosst Canada, Inc. Use of inhibitors of cyclooxygenase in the treatment of neurodegenerative diseases

Also Published As

Publication number Publication date
CA2350069A1 (en) 2000-06-08
WO2000033161A9 (en) 2001-04-19
WO2000033161A3 (en) 2000-11-02
AU3108200A (en) 2000-06-19
JP2003501005A (ja) 2003-01-14
WO2000033161A2 (en) 2000-06-08
EP1155361A2 (en) 2001-11-21

Similar Documents

Publication Publication Date Title
US11414706B2 (en) Method of determining a numeric index of tumor-associated copy number changes of circulating nucleic acids associated with prostate cancer
US20210164993A1 (en) Methods and Systems for Improving Skin Condition
Jawaheer et al. A genomewide screen in multiplex rheumatoid arthritis families suggests genetic overlap with other autoimmune diseases
US20190136314A1 (en) Colorectal cancer associated circulating nucleic acid biomarkers
US20020010552A1 (en) System for genetically characterizing an individual for evaluation using genetic and phenotypic variation over a wide area network
EP1975255A2 (en) Method and apparatus for the determination of genetic associations
WO2013086352A1 (en) Prostate cancer associated circulating nucleic acid biomarkers
CN104736723B (zh) 用于预测对fgf‑18化合物的响应性的遗传标记
WO2006107670A2 (en) In vitro association studies
US20190218616A1 (en) METHODS OF PREDICTING MEDICALLY REFRACTIVE ULCERATIVE COLITIS (mrUC) REQUIRING COLECTOMY
WO2015168699A1 (en) Methods of predicting medically refractive ulcerative colitis (mruc) requiring colectomy
US7335474B2 (en) Methods and systems for identifying predisposition to the placebo effect
MXPA01005513A (es) Metodos para reducir la variacion en estudios de tratamiento utilizando genotipificacion.
US20170145501A1 (en) Apparatus and methods of using of biomarkers for predicting tnf-inhibitor response
WO2008091708A2 (en) Gene expression profiling for identification, monitoring, and treatment of lupus erythematosus
US20140080727A1 (en) Variants predictive of risk of gout
Bochdanovits et al. Genome-wide prediction of functional gene-gene interactions inferred from patterns of genetic differentiation in mice and men
CN106868162A (zh) 基于ppp2r2b和nat2基因的与抗结核药物肝毒性反应相关的snp标志物、试剂盒及应用
WO2023077490A1 (zh) 一种甲、乙和丙型流感病毒的mnp标记组合、引物对组合、试剂盒及其应用
Payseur et al. Contrasting multi‐site genotypic distributions among discordant quantitative phenotypes: the APOA1/C3/A4/A5 gene cluster and cardiovascular disease risk factors
KR20230039213A (ko) 뇌졸중 진단용 단일염기다형성 마커 및 이를 이용한 뇌졸중 진단 방법
Tromp et al. How does one study genetic risk factors in a complex disease such as aneurysms?
CN114350781A (zh) 检测coqr2基因多态性位点snp分型的引物探针组合、试剂盒及其应用
CN106868161A (zh) 基于blnk和nat2基因的与抗结核药物肝毒性反应相关的snp标志物、试剂盒及应用
Li Genetic Association Studies: Concepts and Applications