MXPA99007738A

MXPA99007738A - Secuenciador de genes y metodos

Info

Publication number: MXPA99007738A
Application number: MXPA/A/1999/007738A
Authority: MX
Inventors: Virtanen Jorma
Original assignee: Burstein Laboratories Inc; Virtanen Jorma
Priority date: 1997-02-21
Filing date: 1999-08-20
Publication date: 2000-09-04

Abstract

Se describen un secuenciador de gen disco bio-compacto y metodología de reparación de muestra. Se preparan oligonucléotidos de longitud constante y, en conjunción con el disco bio-compacto y el aparto descritos usados en el secuenciado de gen y, las estrategias para el mismo.

Description

SECUENCIADOR DE GENES Y MÉTODOS CAMPO DE LA INVENCIÓN Esta invención generalmente se refiere al campo de secuenciación de genes. Más particularmente, esta invención se refiere a un secuenciador de genes, un disco bio-compacto de alta densidad útil con el mismo y un método de preparación de muestras para el mismo. El disco bio-compacto de alta densidad y la metodología de preparación de muestras, encuentran aplicación en el campo de secuenciación de oligonucleótidos y secuenciación ADN y generalmente detección. COMPENDIO DE LA INVENCIÓN En un aspecto, la presente invención caracteriza un método de preparación de muestras para obtener oligonucleótidos n-mer de una muestra que contiene fragmentos de oligonucleótidos que comprende: (a) formar un soporte sólido que tiene todos los oligonucleótidos n-mer posibles unidos a la superficie del soporte; (b) poner en contacto el soporte sólido que resulta del paso (a) con la muestra bajo condiciones que ocasionan que los oligonucleótidos de la muestra se hibridicen con los oligonucleótidos n-mer complementarios sobre el soporte sólido; (c) poner en contacto el soporte sólido que resulta del paso (b) con el agente hidrolizante; (d) separar los oligonucleótidos no unidos de los oligonucleótidos hibridizados; (e) desnaturalizar los oligonucleótidos n-mer hibridizados para obtener los oligonucleótidos n-mer de la muestra; en donde n es un número entero seleccionado de los números enteros 4-10,000, más ventajosamente 6-28. En otro aspecto, la invención caracteriza un método para obtener oligonucleótidos n-mer de una muestra que contiene fragmentos de oligonucleótidos que comprende: (a) poner en contacto el soporte sólido adaptado para acoplarse con los oligonucleótidos en la muestra con por lo menos una porción de la muestra; (b) poner en contacto el soporte sólido que resulta del paso (a) con una mezcla de oligonucleótidos n-mer durante un tiempo suficiente para que se hibridicén los oligonucleótidos n-mer con los oligonucleótidos n-mer complementarios sobre los soportes sólidos; (c) separar los oligonucleótidos n-mer hibridizados de los oligonucleótidos no hibridizados; (d) desnaturalizar los oligonucleótidos n-mer hibridizados para obtener los oligonucleótidos n-mer complementarios a aquellos presentes en la muestra; en donde n es un número entero seleccionado de los números enteros 4-10,000, más ventajosamente 6-28. En aún otro aspecto, el método de preparación de la muestra incluye un método para obtener oligonucleótidos n-mer de la muestra que contiene fragmentos de oligonucleótidos que comprenden: (a) poner en contacto un soporte sólido que tiene unido sobre el mismo oligonucleótidos de una muestra con una mezcla de una pluralidad de oligonucleótidos que tienen (k+m)-mer, en donde k+m = n, con una mezcla de una pluralidad de los primeros oligonucleótidos, cada uno siendo un k-mer y estando un grupo hidroxilo libre en el extremo 3' del mismo y una pluralidad de los segundos oligonucleótidos, cada uno siendo un m-mer y estando sin un grupo fosfato libre en el extremo 5' del mismo; (b) ligar los oligonucleótidos sobre el soporte sólido que resulta del paso (a); (c) remover los oligonucleótidos no ligados del soporte sólido; y (d) desnaturalizar los oligonucleótidos n-mer hibridizados restantes sobre el soporte sólido para obtener los oligonucleótidos n-mer complementarios con aquellos presentes en la muestra; en donde m, k y n son cada uno un número entero seleccionado de los números enteros de 6-10,000, más ventajosamente 12-40, siempre y cuando k+m = n. En aún otro aspecto, el método de preparación de la muestra incluye un método para obtener oligonucleótidos n-mer de una muestra que contienen fragmentos de oligonucleótidos que comprende: (a) poner en contacto el soporte sólido que tiene unido sobre el mismo una pluralidad de oligonucleótidos de la muestra con una mezcla de una pluralidad de oligonucleótidos h-mer cada uno teniendo un grupo fosfato en ambos extremos 3' y 5', una pluralidad de oligonucleótidos i-mer cada uno teniendo un grupo hidroxilo, amino o tiol en el extremo 3' y ningún grupo fosfato terminal, y una pluralidad de oligonucleótidos j-mer que tienen un grupo hidroxilo, amino o tiol en el extremo 5' y ningún grupo fosfato terminal; (b) ligar química o enzimáticamente los oligonucleótidos sobre los soportes sólidos que resultan del paso (a); (c) remover los oligonucleótidos no ligados del soporte sólido que resultan del paso (b); y (d) desnaturalizar los oligonucleótidos n-mer hibridizados restantes sobre el soporte sólido para obtener los nucleótidos n-mer complementarios con aquellos presentes en la muestra; en donde h, i y j son cada uno un número entero seleccionado de los números enteros de 6-10,000, más ventajosamente de 18-60, siempre y cuando h + i+j = n. En aún otro aspecto de esta invención, un elemento de análisis se describe comprendiendo un substrato que tiene una superficie que incluye una pluralidad de áreas discretas sobre la superficie adaptada para unirse a una molécula de separación; una pluralidad de moléculas de separación unidas en un primer extremo a la superficie en cada una de las áreas discretas, cada una de las moléculas de separación adaptadas para estar unidas en su segundo extremo a una superficie metálica o una marca, cada una de las moléculas de separación teniendo un sitio entre su primer extremo y su segundo extremo capaces de separarse; un primer oligonucleótido n-mer que tiene una primera secuencia unida substancialmente a todas las moléculas de separación entre el sitio de separación y el primer extremo de la molécula de separación y un segundo oligonucleótido n-mer que tiene una segunda secuencia unida substancialmente a todas las secuencias separadoras; en donde substancialmente ninguna otra área descrita sobre la superficie del substrato contiene moléculas separadores que tienen oligonucleótidos n-mer que tienen la primera secuencia unida a los mismos y n es un número entero seleccionado de los números enteros 4-10,000, más ventajosamente 6-28.

La presente invención también abarca un método para determinar la secuencia de un segmento (p + q + r)-mer de un gen que se sospecha que está presente en una muestra que comprende: (a) formar una solución de la muestra y una mezcla de oligonucleótidos q-mer que tienen todas las secuencias posibles de un oligonucleótido q-mer, u, opcionalmente, un subgrupo de todas las secuencias posibles; (b) poner en contacto un elemento analizado con, por lo menos, una porción de la solución del paso (a), el elemento de análisis teniendo una superficie y pluralidad de molécula de separacións unidas a la superficie, las moléculas de separación teniendo un primer extremo unido a la superficie y un segundo extremo unido a una superficie metálica o a una marca y un sitio de separación intermediario entre los primero y segundo extremos, las moléculas de separación teniendo además un primer oligonucleótido p-mer unido al mismo entre el sitio de separación del primer extremo y un segundo oligonucleótido n-mer unido al mismo entre el sitio de separación y el segundo extremo, la combinaciones de los oligonucleótidos p-mer y r-mer, u, opcionalmente, un subgrupo de todas las combinaciones, cada combinación particular de secuencia de los oligonucleótidos p-mer y r-mer estando en un lugar predeterminado sobre la superficie; (c) ligar los oligonucleótidos hibridizados resultantes unidos a las moléculas de separación que resultan del paso (b) anterior; (d) detectar la presencia o ausencia de una combinación de secuencia particular de los oligonucleótidos hibridizados en cada ubicación predeterminada sobre la superficie; y (e) procesar la información de secuencia obtenida del paso (d) para deducir la secuencia del oligonucleótido (p + q + r) presente en la muestra, en donde p, q y r son números enteros seleccionados de los números enteros 4-10,000, más ventajosamente 6-26, y (p + q + r) no excede de 30,000 y aún más ventajosamente 60. Los pasos (a)-(e) pueden llevarse a cabo en paralelo para diferentes segmentos múltiples de un gen. BREVE DESCRIPCIÓN DE LOS DIBUJOS La invención además se entenderá por referencia a los siguientes dibujos en los cuales: La Figura 1 es una representación esquemática de la síntesis de una pluralidad de oligonucleótidos n-mer sobre un soporte sólido.

La Figura 2, es una representación esquemática de un método que usa el soporte sólido de la Figura 1 para seleccionar oligonucleótidos n-mer de la muestra que contiene una mezcla de oligonucleótidos de longitud de n-mer variable. La Figura 3, es una representación esquemática de una amplificación lineal para obtener una muestra de oligonucleótidos n-mer usando un soporte sólido. La Figura 4, es una representación esquemática de la amplificación para obtener una muestra de oligonucleótidos marcados. La Figura 5, es una representación esquemática de un método de preparación de oligonucleótidos de longitud constante usando ligasa.

La Figura 6, es una representación esquemática de un método para preparar oligonucleótidos de longitud constante usando unión química o lipasa. La Figura 7, es una representación esquemática de dos estampas complementarias usadas en la preparación de discos bio-compactos teniendo oligonucleótidos unidos en su superficie. La Figura 8, es una representación esquemática de una modalidad que utiliza las estampas de la Figura 7 para imprimir en donde se van unir los oligonucleótidos estacionarios al sólido y sobre las paredes de una ranura formada en la estampa. La Figura 9, es una representación esquemática del uso de reconocimiento selectivo, (8, {10},8)-reconocimiento, para determinar secuencias alrededor de 16-mer que presentan dos veces en un cromosoma. La Figura 10, es una representación esquemática de una estampa que tiene cavidades hidrofílicas en una superficie hidrofóbica. La Figura 11, es una representación esquemática de una estampa en la Figura 10, en donde las esferas de látex son químicamente unidas en las cavidades. La Figura 12, es una ilustración de reconocimiento de (4,4) usadas para determinar la información de secuenciación que se refiere a un fragmento de genes.

La Figura 13, es una ilustración de reconocimiento de (4,{5},4)-mer usada para determinar la información de secuenciación que se refiere a un fragmento de genes. La Figura 14A, es una representación esquemática de un disco de fraccionación. La primera fraccionación puede llevarse a cabo en el área central de dieciséis compartimentos. Las fracciones además pueden ser fracciones en los canales espirales o capilares. La Figura 14B demuestra que las fracciones adicionales pueden llevarse a cabo después de que se unen a otro disco sobre el disco descrito en la Figura 14A. La Figura 14C, representa una vista superior de intersecciones de capilares y una zona de clases de oligonucleótidos. La Figura 15, es una representación esquemática de un área de fracción central. La muestra puede circularse alrededor de está área la cual, en esta modalidad particular, contiene dieciséis compartimientos. Cada compartimiento contiene una sonda de subclase de oligonucleótidos específica. La Figura 16, ilustra que los oligonucleótidos pueden eluirse en los capilares haciendo girar el disco después de la desnaturalización. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN Información antecedente significativa, así como la guía adicional para practicar las modalidades particulares de la presente invención dentro del alcance de las reivindicaciones anexas, pueden encontrarse en PCT/US97/11826, ahora públicamente disponible en forma publicada, la descripción de la cual se incorpora expresamente aquí por referencia. PREPARACIÓN DE MUESTRA Las disposiciones de oligonucleótidos prometen mucho para la secuenciación de genes. Actualmente, estos métodos son limitados en su mayor parte a la revisión de genes en donde se conoce la secuencia, excepto por algunos puntos específicos, y solamente se necesita un conjunto limitado de oligonucleótidos en la disposición. La secuenciación de novo es más difícil, debido a que son difíciles de producir disposiciones muy grandes, que contienen todos los oligonucleótidos de longitud constante posibles. También, los oligonucleótidos de muestra de longitud aleatoria ocasionan complicaciones. Pueden hibridizarse unos con otros con una unión más fuerte que con los oligonucieótidos de sonda. Los oligonucleótidos de longitud óptima se hibridizan más fácilmente y con mayor fidelidad que los oligonucleótidos que son muy largos. La presente invención describe cuatro métodos que pueden usarse para preparar oligonucleótidos de longitud uniforme de cualquier muestra de ADN. Además, estos métodos pueden usarse de manera que ia muestra procesada contiene todos los oligonucleótidos de longitud uniforme esenciales, que no tienen un oligonucleótido complementario en la mezcla, es decir, que no pueden formar ninguna disposición doble. Esto es una ventaja mayor en los métodos de arreglos de oligonucleótidos, que están basados en ia hibridización entre los oligonucleótidos de muestra y de sonda. La hibridización se evita limitando, por ejemplo, el nucleótido central para la adenosina o citosina (restricción de AC) en todos los ^ oligonucleótidos de muestra de longitud uniforme. Por lo tanto, dos oligonucleótidos de muestra no son capaces de hibridizarse entre 5 ellos y, en lugar de esto, son capaces de hibridizarse completamente solamente con los oligonucleótidos de sonda en la disposición. La Reacción en Cadena de Polimerasa (RCP) es un método de amplificación de ADN altamente efectivo. Sin embargo, la RCP tiene serios inconvenientes cuando se aplica en métodos de disposición de ^= 10 oligonucleótidos y en secuenciación de novo masiva, tal como la secuenciación de un cromosoma completo en un tiempo. Con el fin de utilizar RCP, se necesitan iniciadores cortos para iniciar la reacción. Para cubrir completamente el cromosoma con los iniciadores, una parte importante de la secuencia debe ser conocida con seguridad. También, cada ciclo en RCP tiende a dar oligonucleótidos más cortos que los previos. Tomados juntos, estos ^^ aspectos significan que varios segmentos del cromosoma no se representan uniformemente y algunas partes no están representadas del todo después de la amplificación de RCP de una muestra no conocida. La Reacción en Cadena de Ligasa (RCL) provee oligonucleótidos de longitud uniforme cuando se conoce la secuencia. Un método descrita en esta solicitud es una extensión de RCL para el caso general que no necesita conocimiento previo de la secuencia.

La secuencíación de novo requiere disposiciones de alta densidad. Estos son producidos previamente por métodos litografieos. A pesar de su uso, este método requiere instrumentación sofisticada y puede dar como resultado la formación de una cantidad significativa de impurezas. En esta solicitud dos métodos de impresión sencillos se describen los cuales permiten exactitud micrométrica. Como se ilustra en las Figura 10 y 11, el primero utiliza esperas de látex de poros inmovilizadas sobre una superficie hidrofóbica. Las esferas de látex pueden humectarse con una solución química, tal como un oligonucleótido en agua y prensarse sobre otra superficie que es capaz de unirse a uno de los componentes (oligonucleótido). Este método requiere generalmente múltiples pasos de impresión, pero es útil para la fabricación de estampados maestros para impresión complementaria. El estampado complementario está moldeado químicamente de manera que puede unir de una de una manera complicada un cierto componente a un sitio específico. El estampado puede contener millones de sitios diferentes de varios componentes. Después del lavado, todos los componentes no unidos se remueven y el estampado se pone en contacto con una superficie que es capaz de unirse químicamente a los componentes deseados. Los componentes se separan de la estampa, se dejan difundir en un canal y reaccionan con la superficie activa. Por lo tanto, millones de componentes químicos, tales como oligonucleótidos, pueden transferirse con precisión micrométrica en un paso de impresión. Repitiendo el proceso se puede crear una combinación de miles de millones de pares de oligonucleótidos. Ningún otro método, de impresión litográfica de inyección de tinta convencional permite que se fabrique dicho patrón de alta densidad en solo dos pasos. Además, no se necesita instrumentación sofisticada. Se conoce bien la impresión de un químico de alta resolución en un tempo. También, la impresión química por la que varios químicos se alimentan sobre la superficie a lo largo de los canales es bien conocida. El último método realmente permite la producción de disposiciones, pero la densidad no es muy grande. Debido a los requerimientos de flujo los capilares no pueden ser muy estrechos. Aunque miles de dichos capilares podrían estar posiblemente en un estampado, no se pueden concebir que esa cantidad de millones de capilares de flujo puedan estar en una superficie de tamaño razonable. Por otro lado, millones de canales de escala micrométrica pueden estamparse en el plástico. Estos canales pueden hacerse hidrofílicos y cada vez que se revisten con cierto oligonucleótido usando fotolitografía o, preferiblemente, un conjunto de estampados de esferas de látex, se describen por separado en esta solicitud. Una disposición de oligonucleótidos que podría ser capaz de secuenciar un cromosoma humano inequívocamente podría ser casi irresistible de fabricar. Mientras que las disposiciones de oligonucleótidos han sido capaces de secuenciar de novo aproximadamente 2000 pares de base (pb). Se puede llevar a cabo la revisión de secuencias para secuencias mucho más grandes, por ejemplo de 20,000 pb. Un cromosoma puede contener 250 millones de pb, que es aproximadamente 100,000 veces mayor que los secuenciado convenientemente por las disposiciones de oligonucleótidos presentes. Los métodos de preparación de muestra y discos bio-compactos de alta densidad descritos en esta solicitud mejoran en gran parte la secuenciación. Además, el protocolo de secuenciación apropiado es fundamentalmente importante para obtener resultados convenientes mientras que reduce al mínimo el número de discos bio-compactos que se pueden utilizar. El enfoque tomado en esta solicitud es de la siguiente manera: 1) determinar los oligonucleótidos de 16-mer que son parte de un cromosoma; y 2) determinar los extremos 8-mer de los oligonucleótidos de 27-mer sin conocer la secuencia media de 11-mer de estos 27-mer. Los números reales únicamente son ejemplos y son posibles diferentes variaciones de este aspecto. Estos dos grupos de datos pueden adquirirse con un conjunto similar de discos bio-compactos, es decir discos que usan un reconocimiento de (8,8). El conjunto 1 de datos (los 16-mer) permite que se determine una secuencia de 11-mer central en cada 27-mer de conjunto de datos 2. Por lo tanto, las secuencias de 27-mer son parte de la secuencia global que será conocida. Esto permite la deducción casi inequívoca de la secuencia original. Solamente algunas secuencias de repetición largas están fuera de la capacidad de este método. Aún en estos casos, se conocen secuencias alternativas. Las disposiciones de oligonucleótidos hechas comúnmente pueden ser necesarias para deducir concluyentemente las secuencias de repeticiones largas. En los análisis de ADN de disposición de bio-microcircuito, los oligonucleótidos estacionarios tienen cierta longitud, es decir tienen m-mer en donde m es un número fijo entre 8 y 30 en una disposición de bio-microcircuito dada. La muestra se prepara por hidrólisis aleatoria, ya sea química o enzimáticamente. La muestra contiene oligonucleótidos que tienen longitud variable. Sin embargo, con el fin de evitar la sobre-hidrólisis, la longitud dirigida al sitio es de aproximadamente 50 bases (50-mer). La longitud excesiva y variable disminuye la hibridización y puede conducir a interacciones no deseadas. La muestra ideal contiene oligonucleótidos de longitud constante, n-mer, en donde n es igual o ligeramente mayor que la longitud de los oligonucleótidos estacionarios, en donde son m-mer (n>_m). En seguida, se describen cuatro variaciones de un procedimiento que da oligonucleótidos de muestra teniendo longitudes constantes y deseadas. MÉTODO 1. (Nucleasa S. Fig. 1: Síntesis de una mezcla completa de n-mer; Fig. 2: Preparación de n-mer de olígomeros de longitud variable; y Fig. 3: Amplificación lineal). Primero, todos los n-mer de oligonucleótidos posibles se sintetizaron sobre un soporte sólido. Esto se puede lograr fácilmente usando en cada conjunto de acoplamiento, una mezcla equimolar de adenosina, citosina, guanosina y timidina fosforamiditas u otros derivados de estos nucleótidos. Se describen dos pasos sintéticos en la Figura 1. Después de los pasos de acoplamiento de n, todos los n-mer están en el soporte sólido elegido. Una mezcla completa de oligonucleótidos hasta de 26-mer puede sintetizarse prácticamente mediante este método. La Tabla 1 demuestra el número de moléculas de cierto n-mer de oligonucleótido en 10 miligramos de la muestra (el peso del soporte no se incluye). Hay cierta fluctuación estadística en las cantidades de los diferentes n-mer en la mezcla. Para 28-mer, se espera que varios oligonucleótidos posibles no se representen en toda la mezcla de 10 miligramos mientras que algunos otros tienen más de 20 copias de manera que el número promedio de copias es de 11. La fluctuación es insignificante para 24-mer, debido a que los 24-mer posibles tienen más de 2*103 copias en la mezcla de 10 miligramos, y que por lo tanto, es una mezcla completa. Los fragmentos de oligonucleótidos de la muestra se hibridizan con la mezcla completa de n-mer unida sobre el soporte sólido (Figura 2). Se agrega un agente de hidrolización, tal como nucleasa S, que hidroliza ADN de un solo hilo. Solamente los segmentos de oligonucleótidos hibridizados se protegen contra la hidrólisis. Los sobrantes de los oligonucleótidos de la muestra se remueven en gran parte. También los n-mer estacionarios sobre el soporte sólido que no pueden tener oligonucleótidos de igualación en la muestra se hidrolizan (Figura 2). La hidrólisis no necesita que sea idealmente completa con el fin de ser útil. Por ejemplo, si n es 16, la escala útil de los oligonucleótidos de la muestra está entre 16 y 22-mer cuando se usa el disco bio-compacto. De manera similar, si los n-mer estacionarios únicamente se hidrolizan parcialmente, los n-mer restantes pueden usarse para la amplificación de la muestra. El soporte sólido contiene, después de la hidrólisis, tal como con un tratamiento de Nucleasa S, un conjunto estacionario de n-mer, que son complementarios para los oligonucleótidos de la muestra. Hibridizando una mezcla de n-mer soluble completa con este conjunto estacionario de n-mer como se muestra en la Figura 2, se obtiene una copia completa de los n-mer de la muestra. El proceso puede repetirse varias veces, pero es ineficiente debido a que la amplificación es una función lineal de tiempo y espacio. Este proceso puede modificarse para ser exponencial por amplificación de RCP o métodos análogos bien conocidos en la materia. Si se restringe la selección de base en un cierto sitio de n-mer, el número de moléculas correspondientemente es más grande. Por ejemplo, si en el centro de estos oligonucleótidos solamente se permiten adenosina y citidina (restricción de AC), el número de copias para cada n-mer es el doble del número dado en la Tabla 1. La limitación de base se logra usando, en un paso específico, un paso de adenosina y citidina apropiado. Los 25-mer restringidos de AC son un compromiso que permite la preparación de la muestra práctica y la secuenciación confiable. MÉTODO 2. (Hibridización únicamente; Figuras 3 y 4: Amplificación de oligonucleótidos de n-mer marcados o activables).

En lugar de unir una mezcla completa de oligonucleótidos a un soporte sólido, una muestra fragmentada de oligonucleótidos puede unirse a la misma. El soporte sólido puede ser partículas de sílice, esferas magnéticas o capilares. La muestra unida se trata con una mezcla completa de n-mer, que opcionalmente puede contener una etiqueta completa (tal como fluoresceina o una enzima) o un grupo funcional reactivo (tal como un tiol). Los n-mer de oligonucleótidos no hibridizados se eliminan. Calentado, los n-mer hibridizados se remueven y se recopilan para proveer un conjunto de oligonucleótidos de n-mer que son complementarios para los oligonucleótidos n-mer de la muestra. El proceso puede repetirse tantas veces como sea necesario. MÉTODO 3. (Ligación, Figura 5: Preparación de oligonucleótidos de longitud constante usando ligasa) Esta una variación de Método 2 y se ilustra en la Figura 5. Si "n" es un número grande, por ejemplo, mayor de 30, la preparación de una mezcla completa de n-mer no es práctica. Además, si n es grande, la desigualdad entre los oligonucleótidos es problemática. Ambos de estos problemas pueden evitarse usando dos mezclas completas de k-mer y m-mer, en donde k+m = n. En este método, el extremo 3' de los k-mer no contiene un grupo hidroxilo libre y el extremo 5' de m-mer no contienen un fosfato libre. Esto se puede lograr usando k-mer en los cuales el extremo 3' es didesoxi terminado o el grupo hidroxilo puede ser fosforilado o puede contener una etiqueta, tal como fluoresceina. El extremo 50 de los m-mer puede tener un grupo hidroxilo libre, un grupo funcional marcado o activo. Después de la hibridización se liga la mezcla. Solamente se pueden unir dos oligonucleótidos por ligación. Los oligonucleótidos no ligados se remueven incrementado la temperatura y lavándolos. Si los m-mer tienen un grupo hidroxilo libre en el extremo 5', este grupo hidroxilo puede fosforilarse ahora con un grupo hidroxilo. El oligonucleótido nuevo puede ligarse ahora en el extremo 5'. Este proceso puede repetirse viras veces. Después de la deshibridización, se provee una recopilación de oligonucleótidos n-mer que son complementarios a los oligonucleótidos n-mer presentes en la muestra. MÉTODO 4. (Ligación química, Figura 6: Preparación de oligonucleótidos de longitud constante usando ligación química). Se pueden obtener excelentes resultados si tres oligonucleótidos de muestra, h-mer, k-mer y n-mer, forman juntos un n-mer de oligonucleótidos después de la ligación. La ligación química es un método muy eficiente aunque también se pueden utilizar enzimas. Como se ilustra en la Figura 6, en este caso todos los oligonucleótidos de nuevo se pueden usar como mezclas completas. Una serie tiene un grupo de fosfato en ambos extremos, mientras que las otras dos no tienen fosfatos terminales por lo menos en la forma activa. Una mezcla completa tiene grupos hidroxilo, amino o tiol en el extremo 3', mientras que el otro tiene grupos similares en el extremo 5'. Cuando estos tres tipos de oligonucleótidos se hibridizan y se localizan apropiadamente (de la cabeza a la cola) uno con el otro, son capaces de formar una unión química uno con el otro. Esto se puede lograr mejor si se logran grupos de fosfato, por ejemplo pueden ser triésteres de manera que dos grupos esterificados son pentafluorofenilos o grupos salientes similares. Después del acoplamiento, el pentafluorofenilo extra puede hidrolizarse opcionalmente. Al deshibridizarse, se provee una recopilación de oligonucleótidos n-mer que son complementarios para los oligonucleótidos n-mer que están presentes en la muestra. TRANSFORMACIÓN DE UNA AMPLIFICACIÓN LINEAL EN UNA AMPLIFICACIÓN EXPONENCIAL Las cuatro amplificaciones lineales descritas antes y también otros procedimientos de amplificación lineales análogos pueden transformarse en los exponenciales mediante el método descrito más adelante. En los métodos de amplificación lineales se utilizan oligonucleótidos de muestra como un conjunto de patrón para generar un conjunto de oligonucleótidos complementario. El proceso puede repetirse varias veces pero cada vez se obtiene aproximadamente el mismo número oligonucleótidos complementarios. Cuando se combinan estos oligonucleótidos, el número total de oligonucleótidos depende linealmente del número de los pasos de amplificación. Con el fin de transformar un proceso lineal en un proceso exponencial, los oligonucleótidos complementarios obtenidos en el primer paso se designan de manera que contienen un tiol protegido, tal como acetato de tiol o un grupo amino alifático. Después de la desnaturalización, estos oligonucleótidos se transfieren en una segundo columna que contiene un grupo reactivo capaz de unirse al amino alifático o el grupo tiol, tal como con un maleimido o un grupo de isocianato. Durante la transferencia, se agrega un reactivo desprotector, tal como hidroxilamina, y se expone el grupo tiol. Los oligonucleótidos complementarios inmediatamente se acoplaran con el soporte sólido. Ahora este soporte también puede usarse como un patrón de amplificación lineal. El oligonucleótido amplificado es complementario al oligonucleótido complementario, es decir, idéntico al oligonucleótido de la muestra original, excepto que contienen un grupo amino o tiol alifático protegido. Este producto se dirige a la columna original que contiene un soporte sólido activo similar capaz de unirse al grupo amino o tiol derivado de los oligonucleótidos después de que se remueven los grupos protegidos. Ahora la primera columna contiene el doble del número original de oligonucleótidos que son idénticos a la muestra. Cuando estos se usan como patrones de amplificación, se obtiene dos veces el número original de los oligonucleótidos complementarios. Después de unirse a estos en la segunda columna, esta columna contenderá un número de umbral de oligonucleótidos complementarios comparado con el primer proceso. El proceso puede repetirse varias veces. La amplificación después de en los pasos se obtienen aproximadamente de la ecuación: a = 5*1.64 n-4 en donde a es el coeficiente de amplificación, es decir, cuantas veces es el incremento en el número de oligonucleótidos comparado con la muestra original. El incremento es exponencial, pero el número no se duplica en cada ciclo como lo hace óptimamente en el receptor de RCP. Una venta significativa sobre RCP es que en este procedimiento la muestra y el conjunto de oligonucleótido complementario se mantienen por separado. Esto es altamente importante cuando se usan disposiciones de bio-microcircuitos, debido a que estos procedimientos se basan en gran parte en la hibridización. Si cada oligonucleótido en la muestra tiene una pareja complementaria en la mezcla, puede ser ineficiente la hibridización con la disposición. PREPARACIÓN DE UN DISCO BIO-COMPACTO DE ALTA DENSIDAD En el primer paso de la secuenciación real, los discos bio-compactos (DBC) se diseñan para reconocer los 16-mer en la muestra. Esto se logra por el reconocimiento de (8,{0},8), es decir, el separador tiene brazos laterales de 8-mer y no se usan oligonucleótidos de sondas solubles. Este reconocimiento se denotará también como reconocimiento (8,8). Hay aproximadamente 65*103 diferentes 8-mer y 4.3*109 pares de 8-mer por duplicado (Tabla 4). Cierta área que contiene una esfera dorada se llama biobit. El área de cada biobit es de aproximadamente 100µm2. Esta área se convierte a cientos de separadores que tienen (8,8)-pares similares de oligonucleótidos como brazos laterales. Cada biobit deberá contener únicamente un tipo de cada uno de los pares (8,8) de oligonucleótidos y debe de haber por lo menos un biobit para cada uno de los pares de 8-mer diferentes. Los lectores de CD-ROM actualmente disponibles son capaces de leer 0.6*109 bits de un disco compacto (DC). Por lo tanto, aproximadamente ocho DBC se necesitan para todas las combinaciones de los 8-mer. La densidad de los DC puede incrementarse muchas veces, potencialmente 20 veces, cuando se usan láser semiconductores azules en lugar de los láser de IR. Esto se reflejará casi linealmente en el desempeño incrementado de DBC. Un método de impresión complementario descrito en la presente puede usarse para fabricar patrones complicados de alta resolución en un paso de impresión una vez que se ha creado una estampa complementaria (Figura 7). Los métodos fotolitográficos o métodos de parejas de alta resolución comparable se necesitan para la estampa complementaria. Los oligonucleótidos de brazos laterales inferiores pueden imprimirse en un paso usando la estampa complementaria. De manera similar, los oligonucleótidos de brazos laterales superiores pueden imprimirse en un paso. Por lo tanto, son necesarias dos estampas para fabricar un DBC. Debido a que se deben producir ocho diferentes DBC, la cantidad de diferentes estampas es de 16. FABRICACIÓN DE UN ESTAMPADO COMPLEMENTARIO Un estampado complementario puede usarse miles de veces. Sin embargo, la fabricación del estampado complementario puede requerir decenas de pasos fotolitográficos o de impresión. Los métodos de impresión en esta solicitud tienen una ventaja fundamental sobre los métodos litografieos en cuanto a que los oligonucleótidos pueden purificarse antes de unirlos a la superficie.

La fabricación de estampados complementarios que se puede usar en la estrategia de reconocimiento (8,8) y (8, {11}, 8) se describe en la presente. Aunque deben producirse cuatro pares diferentes de estampados complementarios, cada par es químicamente idéntico, es decir contienen los mismos 16,384 oligonucleótidos (8-mer), pero los canales espirales van en direcciones opuestas (Figura 7). Debido a que hay 65,536 diferentes oligonucleótidos de 8-mer, se necesitan cuatro estampados para tener un conjunto completo, (4x16,384 = 65,536). Las 16 combinaciones posibles de estampados espirales en la dirección de las manecillas del reloj o dirección contraria de las manecillas del reloj dan 4.3 miles de millones de diferentes oligonucleótidos de 16-mer construidos como pares de los oligonucleótidos de 8-mer posibles (Tabla 4): Primero, los canales en espiral (16,384) se imprimen sobre policarbonato suave. Cada canal es de aproximadamente 4 µm de ancho 1-2 µm de profundidad. Esto es similar a los discos compactos de impresión, en cuyo caso la resolución micrométrica es normal. Se prefiere tener fuentes hidrofóbicas, mientras que los canales son hidrofílicos, en el estampado terminado. Los puentes también son de 4 µm de ancho. Con este fin, el disco se reviste con una resistencia y el mismo estampado que se usa para imprimir los canales espirales se usa de nuevo para exponer la parte inferior de los canales. El oxígeno de grabado se usa para remover cualquier resistencia residual de los canales. La superficie se reviste con grupos amino por plasma de amoniaco. La capa de resistencia se remueve de los puentes. Los separadores de glicol de polietileno que tienen, por ejemplo, grupos isotiocianato sobre ambos extremos se unen a los grupos amino. Usando un exceso de separadores solamente un extremo se unirá con la superficie y el otro puede usarse para unir los oligonucleótidos que tiene un grupo amino alifático adicional. Los canales espirales (16,384) preferiblemente están en 256 grupos de 64 canales (256 x 64 = 16,384). Estos grupos se separan de manera que se puede utilizar un método de inyección de tinta o equivalente para cubrir un grupo con cierto oligonucleótido de 4-mer que tiene un grupo amino alifático. Por lo tanto, un oligonucleótido 4-mer conocido está en 64 canales casi diferentes. Cada uno de los posibles 256 4-mer se presenta en uno de los grupos de 256 canales una vez y solamente una vez. El siguiente paso es depositar 64 diferentes oligonucleótidos de 4-mer por separado en cada uno de los 64 canales en un grupo y unirlos químicamente con el primer oligonucleótido 4-mer. En un disco, todos de este segundo oligonucleótido de 4-mer pueden tener el mismo nucleótido terminal. Por ejemplo, A. Después de que se han fabricado cuatro discos químicamente diferentes, todos los oligonucleótidos (A, C, G y T) aparecen en las posiciones terminales sobre un disco. Debido a que hay 256 diferentes grupos, cada uno de los segundos oligonucleótidos de 4-mer aparecen 256 veces sobre el mismo disco.

Los segundos oligonucleótidos de 4-mer pueden imprimirse sobre estas ubicaciones simultáneamente. Para evitar contaminación cada oligonucleótido deberá imprimirse con un estampado dedicado. Todos los estampados parecen exactamente iguales. Tienen 256 canales espirales separados de igual manera (aproximadamente 0.6 mm). Un canal en espiral es de 5-8 µm de ancho. Los canales pueden ser hidrofílicos, mientras que el área entre los es hidrofóbica. Después de humectarse con la solución de oligonucleótidos, solamente los canales retienen la solución, la cual se transfiere parcialmente después del contacto con el substrato. Otro método es grabar las cavidades hidrofílicas en la parte inferior de los canales, que en esta caso son hidrofóbicos (Figura 10). De preferencia estas cavidades se revisten con esferas de látex, que son porosas, hidrofílicas y elásticas (Figura 11). El canal por si mismo es hidrofóbico, de manera que toda la solución de retiene en las esperas. Esto da un mejor control de la cantidad de la solución y la ubicación de la solución tanto en la estampa como en el substrato. Las esferas se unen químicamente la estampa usando química de unión convencional de en una forma adecuada para esferas de látex, por ejemplo usando una unión de amida entre el separador y la esfera de látex. Opcionalmente la esfera de látex se localiza en una dentadura sobre la estampa para unirse más fuertemente. También, los análogos de oligonucleótidos pueden substituirse por los oligonucleótidos anteriores. Esto se aplica especialmente en la estampa complementaria, debido a que algunos análogos de oligonucleótidos son más fácil de acoplar en solución acuosa que en los oligonucleótidos. Por ejemplo, usando carbodiimida soluble en agua, 4-mer que contienen un grupo amino pueden acoplarse con otros 4-mer que contienen un grupo carboxílico. Además, algunos análogos de oligonucleótidos dan hibridizaciones más fuertes que los propios oligonucleótidos y son útiles en el estampado complementario y en la disposición del oligonucleótido final. FABRICACIÓN DE UN DISCO BIO-COMPACTO En la siguiente descripción se supone que los estampados ya están hechos. En el primer brazo lateral inferior se imprimen los oligonucleótidos. Se prepara una mezcla completa de 8-mer. La síntesis se llevó a cabo de manera que el extremo 2' de los oligonucleótidos se conecta con un separador de polietilenglicol (PEG), el cual tiene un grupo tiol en el otro extremo. (Alternativamente el grupo tiol puede estar en el separador estacionario sobre el substrato y el grupo isocianato o maleimido puede estar en el separador de PEG). La solución de la mezcla completa se usa como una tinta para humedecer un estampado (Figura 7, esquina izquierda superior). En una configuración del estampado, los oligonucleótidos estacionarios están sobre las paredes de una ranura que tiene un 1 µm de profundidad (Figura 8: impresión complementaria cóncava). Después de la hibridización se lava el exceso de los oligonucleótidos. El estampado húmedo se prensa firmemente contra DBC, que tiene grupos maleimido en la parte inferior del separador. Los grupos tiol se acoplarán muy rápido con los grupos maleimido. Debido a la distancia relativamente larga, solamente unos cuantos acoplamientos pueden tomar lugar en esta etapa. Para la liberar los oligonucleótidos e impulsar la reacción para completarse, la capa de agua delgada, se calienta por microondas o por radiación de infrarrojos durante aproximadamente 1 minuto. Los oligonucleótidos se liberan de la estampa y después están libres para difundirse. Un oligonucleótido puede difundir 1 µ en un segundo y 8 µm en un minuto. Debido a un exceso de los grupos maleimido, todos los oligonucleótidos derivados de tiol se unirán eficientemente. El paso de impresión se completa y el estampado puede removerse. Las moléculas de separación capaces de separarse ahora tienen un brazo lateral inferior completo. El grupo protector se remueve de la ubicación del brazo lateral superior y el paso de impresión ahora se repite para insertar los oligonucleótidos del brazo lateral superior (Figura 7. Estampado en la esquina derecha superior). En este caso el extremo 5' del oligonucleótido se conecta con el separador de polietilenglicol. Después de lavar y secar el DBC está listo para usarse. ESTRATEGIA DE SECUENCIACIÓN En lugar de tratar de secuenciar todo el genoma en un solo tiempo, los cromosomas pueden separarse y los dos hilos de cada cromosoma pueden separarse. Únicamente un hilo de cada cromosoma necesita secuenciarse; la secuenciación del otro es opcional y sirve como un doble chequeo. Con fines de secuenciación es importante conocer lo que es la probabilidad para un n-mer de que ya se conoce que está dentro del cromosoma se presenta en una segunda vez. Mientras más grande sea el oligonucleótido caracterizado, menor será la probabilidad de que se presente dos veces. Con el fin de lograr secuenciación confiable, esta probabilidad deberá ser más pequeña en cuanto a que los oligonucleótidos caracterizados se presentan solo una vez en el cromosoma, es decir, esta probabilidad deberá ser más pequeña que 4*109. La inspección estrecha de la Tabla 2B revela que para 28-mer esta probabilidad está debajo del límite requerido (1.7*10~9). Para 24-mer la probabilidad correspondiente es 4.4*10"7, lo cual indica que aproximadamente cien de los 24-mer puede presentarse dos veces en el cromosoma. Por lo tanto, sabiendo que 28-mer garantizan la secuenciación única, mientras que los oligonucleótidos más cortos podrían conducir a ambigüedades. Hay aproximadamente 65*1015 diferentes 28-mer. Una disposición que contiene todos estos oligonucleótidos podría tener una área de 130 acres siempre y cuando un olígonucleótido ocupara únicamente 10 µm2. Esta clase de disposición es casi impractica para manufacturar, procesar y leer. Por otro lado, la Tabla 4 indica que los biobit de 14-mer pueden adaptarse en un solo DBC (área de DBC=4.2*104 mm2). Por lo tanto, un reconocimiento de (7,7) podría se conveniente desde un punto de vista únicamente práctico. Como se ve en la Tabla 2A, un 14-mer dado no se encuentra en todos con la probabilidad de 0.393 y se puede encontrar dos o tres veces con las probabilidades de 0.173 y 0.050, respectivamente. Debido a la presentación de frecuencias repetitivas, estas probabilidades son superiores y correspondientemente el número de 14-mer diferentes es inferior; y menor que la mitad de todos los 14-mer posibles probablemente se encuentren en un cromosoma. Sin embargo esto es una probabilidad muy alta para la secuenciación útil de los 14-mer con más cortos para ser útil en la secuenciación de todo el cromosoma todo a la vez. 16-mer pueden ser los oligonucleótidos más cortos que dan suficiente información para la secuenciación de novo y aún están dentro del limite práctico de los DBC. La estrategia de secuenciación se basa en el uso de los DBC que se preparan como se describió antes. El reconocimiento de (8,{0},8) se usa primero. Esto da información de aproximadamente 16-mer que son parte de los cromosomas. Un 16-mer que ya está en un cromosoma puede presentarse una probabilidad de 0.028 también una segunda vez. Tomando en cuenta el tamaño del cromosoma, esta probabilidad indica que hasta un millón de 16-mer pueden presentarse dos veces en un cromosoma. Cada uno de estos conduce a un punto de ramificación en la información de secuencia. Esto podría suprimirse en la Figura 9, en donde a y ß denotan secuencias que llegan y d y e denotan secuencias salientes de cierta secuencia ? de 16-pb. La ramificación idénticas se presenta en otro punto en las secuencia obtenida de esta forma. Si todos los puntos de ramificación se extraen. Un patrón de redes en lugar de una secuencia se obtiene.

Las secuencias posibles sobres estos puntos de ramificación pueden denotarse -?-d o a-?-e y ß-?-e (Figura 9). Solamente dos de estas posibilidades están en el cromosoma real. La secuencia ? está presente, desde luego, en ambos, mientras cada una de las otras secuencias a, ß, d, o e ocurren una sola vez. Por lo tanto, es suficiente encontrar si la secuencia a-?-d o a-?-e está en un cromosoma particular. Inmediatamente puede deducirse que los otros también están en este cromosoma. El método que se usa encontrará ambos simultáneamente de manera que el otro puede usarse simultáneamente como un doble chequeo. La longitud total de los oligonucleótidos estacionarios deberá ser de 26-28 nucleótidos con el fin de obtener una secuencia única sin puntos de ramificación. Debido a que esto es prácticamente imposible, se pueden usar otras estrategias. Una posibilidad es usar un reconocimiento de (8, {11}, 8) como una alternativa, en donde {11} denota una mezcla completa de 11-mer. La muestra se prepara como antes excepto que 27-mer son la longitud blanco. Los oligonucleótidos de la muestra se aplican en el conjunto similar de DBC como se usó antes. Después de la hibridización una mezcla completa de 11-mer se agrega. En algunos casos hay un espacio suficiente dejado para un 11-mer para también ser hibridizado. Después de la ligación los otros se retira por calentamiento moderado y lavado. No se conocerá cuales 11-mer usaron este espacio, pero al operarse se conocerán 8-mer terminales. La Figura 9, muestra únicamente un hibridización posible. Se observaron todas las hibridizaciones posibles, es decir, cambiadas por ±1, ±2, ±3, etc., nucleótidos. La combinación de estos 8-mer portan suficiente información para deducir la secuencia casi en una forma inequívoca (Figura 9B). El reconocimiento (8, {11}, 8) es substancialmente equivalente al reconocimiento completo de 27-mer. Aunque solamente 16 nucleótidos se reconocen por cada elemento del análisis, es decir, cada molécula de separación particular que tienen brazos laterales de 8-mer, este patrón de reconocimiento provee más información que el reconocimiento de los hilos de 16-mer del ADN. Esto se ilustra en la Figuras 12 y 13, en donde por simplicidad, se usa un reconocimiento de (4,4)- y (4, {5}, 4) por comparación como un ejemplo. Si cierta secuencia de 8-mer ocurre dos veces en el ADN, v.gr., A8 de la Figura 12, dos secuencias globales alternativa son posibles. Sin embargo, en un caso análogo (A +A4) como se ilustra en la Figura 13, el reconocimiento de (4, {5}, 4) provee un resultado no ambiguo. Esto se debe a que las subsecuencias precedentes y después la generación contiene información común (subrayado en la Figura 13), es decir la secuencia TATT y la secuencia GTGG, respectivamente. Consecuentemente, en una forma similar, se podría usar un reconocimiento de (8,{11},8) para secuenciar un segmento de 27-mer sin usar el reconocimiento (8,8), aunque el uso concomitante de ambos preferiblemente para obtener los resultados más ciertos posibles.

En la práctica, varios discos bio-compactos se usan para completar la secuenciación del genoma. En una modalidad preferida, las moléculas de separación se forman con dos brazos laterales de oligonucleótidos de 8-mer, un entre cada uno de los dos extremos de la molécula de separación y el sitio de separación. Todas las secuencias posibles de los oligonucleótidos de 8-mer se representan en los brazos laterales. La ubicación de cada uno de los pares 8-mer posibles de las secuencias unidas a las moléculas separadas sobre la superficie se determina en el proceso de manufactura de manera que la presencia o ausencia de cualquier secuencia particular puede detectarse. En la práctica, cada disco puede contener subgrupos conocidos de todas las secuencias posibles con el fin de tener un disco bio-compacto de tamaño razonable que puede utilizarse con instrumentación comúnmente disponible. Antes del contacto del elemento de análisis, es decir la superficie que tienen las moléculas de separación descritas antes unidas a las ubicaciones predeterminadas una mezcla de oligonucleótidos de 11-mer solubles que tienen todas las secuencias posibles se agrega a la muestra que será probada y la solución resultante se aplica a la superficie de los dichos bio-compactos. Las secuencias respectivas del fragmento de oligonucleótidos de la muestra se unen a las secuencias complementarais sobre las moléculas de separación y se ligan los segmentos unidos. Las secuencias respectivas entonces se determinan como se describió previamente. Para eficiencias de economía y tiempo, ei método anterior puede repetirse en paralelo para los demás segmentos de 27-mer. La recopilación de información de los segmentos de 27-mer se utiliza para determinar toda la secuencia del genoma de métodos conocidos. Mientras que la descripción anterior se dirige al uso del reconocimiento de (8,{11},8)-mer, el método se aplica al reconocimiento de (p,{q},r)-mer en general, en donde p, q y r son números enteros seleccionados de los números enteros 4-10,000, más ventajosamente 6-26 y (p + q + r) no excede 30,00, más ventajosamente 60. Generalmente se prefiere que p = 4 y q>p. Debido a que la sonda de oligonucleótido soluble (q) deberá unirse fuertemente o sea que no se separe del oligonucleótido de la muestra durante la hibridización con sondas estacionarias (p y r), se requiere que q>p. Esto se puede lograr usando algunos análogos de oligonucleótidos solubles, tales como oligonucleótidos de péptidos, que se hibrídizan muy fuertemente. Para lograr una hibridización a temperatura constante p y r deberán ser iguales. Sin embargo, por la misa razón las sondas de oligonucleótidos que contienen muy poca citidina o guanidina deberán hacerse más grandes para obtener una unión más fuerte. Para los genomas pequeños y para las secuencias de genes humanos individuales o grupos de genes es adecuado p = r=7, y q = 9. En este caso un disco es suficiente para la secuenciación. Con el fin de medir secuencias de repetición que comprenden una gran parte del genoma humano, p, q, y r, pueden ser muy grande, aproximadamente 'de 100-10,000. La fuerza centrifuga o electromagnética puede usarse para medir la resistencia de unión.

La ligación se puede usar opcionalmente para revisar la presencia o ausencia de espacios en la doble hélice. Los niveles de expresión del gen pueden medirse por este sistema. Con frecuencia se prefiere usar fragmentos muy grandes para el reconocimiento. Esto ahorra espacio. La desigualdad no es un problema serio en el estudio de expresión de genes y por lo tanto, el uso de oligonucleótidos de sonda más pequeños no provee una gran ventaja. FRACCIONACIÓN DE LA MUESTRA La muestra que contiene fragmentos de oligonucleótidos puede aplicarse directamente sobre la superficie de DBC. Sin embargo, se prefiere que la muestra se fraccione en por lo menos ciertas subclase en por lo menos cierta subclase. Una subclase dada puede localizarse en cierta área sobre la superficie del DBC incrementando la probabilidad de la hibridización disminuyen la probabilidad de desigualación si las fracciones y el emparejamiento de DBC se diseñan apropiadamente. La desigualdad es uno de los problemas peores en el uso de disposiciones de oligonucleótidos. La desigualdad es más frecuente entre oligonucleótidos que difieren en un nucleótido. A pesar de esto, muchas disposiciones de oligonucleótidos se fabrican de manera que los sitios de oligonucleótidos vecinos difieren únicamente por un nucleótido. El siguiente procedimiento permite la fabricación de la disposiciones y sistemas de fraccionación que contienen una subclase de oligonucleótidos en los cuales todos los oligonucleótidos son diferentes en por lo menos dos pares de base. Este procedimiento puede extenderse para crear una subdisposición, en donde cada oligonucleótido tiene por lo menos tres nucleótidos diferentes cuando se comparan unos con otros oligonucleótidos en esa subdisposición. Para garantizar que en cierta subclase n-mer de oligonucleótidos cada oligonucleótido difiere uno del otro por lo menos por dos nucleótidos, esta subclase deberá construirse eligiendo n/2 cuartetos del oligonucleótidos diméricos de la Tabla 5. Se supone que n se divide en 2. Como un ejemplo, una subclase de oligonucleótidos tetraméricos (n = 4) se generan eligiendo dos cuartetos (4/2=2) de dímeros, por ejemplo, los cuartetos 1 y 3. Dieciséis oligonucleótidos tetraméricos pueden generarse combinando un dímero del cuarteto 1 con otro dímero del cuarteto 3. Estos dieciséis tetrámeros se muestran en la Tabla 6. Dos tetrámeros en uno hilera difieren por dos nucleótidos, como los tetrámeros en una columna. Dos tetrámeros tomados desde dos hileras diferentes y columnas difieren por cuatro nucleótidos. Todas las dieciséis subclases de oligonucleótidos tetraméricos pueden generarse usando la Tabla 5. Cada subclase contiene dieciséis oligonucleótidos y por lo tanto, 256 (16 x 16 = 256) oligonucleótidos tetraméricos se generarán y cada es un miembro de uno y solamente una subclase. Similarmente, los n-mer de oligonucleótidos (en donde n es parejo) pueden dividirse en subclases. El número de subclases es 4n/2 y cada una contiene 4n/2 oligonucleótidos, es decir, el total es 4n como debe de ser. La construcción de los n-mer de oligonucleótidos de dímeros únicamente es conceptual y no es una limitación de la síntesis real que puede llevarse a cabo derivados de nucleótidos moméricos, diméricos, etc., como se describe en otras partes. Sin embargo, los dímeros provienen de la forma más práctica para la síntesis de las disposiciones diseñadas usando la Tabla 5. La secuenciación se lleva a cabo ventajosamente usando el reconocimiento (8,8), o (8, {11}, 8) o la combinación de estos. Los oligonucleótidos de muestra pueden fraccionarse primero en subclases 44 (246) basadas en las secuencias 8-mérica en el extremo 3' de cada oligonucleótido. Cada una de estas subclases además se fracciona en 256 subclases de base sobre el extremo 5' de cada oligonucleótido. Por lo tanto, todas subclases juntas 48 (65,536) se obtienen. Cada una de estas subclases contienen 48 (8,8) pares de oligonucleótidos. Una subclase cubrirá aproximadamente 0.25 mm x 0.25 mm sobre el DBC. Con el fin de obtener 4d subclases sobre sus propios sitios sobre ei disco la muestra deberá fraccionarse. Esta tarea también puede llevarse a cabo por un DBC cerrado (Disklab) como se describe en lo siguiente, para el caso de reconocimiento de (4,4). Los oligonucleótidos cortos se usan como un ejemplo para simplificar figuras. Ahora tanto los primeros como los segundos oligonucieótidos de reconocimiento pueden dividirse en 42 (=16) subclases, es decir que son 16 x 16 (=256) combinaciones. Este ejemplo puede generalizarse en una forma obvia por oligonucleótidos más largos. El disco de fraccionación consiste de dos discos separados que se sujetan juntos al que se pueden desunir cuando es necesario. La estructura general de la mitad se describe en la Figura 14A. La estructura del disco se describe partiendo de la parte interna y moviéndose hacia afuera. El círculo más pequeño en el centro es un orificio que es opcional para manejar y girar. El área no estructurada entre dos círculos es un recipiente para una solución reguladora de elución. El área que se divide en dieciséis compartimentos por paredes dobles es una columna de fraccionación circular. Esta primera fraccionación se lleva a cabo en esta parte. Los dieciséis canales espirales pueden usarse en el segundo paso de fraccionación. Finalmente, el perímetro externo no estructurado se usa para recolectar desecho. En la parte superior del primer disco se coloca un segundo dichos (Figura 14B) que se reviste con dieciséis subclases de oligonucleótidos de manera que forman el patrón en dirección contraria a las manecillas del reloj de espiralina. Este disco se llama un disco lector. Ei disco colector puede ser plano o puede ser igualado mecánicamente. En cualquier caso los canales en el primer dichos deben sellarse de manera que la solución reguladora de elusión y los fragmentos de ADN no se intercambien entre los canales cubiertos que son llamados más apropiadamente capilares, cuando se sujetan dos discos juntos. La Figura 14 describe una vista superior del disco operativo. Únicamente una zona de subclase se muestra que provee claridad. Esta zona como las otras quince zonas se interceptan con los dieciséis capilares. Todos juntos son 256 intersecciones en esta modalidad de la invención. La parte central del disco que contiene la primera son de fraccionación se describe en mayor detalle en la Figura 15. Cada una de las dieciséis cámaras contienen un soporte sólido empacado sueltamente revestido con ciertas subclases de oligonucleótidos 8-mérica. Un extremo 4-mérico, para el ejemplo del extremo 3', de estos oligonucleótidos se forma de acuerdo con la Tabla 5. El otro extremo 4-mérico (extremo 5') contiene todas las combinaciones 4-méricas posibles. Cada uno de las dieciséis subclases del extremo 3' 4-mérico ocurre en una y solamente en una cámara. La muestra se circula en una temperatura óptima bombeando. La bomba puede ser externa o interna. Después de que se alcanza un equilibrio, la muestra no unida se remueve y el soporte sólido se lava para remover los oligonucleótidos unidos sueltamente y no unidos. El disco se calienta, por ejemplo, por radiación IR para desnaturalizar los oligonucleótidos hibridizados y gira muy rápido, por ejemplo 200 -50,000 rpm, de manera que las válvulas se abren a fuerza centrifuga. La unidad de fraccionación también puede ser un módulo que puede revestirse en relación con el resto del disco de manera que las 32 válvulas se abrían simultáneamente. En este caso las válvulas pueden ser orificios simples que se cubren en una posición y se abren en otra posición. La solución regulara de elución puede tener los oligonucleótidos desnaturalizados en los capilares cada uno de los cuales tiene dieciséis subclases de oligonucleótidos 8-méricos en forma de zonas en su propia pared. En este caso cada subclase 8-mérica se forma completamente de acuerdo con la Tabla 5. Por lo tanto, cada una de las dieciséis fracciones será dividida además en dieciséis fracciones. Estas fracciones pueden unirse con el disco colector que se separa del otro disco. El disco colector se coloca en la parte superior del disco de secuenciación que se iguala análogamente. La resolución en el disco de secuenciación generalmente es, pero no necesariamente es bastante superior que el disco colector. El propósito de este método de fraccionación es concentrar una clase recta de secuencias cerradas sus oligonucleótidos de son complementarios. Usando oligonucleótidos de longitud constante esta fracción se mejora más. En cualquier caso este método incrementa bastamente la concentración de la clase recta de oligonucleótidos en donde pueden detectarse. Mientras que esta invención se ha descrito con respecto a algunas modalidades específicas, se entiende que las modificaciones y equivalentes y variaciones de la misma serán evidentes para alguien experto en la materia y se pretende que se incluyan dentro del alcance de las reivindicaciones anexas a la misma.

Tabla 1. Peso de todos los n- No. promedio de mers (mg) copias de cada oligonucleótico en 10 ml. 16-mers 34 .3* 10 3*108 24-mers 33 .2* 10 -4 3*103 26-mers 57 MO"3 180 28-mers 0.86 11 31-mers 71 .3 Tabla 2A. La probabilidad de no encontrar en todo o de encontrarlo una vez, dos veces o tres veces un n-mer dado (n = 14, 16, 17, 18 ó 19) en un cromosoma. 14-mer 16-mer 17-mer 18-mer 19-mer P(0) 0.393 0.943 0.986 0.996 0.999 P(D 0.366 5.5*10" 1.4*10" 3.6*10" 9.1*10 -4 P(2) 0.173 1.6*10" 1.0*10" 6.6*10 -6 4.1*10 -7 P(3) 0.050 3.1*10" 5.1*10" 8.0*10- 1.3*10 •10 P(2.3) 0.397 2.8*10" 7.3*10" 1.8*10" 4.6*10 -4 P(1,3) No. Total de 60*10É 7.0*10' 1.8*10* 0.45*10 0.11*10 oligonucleótidos con frecuencia >1 Tabla 2B. La probabilidad de encontrar en todo o de encontrarlo una vez, dos veces o tres veces un n-mer dado (n=20, 21, 22, 24 ó 28) en un cromosoma. 20-mer 21-mer 22-mer 24-mer 28-mer P(1) 2.3*10"4 5.7*10"5 1.4*10"5 8.9*10"9 3.5*10"9 P(2) 2.6*10"8 1.6*10"9 1.0*10"10 3.9*10"13 6.0*10"18 P(3) 2.0*10"12 3.1*10"14 4.8*10"16 1.2*10"19 7.0*10"27 PÍ2.3) 1.1*1 O"4 2.8*10"5 7.1*10"6 4.4*10"7 1.7*10"9 P(1,3) No. Total de 28*10' 7.1*10; 1.1*10¿ 111 0.43 oligonucleótidos con frecuencia >1 Tabla 3. Aspectos Importantes Un cromosoma contiene un máximo de 250*106 pares de base (cromosoma 1). Número de 400 µm2 puntos/DBC es de 105. El área de DBC es de 4.2*104 mm2. Tabla 4. Número de n-mers y el área total de biobits. 4n No contienen Puntos/DBC todos los n-mers como 100µm2 oligopixeles 4 256 5 1024 6 4096 0.4mm2 1.0*10* 7 16*103 1.6mm2 2.5*10' 8 65*103 6.5mm2 6.2*10; 9 260*103 26mm2 1.6*10; 10 1.0*106 100mm2 11 4.2*106 400mm2 12 16.8*106 1.6*103mm2 13 67.1*106 6.4*103mm2 14 268*106 26*103mm2 15 1.1 *1 O9 16 4.3*109 Tabla 5 Cuatro cuartetos de oligonucleótidos diméricos que pueden usarse para construir subclases de oligonucleótidos 1 2 3 4 AA AC AG AT CC CG CT CA GG GT GA GC TT TA TC TG Tabla 6 Una subclase de dieciséis oligonucleótidos tetraméricos generados usando los cuartetos 1 y 3 de la Tabla 5. AA-AG CC-AG GG-AG TT-AG AA-CT CC-CT GG-CT TT-CT AA-GA CC-GA GG-GA TT-GA AA-TC CC-TC GG-TC TT-TC LISTA DE SECUENCIAS (1) INFORMACIÓN GENERAL (i) SOLICITANTE: BURNSTEIN LABORATORIES, INC. (ii) TÍTULO DE LA INVENCIÓN: SECUENCIADOR DE GENES Y MÉTODOS (iii) NÚMERO DE SECUENCIAS: 23 (iv) DIRECCIÓN DE CORRESPO DENCIA: (A) DESTINATARIO: Howrey & Simón (B) CALLE: 1299 Pennsylvania Avenue N.W. (C) CIUDAD: Washington (D) ESTADO: DC (E) PAÍS: USA (F) Z.P.: 20004 (v) FORMA LEÍBLE EN COMPUTADORA (A) TIPO DE MEDIO: Disquete (B) COMPUTADORA: Compatible con IBM (C) SISTEMA OPERATIVO: DOS (D) SOFTWARE: FastSEQ para Windows Versión 2.0 (vi) DATOS DE SOLICITUD ACTUAL: (A) NÚMERO DE APLICACIÓN: PCT/US98/03362 (B) FECHA DE PRESENTACIÓN: 20-FEB-1998 (C) CLASIFICACIÓN: (vii) FECHA DE APLICACIÓN DE PRIORIDAD: (A) NÚMERO DE APLICACIÓN: (B) FECHA DE PRESENTACIÓN: (viii) INFORMACIÓN DE APODERADO/AGENTE: (A) NOMBRE: Halluin, Albert P. (B) NÚMERO DE REGISTRO: 25,227 (C) TELEX: 01296.0011. PCOO (ix) INFORMACIÓN DE TELECOMUNICACIONES: (A) TELÉFONO: 650-463-8109 (B) TELEFAX: 650-463-8400 (C) TELEX: (2) INFORMACIÓN POR SEQ ID NO:1: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 16 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: desconocido (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:1: GGTTAAAAAA AACCCC 16 (2) INFORMACIÓN POR SEQ ID NO:2: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 16 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:2: CCCCAAAAAA AATTTT 16 (2) INFORMACIÓN POR SEQ ID NO:3: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:3: GGTTAAAA 8 (2) INFORMACIÓN POR SEQ ID NO:4: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 9 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:4: GTTAAAAAA ! (2) INFORMACIÓN POR SEQ ID NO:5: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:5: GTAAAAAA 8 (2) INFORMACIÓN POR SEQ ID NO:6: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:6: TAAAAAAA 8 (2) INFORMACIÓN POR SEQ ID NO:7: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:7: AAAAAAAA 8 (2) INFORMACIÓN POR SEQ ID NO:8: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:8: AAAAAAAC 8 (2) INFORMACIÓN POR SEQ ID NO:9: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:9: AAAAAACC 8 (2) INFORMACIÓN POR SEQ ID NO:10: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:10: AAAAACCC 8 (2) INFORMACIÓN POR SEQ ID NO:11: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:11: AAAACCCC (2) INFORMACIÓN POR SEQ ID NO:12: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:12: AAAACCCC (2) INFORMACIÓN POR SEQ ID NO:13: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:13: CCCAAAAA (2) INFORMACIÓN POR SEQ ID NO:14: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:14: CCAAAAAA (2) INFORMACIÓN POR SEQ ID NO:15: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (¡i) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:15: CAAAAAAA (2) INFORMACIÓN POR SEQ ID NO:16: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:16: AAAAAAAT (2) INFORMACIÓN POR SEQ ID NO:17: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:17: AAAAAATT (2) INFORMACIÓN POR SEQ ID NO:18: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:18: AAAAATTT (2) INFORMACIÓN POR SEQ ID NO:19: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 8 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:19: AAAATTTT 8 (2) INFORMACIÓN POR SEQ ID NO:20: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 16 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:20: GGTTAAAAAA AATTTT 16 (2) INFORMACIÓN POR SEQ ID NO:21: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 16 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:21: CCCCAAAAAA AACCCC 16 (2) INFORMACIÓN POR SEQ ID NO:22: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 22 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:22: GGGGAAAATT ATTAAAACCC GG 22 (2) INFORMACIÓN POR SEQ ID NO:23: (i) CARACTERÍSTICAS DE SECUENCIA: (A) LONGITUD: 22 pares de base (B) TIPO: ácido nucleico (C) FORMA DE HILO: sencillo (D) TOPOLOGÍA: lineal (ii) TIPO DE MOLÉCULA: ADN genómico (xi) DESCRIPCIÓN DE SECUENCIA: SEQ ID NO:23: CCCCAAAAGG TGGAAAAGGG CC 22

Claims

REIVINDICACIONES 1. Un método para obtener oligonucleótidos n-mer de una muestra que contiene fragmentos de oligonucleótidos que comprenden: (a) formar un soporte sólido que tienen todos los n-mer de oligonucleótidos posibles unidos a una molécula de separación que se une a la superficie del soporte; (b) poner en contacto el soporte sólido que resulta del paso (a) con la muestra bajo condiciones que ocasionan que la muestra de oligonucleótidos se hibridicen con los oligonucleótidos de n-mer complementarios en el soporte sólido; (c) poner en contacto el soporte sólido que resulta del paso (b) con un agente de hidrolización; (d) separar los oligonucleótidos no unidos de los oligonucleótidos hibridizados; y (e) desnaturalizar los oligonucleótidos de n-mer hibridizados para obtener losoligonucleótidos n-mer de la muestra; en donde n es un número entero seleccionado de los fragmentos 4-10,000, más ventajosamente de 6-28.
2. Un método para obtener oligonucleótidos n-mer de una muestra que contiene fragmentos de oligonucleótidos que comprenden: (a) poner en contacto soporte sólido, adaptado para unirse a una molécula de separación para acoplarse con oligonucleótidos en la muestra, con por lo menos una porción de la muestra; (b) poner en contacto el soporte sólido que resulta del paso (a) con una mezcla de oligonucleótidos de n-mer para hibridizarse con los oligonucleótidos de la muestra sobre ei soporte sólido; (c) separar los oligonucleótidos n-mer hibridizados de los oligonucleótidos no hibridizados; y (d) desnaturalizar los oligonucleótidos de n-mer hibridizados para obtener los oligonucleótidos n-mer que son complementarios con los oligonucleótidos en la muestra; en donde n es un número entero seleccionado de los fragmentos 4-10,000, más ventajosamente de 6-28.
3. Un método para obtener oligonucleótidos n-mer de una muestra que contiene fragmentos de oligonucleótidos que comprende: (a) poner en contacto un soporte sólido está adaptado para unirse a una molécula de separación, el soporte sólido teniendo unido en el mismo una pluralidad de fragmentos de oligonucleótidos de una muestra con una mezcla de una pluralidad de primeros k-mer, cada uno sin un grupo hidroxilo libre en el extremo 3' del mismo, y una pluralidad de segundos oligonucleótidos m-mer, cada uno estando sin un grupo de fosfato libre en el extremo 5' del mismo; (b) ligar los primero y segundo oligonucleótidos hibridizados con los oligonucleótidos de muestra sobre el soporte sólido que resulta del paso (a); (c) remover los oligonucleótidos no ligados del soporte sólido; y (d) desnaturalizar los oligonucleótidos n-mer hibridizados restantes sobre el soporte sólido para obtener los oligonucleótidos n-mer complementarios con aquellos que están presentes en la muestra; en donde m, k y n son cada uno un número entero seleccionado de los números enteros de 4-10,000, más ventajosamente 6-28, siempre y cuando k+m = n.
4. Un método para obtener oligonucleótidos de n-mer de una muestra que contienen fragmentos de oligonucleótidos que comprenden: (a) poner en contacto el soporte sólido que tiene unido sobre el mismo una pluralidad de oligonucleótidos de la muestra con una mezcla de una pluralidad de oligonucleótidos h-mer cada uno teniendo un grupo fosfato en ambos extremos 3' y 5', una pluralidad de oligonucleótidos i-mer cada uno teniendo un grupo hidroxilo, amino o tiol en el extremo 3' y ningún grupo fosfato terminal, y una pluralidad de oligonucleótidos j-mer que tienen un grupo hidroxilo, amino o tiol en el extremo 5' y ningún grupo fosfato terminal; (b) ligar química o enzimáticamente los oligonucieótidos sobre los soportes sólidos que resultan del paso (a); (c) remover los oligonucleótidos no ligados del soporte sólido que resultan del paso (b); y (d) desnaturalizar los oligonucleótidos n-mer hibridizados restantes sobre el soporte sólido para obtener los nucleótidos n-mer complementarios con aquellos presentes en la muestra; en donde h, i y j son cada uno un número entero seleccionado de los números enteros de 6-10,000, más ventajosamente de 18-60, siempre y cuando h + i+j = n.
5. Un elemento de análisis que comprende: un substrato que tiene una superficie que incluye una pluralidad de áreas discretas sobre la superficie adaptada para unirse a una molécula de separación; una pluralidad de moléculas de separación unidas a un primer extremo a dicha superficie en cada una de las áreas discretas, cada una de las moléculas de separación adaptadas para unirse en su segundo extremo a una superficie metálica o a una etiqueta, cada una de las moléculas de separación teniendo un sitio entre su primer extremo y su segundo extremo capaces de separarse; un primer oligonucleótido n-mer teniendo una primera secuencia unida substancialmente a todas las moléculas de separación entre el sitio de separación y el primer extremo de la molécula de separación, y; un segundo oligonucleótido n-mer teniendo una segunda secuencia unida substancialmente a todas las moléculas de separación; en donde n y m son números enteros seleccionados de los números enteros 4-10,000, más ventajosamente 2-28.
6. Un método para determinar la secuencia de un segmento (p + r)-mer de un gen que se sospecha que está presente en una muestra comprendiendo: (a) poner en contacto un elemento analizado con por lo menos una porción de una solución de muestra que contiene un segmento (p + r)-mer no conocido de un gen, el elemento analizado teniendo una superficie y pluralidad de moléculas de separación unidas a la superficie, las moléculas de separación teniendo un primer extremo unido a la superficie y un segundo extremo unido a una superficie metálica o una etiqueta y un sitio de separación intermediario de los primero y segundo extremos, las moléculas de separación además teniendo un primer oligonucleótido p-mer unido al mismo entre el sitio de separación y el primer extremo y un segundo oligonucleótido r-mer unido al mismo entre el sitio de separación y el segundo extremo, las combinaciones de p-mer y r-mer incluyendo todas la combinaciones de secuencias de oligonucleótidos de un oligonucleótido p-mer y r-mer, u, opcionalmente, un subgrupo de dichas combinaciones, cada combinación particular de secuencias de los oligonucleótidos p-mer y r-mer estando en una ubicación predeterminada sobre la superficie; (b) detectar la presencia o ausencia de una combinación de secuencia particular de los oligonucleótidos hibridizados en cada ubicación predeterminada sobre la superficie; y (c) procesar la información de secuencia obtenida del paso (b) para deducir la secuencia del oligonucleótido (p + r)-mer presente en la muestra; en donde p y r son números enteros seleccionados de los números enteros 4-10,000, más ventajosamente es 6-28, y (p + r) no excede 30,000, y más ventajosamente es 60.
7. El método de la reivindicación 6, comprendiendo además el paso de ligar los oligonucleótidos hibridizados resultantes unidos a las moléculas de separación resultantes del paso (a) antes de detectar la presencia o ausencia de una combinación de secuencia particular de los oligonucleótidos hibridizados en cada ubicación predeterminada sobre la superficie.
8. El método de la reivindicación 8, en donde los pasos (a)-(d) se llevan a cabo en paralelo para diferentes segmentos múltiples del gen.
9. Un método para determinar la secuencia de un segmento (p + q + r)-mer de un gen que se sospecha que está presente en una muestra comprendiendo: (a) formar una solución de una muestra y una mezcla de los oligonucleótidos q-mer teniendo todas las secuencias posibles de los oligonucleótidos q-mer, u, opcionalmente un subgrupo de dichas secuencias posibles; (b) poner en contacto un elemento analizado con por lo menos una porción de la solución del paso (a), el elemento analizado teniendo una superficie y pluralidad de moléculas de separación unidas a la superficie, las moléculas teniendo un primer extremo unido a la superficie y un segundo extremo unido a una superficie metálica o marcada y un sitio de separación intermediario de los primero y segundo extremos, las moléculas además teniendo un primer oligonucleótido p-mer unido a la misma entre el sitio de separación y el primer extremo y un segundo oligonucleótido r-mer unido a la misma entre el sitio de separación y el segundo extremo, la combinación de p-mer y r-mer incluyendo todas las combinaciones de secuencias de oligonucleótidos de oligonucleótidos p-mer y r-mer, u, opcionalmente, un subgrupo de dichas combinaciones, cada combinación particular de secuencias de ios oligonucleótidos estando en una ubicación predeterminada sobre la superficie; (c) detectar la presencia o ausencia de una combinación de secuencia particular de los oligonucleótidos hibridizados a cada ubicación predeterminada sobre la superficie; y (d) procesar la información de secuencia obtenida del paso (c) para deducir la secuencia del oligonucleótido (p + q + r) presente en la muestra; en donde p y q son números enteros seleccionados de los números enteros 4-10,000, más ventajosamente es 6-28, y (p + q + r) no excede 30,000, y más ventajosamente es 60.
10. El método de la reivindicación 9, que comprende además el paso de ligar los oligonucleótidos hibridizados resultantes unidos a las moléculas de separación que resultan del paso (b).
11. El método de la reivindicación 9, en donde los pasos (a)-(b) se llevan a cabo en paralelo para diferentes segmentos múltiples de un gen.
12. El método de la reivindicación 9, en donde cada uno de p o r, o tanto p como r, no son ¡guales a q.
13. El método de la reivindicación 9, en donde tanto p como r son números enteros de 7 a 9 y q es un número entero de 9 a 12.
14. Un método para determinar la secuencia de un gen no conocido se sospecha que está presente en una muestra que comprende: (a) llevar a cabo un método de la reivindicación 6, en donde los pasos (a)-(d) se llevan a cabo en paralelo por diferentes segmentos múltiples (p + r)-mer del un gen; (b) llevar a cabo un método de la reivindicación 9, en donde los pasos (a)-(e) se llevan a cabo en paralelo para diferentes segmentos (p + q + r) de un gen; (c) procesar la información de secuencia obtenida délos pasos (a) y (b) para deducir la secuencia del gen no conocido presente en la muestra; en donde p y q son números enteros seleccionados de los números enteros 4-10,000, más ventajosamente es 6-28, y (p + q + r) no excede 30,000, y más ventajosamente de 60.
15. El método de la reivindicación 14, en donde uno de p ó r es, o tanto p como r no son iguales a q.
16. El método de la reivindicación 14, en donde tanto p como r son números enteros de 7 a 9 y q es un número entero de 9 a 12.