ES2713653T3 - Análogos nucleotídicos para secuenciación - Google Patents

Análogos nucleotídicos para secuenciación Download PDF

Info

Publication number
ES2713653T3
ES2713653T3 ES14769128T ES14769128T ES2713653T3 ES 2713653 T3 ES2713653 T3 ES 2713653T3 ES 14769128 T ES14769128 T ES 14769128T ES 14769128 T ES14769128 T ES 14769128T ES 2713653 T3 ES2713653 T3 ES 2713653T3
Authority
ES
Spain
Prior art keywords
nucleotide
photocleavable
termination
residue
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14769128T
Other languages
English (en)
Inventor
Mark A Hayden
Jeffrey Huff
Mark W Eshoo
John Picuri
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ibis Biosciences Inc
Original Assignee
Ibis Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibis Biosciences Inc filed Critical Ibis Biosciences Inc
Application granted granted Critical
Publication of ES2713653T3 publication Critical patent/ES2713653T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

Un análogo nucleotídico que comprende: a) un nucleótido que comprende un resto fosfato, una base y un azúcar; b) un resto de terminación fotoescindible, detectable electroquímicamente, unido al nucleótido; y c) un segundo resto de terminación fotoescindible unido al nucleótido.

Description

DESCRIPCION
Analogos nucleotidicos para secuenciacion
Campo de la invencion
En el presente documento se proporciona tecnologfa relacionada con la secuenciacion de acidos nucleicos, pero no exclusivamente, con composiciones, metodos, sistemas y kits relacionados con nucleotidos que comprenden un resto detectable electroqmmicamente y uno o mas restos inhibidores de la smtesis fotolabiles.
Antecedentes
La secuenciacion del ADN esta impulsando la investigacion y el descubrimiento de la genomica. La finalizacion del Proyecto Genoma Humano fue un logro monumental con una increfble cantidad de esfuerzos combinados entre los centros del genoma y los cientificos de todo el mundo. Este proyecto de una decada se completo con el metodo de secuenciacion de Sanger, que sigue siendo la metodologfa basica de secuenciacion del genoma en los centros de secuenciacion de genoma de alto rendimiento. La razon principal detras del exito prolongado de este metodo es su metodo basico y eficiente, aunque elegante, metodo de terminacion de cadena dideoxi. Con mejoras crecientes en la secuenciacion de Sanger, que incluyen el uso de la excitacion fluorescente inducida por laser de los colorantes de transferencia de energfa, las ADN polimerasas disenadas, la electroforesis capilar, la preparacion de muestras, la informatica y el software de analisis de secuencias, la plataforma de secuenciacion de Sanger ha podido mantener su estado. Los actuales secuenciadores de ADN basados en Sanger de ultima generacion pueden producir mas de 700 bases de secuencia claramente legible en una sola ejecucion desde los moldes hasta 30 kb de longitud. Sin embargo, como ocurre con la mayona de las invenciones tecnologicas, las mejoras continuas en esta plataforma de secuenciacion han llegado a un estancamiento, con una estimacion del coste actual para producir una secuencia borrador de genoma microbiano de alta calidad en aproximadamente 10.000 dolares americanos por par de megabases. Los secuenciadores de ADN actuales basados en el metodo de Sanger permiten analizar en paralelo hasta 384 muestras.
Es evidente que la explotacion de la secuencia completa del genoma humano para la medicina clmica y la atencion medica requiere metodos precisos de secuenciacion de ADN de bajo costo y alto rendimiento. De hecho, tanto el sector publico (National Human Genome Research Institute, NHGRI) como en el sector privado de ciencias genomicas (The J. Craig Venter Science Foundation and Archon X prize for genomics) han emitido una llamada al desarrollo de tecnologfa de secuenciacion de "proxima generacion" que reduzca el coste de la secuenciacion a una decima parte de su coste actual en los proximos diez anos. En consecuencia, para superar las limitaciones de las tecnologfas de secuenciacion convencionales actuales, se han investigado diversos nuevos metodos de secuenciacion de ADN, incluidos los enfoques de secuenciacion por smtesis (SBS), tales como pirosecuenciacion (Ronaghi et al. (1998) Science 281: 363-365), secuenciacion de moleculas de ADN individuales (Braslaysky et al. (2003) Proc. Natl. Acad. Sci. USA 100: 3960-3964) y colonias de polimerasa (secuenciacion "polonia") (Mitra et al. (2003) Anal. Biochem. 320: 55-65).
Algunas tecnologfas de secuenciacion de proxima generacion convencionales incluyen metodos de deteccion optica de una sola molecula, por ejemplo, como se usan en tecnologfas desarrolladas por PacBio; metodos opticos (clonales), por ejemplo, como se usan en las tecnologfas desarrolladas por Illumina; y metodos basados en nucleotidos marcados con fluorescencia (incluidos los que utilizan la fotodesproteccion), por ejemplo, como se usa en la tecnologfa desarrollada por Lasergen. Dichos metodos tienen diversos grados de ventajas y desventajas, pero el desaffo importante hasta ahora ha sido el problema de realizar tales analisis de secuencia con sistemas de instrumentacion de coste ultrabajo con reactivos desechables y de bajo coste.
El concepto de secuenciacion por smtesis de ADN (SBS) se revelo en 1988 con un intento de secuenciar el ADN detectando el grupo pirofosfato que se genera cuando se incorpora un nucleotido mediante una reaccion de ADN polimerasa (Hyman (1999) Anal. Biochem. 174: 423-436). Las tecnologfas SBS posteriores se basaron en formas adicionales para detectar la incorporacion de un nucleotido a una cadena de a Dn en crecimiento. En general, la SBS convencional utiliza un cebador oligonucleotfdico disenado para hibridar con una posicion predeterminada de la molecula del molde de muestra que se va a secuenciar. El complejo cebador-molde se presenta con un nucleotido en presencia de una enzima polimerasa. Si el nucleotido es complementario a la posicion en la molecula del molde de muestra que esta directamente en 3' del extremo del cebador oligonucleotfdico, la ADN polimerasa extendera el cebador con el nucleotido. La incorporacion del nucleotido y la identidad del nucleotido insertado se pueden detectar, por ejemplo, mediante la emision de luz, un cambio en la fluorescencia, un cambio en el pH (vease, por ejemplo, la patente de Estados Unidos N.° 7.932.034), un cambio en la conformacion de la enzima, o algun otro cambio ffsico o qrnmico en la reaccion (vease, por ejemplo, el documentoWO 1993/023564 y el documentoWO 1989/009283; Seo et al. (2005) "Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides," PNAS 102: 5926-59). Tras cada incorporacion con exito de un nucleotido, se detecta una senal que refleja la ocurrencia, la identidad y el numero de incorporaciones de nucleotidos. Los nucleotidos no incorporados se pueden eliminar (por ejemplo, por degradacion qrnmica o por lavado) y la siguiente posicion en el molde-cebador se puede consultar con otra especie de nucleotido.
Si bien se ha hecho evidente que la secuenciacion de proxima generacion tiene una amplia aplicacion en los diagnosticos que incluyen cancer, enfermedades infecciosas, medicamentos complementarios y enfermedades hereditarias, los sistemas de secuenciacion de la proxima generacion existentes estan disenados para secuenciar genomas completos y, por lo tanto, los sistemas tienen un alto coste por prueba (por ejemplo, aproximadamente de 100 a 500 dolares americanos por prueba). Ademas, la implementacion de los sistemas comerciales actuales tambien es costosa (por ejemplo, de 75.000 a 700.000 dolares americanos) y el flujo de trabajo de muestra a secuencia es laborioso. Como tales, las tecnologfas existentes no proporcionan una muestra al sistema de secuencia que es deseable para aplicaciones de diagnostico.
Como tal, es un objetivo generar datos de alta calidad a un coste razonable y entregar datos de secuenciacion de proxima generacion de manera precisa y rapida en un sistema facil de usar. Empresas como PacBio han desarrollado procesos qmmicos espedficos para la implementacion en sus sistemas. Al mismo tiempo, otras empresas como VisiGen y Life Technologies han optado por metodos qmmicos alternativos para abordar la secuenciacion de bajo coste.
En particular, LaserGen ha desarrollado enfoques que utilizan sistemas de deteccion optica y ciertos metodos qmmicos de reaccion para producir y polimerizar nucleotidos foto-desprotegibles que puedan emplearse en aplicaciones de secuenciacion de proxima generacion, por ejemplo, como se describe en las patentes de Estados Unidos n.° 7.893.227; 7.897.737; 7.964.352; y 8.148.503. Los nucleotidos de LaserGen tienen un resto terminador fluorescente y fotoescindible unido a la base nucleotfdica y un hidroxilo 3' no bloqueado en el azucar ribosa. El terminador fluorescente fotoescindible proporciona un sustrato para la polimerizacion, por ejemplo, una polimerasa anade el analogo nucleotfdico al hidroxilo en 3' de la cadena sintetizada. Mientras esta unido al nucleotido en el extremo 3', el terminador fluorescente fotoescindible evita la adicion de nucleotidos adicionales por la polimerasa. Asimismo, el resto fluorescente proporciona la identificacion del nucleotido anadido usando una fuente de luz de excitacion y un detector de emision de fluorescencia. Al exponerse a una fuente de luz de la longitud de onda apropiada, la luz escinde el terminador fluorescente, fotoescindible del extremo 3' de la cadena, eliminando asf el bloque a la smtesis y se agrega otro analogo nucleotfdico para comenzar el ciclo nuevamente. Cuando se usan en una reaccion de secuenciacion por smtesis, los compuestos de nucleotidos marcados con fluorescencia LaserGen ofrecen una forma de fotodesproteccion y al mismo tiempo permiten la extension, por ejemplo, desbloqueando estericamente la region en la enzima para permitir la extension. Sin embargo, estos compuestos tienen que usar la fluorescencia para detectar la presencia o ausencia de un evento de incorporacion particular. Como tal, la necesidad de utilizar la deteccion optica en el contexto de la utilizacion de la escision optica de marcadores fotodesprotegibles en estas tecnologfas es prohibitiva para lograr el coste optimo mas bajo al crear un sistema de secuenciacion de bajo coste. El sistema requiere una coordinacion cuidadosa de la excitacion y la desproteccion de las fuentes de luz para que la excitacion no desproteja los nucleotidos libres o incorporados. En consecuencia, los metodos existentes y las ideas anteriores son inadecuados para lograr el coste optimo deseado para la secuenciacion.
Sumario
Por consiguiente, en el presente documento se proporciona tecnologfa para la secuenciacion de acidos nucleicos que utiliza una qmmica de desproteccion optica para controlar la secuenciacion gradual de una cadena de acido nucleico y un medio electroqmmico para detectar e identificar cada base en particular. Una ventaja de la tecnologfa es que el coste y la complejidad de los componentes de deteccion optica en un secuenciador se reducen al tiempo que se mantiene el uso ventajoso de la desproteccion fotoqmmica como el enfoque fundamental para controlar la reaccion de secuenciacion. En consecuencia, las tecnologfas descritas en el presente documento ofrecen un costo mas bajo para la secuenciacion que las tecnologfas convencionales que dependen tanto de la desproteccion fotoqmmica como de la deteccion optica.
En un aspecto, en el presente documento se proporciona una tecnologfa que comprende el uso de un elemento de deteccion electrica junto con la desproteccion fotoactivada de analogos nucleotfdicos. Ademas, la tecnologfa implementa estos componentes en un enfoque de gma de onda en modo cero para la secuenciacion de proxima generacion. La combinacion de la desproteccion electrica con la deteccion electrica permite que los sistemas de secuenciacion implementen la iluminacion global, en lugar de barrido optico, para desproteger las reacciones de secuenciacion masivamente paralelas. Ademas, el uso de un detector electrico en lugar de los costosos elementos de barrido de resolucion ultraalta que encuentran uso en los sistemas convencionales de deteccion optica existentes reduce la complejidad y el coste del banco de optica. Como resultado, aumenta la velocidad de deteccion y disminuye el coste por lectura.
La tecnologfa encuentra uso en los metodos de secuenciacion por smtesis, por ejemplo, segun lo provisto por la plataforma Solexa/Illumina (vease, por ejemplo, Voelkerding et al., Clinical Chem. 55: 641-658, 2009; MacLean et al., Nature Rev. Microbiol. 7: 287-296; y en la patente de Estados Unidos n.° 6.833.246; 7.115.400; y 6.969.488;).
Ademas, el uso del enfoque de gma de onda en modo cero, por ejemplo, el confinamiento estocastico/optico de moleculas individuales, y los nucleotidos opticamente desbloqueables permiten metodos de secuenciacion por smtesis de proxima generacion utilizando un unico fluido de secuenciacion en lugar de una serie de etapas de lavado ineficientes. La secuenciacion por smtesis convencional de proxima generacion requiere lavar la reaccion despues de cada adicion de base. Estos lavados aumentan el tiempo de secuenciacion y el coste de la secuenciacion al requerir fluidos mas complejos y grandes volumenes de reactivos costosos. Tal como se proporciona en la tecnologfa en el presente documento, los nucleotidos opticamente electrobloqueables, detectables electroqmmicamente, se utilizan en un sistema de secuenciacion de gma de onda en modo cero, que permite desbloquear el nucleotido en el sitio de la extension de polimerasa (en el volumen de iluminacion de la gma de onda en modo cero) sin desbloquear los otros nucleotidos en la mezcla de reaccion. Como resultado, se utiliza un unico fluido sin requerir el lavado de la mezcla de reaccion despues de cada adicion de base. En algunas realizaciones, la deteccion de los nucleotidos incorporados es por medios electroqmmicos en lugar de por medios opticos.
En un aspecto, la tecnologfa proporciona clases de estructuras qmmicas (por ejemplo, analogos nucleotidicos) que mejoran la precision de la secuenciacion. En algunas realizaciones, los analogos nucleotidicos se sintetizan utilizando enfoques qmmicos existentes modificados para incluir un elemento de deteccion electroqmmico, en lugar de fluorescente. En algunas realizaciones, la tecnologfa proporciona analogos nucleotidicos para la deteccion electroqmmica y la desproteccion fotoqmmica.
En algunas realizaciones, la tecnologfa se refiere A una nueva clase qmmica de analogos nucleotidicos fotodesprotegibles que comprenden un resto de terminacion detectable electroqmmicamente en la base nucleotfdica. En algunas realizaciones, la tecnologfa se refiere a una nueva clase qmmica de analogos nucleotidicos fotodesprotegibles que comprenden un resto de terminacion detectable electroqmmicamente en el nucleotido en el extremo 3'. En algunas realizaciones, la tecnologfa se refiere a una nueva clase qmmica de analogos nucleotfdicos fotodesprotegibles que comprenden un resto de terminacion detectable electroqmmicamente o por fluorescencia en la base nucleotidica y un resto terminador en el nucleotido en el extremo 3'. Como tales, los aspectos relacionados proporcionan una tecnologfa para la secuenciacion eliminando secuencialmente el resto terminal detectable electroqmmicamente o por fluorescencia de la base nucleotidica y eliminando el resto terminal del extremo 3' del nucleotido, por ejemplo, mediante exposicion a una fuente de luz o fuentes que proporcionan una luz (por ejemplo, un foton o mas de un foton) que escinde los restos de terminacion del analogo nucleotidico. A diferencia de las tecnologfas convencionales, las realizaciones de la tecnologfa proporcionan un nucleotido que se desbloquea con la luz y permite la extension del polfmero de acido nucleico por una polimerasa de acido nucleico y la deteccion del nucleotido se realza por medios electroqmmicos en lugar de por medios opticos.
Por ejemplo, en algunas realizaciones, la secuenciacion se realiza mediante la siguiente secuencia de eventos con el uso a modo de ejemplo de un nucleotido que comprende al menos dos restos de terminacion fotoqmmicos diferentes. Primero, un analogo nucleotidico que comprende un resto de terminacion detectable electroqmmicamente o por fluorescencia (por ejemplo, unido a la base nucleotidica) y un segundo resto de terminacion (por ejemplo, unido al hidroxilo en 3') esta orientado en el sitio activo de la polimerasa (por ejemplo, mediante una polimerasa ubicado en el volumen de iluminacion de una gma de onda en modo cero) para emparejarse a una base complementaria de la cadena molde y estar adyacente al hidroxilo en 3' libre de la cadena sintetizada en crecimiento. A continuacion, el analogo nucleotidico se anade al extremo 3' de una cadena en crecimiento mediante la polimerasa, por ejemplo, mediante el ataque catalizado por enzimas del hidroxilo en 3' en el alfa-fosfato del analogo nucleotfdico. La extension adicional de la cadena por la polimerasa esta bloqueada por el grupo de terminacion en 3' en el analogo nucleotidico incorporado. El detector electroqmmico o fluorescente (por ejemplo, despues de la excitacion por una fuente de emision) consulta el resto detectable electroqmmicamente o por fluorescencia en el nucleotido incorporado para identificar la base agregada a la cadena sintetizada.
A continuacion, el resto de terminacion detectable electroqmmicamente o por fluorescencia (por ejemplo, unido a la base nucleotidica) se elimina mediante exposicion (por ejemplo, en el volumen de iluminacion de una gma de onda en modo cero) a una longitud de onda de luz que escinde el resto de terminacion detectable electroqmmicamente o por fluorescencia del analogo nucleotfdico. Aunque se ha liberado el resto de terminacion detectable electroqmmicamente o por fluorescencia, la extension adicional de la cadena por la polimerasa permanece bloqueada por el grupo de terminacion en 3' (segundo resto de terminacion) en el analogo nucleotfdico incorporado. A continuacion, el segundo resto de terminacion se elimina mediante exposicion (por ejemplo, en el volumen de iluminacion de una gma de onda en modo cero) a una longitud de onda de luz que escinde el segundo resto de terminacion del analogo nucleotidico. En algunas realizaciones, la longitud de onda de la luz que escinde el resto de terminacion detectable electroqmmicamente o por fluorescencia es diferente de la longitud de onda de la luz que escinde el segundo resto de terminacion, por ejemplo, bloqueando el hidroxilo en 3'. Despues de que se libera el segundo resto de terminacion, el hidroxilo en 3' de la cadena en crecimiento queda libre para una polimerizacion adicional: la siguiente base se incorpora para continuar otro ciclo, por ejemplo, un analogo nucleotidico esta orientado en el sitio activo de la polimerasa, se agrega el analogo nucleotidico hasta el extremo 3' de la cadena en crecimiento por la polimerasa, se consulta el analogo nucleotfdico para identificar la base agregada, y se desprotege el analogo nucleotidico.
En algunas realizaciones, la secuenciacion se realiza mediante la siguiente secuencia de eventos con el uso a modo de ejemplo de un nucleotido que comprende un resto de terminacion fotoqmmico. Primero, un analogo nucleotidico que comprende un resto de terminacion detectable electroqmmicamente (por ejemplo, unido a la base nucleotidica) esta orientado en el sitio activo de la polimerasa (por ejemplo, por una polimerasa ubicada en el volumen de iluminacion de una gma de onda en modo cero) para aparearse con una base complementaria de la cadena molde y para ser adyacente al hidroxilo 3' libre de la cadena sintetizada en crecimiento. A continuacion, el analogo nucleotfdico se anade al extremo 3' de una cadena en crecimiento mediante la polimerasa, por ejemplo, mediante el ataque catalizado por enzimas del hidroxilo en 3' en el alfa-fosfato del analogo nucleotfdico. La extension adicional de la cadena por la polimerasa esta bloqueada por el resto de terminacion detectable electroqmmicamente del analogo nucleotidico incorporado, por ejemplo, por el impedimento esterico de la catalisis, la deformacion de los constituyentes del sitio activo, etc. El resto detectable electroqmmicamente en el nucleotido incorporado es consultado por un detector electroqmmico para identificar la base agregada a la cadena sintetizada.
A continuacion, el resto de terminacion detectable electroqmmicamente (por ejemplo, unido a la base nucleotfdica) se elimina mediante exposicion (por ejemplo, en el volumen de iluminacion de una gma de onda en modo cero) a una longitud de onda de luz que escinde el resto de terminacion detectable electroqmmicamente del analogo nucleotidico. Despues de que se libera el resto de terminacion detectable electroqmmicamente, el hidroxilo en 3' de la cadena en crecimiento queda libre para una polimerizacion adicional: la siguiente base se incorpora para continuar otro ciclo, por ejemplo, un analogo nucleotidico se orienta en el sitio activo de la polimerasa, se anade el analogo nucleotidico al extremo 3' de la cadena en crecimiento por la polimerasa, se consulta el analogo nucleotidico para identificar la base anadida y se desprotege el analogo nucleotfdico.
Por consiguiente, en algunas realizaciones, la tecnologfa proporciona que los nucleotidos en el extremo de la cadena estan protegidos en 3', por lo que no pueden reaccionar con el trifosfato en 5' de los nuevos nucleotidos que entran en el sitio activo hasta despues de desbloquear el extremo 3' (ya sea eliminando un resto de terminacion del hidroxilo en 3' o eliminando el impedimento esterico a la polimerizacion). Por lo tanto, uno puede leer toda o sustancialmente toda la senal de fluorescencia o electroqmmica sin los problemas asociados con la reincorporacion y la lectura de la siguiente base. En realizaciones relacionadas con los reactivos basados en la deteccion electroqmmica, dichos reactivos se desarrollan para la secuenciacion utilizando desproteccion fotoqmmica utilizando un solo grupo de desproteccion fotoqmmica y un elemento electroqmmicamente activo que sirve para la deteccion. Este enfoque mejora las tecnologfas existentes (por ejemplo, como la proporciona la qmmica de LaserGen) y, por lo tanto, encuentra uso en las aplicaciones de secuenciacion por smtesis que tienen mayor precision y menor coste al incluir estos enfoques en sistemas opticos de bajo coste, tal como los sistemas basados en gmas de onda en modo cero y similares.
Por consiguiente, en el presente documento se proporciona tecnologfa relacionada con un analogo nucleotfdico que comprende un nucleotido que comprende un resto fosfato, una base y un azucar; y un resto de terminacion fotoescindible detectable electroqmmicamente, unido al nucleotido. En algunas realizaciones, el analogo nucleotfdico comprende un resto de terminacion fotoescindible, detectable electroqmmicamente, que esta unido al resto de fosfato del nucleotido. En algunas realizaciones, el analogo nucleotidico comprende un resto de terminacion fotoescindible, detectable electroqmmicamente, que esta unido a la base del nucleotido. En algunas realizaciones, el analogo nucleotidico comprende un resto de terminacion fotoescindible, detectable electroqmmicamente, que esta unido al azucar del nucleotido.
Las realizaciones proporcionan que los restos de terminacion fotoescindibles son fotoescindibles, por ejemplo, se pueden escindir del analogo nucleotfdico tras la exposicion a una fuente de luz de la longitud de onda y la intensidad apropiadas para efectuar la escision. Como tal, en algunas realizaciones, el analogo nucleotidico comprende un resto de terminacion fotoescindible, detectable electroqmmicamente, que esta unido al nucleotido por un enlazador fotoescindible. En algunas realizaciones, el resto de terminacion fotoescindible detectable electroqmmicamente tiene una estructura que es:
Figure imgf000006_0001
donde E representa un resto o marcador detectable electroqmmicamente, por ejemplo, un marcador electroqmmico que es una especie facilmente oxidable o reducible, tal como un grupo redox organico, un grupo organometalico, una nanopartfcula metalica y un punto cuantico. Los grupos redox organicos de ejemplo incluyen, pero no se limitan a, azul de metileno, antraquinona y tionina; los ejemplos de grupos organometalicos incluyen, pero no se limitan a los mismos, ferroceno, derivados de ferroceno, complejos de bipirideno de rutenio y complejos de bipirideno de osmio; las nanopartfculas metalicas de ejemplo incluyen, pero no se limitan a los mismos, oro y plata; los puntos cuanticos de ejemplo incluyen, pero no se limitan a los mismos, CdS, CdSe y ZnS. En algunas realizaciones, se contempla que los analogos nucleotfdicos comprenden una estructura como se proporciona en laspatentes de Estados Unidos Nos. 7.893.227; 7.897.737; 7.964.352; y 8.148.503,con el resto fluorescente descrito en las mismas reemplazado por un resto detectable electroqmmicamente como se describe en el presente documento o como se conoce en la tecnica.
En algunas realizaciones, el analogo nucleotfdico comprende un resto de termination fotoescindible detectable electroqmmicamente, que esta unido al nucleotido mediante un enlazador fotoescindible seleccionado del grupo que consiste en eter, ester, diester, etc. La presente tecnologia abarca, en algunas realizaciones, enlazadores fotoescindibles incluidos, pero sin limitation a los mismos, restos 2-nitrobencilo, restos 2-nitrobencilo alfa-sustituidos (por ejemplo, restos 1-(2-nitrofenil)etilo), restos 3,5-dimetoxibencilo, acido tiohidroxamico, restos 7-nitroindolina, restos 9-fenilxantilo, restos benzomicos, restos hidroxifenacilo y restos acido N-hidroxi-succinimidil-4-azidosalicflico (NHS-ASA). La presente tecnologia tambien contempla enlazadores fotoescindibles que comprenden restos 2-nitrobencilo y "brazos reticuladores" (o "brazos espaciadores" que separan adicionalmente un enlazador fotoescindible de un nucleotido al que esta unido operativamente. Los ejemplos de tales "brazos reticuladores" incluyen, pero no se limitan a los mismos, cadenas alquflicas largas o unidades de repetition de restos de caproflo unidos por enlaces amida.
En algunas realizaciones, el analogo nucleotfdico comprende un segundo resto de termination fotoescindible unido al nucleotido, por ejemplo, unido al azucar del nucleotido, por ejemplo, en la position 3' del azucar. Los ejemplos de restos de terminacion fotoescindibles que encuentran uso como un segundo resto de terminacion fotoescindible unido al nucleotido incluyen, pero no se limitan a los mismos
Figure imgf000007_0001
La tecnologia no esta limitada en el resto usado para bloquear el extremo 3'- Por ejemplo, un metodo de secuenciacion que usa analogos nucleotfdicos modificados con 3'-O-alilo se describe en Ruparel et al. (2005) Proc. Natl. Acad. Sci. 102: 5932-5937. Otros terminadores reversibles se describen, por ejemplo, en laspatentes de Estados Unidos N.° 5.872.244; 6.232.465; 6.214.987; 5.808.045; 5.763.594, y 5.302.509; y la publication de solicitud de patente de Estados Unidos n.° 20030215862. En algunas realizaciones, un nucleosido 5'-trifosfato modificado en 2' (por ejemplo, 2'-fosfato) encuentra uso en la tecnologia, por ejemplo, como se ha descrito como un sustrato para ciertas enzimas de polimerizacion de acidos nucleicos (vease, por ejemplo, lapublicacion de solicitud de patente de Estados Unidos n.° 2005/00373898 y 2005/0037991). Otros bloqueadores en 3’ se proporcionan, por ejemplo, en Guo et al. (2008) "Four-color DNA Sequencing with 3'-O-modified Nucleotide Reversible Terminators and Chemically Cleavable Fluorescent Dideoxynucleotides" Proc Nat'l Acad Sci USA 105: 9145- 9150 y en Ju et al (2006) "Four-Color DNA Sequencing by Synthesis Using Cleavable Fluorescent Nucleotide Reversible Terminators" Proc Nat'l Acad Sci USA 103: 19635-19640.
En algunas realizaciones, el analogo nucleotfdico comprende ademas un segundo resto de terminacion fotoescindible unido al nucleotido, en el que el segundo resto de terminacion fotoescindible esta unido al nucleotido mediante un enlazador fotoescindible. En algunas realizaciones, el analogo nucleotfdico comprende ademas un segundo resto de terminacion fotoescindible unido al nucleotido, en el que el segundo resto de terminacion fotoescindible esta unido al nucleotido mediante un enlazador fotoescindible. En algunas realizaciones, el analogo nucleotfdico comprende ademas un segundo resto de terminacion fotoescindible unido al nucleotido, en el que el segundo resto de terminacion fotoescindible esta unido al nucleotido mediante un enlazador fotoescindible que es diferente del enlazador fotoescindible unido al resto de terminacion fotoescindible detectable electroqmmicamente.
La tecnologia no esta limitada en los enlazadores fotoescindibles utilizados para unir un resto detectable (por ejemplo, un resto detectable electroqmmicamente y/o por fluorescencia). Por ejemplo, la presente tecnologia abarca enlazadores fotoescindibles que incluyen, pero sin limitaciones, restos 2-nitrobencilo, restos 2-nitrobencilo alfasustituidos (por ejemplo, restos 1- (2-nitrofenil)etilo), restos 3,5-dimetoxibencilo, acido tiohidroxamico, restos 7-nitroindolina, restos 9-fenilxantilo, restos de benzoma, restos de hidroxifenacilo y restos de acido N-hidroxisuccinimidil-4-azidosalicflico (NHS-ASA). La presente tecnologia tambien contempla enlazadores fotoescindibles que comprenden restos 2-nitrobencilo y "brazos reticuladores" (o "brazos espaciadores" que separan adicionalmente un enlazador fotoescindible de un nucleotido al que esta unido operativamente. Los ejemplos de tales "brazos reticuladores" incluyen, pero no se limitan a los mismos, cadenas alquflicas largas o unidades de repeticion de restos de caproflo unidos por enlaces amida.
Es preferible que la luz requerida para activar la escision no afecte a los otros componentes de los nucleotidos modificados. Por ejemplo, si se usa un fluoroforo como marcador, es preferible que absorba la luz de una longitud de onda diferente a la requerida para escindir la molecula enlazadora. Los enlazadores adecuados incluyen aquellos basados en compuestos de O-nitrobencilo y compuestos de nitroveratrilo. Tambien se pueden utilizar enlazadores basados en la qmmica de la benzoma. Vease, por ejemplo, Lee et al. (1999) J. Org. Chem. 64: 3454-3460.
En el presente documento se proporcionan analogos nucleotidicos que comprenden un nucleotido (por ejemplo, que comprenden un resto fosfato, una base y un azucar); un resto de termination fotoescindible, detectable electroqwmicamente, unido a la base del nucleotido; y un segundo resto de terminacion fotoescindible unido al azucar del nucleotido. Ademas, tambien se proporcionan analogos nucleotidicos que comprenden un nucleotido (por ejemplo, que comprende un resto fosfato, una base y un azucar); un resto de terminacion fotoescindible, detectable por fluorescencia, unido al nucleotido; y un segundo resto de terminacion fotoescindible unido al nucleotido.
En algunas realizaciones del analogo nucleotidico, el resto de terminacion fotoescindible, detectable por fluorescencia, esta unido al resto fosfato del nucleotido y el segundo resto de terminacion fotoescindible esta unido al azucar del nucleotido. En algunas realizaciones del analogo nucleotidico de la revindication, el resto de terminacion fotoescindible, detectable por fluorescencia, esta unido a la base del nucleotido y el segundo resto de terminacion fotoescindible esta unido al azucar del nucleotido.
La tecnologia no esta limitada en los restos fluorescentes y/o grupos fotoescindibles que estan unidos a los analogos nucleotidicos. Por ejemplo, en algunas realizaciones del analogo nucleotidico, el resto de terminacion fotoescindible detectable por fluorescencia comprende un resto detectable por fluorescencia que se basa en un colorante, en el que el colorante es xanteno, fluorescema, rodamina, BODIPY, cianina, cumarina, pirina, ftalocianina, fitocianolina, fitocianina, ficobiliprotema, ALEXA FLUOR® 350, ALEXA FLUOR® 405, ALEXA FLUOR® 430, ALEXA FLUOR® 488, ALEXA FLUOR® 514, ALEXA FLUOR® 532, ALEXA FLUOR® 546, ALEXA FLUOR® 558, ALEXA FLUOR® 568, ALEXA FLUOR® 594, ALEXA FLUOR® 610, ALEXA FLUOR® 633, ALEXA FLUOR® 647, ALEXA FLUOR® 660, ALEXA FLUOR® 680, ALEXA FLUOR® 700, ALEXA FLUOR® 750, o un colorante de escuarama; y el segundo resto de terminacion fotoescindible es
Figure imgf000008_0001
En algunas realizaciones, el resto de terminacion fotoescindible, detectable por fluorescencia, esta unido al nucleotido por un primer enlazador fotoescindible y el segundo resto de terminacion fotoescindible esta unido al nucleotido por un segundo enlazador fotoescindible. En algunas realizaciones, se proporciona un analogo nucleotidico que comprende un nucleotido (por ejemplo, que comprende un resto fosfato, una base y un azucar); un resto de terminacion fotoescindible, detectable por fluorescencia unido a la base del nucleotido; y un segundo resto de terminacion fotoescindible unido al azucar del nucleotido.
La tecnologia abarca nucleotidos y bases naturales y sinteticos. Como tales, en algunas realizaciones, el analogo nucleotidico comprende un nucleotido que es adenina, citosina, guanina, timina o uracilo. En algunas realizaciones, el nucleotido comprende un resto fosfato que es un trifosfato, un difosfato o un monofosfato.
La tecnologia se refiere a nucleotidos que encuentran uso en la secuenciacion por smtesis. De acuerdo con esto, las realizaciones de nucleotidos comprenden un resto de terminacion fotoescindible que es un grupo que imparte propiedades de terminacion de polimerasa al analogo nucleotidico.
Realizaciones relacionadas proporcionan composiciones que comprenden un analogo nucleotidico y una polimerasa. La tecnologia no esta limitada en la polimerasa que encuentra uso en la tecnologia. Las polimerasas que encuentran uso incluyen, pero no se limitan a los mismos, Taq ADN polimerasa, Klenow (exo-) ADN polimerasa, Bst ADN polimerasa, ADN polimerasa VENT® (exo-) (por ejemplo, una ADN polimerasa A clonada de Thermococcus litoralis y que contiene las mutaciones D141A y E143A), Pfu (exo-) ADN polimerasa y ADN polimerasa DEEPVENT™ (exo-) (ADN polimerasa A clonada de la especies de Pyrococcus GB-D y que contiene las mutaciones D141A y E143A), ADN polimerasa AMPLITAQ®, FS (ADN polimerasa Taq que contiene las mutaciones G46D y F667Y), ADN polimerasa THERMOSEQUENASE™ (ADN polimerasa Taq que contiene la mutation F667Y), ADN polimerasa THERMOSEQUENASE ™ II (mezcla de ADN polimerasa THERMOSEQUENASE™ y T. acidophilum pirofosfatasa), ADN polimerasa THERMINATOR™(ADN polimerasa A clonada de la especie de Termococcus 9°N-7 y que contiene las mutaciones D141A, E143A y A485L), THERMINATOR™ II ADN polimerasa ( ADN polimerasa THERMINATOR™ que contiene la mutacion Y409V adicional) y ADN polimerasa VENT® (exo-) A488L (VENT® (exo-) que contiene la mutacion A488L). En algunas realizaciones, se proporciona una composition que comprende ademas un acido nucleico, por ejemplo,un molde que se va a secuenciar (por ejemplo, para tener su secuencia de nucleotidos determinada).
En algunas realizaciones, una polimerasa se modifica para mejorar la incorporacion de los analogos nucleotidicos descritos en el presente documento. Las polimerasas modificadas de ejemplo se desvelan en laspatentes de Estados Unidos N.° 4.889.818; 5.374.553; 5.420.029; 5.455.170; 5.466.591; 5.618.711; 5.624.833; 5.674.738; 5.789.224; 5.795.762; 5.939.292; y las publicaciones de patente de Estados Unidos n.° 2002/0012970 y 2004/0005599. Un ejemplo no limitante de una polimerasa modificada incluye la ADN polimerasa G46E E678G CS5, la ADN polimerasa G46E E678G CS5, la Taq ADN polimerasa E615G, la polimerasa AZO5R y la ADN polimerasa G46E l329A E678G CS5 descritas en lapublicacion de Patente de Estados Unidos n.° 2005/0037398. La produccion de polimerasas modificadas se puede lograr utilizando muchas tecnicas convencionales en biologfa molecular y ADN recombinante descritas en el presente documento y conocidas en la tecnica. En algunas realizaciones, en las que el desbloqueo de 2'-fosfato genera un 2'-hidroxilo, por ejemplo, se pueden usar un ribonucleotido, mutantes de polimerasa, tales como los descritos en la patente de Estados Unidos n.° 5.939.292, que incorporan NTP asf como dNTP.
Ademas, la tecnologfa proporciona realizaciones de metodos para secuenciar un acido nucleico, comprendiendo los metodos hibridar un cebador con un acido nucleico para formar un complejo de cebador/acido nucleico hibridado; proporcionar una pluralidad de analogos nucleotfdicos, comprendiendo los analogos nucleotfdicos un nucleotido y un resto de terminacion fotoescindible, detectable electroqmmicamente, unido al nucleotido; hacer reaccionar el complejo de cebador/acido nucleico hibridado y el analogo nucleotfdico con una polimerasa para agregar el analogo nucleotidico al cebador mediante una reaccion de polimerasa para formar un producto extendido que comprende un analogo nucleotfdico incorporado; consultar el producto extendido para identificar el analogo nucleotidico incorporado; y exponer el producto extendido a una fuente de luz que proporciona una longitud de onda de luz para eliminar un resto de terminacion fotoescindible y detectable electroqmmicamente del analogo nucleotidico incorporado. En algunas realizaciones, los metodos comprenden el uso de un analogo nucleotidico que comprende ademas un segundo resto de terminacion fotoescindible unido al nucleotido y el metodo comprende ademas exponer el producto extendido a una fuente de luz que proporciona una segunda longitud de onda de luz para eliminar un segundo resto de terminacion fotoescindible del analogo nucleotidico incorporado.
Las realizaciones de ejemplo para secuenciar un acido nucleico comprenden hibridar un cebador con un acido nucleico para formar un complejo de cebador/acido nucleico hibridado; proporcionar una pluralidad de analogos nucleotfdicos, comprendiendo cada analogo nucleotidico un nucleotido y un resto de terminacion fotoescindible detectable por fluorescencia unido al nucleotido y un segundo resto de terminacion fotoescindible unido al nucleotido; hacer reaccionar el complejo de cebador/acido nucleico hibridado y el analogo nucleotidico con una polimerasa para anadir el analogo nucleotidico al cebador mediante una reaccion de polimerasa para formar un producto extendido que comprende un analogo nucleotidico incorporado; consultar el producto extendido para identificar el analogo nucleotfdico incorporado; exponer el producto extendido a una fuente de luz que proporciona una primera longitud de onda de luz para eliminar un resto de terminacion fotoescindible detectable por fluorescencia del analogo nucleotidico incorporado; y exponer el producto extendido a una fuente de luz que proporciona una segunda longitud de onda de luz para eliminar un segundo resto de terminacion fotoescindible del analogo nucleotidico incorporado.
Las realizaciones de los metodos proporcionan la determinacion de la secuencia de multiples bases (nucleotidos) de un acido nucleico. Por consiguiente, se proporcionan realizaciones en las que el metodo comprende ademas repetir las etapas de reaccion, consulta y exposicion en uno o mas ciclos adicionales para identificar una pluralidad de bases en el acido nucleico, en el que la etapa de reaccion del ciclo n + 1 comprende reaccionar el producto extendido de ciclo n y un analogo nucleotfdico con la polimerasa para anadir el analogo nucleotidico al producto extendido de ciclo n por una reaccion de polimerasa para formar un producto extendido de ciclo n + 1 que comprende un analogo nucleotidico incorporado.
Algunas realizaciones proporcionan el uso de la gma de onda en modo cero en un metodo de secuenciacion. Como tal, en algunas realizaciones, los metodos proporcionan ademas un sustrato que comprende una gma de onda de modo cero y que localiza la polimerasa dentro de un volumen de observacion de la gma de onda en modo cero. Los analogos nucleotidicos proporcionan la identificacion de un nucleotido por el resto detectable por fluorescencia o detectable electricamente unido al analogo nucleotidico. Por consiguiente, la tecnologfa proporciona en algunas realizaciones que la etapa de consulta se realiza con un elemento de deteccion electrica, por ejemplo, que comprende el uso de voltimetna dclica, voltimetna de decapado por adsorcion, voltimetna de corriente alterna, voltimetna de pulso diferencial y quimioluminiscencia. En algunas realizaciones, la consulta se realiza mediante un elemento de deteccion de fluorescencia, por ejemplo, exponiendo un resto fluorescente a una longitud de onda de emision desde una fuente de luz y detectando una emision desde el resto fluorescente. En algunas realizaciones, la exposicion del producto extendido a la primera longitud de onda de la luz es simultanea a la exposicion del producto extendido a la segunda longitud de onda de la luz; en algunas realizaciones, la exposicion del producto extendido a la primera longitud de onda de la luz es antes o despues de exponer el producto extendido a la segunda longitud de onda de la luz.
En algunas realizaciones, la tecnologfa proporciona analogos nucleotidicos que comprenden dos restos fotoescindibles y realizaciones relacionadas de metodos en los que exponer el producto extendido a la primera longitud de onda de la luz no elimina el segundo resto de terminacion fotoescindible del analogo nucleotidico incorporado y exponer el producto extendido a la segunda la longitud de onda de la luz no elimina el resto de terminacion fotoescindible, detectable electroqmmicamente, ni el resto de terminacion fotoescindible detectable por fluorescencia del analogo nucleotfdico.
Algunos grupos fotoescindibles se escinden por exposicion a un foton de luz en la longitud de onda apropiada y algunos grupos fotoescindibles se escinden por exposicion a dos o mas fotones de luz. Como tal, en algunas realizaciones, exponer el producto extendido a una fuente de luz que proporciona una primera longitud de onda de luz para eliminar un resto de terminacion fotoescindible, detectable electroqmmicamente, o un resto de terminacion fotoescindible, detectable por fluorescencia del analogo nucleotidico incorporado comprende exponer el producto extendido a uno el foton de la primera longitud de onda y la exposicion del producto extendido a una fuente de luz que proporciona una segunda longitud de onda de luz para eliminar un segundo resto de terminacion fotoescindible del analogo nucleotidico incorporado comprende exponer el producto extendido a mas de un foton de la segunda longitud de onda; como alternativa, algunas realizaciones proporcionan que exponer el producto extendido a una fuente de luz que proporciona una primera longitud de onda de luz para eliminar un resto de terminacion fotoescindible, detectable electroqmmicamente, o un resto de terminacion fotoescindible, detectable por fluorescencia del analogo nucleotidico incorporado comprende exponer el producto extendido a mas de un foton de la primera longitud de onda y la exposicion del producto extendido a una fuente de luz que proporciona una segunda longitud de onda de la luz para eliminar un segundo resto de terminacion fotoescindible del analogo nucleotidico incorporado comprende exponer el producto extendido a un foton de la segunda longitud de onda.
Algunas realizaciones proporcionan que la longitud de onda de la luz utilizada para escindir un resto de terminacion fotoescindible es 354 nm, 766 nm o 520 nm. Los metodos de secuenciacion proporcionados en el presente documento incorporan analogos naturales y sinteticos de nucleotidos; por ejemplo, las realizaciones proporcionan que el nucleotido sea adenina, citosina, guanina, timina o uracilo. Los metodos se refieren a metodos de secuenciacion por smtesis, por ejemplo, los metodos que comprenden el uso de un resto de terminacion fotoescindible que es un grupo que imparte propiedades de terminacion de la polimerasa al analogo nucleotidico y el metodo comprende la inhibicion de una etapa de reaccion cuando un nucleotido incorporado comprende un resto de terminacion fotoescindible.
Por consiguiente, la tecnologfa tambien proporciona composiciones para la secuenciacion de un acido nucleico. Por ejemplo, las realizaciones proporcionan una composicion para secuenciar un acido nucleico que comprende cuatro analogos nucleotidicos como se describe en el presente documento, en el que un primer analogo nucleotidico comprende un nucleotido adenina, un segundo analogo nucleotidico comprende un nucleotido citosina, un tercer analogo nucleotidico comprende un nucleotido guanina y un cuarto analogo nucleotfdico comprende un nucleotido timina o uracilo. El resto detectable electroqmmicamente o por fluorescencia unido a los nucleotidos se usa para identificar el nucleotido que se incorpora a un acido nucleico durante una reaccion de secuenciacion por smtesis. Por lo tanto, la tecnologfa se refiere a una composicion para secuenciar un acido nucleico, comprendiendo la composicion cuatro analogos nucleotidicos como se describe en el presente documento, en el que un primer analogo nucleotidico comprende un primer resto detectable electroqmmicamente o un primer resto detectable por fluorescencia, un segundo analogo nucleotidico comprende un segundo resto detectable electroqmmicamente o un segundo resto detectable por fluorescencia, un tercer analogo nucleotidico comprende un tercer resto detectable electroqmmicamente o un tercer resto detectable por fluorescencia, y un cuarto analogo nucleotfdico comprende un cuarto resto detectable electroqmmicamente o un cuarto restodetectable por fluorescencia.
En el presente documento tambien se describen realizaciones de kit de la tecnologfa. Como tales, las realizaciones del kit para secuenciar un acido nucleico comprenden cuatro analogos nucleotidicos como se describe en el presente documento, en las que un primer analogo nucleotidico comprende un nucleotido adenina, un segundo analogo nucleotidico comprende un nucleotido citosina, un tercer analogo nucleotidico comprende un nucleotido guanina y un cuarto nucleotido analogo comprende un nucleotido timina o un nucleotido uracilo. Las realizaciones de kit adicionales para secuenciar un acido nucleico comprenden cuatro analogos nucleotfdicos como se describe en el presente documento, en el que un primer analogo nucleotidico comprende un primer resto detectable electroqmmicamente o un primer resto detectable por fluorescencia, un segundo analogo nucleotidico comprende un segundo resto detectable electroqmmicamente o un segundo resto detectable por fluorescencia, un tercer analogo nucleotidico comprende un tercer resto detectable electroqmmicamente o un tercer resto detectable por fluorescencia, y un cuarto analogo nucleotidico comprende un cuarto resto detectable electroqmmicamente o un cuarto resto detectable por fluorescencia. Algunas realizaciones de kits comprenden cuatro analogos nucleotidicos como se describe en el presente documento, en el que un primer analogo nucleotidico comprende un nucleotido adenina, un segundo analogo nucleotidico comprende un nucleotido citosina, un tercer analogo nucleotidico comprende un nucleotido guanina y un cuarto analogo nucleotidico comprende un nucleotido timina o un nucleotido uracilo; y una polimerasa. Ademas, algunas realizaciones de kit comprenden cuatro analogos nucleotfdicos como se describe en el presente documento, en el que un primer analogo nucleotfdico comprende un primer resto detectable electroqmmicamente o un primer resto detectable por fluorescencia, un segundo analogo nucleotidico comprende un segundo resto detectable electroqmmicamente o un segundo resto detectable por fluorescencia, un tercer analogo nucleotidico comprende un tercer resto detectable electroqmmicamente o un tercer resto detectable por fluorescencia, y un cuarto analogo nucleotidico comprende un cuarto resto detectable electroqmmicamente o un cuarto resto detectable por fluorescencia; y una polimerasa.
Los sistemas para secuenciar un acido nucleico tambien estan abarcados por la tecnologfa proporcionada en el presente documento. En algunas realizaciones, la tecnologfa proporciona un sistema para secuenciar un acido nucleico, comprendiendo el sistema un analogo nucleotidico como se describe en el presente documento, una composicion como se describe en el presente documento, o un kit como se describe en el presente documento; una o mas fuentes de luz coherente; y un elemento de deteccion de fluorescencia o electroqmmica. Las realizaciones del sistema comprenden ademas una o mas de una polimerasa, una gma de onda en modo cero, un ordenador para identificar bases y recopilar informacion de secuencias, y/o un componente de software para adquirir y analizar datos de secuencias.
Las realizaciones adicionales seran evidentes para los expertos en la tecnica relevante basadas en las ensenanzas contenidas en el presente documento.
Breve descripcion de los dibujos
Estas y otras caractensticas, aspectos y ventajas de la tecnologfa actual se entenderan mejor con respecto a los siguientes dibujos:
La figura 1 es un diagrama que muestra una realizacion del metodo de la tecnologfa proporcionada en el presente documento. El dibujo muestra la polimerizacion de un analogo nucleotidico al hidroxilo (-OH) de una cadena de ADN; la identificacion de la base incorporada ("base de consulta") a traves de su resto detectable electroqmmicamente o detectable por fluorescencia; fotoescision de un resto de terminacion detectable electroqmmicamente o un resto de terminacion detectable por fluorescencia (ET/FT) mediante una primera longitud de onda de luz (hv-i); fotoescision de un segundo resto terminador (XT) por una segunda longitud de onda de la luz (hv2); que proporciona un grupo hidroxilo libre en la cadena de ADN en crecimiento para que el ciclo se repita con el siguiente analogo nucleotfdico que se incorporara.
Debe entenderse que las figuras no estan necesariamente dibujadas a escala, ni tampoco los objetos en las figuras estan necesariamente dibujados a escala en relacion unos con otros. Las figuras son representaciones que pretenden brindar claridad y comprension a diversas realizaciones de aparatos, sistemas y metodos desvelados en el presente documento. Siempre que sea posible, se utilizaran los mismos numeros de referencia en todos los dibujos para hacer referencia a partes iguales o similares. Ademas, debe apreciarse que los dibujos no pretenden limitar el alcance de las presentes ensenanzas de ninguna manera.
Descripcion detallada
En el presente documento se proporciona tecnologfa relacionada con la secuenciacion de acidos nucleicos, pero no exclusivamente, con composiciones, metodos, sistemas y kits relacionados con nucleotidos que comprenden un resto detectable electroqmmicamente y uno o mas restos inhibidores de la smtesis fotolabiles.
Los encabezados de seccion usados en el presente documento son unicamente con motivos organizativos y no deben interpretarse de ningun modo como limitantes de la materia objeto descrita.
En esta descripcion detallada de las diversas realizaciones, a efectos de explicacion, se exponen numerosos detalles espedficos para proporcionar una comprension completa de las realizaciones desveladas. Un experto en la materia apreciara, sin embargo, que estas diversas realizaciones se pueden practicar con o sin estos detalles espedficos. En otros casos, las estructuras y dispositivos se muestran en forma de diagrama de bloques. Ademas, un experto en la tecnica puede apreciar facilmente que las secuencias espedficas en las que se presentan y realizan los metodos son ilustrativas y se contempla que las secuencias pueden variarse y aun permanecer dentro del alcance de las diversas realizaciones desveladas en el presente documento.
A menos que se defina lo contrario, todos los terminos tecnicos y cientfficos utilizados en el presente documento tienen el mismo significado que entiende habitualmente un experto en la tecnica a la que pertenecen las diversas realizaciones descritas en el presente documento. Cuando las definiciones de terminos en las referencias incorporadas parecen diferir de las definiciones proporcionadas en las presentes ensenanzas, prevalecera la definicion provista en las presentes ensenanzas.
Definiciones
Para facilitar la comprension de la tecnologfa actual, a continuacion se definen una serie de terminos y frases. A lo largo de la descripcion detallada se exponen definiciones adicionales.
A lo largo de la especificacion y las reivindicaciones, los siguientes terminos toman los significados explfcitamente asociados en el presente documento, a menos que el contexto indique claramente lo contrario. La expresion "en una realizacion" como se usa en el presente documento no se refiere necesariamente a la misma realizacion, aunque puede hacerlo. Ademas, la frase "en otra realizacion" como se usa en el presente documento no se refiere necesariamente a una realizacion diferente, aunque puede ser asu Por lo tanto, como se describe a continuacion, varias realizaciones de la invencion se pueden combinar facilmente, sin apartarse del alcance o esprntu de la invencion.
Ademas, como se usa en el presente documento, el termino "o" es un operador "o" inclusivo y es equivalente al termino "y/o" a menos que el contexto indique claramente lo contrario. La expresion "a base de" no es exclusiva y permite basarse en factores adicionales no descritos, a menos que el contexto indique claramente lo contrario. Ademas, a lo largo de la especificacion, el significado de "un", "uno/a" y "el/la" incluye las referencias en plural. El significado de "en" incluye "en" y "sobre".
Como se usa en el presente documento, un "nucleotido" comprende una "base" (como alternativa, una "nucleobase" o "base nitrogenada"), un "azucar" (en particular, un azucar de cinco carbonos, por ejemplo, ribosa o 2-desoxirribosa), y un "resto fosfato" de uno o mas grupos fosfato (por ejemplo, un monofosfato, un difosfato o un trifosfato que consiste en uno, dos o tres fosfatos unidos, respectivamente). Sin el resto fosfato, la nucleobase y el azucar forman un "nucleosido". Por lo tanto, un nucleotido tambien se puede llamar un monofosfato de nucleosido o un difosfato de nucleosido o un trifosfato de nucleosido, dependiendo del numero de grupos de fosfato unidos. El resto de fosfato se une generalmente al carbono 5 del azucar, aunque algunos nucleotidos comprenden restos de fosfato unidos al carbono 2 o al carbono 3 del azucar. Los nucleotidos contienen una purina (en los nucleotidos adenina y guanina) o una base pirimidmica (en los nucleotidos citosina, timina y uracilo). Los ribonucleotidos son nucleotidos en los que el azucar es ribosa. Los desoxirribonucleotidos son nucleotidos en los que el azucar es desoxirribosa.
Como se usa en el presente documento, un "acido nucleico" significara cualquier molecula de acido nucleico, incluyendo, sin limitacion, ADN, ARN e dbridos de los mismos. Las bases de acido nucleico que forman moleculas de acido nucleico pueden ser las bases A, C, G, T y U, asf como sus derivados. Los derivados de estas bases son bien conocidos en la tecnica. Se debe entender que el termino incluye, como equivalentes, analogos de ADN o ARN hechos de analogos nucleotfdicos. El termino como se usa en el presente documento tambien abarca el ADNc, que es complementario, o copia, ADN producido a partir de un molde de ARN, por ejemplo, mediante la accion de una transcriptasa inversa. Es bien sabido que el ADN (acido desoxirribonucleico) es una cadena de nucleotidos que consiste en 4 tipos de nucleotidos, A (adenina), T (timina), C (citosina) y G (guanina), y ese ARN (acido ribonucleico) es una cadena de nucleotidos que consiste en 4 tipos de nucleotidos A, U (uracilo), G y C. Tambien se sabe que todos estos 5 tipos de nucleotidos se unen espedficamente entre sf en combinaciones llamadas pares de bases complementarias. Es decir, la adenina (A) se aparea con timina (T) (en el caso del ARN, sin embargo, la adenina (A) se aparea con uracilo (U)) y la citosina (C) se aparea con guanina (G), de modo que cada uno estos pares de bases forman una doble cadena. Como se usa en el presente documento, "datos de secuenciacion de acido nucleico", "informacion de secuenciacion de acido nucleico", "secuencia de acido nucleico", "secuencia genomica", "secuencia genetica", "secuencia de fragmentos" o "lectura de secuenciacion de acido nucleico" denota cualquier informacion o datos que son indicativos del orden de las bases nucleotidicas (por ejemplo, adenina, guanina, citosina y timina/uracilo) en una molecula (por ejemplo, un genoma completo, un transcriptoma completo, un exoma, oligonucleotido, polinucleotido, fragmento, etc.) ) de ADN o ARN
Es bien sabido que el ADN (acido desoxirribonucleico) es una cadena de nucleotidos que consiste en 4 tipos de nucleotidos; A (adenina), T (timina), C (citosina) y G (guanina), y ese ARN (acido ribonucleico) esta compuesto por 4 tipos de nucleotidos; A, U (uracilo), G y C. Tambien se sabe que todos estos 5 tipos de nucleotidos se unen espedficamente entre sf en combinaciones llamadas pares de bases complementarias. Es decir, la adenina (A) se aparea con timina (T) (en el caso del ARN, sin embargo, la adenina (A) se aparea con uracilo (U)) y la citosina (C) se aparea con guanina (G), de modo que cada uno estos pares de bases forman una doble cadena. Como se usa en el presente documento, "datos de secuenciacion de acido nucleico", "informacion de secuenciacion de acido nucleico", "secuencia de acido nucleico", "secuencia genomica", "secuencia genetica", "secuencia de fragmentos" o "lectura de secuenciacion de acido nucleico" denota cualquier informacion o datos que son indicativos del orden de las bases nucleotfdicas (por ejemplo, adenina, guanina, citosina y timina/uracilo) en una molecula (por ejemplo, genoma completo, transcriptoma completo, exoma, oligonucleotido, polinucleotido, fragmento, etc.) de ADN o ARN. Debe entenderse que las presentes ensenanzas contemplan la informacion de secuencia obtenida utilizando todas las variedades disponibles de tecnicas, plataformas o tecnologfas, entre las que se incluyen: electroforesis capilar, micromatrices, sistemas basados en ligado, sistemas basados en la polimerasa, sistemas basados en la hibridacion, sistemas de identificacion directa o indirecta de nucleotidos, pirosecuenciacion, sistemas de deteccion basados en iones o pH, sistemas basados en firmas electronicas, etc.
La referencia a una base, un nucleotido u otra molecula puede estar en singular o en plural. Es decir, "una base" puede hacer referencia a una sola molecula de esa base o a una pluralidad de la base, por ejemplo, en una solucion.
Un "polinucleotido", "acido nucleico" u "oligonucleotido" se refiere a un polfmero lineal de nucleosidos (incluidos desoxirribonucleosidos, ribonucleosidos o analogos de los mismos) unidos por enlaces internucleosfdicos. Tfpicamente, un polinucleotido comprende al menos tres nucleosidos. Por lo general, los oligonucleotidos vanan en tamano desde unas pocas unidades monomericas, por ejemplo, de 3-4 a varios cientos de unidades monomericas. Cuando un polinucleotido como un oligonucleotido este representado por una secuencia de letras, tal como "ATGCCTG", se entendera que los nucleotidos estan en el orden 5' -> 3' de izquierda a derecha y que "A" denota desoxiadenosina, "C" denota desoxicitidina, "G" denota desoxiguanosina y "T" denota timidina a menos que se indique lo contrario. Las letras A, C, G y T pueden usarse para hacer referencia a las propias bases, a los nucleosidos o a los nucleotidos que comprenden las bases, como es estandar en la tecnica.
Como se usa en el presente documento, la frase "dNTP" significa desoxinucleotido-trifosfato, en el que el nucleotido comprende una base nucleotfdica, tal como A, T, C, G o U.
El termino "monomero" como se usa en el presente documento significa cualquier compuesto que pueda incorporarse en una cadena molecular en crecimiento por una polimerasa dada. Dichos monomeros incluyen, sin limitaciones, los nucleotidos naturales (por ejemplo, ATp, GTP, Tt P, UTP, CTP, dATP, dGTP, dTTP, dUTP, dCTP, analogos sinteticos), precursores para cada nucleotido, nucleotidos de origen no natural y sus precursores o cualquier otra molecula que pueda incorporarse a una cadena polimerica en crecimiento por una polimerasa dada. Como se usa en el presente documento, "complementario" generalmente se refiere a la duplicacion de nucleotidos espedficos para formar pares de bases canonicos de Watson-Crick, como entienden los expertos en la tecnica. Sin embargo, el complementario tambien incluye apareamiento de bases de analogos nucleotfdicos que son capaces de aparear bases universales con los nucleotidos A, T, G o C y acidos nucleicos bloqueados que mejoran la estabilidad termica de los duplex. Un experto en la materia reconocera que la rigurosidad de la hibridacion es un factor determinante en el grado de apareamiento o apareamiento erroneo en el duplex formado por la hibridacion.
Como se usa en el presente documento, "resto" se refiere a una de dos o mas partes en las que se puede dividir algo, como, por ejemplo, las diversas partes de un hilo, una molecula o una sonda.
La frase "resto detectable electroqmmicamente", como se usa en el presente documento, se refiere a una sustancia que puede aceptar o donar al menos un electron durante una reaccion electroqmmica, tfpicamente oxidacion y/o reduccion (redox). Cada evento electroqmmico, es decir, una transferencia de electrones a o desde el resto detectable electroqmmicamente, contribuye a una corriente o voltaje electrico que el sistema puede detectar y registrar.
Como se usa en el presente documento, un "enlazador" es una molecula o resto que une dos moleculas o restos y proporciona un espaciado entre las dos moleculas o restos de manera que puedan funcionar de la manera deseada. Por ejemplo, un enlazador puede comprender una cadena de hidrocarburo de diamina que esta unida covalentemente a traves de un grupo reactivo en un extremo a una molecula analoga de oligonucleotido y a traves de un grupo reactivo en otro extremo a un soporte solido, tal como, por ejemplo, una superficie de perlas. El acoplamiento de enlazadores a nucleotidos y construcciones de sustrato de interes se puede lograr mediante el uso de reactivos de acoplamiento que son conocidos en la tecnica (vease, por ejemplo, Efimov et al., Nucleic Acids Res.
27: 4416-4426, 1999). Los metodos de derivacion y acoplamiento de moleculas organicas son bien conocidos en las tecnicas de qmmica organica y bioorganica. Un enlazador tambien puede ser escindible (por ejemplo, fotoescindible) o reversible.
Tal como se usa en el presente documento, el termino "enlazador fotoescindible" se refiere a un enlazador que se puede eliminar de un nucleotido, polinucleotido, grupo qmmico o acido nucleico, al cual esta unido o unido operativamente, por exposicion a radiacion electromagnetica (por ejemplo, luz visible, luz ultravioleta, etc.). La longitud de onda de la luz utilizada para fotoescindir el enlazador depende de la estructura del enlazador fotoescindible
Una "polimerasa" es una enzima generalmente para unir nucleotidos 3'-OH 5'-trifosfato, oligomeros y sus analogos. Las polimerasas incluyen, pero no se limitan a, ADN polimerasas dependientes de ADN, ARN polimerasas dependientes de ADN, ADN polimerasas dependientes de ARN, ARN polimerasas dependientes de ARN, ADN polimerasa de T7, ADN polimerasa de T3, ADN polimerasa de T4, ARN polimerasa de T7, ARN polimerasa de T3, ARN polimerasa de SP6, ADN polimerasa 1, fragmento Klenow, ADN polimerasa de Thermophilus aquaticus, Tth ADN polimerasa, ADN polimerasa Vent (New England Biolabs), ADN polimerasa Deep Vent (New England Biolabs), fragmento grande de ADN polimerasa Bst, fragmento de Stoeffel, ADN Polimerasa de 9 ° N, ADN polimerasa de pfu, ADN polimerasa de Tfl, polimerasa RepliPHI Phi29, ADN polimerasa Tli, ADN polimerasa beta eucariotica, telomerasa, polimerasa Therminator (New England Biolabs), KOD HiFi. ADN polimerasa (Novagen), ADN polimerasa KOD1, Q-beta replicasa, transferasa terminal, transcriptasa inversa AMV, transcriptasa inversa M-MLV, transcriptasa inversa Phi6, transcriptasa inversa VIH-1, nuevas polimerasas descubiertas mediante bioprospeccion y polimerasas citadas en la publicacion de solicitud de patente de Estados Unidos n.° 2007/0048748 y en laspatentes de Estados Unidos n.° 6.329.178; 6.602.695 y 6.395.524. Estas polimerasas incluyen isoformas mutantes de tipo salvaje y variantes geneticamente modificadas, tanes como exo-polimerasas y otras mutantes, por ejemplo, que toleran los nucleotidos marcados y los incorporan en una cadena de acido nucleico.
El termino "cebador" se refiere a un oligonucleotido, ya sea de origen natural como en un producto de digestion de restriccion purificado o que se produzca sinteticamente, que sea capaz de actuar como un punto de inicio de la smtesis cuando se coloque en condiciones en las que se induzca la smtesis de un producto de extension del cebador que sea complementary a una cadena de acido nucleico (por ejemplo, en presencia de nucleotidos y un agente inductor tal como ADN polimerasa y a una temperatura y pH adecuados). Preferentemente, el cebador es monocatenario para una maxima eficiencia en la amplificacion, pero, como alternativa, puede ser bicatenario. Si es bicatenario, el cebador se trata primero para separar las cadenas antes de usar para preparar productos de extension. Preferentemente, el cebador es un oligodesoxirribonucleotido. El cebador debe ser lo bastante largo como para cebar la smtesis de los productos de extension en presencia del agente inductor. Las longitudes exactas de los cebadores dependeran de muchos factores, incluidos la temperatura, la fuente del cebador y el uso del procedimiento.
Como se usa en el presente documento, un "sistema" denota un conjunto de componentes, reales o abstractos, que comprende un todo en el que cada componente interacciona con o esta relacionado con al menos otro componente dentro del todo.
Se describen varias plataformas de secuenciacion de acidos nucleicos, ensamblaje de acidos nucleicos y/o sistemas de mapeo (por ejemplo, software de y/o hardware de ordenador), por ejemplo, en lapublicacion de solicitud de patente de Estados Unidos n.° 2011/0270533.
Como se usa en el presente documento, los terminos "alquilo" y el prefijo "alq" incluyen tanto los grupos saturados o insaturados de cadena lineal como los de cadena ramificada y los grupos dclicos, por ejemplo, grupos cicloalquilo y cicloalquenilo. A menos que se especifique lo contrario, los grupos alquilo adclicos son de 1 a 6 carbonos. Los grupos dclicos pueden ser monodclicos o polidclicos y, preferentemente, tienen de 3 a 8 atomos de carbono en el anillo. Los grupos dclicos de ejemplo incluyen grupos ciclopropilo, ciclopentilo, ciclohexilo y adamantilo. Los grupos alquilo pueden estar sustituidos con uno o mas sustituyentes o no sustituidos. Los sustituyentes de ejemplo incluyen alcoxi, ariloxi, sulfhidrilo, alquiltio, ariltio, halogeno, alquilsililo, hidroxilo, fluoroalquilo, perfluoralquilo, amino, aminoalquilo, amino disustituido, amino cuaternario, hidroxialquilo, carboxialquilo y carboxilo. Cuando se usa el prefijo "alq", el numero de carbonos contenidos en la cadena alquilo viene dado por el intervalo que precede directamente a este termino, con el numero de carbonos contenidos en el resto del grupo que incluye este prefijo definido en otra parte en el presente documento. Por ejemplo, el termino "alcarilo C1-C4" ilustra un grupo arilo de 6 a 18 carbonos (por ejemplo, vease mas adelante) unido a un grupo alquilo de 1 a 4 carbonos.
Como se usa en el presente documento, el termino "arilo" se refiere a un anillo o sistema de anillo aromatico carbodclico. A menos que se especifique lo contrario, los grupos arilo son de 6 a 18 carbonos. Los ejemplos de grupos arilo incluyen grupos fenilo, naftilo, bifenilo, fluorenilo e indenilo.
Como se usa en el presente documento, el termino "heteroarilo" se refiere a un anillo aromatico o sistema de anillo que contiene al menos un heteroatomo de anillo (por ejemplo, O, S, Se, N o P). A menos que se especifique lo contrario, los grupos heteroarilo son de 1 a 9 carbonos. Los grupos heteroarilo incluyen grupos furanilo, tienilo, pirrolilo, imidazolilo, pirazolilo, oxazolilo, isoxazolilo, tiazolilo, isotiazolilo, triazolilo, tetrazolilo, oxadiazolilo, oxatriazolilo, piridilo, piridazilo, pirimidilo, pirazilo, triazolo, benzofuranilo, isobenzofuranilo, benzotienilo, indol, indazolilo, indolizinilo, benzisoxazolilo, quinolinilo, isoquinolinilo, cinnolinilo, quinazolinilo, naftirinilo, ftalazinilo, fenantrolinilo, purinilo y carbazolilo.
Como se usa en el presente documento, el termino "heterociclo" se refiere a un anillo o sistema de anillo no aromatico que contiene al menos un heteroatomo de anillo (por ejemplo, O, S, Se, N o P). A menos que se especifique lo contrario, los grupos heterodclicos son de 2 a 9 carbonos. Los grupos heterodclicos incluyen, por ejemplo, grupos dihidropirrolilo, tetrahidropirrolilo, piperazinilo, piranilo, dihidropiranilo, tetrahidropiranilo, dihidrofuranilo, tetrahidrofuranilo, dihidrotiofeno, tetrahidrotiofeno y morfolinilo.
Los grupos arilo, heteroarilo o heterodclicos pueden estar sin sustituir o sustituidos con uno o mas sustituyentes seleccionados del grupo que consiste en alquilo C1-6, hidroxi, halo, nitro, alcoxi C1-6, alquiltio C1-6, trifluorometilo, acilo C1-6, arilcarbonilo, heteroarilcarbonilo, nitrilo, alcoxicarbonilo C1-6, alcarilo (donde el grupo alquilo tiene de 1 a 4 atomos de carbono), y alcheteroarilo (donde el grupo alquilo tiene de 1 a 4 atomos de carbono).
Como se usa en el presente documento, el termino "alcoxi" se refiere a un sustituyente qmmico de la formula -OR, en la que R es un grupo alquilo. Por "ariloxi" se entiende un sustituyente qmmico de la formula -OR', en la que R' es un grupo arilo.
Como se usa en el presente documento, el termino "alcarilo CCx-y" se refiere a un sustituyente qmmico de formula -RR', en la que R es un grupo alquilo de carbonos x a y y R' es un grupo arilo como se define en otra parte en el presente documento.
Como se usa en el presente documento, el termino "alcheteroarilo Cx-y " se refiere a un sustituyente qmmico de formula RR", en la que R es un grupo alquilo de x a y carbonos, y R" es un grupo heteroarilo como se define en otra parte en el presente documento.
Como se usa en el presente documento, el termino "O, S o N no vecinal" se refiere a un sustituyente heteroatomo de oxigeno, azufre o nitrogeno en un enlace, en el que el sustituyente heteroatomo no forma un enlace a un carbono saturado que esta enlazado a otro heteroatomo.
Realizaciones de la tecnologla
La tecnologia descrita en el presente documento se refiere a analogos nucleotidicos y metodos relacionados, composiciones (por ejemplo, mezclas de reaccion), kits y sistemas para la secuenciacion de acidos nucleicos. En particular, algunas realizaciones de los analogos nucleotidicos comprenden un terminador fotoescindible para controlar la secuenciacion gradual de una cadena de acido nucleico y un resto detectable electroqdmicamente para la deteccion e identification de cada base particular, por ejemplo, para determinar una secuencia de acido nucleico. La tecnologia ofrece ventajas sobre los metodos convencionales, tal como un menor coste y una menor complejidad.
Analogos nucleotidicos
En el presente documento se proporcionan analogos nucleotidicos. Los analogos nucleotidicos comprenden uno o mas restos de termination fotoescindibles, por ejemplo, que comprenden ademas, en algunas realizaciones, un resto detectable por fluorescencia o un resto detectable electroqdmicamente. Por ejemplo, la tecnologia proporciona un nucleotido tal como:
Figure imgf000015_0001
en el que P es el resto fosfato (por ejemplo, un monofosfato, un difosfato o un trifosfato) como se define en el presente documento y B es una base, por ejemplo, adenina, timina, citosina, guanina o uracilo.
Los analogos nucleotidicos no estan limitados a un grupo fosfato espedfico. En una realization, el grupo fosfato es un grupo monofosfato o un polifosfato, tal como un grupo difosfato o un grupo trifosfato. En algunas realizaciones, el grupo fosfato es un pirofosfato. Ademas, la base de los analogos nucleotidicos no se limita a una base espedfica. En algunas realizaciones, la base es una adenina, citosina, guanina, timina, uracilo y analogos de las mismas, tales como, por ejemplo, bases adclicas. Los analogos nucleotidicos no estan limitados a un resto de azucar espedfico. En algunas realizaciones, dicho resto de azucar es una ribosa, desoxirribosa, didesoxirribosa y sus analogos.
En algunas realizaciones, el analogo nucleotidico tiene una estructura que es:
Figure imgf000015_0002
en la que ET es un resto terminador detectable electroqtimicamente (por ejemplo, que comprende un resto E detectable electroquimicamente como se describe en el presente documento o como se conoce en la tecnica), ET/FT es un resto terminador detectable por fluorescencia (por ejemplo, que comprende un resto detectable por fluorescencia como se describe en el presente documento, por ejemplo, "F" en las estructuras proporcionadas en el presente documento) o un resto terminador detectable electroquimicamente (por ejemplo, que comprende un resto detectable electroqtimicamente como se describe en el presente documento, por ejemplo, "E" en las estructuras proporcionadas en el presente documento, o como se conoce en la tecnica), y XT es un segundo resto de terminacion (por ejemplo, como se proporciona en el presente documento y/o como se conoce en la tecnica). En algunas realizaciones, se proporcionan cuatro analogos nucleotidicos, cada uno de los cuales comprende un ET o FT diferente y el mismo XT.
Por ejemplo, en algunas realizaciones ET es
Figure imgf000016_0001
En algunas realizaciones, FT es
Figure imgf000017_0001
En algunas realizaciones, XT es
Figure imgf000017_0002
La shtesis de compuestos que se proporciona en el presente documento se realiza como se describe, por ejemplo, en las patentes de Estados Unidos N.° 7.893.227; 7.897.737; 7.964.352; y 8.148.503, con las modificaciones necesarias para reemplazar los restos fluorescentes con restos detectables electroqwmicamente para proporcionar los diversos analogos nucleotfdicos descritos en el presente documento. En el siguiente ejemplo se proporcionan esquemas sinteticos adicionales.
En algunas realizaciones, los terminadores III y VII se escinden por un foton de luz que tiene una longitud de onda de 500-550 nm (por ejemplo, 520 nm). En algunas realizaciones, el terminador XT se escinde por un foton de luz que tiene una longitud de onda de 325-375 nm (por ejemplo, 354 nm). En algunas realizaciones, los terminadores II y VI son escindidos por fotones de luz (por ejemplo, dos o mas fotones) que tienen una longitud de onda de 740-780 nm (por ejemplo, 766 nm). Ejemplos de los productos de escision son:
Figure imgf000018_0001
En algunas realizaciones, la tecnologfa permite desproteger el extremo 3’ y la base de forma selectiva y/o secuencial en el mismo sistema mediante el ajuste fino de las longitudes de onda utilizadas para desproteger, por ejemplo, para que un enlace pueda romperse con un color de luz antes de que el otro enlace se rompa por el otro color de la luz. El color de la luz se usa como un "interruptor" espedfico que rompe los enlaces (por ejemplo, para liberar los terminadores) pero sin impactar o danar el enlace no deseado. Esto permite el control y ofrece diversos beneficios descritos en el presente documento. En algunas realizaciones, los analogos nucleotfdicos comprenden un elemento de deteccion electrica, por ejemplo, como se indica con los nuevos compuestos proporcionados en el presente documento y para compuestos mejorados que comprenden un marcador fluorescente en uso convencional. Los compuestos mejorados eliminan o minimizan las caractensticas fluorescentes indeseables y los inconvenientes asociados sufridos por esa tecnica anterior.
En este esquema anterior, una vez que se ha consultado al resto electroqdmico para identificar la base que se ha incorporado, se retira de la base mediante el procedimiento de fotoescision y se difunde fuera de la ubicacion de la reaccion de secuenciacion (por ejemplo, una reaccion de secuenciacion en un espacio estocasticamente confinado, tal como como en una gda de onda de modo cero o nanoestructura similar). La cadena en crecimiento es libre de comenzar el ciclo nuevamente e identificar la siguiente base en la secuencia.
En realizaciones similares, un analogo nucleotfdico como los descritos en, por ejemplo, las patentes de Estados Unidos N° 7.893.227; 7.897.737; 7.964.352; y8.148.503, y en Litosh et al (2010) "Improved nucleotide selectivity and termination of 3'-OH unblocked reversible terminators by molecular tuning of 2-nitrobenzyl alkylated HOMedU triphosphates" Nucleic Acids Res. 39 (6): e39, y otros, se modifican (por ejemplo, un analogo nucleotfdico terminador en el que un resto detectable por fluorescencia se reemplaza por un resto detectable electroqmmicamente) y se usa sin el enfoque de doble marcaje fotoqdmico. Por consiguiente, debe entenderse que la tecnologfa tambien proporciona una mejora de los analogos nucleotfdicos existentes, tales como los compuestos desprotegibles fotoqdmicos en general y no se limita al uso en el modo de longitud de onda dual como se ha descrito anteriormente.
Guias de onda de modo cero
En algunos ensayos, las moleculas estan confinadas en una serie, matriz u otra disposicion de pequenos orificios, poros o pocillos, por ejemplo, una grna de onda de modo cero (ZMW), por ejemplo, como se describe en la publicacion de solicitud de patente de Estados Unidos n.° 2011/0117637. Las matrices de ZMW se han aplicado a diversos analisis bioqmmicos y han encontrado una utilidad particular para el analisis genetico. Los ZMW comprenden tipicamente un nucleo, pocillo o abertura a nanoescala dispuestos en una capa de revestimiento opaco que se dispone sobre un sustrato transparente, por ejemplo, un orificio circular en una pelfcula de revestimiento de aluminio depositada sobre un sustrato de sflice transparente. Vease, por ejemplo, J. Korlach et al, "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures", 105 PNAS 1176-81 (2008). Un agujero ZMW tfpico tiene un diametro de ~70 nm y una profundidad de ~100 nm. La tecnologfa ZMW permite el analisis sensible de moleculas individuales porque, a medida que la luz viaja a traves de una pequena abertura, el campo optico decae exponencialmente dentro de la camara. Es decir, debido a las estrechas dimensiones del pocillo, se evitara que la radiacion electromagnetica que tenga una frecuencia por encima de una frecuencia de corte particular se propague por todo el nucleo. A pesar de lo anterior, la radiacion penetrara una distancia limitada en el nucleo, proporcionando un volumen iluminado muy pequeno dentro del nucleo. Al iluminar un volumen muy pequeno, se pueden interrogar cantidades muy pequenas de reactivos, que incluyen, por ejemplo, reacciones de una sola molecula. El volumen de observacion dentro de un ZMW iluminado es de ~20 zeptolitros (20 * 10-21 litros). Dentro de este volumen, la actividad de la ADN polimerasa que incorpora un solo nucleotido puede detectarse facilmente.
Al monitorizar las reacciones a nivel de una sola molecula, uno puede identificar y/o monitorizar con precision una reaccion dada. En particular, en algunas realizaciones, la tecnologfa de grna de onda en modo cero es la base para un campo de secuenciacion de ADN de molecula unica que controla la smtesis de molecula por molecula (por ejemplo, nucleotido por nucleotido) de una cadena de ADN de una manera dependiente del molde mediante una unica enzima polimerasa (por ejemplo, secuenciacion del ADN en tiempo real de una sola molecula (SMRT), como la realizada por un secuenciador Rs de Pacific Biosciences (Pacific Biosciences, Menlo Park, CA)). Veanse, por ejemplo, las patentes de Estados Unidos n.° 7.476.503; 7.486.865; 7.907.800; 7.170.050; 8.795.961; 8.501.405; 9.063.156 y 8.153.375. Veanse tambien, Eid, J. et al. 2009. "Real-time DNA sequencing from single polymerase molecules", 323 Science: 133-38 (2009); Korlach, J. et al. "Long, processive enzymatic DNA synthesis using 100% dye-labeled terminal phosphate-linked nucleotides", 27 Nucleosides, Nucleotides & Nucleic Acids: 1072-82 (2008); Lundquist, P. M. et al., "Parallel confocal detection of single molecules in real time", 33 Optics Letters: 1026-28 (2008); Korlach, J. et al., "Selective aluminum passivation for targeted immobilization of single dna polymerase molecules in zero-mode waveguide nanostructures", 105 Proc Natl Acad Sci USA: 1176-81 (2008); Foquet, M. et al., "Improved fabrication of zero-mode waveguides for single-molecule detection", 103 Journal of Applied Physics (2008); and Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations", 299 Science: 682-86 (2003).
En algunas tecnologfas, la colocacion de componentes en los pocillos de ZMW se basa en la difusion simple para entregar componentes (por ejemplo, macromoleculas tales como ADN polimerasa y/o ADN y/o complejos de ADN/ADN polimerasa) en el sitio deseado (por ejemplo, la parte inferior del pocillo de ZMW) en las grnas de onda de modo cero. Algunas tecnologfas colocan componentes en los pocillos de un ZMW utilizando tecnologfa basada en el transporte activo de componentes del ensayo (por ejemplo, una macromolecula como un ADN, una ADN polimerasa, un complejo ADN/ADN polimerasa, una protema, etc.) para obtener una sitio para un ensayo (por ejemplo, el fondo de un pocillo de ZMW). Las variaciones particulares de las tecnologfas de transporte activo y liberacion utilizan filamentos de actina o microtubulos que se unen al fondo de una grna de onda de modo cero. Los filamentos o microtubulos de actina sirven como guias de transporte para las macromoleculas (por ejemplo, la ADN polimerasa o el complejo de ADN polimerasa/ADN). Vease, por ejemplo, la publicacion internacional numeroWO-2013/102081.
En ciertas realizaciones, la tecnologfa encuentra uso para los metodos de secuenciacion de ADN que utilizan guias de onda de modo cero (ZMW), por ejemplo, segun lo desarrollado por Pacific Biosciences o metodos similares. En algunas realizaciones de esta tecnologfa, la secuenciacion de ADN se realiza en un chip, cada uno de los cuales contiene miles de guias de onda de modo cero (ZMW). En algunas realizaciones, un ZMW es un agujero, de decenas de nanometros de diametro, fabricado en una pelmula metalica de 100 nm depositada sobre un sustrato de dioxido de silicio. Cada ZMW se convierte en una camara de visualizacion nanofotonica que proporciona un volumen de deteccion de solo 20 zeptolitros (10-21 l). En este volumen, la actividad de una sola molecula puede detectarse entre un fondo de miles de nucleotidos marcados. La ZMW proporciona una ventana para observar la ADN polimerasa a medida que realiza la secuenciacion por smtesis. Dentro de cada camara, una unica molecula de ADN polimerasa esta unida a la superficie inferior de manera que reside permanentemente dentro del volumen de deteccion. Los analogos nucleotfdicos como se proporcionan en el presente documento, cada tipo (por ejemplo, A, T, C y G) marcados con un fluoroforo de color diferente o un grupo diferente detectable electroqmmicamente, se introducen en la solucion de reaccion a altas concentraciones que promueven la velocidad, precision y capacidad de procesamiento de la enzima. Debido al pequeno tamano de la ZMW, incluso a estas altas concentraciones biologicamente relevantes, el volumen de deteccion esta ocupado por los nucleotidos solo una pequena fraccion del tiempo. Ademas, las visitas al volumen de deteccion son rapidas y duran solo unos pocos microsegundos, debido a la pequena distancia que la difusion tiene para transportar los nucleotidos. El resultado es un fondo muy bajo.
Restos fluorescentes
En algunas realizaciones, el resto detectable es un colorante fluorogenico. Se conocen varias clases de colorantes fluorogenicos y compuestos espedficos que son apropiados para realizaciones particulares de la tecnologfa: derivados de xanteno, tales como fluorescema, rodamina, verde de Oregon, eosina y rojo Texas; derivados de cianina, tales como cianina, indocarbocianina, oxacarbocianina, tiacarbocianina y merocianina; derivados de naftaleno (derivados de dansilo y prodan); derivados de cumarina; derivados de oxadiazol tales como piridiloxazol, nitrobenzoxadiazol y benzoxadiazol; derivados de pireno tales como azul en cascada; derivados de oxazina tales como rojo Nilo, azul Nilo, violeta de cresilo y oxazina 170; derivados de acridina tales como proflavina, naranja de acridina y amarillo de acridina; derivados de arilmetina tales como auramina, cristal violeta y verde malaquita; y derivados de tetrapirol tales como porfina, ftalocianina, bilirrubina. En algunas realizaciones, el resto fluorescente es un colorante que es xanteno, fluorescema, rodamina, BODIPY, cianina, cumarina, pireno, ftalocianina, ficobiliprotema, ALEXA FLUOR® 350, ALEXA FLUOR® 405, ALEXA FLUOR® 430, ALEXA FLUOR® 488, ALEXA FLUOR® 514, ALEXA FLUOR® 532, ALEXA FLUOR® 546, ALEXA FLUOR® 555, ALEXA FLUOR® 568, ALEXA FLUOR® 568, ALEXA FLUOR® 594, ALEXA FLUOR® 610, ALEXA FLUOR® 633, ALEXA FLUOR® 647, ALEXA FLUOR® 660, ALEXA FLUOR® 680, ALEXA FLUOR® 700, ALEXA FLUOR® 750, o un colorante de escuarama.
Ademas, los ejemplos no limitantes de fluoroforos incluyen colorantes que pueden sintetizarse u obtenerse comercialmente (por ejemplo, Operon Biotechnologies, Huntsville, Alabama). Un gran numero de colorantes (mas de 50) estan disponibles para su aplicacion en aplicaciones de excitacion por fluorescencia. Estos colorantes incluyen los de las familias de colorantes de fluorescema, rodamina Alexa Fluor, Bodipy, cumarina y cianina. Los ejemplos espedficos de fluoroforos incluyen, pero no se limitan a los mismos, FAM, TET, HEX, Cy3, TMR, ROX, rojo Texas, rojo LC 640, Cy5 y rojo LC 705. En algunas realizaciones, los colorantes con maximos de emision de 410 nm ( por ejemplo, Cascade Blue) a 775 nm (por ejemplo, Alexa Fluor 750) estan disponibles y se pueden usar. Por supuesto, un experto en la tecnica reconocera que tambien se pueden usar colorantes que tienen maximos de emision fuera de estos intervalos. En algunos casos, los colorantes que oscilan entre 500 nm y 700 nm tienen la ventaja de estar en el espectro visible y pueden detectarse utilizando tubos fotomultiplicadores convencionales. En algunas realizaciones, la amplia gama de colorantes disponibles permite la seleccion de conjuntos de colorantes que tienen longitudes de onda de emision que se extienden a traves del rango de deteccion. Los sistemas de deteccion capaces de distinguir muchos colorantes son conocidos en la tecnica.
Restos detectables electroquimicamente
En algunas realizaciones, los analogos nucleotidicos proporcionados comprenden un resto electroqmmico que es una especie facilmente oxidable o reducible. El resto electroquimicamente activo puede ser un numero de moleculas y/o restos directamente electroquimicamente activos, mediadores electroqmmicos y/u otros marcadores tales como enzimas u otras moleculas que inducen o influyen en la generacion de senales electronicas o electroqmmicas. Cuando se une a un analogo nucleotidico, el resto electroquimicamente activo (por ejemplo, detectable electroquimicamente) identifica la base nucleotidica incorporada en el extremo 3' de la cadena en crecimiento que se esta sintetizando y, por lo tanto, permite determinar la secuencia de la cadena de ADN o ARN que se esta secuenciando. Los restos detectables electroquimicamente abarcados por la tecnologfa incluyen, entre otros, un grupo redox organico, un grupo organometalico, una nanopartmula metalica y un punto cuantico. Los grupos redox organicos de ejemplo incluyen, pero no se limitan a, azul de metileno, antraquinona y tionina; los ejemplos de grupos organometalicos incluyen, pero no se limitan a los mismos, ferroceno, derivados de ferroceno, complejos de bipirideno de rutenio y complejos de bipirideno de osmio; las nanopartmulas metalicas de ejemplo incluyen, pero no se limitan a los mismos, oro y plata; los puntos cuanticos de ejemplo incluyen, pero no se limitan a los mismos, CdS, CdSe y ZnS. En algunas realizaciones, se contempla que los analogos nucleotfdicos comprenden una estructura como se proporciona en laspatentes de Estados Unidos Nos. 7.893.227; 7.897.737; 7.964.352; y 8.148.503,con el resto fluorescente descrito en las mismas reemplazado por un resto detectable electroquimicamente como se describe en el presente documento o como se conoce en la tecnica.
En algunas realizaciones, el resto detectable electroquimicamente comprende un metal de transicion, tal como rutenio, osmio, hierro, rodio o cobre. Los acidos nucleicos modificados que comprenden estos metales se describen, por ejemplo, en Angew. Chem., Int. Ed. Engl. 1995, 34, 352-354; Meade, T. J. Metal Ions in Biological Systems; Sigel, A., Sigel, H., Eds.; Marcel Dekker: New York, 1996; pag. 32, 453-478; Helv. Chim. Acta 1997, 80, 640-652; J. Am. Chem. Soc. 1998, 120, 2194-2195; J. Am. Chem. Soc. 2000, 122, 6287-6288; Inorg. Chem. 1999, 38, 174­ 189; Chem. Commun. 1997, 1609-1610; Nucleic Acids Res. 1996, 24, 4273-4280; Chem. Commun. 1996, 555-557; J. Am. Chem. Soc. 1997, 119, 5045-5046; Nature 1996, 382, 731-735; and J. Am. Chem. Soc. 1994. 116, 5981­ 5982.
Un metodo sintetico de ejemplo para proporcionar un resto detectable electroquimicamente unido a un nucleotido es una reaccion para unir un grupo ferroceno al carbono C-5 de timidina, por ejemplo, como se describe en Pike et al. (2002) "Metallocene - DNA: Synthesis, Molecular and Electronic Structure and DNA Incorporation of C5Ferrocenylthymidine Derivatives” Chem. Eur. J. 8(13): 2891-2899. Se pueden sintetizar diversos derivados de ferrocenil timidina de la siguiente manera:
Figure imgf000021_0001
Otro metodo sintetico de ejemplo para proporcionar un resto detectable electroqmmicamente unido a un nucleotido es una reaccion para unir una base modificada con etiniluracilo a 2-yodoantraquinona, por ejemplo, como se describe en Gorodetsky et al. (2007) "Coupling into the Base Pair Stack is Necessary for DNA-Mediated Electrochemistry” Bioconjugate Chem.18: 1434-1441.
Figure imgf000021_0002
Otro metodo sintetico de ejemplo para proporcionar un resto detectable electroqwmicamente unido a un nucleotido es una reaccion para unir complejos de bipiridina de rutenio, osmio u otros metales de transicion a bases de nucleotidos usando intermedios de analogos nucleotidicos yodados, por ejemplo, como se describe en Vrabel et al. (2009) "Base-Modified DNA Labeled by [Ru(bpy)3]2+ and [Os(bpy)3]2+ Complexes” Chem. Eur. J. 15: 1144-1154.
Figure imgf000022_0001
En este esquema, 1Ru o 1Os, Pd(OAc)2, TPPTS, CuI, EfeN, H2O/CH3CN 2:1, 1 hora, 70 °C.
Otro metodo sintetico de ejemplo para proporcionar un resto detectable electroqmmicamente unido a un analogo nucleotfdico es proporcionado por la patente de Estados Unido. N.° 7.893.227; 7.897.737; 7.964.352; y8.148.503, y en Litosh et al (2010) "Improved nucleotide selectivity and termination of 3'-OH unblocked reversible terminators by molecular tuning of 2-nitrobenzyl alkylated HOMedU triphosphates" Nucleic Acids Res. 39 (6): e39, en el que un resto detectable electroqmmicamente se sustituye por un resto detectable por fluorescencia. Los intermedios qmmicos se fabrican utilizando smtesis conocidas en la tecnica, tal como se describe en lapatente de Estados Unidos N.° 7.893.227; 7.897.737; 7.964.352; y 8.148.503; en Litosh et al, citado anteriormente; y segun lo proporcionado por los esquemas sinteticos descritos en el presente documento. Se utilizan esquemas sinteticos similares para unir grupos redox a otras partes del nucleotido, tal como el azucar o grupo trifosfato.
Otro ejemplo de nucleotido que comprende un resto detectable electroqmmicamente es, por ejemplo, un nucleotido que comprende un grupo ferrocenilo unido a la posicion 2' del anillo de ribosa. Vease, por ejemplo, Yu (2001) "2'-Ribose-Ferrocene Oligonucleotides for Electronic Detection of Nucleic Acids" J. Org. Chem. 66: 2937-2942.
Metodos de secuenciacion
La tecnologfa se refiere, en algunas realizaciones, a metodos para secuenciar un acido nucleico. En algunas realizaciones, la secuenciacion se realiza mediante la siguiente secuencia de eventos con el uso de ejemplo de un analogo nucleotfdico que comprende al menos dos restos de terminacion fotoqmmicos diferentes. Primero, un analogo nucleotfdico que comprende un resto de terminacion detectable electroqmmicamente o por fluorescencia (por ejemplo, unido a la base nucleotfdica) y un segundo resto de terminacion (por ejemplo, unido al hidroxilo en 3') esta orientado en el sitio activo de la polimerasa (por ejemplo, mediante una polimerasa ubicado en el volumen de iluminacion de una gma de onda en modo cero) para emparejarse a una base complementaria de la cadena molde y estar adyacente al hidroxilo en 3' libre de la cadena sintetizada en crecimiento. A continuacion, el analogo nucleotfdico se anade al extremo 3' de una cadena en crecimiento mediante la polimerasa, por ejemplo, mediante el ataque catalizado por enzimas del hidroxilo en 3' en el alfa-fosfato del analogo nucleotfdico. La extension adicional de la cadena por la polimerasa esta bloqueada por el grupo de terminacion en 3' en el analogo nucleotfdico incorporado. El detector electroqmmico o fluorescente (por ejemplo, despues de la excitacion por una fuente de emision) consulta el resto detectable electroqmmicamente o por fluorescencia en el nucleotido incorporado para identificar la base agregada a la cadena sintetizada.
A continuacion, el resto de terminacion detectable electroqmmicamente o por fluorescencia (por ejemplo, unido a la base nucleotidica) se elimina mediante exposicion (por ejemplo, en el volumen de iluminacion de una gma de onda en modo cero) a una longitud de onda de luz que escinde el resto de terminacion detectable electroqmmicamente o por fluorescencia del analogo nucleotfdico. Aunque se ha liberado el resto de terminacion detectable electroqmmicamente o por fluorescencia, la extension adicional de la cadena por la polimerasa permanece bloqueada por el grupo de terminacion en 3' (segundo resto de terminacion) en el analogo nucleotfdico incorporado. A continuacion, el segundo resto de terminacion se elimina mediante exposicion (por ejemplo, en el volumen de iluminacion de una gma de onda en modo cero) a una longitud de onda de luz que escinde el segundo resto de terminacion del analogo nucleotfdico. En algunas realizaciones, la longitud de onda de la luz que escinde el resto de terminacion detectable electroqmmicamente o por fluorescencia es diferente de la longitud de onda de la luz que escinde el segundo resto de terminacion, por ejemplo, bloqueando el hidroxilo en 3'. Despues de que se libera el segundo resto de terminacion, el hidroxilo en 3' de la cadena en crecimiento queda libre para una polimerizacion adicional: la siguiente base se incorpora para continuar otro ciclo, por ejemplo, un analogo nucleotfdico se orienta en el sitio activo de la polimerasa, se anade el analogo nucleotidico al extremo 3' de la cadena en crecimiento por la polimerasa, se consulta el analogo nucleotidico para identificar la base anadida y se desprotege el analogo nucleotidico.
Algunas realizaciones se refieren a la secuenciacion paralela (por ejemplo, masivamente paralela). Por ejemplo, en algunas realizaciones, todas las reacciones de secuenciacion se exponen a la luz en paralelo para desproteger los analogos nucleotidicos en paralelo. La identificacion de la base incorporada se realiza mediante deteccion electroqmmica del resto detectable electroqmmicamente (por ejemplo, que proporciona una "firma" de cada base) antes de que se escinda.
En algunas realizaciones, la secuenciacion se realiza mediante la siguiente secuencia de eventos con el uso a modo de ejemplo de un nucleotido que comprende un resto de terminacion fotoqmmico. Primero, un analogo nucleotidico que comprende un resto de terminacion detectable electroqmmicamente (por ejemplo, unido a la base nucleotidica) esta orientado en el sitio activo de la polimerasa (por ejemplo, por una polimerasa ubicada en el volumen de iluminacion de una gma de onda en modo cero) para aparearse con una base complementaria de la cadena molde y para ser adyacente al hidroxilo 3' libre de la cadena sintetizada en crecimiento. A continuacion, el analogo nucleotidico se anade al extremo 3' de una cadena en crecimiento mediante la polimerasa, por ejemplo, mediante el ataque catalizado por enzimas del hidroxilo en 3' en el alfa-fosfato del analogo nucleotfdico. La extension adicional de la cadena por la polimerasa esta bloqueada por el resto de terminacion detectable electroqmmicamente del analogo nucleotidico incorporado, por ejemplo, por el impedimento esterico de la catalisis, la deformacion de los constituyentes del sitio activo, etc. El resto detectable electroqmmicamente en el nucleotido incorporado es consultado por un detector electroqmmico para identificar la base agregada a la cadena sintetizada.
A continuacion, el resto de terminacion detectable electroqmmicamente (por ejemplo, unido a la base nucleotfdica) se elimina mediante exposicion (por ejemplo, en el volumen de iluminacion de una gma de onda en modo cero) a una longitud de onda de luz que escinde el resto de terminacion detectable electroqmmicamente del analogo nucleotidico. Despues de que se libera el resto de terminacion detectable electroqmmicamente, el hidroxilo en 3' de la cadena en crecimiento queda libre para una polimerizacion adicional: la siguiente base se incorpora para continuar otro ciclo, por ejemplo, un analogo nucleotidico se orienta en el sitio activo de la polimerasa, se anade el analogo nucleotidico al extremo 3' de la cadena en crecimiento por la polimerasa, se consulta el analogo nucleotidico para identificar la base anadida y se desprotege el analogo nucleotfdico.
Por consiguiente, en algunas realizaciones, la tecnologfa proporciona que los nucleotidos en el extremo de la cadena estan protegidos en 3', por lo que no pueden reaccionar con el trifosfato en 5' de los nuevos nucleotidos que entran en el sitio activo hasta despues de desbloquear el extremo 3' (ya sea eliminando un resto de terminacion del hidroxilo en 3' o eliminando el impedimento esterico a la polimerizacion). Por lo tanto, uno puede leer toda o sustancialmente toda la senal de fluorescencia o electroqmmica sin los problemas asociados con la reincorporacion y la lectura de la siguiente base. En realizaciones relacionadas con los reactivos basados en la deteccion electroqmmica, dichos reactivos se desarrollan para la secuenciacion utilizando desproteccion fotoqmmica utilizando un solo grupo de desproteccion fotoqmmica y un elemento electroqmmicamente activo que sirve para la deteccion. Este enfoque mejora las tecnologfas existentes (por ejemplo, como lo proporciona la qmmica de LaserGen) y, por lo tanto, encuentra uso en las aplicaciones de secuenciacion por smtesis que tienen mayor precision y menor coste al incluir estos enfoques en sistemas opticos de bajo coste, tal como los sistemas basados en gmas de onda en modo cero y similares.
Plataformas de secuenciacion de acidos nucleicos
En algunas realizaciones de la tecnologfa, se generan datos de secuencia de acido nucleico. Varias realizaciones de plataformas de secuenciacion de acidos nucleicos (por ejemplo, un secuenciador de acidos nucleicos) incluyen componentes como se describe a continuacion. Segun diversas realizaciones, un instrumento de secuenciacion incluye una unidad de control y liberacion de fluidos, una unidad de procesamiento de muestras, una unidad de deteccion de senales y una unidad de adquisicion, analisis y control de datos. Varias realizaciones del instrumento proporcionan una secuenciacion automatizada que se usa para recopilar informacion de secuencia de una pluralidad de secuencias en paralelo y/o sustancialmente de forma de simultanea.
En algunas realizaciones, la unidad de administracion y control de fluidos incluye un sistema de administracion de reactivos. El sistema de liberacion de reactivos incluye un reservorio de reactivos para el almacenamiento de diversos reactivos. Los reactivos pueden incluir cebadores basados en ARN, cebadores de ADN directos/inversos, mezclas de nucleotidos (por ejemplo, composiciones que comprenden analogos nucleotfdicos como se proporcionan en el presente documento) para secuenciacion por smtesis, tampones, reactivos de lavado, reactivos de bloqueo, reactivos de separacion y similares. Ademas, el sistema de liberacion de reactivos puede incluir un sistema de pipeteado o un sistema de flujo continuo que conecta la unidad de procesamiento de muestras con el deposito de reactivos.
En algunas realizaciones, la unidad de procesamiento de muestras incluye una camara de muestras, tal como una celda de flujo, un sustrato, una micromatriz, una bandeja de multiples pocillos o similares. La unidad de procesamiento de muestras puede incluir varios carriles, varios canales, varios pocillos u otros medios para procesar multiples conjuntos de muestras de manera sustancialmente simultanea. Ademas, la unidad de procesamiento de muestras puede incluir multiples camaras de muestras para permitir el procesamiento de multiples ciclos simultaneamente. En realizaciones particulares, el sistema puede realizar deteccion de senal en una camara de muestras mientras procesa sustancialmente simultaneamente otra camara de muestras. Ademas, la unidad de procesamiento de muestras puede incluir un sistema de automatizacion para mover o manipular la camara de muestras. En algunas realizaciones, la unidad de deteccion de senal puede incluir un sensor de imagen o deteccion. Por ejemplo, el sensor de imagenes o deteccion (por ejemplo, un detector de fluorescencia o un detector electrico) puede incluir un CCD, un CMOS, un sensor de iones, tal como una capa sensible a los iones que recubre un CMOS, un detector de corriente, o similar. La unidad de deteccion de senales puede incluir un sistema de excitacion para hacer que una sonda, como un tinte fluorescente, emita una senal. El sistema de deteccion puede incluir una fuente de iluminacion, tal como una lampara de arco, un laser, un diodo emisor de luz (LED) o similares. En realizaciones particulares, la unidad de deteccion de senales incluye opticas para la transmision de luz desde una fuente de iluminacion a la muestra o desde la muestra al sensor de deteccion o de imagen. Como alternativa, la unidad de deteccion de senales puede no incluir una fuente de iluminacion, tal como, por ejemplo, cuando una senal se produce espontaneamente como resultado de una reaccion de secuenciacion. Por ejemplo, puede producirse una senal mediante la interaccion de un resto liberado, tal como un ion liberado que interacciona con una capa sensible a los iones, o un pirofosfato que reacciona con una enzima u otro catalizador para producir una senal quimioluminiscente. En otro ejemplo, los cambios en una corriente electrica, voltaje o resistencia se detectan sin la necesidad de una fuente de iluminacion.
En algunas realizaciones, una unidad de analisis y control de adquisicion de datos supervisa varios parametros del sistema. Los parametros del sistema pueden incluir la temperatura de varias partes del instrumento, tal como una unidad de procesamiento de muestras o depositos de reactivos, volumenes de varios reactivos, el estado de varios subcomponentes del sistema, como un manipulador, un motor paso a paso, una bomba o similar o cualquier combinacion de los mismos.
Un experto en la materia apreciara que se utilizan diversas realizaciones de los instrumentos y sistemas para practicar metodos de secuenciacion tales como secuenciacion por smtesis, metodos de molecula unica y otras tecnicas de secuenciacion. La secuenciacion por smtesis puede incluir la incorporacion de nucleotidos marcados con colorante, la terminacion de la cadena, la secuenciacion de iones/protones, la secuenciacion de pirofosfatos o similares. Las tecnicas de una sola molecula pueden incluir una secuenciacion gradual, donde las reacciones de secuenciacion se detiene para determinar la identidad del nucleotido incorporado.
En algunas realizaciones, el instrumento de secuenciacion determina la secuencia de un acido nucleico, tal como un polinucleotido o un oligonucleotido. El acido nucleico puede incluir ADN o ARN, y puede ser monocatenario, tal como ADNss y ARN, o bicatenario, como ADNds o un par de ARNA/ADNc. En algunas realizaciones, el acido nucleico puede incluir o derivar de una biblioteca de fragmentos, una biblioteca de pares de parejas, un fragmento de ChIP, o similar. En realizaciones particulares, el instrumento de secuenciacion puede obtener la informacion de secuencia de una unica molecula de acido nucleico o de un grupo de moleculas de acido nucleico sustancialmente identicas. En algunas realizaciones, el instrumento de secuenciacion puede generar datos de lectura de secuenciacion de acidos nucleicos en diversos tipos/formatos diferentes de archivos de datos de salida, que incluyen, entre otros: *.txt, *.fasta, *.csfasta, *seq.txt, *qseq.txt, *.fastq, *.sff, *prb.txt, *.sms, *srs, y/o *.qv.
Analisis de acidos nucleicos
En algunas realizaciones, se utiliza un programa de analisis informatico para traducir los datos sin procesar generados por el ensayo de deteccion (por ejemplo, lecturas de secuenciacion) en datos de valor predictivo para un usuario final (por ejemplo, personal medico). El usuario puede acceder a los datos predictivos utilizando cualquier medio adecuado. Por lo tanto, en algunas realizaciones preferidas, la presente tecnologfa proporciona el beneficio adicional de que el usuario, que probablemente no este capacitado en genetica o biolog^a molecular, no requiere comprender los datos en bruto. Los datos se presentan directamente al usuario final en su forma mas util. El usuario puede utilizar inmediatamente la informacion para determinar informacion util (por ejemplo, en diagnosticos medicos, investigacion o deteccion).
Algunas realizaciones proporcionan un sistema para reconstruir una secuencia de acido nucleico. El sistema puede incluir un secuenciador de acido nucleico, un almacenamiento de datos de la secuencia de muestra, un almacenamiento de datos de la secuencia de referencia y un dispositivo/servidor/nodo de computacion analttica. En algunas realizaciones, el dispositivo/servidor/nodo de computacion analftica puede ser una estacion de trabajo, ordenador principal, ordenador personal, dispositivo movil, etc. El secuenciador de acido nucleico puede configurarse para analizar (por ejemplo, interrogar) un fragmento de acido nucleico (por ejemplo, fragmento individual, fragmento de pareja apareada, fragmento de extremo pareado, etc.) utilizando todas las variedades disponibles de tecnicas, plataformas o tecnologfas para obtener informacion de la secuencia de acido nucleico, en particular los metodos descritos en el presente documento utilizando las composiciones proporcionadas en el presente documento. En algunas realizaciones, el secuenciador de acido nucleico esta en comunicacion con el almacenamiento de datos de la secuencia de muestra, ya sea directamente a traves de un cable de datos (por ejemplo, cable en serie, conexion directa por cable, etc.) o enlace de bus o, alternativamente, a traves de una conexion de red (por ejemplo, Internet, LAN, WAN, VPN, etc.). En algunas realizaciones, la conexion de red puede ser una conexion ffsica "cableada". Por ejemplo, el secuenciador de acido nucleico se puede conectar comunicativamente (a traves de la Categona 5 (CAT5), fibra optica o cableado equivalente) a un servidor de datos que esta conectado comunicativamente (a traves de CAT5, fibra optica o cableado equivalente) a traves de Internet y secuencia de muestras de almacenamiento de datos. En algunas realizaciones, la conexion de red es una conexion de red inalambrica (por ejemplo, Wi-Fi, WLAN, etc.), por ejemplo, utilizando un formato de transmision 802.11 a/b/g/n o equivalente. En la practica, la conexion de red utilizada depende de los requisitos particulares del sistema. En algunas realizaciones, el almacenamiento de datos de la secuencia de muestra es una parte integrada del secuenciador de acido nucleico.
En algunas realizaciones, el almacenamiento de datos de la secuencia de muestra es cualquier dispositivo de almacenamiento, sistema o implementacion de la base de datos (por ejemplo, particion de almacenamiento de datos, etc.) que esta configurado para organizar y almacenar los datos de lectura de la secuencia de acido nucleico generados por el secuenciador de acido nucleico de manera tal que los datos se pueden buscar y recuperar manualmente (por ejemplo, por un administrador de base de datos u operador del cliente) o automaticamente mediante un programa informatico, una aplicacion o un script de software. En algunas realizaciones, el almacenamiento de datos de referencia puede ser cualquier dispositivo de base de datos, sistema de almacenamiento o implementacion (por ejemplo, particion de almacenamiento de datos, etc.) que este configurado para organizar y almacenar secuencias de referencia (por ejemplo, genoma total o parcial, exoma total o parcial, SNP, gen, etc.) de modo que los datos puedan buscarse y recuperarse manualmente (por ejemplo, un administrador de la base de datos u operador del cliente) o automaticamente mediante un programa de computadora, una aplicacion y/o un script de software. En algunas realizaciones, los datos de lectura de la secuencia de acidos nucleicos de muestra pueden almacenarse en el almacenamiento de datos de secuencia de muestra y/o en el almacenamiento de datos de referencia en una variedad de diferentes tipos/formatos de archivos de datos, incluidos, entre otros: *.txt, *.fasta, *.csfasta, *seq.txt, *qseq.txt, *.fastq, *.sff, *prb.txt, *.sms, *srs y/o *.qv.
En algunas realizaciones, el almacenamiento de datos de la secuencia de muestra y el almacenamiento de datos de referencia son dispositivos/sistemas autonomos independientes o implementados en diferentes dispositivos. En algunas realizaciones, el almacenamiento de datos de la secuencia de muestra y el almacenamiento de datos de referencia se implementan en el mismo dispositivo/sistema. En algunas realizaciones, el almacenamiento de datos de la secuencia de muestra y/o el almacenamiento de datos de referencia pueden implementarse en el dispositivo/servidor/nodo de calculo informatico. El dispositivo/servidor/nodo informatico analftico puede estar en comunicacion con el almacenamiento de datos de secuencia de muestra y el almacenamiento de datos de referencia directamente a traves de un cable de datos (por ejemplo, cable en serie, conexion directa por cable, etc.) o enlace de bus o, alternativamente, a traves de una conexion de red (por ejemplo, Internet, LAN, WAN, VPN, etc.). En algunas realizaciones, el dispositivo informatico analttico/servidor/nodo puede alojar un motor de mapeo de referencia, un modulo de mapeo de novo y/o un motor de analisis terciario. En algunas realizaciones, el motor de mapeo de referencia puede configurarse para obtener lecturas de secuencia de acido nucleico de muestra del almacenamiento de datos de muestra y mapearlas contra una o mas secuencias de referencia obtenidas del almacenamiento de datos de referencia para ensamblar las lecturas en una secuencia que es similar pero no necesariamente identica a la secuencia de referencia que utiliza todas las variedades de tecnicas y metodos de mapeo/alineacion de referencia. La secuencia reensamblada puede analizarse despues mediante uno o mas motores de analisis terciarios opcionales para identificar diferencias en la composicion genetica (genotipo), expresion genica o estado epigenetico de individuos que pueden resultar en grandes diferencias en las caractensticas ffsicas (fenotipo). Por ejemplo, en algunas realizaciones, el motor de analisis terciario puede configurarse para identificar varias variantes genomicas (en la secuencia ensamblada) debido a mutaciones, recombinacion/cruce o deriva genetica. Los ejemplos de tipos de variantes genomicas incluyen, pero no se limitan a: polimorfismos de un solo nucleotido (SNP), variaciones en el numero de copias (CNV), inserciones/deleciones (Indels), inversiones, etc. El modulo opcional de mapeo de novo se puede configurar para ensamblar la secuencia de acido nucleico de muestra se lee del almacenamiento de datos de la muestra en secuencias nuevas y previamente desconocidas. Sin embargo, debe entenderse que los diversos motores y modulos alojados en el dispositivo/servidor/nodo de computo analttico se pueden combinar o colapsar en un solo motor o modulo, segun los requisitos de la aplicacion particular o la arquitectura del sistema. Ademas, en algunas realizaciones, el dispositivo/servidor/nodo informatico analftico puede alojar motores o modulos adicionales segun lo requiera la aplicacion particular o la arquitectura del sistema.
En algunas realizaciones, los motores de mapeo y/o analisis terciario estan configurados para procesar el acido nucleico y/o las secuencias de referencia en el espacio de color. En algunas realizaciones, los motores de mapeo y/o analisis terciario estan configurados para procesar el acido nucleico y/o las secuencias de referencia en el espacio base. Sin embargo, debe entenderse que los motores de mapeo y/o analisis terciario descritos en el presente documento pueden procesar o analizar los datos de la secuencia de acido nucleico en cualquier esquema o formato, siempre que el esquema o formato pueda transmitir la identidad y posicion de la base de la secuencia de acido nucleico.
En algunas realizaciones, la lectura de la secuenciacion de acidos nucleicos de muestra y los datos de la secuencia de referencia pueden suministrarse al dispositivo/servidor/nodo informaticos analíticos en una variedad de diferentes tipos/formatos de archivos de datos de entrada, que incluyen, entre otros: *txt, *fasta, *csfasta, *seq.txt, *qseq.txt, *fastq, *sff, *prb.txt, *sms, *srs y/o *qv.
Ademas, un terminal de cliente puede ser un dispositivo informatico de cliente ligero o cliente pesado. En algunas realizaciones, el terminal del cliente puede tener un navegador web que se puede usar para controlar el funcionamiento del motor de mapeo de referencia, el modulo de mapeo de novo y/o el motor de analisis terciario. Es decir, el terminal del cliente puede acceder al motor de mapeo de referencia, el modulo de mapeo de novo y/o el motor de analisis terciario usando un navegador para controlar su funcion. Por ejemplo, el terminal del cliente puede usarse para configurar los parametros operativos (por ejemplo, restriccion de falta de coincidencia, umbrales de valor de calidad, etc.) de los diversos motores, segun los requisitos de la aplicacion en particular. De manera similar, el terminal del cliente tambien puede mostrar los resultados del analisis realizado por el motor de mapeo de referencia, el modulo de mapeo de novo y/o el motor de analisis terciario.
La presente tecnologfa tambien abarca cualquier metodo capaz de recibir, procesar y transmitir la informacion hacia y desde los laboratorios que realizan los ensayos, la informacion, el personal medico y los sujetos.
Aunque la divulgacion en el presente documento se refiere a ciertas realizaciones ilustradas, debe entenderse que estas realizaciones se presentan a modo de ejemplo y no a modo de limitacion.
EJEMPLOS
1. Smtesis del intermedio de alcohol (S)-t-butil-5-metoxi-2-nitrobencilico
Figure imgf000027_0001
A una solucion de 3-yodo-4-nitroanisol (2,79 g, 10,0 mmol) en THF anhidro (10 ml) a menos 40 °C bajo una atmosfera de nitrogeno, se utilizo cloruro de fenilmagnesio (2 M en THF, 4,2 ml, 8,3 mmol) se anade gota a gota a una velocidad tal que la temperatura no exceda menos 35 1C. Una vez completada la adicion, la mezcla se agito a menos 40 °C durante dos horas, seguido de la adicion de trimetilacetaldeddo (1,1 ml, 10 mmol). La mezcla se agito a menos 40 °C durante dos horas y luego a temperatura ambiente durante una hora mas. A continuacion, la reaccion se detuvo con salmuera (100 ml) y la mezcla se extrajo con CH2O2 (40 ml) tres veces. La fase organica combinada se seco sobre Na2SO4, se concentro al vado, y el residuo se purifico por cromatografia en columna de gel de sflice para producir (R/S)-1-(5-metoxi-2-nitrofenil)-2,2-dimetil-1-propanol racemico (1,76 g, 88 %).
RMN 1H (400 MHz, CDCla): 57,89 (d, 1 H, J = 9,2 Hz, Ph-H), 7,27 (d, 1 H, J = 2,8 Hz, Ph-H), 6,84 (dd, 1 H, J = 8,8 and 2,8 Hz, Ph-H), 5,62 (d, 1 H, J = 4,0 Hz, PhCH), 3,89 (s, 3 H, OCH3), 2,08 (d, 1 H, J = 4,0 Hz, OH), 0,89 (s, 9 H, C(CHa)a).
A una solucion de (R/S)-1-(5-metoxi-2-nitrofenil)-2,2-dimetil-1-propanol racemico (1,75 g, 7,3 mmol) y DMAP (2,92 g, 23,9 mmol) en CH2G2 anhidro (10 ml), se añ calodriuóro (1S)-canfanico (2,6 g, 12 mmol) y la mezcla se agito durante la noche a temperatura ambiente bajo una atmosfera de nitrogeno. La mezcla de reaccion se diluyo con CH2O2 (50 ml) y se lavo con una solucion de NaHCO3 saturada (50 ml). La fase organica se seco sobre Na2SO4, se concentro al vado, y el residuo se purifico por cromatografia en columna de gel de sflice para producir (1S)-canfanato de (R/S)-1-(5-metoxi-2-nitrofenil)-2,2-dimetil-1-propilo (2,5 g, 85 %, mezcla 1:1 de diastereoisomeros). El canfanato se disolvio en acetato de etilo (30 ml) seguido de la adicion lenta de hexano (120 ml) con agitacion. Los cristales de aguja se formaron gradualmente a partir de la solucion durante un penodo de dos horas. Los cristales se recogieron por filtracion para producir diastereomero unico (1S)-canfanato de (S)-1- (5-metoxi-2-nitrofenil)-2,2-dimetil-1-propilo puro. El filtrado se concentro al vado y el proceso de cristalizacion se repitio dos veces para proporcionar (1S)-canfanato de (S)-1- (5-metoxi-2-nitrofenil)-2,2-dimetil-1-propilo adicional (total 1,08 g, 43 %).
RMN 1H (400 MHz, CDCh): 58,04 (d, 1 H, J = 9,2 Hz, Ph-H), 7,27 (d, 1 H, J = 2,8 Hz, Ph-H), 6,88 (dd, 1 H, J = 2,8 and 8,8 Hz, Ph-H), 6,81 (3, 1 H, Ph-CH), 3,87 (s, 3 H, OCH3), 2,36 (m, 1 H, CH), 1,92 (m, 2 H, CH2), 1,66 (m, 1 H, CH), 1,12 (s, 3 H, CH3), 1,06 (s, 3 H, CH3), 1,02 (s, 3 H, CH3), 0,95 (s, 9 H, C(CH3)3).
2. Sintesis de analogo de 5-bromometil-2'-desoxiuridina
Figure imgf000028_0001
Esquema S5. Smtesis de los analogos de 5-(2-nitrobenciloxi) metil-dUTP. Reactivos y condiciones: (i) TBSCI, imidazol, DMF anhidra, temperatura ambiente, 16 h, 95 %; (ii) Boc2O, DMAP, DMF anhidro, temperatura ambiente, 16 h, 78 %; (iii) N-bromosuccinimida, peroxido de benzoflo, CCl4, reflujo, una hora, 43 %;
3',5'-O-bis-terc-butildimetilsilil-N3-terc-butiloxicarbonil-timidina (1). A una solucion de timidina (5,00 g, 20,64 mmol) e imidiazol (9,0 g, 132,1 mmol) en DMF anhidra (11 ml), se gota añ aad gioóta una solucion de TBSCl (9,96 g, 66,05 mmol) en DMF anhidra (11 ml) y la mezcla se agito a temperatura ambiente durante 16 h bajo una atmosfera de nitrogeno. El disolvente se elimino al vado y el residuo se purifico mediante cromatografia en columna de gel de sflice para producir 3’,5’-O-bis-terc-butildimetilsilil-timidina (9,23 g, 95 %) como un solido blanco.
RMN 1H (400 MHz, CDCU): 68,51 (s a, 1 H, NH), 7,48 (d, 1 H, J = 1,2 Hz, H-6), 6,34 (dd, 1 H, J = 5,8 and 8,0 Hz, H-1 ’), 4,41 (m, 1 H, H-3’), 3,93 (m, 1 H, H-4’), 3,87 (dd, 1 H, J = 2,6 and 11,4 Hz, H-5’a), 3,76 (dd, 1 H, J = 2,6 and 11,4 Hz, H-5’b), 2,17 (m, 1 H, H-2’a), 2,01 (m, 1 H, H-2’b), 1,92 (d, 3 H, J = 1,2 Hz, CH3), 0,93 (s, 9 H, (CH3)sCSi), 0,88 (s, 9 H, (CH^CSi), 0,11 (s, 6 H, (CH^Si), 0,08 (s, 6 H, (CHs^Si).
A una solucion del compuesto 3’,5’-O-bis-terc-butildimetilsilil-timidina (2,43 g, 5,15 mmol) y DMAP (1,39 g, 11,34 mmol) en DMF anhidra (45 ml), se a gñoatdaió a gota una solucion de di-terc-butildicarbonato (2,47 g, 11,34 mmol) en DMF anhidra (9 ml). La mezcla se agito a temperatura ambiente durante 16 horas bajo una atmosfera de nitrogeno. La mezcla se concentro despues al vado, y el residuo se disolvio en CH2Cl2 (80 ml), se lavo con una solucion de NH4Cl saturado (10 ml), se seco sobre Na2SO4, y se concentro al vado. El residuo se purifico por cromatografia en columna de gel de sflice para dar 3’, 5-O-bis-terc-butildimetilsilil-N3-terc-butiloxicarbonil-timidina 1 (2,30 g, 78 %) como un solido blanco.
RMN 1H (400 MHz, CDCU): 67,50 (d, 1 H, J = 1,2 Hz, H-6), 6,34 (dd, 1 H, J = 5,8 and 8,0 Hz, H-1’), 4,42 (m, 1 H, H-3’), 3,95 (m, 1 H, H-4’), 3,87 (dd, 1 H, J = 2,5 and 11,4 Hz, H-5’a), 3,76 (dd, 1 H, J = 2,5 and 11,4 Hz, H-5’b), 2,17 (m, 1 H, H-2’a), 2,01 (m, 1 H, H-2’b), 1,92 (d, 3 H, J = 1,2 Hz, CH3), 1,60 (s, 9 H, (CHs)s), 0,93 (s, 9 H, (CH3)sCSi), 0,88 (s, 9 H, (CH3)sCSi), 0,11 (s, 6 H, (CHs^Si), 0,08 (s, 6 H, (CHs^Si).
3’,5’-Bis-O-terc-butildimetilsilil-N3-terc-butiloxicarbonil-5-bromometil-2’-desoxiuridina (2). Una solucion del compuesto 1 (570 mg, 1,00 mmol), N-bromosuccinimida (0,37 g, 2,10 mmol) y peroxido de benzoflo (10 mg, solucion acuosa al 75 %) en CCU (10 ml) se calento a reflujo durante una hora (7). La mezcla se filtro y el filtrado se concentro al vado y se purifico por cromatografia en columna de gel de sflice para dar 3’,5’-bis-O-terc-butildimetilsilil-N.3-tercbutiloxicarbonil-5-bromometil-2’-desoxiuridina 2 (281 mg, 43 %) como un solido amarillo.
RMN 1H (400 MHz, CDCU): 67,89 (s, 1 H, H-6), 6,27 (dd, 1H, J = 5,8 and 8,0 Hz, H-1’), 4,38 (m, 1 H, H-3’), 4,27 (d, 1 H, J = 10,6 Hz, CH2Br), 4,20 (d, 1 H, J = 10,6 Hz, CH2Br), 3,98 (m, 1 H, H-4’), 3,88 (dd, 1 H, J = 2,5 and 11,4 Hz, H-5’b), 3,77 (dd, 1 H, J = 2,6 and 11,4 Hz, H-5’a), 2,33 (m, 1 H, H-2’a), 2,01 (m, 1 H, H-2’b), 1,61 (s, 9 H, (CHs)s), 0,95 (s, 9 H, (CH^sCSi), 0,89 (s, 9 H, (CH3)3CSi), 0,14 (s, 6 H, (CH^Si), 0,07 (s, 6 H, (CH^Si); 13C NMR (100 MHz, CDCl3): 6159,21 (C), 147,99 (C), 147,32 (C), 138,46 (CH), 111,30 (C), 88,34 (CH), 87,22 (C), 86,00 (CH), 72,28 (CH), 63,04 (CH2), 41,93 (CH2), 27,42 (CH3), 25,99 (CH3), 25,71 (CH3), 25,65 (CH3), 24,91 (CH2), 18,47 (C), 17,97 (C), -3,58 (CH3), -4,65 (CH3), -4,86 (CH3), -5,32 (CH3).
3. Smtesis del analogo de trifosfato de 5-HOMe-2'-desoxiuridina
S-((S)-1-(5-mstoxi-2f}itrofenil}-2,2-aimstil-propiloxi)metil-2 -desoxiundm
5 -tnfosfato
Figure imgf000029_0001
El compuesto 38 (315 mg, 0,49 mmol) y (S)-1- (5-metoxi-2-nitrofenil)-2,2-dimetil-1-propanol (490 mg, 2,1 mmol) se calentaron a 110 °C durante 45 min bajo una atmosfera de nitrogeno. La mezcla se enfrio a temperatura ambiente, se disolvio en MeOH (10 ml) y se siguio con la adicion de NH4F (400 mg, 11 mmol). La mezcla se agito a 50 °C durante 12 horas, se concentro al vado, se disolvio en CH2Cl2 (50 ml) y se lavo con salmuera (50 ml). La fase organica se seco sobre Na2SO4, se concentro al vado, y el residuo se purifico por cromatograffa en gel de sflice para producir 5-[(S)-1- (5-metoxi-2-nitrofenil)-2,2-dimetil-propiloxi] metil-2'-desoxiuridina 39 (130 mg, 56 %).
RMN 1H (400 MHz, CDCl3): 89,14 (s a, 1 H, NH), 7,90 (d, 1 H, J = 9,2 Hz, Ph-H), 7,67 (s, 1 H, H-6), 7,17 (d, 1 H, J
= 2,8 Hz, Ph-H), 6,84 (dd, 1 H, J = 9,2 and 2,8 Hz, Ph-H), 6,18 (t, 1 H, J = 6,4 Hz,H-1'), 5,22 (s, 1 H, Ph-CH), 4,56
(m, 1 H, H-3'), 4,24 (d, 1 H, J = 12,4 Hz, 5-CH2a), 4,15 (d, 1 H,J = 12,4 Hz, 5-CH2b), 4,00 (m, 1 H, H-4'), 3,90 (m, 1
H, H-5'a), 3,88 (s, 3 H, OCH3), 3,81 (m, 1 H,H-5'b), 2,35 (m, 2 H, H-2), 0,83 (s, 9 H, C(CH3)3).
El compuesto 39 (30 mg, 0,065 mmol) se fosforilo con POCl3 (9 pl, 0,097 mmol) y esponja de protones (28 mg, 0,13 mmol) en fosfato de trimetilo (0,35 ml) a 0 °C durante una hora bajo una atmosfera de nitrogeno. Se una añadió solucion de pirofosfato de tri-n-butilamonio (147 mg, 0,32 mmol) y tri-n-butilamina (64 pl) en DMF anhidra (0,64 ml).
Despues de 10 minutos de agitacion, se añ taadmiópon bicarbonato de trietilamonio (0,1 M, pH 7,5; 10 ml). La reaccion se agito a temperatura ambiente durante una hora y luego se concentro al vado. El residuo se disolvio en acetonitrilo acuoso al 20 % (10 ml), se filtro y se purifico por cromatograffa de intercambio anionico. Las fracciones que conteman trifosfato se combinaron y se liofilizaron para producir 5-[(S)-1- (5-metoxi-2-nitrofenil)-2,2-dimetilpropiloxi] metil-2'-desoxiuridina-5'-trifosfato dU. VI, que se purifico adicionalmente usando RP-HPLC.

Claims (15)

REIVINDICACIONES
1. Un analogo nucleotfdico que comprende:
a) un nucleotido que comprende un resto fosfato, una base y un azucar;
b) un resto de terminacion fotoescindible, detectable electroqmmicamente, unido al nucleotido; y
c) un segundo resto de terminacion fotoescindible unido al nucleotido.
2. El analogo nucleotidico de la reivindicacion 1, en el que el resto de terminacion fotoescindible y detectable electroqmmicamente esta unido al resto de fosfato, la base o el azucar del nucleotido.
3. El analogo nucleotidico de una cualquiera de las reivindicaciones 1 a 2, en el que el resto de terminacion fotoescindible, detectable electroqmmicamente, esta unido al nucleotido mediante un enlazador fotoescindible.
4. El analogo nucleotidico de la reivindicacion 3, en el que el resto de terminacion fotoescindible, detectable electroqmmicamente, se selecciona del grupo que consiste en
Figure imgf000030_0001
en el que E representa un resto detectable electroqmmicamente.
5. El analogo nucleotidico de la reivindicacion 3, en el que el resto de terminacion fotoescindible, detectable electroqmmicamente, esta unido al nucleotido mediante un enlazador fotoescindible seleccionado del grupo que consiste en eter, ester, diester, 2-nitrobencilo, 2-nitrobencilo alfa-sustituido, I- -nitrofenil)etilo, 3,5-dimetoxibencilo, acido tiohidroxamico, 7-nitroindolina, 9-fenilxantilo, benzoma, hidroxifenacilo, nitroveratrilo y acido N-hidroxisuccinimidil-4-azidosalicflico.
6. El analogo nucleotidico de la reivindicacion 1, en el que el resto de terminacion fotoescindible electroqmmicamente detectable comprende un resto detectable electroqmmicamente seleccionado del grupo que consiste en un grupo redox organico, un grupo organometalico, una nanopartfcula metalica y un punto cuantico.
7. El analogo nucleotidico de la reivindicacion 6, en el que:
a) el grupo redox organico se selecciona del grupo que consiste en azul de metileno, antraquinona y tionina; b) el grupo organometalico se selecciona del grupo que consiste en ferroceno, derivados de ferroceno, un complejo de bipirideno de rutenio y un complejo de bipirideno de osmio;
c) la nanoparticula metalica se selecciona del grupo que consiste en oro y plata; o
d) el punto cuantico se selecciona del grupo que consiste en CdS, CdSe y ZnS.
8. El analogo nucleotidico de la reivindicacion 1, en el que el segundo resto de terminacion fotoescindible esta unido al azucar del nucleotido, en el que opcionalmente el segundo resto de terminacion fotoescindible esta unido a una posicion 3’ del azucar del nucleotido.
9. El analogo nucleotidico de la reivindicacion 1, en el que el segundo resto de terminacion fotoescindible se selecciona del grupo que consiste en
Figure imgf000031_0001
en la que R es cualquier grupo alifatico que consiste en 1-3 carbonos o un hidrogeno.
10. Una composicion que comprende un analogo nucleotidico de una cualquiera de las reivindicaciones 1 a 9 y una polimerasa.
11. Uso de un analogo nucleotidico de una cualquiera de las reivindicaciones 1 a 9 en una reaccion de secuenciacion de acidos nucleicos.
12. Un metodo para secuenciar un acido nucleico, comprendiendo el metodo:
a) hibridar un cebador con un acido nucleico para formar un complejo de cebador/acido nucleico hibridado; b) proporcionar una pluralidad de analogos nucleotidicos, comprendiendo cada analogo nucleotidico un nucleotido, un resto de terminacion fotoescindible y detectable electroqmmicamente unido al nucleotido y un segundo resto de terminacion fotoescindible unido al nucleotido;
c) hacer reaccionar el complejo de cebador/acido nucleico hibridado y el analogo nucleotidico con una polimerasa para agregar el analogo nucleotidico al cebador mediante una reaccion de polimerasa para formar un producto extendido que comprende un analogo nucleotidico incorporado;
d) consultar el producto extendido para identificar el analogo nucleotidico incorporado;
e) exponer el producto extendido a una fuente de luz que proporciona una longitud de onda de la luz para eliminar un resto de terminacion fotoelectrico, detectable electroqmmicamente, del analogo nucleotidico incorporado; y
f) exponer el producto extendido a una fuente de luz que proporciona una segunda longitud de onda de luz para eliminar un segundo resto de terminacion fotoescindible del analogo nucleotidico incorporado.
13. Un kit o mezcla de reaccion para secuenciar un acido nucleico que comprende cuatro analogos nucleotidicos segun una cualquiera de las reivindicaciones 1 a 9, en el que un primer analogo nucleotidico comprende un nucleotido adenina, un segundo analogo nucleotidico comprende un nucleotido citosina, un tercer analogo nucleotidico comprende un nucleotido guanina y un cuarto analogo nucleotidico comprende un nucleotido timina o un nucleotido uracilo.
14. Un sistema para secuenciar un acido nucleico, comprendiendo el sistema:
a) un analogo nucleotidico de acuerdo con una cualquiera de las reivindicaciones 1 a 9,
b) una o mas fuentes de luz coherentes; y
c) un elemento de deteccion de fluorescencia o electroqmmica.
15. El sistema segun la reivindicacion 14, que comprende ademas un sustrato que comprende una gma de onda de modo cero.
ES14769128T 2013-03-15 2014-03-12 Análogos nucleotídicos para secuenciación Active ES2713653T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201361791730P 2013-03-15 2013-03-15
PCT/US2014/024391 WO2014150851A1 (en) 2013-03-15 2014-03-12 Nucleotide analogs for sequencing

Publications (1)

Publication Number Publication Date
ES2713653T3 true ES2713653T3 (es) 2019-05-23

Family

ID=51580839

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14769128T Active ES2713653T3 (es) 2013-03-15 2014-03-12 Análogos nucleotídicos para secuenciación

Country Status (4)

Country Link
US (2) US10428379B2 (es)
EP (1) EP2970366B1 (es)
ES (1) ES2713653T3 (es)
WO (1) WO2014150851A1 (es)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160024573A1 (en) * 2013-03-15 2016-01-28 Ibis Biosciences, Inc. Photocleavable deoxynucleotides with high-resolution control of deprotection kinetics
US20150051088A1 (en) 2013-08-19 2015-02-19 Abbott Molecular Inc. Next-generation sequencing libraries
ES2788692T3 (es) * 2014-09-17 2020-10-22 Ibis Biosciences Inc Secuenciación por síntesis usando óptica de lectura por pulsos
US10538808B2 (en) 2017-05-26 2020-01-21 Vibrant Holdings, Llc Photoactive compounds and methods for biomolecule detection and sequencing
WO2023282245A1 (ja) * 2021-07-05 2023-01-12 国立研究開発法人科学技術振興機構 ヌクレオチド類の精製方法及びヌクレオチド類の精製装置並びに疎水性試薬及び疎水性基質

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5795762A (en) 1986-08-22 1998-08-18 Roche Molecular Systems, Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US5618711A (en) 1986-08-22 1997-04-08 Hoffmann-La Roche Inc. Recombinant expression vectors and purification methods for Thermus thermophilus DNA polymerase
US5455170A (en) 1986-08-22 1995-10-03 Hoffmann-La Roche Inc. Mutated thermostable nucleic acid polymerase enzyme from Thermus species Z05
US5466591A (en) 1986-08-22 1995-11-14 Hoffmann-La Roche Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US4971903A (en) 1988-03-25 1990-11-20 Edward Hyman Pyrophosphate-based method and apparatus for sequencing nucleic acids
US5424186A (en) 1989-06-07 1995-06-13 Affymax Technologies N.V. Very large scale immobilized polymer synthesis
US5302509A (en) 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
GB9210168D0 (en) 1992-05-12 1992-06-24 Cemu Bioteknik Ab Method of sequencing dna
US5986076A (en) * 1994-05-11 1999-11-16 Trustees Of Boston University Photocleavable agents and conjugates for the detection and isolation of biomolecules
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US6232465B1 (en) 1994-09-02 2001-05-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US6214987B1 (en) 1994-09-02 2001-04-10 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent formation of phosphodiester bonds using protected nucleotides
US5872244A (en) 1994-09-02 1999-02-16 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
CZ293215B6 (cs) 1996-08-06 2004-03-17 F. Hoffmann-La Roche Ag Rekombinantní tepelně stálá DNA polymeráza, způsob její přípravy a prostředek, který ji obsahuje
US6395524B2 (en) 1996-11-27 2002-05-28 University Of Washington Thermostable polymerases having altered fidelity and method of identifying and using same
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
ATE469699T1 (de) 1999-02-23 2010-06-15 Caliper Life Sciences Inc Manipulation von mikroteilchen in mikrofluiden systemen
WO2001023610A2 (en) 1999-09-29 2001-04-05 Solexa Ltd. Polynucleotide sequencing
US6329178B1 (en) 2000-01-14 2001-12-11 University Of Washington DNA polymerase mutant having one or more mutations in the active site
US7179590B2 (en) 2000-04-18 2007-02-20 Roche Molecular Systems, Inc High temperature reverse transcription using mutant DNA polymerases
US7148049B2 (en) 2002-04-02 2006-12-12 Roche Molecular Systems, Inc. Thermostable or thermoactive DNA polymerase molecules with attenuated 3′-5′ exonuclease activity
US20100035254A1 (en) 2003-04-08 2010-02-11 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7572581B2 (en) 2003-06-30 2009-08-11 Roche Molecular Systems, Inc. 2′-terminator nucleotide-related methods and systems
US7947817B2 (en) 2003-06-30 2011-05-24 Roche Molecular Systems, Inc. Synthesis and compositions of 2'-terminator nucleotides
GB0324456D0 (en) * 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
AU2005296200B2 (en) 2004-09-17 2011-07-14 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US20070048748A1 (en) 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
ES2388722T3 (es) 2005-12-21 2012-10-18 F. Hoffmann-La Roche Ag Secuenciación y genotipado utilizando nucleótidos modificados en 2' de forma reversible
EP2857829B1 (en) 2006-06-12 2017-08-09 Pacific Biosciences of California, Inc. Zero mode waveguide substrates for performing analytical reactions
US7897737B2 (en) 2006-12-05 2011-03-01 Lasergen, Inc. 3′-OH unblocked, nucleotides and nucleosides, base modified with photocleavable, terminating groups and methods for their use in DNA sequencing
US7893227B2 (en) 2006-12-05 2011-02-22 Lasergen, Inc. 3′-OH unblocked nucleotides and nucleosides base modified with non-cleavable, terminating groups and methods for their use in DNA sequencing
US7932034B2 (en) 2006-12-20 2011-04-26 The Board Of Trustees Of The Leland Stanford Junior University Heat and pH measurement for sequencing of DNA
BRPI0909212A2 (pt) 2008-03-28 2015-08-18 Pacific Biosciences California Composições e método para sequeciamento de ácido nucléico
NZ590265A (en) 2008-06-11 2012-11-30 Lasergen Inc Nucleotides and nucleosides and methods for their use in dna sequencing
US7923562B2 (en) * 2008-06-16 2011-04-12 The Board Of Trustees Of The Leland Stanford Junior University Photocleavable linker methods and compositions
US8173620B2 (en) 2008-08-20 2012-05-08 University Of Georgia Research Foundation, Inc. BHQ-caged nucleotide probes photolysable by two-photon excitation
US8795961B2 (en) 2008-09-05 2014-08-05 Pacific Biosciences Of California, Inc. Preparations, compositions, and methods for nucleic acid sequencing
EP2379748A4 (en) * 2008-12-23 2012-08-29 Illumina Inc MULTIBASE RELEASE FOR LONG READINGS IN SEQUENCING BY SYNTHESIS PROTOCOLS
AU2010245304B2 (en) 2009-04-27 2015-06-04 Pacific Biosciences Of California, Inc. Real-time sequencing methods and systems
WO2010144150A2 (en) 2009-06-12 2010-12-16 Pacific Biosciences Of California, Inc. Real-time analytical methods and systems
US8906670B2 (en) 2009-09-11 2014-12-09 Pacific Bioscience Of California, Inc. Zero-mode waveguides with non-reflecting walls
WO2011137368A2 (en) 2010-04-30 2011-11-03 Life Technologies Corporation Systems and methods for analyzing nucleic acid sequences
WO2013102081A2 (en) 2011-12-29 2013-07-04 Ibis Biosciences, Inc. Macromolecule delivery to nanowells

Also Published As

Publication number Publication date
EP2970366A4 (en) 2016-09-21
EP2970366A1 (en) 2016-01-20
US10697009B2 (en) 2020-06-30
US20160032376A1 (en) 2016-02-04
US20190367976A1 (en) 2019-12-05
US10428379B2 (en) 2019-10-01
EP2970366B1 (en) 2019-01-16
WO2014150851A1 (en) 2014-09-25

Similar Documents

Publication Publication Date Title
US10697009B2 (en) Nucleotide analogs for sequencing
US10222349B2 (en) Methods and devices for sequencing nucleic acids in smaller batches
ES2764096T3 (es) Bibliotecas de secuenciación de próxima generación
JP2966524B2 (ja) 赤外染料で標識されたヌクレオチド及び核酸検出におけるそれらの使用
BR112020026668A2 (pt) Nucleosídeos ou nucleotídeos, oligonucleotídeo, método de preparação de um polinucleotídeo, método de determinação da sequência de um polinucleotídeo e kit
US20160010150A1 (en) Single molecule sequencing with two distinct chemistry steps
US7893227B2 (en) 3′-OH unblocked nucleotides and nucleosides base modified with non-cleavable, terminating groups and methods for their use in DNA sequencing
JP2004513619A (ja) リアルタイム配列決定
JP2004510433A (ja) Dnaおよびrnaを解読するための大量並行方法
US20160115473A1 (en) Multifunctional oligonucleotides
BR112019027614A2 (pt) ligantes de braços pendentes curtos para nucleotídeos em aplicações de sequenciamento
ES2683707T3 (es) Secuenciación de ADN
US11359236B2 (en) DNA sequencing
JP7332235B2 (ja) ポリヌクレオチドを配列決定する方法
US11035823B2 (en) Methods and devices for sequencing nucleic acids in smaller batches
ES2840456T3 (es) Secuenciación de ADN
Tong et al. Combinatorial fluorescence energy transfer tags: New molecular tools for genomics applications
Castiblanco A primer on current and common sequencing technologies
US20160024573A1 (en) Photocleavable deoxynucleotides with high-resolution control of deprotection kinetics
CN115803457A (zh) 用于核酸测序的方法、系统和组合物