ES2910406T3 - Nanoporos de alfa-hemolisina de larga duración - Google Patents

Nanoporos de alfa-hemolisina de larga duración Download PDF

Info

Publication number
ES2910406T3
ES2910406T3 ES17740304T ES17740304T ES2910406T3 ES 2910406 T3 ES2910406 T3 ES 2910406T3 ES 17740304 T ES17740304 T ES 17740304T ES 17740304 T ES17740304 T ES 17740304T ES 2910406 T3 ES2910406 T3 ES 2910406T3
Authority
ES
Spain
Prior art keywords
hemolysin
nanopore
variant
seq
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17740304T
Other languages
English (en)
Inventor
Timothy Craig
Corissa Harris
Mark Ambroso
Marshall Porter
Matthew Dipietro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Application granted granted Critical
Publication of ES2910406T3 publication Critical patent/ES2910406T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/305Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
    • C07K14/31Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/02Peptides of undefined number of amino acids; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/01Preparation of mutants without inserting foreign genetic material therein; Screening processes therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof

Abstract

Una variante de α-hemolisina (α-HL) de la secuencia de aminoácidos expresada como SEQ ID NO: 14, en la que la variante tiene al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 14 y en la que la variante comprende sustituciones aminoacídicas correspondientes a E111N/E111S, M113A, 126-131G y K147N.

Description

DESCRIPCIÓN
Nanoporos de alfa-hemolisina de larga duración
Solicitudes relacionadas
La presente solicitud reivindica el beneficio de la solicitud provisional de EE. UU. con n.° de serie 62/357.230, presentada el 30 de junio de 2016, de la que su contenido se incorpora por el presente documento en su totalidad.
Campo técnico
Se divulgan procedimientos y composiciones relacionados con variantes de alfa-hemolisina de Staphylococcus aureaus que, cuando se ensamblan en un nanoporo de múltiples subunidades, incrementan la duración de secuenciación del nanoporo durante una reacción de secuenciación de ácido nucleico. También se divulgan variantes que, cuando se ensamblan en un nanoporo de múltiples subunidades, mejoran la eficacia y la exactitud de secuenciación.
Antecedentes
Las hemolisinas son miembros de una familia de toxinas proteicas que se producen por una amplia variedad de organismos. Algunas hemolisinas, por ejemplo alfa hemolisinas, pueden romper la integridad de una membrana celular (por ejemplo, una membrana de célula huésped) formando un poro o canal en la membrana. Los poros o canales que se forman en una membrana por proteínas formadoras de poros se pueden usar para transportar determinados polímeros (por ejemplo, polipéptidos o polinucleótidos) de un lado de una membrana al otro.
La alfa hemolisina (a-HL, a-HL o alfa-HL) es una toxina hemolisina autoensamblable que forma un canal en la membrana de una célula huésped. Más en particular, siete monómeros de alfa-hemolisina se ensamblan en un poro de barril beta heptamérico en membranas biológicas. La alfa-hemolisina tiene muchas propiedades ventajosas incluyendo alta estabilidad y autoensamblaje en un nanoporo que es lo suficientemente ancho para alojar ADN monocatenario pero no ADN bicatenario (Kasianowicz et al., 1996). En base a estas propiedades y otras propiedades, la alfa-hemolisina se ha convertido en un componente principal para la comunidad de secuenciación de nanoporos.
El trabajo previo sobre detección de ADN en el poro de a-HL se ha centrado en analizar la firma de corriente iónica a medida que el ADN se transloca a través del poro (Kasianowicz et al., 1996, Akeson et al., 1999, Meller et al., 2001), una tarea muy difícil dada la tasa de translocación (~1 nt/ps a 100 mV) y el consiguiente ruido en la señal de corriente iónica. Se ha logrado una mayor especificidad en sensores basados en nanoporos por la incorporación de moléculas de sonda ancladas permanentemente al interior del poro (Howorka et al., 2001a y Howorka et al., 2001b; Movileanu et al., 2000).
Si bien el uso de nanoporos ha revolucionado la secuenciación de ADN, los nanoporos que usan alfa-hemolisinas naturales solo pueden generar datos de secuencia durante un corto tiempo. Por consiguiente, la duración del nanoporo de alfa-hemolisina durante la reacción de secuenciación a menudo sirve como rasgo característico limitante de la velocidad de la reacción de secuenciación. Además, el uso de alfa hemolisina natural a menudo da como resultado un número significativo de errores de deleción, es decir, bases que no se miden. Por lo tanto, se desean nanoporos de alfa-hemolisina con propiedades mejoradas, incluyendo duraciones de secuenciación incrementadas.
Breve sumario de la invención
En el presente documento se proporcionan polipéptidos de alfa hemolisina (aHL) estafilocócica mutantes que, cuando se incorporan en un nanoporo, mejoran la duración del nanoporo durante una reacción de secuenciación de ADN. Por ejemplo, un nanoporo que incluye una o más de las variantes descritas en el presente documento dura más tiempo, y, por consiguiente, proporciona más datos de secuenciación, que un nanoporo que consiste en alfa hemolisina natural.
En determinados aspectos de ejemplo, las variantes de a-hemolisina (a-HL) comprenden sustituciones E111N/E111S, M113A, 126-131G y K147N de SEQ ID NO: 14 (la secuencia de alfa hemolisina natural madura). La variante de a-hemolisina también puede incluir una sustitución en H35G de SEQ ID NO: 14.
En determinados aspectos de ejemplo, la variante de a-hemolisina incluye una secuencia de aminoácidos que tiene al menos una de las sustituciones descritas en el presente documento, mientras que la secuencia de la variante de a-hemolisina tiene al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 14. En determinados aspectos de ejemplo, la variante de a-hemolisina incluye una secuencia de aminoácidos que tiene al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NOS: 17, 18, 19, 20 o 22.
En determinados aspectos de ejemplo, la variante de alfa-hemolisina descrita en el presente documento se une a una ADN polimerasa, tal como por medio de un enlace covalente. Por ejemplo, la variante de alfa-hemolisina se une a la ADN polimerasa por medio de un enlace SpyTag/SpyCatcher. En determinados aspectos de ejemplo, la variante de alfa-hemolisina se une a la ADN polimerasa por medio de un enlace isopeptídico.
En determinados aspectos de ejemplo, se proporciona un ensamblaje de nanoporo heptamérico. El ensamblaje, por ejemplo, incluye al menos una o más de las variantes de alfa-hemolisina descritas en el presente documento. Por ejemplo, el ensamblaje de nanoporo heptamérico puede incluir una o más proteínas alfa-hemolisina que tienen una sustitución en E111N, M113A, 126-131G y K147N de SEQ ID NO: 14, tal como se describe en el presente documento. En determinados aspectos de ejemplo, cada uno de los siete monómeros de alfa-hemolisina del nanoporo heptamérico son variantes de alfa-hemolisina como se describe en el presente documento. La variante puede ser la misma variante o una combinación de variantes diferentes descritas en el presente documento. En determinados aspectos de ejemplo, el ensamblaje de nanoporo incluye una o más variantes que tienen al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NOS: 17, 18, 19, 20 o 22. Usando y basándose en las variantes de alfa-hemolisina para ensamblar el nanoporo, en determinados aspectos de ejemplo, la duración del nanoporo resultante se incrementa en un 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o más en comparación con un ensamblaje de nanoporo heptamérico que consisten en alfa-hemolisina natural.
En determinados aspectos de ejemplo, también se proporcionan ácidos nucleicos que codifican cualquiera de las variantes de alfa hemolisina descritas en el presente documento. Por ejemplo, la secuencia de ácido nucleico se puede derivar de Staphylococcus aureus (SEQ ID NO: 1). También se proporcionan, en determinados aspectos de ejemplo, vectores que incluyen uno cualquiera de dichos ácidos nucleicos que codifican una cualquiera de las variantes de hemolisina descritas en el presente documento. También se proporciona una célula huésped que se transforma con el vector.
En determinados aspectos de ejemplo, se proporciona un procedimiento de producción de una variante de alfa-hemolisina como se describe en el presente documento. El procedimiento incluye, por ejemplo, las etapas de cultivar una célula huésped que incluye el vector en un medio de cultivo adecuado en condiciones adecuadas para producir una variante de alfa-hemolisina. A continuación, la variante se obtiene del cultivo usando procedimientos conocidos en la técnica.
En determinados otros aspectos de ejemplo, se proporciona un procedimiento de detección de una molécula diana. El procedimiento incluye por ejemplo, proporcionar un chip que comprende un ensamblaje de nanoporo como se describe en el presente documento en una membrana que se dispone contigua o cerca de un electrodo sensor. A continuación, el procedimiento incluye dirigir una molécula de ácido nucleico a través del nanoporo. La molécula de ácido nucleico se asocia con una molécula indicadora e incluye una región de dirección y una región de sonda. La molécula indicadora se asocia con la molécula de ácido nucleico en la región de sonda y se acopla a una molécula diana. El procedimiento implica además secuenciar la región de dirección mientras que dicha molécula de ácido nucleico se dirige a través de dicho nanoporo para determinar una secuencia de ácido nucleico de dicha región de dirección. La molécula diana se identifica, con la ayuda de un procesador informático, en base a una secuencia de ácido nucleico de la región de dirección determinada.
Estos y otros aspectos, objetivos, rasgos característicos y ventajas de los modos de realización de ejemplo resultarán evidentes para los expertos en la técnica tras considerar la siguiente descripción detallada de los modos de realización de ejemplo ilustrados. Se debe entender, sin embargo, que la descripción detallada y los ejemplos específicos, si bien indican modos de realización preferentes de la invención, se dan solo a modo de ilustración, puesto que diversos cambios y modificaciones dentro del alcance y el espíritu de la invención serán evidentes para un experto en la técnica a partir de esta descripción detallada.
Incorporación del listado de secuencias por referencia
La presente solicitud incorpora por referencia por el presente documento un listado de secuencias presentado con la misma en un formato legible por ordenador, que tiene un nombre de archivo de 33725_WO_seqlist_ST25, creada el 27 de junio de 2017, que tiene un tamaño de 56.231 bytes.
Breve descripción de los dibujos
La FIG. 1A es un histograma que muestra la evaluación de la duración de un nanoporo H144A estándar. El eje y es el número de poros que tuvieron una duración dentro del intervalo en el eje x. El eje x es el número de intervalos de 100 (repeticiones) en los que la corriente que pasa a través del canal correspondía a la de un nanoporo individual de hemolisina. Este experimento se realizó durante 7200, o 72 repeticiones.
La FIG. 1B es un gráfico que muestra un análisis de los mecanismos de fallo del nanoporo H144A para la misma tanda que la FIG. 1A. Este experimento se realizó durante 7200, o 72 repeticiones representa un análisis de los mecanismos de fallo del nanoporo para la misma tanda que la FIG. 1A. Como se muestra, los poros individuales se representan como puntos en una serie de categorías. La primera categoría es para los poros que sobrevivieron hasta el final del experimento; su modo de fallo fue que el instrumento se apagó. La segunda categoría es para las células que se desactivaron por la FPGA Genia porque la corriente se incrementó muy rápidamente a un nivel >10x de la corriente de un nanoporo individual, que es un indicador general de que se rompió la bicapa lipídica. La tercera categoría es para cuando la corriente de canal abierto se incrementa de la de un poro individual a la de un múltiplo de un poro individual, pero menor a 10X la corriente. Esto típicamente indica que se insertaron 2, 3, 4, 5, 6, 7, 8 o 9 nanoporos en la bicapa que originalmente solo albergaba uno. El intervalo con ruido contiene poros donde se produjo algún modo de fallo desconocido, que típicamente da como resultado que se mida un nivel inestable de corriente; esto se puede deber a un fallo del electrodo. La última categoría es bicapa, y corresponde a la situación donde ya no se mide la corriente que pasa a través de un nanoporo, sino que se observa la conductancia característicamente baja de una bicapa lipídica.
La FIG. 2A es un histograma que muestra la evaluación de la duración de un nanoporo de rectificación N. El eje y es el número de poros que tuvieron una duración dentro del intervalo en el eje x. El eje x es el número de intervalos de 100 (repeticiones) en los que la corriente que pasa a través del canal corresponde a la de un nanoporo individual de hemolisina de rectificación N. Este experimento se realizó durante 3600, o 36 repeticiones.
La FIG. 2B es un gráfico que muestra un análisis de los mecanismos de fallo del nanoporo de rectificación N para la misma tanda que la FIG. 2a . Este experimento se realizó durante 3600, o 36 repeticiones representa un análisis de los mecanismos de fallo del nanoporo para la misma tanda que la FIG. 1A. En esta representación, los poros individuales se representan como puntos en una serie de categorías. La primera categoría es para los poros que sobrevivieron hasta el final del experimento; su modo de fallo fue que el instrumento se apagó. La segunda categoría es para las células que se desactivaron por la FPGA Genia porque la corriente se incrementó muy rápidamente a un nivel >10x de la corriente de un nanoporo individual, que es un indicador general de que se rompió la bicapa lipídica. La tercera categoría es para cuando la corriente de canal abierto se incrementa de la de un poro individual a la de un múltiplo de un poro individual, pero menor a 10X la corriente. Esto típicamente indica que se insertaron 2, 3, 4, 5, 6, 7, 8 o 9 nanoporos en la bicapa que originalmente solo albergaba uno. El intervalo con ruido contiene poros donde se produjo algún modo de fallo desconocido, que típicamente da como resultado que se mida un nivel inestable de corriente; esto se puede deber a un fallo del electrodo. La última categoría es bicapa, y corresponde a la situación donde ya no se mide la corriente que pasa a través de un nanoporo, sino que se observa la conductancia característicamente baja de una bicapa lipídica.
La FIG. 3A es un histograma que muestra la evaluación de la duración de un nanoporo de rectificación N. El eje y es el número de poros que tuvieron una duración dentro del intervalo en el eje x. El eje x es el número de intervalos de 100 (repeticiones) en los que la corriente que pasa a través del canal corresponde a la de un nanoporo individual de hemolisina de rectificación N. Este experimento se realizó durante 18000, o 180 repeticiones.
La FIG. 3B es un gráfico que muestra un análisis de los mecanismos de fallo del nanoporo de rectificación N para la misma tanda que la FIG. 3a . Este experimento se realizó durante 3600, o 36 repeticiones representa un análisis de los mecanismos de fallo del nanoporo para la misma tanda que la FIG. 1A. En esta representación, los poros individuales se representan como puntos en una serie de categorías. La primera categoría es para los poros que sobrevivieron hasta el final del experimento; su modo de fallo fue que el instrumento se apagó. La segunda categoría es para las células que se desactivaron por la FPGA Genia porque la corriente se incrementó muy rápidamente a un nivel >10x de la corriente de un nanoporo individual, que es un indicador general de que se rompió la bicapa lipídica. La tercera categoría es para cuando la corriente de canal abierto se incrementa de la de un poro individual a la de un múltiplo de un poro individual, pero menor a 10X la corriente. Esto típicamente indica que se insertaron 2, 3, 4, 5, 6, 7, 8 o 9 nanoporos en la bicapa que originalmente solo albergaba uno. El intervalo con ruido contiene poros donde se produjo algún modo de fallo desconocido, que típicamente da como resultado que se mida un nivel inestable de corriente; esto se puede deber a un fallo del electrodo. La última categoría es bicapa, y corresponde a la situación donde ya no se mide la corriente que pasa a través de un nanoporo, sino que se observa la conductancia característicamente baja de una bicapa lipídica.
La FIG. 4A es un gráfico que muestra el tiempo de enhebrado para los nanoporos heptaméricos de control en comparación con los nanoporos heptaméricos que incluyen un conjugado alfa-hemolisina/ADN polimerasa phi29 y seis variantes de alfa-hemolisina, teniendo cada variante sustituciones en H35G+V149K+H144A (es decir, una proporción de 1:6), como se expresa en SEQ ID NO: 4. Los nanoporos de control (marcados como "WT") incluyen una proporción de 1:6 de conjugado alfa-hemolisina/ADN polimerasa phi29 con respecto a seis alfa-hemolisinas naturales. Estos datos se combinan de muchos poros que capturaron los nucleótidos marcados lo que indica que el poro tenía una molécula tanto de polimerasa como de ADN molde. Como se muestra para cada marca (correspondiente a A, C, G, T), la tasa de enhebrado para un nanoporo que incluye la variante alfa hemolisina se incrementó significativamente en comparación con el nanoporo de control, demostrando por tanto un tiempo de enhebrado mejorado (disminuido). En el caso de la marca de nucleótido C, la tasa de enhebrado se incrementó desde un valor medio de 221,62 s-1 (desviación estándar 13,6 s-1) a 663,15 (desviación estándar 172 s-1). Otras marcas de nucleótidos mostraron incrementos similares como se muestra en la FIG. 1.
La FIG. 4B es un gráfico que muestra los datos brutos usados para generar la FIG. 4A. La FIG. 2 representa un valor de convertidor analógico a digital (ADC) para el sistema acoplado de CA, que da lugar a un valor de ADC para canal abierto cuando la polarización aplicada es positiva (175 unidades de ADC) y cuando la polarización aplicada es negativa (45 unidades de ADC). Cuando un nucleótido marcado se enhebra en el poro, el valor de ADC durante la aplicación de polarización positiva disminuye del nivel de canal abierto a 145 unidades de ADC. Se muestran varios ejemplos de esto de 1020 a 1040 s en el panel inferior expandido de la FIG. 4B. Cuando la polarización aplicada es negativa, el nucleótido marcado sale del poro, por lo que el nivel de canal abierto negativo no se reduce significativamente. Para calcular la tasa de enhebrado, se cuenta una distribución de los tiempos requeridos en cada período de polarización positiva para que el valor de ADC alcance un nivel de enhebrado para los ciclos con un ciclo inmediatamente anterior que terminó en un valor de ADC enhebrado. A continuación, este histograma se ajusta a una función exponencial única estándar, con una tasa de disminución que es la tasa de enhebrado.
Descripción detallada
Las modos de realización descritos en el presente documento se pueden entender más fácilmente por referencia a la siguiente descripción detallada, ejemplos y reivindicaciones, y su descripción previa y siguiente. Antes de divulgar y describir el presente sistema, dispositivos, composiciones y/o procedimientos, se ha de entender que los modos de realización descritos en el presente documento no se limitan a los sistemas, dispositivos y/o composiciones específicos divulgados a menos que se especifique de otro modo, ya que estos, por supuesto, pueden variar. También se ha de entender que la terminología usada en el presente documento es con el propósito solo de describir aspectos particulares y no pretende ser limitante.
Además, la siguiente descripción se proporciona como enseñanza habilitante de los diversos modos de realización en su mejor aspecto actualmente conocido. Los expertos en la técnica pertinente reconocerán que se pueden realizar muchos cambios en los aspectos descritos, mientras todavía se obtienen los resultados beneficiosos de la presente divulgación. También será evidente que algunos de los beneficios deseados de la presente invención se pueden obtener seleccionando algunos de los rasgos característicos de los diversos modos de realización sin utilizar otros rasgos característicos. En consecuencia, los que trabajan en la técnica reconocerán que son posibles muchas modificaciones y adaptaciones a los diversos modos de realización descritos en el presente documento e incluso pueden ser deseables en determinadas circunstancias y son parte de la presente divulgación. Por tanto, la siguiente descripción se proporciona como ilustrativa de los principios de los modos de realización descritos en el presente documento y no como limitación de los mismos.
La invención se describirá ahora en detalle por medio de referencia usando solo las siguientes definiciones y ejemplos. Todas las patentes y publicaciones, incluyendo todas las secuencias divulgadas en dichas patentes y publicaciones, a las que se hace referencia en el presente documento, se incorporan expresamente por referencia.
A menos que se defina de otro modo en el presente documento, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que se entiende comúnmente por un experto en la técnica a la que pertenece la presente invención. Singleton, et al., Dictionary of Microbiology and Molecular Biology, 2.a Ed., John Wiley and Sons, Nueva York (1994), y Hale y Marham, The Harper Collins Dictionary of Biology, Harper Perennial, NY (1991) proporcionan a un experto un diccionario general de muchos de los términos usados en la presente invención. Aunque se puede usar cualquier procedimiento y material similar o equivalente a los descritos en el presente documento en la práctica o pruebas de la presente invención, se describen los procedimientos y materiales preferentes. Los profesionales sanitarios se dirigen en particular a Sambrook et al., 1989, y Ausubel f M et al., 1993, para consultar definiciones y términos de la técnica. Se ha de entender que la presente invención no está limitada a la metodología, protocolos y reactivos particulares descritos, ya que estos pueden variar.
Los intervalos numéricos incluyen los números que definen el intervalo. El término aproximadamente se usa en el presente documento para referirse a más o menos un diez por ciento (10 %) de un valor. Por ejemplo, "aproximadamente 100" se refiere a cualquier número entre 90 y 110.
A menos que se indique de otro modo, los ácidos nucleicos se escriben de izquierda a derecha en una orientación de 5' a 3'; las secuencias de aminoácidos se escriben de izquierda a derecha en una orientación de amino a carboxilo, respectivamente.
Los títulos proporcionados en el presente documento no son limitaciones de los diversos aspectos o modos de realización de la invención que se pueden tener por referencia a la memoria descriptiva como un todo. En consecuencia, los términos definidos inmediatamente a continuación se definen más completamente por referencia a la memoria descriptiva como un todo.
Definiciones
Alfa hemolisina: como se usa en el presente documento, "alfa hemolisina", "a-hemolisina", "a-HL" y "a-HL" se usan de manera intercambiable y se refieren a la proteína monomérica que se autoensambla en un canal transmembranario lleno de agua heptamérico (es decir, nanoporo). Dependiendo del contexto, el término también se puede referir al canal transmembranario formado por siete proteínas monoméricas.
Aminoácido: como se usa en el presente documento, el término "aminoácido", en su sentido más amplio, se refiere a cualquier compuesto y/o sustancia que se puede incorporar en una cadena polipeptídica. En algunos modos de realización, un aminoácido tiene la estructura general H2N-C(H)(R)-COOH. En algunos modos de realización, un aminoácido es un aminoácido natural. En algunos modos de realización, un aminoácido es un aminoácido sintético; en algunos modos de realización, un aminoácido es un D-aminoácido; en algunos modos de realización, un aminoácido es un L-aminoácido. "Aminoácido estándar" se refiere a cualquiera de los veinte L-aminoácidos estándar encontrados comúnmente en péptidos naturales. "Aminoácido no estándar" se refiere a cualquier aminoácido, distinto de los aminoácidos estándar, independientemente de si se prepara sintéticamente o se obtiene de una fuente natural. Como se usa en el presente documento, "aminoácido sintético" o "aminoácido no natural" engloba aminoácidos modificados químicamente, incluyendo pero sin limitarse a sales, derivados aminoacídicos (tales como amidas) y/o sustituciones. Los aminoácidos, incluyendo aminoácidos carboxi y/o aminoterminales en péptidos, se pueden modificar por metilación, amidación, acetilación y/o sustitución con otros grupos químicos sin afectar negativamente a su actividad. Los aminoácidos pueden participar en un enlace disulfuro. El término "aminoácido" se usa de manera intercambiable con "residuo aminoacídico" y se puede referir a un aminoácido libre y/o a un residuo aminoacídico de un péptido. Será evidente a partir del contexto en el que se usa el término si se refiere a un aminoácido libre o a un residuo de un péptido. Cabe destacar que todas las secuencias de residuos aminoacídicos se representan en el presente documento por fórmulas con una orientación izquierda y derecha que está en el sentido convencional del extremo amino al extremo carboxílico.
Par de bases (pb): como se usa en el presente documento, par de bases se refiere a una asociación de adenina (A) con timina (T), adenina (A) con uracilo (U) o de citosina (C) con guanina (G) en un ácido nucleico bicatenario.
Complementario: como se usa en el presente documento, el término "complementario" se refiere al concepto amplio de complementariedad de secuencia entre regiones de dos hebras polinucleotídicas o entre dos nucleótidos a través de emparejamiento de bases. Es conocido que un nucleótido adenina puede formar enlaces de hidrógeno específicos ("emparejamiento de bases") con un nucleótido que sea timina o uracilo. De forma similar, es conocido que un nucleótido citosina puede realizar emparejamiento de bases con un nucleótido guanina.
Casete de expresión: un "casete de expresión" o "vector de expresión" es una construcción de ácido nucleico generada de forma recombinante o sintética, con una serie de elementos de ácido nucleico especificados que permiten la transcripción de un ácido nucleico particular en una célula diana. El casete de expresión recombinante se puede incorporar en un plásmido, cromosoma, ADN mitocondrial, ADN de plástido, virus o fragmento de ácido nucleico. Típicamente, la porción de casete de expresión recombinante de un vector de expresión incluye, entre otras secuencias, una secuencia de ácido nucleico que se va a transcribir y un promotor.
Heterólogo: una construcción o secuencia de ácido nucleico "heterólogo" tiene una porción de la secuencia que no es natural para la célula en la que se expresa. Heterólogo, con respecto a una secuencia de control se refiere a una secuencia de control (es decir, promotor o potenciador) que no funciona en la naturaleza para regular el mismo gen con una expresión que se está regulando actualmente. En general, las secuencias de ácido nucleico heterólogo no son endógenas para la célula o parte del genoma en el que están presentes, y se han añadido a la célula, por infección, transfección, transformación, microinyección, electroporación o similares. Una construcción de ácido nucleico "heterólogo" puede contener una combinación de secuencia de control/secuencia codificante de ADN que es igual a, o diferente de una combinación de secuencia de control/secuencia codificante de ADN encontrada en la célula natural.
Célula huésped: por el término "célula huésped" se quiere decir una célula que contiene un vector y apoya la replicación, y/o transcripción o transcripción y traducción (expresión) de la construcción de expresión. Las células huésped para su uso en la presente invención pueden ser células procariotas, tales como E. coli o Bacillus subtilus, o células eucariotas tales como levadura, células de planta, insecto, anfibio o mamífero. En general, las células huésped son procariotas, por ejemplo, E. coli.
Duración: como se usa en el presente documento, el término "duración" o "duración de nanoporo" se usa en general para referirse al espacio de tiempo global que funciona un nanoporo, en una reacción de secuenciación, para proporcionar datos de secuenciación útiles. Más en particular, la duración de un nanoporo se puede medir midiendo el tiempo entre el comienzo de un experimento y el momento en que el nanoporo deja de funcionar apropiadamente, como se determina por el nivel de corriente de canal abierto.
Aislado: una molécula "aislada" es una molécula de ácido nucleico que se separa de al menos otra molécula con la que se asocia normalmente, por ejemplo, en su entorno natural. Una molécula de ácido nucleico aislada incluye una molécula de ácido nucleico contenida en células que expresan normalmente la molécula de ácido nucleico, pero la molécula de ácido nucleico está presente de forma extracromosómica o en una localización cromosómica que es diferente de su localización cromosómica natural.
Alfa-hemolisina modificada: como se usa en el presente documento, el término "alfa-hemolisina modificada" se refiere a una alfa-hemolisina originada de otra alfa-hemolisina (es decir, original) y contiene una o más alteraciones aminoacídicas (por ejemplo, sustitución, deleción o inserción aminoacídica) en comparación con la alfa-hemolisina original. En algunos modos de realización, una alfa-hemolisina modificada de la invención se origina o modifica a partir de una alfa-hemolisina natural. En algunos modos de realización, una alfa-hemolisina modificada de la invención se origina o modifica a partir de una alfa-hemolisina recombinante o genomanipulada incluyendo, pero sin limitarse a, alfa-hemolisina quimérica, alfa-hemolisina de fusión u otra alfa-hemolisina modificada. Típicamente, una alfa-hemolisina modificada tiene al menos un fenotipo cambiado en comparación con la alfa-hemolisina original.
Mutación: como se usa en el presente documento, el término "mutación" se refiere a un cambio introducido en una secuencia original incluyendo, pero sin limitarse a, sustituciones, inserciones, deleciones (incluyendo truncamientos). Las consecuencias de una mutación incluyen, pero no se limitan a, la creación de un nuevo carácter, propiedad, función, fenotipo o rasgo no encontrado en la proteína codificada por la secuencia original.
Nanoporo: el término "nanoporo", como se usa en el presente documento, se refiere en general a un poro, canal o paso formado o proporcionado de otro modo en una membrana. Una membrana puede ser una membrana orgánica, tal como una bicapa lipídica, o una membrana sintética, tal como una membrana formada de un material polimérico. La membrana puede ser un material polimérico. El nanoporo se puede disponer contiguo o cerca de un circuito de detección o un electrodo acoplado a un circuito de detección, tal como, por ejemplo, un circuito con semiconductor complementario de óxido metálico (CMOS) o transistor de efecto campo (FET). En algunos ejemplos, un nanoporo tiene una anchura o diámetro característico del orden de 0,1 nanómetros (nm) a aproximadamente 1000 nm. Algunos nanoporos son proteínas. La alfa-hemolisina es un ejemplo de un nanoporo proteico.
Molécula de ácido nucleico: el término "molécula de ácido nucleico" incluye moléculas de ARN, ADN y ADNc. Se entenderá que, como resultado de la degeneración del código genético, se puede producir una multitud de secuencias de nucleótidos que codifican una proteína dada tal como alfa-hemolisina y/o variantes de la misma. La presente invención contempla cada posible secuencia de nucleótidos variante, que codifica alfa-hemolisina variante, de las que todas son posibles dada la degeneración del código genético.
Promotor: como se usa en el presente documento, el término "promotor" se refiere a una secuencia de ácido nucleico que funciona para dirigir la transcripción de un gen hacia 3'. El promotor será apropiado en general para la célula huésped en la que se expresa el gen diana. El promotor conjuntamente con otras secuencias de ácido nucleico reguladoras transcripcionales y traduccionales (también denominadas "secuencias de control") son necesarios para expresar un gen dado. En general, las secuencias reguladoras transcripcionales y traduccionales incluyen, pero no se limitan a, secuencias promotoras, sitios de unión ribosómicos, secuencias de inicio y parada transcripcionales, secuencias de inicio y parada traduccionales y secuencias potenciadoras o activadoras.
Purificado: como se usa en el presente documento, "purificado" quiere decir que una molécula está presente en una muestra a una concentración de al menos un 95 % en peso, o al menos un 98 % en peso de la muestra en la que está contenida.
Purificar: como se usa en el presente documento, el término "purificar" en general se refiere a someter a las células que contienen proteína o ácido nucleico transgénico a purificación bioquímica y/o cromatografía en columna.
Marca: como se usa en el presente documento, el término "marca" se refiere a un resto detectable que puede ser átomos o moléculas, o una colección de átomos o moléculas. Una marca puede proporcionar una firma óptica, electroquímica, magnética o electrostática (por ejemplo, inductiva, capacitiva), firma que se puede detectar con la ayuda de un nanoporo. Típicamente, cuando un nucleótido se une a la marca, se llama "nucleótido marcado". La marca puede estar unida al nucleótido por medio del resto fosfato.
Tiempo de enhebrado: el término "tiempo de enhebrado" o "TTT" quiere decir el tiempo que tarda el complejo polimerasa-marca o una hebra de ácido nucleico en enhebrar la marca en el cuerpo del nanoporo.
Variante: como se usa en el presente documento, el término "variante" se refiere a una proteína modificada que presenta características alteradas cuando se compara con la proteína original, por ejemplo, conductancia iónica alterada.
Hemolisina variante: el término "gen de hemolisina variante" o "hemolisina variante" quiere decir, respectivamente, que la secuencia de ácido nucleico del gen de alfa-hemolisina de Staphylococcus aureus se ha alterado retirando, añadiendo y/o manipulando la secuencia codificante o la secuencia de aminoácidos de la proteína expresada se ha modificado consecuentemente con la invención descrita en el presente documento.
Vector: como se usa en el presente documento, el término "vector" se refiere a una construcción de ácido nucleico diseñada para la transferencia entre diferentes células huésped. Un "vector de expresión" se refiere a un vector que tiene la capacidad de incorporar y expresar fragmentos de ADN heterólogos en una célula exógena. Muchos vectores de expresión procariotas y eucariotas están disponibles comercialmente. La selección de vectores de expresión apropiados está dentro del conocimiento de los expertos en la técnica.
Natural: como se usa en el presente documento, el término "natural" se refiere a un gen o producto génico natural que tiene las características de ese gen o producto génico cuando se aísla de una fuente natural.
Porcentaje de homología: el término "% de homología" se usa de manera intercambiable en el presente documento con el término "% de identidad" en el presente documento y se refiere al nivel de identidad de secuencia de ácido nucleico o aminoácidos entre la secuencia de ácido nucleico que codifica uno cualquiera de los polipéptidos según la invención o la secuencia de aminoácidos del polipéptido según la invención, cuando se alinea usando un programa de alineación de secuencias. Por ejemplo, como se usa en el presente documento, un 80 % de homología quiere decir lo mismo que un 80 % de identidad de secuencia determinada por un algoritmo definido y, en consecuencia, un homólogo de una secuencia dada tiene más de un 80 % de identidad de secuencia en una longitud de la secuencia dada. Los niveles ejemplares de identidad de secuencia incluyen, pero no se limitan a, un 80, 85, 90, 95, 98 % o más de identidad de secuencia para una secuencia dada, por ejemplo, la secuencia codificante para uno cualquiera de los polipéptidos según la invención, como se describe en el presente documento.
Los programas informáticos ejemplares que se pueden usar para determinar la identidad entre dos secuencias incluyen, pero no se limitan a, el paquete de programas BLAST, por ejemplo, BLASTN, BLASTX y TBLASTX, BLASTP y TBLASTN, disponibles públicamente en Internet. Véanse también, Altschul, et al., 1990 y Altschul, et al., 1997.
Las búsquedas de secuencias se llevan a cabo típicamente usando el programa BLASTN cuando se evalúa una secuencia de ácido nucleico dada en relación con las secuencias de ácido nucleico en GenBank DNA Sequences y otras bases de datos públicas. El programa BLASTX es preferente para buscar secuencias de ácido nucleico que se han traducido en todos los marcos de lectura frente a secuencias de aminoácidos en GenBank Protein Sequences y otras bases de datos públicas. Tanto BLASTN como BLASTX se ejecutan usando parámetros predeterminados de una penalización por hueco abierto de 11,0 y una penalización por hueco extendido de 1,0, y utilizan la matriz BLOSu M-62. (Véase, por ejemplo, Altschul, S. F., et al., Nucleic Acids Res. 25:3389-3402, 1997). Se realiza una alineación preferente de secuencias seleccionadas para determinar el "% de identidad" entre dos o más secuencias, usando por ejemplo, el programa CLUSTAL-W en MacVector versión 13.0.7, ejecutado con parámetros predeterminados, incluyendo una penalización por hueco abierto de 10,0, una penalización por hueco extendido de 0,1 y una matriz de similitud BLOSUM 30.
Nomenclatura
En la presente descripción y reivindicaciones se usan los códigos de una letra y tres letras convencionales para los residuos aminoacídicos.
Para facilitar la referencia, las variantes de la solicitud se describen por el uso de la siguiente nomenclatura: aminoácido(s) original(es); posición/posiciones; aminoácido(s) sustituido(s). De acuerdo con esta nomenclatura, por ejemplo, la sustitución de un ácido glutámico por una asparagina en la posición 111 se muestra como:
Glu111Asn o E111N
Las mutaciones múltiples se separan por signos más, tales como:
His35Gly+Glu111 Asn o H35G+E111N
representando las mutaciones en las posiciones 35 y 149 sustituyendo histidina por glicina y ácido glutámico por asparagina, respectivamente. Los tramos de sustituciones aminoacídicas y/o los tramos de residuos se representan por un guion, tales como un tramo de residuos de glicina del residuo 126 al 131 que es: 126-131 Gly o 126-131G. Las variaciones en sustituciones específicas se representan con una barra diagonal. Por ejemplo, una E111N/E111S quiere decir que el residuo E en la posición 111 se puede sustituir por un residuo N o bien un residuo S, respectivamente.
Mutagénesis dirigida a sitio de alfa-hemolisina
En el presente documento se proporcionan secuencias naturales de alfa-hemolisina de Staphylococcus aureus (SEQ ID NO:1, región codificante de ácido nucleico; SEQ ID NO:14, secuencia proteica) y están disponibles en otros lugares (National Center for Bioinformatics o GenBank con números de acceso M90536 y AAA26598).
Se pueden introducir mutaciones puntuales por cualquier procedimiento conocido en la técnica. Por ejemplo, se puede realizar una mutación puntual usando el kit QuikChange Lightning 2 (Stategene/Agilent) siguiendo las instrucciones del fabricante.
Se pueden encargar los cebadores a empresas comerciales, por ejemplo, IDT DNA.
Variantes de alfa-hemolisina
Las variantes de alfa-hemolisina proporcionadas en el presente documento incluyen sustituciones específicas, o una o más combinaciones de sustituciones, de modo que los nanoporos que incorporan las variantes tienen una duración de nanoporo mejorada con canales abiertos estables durante una reacción de secuenciación de ácido nucleico. Mejorando la duración de nanoporo, las reacciones de secuenciación que usan dichos nanoporos de larga duración pueden generar datos de secuenciación más utilizables en el transcurso de una reacción de secuenciación más larga.
En determinados modos de realización de ejemplo, las variantes incluyen una mutación o una serie de mutaciones particulares. Por ejemplo, la variante puede incluir una sustitución aminoacídica de una cualquiera de E111N/E111S, M113A/M113S, L135I, T145S, K147N/K147S o una combinación de las mismas de SEQ ID NO: 14. Además, en determinados modos de realización de ejemplo, la variante también puede incluir una sustitución H35G de SEQ ID NO: 14.
Además, la variante puede incluir una sustitución poli-G en los residuos 127-129 de SEQ ID NO: 14. La variante puede incluir además una mutación K131G. Como tal, en determinados modos de realización de ejemplo, las sustituciones E111N/E111S, M113A/M113S, L135I, T145S, K147N/K147S y/o H35G descritas en el presente documento están acompañadas por una serie de aminoácidos poli-G en los residuos 126-131 de SEQ ID NO: 14. Para mejorar la estabilidad del nanoporo, en determinados modos de realización de ejemplo, las variantes de alfa-hemolisina descritas en el presente documento pueden incluir adicionalmente una sustitución aminoacídica en H144A de SEQ ID NO: 14.
En determinados modos de realización de ejemplo, las variantes de alfa-hemolisina incluyen combinaciones específicas de sustituciones. Por ejemplo, la variante de alfa hemolisina puede incluir una sustitución E111N+K147N o una sustitución E111S+K147S. De forma adicional o alternativa, la variante de alfa-hemolisina puede incluir una sustitución E111N+K147N+M113A o una sustitución E111S+K147S+M113S. En determinados modos de realización de ejemplo, las variantes de alfa hemolisina incluyen una de las siguientes combinaciones de sustituciones/residuos:
E111N+126-131G+H144A+K147N;
H35G+E111N+H144A+K147N;
H35G+E111N+M113A+126-131G+H144A+K147N;
E111N+M113A+127-131G+K147N; o
E111S+M113S+T145S+K147S+L135I.
En determinados modos de realización de ejemplo, la variante incluye una o más de las sustituciones descritas en el presente documento, mientras que la secuencia global de la variante conserva hasta un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 2. De forma similar, en otros modos de realización de ejemplo, la variante incluye una o más de las sustituciones descritas en el presente documento, mientras que la secuencia global de la variante conserva hasta un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 14. En determinados modos de realización de ejemplo, la variante tiene un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada SEQ ID NOS: 17, 18, 19, 20 o 22.
Sin desear quedar vinculado a ninguna teoría en particular, se cree que, cuando un nanoporo incluye las variantes descritas en el presente documento, el sitio de constricción del poro se ensancha, permitiendo de este modo que fluyan más iones a través del poro durante una reacción de secuenciación de ácido nucleico. Como resultado, se cree que los nanoporos que incluyen dichas variantes tienen menos movimiento neto de sal a través del poro cuando el nanoporo se somete a una corriente alterna. Disminuyendo el movimiento neto de sal, disminuye el desequilibrio osmótico a través del poro, mejorando de este modo la estabilidad global del nanoporo. Por consiguiente, el nanoporo resultante tiene una duración mejorada en comparación con, por ejemplo, un nanoporo que consiste en alfa-hemolisinas naturales.
En determinados modos de realización de ejemplo, las variantes de alfa-hemolisina descritas en el presente documento que mejoran la duración de nanoporo también pueden mejorar el tiempo de enhebrado durante una reacción de secuenciación. Es decir, cuando la variante se incorpora a un nanoporo, se mejoran tanto la duración del nanoporo como el tiempo de enhebrado, dando como resultado por tanto un nanoporo superior. Por ejemplo, cualquiera de las sustituciones H35G, E111N, M113A, K147N o 127-129G puede mejorar tanto la duración del nanoporo como el tiempo de enhebrado. Del mismo modo, cualquiera de las mutaciones E111S, M113S, T145S, K147S o L135I puede mejorar tanto la duración del nanoporo como el tiempo de enhebrado.
En determinados modos de realización de ejemplo, se pueden incorporar sustituciones adicionales a las variantes para mejorar enhebrado a enhebrado de un nanoporo resultante, mejorando de este modo el funcionamiento global del nanoporo (tanto la duración como enhebrado a enhebrado). En la tabla 1 se proporciona una lista de los residuos que se pueden mutar, por ejemplo, para mejorar el tiempo de enhebrado. En determinados modos de realización de ejemplo, una variante que da como resultado una duración de nanoporo mejorada y un tiempo mejorado para formarse a partir de la mutación de uno o más de los aminoácidos de SEQ ID NO: 14 identificados en la tabla 1 tiene un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia expresada como SEQ ID NO: 14. En determinados modos de realización de ejemplo, la mutación da como resultado la adición de una carga positiva. Por ejemplo, la mutación puede dar como resultado una sustitución de un residuo de aminoácido identificado en la tabla 1 por una arginina, lisina, histidina, asparagina u otro aminoácido que pueda tener una carga positiva.
En determinados modos de realización de ejemplo, además de una sustitución H35G, E111N/E111S, M113A/M113S, L135I, T145S, K147N/K147S y/o 127-129G (o una combinación de las mismas) para mejorar la duración de nanoporo, la mutación puede incluir una sustitución adicional particular para mejorar también el tiempo de enhebrado. Por ejemplo, la variante puede incluir adicionalmente una sustitución aminoacídica de una cualquiera de V149K, E287R, T109K, P151K o combinaciones de las mismas de SEQ ID NO: 14. En otros modos de realización de ejemplo, la variante puede incluir una o más de estas mismas sustituciones, mientras que la secuencia global puede tener hasta un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos establecida como SEQ ID NO: 14. En determinados modos de realización de ejemplo, uno o más de los primeros 17 aminoácidos de SEQ ID NO: 14 mutaron a, N, K o bien combinaciones de los mismos. De forma adicional o alternativa, cualquiera de las variantes puede incluir una serie de sustituciones de residuos de glicina que abarcan del residuo 127 al residuo 131 de la secuencia expresada como SEQ ID NO: 14, como se describe en el presente documento.
Tabla 1: Residuos de alfa-hemolisina madura que se pueden mutar para formar una variante de alfa-hemolisina.
Figure imgf000010_0001
Figure imgf000011_0001
* La posición corresponde a la posición del aminoácido específico en SEQ ID NO: 14.
Si bien la variante de a-hemolisina puede incluir diversas combinaciones de sustituciones como se describe en el presente documento, en determinados modos de realización de ejemplo, la variante de a-hemolisina incluye combinaciones particulares de sustituciones para mejorar el tiempo de enhebrado. Por ejemplo, una variante de a-hemolisina puede incluir las siguientes combinaciones de sustituciones aminoacídicas de la secuencia expresada como SEQ ID NO: 14:
H35G+V149K;
V149K+E287R+H35G;
V149K+E287R;
T109K+H35G;
P151K+H35G;
V149K+P151K+H35G;
T109K+V149K+H35G;
V149K+K147N+E111N+127-131G+M113A+H35G;
V149K+K147N+E111N+127-131G+M113A; o
T109K+V149K+P151K+H35G.
Dichas combinaciones también pueden incluir, por ejemplo, una sustitución en H144A de SEQ ID NO: 14 y/o una serie de residuos de glicina en los aminoácidos 127-131 de SEQ ID NO: 14. En determinados modos de realización de ejemplo, la variante de a-hemolisina incluye una secuencia de aminoácidos que tiene al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 11, SEQ ID NO: 12 o SEQ ID NO: 13, conservándose la(s) sustitución/sustituciones identificada(s) en cada secuencia, por ejemplo, en la variante.
En determinados modos de realización de ejemplo, la sustitución aminoacídica descrita en el presente documento permite la adición de moléculas heterólogas, tales como polietilenglicol (PEG). En determinados aspectos de ejemplo, la variante de a-HL tiene una o más modificaciones postraduccionales. En determinados aspectos de ejemplo, la sustitución es un aminoácido no natural que es básico o positivamente cargado a un pH de aproximadamente 5 a aproximadamente 8,5.
En determinados modos de realización de ejemplo, los aminoácidos que forman la totalidad o una parte de las variantes descritas en el presente documento pueden ser estereoisómeros. De forma adicional o alternativa, los aminoácidos que forman la totalidad o una parte de las variantes descritas en el presente documento pueden ser modificaciones de aminoácidos naturales, aminoácidos no naturales, aminoácidos modificados de forma postraduccional, aminoácidos sintetizados de forma enzimática, aminoácidos derivatizados, construcciones o estructuras diseñadas para imitar aminoácidos y similares. Los aminoácidos que forman las variantes descritas en el presente documento pueden ser uno o más de los 20 aminoácidos comunes que se encuentran en las proteínas naturales, o uno o más de los aminoácidos modificados e inusuales. En determinados modos de realización de ejemplo, los aminoácidos pueden ser D- o L-aminoácidos.
En determinados modos de realización de ejemplo, las variantes también pueden incluir uno o más aminoácidos modificados. El aminoácido modificado puede ser un aminoácido derivatizado o un aminoácido modificado e inusual. Los ejemplos de aminoácidos modificados e inusuales incluyen pero no se limitan a, ácido 2-aminoadípico (Aad), ácido 3-aminoadípico (Baad), ácido p-amino-propiónico (Bala, p-alanina), ácido 2-aminobutírico (Abu, ácido piperidínico), ácido 4-aminobutírico (4Abu), ácido 6-aminocaproico (Acp), ácido 2-aminoheptanoico (Ahe), ácido 2-aminoisobutírico (Aib), ácido 3-aminoisobutírico (Baib), ácido 2-aminopimélico (Apm), ácido 2,4-diaminobutírico (Dbu), desmosina (Des), ácido 2,2'-diaminopimélico (Dpm), ácido 2,3-diaminopropiónico (Dpr), N-etilglicina (EtGly), N-etilasparagina (EtAsn), hidroxilisina (Hyl), alo-hidroxilisina (AHyl), 3-hidroxiprolina (3Hyp), 4-hidroxiprolina (4Hyp), isodesmosina (Ide), alo-isoleucina (Alle), N-metilglicina (MeGly, sarcosina), N-metilisoleucina (Melle), 6-N-metillisina (MeLys), N-metilvalina (MeVal), norvalina (Nva), norleucina (Nle) y ornitina (Orn). Otros ejemplos de aminoácidos modificados e inusuales se describen en general en Synthetic Peptides: A User's Guide, segunda edición, abril 2002, editado por Gregory A. Grant, Oxford University Press; Hruby V J, Al-obeidi F y Kazmierski W: Biochem J 268:249-262, 1990; y Toniolo C: Int J Peptide Protein Res 35:287-300, 1990; de los que se incorporan las enseñanzas de todos expresamente en el presente documento por referencia.
En determinados modos de realización de ejemplo, la secuencia de aminoácidos de la variante es secuencial, sin ningún aminoácido modificado e inusual que interrumpa la secuencia de D- o L-aminoácidos. En otros modos de realización, la secuencia puede incluir uno o más aminoácidos modificados e inusuales como se indica anteriormente. Por ejemplo, la secuencia de la variante puede estar interrumpida por uno o más aminoácidos modificados e inusuales. En consecuencia, se proporcionan pseudopéptidos y peptidomiméticos, incluyendo estructuras que tienen una cadena principal no peptídica. En determinados modos de realización de ejemplo, las variantes incluyen dímeros o multímeros de péptidos.
Para que las variantes y la alfa-hemolisina WT se puedan manipular, en determinados modos de realización de ejemplo, cualquiera de las secuencias de aminoácidos descritas en el presente documento, tales como las expresadas como SEQ ID NO: 4-14 y 17-20 y 22, también pueden incluir secuencias conectoras o marcas de afinidad, y además pueden incluir secuencias para retirar dichas marcas (por ejemplo, sitios de escisión de proteasa). Por ejemplo, en algunos modos de realización de las secuencias de aminoácidos descritas en el presente documento, las secuencias pueden incluir una secuencia conectora/TEV/HisTAG en el extremo C terminal que tiene la secuencia GLSAENLYFQGHHHHHH (SEQ ID NO: 16, donde la secuencia TEV está subrayada). Como apreciarán los expertos en la técnica, una secuencia de este tipo permite la purificación de la variante.
Ensamblaje e inserción de nanoporo
Los péptidos de alfa-hemolisina descritos en el presente documento se pueden ensamblar en un ensamblaje de proteína multimérica (es decir, un nanoporo). Por consiguiente, el nanoporo resultante incluirá múltiples subunidades de alfa-hemolisina. Por ejemplo, un nanoporo de alfa-hemolisina heptamérica incluye siete subunidades.
Cualquiera de las variantes de alfa-hemolisina descritas en el presente documento se puede usar en el ensamblaje de nanoporo. Las subunidades de un nanoporo dado, por ejemplo, pueden ser copias idénticas del mismo polipéptido o pueden ser polipéptidos diferentes. Por ejemplo, cada una de las siete subunidades de un ensamblaje heptamérico puede tener una secuencia de aminoácidos correspondiente a la secuencia de aminoácidos expresada como SEQ ID NOS: 17, 18, 19, 20 o 22. En otros modos de realización de ejemplo, las subunidades pueden incluir las sustituciones identificadas en SEQ ID NOS: 17, 18, 19, 20 o 22, pero solo pueden tener un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NOS: 17, 18, 19, 20 o 22, respectivamente.
En otros modos de realización de ejemplo, cada una de las subunidades puede incluir la misma serie de sustituciones, teniendo una o más de cada una de las subunidades del nanoporo una secuencia de aminoácidos global diferente. Es decir, si bien una sustitución o combinación de sustituciones particular se puede conservar entre todas las subunidades en un nanoporo dado, las secuencias de aminoácidos globales de las diversas subunidades pueden ser diferentes. En determinados modos de realización de ejemplo, un nanoporo que incluye subunidades de alfa-hemolisina variante que son iguales o sustancialmente iguales proporciona una duración mejorada en comparación con un nanoporo que tiene una mezcla de subunidades de alfa-hemolisina diferentes. Por ejemplo, un nanoporo que incluye solo subunidades variantes de alfa-hemolisina que tienen un 80 %, 85 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a una de las secuencias de aminoácidos expresadas como SEQ ID NOS: 17, 18, 19, 20 o 22 puede tener una duración mayor que un nanoporo que incluye subunidades variantes junto con subunidades naturales.
En determinados modos de realización de ejemplo, una o más de las subunidades pueden incluir adicionalmente sustituciones que mejoran el tiempo de enhebrado como se describe en el presente documento. Por consiguiente, el nanoporo resultante tiene tanto duración mejorada como tiempo de enhebrado incrementado. En determinados modos de realización de ejemplo, el nanoporo puede incluir una mezcla de las variantes descritas en el presente documento y otros polipéptidos de alfa-hemolisina, tales como alfa-hemolisinas naturales. En determinados modos de realización de ejemplo, los nanoporos tienen una proporción definida de subunidades modificadas (por ejemplo, variantes de a-HL) con respecto a subunidades no modificadas (por ejemplo, a-HL). En determinados modos de realización de ejemplo y como se describe además a continuación, el nanoporo tiene una polimerasa unida a una de las subunidades para formar un ensamblaje de nanoporo.
En el presente documento también se proporcionan procedimientos para producir proteínas multiméricas (por ejemplo, nanoporos o ensamblaje de nanoporo) que tienen una proporción definida de subunidades modificadas con respecto a subunidades no modificadas. Con referencia a la FIG. 27 del documento WO2014/074727, un procedimiento para ensamblar una proteína que tiene una pluralidad de subunidades incluye proporcionar una pluralidad de primeras subunidades 2705 y proporcionar una pluralidad de segundas subunidades 2710, donde las segundas subunidades se modifican en comparación con las primeras subunidades. En algunos casos, las primeras subunidades son naturales (por ejemplo, purificadas de fuentes naturales o producidas de forma recombinante). Las segundas subunidades se pueden modificar de cualquier forma adecuada. En algunos casos, las segundas subunidades tienen una proteína (por ejemplo, una polimerasa) unida (por ejemplo, como una proteína de fusión).
En determinados modos de realización de ejemplo, las subunidades modificadas pueden comprender un resto químicamente reactivo (por ejemplo, una acida o un grupo alquino adecuado para formar un enlace). En algunos casos, el procedimiento comprende además realizar una reacción (por ejemplo, una cicloadición de química Click) para unir una entidad (por ejemplo, una polimerasa) al resto químicamente reactivo.
En determinados modos de realización de ejemplo, el procedimiento puede incluir además poner en contacto las primeras subunidades con las segundas subunidades 2715 en una primera proporción para formar una pluralidad de proteínas 2720 que tienen las primeras subunidades y las segundas subunidades. Por ejemplo, una parte de las subunidades de aHL modificadas que tienen un grupo reactivo adecuado para unir una polimerasa se puede mezclar con seis partes de subunidades de aHL naturales (es decir, siendo la primera proporción 1:6). La pluralidad de proteínas puede tener una pluralidad de proporciones de las primeras subunidades con respecto a las segundas subunidades. Por ejemplo, las subunidades mixtas pueden formar varios nanoporos que tienen una distribución de estequiometrías de subunidades modificadas con respecto a no modificadas (por ejemplo, 1:6, 2:5, 3:4).
En determinados modos de realización de ejemplo, las proteínas se forman simplemente mezclando las subunidades. En el caso de nanoporos de aHL, por ejemplo, un detergente (por ejemplo, ácido desoxicólico) puede provocar que el monómero de aHL adopte la conformación de poro. Los nanoporos también se pueden formar, por ejemplo, usando un lípido (por ejemplo, 1,2-difitanoil-sn-glicero-3-fosfocolina (DPhPC) o 1,2-di-0-fitanil-sn-glicero-3-fosfocolina (DoPhPC)) y temperatura moderada (por ejemplo, menos de aproximadamente 100 °C). En algunos casos, mezclar DPhPC con una solución tampón crea grandes vesículas multilaminares (LMV), y añadir subunidades de aHL a esta solución e incubar la mezcla a 40 °C durante 30 minutos da como resultado la formación de poro.
Si se usan dos tipos de subunidades diferentes (por ejemplo, la proteína natural y un segundo monómero de aHL que puede contener una única mutación puntual), las proteínas resultantes pueden tener una estequiometría mixta (por ejemplo, de las proteínas naturales y mutantes). La estequiometría de estas proteínas, en determinados modos de realización de ejemplo, puede seguir una fórmula que es dependiente de la proporción de las concentraciones de las dos proteínas usadas en la reacción de formación de poros. Esta fórmula es como sigue: 100 Pm= 100[n!/m!(n-m)!] • fmutm • fwtñm, donde
Pm = probabilidad de que un poro tenga un número m de subunidades mutantes
n = número total de subunidades (por ejemplo, 7 para aHL)
m = número de subunidades "mutantes"
fmut = fracción o proporción de subunidades mutantes mezcladas entre sí
fwt = fracción o proporción de subunidades naturales mezcladas entre sí
El procedimiento puede comprender además fraccionar la pluralidad de proteínas para enriquecer proteínas que tienen una segunda proporción de las primeras subunidades con respecto a las segundas subunidades 2725. Por ejemplo, se pueden aislar proteínas de nanoporo que tienen una y solo una subunidad modificada (por ejemplo, una segunda proporción de 1:6). Sin embargo, cualquier segunda proporción es adecuada. También se puede fraccionar una distribución de segundas proporciones, tal como enriquecer proteínas que tienen una o bien dos subunidades modificadas. El número total de subunidades que forman la proteína no siempre es 7 (por ejemplo, se puede usar un nanoporo diferente o se puede formar un nanoporo de alfa-hemolisina que tiene seis subunidades) como se representa en la FIG. 27 del documento WO2014/074727. En algunos modos de realización, se enriquecen las proteínas que tienen solo una subunidad modificada. En dichos casos, la segunda proporción es 1 segunda subunidad por (n-1) primeras subunidades, donde n es el número de subunidades que comprende la proteína.
La primera proporción puede ser la misma que la segunda proporción, sin embargo, esto no se requiere. En algunos modos de realización, las proteínas que tienen monómeros mutados se pueden formar menos eficazmente que las que no tienen subunidades mutadas. Si este es el caso, la primera proporción puede ser mayor que la segunda proporción (por ejemplo, si se desea una segunda proporción de 1 subunidad mutada con respecto a 6 no mutadas en un nanoporo, formar un número adecuado de 1:6 proteínas puede requerir mezclar las subunidades en una proporción mayor que 1:6).
Las proteínas que tienen segundas proporciones de subunidades diferentes se pueden comportar de forma diferente (por ejemplo, tener tiempos de retención diferentes) en una separación. En determinados modos de realización de ejemplo, las proteínas se fraccionan usando cromatografía, tal como cromatografía de intercambio iónico o cromatografía de afinidad. Puesto que las primeras y segundas subunidades pueden ser idénticas aparte de la modificación, el número de modificaciones en la proteína puede servir como base para la separación. En algunos casos, la primera o bien la segunda subunidad tienen una marca de purificación (por ejemplo, además de la modificación) para permitir o mejorar la eficacia del fraccionamiento. En algunos modos de realización, se usa una marca polihistidina (marca His), una marca estreptavidina (marca Strep) u otra marca peptídica. En algunos modos de realización, las primera y segunda subunidades comprenden cada una marcas diferentes y la etapa de fraccionamiento fracciona en base a cada marca. En el caso de una marca His, se crea una carga en la marca a pH bajo (los residuos de histidina se cargan positivamente por debajo del pKa de la cadena lateral). Con una diferencia significativa de carga en una de las moléculas de aHL en comparación con las otras, se puede usar cromatografía de intercambio iónico para separar los oligómeros que tienen 0, 1, 2, 3, 4, 5, 6 o 7 de las subunidades de aHL "marcadas con carga". En principio, esta marca de carga puede ser una cadena de cualquier aminoácido que tenga una carga uniforme. La FIG. 28 y la FIG. 29 muestran ejemplos de fraccionamiento de nanoporos en base a una marca His. La FIG. 28 muestra una curva de absorbancia ultravioleta a 280 nanómetros, absorbancia ultravioleta a 260 nanómetros y conductividad. Los picos corresponden a nanoporos con diversas proporciones de subunidades modificadas y no modificadas. La FIG. 29 del documento WO2014/074727 muestra el fraccionamiento de nanoporos de aHL y mutantes de los mismos usando tanto marca His como marcas Strep.
En determinados modos de realización de ejemplo, una entidad (por ejemplo, una polimerasa) se une a la proteína después del fraccionamiento. La proteína puede ser una proteína de nanoporo y la entidad puede ser una polimerasa. En algunos casos, el procedimiento comprende además insertar las proteínas que tienen las segundas subunidades de proporción en una bicapa.
Como se describe en el presente documento, un nanoporo puede comprender una pluralidad de subunidades. Se puede unir una polimerasa a una de las subunidades y al menos una y menos que todas las subunidades comprenden una primera marca de purificación. En algunos casos, todas las subunidades comprenden una primera marca de purificación o una segunda marca de purificación. La primera marca de purificación, por ejemplo, puede ser una marca polihistidina (por ejemplo, en la subunidad que tiene la polimerasa unida).
Unión de polimerasa a nanoporo
Como se describe en el presente documento, una polimerasa (por ejemplo, ADN polimerasa) se une a y/o se localiza cerca del nanoporo. Cualquier ADN polimerasa que puede sintetizar ADN durante una reacción de síntesis de ADN se puede usar de acuerdo con los procedimientos y composiciones descritos en el presente documento. Las ADN polimerasas de ejemplo incluyen, pero no se limitan a, phi29 (bacteriófago de bacilo 029), pol6 (fago de clostridio phiCPV4; GenBank: AFH27113.1) o pol7 (fago de Actinomyces Av-1; GenBank: ABR676711). En determinados modos de realización de ejemplo, al ensamblaje de nanoporo está unida una enzima manipuladora o modificadora de ADN, tal como una ligasa, nucleasa, fosfatasa, cinasa, transferasa o topoisomerasa.
En determinados modos de realización de ejemplo, la polimerasa es una variante de polimerasa. Por ejemplo, la variante de polimerasa puede incluir cualquiera de las variantes de polimerasa identificadas en la sol. de pat. de EE. UU. n.° 15/012.317 (publicada como Us 2016/0222363 A1, también denominada en el presente documento como la "solicitud '317"). Dichas variantes incluyen, por ejemplo, una o más sustituciones aminoacídicas en H223A, N224Y/L, Y225L/T/I/F/A, H227P, I295W/F/M/E, Y342L/F, T343N/F, I357G/L/Q/H/W/M/A/E/Y/P, S360G, L361M/W/V, I363V, S365Q/W/M/A/G, S366A/L, Y367L/E/M/P/N, P368G, D417P, E475D, Y476V, F478L, K518Q, H527W/R/L, T529M/F, M531H/Y/A/K/R/W/T/L/V, N535L/Y/M/K/I, G539Y/F, P542E/S, N545K/D/S/L/R, Q546W/F, A547M/Y/W/F/V/S, L549Q/Y/H/G/R, I550A/W/T/G/F/S, N552L/M/S, G553S/T, F558P/T, A596S, G603T, A610T/E, V615A/T, Y622A/M, C623G/S/Y, D624F, I628YA//F, Y629W/H/M, R632L/C, N635D, M641L/Y, A643L, I644H/M/Y, T647G/A/E/K/S, I648K/RA//N/T, T651Y/F/M, I652Q/G/S/N/F/T, K655G/F/E/N, W656E, D657R/P/A, V658L, H660A/Y, F662I/L, L690M o combinaciones de las mismas de SEQ ID NO: 15 (que corresponde a SEQ ID NO: 2 de la solicitud '317). En determinados modos de realización de ejemplo, la polimerasa incluye una o más de dichas sustituciones y tiene un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 15. Como se describe en la solicitud '317, la variante de polimerasa puede tener actividad enzimática, fidelidad, procesividad, tasa de alargamiento, exactitud de secuenciación, capacidad de lectura continua prolongada, estabilidad o solubilidad alteradas en relación con la polimerasa original.
La polimerasa se puede unir al ensamblaje de nanoporo de cualquier forma adecuada conocida en la técnica. Véanse, por ejemplo, los documentos PCT/US2013/068967 (publicado como WO2014/074727; Genia Technologies), PCT/US2005/009702 (publicado como WO2006/028508) y PCT/US2011/065640 (publicado como WO2012/083249; Columbia Univ). En determinados modos de realización de ejemplo, la polimerasa se une al monómero proteico de nanoporo (por ejemplo, hemolisina) y, a continuación, se ensambla el heptámero de nanoporo completo (por ejemplo, en una proporción de un monómero con una polimerasa unida con respecto a 6 monómeros de nanoporo (por ejemplo, hemolisina) sin una polimerasa unida). El heptámero de nanoporo se puede insertar a continuación en la membrana.
Otro procedimiento para unir una polimerasa a un nanoporo implica unir una molécula conectora a un monómero de hemolisina o mutar un monómero de hemolisina para tener un sitio de unión y, a continuación, ensamblar el heptámero de nanoporo completo (por ejemplo, en una proporción de un monómero con conector y/o sitio de unión con respecto a 6 monómeros de hemolisina sin conector y/o sitio de unión). A continuación, se puede unir una polimerasa al sitio de unión o conector de unión (por ejemplo, en bloque, antes de insertarlo en la membrana). La polimerasa también se puede unir al sitio de unión o conector de unión después de que el nanoporo (por ejemplo, heptámero) se forme en la membrana. En algunos casos, se inserta una pluralidad de pares nanoporo-polimerasa en una pluralidad de membranas (por ejemplo, dispuestas sobre los pocillos y/o electrodos) del biochip. En algunos casos, la unión de la polimerasa al complejo de nanoporo se produce en el biochip encima de cada electrodo.
La polimerasa se puede unir al nanoporo con cualquier química adecuada (por ejemplo, enlace covalente y/o conector). En algunos casos, la polimerasa se une al nanoporo con grapas moleculares. En algunos casos, las grapas moleculares comprenden tres secuencias de aminoácidos (indicadas como conectores A, B y C). El conector A se puede extender desde un monómero de hemolisina, el conector B se puede extender desde la polimerasa, y el conector C puede unir a continuación los conectores A y B (por ejemplo, envolviendo ambos conectores A y B) y, por tanto, la polimerasa al nanoporo. El conector C también se puede construir para ser parte del conector A o conector B, reduciendo por tanto el número de moléculas conectoras.
En determinados modos de realización de ejemplo, la polimerasa se fija al nanoporo usando la química Solulink™. Solulink™ puede ser una reacción entre HyNic (ácido 6-hidracino-nicotínico, una hidracina aromática) y 4FB (4-formilbenzoato, un aldehido aromático). En algunos casos, la polimerasa se fija al nanoporo usando la química Click (disponible de LifeTechnologies, por ejemplo). En algunos casos, se introducen mutaciones de dedos de cinc en la molécula de hemolisina y, a continuación, se usa una molécula (por ejemplo, una molécula intermedia de ADN) para fijar la polimerasa a los sitios de dedos de cinc en la hemolisina.
De forma adicional o alternativa, se puede usar el sistema SpyTag/SpyCatcher, que forma espontáneamente enlaces isopeptídicos covalentes en condiciones fisiológicas, para unir un monómero de alfa-hemolisina a la polimerasa. Véase, por ejemplo, Li et al., J Mol Biol., 23 enero de 2014; 426(2):309-17. Por ejemplo, se puede expresar una proteína alfa-hemolisina que tiene un dominio SpyTag. Además, se puede expresar por separado la a Dn polimerasa que se va a unir a la alfa-hemolisina como proteína de fusión que tiene un dominio SpyCatcher. Mezclando la proteína de fusión alfa-hemolisina/SpyTag con la ADN polimerasa/proteína SpyCatcher, las proteínas SpyTag y SpyCatcher interactúan para formar el monómero alfa-hemolisina que se fija a una ADN polimerasa por medio de un enlace isopeptídico covalente. En determinados modos de realización de ejemplo, el dominio SpyTag se une a la alfa-hemolisina por medio de una secuencia conectora. Por ejemplo, el conector-proteína SpyTag puede incluir la secuencia GGSSGGSSGGAHIVMVDAYKPTK (SEQ ID NO: 21), siendo la porción subrayada la secuencia conectora y la porción en negrita la secuencia SpyTag. En determinados modos de realización de ejemplo, se une una HisTag a la secuencia de SpyTag de la secuencia de SpyTag. Por ejemplo, HisTag se puede fijar a SpyTag por medio de un conector KG.
En determinados modos de realización de ejemplo, la polimerasa se puede unir a un monómero de nanoporo antes de que el monómero de nanoporo se incorpore en un ensamblaje de nanoporo. Por ejemplo, después de la expresión y purificación de la proteína de fusión alfa-hemolisina/SpyTag, la proteína de fusión alfa-hemolisina/SpyTag purificada se mezcla con la proteína de fusión polimerasa/SpyCatcher purificada, permitiendo por tanto que las proteínas SpyTag y SpyCatcher se unan entre sí para formar un monómero de alfa-hemolisina/polimerasa. A continuación, el monómero se puede incorporar al ensamblaje de nanoporo como se describe en el presente documento para formar un ensamblaje heptamérico.
En determinados modos de realización de ejemplo, la polimerasa se une al ensamblaje de nanoporo después de la formación del ensamblaje de nanoporo. Por ejemplo, después de la expresión y purificación de la proteína de fusión alfa-hemolisina/SpyTag, la proteína de fusión se incorpora al ensamblaje de nanoporo para formar el ensamblaje de nanoporo heptamérico. La proteína de fusión polimerasa/SpyCatcher a continuación se mezcla con el ensamblaje heptamérico, permitiendo por tanto que las proteínas SpyTag y SpyCatcher se unan entre sí, lo que a su vez da como resultado la unión de la polimerasa al ensamblaje de nanoporo.
Debido a la naturaleza de la reacción de secuenciación basada en nanoporo, los expertos en la técnica apreciarán que es beneficioso tener solo una única polimerasa asociada con cada ensamblaje de nanoporo (en lugar de múltiples polimerasas). Para lograr dichos ensamblajes, el ensamblaje de nanoporo se puede configurar, por ejemplo, para tener solo una única SpyTag, que por lo tanto permite la unión de una única polimerasa/SpyCatcher.
En el caso de alfa-hemolisina, por ejemplo, mezclar las proteínas alfa-hemolisina/SpyTag con proteínas alfa-hemolisina adicionales da como resultado heptámeros que tienen 0, 1, 2, 3, 4, 5, 6 o 7 subunidades de alfa-hemolisina/SpyTag. Además debido al número diferente de secuencias de SpyTag (0, 1, 2, 3, 4, 5, 6 o 7) asociadas con cada heptámero, los heptámeros tienen cargas diferentes. Por consiguiente, en determinados modos de realización de ejemplo, los heptámeros se pueden separar por procedimientos conocidos en la técnica, tales como por medio de elución con cromatografía de intercambio catiónico. A continuación, las fracciones eluidas se pueden examinar para determinar qué fracción incluye un ensamblaje con una única SpyTag. La fracción con una única SpyTag se puede usar a continuación para unir una única polimerasa a cada ensamblaje, creando de este modo ensamblajes de un nanoporo con una única polimerasa unida a los mismos.
Si bien una variedad de procedimientos pueden ser adecuados para determinar qué fracción de heptámero contiene una única SpyTag (y que, por consiguiente, se puede unir solo a una única proteína de fusión polimerasa/SpyCatcher por heptámero), en determinados modos de realización de ejemplo, la fracción de heptámero diferente se puede separar en base al peso molecular, tal como por medio de SDS-PAGE. A continuación se puede usar un reactivo para confirmar la presencia de SpyTag asociada con cada fracción. Por ejemplo, se puede añadir una SpyCatcher-GFP (proteína fluorescente verde) a las fracciones antes de la separación por medio de SDS-PAGE.
Debido a que los heptámeros con menos números de SpyTag son más pequeños que los heptámeros con mayor número de SpyTag, se puede identificar la fracción con una única SpyTag, como se demuestra por la migración de banda más lejos y la presencia de fluorescencia por GFP en el gel de SDS-PAGE correspondiente a la banda. Por ejemplo, una fracción que contiene siete monómeros de alfa-hemolisina y cero proteínas de fusión SpyTag migrará más lejos, pero no emitirá fluorescencia cuando se mezcle con SpyCatcher-GFP debido a la ausencia de SpyTag unida a los heptámeros. Sin embargo, la fracción que contiene una única SpyTag migrará lo siguiente más lejos (en comparación con otras bandas fluorescentes) y emitirá fluorescencia, permitiendo de este modo la identificación de la fracción con una única SpyTag unida al heptámero. Después de la identificación de la fracción con una única SpyTag unida al heptámero, se puede añadir a continuación la proteína de fusión polimerasa/SpyCatcher a esta fracción, fijando de este modo la polimerasa al ensamblaje de nanoporo.
Usando los procedimientos y composiciones descritos en el presente documento, se puede lograr un ensamblaje de nanoporo anclado a una única ADN polimerasa, y que incluye una o más de las variantes de alfa hemolisina como se describe en el presente documento. Por ejemplo, un nanoporo heptamérico puede incluir siete subunidades variantes, teniendo cada subunidad una secuencia correspondiente a una de las secuencias de aminoácidos expresadas en SEQ ID NOS: 17, 18, 19, 20 o 22 o a una secuencia de aminoácidos que es, respectivamente, un 80 %, 85 %, 90 %, 95 %, 98 % o más idéntica a la misma, con una ADN polimerasa unida a una de las subunidades.
Configuración del aparato
El nanoporo descrito en el presente documento se puede formar o incluirse de otro modo en una membrana dispuesta contigua a un electrodo sensor de un circuito sensor, tal como un circuito integrado. El circuito integrado puede ser un circuito integrado específico de la aplicación (ASIC). En algunos ejemplos, el circuito integrado es un transistor de efecto de campo o un semiconductor complementario de óxido metálico (CMOS). El circuito sensor se puede situar en un chip u otro dispositivo que tenga el nanoporo, o fuera del chip o dispositivo, tal como en una configuración fuera de chip. El semiconductor puede ser cualquier semiconductor, incluyendo, sin limitación, semiconductores del grupo IV (por ejemplo, silicio) y grupo III-V (por ejemplo, arseniuro de galio). Véase, por ejemplo, el documento WO 2013/123450, para la configuración del aparato y dispositivo para detectar un nucleótido o marca.
Se pueden usar sensores basados en poros (por ejemplo, biochips) para consulta electrónica de moléculas individuales. Un sensor basado en poros puede incluir un nanoporo de la presente divulgación formado en una membrana que se dispone contigua o cerca de un electrodo sensor. El sensor puede incluir un contraelectrodo. La membrana incluye un lado trans (es decir, un lado orientado hacia el electrodo sensor) y un lado cis (es decir, un lado orientado hacia el contraelectrodo).
En determinados modos de realización de ejemplo, un nanoporo que incluye una o más de las variantes de alfa-hemolisina descritas en el presente documento, tendrá una duración de nanoporo mejorada en relación con un nanoporo que incluye alfa-hemolisina natural (es decir, un nanoporo sin ninguna de las sustituciones descritas en el presente documento). En determinados modos de realización de ejemplo, cuanto mayor sea el número de variantes incluidas en el nanoporo corresponde a un mayor nivel de mejora en la duración de nanoporo. Por ejemplo, un nanoporo heptamérico donde cada una de las siete subunidades de alfa-hemolisina corresponde a una de las secuencias expresadas como SEQ ID NOS: 17, 18, 19, 20 o 22 o una secuencia que es, respectivamente, un 80 %, 85 %, 90 %, 95 %, 98 % o más idéntica a la misma, puede tener una duración más larga que un nanoporo que incluye solo alfa-hemolisina natural o menos de siete variantes. Es decir, en determinados modos de realización de ejemplo, el mayor número de variantes incluidas en el nanoporo corresponde a una duración de nanoporo más larga. En determinados modos de realización de ejemplo, las siete subunidades de un nanoporo heptamérico incluyen sustituciones, tales como la misma sustitución o sustituciones superpuestas que mejoran la duración de nanoporo. Las variantes en un nanoporo dado pueden ser la misma variante o una combinación de variantes diferentes.
En determinados modos de realización de ejemplo, la duración de un nanoporo que incluye una o más variantes de alfa-hemolisina como se describe en el presente documento, tales como las proporcionadas en SEQ ID NOS: 17, 18, 19, 20 y 22, se incrementa en aproximadamente un 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o más en comparación con un nanoporo que incluye solo alfa-hemolisina natural. En determinados modos de realización de ejemplo, la duración de un nanoporo que incluye una o más variantes de alfa-hemolisina como se describe en el presente documento se duplica o triplica en comparación con un nanoporo que incluye solo alfa-hemolisina natural.
En determinados modos de realización de ejemplo, además de una duración de nanoporo mejorada, puede disminuir el tiempo para que una marca se enhebre a través del poro (el tiempo de enhebrado o TTT). Por ejemplo, el TTT para un nanoporo que comprende una o más de las variantes descritas en el presente documento puede disminuir en aproximadamente un 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o más en comparación con un ensamblaje de nanoporo heptamérico que consiste en alfa-hemolisina natural. Como tal, un nanoporo que incluye una o más de las variantes descritas en el presente documento puede tener una duración incrementada de un 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o más, así como un TTT disminuido de un 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o más, en comparación con un ensamblaje de nanoporo heptamérico que consiste en alfa-hemolisina natural.
En la divulgación experimental que sigue, se aplican las siguientes abreviaturas: eq (equivalentes); M (Molar); |jM (micromolar); N (normal); mol (moles); mmol (milimoles); jmol (micromoles); nmol (nanomoles); g (gramos); mg (miligramos); kg (kilogramos); jg (microgramos); l (litros); ml (mililitros); j l (microlitros); cm (centímetros); mm (milímetros); jm (micrómetros); nm (nanómetros); °C (grados centígrados); h (horas); min (minutos); s (segundos); ms (milisegundos).
Ejemplos
La presente invención se describe en mayor detalle en los siguientes ejemplos que de ningún modo pretenden limitar el alcance de la invención como se reivindica. Las figuras adjuntas se deben considerar como partes integrales de la memoria descriptiva y la descripción de la invención. Todas las referencias citadas se incorporan específicamente en el presente documento por referencia para todo lo que se describe en el mismo. Se ofrecen los siguientes ejemplos para ilustrar, pero no para limitar la invención reivindicada.
Exp resión y recuperación
Este ejemplo ilustra la expresión y recuperación de proteína de células huésped bacterianas, por ejemplo, E. coli.
Se adquirió el ADN que codifica la a-HL natural de una fuente comercial. Se verificó la secuencia por secuenciación.
Construcción de plásmido. Se insertó el gen que codifica una a-hemolisina natural o bien variante en un plásmido pPR-IBA2 (IBA Life Sciences, Alemania) bajo el control del promotor T7.
Transformación. Se transformaron células BL21 DE3 de E. coli (de Life Technologies) con el vector de expresión que comprende el ADN que codifica la a-hemolisina natural o variante usando técnicas bien conocidas en la técnica. En resumen, se descongelaron las células en hielo (si se congelaron). Seguidamente, se añadió el ADN deseado (en un vector/plásmido adecuado) directamente a las células competentes (no debe exceder un 5 % del de las células competentes) y se mezcló moviendo el tubo. Se colocaron los tubos en hielo durante 20 minutos. Seguidamente, se colocaron las células en un baño de agua a 42 °C durante 45 segundos sin mezclar, seguido de colocación de los tubos en hielo durante 2 min. A continuación se transfirieron las células a un tubo de cultivo esterilizado de 15 ml que contenía 0,9 ml de medio SOC (precalentado a temperatura ambiente) y se cultivaron a 37 °C durante 1 h en un agitador. Finalmente, se extendió una alícuota de las células sobre una placa de agar LB que contenía el antibiótico apropiado y se incubaron las placas a 37 °C durante la noche.
Expresión de proteína. Después de la transformación, se recogieron las colonias y se inocularon en un pequeño volumen (por ejemplo, 3 ml) de medio de crecimiento (por ejemplo, caldo LB) que contenía el antibiótico apropiado con agitación a 37 °C, durante la noche.
A la mañana siguiente, transferir 1 ml del cultivo durante la noche a 100 ml nuevos de medio de autoinducción, por ejemplo, Magic Media (Life Technologies) que contiene un antibiótico apropiado para seleccionar el plásmido de expresión. Cultivar el cultivo con agitación a 25 °C aproximadamente 16 h, pero esto dependió de los plásmidos de expresión. Se recogieron las células por centrifugación a 3000 g durante 20 min a 4 °C y se almacenaron a -80 °C hasta su uso.
Purificación. Se lisaron las células por ultrasonido. Se purificó la alfa-hemolisina hasta homogeneidad por cromatografía en columna de afinidad.
Ejemplo 2
Variantes de alfa-hemolisina
El siguiente ejemplo detalla la introducción de una mutación en un residuo deseado.
Mutaciones. La mutagénesis dirigida al sitio se lleva a cabo utilizando un kit de mutagénesis dirigida a sitios múltiples QuikChange (Stratagene, La Jolla, CA) para preparar la H35G+V149K+H144A (SEQ ID NO: 4) y H35G+E111N+M113A+126-131G H144A+K147N (SEQ ID NO: 19) de ejemplo, incluyendo las secuencias un conector C terminal/TEV/HisTag para la purificación. El kit de mutagénesis dirigida a sitios múltiples QuikChange (Stratagene, La Jolla, CA) también se lleva a cabo para preparar una variante (E111N+M113A+126-131G+K147N, SEQ ID NO: 20) para la unión de polimerasa, incluyendo la variante una SpyTag C terminal, conector KG e HisTag. Se expresaron las variantes y se purificaron como en el ejemplo 1.
Ejemplo 3
Ensamblaje de nanoporo incluyendo variantes
Este ejemplo describe el ensamblaje de un nanoporo heptamérico 1:6 que incluye una subunidad que tiene una secuencia SpyTag para la unión posterior de polimerasa (la subunidad "a-HL-variante-SpyTag") y seis subunidades a-HL-variante sin SpyTag (las "subunidades a-HL-variante").
Se preparó y expresó la a-HL-variante-SpyTag (E111N+M113A+126-131G+K147N, SEQ ID NO: 20)) como se describe en los ejemplos 1 y 2 con una SpyTag C terminal, un conector KG e HisTag. A continuación, se purificó la proteína a-HL-variante-SpyTag en una columna de afinidad de cobalto usando un tampón de elución de cobalto (NaCl 200 mM, imidazol 300 mM, tris 50 mM, pH 8). Se almacenó la proteína a 4 °C si se usaba dentro de 5 días, de otro modo se añadió trehalosa al 8 % y se almacenó a -80 °C.
Para las subunidades a-HL-variante, se prepararon y expresaron variantes de H35G+E111N+M113A+126-131G+H144A+K147N (SEQ ID NO: 19) como se describe en los ejemplos 1 y 2 con un conector/TEV/HisTag y se purificaron en una columna de afinidad de cobalto usando un tampón de elución de cobalto (NaCl 200 mM, imidazol 300 mM, tris 50 mM, pH 8). A continuación, se incubó la proteína a-HL-variante con 1 mg de TEV proteasa por cada 5 mg de proteína a 4 °C durante 4 horas. Después de la incubación con la TEV proteasa, se purifica la mezcla en una columna de afinidad de cobalto para retirar la TEV proteasa y la proteína no digerida. Se almacenaron las proteínas a 4 °C si se usaban dentro de 5 días, de otro modo se añadió trehalosa al 8 % y se almacenó a -80 °C.
Usando aproximadamente 10 mg de proteína total, se mezclaron conjuntamente las soluciones de proteína a-HL-variante-SpyTag con respecto a a-HL-variante deseada en una proporción de 1:9 para facilitar finalmente la formación de una mezcla de heptámeros en la proporción deseada. Se espera que una mezcla de heptámeros de este tipo dé como resultado diversas fracciones que incluyen proporciones variables de proteína a-HL-variante-SpyTag con respecto a a-HL-variante (0:7; 1:6, 2:5, 3:4, etc.), donde el componente a-HL-variante-SpyTag está presente como 0, 1, 2, 3, 4, 5, 6 o siete subunidades monoméricas del heptámero.
Se solubilizó el lípido difitanoilfosfatidilcolina (DPhPC) en Tris 50 mM, NaCI 200 mM, pH 8 o bien KCI 150 mM, HEPES 30 mM, pH 7,5 hasta una concentración final de 50 mg/ml y se añadió a la mezcla de monómeros de a-HL hasta una concentración final de 5 mg/ml. Se incubó la mezcla de los monómeros de a-HL a 37 °C durante al menos 60 min. Después de esto, se añadió n-octil-p-D-glucopiranósido (pOG) hasta una concentración final del 5 % (peso/volumen) para solubilizar la mezcla de lípido-proteína resultante. Se centrifugó la muestra para depurar los agregados de proteínas y los complejos lipídicos sobrantes y se recogió el sobrenadante para su posterior purificación.
A continuación, se sometió la mezcla de heptámeros de a-HL a purificación por intercambio catiónico y se recogieron las fracciones de elución. Para cada fracción, se prepararon dos muestras para SDS-PAGE. La primera muestra incluía 15 ul de eluato de a-HL solo y la segunda muestra se combinó con 3 ug de SpyCatcher-GFP. A continuación, se incubaron las muestras y se protegieron de la luz y a temperatura ambiente durante 1-16 horas. Después de la incubación, se añadieron 5 ul de tampón SDS-PAGE Laemmli 4x (Bio-Rad™) a cada muestra. A continuación se cargaron las muestras y una escalera de proteínas sin tinción PrecisionPlus™ en un gel prefabricado de proteínas sin tinción Mini-PROTEAN al 4-20 % (Bio-Rad). Se desarrollaron los geles a 200 mV durante 30 minutos. A continuación, se tomaron imágenes de los geles usando un filtro sin tinción.
La conjugación de SpyCatcher-GFP con a-HL heptamérica/SpyTag se puede observar a través de cambios de banda de peso molecular durante SDS-PAGE. Los heptámeros que contienen una única SpyTag se unirán a una única molécula SpyCatcher-GFP y, por tanto, tendrán un cambio que corresponde al peso molecular del poro heptamérico más el peso molecular de una única SpyCatcher-GFP, mientras que los heptámeros con dos o más SpyTag deberían tener cambios de peso molecular correspondientemente mayores. Por lo tanto, se pueden analizar los picos eluidos de la columna de intercambio catiónico durante la purificación de a-HL heptamérica anterior para determinar la proporción de a-HL/SpyTag con respecto a a-HL-variante. Además, se puede observar la presencia de la unión de SpyCatcher-GFP usando un filtro de fluorescencia de GFP cuando se forman imágenes de los geles de SDS-PAGE.
En base a este razonamiento, se determinó la fracción con cambio de peso molecular que correspondía a una única adición de SpyCatcher-GFP usando una escalera de proteínas estándar de peso molecular. Se usó el sistema de formación de imágenes sin tinción de Bio-Rad para determinar el cambio de peso molecular. Se determinó la presencia de fluorescencia de GFP usando un filtro azul. Se usó la presencia de fluorescencia para confirmar la presencia de la proteína SpyTag. A continuación se usó la fracción de elución correspondiente a la proporción 1:6, es decir, una a-HL-variante-SpyTag con respecto a seis a-HL-variantes, para otros experimentos.
Usando estos mismos o similares procedimientos, también se produjo un heptámero 1:6 que tenía una sustitución V149K añadida a cada una de las a-HL-variantes H35G+E111N+M113A+126-131G+H144A+K147N (SEQ ID NO: 19). Es decir, el componente "seis" del heptámero 1:6 incluía una sustitución V149K, siendo el componente "uno" de la a-HL-variante-SpyTag E111N+M113A+126-131G+K147N indicado como rectificación N en la tabla 1 (SEQ ID NO: 20).
Además de los heptámeros 1:6 descritos anteriormente, se usaron estos mismos o similares procedimientos para crear un heptámero 1:6 que tenía seis a-HL-variantes H35G+V149K+H144A (SEQ ID NO: 4). Más en particular, dichos heptámeros 1:6 tienen una a-HL natural-SpyTag como el componente "uno" de la proporción 1:6 y un componente "seis" que incluye seis a-HL-variantes H35G+V149K+H144A (SEQ ID NO: 4).
Ejemplo 4
Unión de una polimerasa
Este ejemplo proporciona la unión de una polimerasa a un nanoporo.
Se puede acoplar la polimerasa al nanoporo por cualquier medio adecuado. Véanse, por ejemplo, los documentos PCT/US2013/068967 (publicado como WO2014/074727; Genia Technologies), PCT/US2005/009702 (publicado como WO2006/028508) y PCT/US2011/065640 (publicado como WO2012/083249; Columbia Univ).
Se acopló la polimerasa, por ejemplo, ADN polimerasa phi29, a un nanoporo proteico (por ejemplo, alfa-hemolisina), a través de una molécula conectora. Específicamente, se usó el sistema SpyTag y SpyCatcher, que forma espontáneamente enlaces isopeptídicos covalentes en condiciones fisiológicas. Véase, por ejemplo, Li et al., J Mol Biol., 23 de enero de 2014; 426(2):309-17.
En resumen, se expresó la SpyCatcher HisTag de phi29 adherente de acuerdo con el ejemplo 1 y se purificó usando una columna de afinidad de cobalto. Se incubaron la polimerasa SpyCatcher y la proteína oligomerizada SpyTag a una proporción molar 1:1 durante la noche a 4 °C en SrCh 3 mM. A continuación se purifica el complejo 1:6-polimerasa-molde usando cromatografía de exclusión por tamaño.
Ejemplo 5
Actividad de las variantes
Este ejemplo muestra la actividad de los nanoporos como se proporciona por los ejemplos 1-4 (nanoporos con una polimerasa unida).
Se sometieron a ensayo los nanoporos variantes para determinar el efecto de las sustituciones. Más en particular, se sometieron a ensayo los nanoporos con una proporción de 1:6 incluyendo el componente "uno" del nanoporo la a-HL-variante-SpyTag (con la polimerasa unida) e incluyendo el componente "seis" las a-HL-variantes, para determinar el efecto de las sustituciones en la duración de nanoporo. De forma similar, se sometieron a ensayo los nanoporos que también incluyen la sustitución V149K para determinar la duración de nanoporo (véase la tabla 1, a continuación). Además, se analizaron los nanoporos que tienen la a-HL natural-SpyTag 1:6 (con polimerasa unida) como el componente "uno" y seis a-HL-variantes H35G+V149K+H144A (SEQ ID NO: 4) como el componente "seis" para determinar el efecto de las sustituciones en el tiempo de enhebrado.
Para realizar los ensayos se formaron las bicapas y se insertaron poros como se describe en el documento PCT/US14/61853 presentado el 23 de octubre de 2014. Se configuró el dispositivo (o sensor) de nanoporos usado para detectar una molécula (y/o secuenciar un ácido nucleico) como se describe en el documento WO2013123450.
Evaluación de duración de nanoporo
Este ensayo se diseñó para medir el tiempo que un nanoporo puede funcionar apropiadamente en una bicapa lipídica bajo el efecto de voltajes alternos, es decir, ondas cuadradas.
Para medir la duración de nanoporo, se ha ideado un ensayo que usa voltajes positivos y negativos alternos (ondas cuadradas) para la duración de poro. Este complejo de secuenciación está compuesto por un nanoporo proteico (aHL) que se une a una única a Dn polimerasa (véase el ejemplo 4). La corriente pasa de forma diferente a través del poro en los voltajes aplicados positivos y negativos. Los nanoporos pueden pasar iones de forma diferente bajo voltajes positivos en comparación con voltajes negativos. Esto da lugar a un bombeo de iones de sal y agua fuera del pocillo. Durante la duración del poro, este proceso deforma gradualmente la bicapa y provoca que el nanoporo ya no conduzca iones a través de la bicapa. Cuando esto sucede, marca el final de la duración de poro. A continuación, estos tiempos se registran y se representan como un histograma, como se muestra en la FIG. 1A, la FIG. 2A y la FIG. 3A.
Para llevar a cabo el ensayo de "duración", se usa el dispositivo de secuenciación Genia con un chip de secuenciación Genia. Se acondicionan los electrodos y se establecen bicapas de fosfolípidos en el chip como se explica en el documento PCT/US2013/026514. Se inserta el complejo de secuenciación de Genia en las bicapas siguiendo el protocolo descrito en el documento PCT/US2013/026514 (publicado como WO2013/123450). Se recogieron los datos de duración de poro usando un sistema tampón compuesto por HEPES 20 mM pH 8, KGlu 300 mM, nucleótido marcado 3 uM, Mg2+ 3 mM, con un voltaje aplicado de 235 mV de pico a pico con una tasa de modulación de 80 Hz.
Como se muestra en las FIGS. 1A-1B, 2A-2B y 3A-3B, los nanoporos que incluyen proporciones 1:6 de las subunidades de a-HL-variante-SpyTag (E111N+M113A+126-131G+K147N, SEQ ID NO: 20) y a-HL-variante (H35G+E111N+M113A+126-131G+H144A+K147N (SEQ ID NO: 19)) mostraron duraciones significativamente mejoradas. Y, si bien la adición de la sustitución V149K redujo el nivel global de duración mejorada de los nanoporos, no obstante, la duración mejoró en de un 5,4 % a ~26 % de poros que duraron al menos 1 hora (en comparación con los controles) (véase la tabla 1).
Figure imgf000021_0001
Tabla 1: Evaluación de V149Ksobre la duración de nanoporo mejorada. En resumen, se sometieron a prueba tipos de poros diferentes tanto para el tiempo de enhebrado como para la duración de poro en condiciones diferentes. E111N+M113A+126-131G+K147N se denominan "rectificación N" para ahorrar espacio. Los poros de rectificación N tienen una duración más larga que sus homólogos H144A o V149K. Cuando se combinan las mutaciones V149K y rectificación N, el mutante resultante tiene > 2x la duración de poro de V149K solo cuando se diluye hasta 0,0001 |jM.
Evaluación del tiempo de enhebrado
Se diseñó este ensayo para medir el tiempo que se tarda en capturar una molécula marcada por una ADN polimerasa unida al nanoporo usando voltajes alternos, es decir, ondas cuadradas.
Para medir el tiempo que se tarda en capturar un nucleótido marcado por una ADN polimerasa en este complejo de secuenciación, se ha ideado un ensayo que usa voltajes positivos y negativos alternos (ondas cuadradas) para determinar el tiempo que esto tarda. Este complejo de secuenciación está compuesto por un nanoporo proteico (aHL) que se une a una única ADN polimerasa (véase el ejemplo 4). Los nucleótidos marcados están cargados negativamente y, por lo tanto, se atraen por el nanoporo cuando el voltaje aplicado es de naturaleza positiva, y se repelen cuando el voltaje aplicado al complejo de secuenciación de nanoporo es negativo. Así, se puede medir el tiempo que tarda una marca en enhebrarse en el poro alternando el voltaje entre los potenciales positivo y negativo y determinar cuánto tiempo la corriente del nanoporo está sin obstrucciones (canal abierto) frente a cuando se enhebra la marca (flujo de corriente reducido).
Para llevar a cabo el ensayo de "tiempo de enhebrado", se usa el dispositivo de secuenciación Genia con un chip de secuenciación Genia. Se acondicionan los electrodos y se establecen bicapas de fosfolípidos en el chip como se explica en el documento PCT/US2013/026514. Se inserta el complejo de secuenciación de Genia en las bicapas siguiendo el protocolo descrito en el documento PCT/US2013/026514 (publicado como WO2013/123450). Se recogieron los datos de tiempo de enhebrado usando un sistema tampón compuesto por HEPES 20 mM pH 8, KGlu 300 mM, nucleótido marcado 3 uM, Mg2+ 3 mM, con un voltaje aplicado de 235 mV de pico a pico con un ciclo de trabajo de 80 Hz.
Después de que se recogieron los datos, se analizaron para determinar las ondas cuadradas que mostraban la captura de un nucleótido marcado (nivel enhebrado) que duró hasta el final de la porción positiva de la onda cuadrada, y se siguió de otra captura de marca en la onda cuadrada posterior. Se midió el tiempo de enhebrado determinando cuánto tiempo la segunda onda cuadrada informó de corriente de canal abierto sin obstrucciones. Como ejemplo, si 10 ondas cuadradas consecutivas mostraron capturas de nucleótidos marcados que duraron hasta el final de la porción positiva de la onda cuadrada, entonces el parámetro de tiempo de enhebrado se calcularía a partir de las ondas cuadradas 2-10 (la primera onda cuadrada no se tiene en cuenta en el cálculo porque la polimerasa no tenía una marca unida a ella en la onda cuadrada previa). A continuación se recogieron esos números de tiempo de enhebrado para todos los poros en el experimento y se extrajeron parámetros estadísticos de ellos (tales como una media, mediana, desviación estándar, etc.).
Los resultados para la variante H35G+V149K+H144A, en comparación con los controles, se muestran en las figs.
4A-4B.
Se entiende que los ejemplos y modos de realización descritos en el presente documento son solo para propósitos ilustrativos y que diversas modificaciones o cambios a la luz de los mismos se sugerirán a los expertos en la técnica y se han de incluir dentro del espíritu y el ámbito de la presente solicitud y el alcance de las reivindicaciones adjuntas. Todas las publicaciones, patentes y solicitudes de patente citadas en el presente documento se incorporan por el presente documento por referencia en su totalidad para todos los propósitos. Las secuencias divulgadas en la presente solicitud se expresan como sigue:
Texto libre del listado de secuencias
SEQ ID NO: 1 (ADN WT aHL)
ATGGCAGATC TCGATCCCGC GAAATTAATA CGACTCACTA TAGGGAGGGC
50
ACAACGGTTT CCCTCTAGAA ATAATTTTGT TTAACTTTAA GAAGGAGATA
100
TACAAATGGA TTCAGATATT AATATTAAAA CAGGTACAAC AGATATTGGT
150
TCAAATACAA CAGTAAAAAC TGGTGATTTA GTAACTTATG ATAAAGAAAA
200
TGGTATGCAT AAAAAAGTAT TTTATTCTTT TATTGATGAT AAAAATCATA
250
ATAAAAAATT GTTAGTTATT CGTACAAAAG GTACTATTGC AGGTCAATAT
300
AGAGTATATA GTGAAGAAGG TGCTAATAAA AGTGGTTTAG CATGGCCATC
350
TGCTTTTAAA GTTCAATTAC AATTACCTGA TAATGAAGTA GCACAAATTT
400
CAGATTATTA TCCACGTAAT AGTATTGATA CAAAAGAATA TATGTCAACA
450
TTAACTTATG GTTTTAATGG TAATGTAACA GGTGATGATA CTGGTAAAAT
500
TGGTGGTTTA ATTGGTGCTA ATGTTTCAAT TGGTCATACA TTAAAATATG
550
TACAACCAGA TTTTAAAACA ATTTTAGAAA GTCCTACTGA TAAAAAAGTT
600
GGTTGGAAAG TAATTTTTAA TAATATGGTT AATCAAAATT GGGGTCCTTA
650
TGATCGTGAT AGTTGGAATC CTGTATATGG TAATCAATTA TTTATGAAAA
700
CAAGAAATGG TTCTATGAAA GCAGCTGATA ATTTCTTAGA TCCAAATAAA 750
GCATCAAGTT TATTATCTTC AGGTTTTTCT CCTGATTTTG CAACAGTTAT
800
TACTATGGAT AGAAAAGCAT CAAAACAACA AACAAATATT GATGTTATTT
850
ATGAACGTGT AAGAGATGAT TATCAATTAC ATTGGACATC AACTAATTGG
900
AAAGGTACAA ATACTAAAGA TAAATGGACA GATAGAAGTT CAGAAAGATA
950
TAAAATTGAT TGGGAAAAAG AAGAAATGAC AAATGGTCTC AGCGCTTGGA
1000
GCCACCCGCA GTTCGAAAAA TAA 1023
SEQ ID NO: 2 (aminoácidos de WT aHL) Tcomo se expresa en E. colil
MADSDINIKT GTTDIGSNTT VKTGDLVTYD KENGMHKKVF YSFIDDKNHN
50
KKLLVIRTKG TIAGQYRVYS EEGANKSGLA WPSAFKVQLQ LPDNEVAQIS
100
DYYPRNSIDT KEYMSTLTYG FNGNVTGDDT GKIGGLIGAN VSIGHTLKYV
150
QPDFKTILES PTDKKVGWKV IFNNMVNQNW GPYDRDSWNP VYGNQLFMKT
200
RNGSMKAADN FLDPNKASSL LSSGFSPDFA TVITMDRKAS KQQTNIDVIY
250
ERVRDDYQLH WTSTNWKGTN TKDKWTDRSS ERYKIDWEKE EMTNGLSAWS
300
HPQFEK
306
SEQ ID NO: 3 (WT aHL madura, con marca de purificación)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGHTLiKYVQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTNGLSAWSH
300
PQFEK
305
SEQ ID NO: 4 (H35G+V149K+H144A)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYKQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 SEQ ID NO: 5 (H35G+H144A+V149K+E287R)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRWSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYKQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADWF LDPWKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWRKEE MTN 293
SEQ ID NO: 6 (V149K+E287R)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGHTLKYKQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWRKEE MTN 293
SEQ ID NO: 7 (T109K+H35G)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDKK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYVQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293
SEQ ID NO: 8 (P151K+H35G)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD 100
YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYVQ
150
KDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293
SEQ ID NO: 9 (V149K+P151K+H35G)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYKQ
150
KDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293
SEQ ID NO: 10 (T109K+V149K+H35G)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDKK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYKQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293
SEQ ID NO: 11 (V149K+K147N+E111N+127-131G+M113A+H35G)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK NYASTLTYGF NGNVTGGGGG GIGGLIGANV SIGATLNYKQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 SEQ ID NO: 12 (V149K+K147N+E111N+127-131G+M113A)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK NYASTLTYGF NGNVTGGGGG GIGGLIGANV SIGHTLNYKQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293
SEQ ID NO: 13 (T109K+V149K+P151K+H35G)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDKK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLKYKQ
150
KDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293
SEQ ID NO: 14 (WT aHL madura; AAA26598)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK
50
KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD
100
YYPRNSIDTK EYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGHTLKYVQ
150
PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR
200
NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE
250
RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN
293
SEQ ID NO: 15 (Pol6 con marca His)
MHHHHHHHHS GGSDKHTQYV KEHSFNYDEY KKAWFDKIEC LIFDTESCTN
50
YEWDNTGARV YGWGLGVTRN HNMIYGQNLN QFWEVCQNIF NDWYHDNKHT
100
IKITKTKKGF PKRKYIKFPI AVHNLGWDVE FLKYSLVENG FNYDKGLLKT
150
VFSKGAPYQT VTDVEEPKTF HIVQNNNIVY GCNVYMDKFF EVENKDGSTT
200
EIGLCLDFFD SYKIITCAES QFHNYVHDVD PMFYKMGEEY DYDTWRSPTH
250
KQTTLELRYQ YNDIYMLREV IEQFYIDGLC GGELPLTGMR TASSIAFNVL
300
KKMTFGEEKT EEGYINYFEL DKKTKFEFLR KRIEMESYTG GYTHANHKAV
350
GKTINKIGCS LDINSSYPSQ MAYKVFPYGK PVRKTWGRKP KTEKNEVYLI
400
EVGFDFVEPK HEEYALDIFK IGAVNSKALS PITGAVSGQE YFCTNIKDGK
450
AIPVYKELKD TKLTTNYNW LTSVEYEFWI KHFNFGVFKK DEYDCFEVDN
500
LEFTGLKIGS ILYYKAEKGK FKPYVDHFTK MKVENKKLGN KPLTNQAKLI
550
LNGAYGKFGT KQNKEEKDLI MDKNGLLTFT GSVTEYEGKE FYRPYASFVT
600
AYGRLQLWNA IIYAVGVENF LYCDTDSIYC NREVNSLIED MNAIGETIDK
650
TILGKWDVEH VFDKFKVLGQ KKYMYHDCKE DKTDLKCCGL PSDARKIIIG
700
QGFDEFYLGK NVEGKKQRKK VIGGCLLLDT LFTIKKIMF*
739
SEQ ID NO: 16 (conector/TEV/HisTag (porción TEV subrayada))
GLSAENLY FQGHHHHHH
SEQ ID NO: 17 (E111N+126-131G+H144A+K147N)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK
50 KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD 100 YYPRNSIDTK NYMSTLTYGF NGNVTGGGGG GIGGLIGANV SIGATLNYVQ 150 PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR 200 NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE 250 RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 SEQ ID N O :18 (H35G+E111N+H144A+K147N)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50 KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD 100 YYPRNSIDTK WYMSTLTYGF NGNVTGDDTG KIGGLIGANV SIGATLJíYVQ 150 PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR 200 NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE 250 RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 SEQ ID NO: 19 (H35G+E111N+M113A+126-131G+H144A+K147N)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMGKKVFY SFIDDKNHNK
50 KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD 100 YYPRNSIDTK WYASTLTYGF NGNVTGGGGG GIGGLIGANV SIGATLWYVQ 150 PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR 200 NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE 250 RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 SEQ ID NO: 20 (E111N+M113A+126-131G+K147N)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK
50 KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD 100 YYPRNSIDTK NYASTLTYGF NGNVTGGGGG GfIGGLIGANV SIGHTLNYVQ 150 PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR 200 NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE 250 RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 SEQ ID NO: 21 (conector-proteína SpyTag, con conector subrayado y SpyTag en negrita)
GGSSGGSSGGAHIVMVDAYKPTK
----------SEQ ID NO: 22 (E111S-M113S-T145S-K147S-L135I)
ADSDINIKTG TTDIGSNTTV KTGDLVTYDK ENGMHKKVFY SFIDDKNHNK
50 KLLVIRTKGT IAGQYRVYSE EGANKSGLAW PSAFKVQLQL PDNEVAQISD 100 YYPRNSIDTK SYSSTLTYGF NGNVTGDDTG KIGGIIGANV SIGASLSYVQ 150 PDFKTILESP TDKKVGWKVI FNNMVNQNWG PYDRDSWNPV YGNQLFMKTR 200 NGSMKAADNF LDPNKASSLL SSGFSPDFAT VITMDRKASK QQTNIDVIYE 250 RVRDDYQLHW TSTNWKGTNT KDKWTDRSSE RYKIDWEKEE MTN 293 Lista de citas
Literatura de patentes
[1] Documento PCT/US2013/026514 (publicado como WO2013/123450) titulado "Methods for Creating Bilayers for Use with Nanopore Sensors"
[2] Documento PCT/US2013/068967 (publicado como WO 2014/074727) titulado "Nucleic Acid Sequencing Using Tags"
[3] Documento PCT/US14/61853 presentado el 23 de octubre de 2014 titulado "Methods for Forming Lipid Bilayers on Biochips"
Literatura distinta de patente
[4] Aksimentiev y Schulten, Im a g in g a -H e m o lys in w ith M o le c u la r D yn a m ics : lo n ic C o nd uc tan ce , O sm o tic P erm e ab ility , a n d the E le c tro s ta tic P o te n tia l M ap, Biophysical Journal (2005) 88: 3745-3761.
[5] Butler e t al., S in g le -m o le cu le D N A d e te c tio n w ith an e n g in e e re d M spA p ro te in n a n o po re , PNAS (2008) 105(52): 20647-20652.
[6] Korchev e t al., L o w C o n d u c ta n ce S ta tes o f a S in g le Ion C h a n n e l a re n o t 'C losed ', J. Membrane Biol. (1995) 147:233-239.
[7] Krasilnikov y Sabirov, Io n T ransp o rt T h rou gh C h a n n e ls F o rm e d in L ip id B ila ye rs b y S ta p h y lo co ccu s au reu s A lp h a -T o x in , Gen. Physiol. Biophys. (1989) 8:213-222.
[8] Nakane e t al., A N a n o s e n s o r fo r T ra n sm e m b ra n e C a p tu re a n d Id e n tif ica tio n o f S in g le N u c le ic A c id M o lecu les , Biophys. J. (2004) 87:615-621.
[9] Rhee y Burns, N a n o p o re se q u e n c in g te ch n o lo g y : n a n o p o re p re p a ra tio n s , TRENDS in Biotech. (2007) 25(4): 174-181.
[10] Song e t al., S tru c tu re o f S ta p h y lo c o c c a l a -H em o lys in , a H e p ta m e ric T ra n sm e m b ra n e P ore , Science (1996) 274:1859-1866.
[11] Kasianowicz e t al., N a n o m e te r-s c a le p o re s : p o te n t ia l a p p lica tio n s fo r a n a ly te d e te c tio n a n d D N A ch a ra c te riza tio n , Proc. Natl. Acad. Sci. USA (1996) 93:13770-13773.
[12] Akeson e t al., M ic ro s e c o n d tim e sca le d isc rim in a tio n a m o n g p o ly c y tid y lic acid, p o ly a d e n y lic acid, a n d p o ly u r id y lic a c id as h o m o p o ly m e rs o r as se g m e n ts w ith in s in g le R N A m o lecu les , Biophys. J. (1999) 77:3227-3233.
[13] Meller e t al., V o lta ge -d rive n D N A tra n s lo c a tio n s th ro u g h a n a n o po re , Phys. Rev. Lett., 86 (2001), pp.
3435-3438.
[14] Howorka e t al., S e q u e n ce -sp e c ific d e te c tio n o f in d iv id u a l D N A s tra n d s u s in g e n g in e e re d na n o p o re s , Nat. Biotechnol., 19 (2001a), pp. 636-639.
[15] Howorka e t al., K in e tics o f d u p le x fo rm a tio n fo r in d iv id u a l D N A s tra n d s w ith in a s in g le p ro te in nano po re , Proc. Natl. Acad. Sci. USA, 98 (2001b), pp. 12996-13001.
[16] Movileanu e t al., D e te c tin g p ro te in a n a ly te s th a t m o d u la te tra n s m e m b ra n e m o v e m e n t o f a p o ly m e r ch a in w ith in a s in g le p ro te in po re , Nat. Biotechnol., 18 (2000), pp. 1091-1095.

Claims (13)

REIVINDICACIONES
1. Una variante de a-hemolisina (a-HL) de la secuencia de aminoácidos expresada como SEQ ID NO: 14, en la que la variante tiene al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia de aminoácidos expresada como SEQ ID NO: 14 y en la que la variante comprende sustituciones aminoacídicas correspondientes a E111N/E111S, M113A, 126-131G y K147N.
2. La variante de a-hemolisina de la reivindicación 1, en la que la variante comprende además una sustitución aminoacídica correspondiente a H144A de la secuencia de aminoácidos expresada como SEQ ID NO: 14.
3. La variante de a-hemolisina de la reivindicación 1-2, en la que la variante comprende además una sustitución correspondiente a H35G de la secuencia de aminoácidos expresada como SEQ ID NO: 14.
4. La variante de a-hemolisina de cualquiera de las reivindicaciones 1-3, en la que la variante comprende además una sustitución poli-G correspondiente a los aminoácidos 127-129 de la secuencia de aminoácidos expresada como SEQ ID NO: 14.
5. La variante de a-hemolisina de cualquiera de las reivindicaciones 1-4, en la que la variante comprende además una sustitución correspondiente a K131G de la secuencia de aminoácidos expresada como SEQ ID NO: 14.
6. La variante de a-hemolisina de cualquiera de las reivindicaciones 1-5, que comprende además una sustitución aminoacídica en una posición correspondiente a una cualquiera de V149k , E287R, T109K o P151K, o combinaciones de las mismas de la secuencia de aminoácidos expresada como SEQ ID NO: 14.
7. La variante de a-hemolisina de acuerdo con cualquiera de las reivindicaciones 1-6, en la que la variante tiene una secuencia que tiene al menos un 80 %, 90 %, 95 %, 98 % o más de identidad de secuencia con respecto a la secuencia expresada como SEQ ID NOS: 17, 18, 19, 20 o 22.
8. Un ensamblaje de nanoporo heptamérico que comprende al menos una variante de a-hemolisina (a-HL) de acuerdo con una cualquiera de las reivindicaciones 1-7.
9. El ensamblaje de nanoporo heptamérico de la reivindicación 8, que comprende además una ADN polimerasa que se une a una de las variantes de alfa-hemolisina.
10. El ensamblaje de nanoporo heptamérico de la reivindicación 9, en el que la variante se une a la ADN polimerasa por medio de un enlace isopeptídico.
11. El ensamblaje de nanoporo heptamérico de acuerdo con las reivindicaciones 9 o 10, en el que el ensamblaje de nanoporo tiene una duración incrementada en relación con un ensamblaje de nanoporo que consiste en alfa-hemolisina natural.
12. El ensamblaje de nanoporo heptamérico de acuerdo con la reivindicación 11, en el que la duración se incrementa en aproximadamente un 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 % o más en comparación con un ensamblaje de nanoporo heptamérico que consiste en alfa-hemolisina natural.
13. Un procedimiento para detectar una molécula diana, que comprende:
(a) proporcionar un chip que comprende un nanoporo heptamérico de acuerdo con las reivindicaciones 8-12 en una membrana que se dispone contigua o cerca de un electrodo sensor;
(b) dirigir una molécula de ácido nucleico a través de dicho nanoporo, en el que dicha molécula de ácido nucleico se asocia con una molécula indicadora, en el que dicha molécula de ácido nucleico comprende una región de dirección y una región de sonda, en el que dicha molécula indicadora se asocia con dicha molécula de ácido nucleico en dicha región de sonda, y en el que dicha molécula indicadora se acopla a una molécula diana;
(c) secuenciar dicha región de dirección mientras dicha molécula de ácido nucleico se dirige a través de dicho nanoporo para determinar una secuencia de ácido nucleico de dicha región de dirección; e
(d) identificar, con la ayuda de un procesador informático, dicha molécula diana en base a una secuencia de ácido nucleico de dicha región de dirección determinada en (c).
ES17740304T 2016-06-30 2017-06-28 Nanoporos de alfa-hemolisina de larga duración Active ES2910406T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662357230P 2016-06-30 2016-06-30
PCT/EP2017/065972 WO2018002125A1 (en) 2016-06-30 2017-06-28 Long lifetime alpha-hemolysin nanopores

Publications (1)

Publication Number Publication Date
ES2910406T3 true ES2910406T3 (es) 2022-05-12

Family

ID=59363096

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17740304T Active ES2910406T3 (es) 2016-06-30 2017-06-28 Nanoporos de alfa-hemolisina de larga duración

Country Status (6)

Country Link
US (4) US20180002750A1 (es)
EP (1) EP3478706B1 (es)
JP (1) JP6975185B2 (es)
CN (1) CN109415419B (es)
ES (1) ES2910406T3 (es)
WO (1) WO2018002125A1 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10655174B2 (en) 2016-05-27 2020-05-19 Roche Sequencing Solutions, Inc. Tagged multi-nucleotides useful for nucleic acid sequencing
WO2018002125A1 (en) * 2016-06-30 2018-01-04 F. Hoffmann-La Roche Ag Long lifetime alpha-hemolysin nanopores
US10669580B2 (en) 2016-08-26 2020-06-02 Roche Sequencing Solutions, Inc. Tagged nucleotides useful for nanopore detection
WO2019166457A1 (en) 2018-02-28 2019-09-06 F. Hoffmann-La Roche Ag Tagged nucleoside compounds useful for nanopore detection
JP7157164B2 (ja) * 2018-02-28 2022-10-19 エフ.ホフマン-ラ ロシュ アーゲー アルファ溶血素バリアントおよびその使用
JP2021525095A (ja) 2018-05-28 2021-09-24 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft Dna−ポア−ポリメラーゼ複合体の酵素的濃縮
EP4100415A1 (en) 2020-02-06 2022-12-14 F. Hoffmann-La Roche AG Compositions that reduce template threading into a nanopore
WO2022033998A1 (en) 2020-08-11 2022-02-17 F. Hoffmann-La Roche Ag Nucleoside-5'-oligophosphates tagged with positively-charged polymers, nanopores incorporating negative charges, and methods and systems using the same
EP4355757A1 (en) 2021-06-17 2024-04-24 F. Hoffmann-La Roche AG Nucleoside-5 -oligophosphates having a cationically-modified nucleobase
EP4355912A1 (en) 2021-06-17 2024-04-24 F. Hoffmann-La Roche AG Engineered nanopore with a negatively charged polymer threaded through the channel
CN117999346A (zh) * 2021-07-21 2024-05-07 豪夫迈·罗氏有限公司 形成窄通道孔的α-溶血素变体及其用途
WO2023213766A1 (en) 2022-05-02 2023-11-09 F. Hoffmann-La Roche Ag Compositions and methods that reduce prussian blue formation during nanopore sequencing

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6426231B1 (en) 1998-11-18 2002-07-30 The Texas A&M University System Analyte sensing mediated by adapter/carrier molecules
US7238485B2 (en) 2004-03-23 2007-07-03 President And Fellows Of Harvard College Methods and apparatus for characterizing polynucleotides
CN103282518B (zh) 2010-12-17 2016-11-16 纽约哥伦比亚大学理事会 使用经修饰的核苷酸和纳米孔检测的dna边合成边测序
US20140248608A1 (en) 2011-06-24 2014-09-04 Electronic Biosciences, Inc. Methods for characterizing a device component based on a contrast signal to noise ratio
EP3540077B1 (en) 2012-02-16 2021-01-27 Genia Technologies, Inc. Methods for creating bilayers for use with nanopore sensors
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
US10047129B2 (en) * 2012-12-20 2018-08-14 Electronic Biosciences, Inc. Modified alpha hemolysin polypeptides and methods of use
CN103267785B (zh) 2013-05-14 2016-04-13 西北大学 一种检测药物包裹或释放过程的单分子分析方法
US9322062B2 (en) 2013-10-23 2016-04-26 Genia Technologies, Inc. Process for biosensor well formation
ES2804843T3 (es) 2015-02-02 2021-02-09 Hoffmann La Roche Variantes de polimerasa
US10351908B2 (en) 2016-04-21 2019-07-16 Roche Sequencing Solutions, Inc. Alpha-hemolysin variants and uses thereof
WO2018002125A1 (en) * 2016-06-30 2018-01-04 F. Hoffmann-La Roche Ag Long lifetime alpha-hemolysin nanopores

Also Published As

Publication number Publication date
US20210230683A1 (en) 2021-07-29
CN109415419B (zh) 2022-07-29
US20190376134A1 (en) 2019-12-12
EP3478706A1 (en) 2019-05-08
US20230332222A1 (en) 2023-10-19
US11613778B2 (en) 2023-03-28
EP3478706B1 (en) 2022-02-09
JP6975185B2 (ja) 2021-12-01
CN109415419A (zh) 2019-03-01
JP2019525911A (ja) 2019-09-12
US10934582B2 (en) 2021-03-02
WO2018002125A1 (en) 2018-01-04
US20180002750A1 (en) 2018-01-04

Similar Documents

Publication Publication Date Title
ES2910406T3 (es) Nanoporos de alfa-hemolisina de larga duración
ES2774802T3 (es) Variantes de hemolisina alfa con características alteradas
US10968480B2 (en) Alpha-hemolysin variants and uses thereof
US11261488B2 (en) Alpha-hemolysin variants
US20200385433A1 (en) Alpha-hemolysin variants and uses thereof