ES2906221T3 - Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación - Google Patents

Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación

Info

Publication number
ES2906221T3
ES2906221T3 ES16710551T ES16710551T ES2906221T3 ES 2906221 T3 ES2906221 T3 ES 2906221T3 ES 16710551 T ES16710551 T ES 16710551T ES 16710551 T ES16710551 T ES 16710551T ES 2906221 T3 ES2906221 T3 ES 2906221T3
Authority
ES
Spain
Prior art keywords
target
sequence
oligonucleotide
stochastic
nucleotide sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16710551T
Other languages
English (en)
Inventor
Glenn Fu
Julie Wilhelmy
Maria Simbirsky
Eleen Shum
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Becton Dickinson and Co
Original Assignee
Becton Dickinson and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Becton Dickinson and Co filed Critical Becton Dickinson and Co
Application granted granted Critical
Publication of ES2906221T3 publication Critical patent/ES2906221T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Abstract

Un método para marcar un ácido nucleico en una muestra, que comprende: hibridar un objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la secuencia de adaptador universal, en donde el tercer oligonucleótido comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico, en donde el objetivo es una molécula de ARNm; y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.

Description

DESCRIPCIÓN
Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación
CAMPO
Las realizaciones en lo sucesivo se refieren a realizaciones de la divulgación que no son necesariamente realizaciones de la invención. Las realizaciones proporcionadas en la presente se refieren a métodos para marcar un ácido nucleico en una muestra con un código de barras estocástico. Algunas realizaciones se refieren a métodos para caracterizar una muestra identificando la cadena alfa o la cadena beta de TCR de una célula T.
ANTECEDENTES
Se han desarrollado métodos y composiciones para marcar moléculas de ácidos nucleicos para amplificación o secuenciación. El recuento estocástico de objetivos de ácidos nucleicos es un método de cuantificación importante. Sin embargo, un inconveniente del trabajo anterior ha sido que los reactivos diseñados para objetivos particulares serían costosos de diseñar para su uso en el marcado estocástico. En la presente se describen métodos y composiciones para marcar objetivos para el recuento estocástico.
La WO 2013/188831 A1 describe genes de receptores inmunitarios adaptativos reorganizados marcados de manera única en un conjunto de genes complejo. La WO 2014/144495 A1 describe la codificación de barras de células individuales para el descubrimiento de anticuerpos. La WO 2014/015084 A2 describe un sistema y métodos para detectar la variación genética. La WO 2015/031691 A1 describe el análisis de células individuales masivamente paralelo. La WO 2015/103339 A1 describe el análisis de ácidos nucleicos asociados con células individuales usando códigos de barras de ácidos nucleicos.
SUMARIO
La invención proporciona un método para marcar un ácido nucleico objetivo en una muestra, que comprende: hibridar un objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la secuencia de adaptador universal, en donde el tercer oligonucleótido comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación para generar una pluralidad cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico, en donde el objetivo es una molécula de ARNm; y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
La invención también proporciona un método para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprende: hibridar dicho objetivo con un primer oligonucleótido que comprende una primera secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia de adaptador universal y una segunda secuencia específica de objetivo; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la primera secuencia de adaptador universal; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; hibridar dicha tercera secuencia de nucleótidos con un cuarto oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y la segunda secuencia de adaptador universal, en donde uno o ambos del tercer oligonucleótido y el cuarto oligonucleótido comprenden parte de un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular; extender dicho cuarto oligonucleótido para generar una cuarta secuencia de nucleótidos; y amplificar dicha cuarta secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de quintas secuencias de nucleótidos, en donde cada una de la pluralidad de las quintas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico, en donde el objetivo es un molécula de ARNm; y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
La invención también proporciona un método para marcar un objetivo en una muestra para la cuantificación de dicho objetivo que comprende: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica del objetivo y un sitio de unión para un primer cebador de amplificación; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una secuencia de adaptador universal y una segunda secuencia específica de objetivo; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y una secuencia que se une específicamente a la secuencia de adaptador universal, en donde el tercer oligonucleótido comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico, en donde el objetivo es una molécula de ARNm, y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
La invención también proporciona un método para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprende: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica de objetivo y una primera secuencia de cebador de amplificación en presencia de un segundo oligonucleótido que comprende una secuencia de adaptador universal; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos que comprende un complemento de la secuencia de adaptador universal; hibridar dicha primera secuencia de nucleótidos con un tercer oligonucleótido que comprende la secuencia de adaptador universal, un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular y un sitio de unión para un segundo cebador de amplificación; extender dicho tercer oligonucleótido para generar una segunda secuencia de nucleótidos; y amplificar dicha segunda secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de terceras secuencias de nucleótidos, en donde cada una de la pluralidad de las terceras secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico, en donde el objetivo es una molécula de ARNm; y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
La invención también proporciona un método para marcar un objetivo en una muestra para la cuantificación de dicho objetivo que comprende: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia específica de objetivo y un tercer oligonucleótido que comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular y una secuencia que se une específicamente a la secuencia de adaptador universal; amplificar dicha primera secuencia de nucleótidos para generar una pluralidad de segundas secuencias de nucleótidos, en donde cada una de la pluralidad de las segundas secuencias de nucleótidos comprende dicho objetivo y dicho código de barras estocástico, en donde el objetivo es una molécula de ARNm; y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
En un aspecto, la divulgación proporciona métodos para marcar un ácido nucleico en una muestra que comprenden: hibridar un objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la secuencia de adaptador universal, en donde uno o ambos del primer oligonucleótido y el tercer oligonucleótido comprenden parte de un código de barras estocástico; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico. En algunas realizaciones, la muestra es una única célula. En algunas realizaciones, el objetivo es una molécula de ARNm. En algunas realizaciones, la molécula de ARNm codifica una cadena alfa o cadena beta del receptor de células T (TCR). En algunas realizaciones, la secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o la cadena beta de TCR. En algunas realizaciones, los métodos comprenden amplificar dicha tercera secuencia de nucleótidos usando un segundo cebador de amplificación. En algunas realizaciones, el segundo cebador de amplificación se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de las mismas. En algunas realizaciones, el segundo oligonucleótido se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el segundo oligonucleótido comprende un sitio de unión para un segundo cebador de amplificación. En algunas realizaciones, los métodos comprenden amplificar dicha tercera secuencia de nucleótidos usando el segundo cebador de amplificación. En algunas realizaciones, el primer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, el tercer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, cada uno del primer oligonucleótido y el tercer oligonucleótido comprende parte del código de barras estocástico. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular. En algunas realizaciones, el código de barras estocástico comprende un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos. En algunas realizaciones, el primer oligonucleótido o el tercer oligonucleótido se une a un soporte sólido. En algunas realizaciones, la muestra comprende una pluralidad del objetivo. En algunas realizaciones, cada uno de la pluralidad del objetivo está marcado con un código de barras estocástico distinto. En algunas realizaciones, los métodos comprenden contar el número de la pluralidad del objetivo contando los distintos códigos de barras estocásticos asociados con el objetivo.
En un aspecto, la divulgación proporciona métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una primera secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia de adaptador universal y una segunda secuencia específica del objetivo; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la primera secuencia de adaptador universal; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; hibridar dicha tercera secuencia de nucleótidos con un cuarto oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y la segunda secuencia de adaptador universal, en donde uno o ambos del tercer oligonucleótido y el cuarto oligonucleótido comprenden parte de un código de barras estocástico; extender dicho cuarto oligonucleótido para generar una cuarta secuencia de nucleótidos; y amplificar dicha cuarta secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de quintas secuencias de nucleótidos, en donde cada una de la pluralidad de las quintas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico. En algunas realizaciones, la muestra es una célula individual. En algunas realizaciones, el objetivo es una molécula de ARNm. En algunas realizaciones, la molécula de ARNm codifica una cadena alfa o cadena beta del receptor de células T (TCR). En algunas realizaciones, la secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o cadena beta de TCR. En algunas realizaciones, la segunda secuencia específica del objetivo se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el tercer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, el cuarto oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, cada uno del tercer oligonucleótido y el cuarto oligonucleótido comprende parte del código de barras estocástico. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular. En algunas realizaciones, el código de barras estocástico comprende un marcador universal, un marcador de dimensión, un marcador celular, o una combinación de los mismos.
En un aspecto, la divulgación proporciona métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica del objetivo y un sitio de unión para un primer cebador de amplificación; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una secuencia de adaptador universal y una segunda secuencia específica del objetivo; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y una secuencia que se une específicamente a la secuencia de adaptador universal, en donde uno o ambos del segundo oligonucleótido y el tercer oligonucleótido comprenden parte de un código de barras estocástico; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico. En algunas realizaciones, la muestra es una célula individual. En algunas realizaciones, el objetivo es una molécula de ARNm. En algunas realizaciones, la molécula de ARNm codifica una cadena alfa o cadena beta del receptor de células T (TCR). En algunas realizaciones, la secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o cadena beta de TCR. En algunas realizaciones, la segunda secuencia específica del objetivo se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el tercer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular. En algunas realizaciones, el código de barras estocástico comprende un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos.
En un aspecto, la divulgación proporciona métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica del objetivo y una primera secuencia de cebador de amplificación en presencia de un segundo oligonucleótido que comprende un secuencia de adaptador universal; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos que comprende un complemento de la secuencia de adaptador universal; hibridar dicha primera secuencia de nucleótidos con un tercer oligonucleótido que comprende la secuencia de adaptador universal, un código de barras estocástico y un sitio de unión para un segundo cebador de amplificación; extender dicho tercer oligonucleótido para generar una segunda secuencia de nucleótidos; y amplificar dicha segunda secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de terceras secuencias de nucleótidos, en donde cada una de la pluralidad de las terceras secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico. En algunas realizaciones, los métodos comprenden extender el primer oligonucleótido para generar una primera secuencia de nucleótidos que comprende un complemento de la secuencia de adaptador universal mediante cambio de plantillas. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular. En algunas realizaciones, el código de barras estocástico comprende un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos.
En un aspecto, la divulgación proporciona métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia específica del objetivo y un tercer oligonucleótido que comprende un código de barras estocástico y una secuencia que se une específicamente a la secuencia de adaptador universal; amplificar dicha primera secuencia de nucleótidos para generar una pluralidad de segundas secuencias de nucleótidos, en donde cada una de la pluralidad de las segundas secuencias de nucleótidos comprende dicho objetivo y dicho código de barras estocástico. En algunas realizaciones, la muestra es una célula individual. En algunas realizaciones, el objetivo es una molécula de ARNm. En algunas realizaciones, la molécula de ARNm codifica una cadena alfa o cadena beta del receptor de células T (TCR). En algunas realizaciones, la secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o cadena beta de TCR. En algunas realizaciones, los métodos comprenden amplificar dicha tercera secuencia de nucleótidos usando un segundo cebador de amplificación. En algunas realizaciones, el segundo cebador de amplificación se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el segundo oligonucleótido se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el segundo oligonucleótido comprende un sitio de unión para un segundo cebador de amplificación. En algunas realizaciones, los métodos comprenden amplificar dicha tercera secuencia de nucleótidos usando el segundo cebador de amplificación. En algunas realizaciones, el primer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, el tercer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, cada uno del primer oligonucleótido y el tercer oligonucleótido comprende parte del código de barras estocástico. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular. En algunas realizaciones, el código de barras estocástico comprende un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos. En algunas realizaciones, el primer oligonucleótido o el tercer oligonucleótido se une a un soporte sólido. En algunas realizaciones, la muestra comprende una pluralidad del objetivo. En algunas realizaciones, cada uno de la pluralidad del objetivo está marcado con un código de barras estocástico distinto. En algunas realizaciones, los métodos comprenden contar el número de la pluralidad del objetivo contando los distintos códigos de barras estocásticos asociados con el objetivo.
En un aspecto, la divulgación proporciona métodos para caracterizar una muestra, que comprenden: hibridar un primer objetivo en la muestra con un primer oligonucleótido que comprende una primera secuencia específica del objetivo y un primer código de barras estocástico, en donde el primer objetivo es un ARNm que codifica una cadena alfa o cadena beta de TCR; hibridar un segundo objetivo en la muestra con un segundo oligonucleótido que comprende una segunda secuencia específica de objetivo y un segundo código de barras estocástico; extender el primer oligonucleótido y el segundo oligonucleótido para incorporar el primer código de barras estocástico en el primer objetivo y el segundo código de barras estocástico en el segundo objetivo; e identificar las secuencias del primer objetivo y el segundo objetivo. En algunas realizaciones, la muestra es una célula individual. En algunas realizaciones, la primera secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o cadena beta de TCR. En algunas realizaciones, la extensión comprende amplificar el primer objetivo con un cebador directo. En algunas realizaciones, el cebador directo se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el segundo objetivo se selecciona del grupo que consiste de los genes enumerados en la Figura 39. En algunas realizaciones, el primer código de barras estocástico o el segundo código de barras estocástico comprende uno o más de un marcador molecular, un marcador universal, un marcador de dimensión y un marcador celular. En algunas realizaciones, el primer código de barras estocástico y el segundo código de barras estocástico comprenden el mismo marcador celular. En algunas realizaciones, la muestra comprende una pluralidad del primer objetivo o del segundo objetivo. En algunas realizaciones, cada uno de la pluralidad del primer objetivo o del segundo objetivo está marcado con un código de barras estocástico distinto. En algunas realizaciones, los métodos comprenden contar el número de la pluralidad del primer objetivo o del segundo objetivo contando los distintos códigos de barras estocásticos asociados con el primer objetivo o el segundo objetivo.
En un aspecto, la divulgación proporciona métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia específica de objetivo; extender dicho segundo oligonucleótido para generar una cadena complementaria de la primera secuencia de nucleótidos y una secuencia de nucleótidos de cadena doble; ligar un oligonucleótido adaptador de cadena doble que comprende un sitio de unión para un primer cebador de amplificación a dicha secuencia de nucleótidos de cadena doble para formar una secuencia de nucleótidos ligada; amplificar dicha secuencia de nucleótidos ligada usando un primer cebador de amplificación y un segundo cebador de amplificación que comprende un código de barras estocástico para generar una pluralidad de una segunda secuencia de nucleótidos, en donde cada una de la pluralidad de la segunda secuencia de nucleótidos comprende dicho objetivo y dicho código de barras estocástico. En algunas realizaciones, la muestra es una célula individual. En algunas realizaciones, el objetivo es una molécula de ARNm. En algunas realizaciones, la molécula de ARNm codifica una cadena alfa o cadena beta del receptor de células T (TCR). En algunas realizaciones, la secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o cadena beta de TCR. En algunas realizaciones, los métodos comprenden amplificar dicha tercera secuencia de nucleótidos usando un segundo cebador de amplificación. En algunas realizaciones, el segundo cebador de amplificación se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el segundo oligonucleótido se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el segundo oligonucleótido comprende un sitio de unión para un segundo cebador de amplificación. En algunas realizaciones, los métodos comprenden amplificar dicha tercera secuencia de nucleótidos usando el segundo cebador de amplificación. En algunas realizaciones, el primer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, el tercer oligonucleótido comprende el código de barras estocástico. En algunas realizaciones, cada uno del primer oligonucleótido y el tercer oligonucleótido comprende parte del código de barras estocástico. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular. En algunas realizaciones, el código de barras estocástico comprende un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos. En algunas realizaciones, el primer oligonucleótido o el tercer oligonucleótido se une a un soporte sólido. En algunas realizaciones, la muestra comprende una pluralidad del objetivo. En algunas realizaciones, cada uno de la pluralidad del objetivo está marcado con un código de barras estocástico distinto. En algunas realizaciones, los métodos comprenden contar el número de la pluralidad del objetivo contando los distintos códigos de barras estocásticos asociados con el objetivo.
En un aspecto, la divulgación proporciona kits que comprenden: un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; y un segundo oligonucleótido que comprende un código de barras estocástico y la secuencia de adaptador universal o el complemento de la misma. En algunas realizaciones, el primer oligonucleótido o el segundo oligonucleótido está unido a un soporte sólido. En algunas realizaciones, la secuencia específica del objetivo se une específicamente a la región C de una cadena alfa o cadena beta de TCR. En algunas realizaciones, los kits comprenden un cebador directo, en donde cebador directo se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el código de barras estocástico comprende uno o más de un marcador molecular, un marcador universal, un marcador de dimensión, y un marcador celular.
En un aspecto, la divulgación proporciona un método que comprende: poner en contacto uno o más ARNm objetivo del receptor y ARNm objetivo específico de la célula en una célula con un cebador de transcripción inversa que comprende un código de barras estocástico; transcribir de manera inversa el uno o más ARNm objetivo del receptor y el ARNm objetivo específico de la célula para generar ADNc objetivo del receptor y ADNc objetivo específico de la célula; determinar las secuencias del ADNc objetivo del receptor y el ADNc objetivo específico de la célula, y sus códigos de barras estocásticos correspondientes; contar el número de ADNc objetivo del receptor y el objetivo específico de la célula, caracterizando de este modo la célula y el receptor. En algunas realizaciones, los ARNm objetivo del receptor se seleccionan del grupo que consiste de una o más cadenas alfa de TCR, una o más cadenas beta de TCR, o cualquier combinación de las mismas. En algunas realizaciones, el ARNm objetivo específico de la célula es un gen indicativo de un tipo de célula inmunitaria. En algunas realizaciones, el ARNm objetivo específico de la célula se selecciona de un ARNm objetivo enumerado en la Figura 39. En algunas realizaciones, la transcripción inversa comprende la extensión del cebador del código de barras estocástico a lo largo del ARNm objetivo del receptor y el ARNm objetivo específico de la célula. En algunas realizaciones, el cebador de transcripción inversa se une a una región C de una cadena alfa o cadena beta de TCR y uno de los dos o más cebadores de transcripción inversa se une a un objetivo específico de la célula. En algunas realizaciones, el método comprende además amplificar el ADNc generando de este modo amplicones de ADNc antes de la determinación. En algunas realizaciones, la amplificación comprende amplificar con un primer conjunto de cebadores directos. En algunas realizaciones, el primer conjunto de cebadores directos comprende cebadores que se unen a una o más cadenas alfa y beta del receptor. En algunas realizaciones, el primer conjunto de cebadores directos comprende cebadores que se unen a objetivos específicos de células T. En algunas realizaciones, el primer conjunto de cebadores directos comprende cebadores que se unen a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR y la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el método comprende además amplificar los amplicones de ADNc con un segundo conjunto de cebadores directos. En algunas realizaciones, el segundo conjunto de cebadores directos se une a una región del receptor que está 3' del sitio de unión del primer conjunto de cebadores directos. En algunas realizaciones, la determinación comprende determinar la secuencia de amplicones del ADNc objetivo del receptor y el ADNc objetivo específico de la célula. En algunas realizaciones, la caracterización comprende determinar qué alelo de qué cadena del receptor es funcionalmente activo. En algunas realizaciones, la caracterización comprende determinar qué alelo de qué cadena del receptor se expresa más en comparación con otros alelos del receptor. En algunas realizaciones, la caracterización comprende determinar el fenotipo de la célula. En algunas realizaciones, la caracterización comprende determinar la funcionalidad de la célula. En algunas realizaciones, la célula es una célula inmunitaria. En algunas realizaciones, la célula es una célula T.
En un aspecto, la divulgación proporciona un kit que comprende: una placa, en donde cada pocillo de la placa comprende dos o más cebadores de transcripción inversa diferentes que se unen a secuencias diferentes, en donde los dos o más cebadores de transcripción inversa comprenden un código de barras estocástico; una pluralidad de cebadores directos específicos de genes; e instrucciones de uso. En algunas realizaciones, los dos o más cebadores de transcripción inversa son tres cebadores de transcripción inversa. En algunas realizaciones, los dos o más cebadores de transcripción inversa se unen a un objetivo seleccionado del grupo que consiste de: uno o más genes marcadores de células T, una o más cadenas alfa de TCR, una o más cadenas beta de TCR o cualquier combinación de los mismos. En algunas realizaciones, los dos o más cebadores de transcripción inversa se unen a una región C de una cadena alfa o cadena beta de TCR. En algunas realizaciones, uno de los dos o más cebadores de transcripción inversa se une a una región C de una cadena alfa o cadena beta de TCR y uno de los dos o más cebadores de transcripción inversa se une a un objetivo específico de la célula. En algunas realizaciones, los cebadores específicos de genes se unen a objetivos específicos de células T. En algunas realizaciones, los cebadores específicos de genes se unen a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR y la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de los mismos. En algunas realizaciones, el kit comprende además cebadores de secuenciación. En algunas realizaciones, el kit comprende además una segunda pluralidad de cebadores específicos de genes que son cebadores anidados de la pluralidad de cebadores específicos de genes. En algunas realizaciones, el kit comprende además software. En algunas realizaciones, el software se usa para contar el número de moléculas de un objetivo que se transcribe de manera inversa por uno o más códigos de barras estocásticos. En algunas realizaciones, el software se usa para identificar las secuencias de un objetivo que se transcribe de manera inversa por uno o más códigos de barras estocásticos. En algunas realizaciones, el código de barras estocástico comprende una región específica de gen, un marcador molecular, un marcador de muestra o cualquier combinación de los mismos.
En un aspecto, la divulgación proporciona un método para estimar el número de uno o más objetivos en una muestra usando un cebador de adaptador universal que comprende: poner en contacto uno o más objetivos con un oligonucleótido que comprende un cebador de adaptador universal; hibridar el oligonucleótido con un código de barras estocástico; amplificar el uno o más objetivos, incorporando de este modo el oligonucleótido y el código de barras estocástico en una secuencia del uno o más objetivos; y estimar el número del uno o más objetivos usando el código de barras estocástico. En algunas realizaciones, el oligonucleótido comprende además una región específica de gen. En algunas realizaciones, el código de barras estocástico comprende una secuencia adaptada para hibridar con el adaptador de cebador universal. En algunas realizaciones, el contacto comprende hibridar el oligonucleótido con el uno o más objetivos. En algunas realizaciones, el contacto comprende extender el oligonucleótido para incorporar la secuencia de uno o más objetivos, generando de este modo una primera transcripción. En algunas realizaciones, la extensión se realiza con extensión del cebador. En algunas realizaciones, la extensión se realiza con transcripción inversa. En algunas realizaciones, el contacto comprende además una segunda extensión. En algunas realizaciones, la segunda extensión comprende hibridar un cebador específico de gen inverso con la primera transcripción. En algunas realizaciones, la segunda extensión comprende hibridar con la primera transcripción un cebador seleccionado del grupo que consiste de un cebador universal, un cebador oligo dT y un hexámero aleatorio. En algunas realizaciones, la hibridación comprende hibridar la secuencia adaptadora del cebador universal con la secuencia adaptada para hibridar con la secuencia adaptadora del cebador universal. En algunas realizaciones, la hibridación comprende además extender el código de barras estocástico para incorporar la secuencia de la primera transcripción. En algunas realizaciones, la amplificación se realiza con un cebador universal y un cebador específico de gen. En algunas realizaciones, la amplificación se realiza con un cebador universal y un segundo cebador universal. En algunas realizaciones, el segundo cebador universal comprende además una región específica de gen. En algunas realizaciones, la amplificación se realiza una vez. En algunas realizaciones, la amplificación se realiza dos veces. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular, un marcador celular, un marcador de muestra y un marcador universal, o cualquier combinación de los mismos. En algunas realizaciones, el marcador molecular está 3' de cualquier otro marcador. En algunas realizaciones, el marcador molecular está 5' de cualquier otro marcador. En algunas realizaciones, la secuencia adaptadora del cebador universal tiene una longitud de 5-30 nucleótidos. En algunas realizaciones, la estimación comprende además determinar la secuencia de un marcador molecular del código de barras estocástico específico del gen. En algunas realizaciones, el método comprende además contar las apariciones de distintas secuencias del marcador molecular. En algunas realizaciones, el recuento se usa para estimar el número de uno o más objetivos. En algunas realizaciones, la determinación comprende secuenciar el código de barras estocástico específico del gen. En algunas realizaciones, la secuenciación comprende la secuenciación con longitudes de lectura de por lo menos 100 bases. En algunas realizaciones, la secuenciación comprende la secuenciación con longitudes de lectura de por lo menos 500 bases. En algunas realizaciones, el código de barras estocástico comprende un marcador molecular, un marcador celular, un marcador de muestra, un marcador espacial, un marcador de dimensión y un marcador universal, o cualquier combinación de los mismos. En algunas realizaciones, los marcadores moleculares en diferentes códigos de barras estocásticos son diferentes. En algunas realizaciones, los diferentes códigos de barras estocásticos comprenden el mismo marcador de muestra, marcador celular o tanto marcador de muestra como marcador celular. En algunas realizaciones, la muestra comprende una célula individual. En algunas realizaciones, la muestra comprende una pluralidad de células. En algunas realizaciones, la pluralidad de células comprende uno o más tipos de células diferentes. En algunas realizaciones, el uno o más tipos de células se seleccionan del grupo que consiste de: células del cerebro, células del corazón, células cancerosas, células tumorales circulantes, células de órganos, células epiteliales, células metastásicas, células benignas, células primarias y células circulatorias, o cualquier combinación de las mismas. En algunas realizaciones, la muestra comprende un tejido sólido. En algunas realizaciones, la muestra se obtiene de un sujeto. En algunas realizaciones, el sujeto es un sujeto seleccionado del grupo que consiste de: un humano, un mamífero, un perro, una rata, un ratón, un pez, una mosca, un gusano, una planta, un hongo, una bacteria, un virus, un vertebrado y un invertebrado. En algunas realizaciones, el uno o más objetivos son moléculas de ácido ribonucleico. En algunas realizaciones, las moléculas de ácido ribonucleico se seleccionan del grupo que consiste de: ARNm, microARN, productos de degradación del ARNm y ácidos ribonucleicos que comprenden una cola poli-A, o cualquier combinación de los mismos. En algunas realizaciones, los objetivos son moléculas de ácido desoxirribonucleico.
En un aspecto, la divulgación proporciona un método para estimar el número de uno o más objetivos en una muestra usando un adaptador de cebador universal y un código de barras estocástico que comprende: poner en contacto un primer oligonucleótido que comprende una secuencia complementaria a una secuencia adaptadora de cebador universal y una secuencia específica del gen para un segundo oligonucleótido que comprende una secuencia que codifica el código de barras estocástico y una secuencia que codifica la secuencia adaptadora del cebador universal; incorporar la secuencia específica del gen en la secuencia del código de barras estocástico, generando de este modo un código de barras estocástico específico del gen; asociar el código de barras estocástico específico del gen a uno o más objetivos; y estimar el número del uno o más objetivos usando el código de barras estocástico específico del gen. En algunas realizaciones, el contacto comprende hibridar la secuencia adaptadora del cebador universal con la secuencia complementaria a la secuencia adaptadora del cebador universal. En algunas realizaciones, la secuencia adaptadora del cebador universal tiene una longitud de 5-30 nucleótidos. En algunas realizaciones, la secuencia específica del gen tiene una longitud de 5-30 nucleótidos. En algunas realizaciones, la incorporación comprende la extensión del cebador del primer oligonucleótido. En algunas realizaciones, la incorporación comprende la extensión del cebador del segundo oligonucleótido. En algunas realizaciones, la incorporación comprende la transcripción inversa del primer oligonucleótido. En algunas realizaciones, la incorporación comprende la transcripción inversa del segundo oligonucleótido. En algunas realizaciones, la asociación comprende hibridar el código de barras estocástico específico del gen con uno o más objetivos. En algunas realizaciones, la asociación se realiza de tal manera que cada uno de los uno o más objetivos se asocie con un código de barras estocástico específico de gen único. En algunas realizaciones, la asociación se realiza de tal manera que por lo menos el 95% del uno o más objetivos se asocie con un código de barras estocástico específico de gen único. En algunas realizaciones, la estimación comprende generar una molécula de código de barras objetivo. En algunas realizaciones, la molécula de código de barras objetivo comprende la secuencia de un código de barras estocástico específico de gen al que está asociada. En algunas realizaciones, la estimación comprende además determinar la secuencia de un marcador molecular del código de barras estocástico específico del gen. En algunas realizaciones, el método comprende además contar las apariciones de distintas secuencias del marcador molecular. En algunas realizaciones, el recuento se usa para estimar el número de uno o más objetivos. En algunas realizaciones, la determinación comprende secuenciar el código de barras estocástico específico del gen. En algunas realizaciones, la secuenciación comprende la secuenciación con longitudes de lectura de por lo menos 100 bases. En algunas realizaciones, la secuenciación comprende la secuenciación con longitudes de lectura de por lo menos 500 bases. En algunas realizaciones, se une un primer oligonucleótido a un soporte sólido. En algunas realizaciones, los soportes sólidos comprenden una perla. En algunas realizaciones, la perla se selecciona del grupo que consiste de: perla de gel de sílice, perla de vidrio de poro controlado, perla magnética, perla Dynabead, perlas de Sephadex/Sepharose, perlas de celulosa y perlas de poliestireno, o cualquier combinación de las mismas. En algunas realizaciones, la perla comprende una perla magnética. En algunas realizaciones, el soporte sólido es semisólido. En algunas realizaciones, el soporte sólido comprende un polímero, una matriz o un hidrogel. En algunas realizaciones, el soporte sólido comprende un dispositivo de matriz de agujas. En algunas realizaciones, el soporte sólido comprende un anticuerpo. En algunas realizaciones, el soporte sólido comprende una pluralidad de códigos de barras estocásticos. En algunas realizaciones, cada código de barras estocástico de la pluralidad de códigos de barras estocásticos comprende un marcador molecular. En algunas realizaciones, los marcadores moleculares en diferentes soportes sólidos difieren en por lo menos un nucleótido. En algunas realizaciones, el código de barras estocástico comprende además un marcador universal, una muestra, un marcador y un marcador celular, o cualquier combinación de los mismos. En algunas realizaciones, el marcador universal, el marcador de muestra y el marcador celular son los mismas para todos los códigos de barras estocásticos en el soporte sólido. En algunas realizaciones, la muestra comprende una célula individual. En algunas realizaciones, la muestra comprende una pluralidad de células. En algunas realizaciones, la pluralidad de células comprende uno o más tipos de células diferentes. En algunas realizaciones, el uno o más tipos de células se seleccionan del grupo que consiste de: células cerebrales, células cardíacas, células cancerosas, células tumorales circulantes, células de órganos, células epiteliales, células metastásicas, células benignas, células primarias y células circulatorias o cualquier combinación de las mismas. En algunas realizaciones, la muestra comprende un tejido sólido. En algunas realizaciones, la muestra se obtiene de un sujeto. En algunas realizaciones, el sujeto es un sujeto seleccionado del grupo que consiste de: un humano, un mamífero, un perro, una rata, un ratón, un pez, una mosca, un gusano, una planta, un hongo, una bacteria, un virus, un vertebrado y un invertebrado. En algunas realizaciones, el uno o más objetivos son moléculas de ácido ribonucleico. En algunas realizaciones, las moléculas de ácido ribonucleico se seleccionan del grupo que consiste de: ARNm, microARN, productos de degradación del ARNm y ácidos ribonucleicos que comprenden una cola poli-A, o cualquier combinación de los mismos. En algunas realizaciones, los objetivos son moléculas de ácido desoxirribonucleico.
En un aspecto, la divulgación proporciona un método para estimar el número de un objetivo en una muestra usando un adaptador de cebador universal y un código de barras estocástico como se representa en una o más de las figuras 1-42.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
Las características novedosas de la invención se exponen con particularidad en las reivindicaciones adjuntas. Se obtendrá una mejor comprensión de las características y ventajas de los métodos haciendo referencia a la siguiente descripción detallada que expone realizaciones ilustrativas de la divulgación, y los dibujos acompañantes de los cuales:
La Figura 1 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. En un primer paso de extensión, un oligonucleótido 120 que comprende una secuencia específica del objetivo 110 y un cebador de adaptador universal 105 se hibrida a un objetivo 115 para generar una primera secuencia de nucleótidos 121. En un segundo paso de extensión, se usa un segundo cebador específico del objetivo 122 para sintetizar una cadena complementaria 125 de la primera secuencia de nucleótidos 121. En un tercer paso de extensión, puede ponerse en contacto un código de barras estocástico que comprende un compañero de unión para el cebador de adaptador universal 130 con la cadena complementaria 125 a través del cebador de adaptador universal 105 para sintetizar una tercera secuencia de nucleótidos 136. En un paso de amplificación, puede usarse un tercer cebador específico de objetivo 140 y un cebador de PCR universal 150 para amplificar la tercera secuencia de nucleótidos 136 para generar un objetivo con código de barras estocástico 145.
La Figura 2 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 1, excepto que se introduce un segundo cebador de PCR universal en el segundo paso de extensión.
La Figura 3 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 2, excepto que el orden del marcador molecular y el código de muestra se cambia en el código de barras estocástico.
La Figura 4 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 2, excepto que las partes de un código de barras estocástico se introducen ambos en el primer paso de extensión como en el tercer paso de extensión.
La Figura 5 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 4, excepto que tanto el marcador molecular como el código de muestra se introducen ambos en el primer paso de extensión.
La Figura 6 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 1, excepto que las partes de un código de barras estocástico se introducen tanto en el primer paso de extensión como en el tercer paso de extensión.
La Figura 7 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 6, excepto que tanto el marcador molecular como el código de muestra se introducen ambos en el primer paso de extensión.
La Figura 8 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 2, excepto que se introduce un segundo cebador de adaptador universal en el segundo paso de extensión, y se introduce un segundo cebador de PCR universal en un cuarto paso de extensión, y se introducen partes del código de barras estocástico tanto en el tercer como en el cuarto paso de extensión.
La Figura 9 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 8, excepto que el código de muestra se introduce en el tercer paso de extensión y el marcador molecular se introduce en el cuarto paso de extensión.
La Figura 10 representa una realización ejemplar de un método para añadir un código de barras estocástico a un ARNm objetivo, en donde el primer paso de extensión es un paso de transcripción inversa usando un primer oligonucleótido que comprende un segundo cebador de PCR universal y un poli(dT), y el segundo paso de extensión puede usar un segundo oligonucleótido que comprende una secuencia específica del objetivo y un cebador de adaptador universal, y el tercer paso de extensión puede usar un tercer oligonucleótido que comprende un código de barras estocástico y un compañero de unión para el cebador de adaptador universal. La Figura 11 representa una realización ejemplar de un método para añadir un código de barras estocástico a un ARNm objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 10, excepto que el orden del marcador molecular y el código de muestra se cambia en el código de barras estocástico.
La Figura 12 representa una realización ejemplar de un método para añadir un código de barras estocástico a un ARNm objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 10, excepto que el cebador del adaptador universal se introduce en el primer paso de extensión usando cambio de plantillas.
La Figura 13 representa una realización ejemplar de un método para añadir un código de barras estocástico a un ARNm objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 12, excepto que se cambia el orden del marcador molecular y el código de muestra en el código de barras estocástico.
La Figura 14 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 1, en donde puede inmovilizarse un cebador de adaptador universal en una perla para generar un código de barras estocástico específico del gen.
La Figura 15 representa una realización ejemplar de un método para añadir un código de barras estocástico a un objetivo usando un cebador de adaptador universal. La realización es similar a la representada en la Figura 14, en donde puede inmovilizarse en una perla un código de barras estocástico que comprende un cebador de adaptador universal para generar un código de barras estocástico específico del gen.
La Figura 16 representa una realización ejemplar de cómo un soporte sólido puede comprender una secuencia que puede hibridar con un cebador de adaptador universal de la divulgación, que puede ser parte de un código de barras estocástico.
La Figura 17 muestra una realización ejemplar de cómo un soporte sólido puede comprender una secuencia que puede hibridar con un cebador de adaptador universal similar al representado en la Figura 16, excepto que se cambia el orden del marcador molecular y el código de muestra en el código de barras estocástico.
La Figura 18 representa una realización ejemplar de cómo un soporte sólido puede comprender una secuencia que puede hibridar con un cebador de adaptador universal. La realización es similar a la representada en la Figura 16, excepto que se liga un segundo cebador de PCR universal al objetivo.
La Figura 19 muestra una realización ejemplar de cómo un soporte sólido puede comprender una secuencia que puede hibridar con un cebador de adaptador universal similar al representado en la Figura 18, excepto que se cambia el orden del marcador molecular y el código de muestra en el código de barras estocástico.
La Figura 20 representa una realización ejemplar del cambio de plantilla representado en la Figura 12 puede realizarse usando un cebador de adaptador universal unido a un soporte sólido.
La Figura 21 representa una realización ejemplar de cambio de plantilla similar a la representada en la Figura 20, excepto que el código de barras estocástico se introduce durante el paso de cambio de plantilla.
La Figura 22 representa un código de barras estocástico ejemplar.
La Figura 23 ilustra un proceso ejemplar para el marcado estocástico de moléculas de ARNm en células individuales.
La Figura 24 ilustra un sistema informático, que incluye un medio legible por ordenador no transitorio que puede usarse en relación con las realizaciones de la presente divulgación.
La Figura 25 ilustra una realización ejemplar de un primer ejemplo de arquitectura de un sistema informático que puede usarse en relación con realizaciones de la presente divulgación.
La Figura 26 ilustra un diagrama ejemplar que muestra una red con una pluralidad de sistemas informáticos para su uso en los métodos de la divulgación.
La Figura 27 ilustra un diagrama de bloques ejemplar de un sistema informático multiprocesador que usa un espacio de memoria de dirección virtual compartida de acuerdo con los métodos de la divulgación.
Las Figuras 28A, 28B y 28C representan un cartucho ejemplar para su uso en los métodos de la divulgación. La Figura 29 ilustra una realización ejemplar de un método para reducir los dímeros del cebador durante la amplificación.
La Figura 30 ilustra una realización ejemplar de un método para reducir los dímeros del cebador durante la amplificación, en donde el cebador de amplificación comprende una secuencia universal (por ejemplo, compatible con los secuenciadores de Illumina).
La Figura 31 ilustra una realización ejemplar del método de ligadura del adaptador de la divulgación.
La Figura 32 muestra las tasas de mapeo y demultiplexación usando los métodos de la divulgación.
La Figura 33 muestra la distribución de los recuentos de lectura en los amplicones. Los genes con amplicones individuales están marcados en gris claro/oscuro. Varios amplicones dentro de un gen tienen el mismo color y están agrupados.
La Figura 34 muestra una realización ejemplar del método computacional de identificación de SNP en los métodos de la divulgación.
La Figura 35 ilustra la expresión específica de alelos para genes seleccionados. Los números de la tabla representan el número de lecturas que contienen la base indicada en la posición SNP. Los valores resaltados en gris oscuro tienen recuentos muy bajos, mientras que los valores resaltados en gris claro tienen recuentos altos. La Figura 36 representa un esquema para la detección de ARNm de IgG con cebadores específicos de genes. El ARNm de la cadena pesada de IgG se representa en el Paso 1 con la estructura VDJC. El método de preparación de la biblioteca de ARNm de cadena ligera de IgG es similar pero sin el segmento de región D corto. C-Rev: secuencia inversa específica de la región C; marcador-rev: cebador inverso de marcador específico de gen; MI-SI-Universal: secuencia de cebador que incluye códigos de barras de índice de muestra y molecular junto con una secuencia de cebador constante; ILMN R1: secuencia del cebador Illumina Read 1; ILMN R2: secuencia del cebador Illumina Read 2.
La Figura 37 muestra un esquema del enfoque de adaptador-ligadura para la preparación de bibliotecas. El ARNm de la cadena pesada de IgG se representa en el Paso 1 con la estructura VDJC. El método de preparación de la biblioteca de ARNm de cadena ligera de IgG es similar pero sin el segmento de región D corto. C-Rev: secuencia del cebador inverso específico de la región C; marcador-rev: secuencia inversa del marcador específico del gen; MI-SI-Universal: secuencia de cebador que incluye códigos de barras de índice de muestra y molecular junto con una secuencia de cebador constante; ILMN R1: secuencia del cebador Illumina Read 1; ILMN R2: secuencia del cebador Illumina Read 2.
La Figura 38 muestra que el receptor de células T (TCR) y los ARNm de marcadores genéticos se marcan con códigos de barras con marcadores moleculares (MI) y marcadores de muestra (SI) durante la transcripción inversa usando o una secuencia inversa de la región C de TCR o una cola de poli(A) para la captura de ARNm universal. Se realizan 2 PCR multiplex para enriquecer los objetivos usando cebadores específicos de genes y para unir adaptadores de secuenciación. Esta estrategia de preparación de la biblioteca puede amplificar la región determinante de la complementariedad 3 (CDR3) tanto de TCRa como de TCRp, que es una sección 'hipervariable' que abarca diferentes segmentos de TCR reorganizados.
La Figura 39 muestra genes ejemplares que pueden usarse en el panel de genes de TCR.
La Figura 40 muestra el repertorio de TCRa y TCRp identificado en una muestra de ARN de células T.
La Figura 41 muestra los resultados del análisis de componentes principales de células T activadas individuales. La Figura 42 muestra un protocolo ejemplar para RT-PCR de un solo paso para marcar el ARNm de TCR con un código de barras estocástico.
DESCRIPCIÓN DETALLADA
La divulgación proporciona métodos para estimar el número de objetivos en una muestra usando un código de barras estocástico específico de un gen. La divulgación proporciona métodos para generar un código de barras estocástico específico de un gen. La divulgación proporciona métodos para realizar códigos de barras estocásticos de una manera específica de genes. Por ejemplo, pueden generarse códigos de barras estocásticos específicos de genes mediante una realización ejemplar ilustrada en la Figura 1. Un oligonucleótido que comprende un adaptador de cebador universal 105 y una región de unión al objetivo específica de gen 110 puede ponerse en contacto con un objetivo 115. Puede realizarse una primera reacción de extensión extendiendo 120 el oligonucleótido para incorporar la secuencia del objetivo 115, generando de este modo una primera transcripción 121. Puede realizarse una segunda reacción de extensión en la que puede usarse un cebador específico del gen inverso 122 para generar una cadena complementaria 125 que incorpore el oligonucleótido que comprende el cebador específico del gen 110 y el adaptador del cebador universal 105. Un código de barras estocástico que comprende un adaptador de cebador universal 130 (o una secuencia que puede hibridar con un adaptador de cebador universal) puede ponerse en contacto con la transcripción 125 a través de la secuencia del adaptador de cebador universal 105. Puede realizarse una tercera extensión en la que se genera una transcripción 136 que comprende la secuencia objetivo, la secuencia del cebador del adaptador universal 105 y la secuencia de código de barras estocástica. Después de la tercera extensión, el exceso de códigos de barras estocásticos 130 puede eliminarse (por ejemplo, por exclusión por tamaño, electroforesis). Puede realizarse una reacción de amplificación con un cebador específico de gen 140 y un cebador de adaptador universal 150 que puede hibridar con el marcador universal (por ejemplo, secuencia de cebador de PCR universal). La amplificación puede producir un objetivo con código de barras estocástico 145, que puede usarse para identificar el número distinto de objetivos en la muestra. Puede haber una proporción 1:1 de asociación de códigos de barras estocásticos con un objetivo. De esta manera, el código de barras estocástico puede usarse para contar distintas apariciones de la especie objetivo.
En algunos casos, después de la tercera extensión, es posible que no se elimine el exceso de códigos de barras estocásticos 130. El exceso de códigos de barras estocásticos 130 puede no incorporarse en la reacción de códigos de barras estocásticos (por ejemplo, la tercera extensión) alterando la temperatura a la que se realiza la reacción. La reacción puede realizarse a una temperatura en la que un conjunto de oligonucleótidos puede hibridar con una transcripción y otro no. Por ejemplo, el cebador universal y el cebador específico del gen 122 puede tener una Tm de 70° C. Las secuencias del cebador del adaptador universal pueden tener una Tm de 50° C. Si la reacción de códigos de barras estocásticos se realiza a 70° C, puede evitar que el exceso de códigos de barras estocásticos 130 se aparee a los objetivos. Los cebadores de adaptadores universales pueden tener una Tm de por lo menos 30, 40, 50, 60, 70 u 80° C o más. Los cebadores de adaptadores universal pueden tener una Tm de como máximo 30, 40, 50, 60, 70 u 80C o más. El cebador universal y el cebador específico de gen (por ejemplo, cebadores de extensión) pueden tener una Tm de por lo menos 30, 40, 50, 60, 70 u 80° C o más. El cebador universal y el cebador específico de gen (por ejemplo, cebadores de extensión) pueden tener una Tm de como máximo 30, 40, 50, 60, 70 u 80° C o más. La Tm de los cebadores de adaptadores universales puede ser de por lo menos el 10, 20, 30,40, 50, 60, 70, 80, 90, 10, 110, 120, 130, 140, 150, 160, 170, 180, 190, o 200% o más que la Tm de los cebadores de extensión. La Tm de los cebadores de adaptadores universales puede ser como máximo del 10, 20, 30,40, 50, 60, 70, 80, 90, 10, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200% o más que la Tm de los cebadores de extensión.
Los métodos de la divulgación pueden proporcionar una manera de generar códigos de barras estocásticos específicos de genes. Por ejemplo, el método de generar un código de barras estocástico específico de un gen de la divulgación puede ser similar al descrito e ilustrado en la Figura 1. Los marcadores del código de barras estocástico (por ejemplo, el marcador de muestra (o el código de muestra, que puede usarse en la presente es intercambiable con el término "marcador de muestra") pueden estar en cualquier orden. En algunas realizaciones, todo o parte del código de barras estocástico puede estar incluido en el oligonucleótido 120 que comprende el cebador específico del gen 110 y el cebador de adaptador universal 105, por ejemplo, 3' al cebador de adaptador universal 105. Las Figuras 6 y 7 ilustran el método de la Figura 1 pero en donde el marcador molecular (Figura 6) o tanto el marcador molecular como el marcador de muestra (Figura 7) están incluidos en el oligonucleótido 120 que comprende el cebador específico del gen 110 y el adaptador de cebador universal 105.
En algunas realizaciones, la divulgación proporciona métodos para la amplificación específica del gen para múltiples amplicones del mismo gen. Por ejemplo, por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más amplicones en un gen pueden amplificarse (por ejemplo, en paralelo) usando los métodos específicos de genes de la divulgación. Pueden amplificarse como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más amplicones en un gen (por ejemplo, en paralelo) usando los métodos específicos del gen de la divulgación. En algunos casos, pueden amplificarse hasta 100 amplicones en un gen. Los amplicones pueden elegirse para llamadas de variantes específicas, como llamadas de SNP, que determinan la expresión específica del alelo.
Los métodos de la divulgación pueden usarse para identificar regiones VDJ de anticuerpos. La recombinación de VDJ, también conocida como recombinación somática, es un mecanismo de recombinación genética en las primeras etapas de la producción de inmunoglobulina (Ig) y el receptor de células T (TCR) del sistema inmunitario. La recombinación de VDJ puede combinar casi aleatoriamente segmentos de genes variables (V), diversos (D) y de unión (J). Debido a su aleatoriedad en la elección de diferentes genes, es capaz de codificar de manera diversa proteínas para emparejar antígenos de bacterias, virus, parásitos, células disfuncionales como células tumorales y pólenes.
La región VDJ puede comprender un gran locus de 3 Mb que comprende genes variables (V), genes de diversidad (D) y genes de unión (J). Estos son los segmentos que pueden participar en la recombinación de VDJ. Puede haber genes constantes que pueden no experimentar recombinación VDJ. El primer evento en la recombinación VDJ de este locus puede ser que uno de los genes D se reordena en uno de los genes J. Después de esto, uno de los genes V puede agregarse a este reordenamiento de DJ para formar el gen reordenado VDJ funcional que luego codifica el segmento variable de la proteína de cadena pesada. Ambos pasos pueden ser catalizados por enzimas recombinasas, que pueden eliminar el ADN intermedio.
Este proceso de recombinación tiene lugar de manera escalonada en las células B progenitoras para producir la diversidad requerida para el repertorio de anticuerpos. Cada célula B puede producir solo un anticuerpo. Esta especificidad puede lograrse mediante exclusión alélica de tal manera que el reordenamiento funcional de un alelo señale para prevenir la recombinación adicional del segundo alelo.
Definiciones
A menos que se defina lo contrario, todos los términos técnicos usados en la presente tienen el mismo significado que el entendido comúnmente un experto en la técnica en el campo al que pertenece esta divulgación. Como se usa en esta memoria descriptiva y las reivindicaciones adjuntas, las formas singulares "un", "uno" y "el" incluyen referencias en plural a menos que el contexto indique claramente lo contrario. Cualquier referencia a "o" en la presente se pretende que abarque "y/o" a menos que se indique lo contrario.
Como se usa en la presente, el término "asociado" o "asociado con" puede significar que dos o más especies son identificables por estar colocalizadas en un punto en el tiempo. Una asociación puede significar que dos o más especies están o estuvieron dentro de un recipiente similar. Una asociación puede ser una asociación informática en la que, por ejemplo, se almacena información referente a dos o más especies y puede usarse para determinar que una o más de las especies se colocalizaron en un momento determinado. Una asociación también puede ser una asociación física. En algunos casos, dos o más especies asociadas están "atadas", "unidas" o "inmovilizadas" entre sí o sobre una superficie sólida o semisólida común. Una asociación puede referirse a medios covalentes o no covalentes para unir marcadores a soportes sólidos o semisólidos como perlas. Una asociación pueden ser un enlace covalente entre un objetivo o un marcador.
Como se usa en la presente, el término "recuento digital" puede referirse a un método para estimar un número de moléculas objetivo en una muestra. El recuento digital puede incluir el paso de determinar una cantidad de marcadores únicos que se han asociado con los objetivos en una muestra. Esta metodología estocástica transforma el problema de contar moléculas de localizar e identificar moléculas idénticas a una serie de preguntas digitales de sí/no con respecto a la detección de un conjunto de marcadores predefinidos.
Como se usa en la presente, el término "marcador" o "marcadores" pueden referirse a códigos de ácidos nucleicos asociados con un objetivo dentro de una muestra. Un marcador puede ser, por ejemplo, un marcador de ácido nucleico. Un marcador puede ser un marcador completa o parcialmente amplificable. Un marcador puede ser un marcador que pueda secuenciarse total o parcialmente. Un marcador puede ser una porción de un ácido nucleico nativo que puede identificarse como distinto. Un marcador puede ser una secuencia conocida. Un marcador puede comprender una unión de secuencias de ácidos nucleicos, por ejemplo, una unión de una secuencia nativa y no nativa. Como se usa en la presente, el término "marcador" puede usarse indistintamente con los términos "índice", "etiqueta" o "marcador-etiqueta". Los marcadores pueden transmitir información. Por ejemplo, en varias realizaciones, los marcadores pueden usarse para determinar la identidad de una muestra, una fuente de una muestra, una identidad de una célula, y/o un objetivo.
Como se usa en la presente, el término "depósitos que no se agotan" puede referirse a un grupo de códigos de barras estocásticos compuestos por muchas marcadores diferentes. Un depósito que no se agota puede comprender un gran número de códigos de barras estocásticos diferentes de tal manera que cuando el depósito que no se agota está asociado con un grupo de objetivos, es probable que cada objetivo esté asociado con un código de barras estocástico único. La unicidad de cada molécula objetivo marcado puede determinarse mediante las estadísticas de elección aleatoria y depende del número de copias de moléculas objetivo idénticas en la colección en comparación con la diversidad de marcadores. El tamaño del conjunto resultante de moléculas objetivo marcadoras puede determinarse por la naturaleza estocástica del proceso de códigos de barras, y el análisis del número de códigos de barras estocásticos detectados permite calcular el número de moléculas objetivo presentes en la colección o muestra original. Cuando la proporción entre el número de copias de una molécula objetivo presente y el número de códigos de barras estocásticos únicos es baja, las moléculas objetivo marcados son muy únicas (es decir, hay una probabilidad muy baja de que más de una molécula objetivo haya sido marcada con un marcador dado).
Como se usa en la presente, el término "muestra" puede referirse a una composición que comprende objetivos. Las muestras adecuadas para el análisis mediante los métodos, dispositivos y sistemas divulgados incluyen células, tejidos, órganos u organismos.
Como se usa en la presente, el término "dispositivo de muestreo" o "dispositivo" puede referirse a un dispositivo que puede tomar una sección de una muestra y/o colocar la sección sobre un sustrato. Un dispositivo de muestra puede referirse, por ejemplo, a una máquina de clasificación de células activadas por fluorescencia (FACS), una máquina de clasificación de células, una aguja de biopsia, un dispositivo de biopsia, un dispositivo de corte de tejido, un dispositivo de microfluidos, una rejilla de cuchillas y/o un micrótomo.
Como se usa en la presente, el término "soporte sólido" puede referirse a superficies sólidas o semisólidas discretas a las que pueden unirse una pluralidad de códigos de barras estocásticos. Un soporte sólido puede abarcar cualquier tipo de esfera, bola, cojinete, cilindro sólido, poroso o hueco, u otra configuración similar compuesta de plástico, cerámica, metal o material polimérico (por ejemplo, hidrogel) sobre el que puede inmovilizarse un ácido nucleico (por ejemplo, covalente o no covalentemente). Un soporte sólido puede comprender una partícula discreta que puede ser esférica (por ejemplo, microesferas) o tener una forma no esférica o irregular, como cúbica, cuboide, piramidal, cilíndrica, cónica, oblonga o en forma de disco, y similares. Una pluralidad de soportes sólidos espaciados en una matriz puede no comprender un sustrato. Puede usarse un soporte sólido de manera intercambiable con el término "perla".
Un soporte sólido puede referirse a un "sustrato". Un sustrato puede ser un tipo de soporte sólido. Un sustrato puede referirse a una superficie continua sólida o semisólida sobre la que pueden realizarse los métodos de la divulgación. Un sustrato puede referirse a una matriz, un cartucho, un chip, un dispositivo y un portaobjetos, por ejemplo.
Como se usa en la presente, el término "marcador espacial" puede referirse a un marcador que puede asociarse con una posición en el espacio.
Como se usa en la presente, el término "código de barras estocástico" puede referirse a una secuencia de polinucleótidos que comprende marcadores. Un código de barras estocástico puede ser una secuencia de polinucleótidos que puede usarse para códigos de barras estocásticos. Los códigos de barras estocásticos pueden usarse para cuantificar objetivos dentro de una muestra. Los códigos de barras estocásticos pueden usarse para controlar los errores que pueden producirse después de que un marcador se haya asociado con un objetivo. Por ejemplo, puede usarse un código de barras estocástico para evaluar errores de secuenciación o amplificación. Un código de barras estocástico asociado con un objetivo puede denominarse objetivo de código de barras estocástico u objetivo de etiqueta de código de barras estocástico.
Como se usa en la presente, el término "código de barras estocástico específico de gen" puede referirse a una secuencia de polinucleótidos que comprende marcadores y una región de unión al objetivo que es específica del gen. Un código de barras estocástico puede ser una secuencia de polinucleótidos que puede usarse para códigos de barras estocásticos. Los códigos de barras estocásticos pueden usarse para cuantificar objetivos dentro de una muestra. Los códigos de barras estocásticos pueden usarse para controlar los errores que pueden producirse después de que un marcador se haya asociado con un objetivo. Por ejemplo, puede usarse un código de barras estocástico para evaluar errores de secuenciación o amplificación. Un código de barras estocástico asociado con un objetivo puede denominarse objetivo de código de barras estocástico u objetivo de etiqueta de código de barras estocástico.
Como se usa en la presente, el término "código de barras estocástico" puede referirse al marcador aleatorio (por ejemplo, código de barras) de ácidos nucleicos. Los códigos de barras estocásticos pueden utilizar una estrategia de Poisson recursiva para asociar y cuantificar marcadores asociados con objetivos. Como se usa en la presente, el término "código de barras estocástico" puede usarse indistintamente con "código de barras estocástico específico de gen".
Como se usa aquí, el término "objetivo" puede referirse a una composición que puede asociarse con un código de barras estocástico. Los objetivos ejemplares adecuados para el análisis mediante los métodos, dispositivos y sistemas divulgados incluyen oligonucleótidos, ADN, ARN, ARNm, microARN, ARNt y similares. Los objetivos pueden ser de cadena sencilla o doble. En algunas realizaciones, los objetivos pueden ser proteínas. En algunas realizaciones, los objetivos son lípidos.
El término "transcriptasas inversas" puede referirse a un grupo de enzimas que tienen actividad de transcriptasa inversa (es decir, que catalizan la síntesis de ADN a partir de una plantilla de ARN). En general, tales enzimas incluyen, pero no se limitan a, transcriptasa inversa retroviral, transcriptasa inversa de retrotransposones, transcriptasas inversas retroplasmidas, transcriptasas inversas de retrones, transcriptasas inversas bacterianas, transcriptasa inversa derivada de intrones del grupo II y mutantes, variantes o derivados de las mismas. Las transcriptasas inversas no retrovirales incluyen transcriptasas inversas de retrotransposones no LTR, transcriptasas inversas de retroplasmidos, transcriptasas inversas de retrones y transcriptasas inversas de intrones del grupo II. Ejemplos de transcriptasas inversas de intrones del grupo II incluyen la transcriptasa inversa de intrón de Lactococc s lactis Ll.LtrB, la transcriptasa inversa del intrón de Thermosynechococcus elongatus TeI4c, o la transcriptasa inversa del intrón de Geobacillus stearothermophilus GsI-IIC. Otras clases de transcriptasas inversas pueden incluir muchas clases de transcriptasas inversas no retrovirales (es decir, retrones, intrones del grupo II y retroelementos generadores de diversidad, entre otros).
El término "cambio de plantilla" puede referirse a la capacidad de una transcriptasa inversa para cambiar de una plantilla de secuencia de ácidos nucleicos inicial al extremo 3' de una nueva plantilla de secuencia de ácidos nucleicos que tiene poca o ninguna complementariedad con el extremo 3' del ácido nucleico sintetizado a partir de la plantilla inicial. Un ejemplo de cambio de plantilla es la capacidad de una transcriptasa inversa para cambiar de un sustrato de cebador/plantilla de secuencia de ácidos nucleicos inicial al extremo 3' de una nueva plantilla de secuencia de ácidos nucleicos que es poco o nada complementaria con el extremo 3' de la cadena del cebador de ácidos nucleicos. Pueden hacerse copias de ácidos nucleicos de un polinucleótido objetivo usando cambio de plantilla. El cambio de plantilla permite, por ejemplo, una copia de ADN que se preparará usando una transcriptasa inversa que cambia de una plantilla de secuencia de ácidos nucleicos inicial al extremo 3' de una nueva plantilla de secuencia de ácidos nucleicos que tiene poca o ninguna complementariedad con el extremo 3' del ADN sintetizado a partir de la plantilla inicial, permitiendo de este modo la síntesis de un producto de ADN continuo que enlaza directamente una secuencia adaptadora con una secuencia de oligonucleótidos objetivo sin ligación. El cambio de plantilla puede comprender la ligadura de un adaptador, una cola de homopolímero (por ejemplo, poliadenilación), cebador aleatorio o un oligonucleótido con el que puede asociarse la polimerasa.
Los términos "cebador de adaptador universal", "adaptador cebador universal" o "secuencia de adaptador universal" se usan indistintamente para referirse a una secuencia de nucleótidos que puede usarse para hibridar códigos de barras estocásticos para generar códigos de barras estocásticos específicos de genes. Una secuencia de adaptador universal puede, por ejemplo, ser una secuencia conocida que es universal en todos los códigos de barras estocásticos usados en los métodos de la divulgación. Por ejemplo, cuando se marcan múltiples objetivos usando los métodos divulgados en la presente, cada una de las secuencias específicas del objetivo puede enlazarse a la misma secuencia de adaptador universal. En algunas realizaciones, puede usarse más de una secuencia de adaptador universal en los métodos divulgados en la presente. Por ejemplo, cuando se marcan múltiples objetivos usando los métodos divulgados en la presente, por lo menos dos de las secuencias específicas del objetivo están enlazadas a diferentes secuencias adaptadoras universales. Un cebador de adaptador universal y su complemento pueden incluirse en dos oligonucleótidos, uno de los cuales comprende una secuencia específica del objetivo y el otro comprende un código de barras estocástico. Por ejemplo, una secuencia de adaptador universal puede ser parte de un oligonucleótido que comprende una secuencia específica del objetivo para generar una secuencia de nucleótidos que es complementaria a un ácido nucleico objetivo. Un segundo oligonucleótido que comprende un código de barras estocástico y una secuencia complementaria de la secuencia de adaptador universal puede hibridar con la secuencia de nucleótidos y generar un código de barras estocástico específico del objetivo. En algunas realizaciones, un cebador de adaptador universal tiene una secuencia que es diferente de un cebador de PCR universal usado en los métodos de esta divulgación.
Como se usa en la presente, el término "se une específicamente" se refiere a la especificidad de unión de una pareja de unión específica. La hibridación por una secuencia de ácidos nucleicos específica del objetivo de una secuencia de polinucleótidos objetivo particular en presencia de otros objetivos potenciales es una característica de tal unión. La unión específica implica dos moléculas de ácidos nucleicos diferentes en las que una de las moléculas de ácido nucleico hibrida específicamente con la segunda molécula de ácido nucleico a través de medios químicos o físicos. Las dos moléculas de ácidos nucleicos están relacionadas en el sentido de que su unión entre sí es tal que son capaces de distinguir su compañero de unión de otros constituyentes del ensayo que tienen características similares. Los miembros de la pareja de componentes de unión se denominan ligando y receptor (anti-ligando), miembro de la pareja de unión específica (SBP) y compañero de SBP, y similares.
"Polinucleótido" o "nucleótido", como se usa indistintamente en la presente, se refiere a polímeros de nucleótidos de cualquier longitud, e incluye ADN y ARN. Una secuencia de polinucleótidos o nucleótidos podría ser o de cadena doble o de cadena sencilla. Cuando una secuencia de polinucleótidos o nucleótidos es de cadena sencilla, podría referirse a cualquiera de las dos cadenas complementarias. Los nucleótidos pueden ser desoxirribonucleótidos, ribonucleótidos, nucleótidos o bases modificados y/o sus análogos, o cualquier sustrato que pueda incorporarse en un polímero mediante ADN o ARN polimerasa. Un polinucleótido puede comprender nucleótidos modificados, como nucleótidos metilados y sus análogos. Si la hay, la modificación de la estructura de nucleótidos puede impartirse antes o después del ensamblaje del polímero. La secuencia de nucleótidos puede estar interrumpida por componentes no nucleotídicos. Un polinucleótido puede modificarse adicionalmente después de la polimerización, como por conjugación con un componente de marcado. Otros tipos de modificaciones incluyen, por ejemplo, "caperuzas", sustitución de uno o más de los nucleótidos naturales con un análogo, modificaciones internucleotídicas como, por ejemplo, aquellas con enlaces no cargados (por ejemplo, metilfosfonatos, fosfotriésteres, fosfoamidatos, cabamatos, etc.) y con enlaces cargados (por ejemplo, fosforotioatos, fosforoditioatos, etc.), las que contienen fracciones colgantes como, por ejemplo, proteínas (por ejemplo, nucleasas, toxinas, anticuerpos, péptidos señal, ply-L-lisina, etc..), las que tienen intercaladores (por ejemplo, acridina, psoraleno, etc.), las que contienen quelantes (por ejemplo, metales, metales radiactivos, boro, metales oxidativos, etc.), las que contienen alquilantes, aquellas con enlaces modificados (por ejemplo, ácidos nucleicos alfa anoméricos, etc.), así como formas no modificadas del polinucleótidos. Además, cualquiera de los grupos hidroxilo presentes normalmente en los azúcares puede reemplazarse, por ejemplo, por grupos fosfonato, grupos fosfato, protegerse con grupos protectores estándar o activarse para preparar enlaces adicionales con nucleótidos adicionales, o puede conjugarse con soportes sólidos. El OH terminal 5' y 3' puede fosforilarse o sustituirse con aminas o fracciones de grupos protectores orgánicos de 1 a 20 átomos de carbono. También pueden derivatizarse otros hidroxilos a grupos protectores estándar. Los polinucleótidos también pueden contener formas análogas de azúcares ribosa o desoxirribosa que son generalmente conocidas en la técnica, incluyendo, por ejemplo, 2'-O-metil-2'-O-alilo, 2'-fluoroo 2'-azido-ribosa, análogos de azúcares carbocíclicos, azúcares a-anoméricos, azúcares epiméricos como arabinosa, xilosas o lixosas, azúcares de piranosa, azúcares de furanosa, sedoheptulosas, análogos acíclicos y análogos de nucleósidos abásicos como metil ribósido. Uno o más enlaces fosfodiéster pueden reemplazarse por grupos de enlace alternativos. Estos grupos de enlace alternativos incluyen, pero no se limitan a, realizaciones en las que el fosfato se reemplaza por P(O)S ("tioato"), P(S)S ("ditioato"), "(O)NR 2 (" amidato "), P(O)R, P(O)OR', CO o CH 2 ("formacetal"), en el que cada R o R' es independientemente H o alquilo (1-20 C) sustituido o no sustituido que contiene opcionalmente un enlace éter (-O--), arilo, alquenilo, cicloalquilo, cicloalquenilo o araldilo. No es necesario que todos los enlaces en un polinucleótido sean idénticos. La descripción anterior se aplica a todos los polinucleótidos a los que se hace referencia en la presente, incluyendo el ARN y el ADN.
"Oligonucleótido", como se usa en la presente, se refiere de manera general a polinucleótidos generalmente sintéticos, generalmente de cadena sencilla, cortos que tienen generalmente, pero no necesariamente, menos de aproximadamente 200 nucleótidos de longitud. Los términos "oligonucleótido" y "polinucleótido" no son mutuamente excluyentes. La descripción anterior para polinucleótidos es igualmente y completamente aplicable a oligonucleótidos.
Códigos de barras estocásticos
Un código de barras estocástico puede hacer referencia a una secuencia de polinucleótidos que puede usarse para marcar estocásticamente (por ejemplo, código de barras, etiqueta) un objetivo. Un código de barras estocástico puede comprender uno o más marcadores. Los marcadores ejemplares pueden incluir un marcador universal, un marcador celular, un marcador molecular, un marcador de muestra, un marcador de placa, un marcador espacial y/o un marcador preespacial. La Figura 22 ilustra un código de barras estocástico ejemplar con un marcador espacial de la divulgación. Por ejemplo, un código de barras estocástico 2204 puede comprender una amina 5' que puede enlazar el código de barras estocástico a un soporte sólido 2205.El código de barras estocástico puede comprender un marcador universal, un marcador de dimensión, un marcador espacial, un marcador celular y/o un marcador molecular. El marcador universal puede ser el marcador más 5'. El marcador molecular puede ser el marcador más 3'. El marcador espacial, el marcador de dimensión y el marcador celular pueden estar en cualquier orden. En algunos casos, el marcador universal, el marcador espacial, el marcador de dimensión, el marcador celular y el marcador molecular están en cualquier orden. El código de barras estocástico puede comprender una región de unión al objetivo. La región de unión al objetivo puede interactuar con un objetivo (por ejemplo, ácido nucleico, ARN, ARNm, ADN objetivo) en una muestra. Por ejemplo, una región de unión al objetivo puede comprender una secuencia de oligo d(T)s que puede interactuar con las colas poli-A de los ARNm. En algunos casos, dos cualquiera de los marcadores del código de barras estocástico (por ejemplo, marcador universal, marcador de dimensión, marcador celular, y marcador molecular) pueden estar separador por, o por aproximadamente, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, o 20 o más nucleótidos.
Un código de barras estocástico puede comprender uno o más marcadores universales. El uno o más marcadores universales pueden ser los mismos para todos los códigos de barras estocásticos en el conjunto de códigos de barras estocásticos unidos a un soporte sólido dado. En algunas realizaciones, el uno o más marcadores universales pueden ser los mismos para todos los códigos de barras estocásticos unidos a una pluralidad de perlas. En algunas realizaciones, un marcador universal puede comprender una secuencia de ácidos nucleicos que es capaz de hibridar con un cebador de secuenciación. Pueden usarse cebadores de secuenciación para secuenciar códigos de barras estocásticos que comprenden un marcador universal. Los cebadores de secuenciación (por ejemplo, cebadores de secuenciación universales) pueden comprender cebadores de secuenciación asociados con plataformas de secuenciación de alto rendimiento. En algunas realizaciones, un marcador universal puede comprender una secuencia de ácidos nucleicos que es capaz de hibridar con un cebador de PCR. En algunas realizaciones, el marcador universal puede comprender una secuencia de ácidos nucleicos que es capaz de hibridar con un cebador de secuenciación y un cebador de PCR. A la secuencia de ácidos nucleicos del marcador universal que es capaz de hibridar con un cebador de secuenciación o PCR puede hacerse referencia como sitio de unión del cebador. Un marcador universal puede comprender una secuencia que puede usarse para iniciar la transcripción del código de barras estocástico. Un marcador universal puede comprender una secuencia que puede usarse para la extensión del código de barras estocástico o una región dentro del código de barras estocástico. Un marcador universal puede tener por lo menos, o por lo menos aproximadamente, 1,2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Un marcador universal puede comprender por lo menos aproximadamente 10 nucleótidos. Un marcador universal puede tener como máximo, o como máximo aproximadamente, 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. En algunas realizaciones, un conector escindible o un nucleótido modificado puede ser parte de la secuencia del marcador universal para permitir que el código de barras estocástico se escinda del soporte. Como se usa en la presente, un marcador universal puede usarse indistintamente con "cebador de PCR universal".
Un código de barras estocástico puede comprender un marcador de dimensión. Un marcador de dimensión puede comprender una secuencia de ácidos nucleicos que proporciona información sobre una dimensión en la que se produjo el marcado estocástico. Por ejemplo, un marcador de dimensión puede proporcionar información sobre el momento en el que un objetivo se codificó estocásticamente con un código de barras. Un marcador de dimensión puede asociarse con un tiempo de marcado con código de barras estocástico en una muestra. Un marcador de dimensión puede activarse en el momento del marcado estocástico. Pueden activarse marcadores de diferentes dimensiones en diferentes momentos. El marcador de dimensión proporciona información sobre el orden en el que los objetivos, grupos de objetivos y/o muestras se codificaron estocásticamente con códigos de barras. Por ejemplo, una población de células puede marcarse estocásticamente con código de barras en la fase GO del ciclo celular. Las células pueden volver a pulsarse con códigos de barras estocásticos en la fase G1 del ciclo celular. Las células pueden volver a pulsarse con códigos de barras estocásticos en la fase S del ciclo celular, y así sucesivamente. Los códigos de barras estocásticos en cada pulso (por ejemplo, cada fase del ciclo celular), pueden comprender marcadores de diferentes dimensiones. De esta manera, el marcador de dimensión proporciona información sobre qué objetivos se marcaron en qué fase del ciclo celular. Los marcadores de dimensión pueden interrogar muchos tiempos biológicos diferentes. Los tiempos biológicos ejemplares pueden incluir, pero no se limitan a, el ciclo celular, la transcripción (por ejemplo, el inicio de la transcripción) y la degradación de la transcripción. En otro ejemplo, una muestra (por ejemplo, una célula, una población de células) puede marcarse estocásticamente antes y/o después del tratamiento con un fármaco y/o terapia. Los cambios en el número de copias de distintos objetivos pueden ser indicativos de la respuesta de la muestra al fármaco y/o la terapia.
Un marcador de dimensión puede ser activable. Un marcador de dimensión activable puede activarse en un momento específico. El activable puede activarse constitutivamente (por ejemplo, no apagarse). El marcador de dimensión activable puede activarse reversiblemente (por ejemplo, el marcador de dimensión activable puede encenderse y apagarse). El marcador de dimensión puede ser activable reversiblemente por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más veces. El marcador de dimensión puede ser activable reversiblemente por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más veces. El marcador de dimensión puede activarse con fluorescencia, luz, un evento químico (por ejemplo, escisión, ligación de otra molécula, adición de modificaciones (por ejemplo, pegilarse, sumoilarse, acetilarse, metilarse, desacetilarse, desmetilarse), un evento fotoquímico (por ejemplo, fotoenjaularse) e introducción de un nucleótido no natural.
El marcador de dimensión puede ser idéntico para todos los códigos de barras estocásticos unidos a un soporte sólido dado (por ejemplo, perlas), pero diferente para diferentes soportes sólidos (por ejemplo, perlas). En algunas realizaciones, por lo menos el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99% o 100% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender la misma marcador de dimensión. En algunas realizaciones, por lo menos el 60% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador de dimensión. En algunas realizaciones, por lo menos el 95% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador de dimensión.
Puede haber hasta 106 o más secuencias de marcador de dimensión únicas representadas en una pluralidad de soportes sólidos (por ejemplo, perlas). Un marcador de dimensión puede tener por lo menos aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Un marcador de dimensión puede tener como máximo aproximadamente 300, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 15, 12, 10, 9, 8, 7, 6, 5, 4 o menos o más nucleótidos de longitud. Un marcador de dimensión puede comprender entre aproximadamente 5 y aproximadamente 200 nucleótidos. Un marcador de dimensión puede comprender entre aproximadamente 10 y aproximadamente 150 nucleótidos. Un marcador de dimensión puede comprender entre aproximadamente 20 y aproximadamente 125 nucleótidos de longitud.
Un código de barras estocástico puede comprender un marcador espacial. Un marcador espacial puede comprender una secuencia de ácidos nucleicos que proporciona información sobre la orientación espacial de una molécula objetivo que está asociada con el código de barras estocástico. Un marcador espacial puede asociarse con una coordenada en una muestra. La coordenada puede ser una coordenada fija. Por ejemplo, puede fijarse una coordenada en referencia a un sustrato. Un marcador espacial puede estar en referencia a una cuadrícula bidimensional o tridimensional. Puede fijarse una coordenada en referencia a un punto de referencia. El punto de referencia puede ser identificable en el espacio. Un punto de referencia puede ser una estructura de la que puede obtenerse una imagen. Un punto de referencia puede ser una estructura biológica, por ejemplo, un punto de referencia anatómico. Un punto de referencia puede ser un punto de referencia celular, por ejemplo, un orgánulo. Un punto de referencia puede ser un punto de referencia no natural, como una estructura con un identificador identificable, como un código de color, código de barras, propiedad magnética, fluorescentes, radiactividad o un tamaño o forma únicos. Un marcador espacial puede asociarse con una partición física (por ejemplo, un pocillo, un recipiente o una gotita). En algunos casos, se usan varios marcadores espaciales juntos para codificar una o más posiciones en el espacio.
El marcador espacial puede ser idéntico para todos los códigos de barras estocásticos unidos a un soporte sólido dado (por ejemplo, perlas), pero diferente para diferentes soportes sólidos (por ejemplo, perlas). En algunas realizaciones, por lo menos el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99% o 100% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador espacial. En algunas realizaciones, por lo menos el 60% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador espacial. En algunas realizaciones, por lo menos el 95% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador espacial.
Puede haber hasta 106 o más secuencias de marcadores espaciales únicas representadas en una pluralidad de soportes sólidos (por ejemplo, perlas). Un marcador espacial puede tener por lo menos aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Un marcador espacial puede tener como máximo aproximadamente 300, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 15, 12, 10, 9, 8, 7, 6, 5, 4 o menos o más nucleótidos de longitud. Un marcador espacial puede comprender entre aproximadamente 5 y aproximadamente 200 nucleótidos. Un marcador espacial puede comprender entre aproximadamente 10 y aproximadamente 150 nucleótidos. Un marcador espacial puede comprender entre aproximadamente 20 y aproximadamente 125 nucleótidos de longitud.
Los códigos de barras estocásticos pueden comprender un marcador celular. Un marcador celular puede comprender una secuencia de ácidos nucleicos que proporciona información para determinar qué ácido nucleico objetivo se originó a partir de qué célula. En algunas realizaciones, el marcador celular es idéntico para todos los códigos de barras estocásticos unidos a un soporte sólido dado (por ejemplo, perla), pero diferente para diferentes soportes sólidos (por ejemplo, perlas). En algunas realizaciones, por lo menos el 60%, 70%, 80%, 85%, 90%, 95%, 97%, 99% o 100% de códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador celular. En algunas realizaciones, por lo menos el 60% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador celular. En alguna realización, por lo menos el 95% de los códigos de barras estocásticos en el mismo soporte sólido pueden comprender el mismo marcador celular.
Puede haber hasta 106 o más secuencias de marcadores celulares únicas representadas en una pluralidad de soportes sólidos (por ejemplo, perlas). Un marcador celular puede tener por lo menos aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Un marcador celular puede tener como máximo aproximadamente 300, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 15, 12, 10, 9, 8, 7, 6, 5, 4 o menos o más nucleótidos de longitud. Un marcador celular puede comprender entre aproximadamente 5 y aproximadamente 200 nucleótidos. Un marcador celular puede comprender entre aproximadamente 10 y aproximadamente 150 nucleótidos. Un marcador celular puede comprender entre aproximadamente 20 y aproximadamente 125 nucleótidos de longitud.
El marcador celular puede comprender además un conjunto único de subsecuencias de ácidos nucleicos de longitud definida, por ejemplo, de 7 nucleótidos cada una (equivalente al número de bits usados en algunos códigos de corrección de errores de Hamming), que están diseñadas para proporcionar capacidad de corrección de errores. El conjunto de subsecuencias de corrección de errores comprende 7 secuencias de nucleótidos que pueden diseñarse de tal manera que cualquier combinación de secuencias por pares en el conjunto muestre una "distancia genética" definida (o número de bases malapareadas), por ejemplo, un conjunto de subsecuencias de corrección de errores puede diseñarse para mostrar una distancia genética de 3 nucleótidos. En este caso, la revisión de las secuencias de corrección de errores en el conjunto de datos de secuencia para moléculas de ácidos nucleicos objetivo marcados (descritas más detalladamente a continuación) puede permitir detectar o corregir errores de secuenciación o amplificación. En algunas realizaciones, la longitud de las subsecuencias de ácidos nucleicos usadas para crear códigos de corrección de errores puede variar, por ejemplo, pueden tener una longitud de 3 nucleótidos, 7 nucleótidos, 15 nucleótidos o 31 nucleótidos. En algunas realizaciones, pueden usarse subsecuencias de ácidos nucleicos de otras longitudes para crear códigos de corrección de errores.
Los códigos de barras estocásticos pueden comprender un marcador molecular. Un marcador molecular puede comprender una secuencia de ácidos nucleicos que proporciona información de identificación para el tipo específico de especie de ácido nucleico objetivo hibridada con el código de barras estocástico. Un marcador molecular puede comprender una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica de la especie de ácido nucleico objetivo hibridada con el código de barras estocástico (por ejemplo, región de unión al objetivo). En algunas realizaciones, se une un conjunto diverso de marcadores moleculares a un soporte sólido dado (por ejemplo, perla). En algunas realizaciones, puede haber tantos como 105 o más secuencias de marcadores moleculares únicas unidas a un soporte sólido dado (por ejemplo, perla). En algunas realizaciones, puede haber hasta 104 o más secuencias de marcadores moleculares únicas unidas a un soporte sólido dado (por ejemplo, una perla). En algunas realizaciones, puede haber tantas como 103 o más secuencias de marcadores moleculares únicas unidas a un soporte sólido dado (por ejemplo, perla). En algunas realizaciones, puede haber tantas como 102 o más secuencias de marcadores moleculares únicas unidas a un soporte sólido dado (por ejemplo, perla). Un marcador molecular puede tener por lo menos aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Un marcador molecular puede tener como máximo aproximadamente 300, 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 15, 12, 10, 9, 8, 7, 6, 5, 4 o menos nucleótidos de longitud.
Los códigos de barras estocásticos pueden comprender una región de unión al objetivo. En algunas realizaciones, las regiones de unión objetivo pueden comprender una secuencia de ácidos nucleicos que hibrida específicamente con un objetivo (por ejemplo, ácido nucleico objetivo, molécula objetivo, por ejemplo, un ácido nucleico celular a analizar), por ejemplo, con una secuencia genética específica. En algunas realizaciones, una región de unión al objetivo puede comprender una secuencia de ácidos nucleicos que puede unirse (por ejemplo, hibridar) con una localización específica de un ácido nucleico objetivo específico. En algunas realizaciones, la región de unión al objetivo puede comprender una secuencia de ácidos nucleicos que es capaz de hibridación específica con un saliente de un sitio de restricción (por ejemplo, un saliente de extremo adhesivo de EcoRI). El código de barras estocástico puede luego ligarse a cualquier molécula de ácido nucleico que comprenda una secuencia complementaria al saliente del sitio de restricción.
En algunas realizaciones, una región de unión al objetivo puede comprender una secuencia de ácidos nucleicos objetivo no específica. Una secuencia de ácidos nucleicos objetivo no específica puede referirse a una secuencia que puede unirse a múltiples ácidos nucleicos objetivo, independientemente de la secuencia específica del ácido nucleico objetivo. Por ejemplo, la región de unión al objetivo puede comprender una secuencia multimérica aleatoria o una secuencia oligo-dT que hibrida con la cola poli-A en moléculas de ARNm. Una secuencia aleatoria de multímeros puede ser, por ejemplo, una secuencia aleatoria de dímeros, trímeros, cuatrámeros, pentámeros, hexámeros, septameros, octámeros, nonámeros, decámeros o multímeros superiores de cualquier longitud. En algunas realizaciones, la región de unión al objetivo es la misma para todos los códigos de barras estocásticos unidos a una perla determinada. En algunas realizaciones, las regiones de unión al objetivo para la pluralidad de códigos de barras estocásticos unidos a una perla dada pueden comprender dos o más secuencias de unión al objetivo diferentes. Una región de unión al objetivo puede tener por lo menos aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud. Una región de unión al objetivo puede tener como máximo aproximadamente 5, 10, 15, 20, 25, 30, 35, 40, 45, 50 o más nucleótidos de longitud.
Un código de barras estocástico puede comprender una propiedad de orientación que puede usarse para orientar (por ejemplo, alinear) los códigos de barras estocásticos. Un código de barras estocástico puede comprender una fracción para el enfoque isoeléctrico. Diferentes códigos de barras estocásticos pueden comprender diferentes puntos de enfoque isoeléctrico. Cuando estos códigos de barras estocásticos se introducen en una muestra, la muestra puede someterse a un enfoque isoeléctrico para orientar los códigos de barras estocásticos de una manera conocida. De esta forma, la propiedad de orientación puede usarse para desarrollar un mapa conocido de códigos de barras estocásticos en una muestra. Las propiedades de orientación ejemplares pueden incluir movilidad electroforética (por ejemplo, basada en el tamaño del código de barras estocástico), punto isoeléctrico, espín, conductividad y/o autoensamblaje. Por ejemplo, códigos de barras estocásticos que con una propiedad de orientación de autoensamblaje, pueden autoensamblarse en una orientación específica (por ejemplo nanoestructura de ácidos nucleicos) tras la activación.
Un código de barras estocástico puede comprender una propiedad de afinidad. Un marcador espacial puede comprender una propiedad de afinidad. Una propiedad de afinidad puede incluir una fracción química y/o biológica que puede facilitar la unión del código de barras estocástico a otra entidad (por ejemplo, receptor celular). Por ejemplo, una propiedad de afinidad puede comprender un anticuerpo. Un anticuerpo puede ser específico para una fracción específica (por ejemplo, receptor) en una muestra. Un anticuerpo puede guiar al código de barras estocástico a un tipo de célula o molécula específica. Los objetivos en y/o cerca del tipo de célula o molécula específico pueden marcarse estocásticamente. Una propiedad de afinidad también puede proporcionar información espacial además de la secuencia de nucleótidos del marcador espacial porque el anticuerpo puede guiar el código de barras estocástico a una localización específica. Un anticuerpo puede ser un anticuerpo terapéutico. Un anticuerpo puede ser un anticuerpo monoclonal. Un anticuerpo puede ser un anticuerpo policlonal. Un anticuerpo puede ser humanizado. Un anticuerpo puede ser quimérico. Un anticuerpo puede ser un anticuerpo desnudo. Un anticuerpo puede ser un anticuerpo de fusión.
Un anticuerpo puede referirse a una molécula de inmunoglobulina de longitud completa (es decir, de origen natural o formada por procesos recombinantes de fragmentos de genes de inmunoglobulina normales) (por ejemplo, un anticuerpo de IgG) o una porción inmunológicamente activa (es decir, que se une específicamente) de una molécula de inmunoglobulina, como un fragmento de anticuerpo.
Un anticuerpo puede ser un fragmento de anticuerpo. Un fragmento de anticuerpo puede ser una porción de un anticuerpo como F(ab')2, Fab', Fab, Fv, sFv y similares. Un fragmento de anticuerpo puede unirse al mismo antígeno que reconoce el anticuerpo de longitud completa. Un fragmento de anticuerpo puede incluir fragmentos aislados que consisten de las regiones variables de anticuerpos, como los fragmentos "Fv" que consisten de las regiones variables de las cadenas pesada y ligera y moléculas polipeptídicas de cadena sencilla recombinantes en las que las regiones variables ligeras y pesadas están conectadas por un conector peptídico ("proteínas scFv"). Los anticuerpos ejemplares pueden incluir, pero no se limitan a, anticuerpos para anticuerpos para células cancerosas, anticuerpos para virus, anticuerpos que se unen a receptores de la superficie celular (CD8, CD34, CD45) y anticuerpos terapéuticos.
Un código de barras estocástico puede comprender una región de unión al objetivo. Una región de unión al objetivo puede hibridar con un objetivo de interés. Por ejemplo, una región de unión al objetivo puede comprender un oligo dT que puede hibridar con ARNm que comprenden extremos poliadenilados. Una región de unión al objetivo puede ser específica de un gen. Por ejemplo, una región de unión al objetivo puede configurarse para hibridar con una región específica de un objetivo. Una región de unión al objetivo puede tener por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 2627, 28, 29 o 30 o más nucleótidos de longitud. Una región de unión al objetivo puede tener como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 2627, 28, 29 o 30 o más nucleótidos de longitud. Una región de unión al objetivo puede tener una longitud de 5-30 nucleótidos. Cuando un código de barras estocástico comprende una región de unión al objetivo específica del gen, puede hacerse referencia al código de barras estocástico como código de barras estocástico específico del gen.
Un código de barras estocástico puede comprender una cebador de adaptador universal. Un código de barras estocástico específico de un gen puede comprender un cebador de adaptador universal. Un cebador de adaptador universal puede referirse a una secuencia de nucleótidos que es universal en todos los códigos de barras estocásticos. Puede usarse un cebador de adaptador universal para construir códigos de barras estocásticos específicos de genes de la divulgación. Un cebador de adaptador universal puede tener por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 2627, 28, 29 o 30 o más nucleótidos de longitud.
Un cebador de adaptador universal puede tener como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 2627, 28, 29 o 30 o más nucleótidos de longitud. Un cebador de adaptador universal puede tener de 5 a 30 nucleótidos de longitud.
Método de elaboración de códigos de barras estocásticos específicos de genes
Algunas realizaciones divulgadas en la presente proporcionan métodos para marcar un ácido nucleico en una muestra, que comprenden: hibridar un objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la secuencia de adaptador universal, en donde uno o ambos del primer oligonucleótido y el tercer oligonucleótido comprenden parte de un código de barras estocástico; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico.
Algunas realizaciones divulgadas en la presente proporcionan métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una primera secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia de adaptador universal y una segunda secuencia específica del objetivo; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la primera secuencia de adaptador universal; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; hibridar dicha tercera secuencia de nucleótidos con un cuarto oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y la segunda secuencia de adaptador universal, en donde uno o ambos del tercer oligonucleótido y el cuarto oligonucleótido comprenden parte de un código de barras estocástico; extender dicho cuarto oligonucleótido para generar una cuarta secuencia de nucleótidos; y amplificar dicha cuarta secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de quintas secuencias de nucleótidos, en donde cada una de la pluralidad de las quintas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico. Algunas realizaciones divulgadas en la presente proporcionan métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica del objetivo y un sitio de unión para un primer cebador de amplificación; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una secuencia de adaptador universal y una segunda secuencia específica de objetivo; extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos; hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y una secuencia que se une específicamente a la secuencia de adaptador universal, en donde uno o ambos del segundo oligonucleótido y el tercer oligonucleótido comprenden parte de un código de barras estocástico; extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos, en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico.
Algunas realizaciones divulgadas en la presente proporcionan métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica de objetivo y una primera secuencia de cebador de amplificación en presencia de un segundo oligonucleótido que comprende una secuencia de adaptador universal; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos que comprende un complemento de la secuencia de adaptador universal; hibridar dicha primera secuencia de nucleótidos con un tercer oligonucleótido que comprende la secuencia de adaptador universal, un código de barras estocástico y un sitio de unión para un segundo cebador de amplificación; extender dicho tercer oligonucleótido para generar una segunda secuencia de nucleótidos; y amplificar dicha segunda secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de terceras secuencias de nucleótidos, en donde cada una de la pluralidad de las terceras secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico. Algunas realizaciones divulgadas en la presente proporcionan métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia específica de objetivo y un tercer oligonucleótido que comprende un código de barras estocástico y una secuencia que se une específicamente a la secuencia de adaptador universal; amplificar dicha primera secuencia de nucleótidos para generar una pluralidad de segundas secuencias de nucleótidos, en donde cada una de la pluralidad de las segundas secuencias de nucleótidos comprende dicho objetivo y dicho código de barras estocástico. Algunas realizaciones divulgadas en la presente proporcionan métodos para caracterizar una muestra, que comprenden: hibridar un primer objetivo en la muestra con un primer oligonucleótido que comprende una primera secuencia específica del objetivo y un primer código de barras estocástico, en donde el primer objetivo es un ARNm que codifica una cadena alfa o cadena beta de TCR; hibridar un segundo objetivo en la muestra con un segundo oligonucleótido que comprende una segunda secuencia específica del objetivo y un segundo código de barras estocástico; extender el primer oligonucleótido y el segundo oligonucleótido para incorporar el primer código de barras estocástico en el primer objetivo y el segundo código de barras estocástico en el segundo objetivo; e identificar las secuencias del primer objetivo y el segundo objetivo. Algunas realizaciones divulgadas en la presente proporcionan métodos para marcar un objetivo en una muestra para la cuantificación de dicho objetivo, que comprenden: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos; hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia específica del objetivo; extender dicho segundo oligonucleótido para generar una cadena complementaria de la primera secuencia de nucleótidos y una secuencia de nucleótidos de cadena doble; ligar un oligonucleótido de adaptador de cadena doble que comprende un sitio de unión para un primer cebador de amplificación a dicha secuencia de nucleótidos de cadena doble para formar una secuencia de nucleótidos ligada; amplificar dicha secuencia de nucleótidos ligada usando un primer cebador de amplificación y un segundo cebador de amplificación que comprende un código de barras estocástico para generar una pluralidad de una segunda secuencia de nucleótidos, en donde cada una de la pluralidad de la segunda secuencia de nucleótidos comprende dicho objetivo y dicho código de barras estocástico. Algunas realizaciones divulgadas en la presente proporcionan kits que comprenden: un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo; y un segundo oligonucleótido que comprende un código de barras estocástico y la secuencia de adaptador universal o el complemento de la misma.
En cualquiera de las realizaciones mencionadas anteriormente, la muestra puede ser una célula individual, como una célula B, una célula T, una célula cancerosa, etc., o una pluralidad de células. En cualquiera de las realizaciones mencionadas anteriormente, el objetivo puede ser un ADN como ADN genómico, o una molécula de ARNm. En cualquiera de las realizaciones mencionadas anteriormente, la molécula de ADN o ARNm puede codificar una cadena alfa o cadena beta del receptor de células T (TCR). En cualquiera de las realizaciones mencionadas anteriormente, la secuencia específica del objetivo puede unirse específicamente a la región C de una cadena alfa o cadena beta de TCR. En cualquiera de las realizaciones mencionadas anteriormente, los métodos pueden comprender amplificar una secuencia de nucleótidos usando un par de cebadores de PCR, como cebadores de PCR universales. En cualquiera de las realizaciones mencionadas anteriormente, un cebador de amplificación de PCR puede unirse específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de las mismas. En cualquiera de las realizaciones mencionadas anteriormente puede usarse, una secuencia específica del objetivo que se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de las mismas, para una de las reacciones de extensión o amplificación. En cualquiera de las realizaciones mencionadas anteriormente, parte o la totalidad del código de barras estocástico puede ser parte de cualquiera de los oligonucleótidos usados para cada una de los pasos de extensión. En cualquiera de las realizaciones mencionadas anteriormente, el código de barras estocástico puede comprender un marcador molecular, un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos. En cualquiera de las realizaciones mencionadas anteriormente, cualquiera de los oligonucleótidos puede unirse a un soporte sólido, como una perla. En cualquiera de las realizaciones mencionadas anteriormente, la muestra puede comprender una pluralidad del objetivo. En cualquiera de las realizaciones mencionadas anteriormente, cada uno de la pluralidad del objetivo puede marcarse con un código de barras estocástico distinto. En cualquiera de las realizaciones mencionadas anteriormente, los métodos pueden comprender contar el número de la pluralidad del objetivo contando los distintos códigos de barras estocásticos asociados con el objetivo. En cualquiera de las realizaciones mencionadas anteriormente, puede usarse cambio de plantillas para introducir una secuencia de adaptador universal o el complemento de la misma. En cualquiera de las realizaciones mencionadas anteriormente, los métodos pueden comprender marcar un segundo objetivo en la muestra con un segundo código de barras estocástico. En cualquiera de las realizaciones mencionadas anteriormente, el segundo objetivo puede seleccionarse del grupo que consiste de los genes enumerados en la Figura 39. En cualquiera de las realizaciones mencionadas anteriormente, el segundo código de barras estocástico comprende uno o más de un marcador molecular, un marcador universal, un marcador de dimensión y un marcador celular.
Los métodos de la divulgación pueden usar métodos de transcripción inversa, síntesis de ADNc de primera cadena y métodos de síntesis y/o amplificación de ADN de segunda cadena.
Los métodos de síntesis de ADN complementario de primera cadena relevantes para la presente divulgación pueden depender de la síntesis enzimática de ADN a partir de una plantilla de ácido nucleico, por ejemplo, ARN mensajero. A las enzimas capaces de catalizar la síntesis de ADN puede hacerse referencia como "ADN polimerasas dependientes de ARN", donde la plantilla de ácido nucleico es ARN y "ADN polimerasas dependientes de ADN", donde la plantilla es ADN (generalmente, sin embargo, las ADN polimerasas dependientes de ARN también son capaces de funcionar como polimerasas dependientes de ADN). Se puede confiar en las ADN polimerasas dependientes de ARN, como las transcriptasas inversas AMV o MMLV, para la síntesis enzimática de la primera cadena de ADN complementario a partir de una plantilla de ARN mensajero. Ambos tipos de ADN polimerasas pueden necesitar, además de un plantilla, un cebador polinucleotídico y desoxirribonucleótidos trifosfatos. La síntesis de ADN complementario de la primera cadena puede cebarse con un oligo-d (T), que consiste de 12-18 nucleótidos de longitud, que inicia la síntesis por apareamiento con el tracto poli-A en el extremo 3' terminal de las moléculas de ARN mensajero eucariótico. Pueden usarse otros cebadores, incluyendo cebadores oligonucleotídicos aleatorios cortos, para cebar la síntesis de ADN complementario. En algunos casos, pueden usarse cebadores específicos de genes para cebar la síntesis de ADNc. Durante la reacción de la polimerasa, el cebador puede extenderse, paso a paso, mediante la incorporación de desoxirribonucleótidos trifosfatos en el extremo 3' del cebador. Las ADN polimerasas pueden comprender magnesio y otros iones para estar presentes en los tampones de reacción en concentraciones bien definidas. Después de la síntesis de la primera cadena de ADN complementario, pueden emplearse varios métodos para reemplazar la plantilla de ARN con la segunda cadena de ADN. Uno de tales métodos puede implicar la eliminación del ARN mensajero con NaOH y el autocebado por la primera cadena de ADN complementario para la síntesis de la segunda cadena. Puede permitirse que el extremo 3' del ADN complementario de cadena sencilla forme una estructura en forma de horquilla que ceba la síntesis de la segunda cadena del ADN complementario por la ADN polimerasa I o la transcriptasa inversa de E. coli. Otro método puede implicar la síntesis de reemplazo de ADN complementario de la segunda cadena. Durante la síntesis de reemplazo, el producto de la síntesis de la primera cadena, un híbrido de ADN complementario: ARN mensajero, proporciona una plantilla y un cebador para una reacción de traducción de muescas en la que la enzima RNasa H produce muescas y huecos en la cadena de ARN mensajero. dando como resultado una serie de cebadores de ARN para la síntesis de la segunda cadena de ADN complementario con la enzima ADN polimerasa I de E. coli. Después de la síntesis de un ADN complementario de cadena doble, el ADN sintetizado puede introducirse en una célula huésped, por ejemplo, una cepa bacteriana, y replicarse por medio de un vector adecuado, como un vector de bacteriófago lambda. Tales métodos pueden implicar, por ejemplo, la adición de conectores polinucleotídicos sintéticos cortos que se ligan a los extremos del ADN complementario después de la síntesis de la segunda cadena. Los conectores pueden contener secuencias que pueden ser reconocidas por una endonucleasa de restricción apropiada, por ejemplo, EcoR I. Después de que los conectores se hayan ligado a los extremos del ADN complementario, pueden cortarse con la endonucleasa de restricción apropiada para generar secuencias de ADN cohesivas idénticas en ambos extremos del ADN complementario, facilitando de este modo la unión del ADN complementario a un vector bacteriófago lambda. Como los clones de ADN complementario de interés pueden contener sitios de restricción reconocidos por la endonucleasa de restricción, el ADN complementario puede tratarse con una metilasa, como EcoR I metilasa, antes de la ligación de los conectores sintéticos para proteger los sitios de restricción internos de la digestión posterior.
Los métodos de la divulgación pueden proporcionar una manera de generar códigos de barras estocásticos específicos de genes y/o métodos para marcado con códigos de barras estocásticos específicos de genes. Por ejemplo, el método de marcado con código de barras estocástico específico de gen de la divulgación puede ser similar al descrito e ilustrado en la Figura 1. En algunos casos, como se muestra en la Figura 2, la segunda extensión puede realizarse con un cebador inverso que comprende un cebador específico del gen inverso 122 enlazado a un segundo cebador universal (por ejemplo, un segundo cebador de PCR universal 205). Un segundo cebador de PCR universal puede ser similar a un marcador universal en el sentido de que puede comprender una secuencia que puede ser común entre los códigos de barras estocásticos. Puede usarse un segundo cebador de PCR universal para los métodos de amplificación y/o secuenciación de la divulgación. Un segundo cebador de PCR universal puede ser un marcador universal.
Los marcadores del código de barras estocástico (por ejemplo, marcador de muestra o código de muestra, que pueden usarse en la presente son intercambiables con el término "marcador de muestra") pueden estar en cualquier orden. La Figura 3 ilustra una realización ejemplar del método de generación de código de barras estocástico específico de gen de la divulgación, como se ilustra en la Figura 2, en donde la segunda extensión se realiza con un cebador específico de gen inverso enlazado con un segundo cebador universal y en donde el marcador molecular está 5' con respecto al marcador de la muestra. La Figura 2 ilustra el mismo método pero con el marcador de la muestra estando 5' del marcador molecular. También puede incluirse todo o parte del código de barras estocástico en el oligonucleótido que comprende el cebador de adaptador universal. Por ejemplo, los marcadores del código de barras estocástico pueden permutarse de tal manera que el código de barras molecular esté 3' con respecto al cebador del adaptador universal, como se muestra en la Figura 4. Por ejemplo, tanto el marcador de la muestra como el marcador molecular pueden estar 3' del cebador del adaptador universal, como se ilustra en la Figura 5.
La Figura 8 divulga un método para generar un código de barras estocástico específico de gen que utiliza dos secuencias de cebadores adaptadores universales. La molécula objetivo puede ponerse en contacto con una secuencia de cebador de adaptador universal directo (por ejemplo, primero) e inverso (por ejemplo, segundo). Las secuencias pueden amplificar el objetivo. Los códigos de barras estocásticos pueden asociarse con las secuencias del cebador de adaptador universal a través de sus propias secuencias que pueden ser complementarias a las secuencias del cebador del adaptador universal. Los códigos de barras estocásticos pueden comprender cualquier permutación de marcadores de la divulgación (por ejemplo, marcadores de muestra, marcadores moleculares). El objetivo puede amplificarse usando dos marcadores universales (por ejemplo, cebadores de PCR universales). La Figura 9 representa una realización alternativa en la que el marcador de la muestra y el marcador molecular han cambiado de posición. La Figura 9 representa una realización ejemplar, que no es limitativa, es decir, puede colocarse cualquier marcador en cualquier localización de la configuración divulgada en la Figura 9.
Los métodos para generar un código de barras estocástico específico de un gen pueden realizarse en los extremos 3' de las moléculas (por ejemplo, en sus sitios de poliadenilación). La Figura 10 ilustra una realización ejemplar del uso de un código de barras estocástico específico de un gen para marcar estocásticamente con código de barras de manera específica de un gen un objetivo. Un objetivo que comprende una cola poli-A puede hibridar con un polinucleótido que comprende un oligo dT y un marcador universal (por ejemplo, cebador de PCR universal). El oligo dT puede extenderse (por ejemplo, transcripción inversa) para incorporar la secuencia del objetivo. Un cebador específico de gen unido a un cebador de adaptador universal puede hibridar con la secuencia objetivo. Secuencial o simultáneamente, un código de barras estocástico que comprende una secuencia complementaria al cebador de adaptador universal puede hibridar con el cebador de adaptador universal y extenderse (por ejemplo, mediante extensión del cebador), generando de este modo un objetivo marcado estocásticamente con código de barras específico de gen. El objetivo marcado estocásticamente con código de barras puede amplificarse, secuenciarse, y/o contarse digitalmente de acuerdo con los métodos de la divulgación. La Figura 10 se entiende como una realización ejemplar. El método divulgado en la Figura 10 puede realizarse de manera similar con una secuencia de cebador específica de gen que reemplaza la secuencia de oligo dT representada. En los métodos mostrados en la Figura 10, los marcadores del código de barras estocástico pueden estar en cualquier orden. Por ejemplo, el marcador de la muestra puede estar 5' del marcador molecular. El marcador molecular puede estar 5' del marcador de la muestra, como se muestra en la Figura 11.
En algunos casos, puede usarse el cambio de plantilla para codificar con código de barras estocásticamente un objetivo usando un código de barras estocástico específico de un gen. La Figura 12 representa una realización ejemplar de cambio de plantilla. Un objetivo que comprende, por ejemplo, una cola poli-A puede ponerse en contacto con un polinucleótido que comprende un oligo dT y un marcador universal (por ejemplo, cebador de PCR universal. El oligo dT puede extenderse y añadirse una cola con una secuencia de oligonucleótidos (por ejemplo, CCC). Otra secuencia de oligonucleótidos que codifica un cebador de adaptador universal y una secuencia complementaria a la secuencia con cola (por ejemplo, GGG) pueden hibridar entre sí e incorporarse en la transcripción (por ejemplo, cambio de plantilla). Un código de barras estocástico que comprende una secuencia complementaria a la secuencia de cebador de adaptador universal puede hibridar con el cebador de adaptador universal y extenderse (por ejemplo, mediante la extensión del cebador), generando de este modo un objetivo marcado estocásticamente específico del gen. En los métodos que se muestran en la Figura 12, los marcadores del código de barras estocástico pueden estar en cualquier orden. Por ejemplo, el marcador molecular puede estar 5' del marcador de la muestra. El marcador de la muestra puede estar 5' del marcador molecular, como se muestra en la Figura 13.
En algunos casos, un cebador de adaptador universal puede ser un soporte para generar un código de barras estocástico específico de un gen. Por ejemplo, como se muestra en la Figura 14, un cebador de adaptador universal puede unirse a un soporte sólido. El cebador de adaptador universal puede ser un soporte para otro oligonucleótido que puede comprender una secuencia que puede hibridar con el soporte del cebador de adaptador universal y una secuencia específica de gen (por ejemplo, X, Y, Z). Una secuencia complementaria específica del gen (por ejemplo, X', Y', Z') puede ponerse en contacto con su compañero de unión afín (por ejemplo, X, Y, Z, respectivamente). X, Y y Z pueden extenderse para incorporar la secuencia de X', Y' y Z', generando de este modo una secuencia específica de gen unida a un cebador de adaptador universal.
En algunos casos, puede generarse un código de barras estocástico específico de gen hibridando un código de barras estocástico que comprende una secuencia de cebador de adaptador universal con un oligonucleótido que comprende una secuencia complementaria a la secuencia del cebador de adaptador universal (por ejemplo, de tal manera que puedan hibridar) y una secuencia que codifica un cebador específico de gen. Como se muestra en la Figura 15, puede realizarse una reacción de extensión para extender X, Y y Z sobre la secuencia de X', Y' y Z'. Las secuencias de X', Y' y Z' pueden unirse a una secuencia que puede hibridar con el cebador de adaptador universal del código de barras estocástico. La reacción de extensión puede incorporar la secuencia de X', Y' y Z' en el código de barras estocástico, generando de este modo un código de barras estocástico específico del gen. El código de barras estocástico específico del gen puede ponerse en contacto con uno o más objetivos en una muestra de acuerdo con los métodos de recuento y marcado con código de barras estocásticos de la divulgación. Los objetivos asociados con cada código de barras estocástico específico de gen pueden amplificarse y/o contarse para determinar el número de objetivos distintos de cada tipo en la muestra. En algunas realizaciones, el cebador de adaptador universal puede inmovilizarse sobre un soporte sólido, como una perla, y usarse como una atadura para inmovilizar un código de barras estocástico a través de hibridación con una secuencia complementaria a la secuencia del cebador de adaptador universal enlazada con el código de barras estocástico.
En algunos casos, la secuencia del adaptador universal puede estar 5' del marcador molecular (y cualquier otro marcador). Las Figuras 16 y 17 muestran una realización ejemplar de cómo un soporte sólido puede comprender una secuencia que puede hibridar con un cebador de adaptador universal de la divulgación, que puede ser parte de un código de barras estocástico (o viceversa). La secuencia que puede hibridar con el cebador de adaptador universal puede unirse a un soporte sólido. El código de barras estocástico puede comprender una región de unión específica de gen Y. Y', una secuencia complementaria de Y, puede hibridar con Y. Y puede extenderse para incorporar la secuencia de Y', generando de este modo un código de barras estocástico específico de gen. Puede usarse un cebador inverso, que comprende un segundo cebador de PCR universal (por ejemplo, un marcador universal) y una región complementaria a Y para generar una transcripción que comprende un código de barras estocástico, un adaptador de cebador universal, una región de unión específica de gen (Y), y un segundo cebador de PCR universal. El segundo cebador de secuencia universal como se representa en las Figuras 16 y 17 puede ser el cebador de secuencia universal como se ha descrito anteriormente, o proporcionar la misma función pero con una secuencia diferente. El cebador de secuenciación universal (o el segundo cebador de secuenciación universal) puede usarse para secuenciar la transcripción. El cebador de secuenciación universal puede no estar asociado en tándem (por ejemplo, directamente adyacente) a los marcadores de la divulgación (por ejemplo, marcador celular, marcador molecular, marcador de muestra). En los métodos mostrados en la Figura 16, los marcadores del código de barras estocástico pueden estar en cualquier orden. Por ejemplo, el marcador molecular puede estar 5' del marcador de la muestra. El marcador de la muestra puede estar 5' del marcador molecular, como se muestra en la Figura 17.
En algunas realizaciones, el método divulgado en las Figuras 16 y 17 puede realizarse con una secuencia de Y' que comprende el segundo cebador de PCR universal (por ejemplo, también puede ser el cebador de secuenciación universal divulgado anteriormente), como se muestra en las Figuras 18 y 19. El oligonucleótido Y' que comprende el segundo cebador de PCR universal puede ponerse en contacto con un código de barras estocástico que comprende una secuencia específica de gen Y, en donde Y puede hibridar con Y'. El resto del método se puede realizar como se describe para las Figuras 16 y 17. En los métodos mostrados en la Figura 18, los marcadores del código de barras estocástico pueden estar en cualquier orden. Por ejemplo, el marcador molecular puede estar 5' del marcador de la muestra. El marcador de la muestra puede estar 5' del marcador molecular, como se muestra en la Figura 19.
En algunos casos, puede usarse el cambio de plantillas para codificar estocásticamente con código de barras un objetivo con un código de barras estocástico específico del gen que puede realizarse de manera sustancialmente similar al método divulgado en la Figura 12. Como se muestra en la Figura 20, el cambio de plantillas puede realizarse usando un cebador de adaptador universal unido a un soporte sólido. Un objetivo que comprende, por ejemplo, una cola poli-A puede ponerse en contacto con un polinucleótido que comprende un oligo dT y un marcador universal (por ejemplo, cebador de PCR universal. El oligo dT puede extenderse y añadir una cola con una secuencia de oligonucleótidos (por ejemplo, CCC). Otra secuencia de oligonucleótidos que codifica un cebador de adaptador universal y una secuencia complementaria a la secuencia con cola añadida (por ejemplo, GGG) pueden hibridar e incorporarse en la transcripción (por ejemplo, cambio de plantilla). Un código de barras estocástico que comprende una secuencia complementaria a la secuencia del cebador de adaptador universal puede hibridar con el cebador de adaptador universal y extenderse (por ejemplo, mediante la extensión del cebador), generando de este modo un objetivo marcado estocásticamente con un gen específico. En los métodos que se muestran en la Figura 20, los marcadores del código de barras estocástico pueden estar en cualquier orden. El código de barras estocástico puede hibridar con el segundo cebador de adaptador universal. En algunos casos, el código de barras estocástico puede añadirse al soporte sólido como se ilustra en la Figura 21. En algunas realizaciones, el cebador del adaptador universal puede inmovilizarse en un soporte sólido, como una perla, y puede usarse como una atadura para inmovilizar un código de barras estocástico mediante la hibridación con una secuencia complementaria a la secuencia del cebador de adaptador universal unida al código de barras estocástico.
En todos los métodos descritos en las Figuras 1-21, el objetivo marcado estocásticamente con código de barras específico del gen puede someterse a cualquier otro método de la divulgación, como amplificación, secuenciación y/o recuento digital para determinar el número de copias únicas del objetivo en una muestra.
La Figura 29 ilustra una realización ejemplar de un método para reducir los dímeros de cebadores durante la amplificación. A la izquierda se muestra un método ejemplar para marcar estocásticamente con código de barras un producto amplificado (por ejemplo, amplificado en el primer paso). Pueden formarse dímeros de cebadores. A la derecha, hay una realización ejemplar de un método para reducir la formación de dímeros de cebadores. Puede introducirse un marcador molecular 3' del cebador de adaptador universal. Puede realizarse una reacción de amplificación por PCR que puede marcar con código de barras estocásticamente el objetivo, en lugar de marcar con códigos de barras copias amplificadas del objetivo. Los dímeros del cebador pueden reducirse mediante la introducción de un marcador molecular durante la primera reacción de amplificación. La Figura 30 muestra un método similar a la Figura 29, pero el cebador de amplificación comprende una secuencia universal (por ejemplo, compatible con secuenciadores de Illumina). El exceso de índices moleculares puede eliminarse antes de la amplificación, como se muestra en la Figura 30 a la derecha.
Soportes sólidos
Los códigos de barras estocásticos divulgados en la presente pueden unirse a un soporte sólido (por ejemplo, una perla, un sustrato). Como se usa en la presente, los términos "atado", "unido" e "inmovilizado" se usan indistintamente y pueden referirse a medios covalentes o no covalentes para unir códigos de barras estocásticos a un soporte sólido. Puede usarse cualquiera de una variedad de diferentes soportes sólidos como soportes sólidos para unir códigos de barras estocásticos presintetizados o para la síntesis en fase sólida in situ de códigos de barras estocásticos.
En algunos casos, un soporte sólido es una perla. Una perla puede abarcar cualquier tipo de esfera, bola, cojinete, cilindro u otra configuración similar sólido, poroso o hueco, compuesto de plástico, cerámica, metal o material polimérico sobre el que puede inmovilizarse un ácido nucleico (por ejemplo, covalentemente o no covalentemente). Una perla puede comprender una partícula discreta que puede ser esférica (por ejemplo, microesferas) o tener una forma no esférica o irregular, como cúbica, cuboide, piramidal, cilíndrica, cónica, oblonga o en forma de disco, y similares. Una perla puede tener forma no esférica.
Las perlas pueden comprender una variedad de materiales incluyendo, pero no limitados a, materiales paramagnéticos (por ejemplo, magnesio, molibdeno, litio y tántalo), materiales superparamagnéticos (por ejemplo, nanopartículas de ferrita (Fe3O4; magnetita)), materiales ferromagnéticos (por ejemplo, hierro, níquel, cobalto, algunas aleaciones de los mismos y algunos compuestos de metales de tierras raras), cerámica, plástico, vidrio, poliestireno, sílice, metilestireno, polímeros acrílicos, titanio, látex, sefarosa, agarosa, hidrogel, polímero, celulosa, nailon y cualquier combinación de los mismos.
El diámetro de las perlas puede ser de por lo menos aproximadamente 5 pm, 10 pm, 20 pm, 25 pm, 30 pm, 35 pm, 40 pm, 45 pm o 50 pm. El diámetro de las perlas puede ser como máximo de aproximadamente 5 pm, 10 pm, 20 pm, 25 pm, 30 pm, 35 pm, 40 pm, 45 pm o 50 pm.
Una perla puede unirse y/o incrustarse en un sustrato. Una perla puede unirse y/o incrustarse en un gel, hidrogel, polímero y/o matriz. La posición espacial de una perla dentro de un sustrato (por ejemplo, gel, matriz, andamiaje o polímero) puede identificarse usando el marcador espacial presente en el código de barras estocástico en la perla que puede servir como una dirección de localización.
Ejemplos de perlas pueden incluir, pero no se limitan a, perlas de estreptavidina, perlas de agarosa, perlas magnéticas, Dynabeads®, microperlas MACS®, perlas conjugadas de anticuerpos (por ejemplo, microperlas antiinmunoglobulina), perlas conjugadas con proteína A, perlas conjugadas con proteína G, perlas conjugadas con proteína A/G, perlas conjugadas con proteína L, perlas conjugadas con oligodT, perlas de sílice, perlas similares a sílice, microperlas anti-biotina, microperlas anti-fluorocromo y perlas magnéticas terminadas con carboxi BcMag™.
Una perla puede estar asociada con (por ejemplo, impregnada con) puntos cuánticos o tintes fluorescentes para hacerla fluorescente en un canal óptico de fluorescencia o en múltiples canales ópticos. Una perla puede estar asociada con óxido de hierro u óxido de cromo para hacerla paramagnética o ferromagnética. Las cuentas pueden ser identificables. Por ejemplo, pueden obtenerse imágenes de una perla usando una cámara. Una perla puede tener un código detectable asociado con la perla. Por ejemplo, una perla puede comprender un código de barras estocástico. Una perla puede cambiar de tamaño, por ejemplo, debido al hinchamiento en una solución orgánica o inorgánica. Una perla puede ser hidrófoba. Una perla puede ser hidrófila. Una perla puede ser biocompatible.
Puede visualizarse un soporte sólido (por ejemplo, una perla). El soporte sólido puede comprender una etiqueta de visualización (por ejemplo, tinte fluorescente). Un soporte sólido (por ejemplo, una perla) puede grabarse con un identificador (por ejemplo, un número). El identificador se puede visualizar mediante la obtención de imágenes de las perlas.
Un soporte sólido puede referirse a un material insoluble, semisoluble o insoluble. A un soporte sólido puede hacerse referencia como "funcionalizado" cuando incluye un conector, un andamiaje, un bloque de construcción u otra fracción reactiva unida al mismo, mientras que un soporte sólido puede estar "no funcionalizado" cuando carece de dicha fracción reactiva unida al mismo. El soporte sólido puede emplearse libre en solución, como en un formato de pocillo de microtitulación; en un formato de flujo continuo, como en una columna; o en una tira reactiva.
El soporte sólido puede comprender una membrana, papel, plástico, superficie recubierta, superficie plana, vidrio, portaobjetos, chip o cualquier combinación de los mismos. Un soporte sólido puede tomar la forma de resinas, geles, microesferas u otras configuraciones geométricas. Un soporte sólido puede comprender chips de sílice, micropartículas, nanopartículas, placas y matrices. Los soportes sólidos pueden incluir perlas (por ejemplo, gel de sílice, vidrio de poro controlado, perlas magnéticas, Dynabeads, resina Wang; resina Merrifield, perlas de Sephadex/Sepharose, perlas de celulosa, perlas de poliestireno, etc.), capilares, soportes planos como filtros de fibra de vidrio, superficies de vidrio, superficies metálicas (acero, oro, plata, aluminio, silicio y cobre), soportes de vidrio, soportes de plástico, soportes de silicona, chips, filtros, membranas, placas de micropocillos, portaobjetos o similares. materiales plásticos, incluidas placas o membranas multipocillo (por ejemplo, formadas de polietileno, polipropileno, poliamida, polivinilidendifluoruro), obleas, peines, alfileres o agujas (por ejemplo, conjuntos de alfileres adecuados para síntesis o análisis combinatorios) o perlas en una matriz de hoyos o pocillos de nanolitros de superficies planas como obleas (por ejemplo, obleas de silicio), obleas con hoyos con o sin fondos de filtro.
En algunos casos, los códigos de barras estocásticos de la divulgación pueden unirse a una matriz polimérica (por ejemplo, gel, hidrogel). La matriz polimérica puede penetrar en el espacio intracelular (por ejemplo, alrededor de orgánulos). La matriz polimérica puede bombearse por todo el sistema circulatorio.
Un soporte sólido puede ser una molécula biológica. Por ejemplo, un soporte sólido puede ser un ácido nucleico, una proteína, un anticuerpo, una histona, un compartimento celular, un lípido, un carbohidrato y similares. Los soportes sólidos que son moléculas biológicas pueden amplificarse, traducirse, transcribirse, degradarse y/o modificarse (por ejemplo, pegilarse, sumoilarse). Un soporte sólido que es una molécula biológica puede proporcionar información espacial y temporal además del marcador espacial que se une a la molécula biológica. Por ejemplo, una molécula biológica puede comprender una primera confirmación cuando no se modifica, pero puede cambiar a una segunda confirmación cuando se modifica. Las diferentes conformaciones pueden exponer los códigos de barras estocásticos de la divulgación a los objetivos. Por ejemplo, una molécula biológica puede comprender códigos de barras estocásticos que son inaccesibles debido al plegamiento de la molécula biológica. Tras la modificación de la molécula biológica (por ejemplo, acetilación), la molécula biológica puede cambiar de conformación para exponer los marcadores estocásticos. La cadencia de la modificación puede proporcionar otra dimensión de tiempo al método de marcado con código de barras estocástico de la divulgación.
En otro ejemplo, la molécula biológica que comprende los códigos de barras estocásticos de la divulgación puede localizarse en el citoplasma de una célula. Tras la activación, la molécula biológica puede moverse al núcleo, después de lo cual puede tener lugar el marcado con código de barras estocástico. De esta manera, la modificación de la molécula biológica puede codificar información adicional de espacio-tiempo para los objetivos identificados por los códigos de barras estocásticos.
Un marcador de dimensión puede proporcionar información sobre el espacio-tiempo de un evento biológico (por ejemplo, división celular). Por ejemplo, puede añadirse un marcador de dimensión a una primera célula, la primera célula puede dividirse generando una segunda célula hija, la segunda célula hija puede comprender todos, algunos o ninguno de los marcadores de dimensión. Los marcadores de dimensión pueden activardr en la célula original y en la célula hija. De esta manera, el marcador de dimensión puede proporcionar información sobre el tiempo del marcado con código de barras estocástico en distintos espacios.
Sustratos
Un sustrato puede referirse a un tipo de soporte sólido. Un sustrato puede referirse a un soporte sólido que puede comprender códigos de barras estocásticos de la divulgación. Un sustrato puede comprender una pluralidad de micropocillos. Un micropocillo puede comprender una pequeña cámara de reacción de volumen definido. Un micropocillo puede atrapar una o más células. Un micropocillo puede atrapar solo una célula. Un micropocillo puede atrapar uno o más soportes sólidos. Un micropocillo puede atrapar solo un soporte sólido. En algunos casos, un micropocillo atrapa una sola célula y un solo soporte sólido (por ejemplo, una perla).
Los micropocillos de la matriz pueden fabricarse en una variedad de formas y tamaños. Las geometrías de pocillo apropiadas pueden incluir, pero no se limitan a, cilíndricas, cónicas, hemisféricas, rectangulares o poliédricas (por ejemplo, geometrías tridimensionales compuestas por varias caras planas, por ejemplo, columnas hexagonales, columnas octagonales, pirámides triangulares invertidas, pirámides cuadradas invertidas, pirámides pentagonales invertidas, pirámides hexagonales invertidas o pirámides truncadas invertidas). Los micropocillos pueden comprender una forma que combina dos o más de estas geometrías. Por ejemplo, un micropocillo puede ser parcialmente cilíndrico, el resto teniendo la forma de un cono invertido. Un micropocillo puede incluir dos cilindros uno al lado del otro, uno de mayor diámetro (por ejemplo, que se corresponde aproximadamente al diámetro de las perlas) que el otro (por ejemplo que corresponde aproximadamente al diámetro de las células), que están conectadas por un canal vertical (es decir, paralelo a los ejes de los cilindros) que se extiende a lo largo de la longitud completa (profundidad) de los cilindros. La abertura del micropocillo puede estar en la superficie superior del sustrato. La abertura del micropocillo puede estar en la superficie inferior del sustrato. El extremo cerrado (o parte inferior) del micropocillo puede ser plano. El extremo cerrado (o parte inferior) del micropocillo puede tener una superficie curvada (por ejemplo, convexa o cóncava). La forma y/o el tamaño del micropocillo pueden determinarse en base a los tipos de células o soportes sólidos que quedarán atrapados dentro de los micropocillos.
Las dimensiones de los micropocillos pueden caracterizarse en términos del diámetro y la profundidad del pozo. Como se usa en la presente, el diámetro del micropocillo se refiere al círculo más grande que puede inscribirse dentro de la sección transversal plana de la geometría del micropocillo. El diámetro de los micropocillos puede variar de aproximadamente 1 vez a aproximadamente 10 veces el diámetro de las células o soportes sólidos que deben quedar atrapados dentro de los micropocillos. El diámetro de los micropocillos puede ser por lo menos 1 vez, por lo menos 1,5 veces, por lo menos 2 veces, por lo menos 3 veces, por lo menos 4 veces, por lo menos 5 veces o por lo menos 10 veces el diámetro de las células o soportes sólidos que deben quedar atrapados dentro de los micropocillos. El diámetro del micropocillo puede ser como máximo 10 veces, como máximo 5 veces, como máximo 4 veces, como máximo 3 veces, como máximo 2 veces, como máximo 1,5 veces, o como máximo 1 vez el diámetro de las células o los soportes sólidos que deben quedar atrapados dentro de los micropocillos. El diámetro de los micropocillos puede ser aproximadamente 2,5 veces el diámetro de las células o los soportes sólidos que deben quedar atrapados dentro de los micropocillos.
El diámetro de los micropocillos puede especificarse en términos de dimensiones absolutas. El diámetro de los micropocillos puede variar de aproximadamente 5 a aproximadamente 50 micrómetros. El diámetro del micropocillo puede ser de por lo menos 5 micrómetros, por lo menos 10 micrómetros, por lo menos 15 micrómetros, por lo menos 20 micrómetros, por lo menos 25 micrómetros, por lo menos 30 micrómetros, por lo menos 35 micrómetros, por lo menos 40 micrómetros, por lo menos 45 micrómetros, o por lo menos 50 micrómetros. El diámetro de los micropocillos puede ser de como máximo 50 micrómetros, como máximo 45 micrómetros, como máximo 40 micrómetros, como máximo 35 micrómetros, como máximo 30 micrómetros, como máximo 25 micrómetros, como máximo 20 micrómetros, como máximo 15 micrómetros, como máximo 10 micrómetros, o como máximo 5 micrómetros. El diámetro de los micropocillos puede ser de aproximadamente 30 micrómetros.
La profundidad de los micropocillos puede elegirse para proporcionar un atrapamiento eficaz de células y soportes sólidos. La profundidad de los micropocillos puede elegirse para proporcionar un intercambio eficaz de tampones de ensayo y otros reactivos contenidos dentro de los pocillos. La proporción de diámetro a altura (es decir, relación de aspecto) puede elegirse de tal manera que una vez que una célula y un soporte sólido se asienten dentro de un micropocillo, no se desplacen por el movimiento del fluido por encima del micropocillo. Las dimensiones del micropocillo pueden elegirse de tal manera que el micropocillo tenga espacio suficiente para acomodar un soporte sólido y una célula de varios tamaños sin que se desplace por el movimiento de fluido por encima del micropocillo. La profundidad de los micropocillos puede variar de aproximadamente 1 vez hasta aproximadamente 10 veces el diámetro de las células o los soportes sólidos que deben quedar atrapados dentro de los micropocillos. La profundidad de los micropocillos puede ser de por lo menos 1 vez, por lo menos 1,5 veces, por lo menos 2 veces, por lo menos 3 veces, por lo menos 4 veces, por lo menos 5 veces, o por lo menos 10 veces el diámetro de las células o soportes sólidos que deben ser atrapados dentro de los micropocillos. La profundidad de los micropocillos puede ser como máximo 10 veces, como máximo 5 veces, como máximo 4 veces, como máximo 3 veces, como máximo 2 veces, como máximo 1,5 veces o como máximo 1 vez el diámetro de las células o soportes sólidos que deben quedar atrapados dentro de los micropocillos. La profundidad de los micropocillos puede ser de aproximadamente 2,5 veces el diámetro de las células o de los soportes sólidos que deben quedar atrapados dentro de los micropocillos.
La profundidad de los micropocillos puede especificarse en términos de dimensiones absolutas. La profundidad de los micropocillos puede variar entre aproximadamente 10 y aproximadamente 60 micrómetros. La profundidad de los micropocillos puede ser de por lo menos 10 micrómetros, por lo menos 20 micrómetros, por lo menos 25 micrómetros, por lo menos 30 micrómetros, por lo menos 35 micrómetros, por lo menos 40 micrómetros, por lo menos 50 micrómetros o por lo menos 60 micrómetros. La profundidad del micropocillo puede ser como máximo de 60 micrómetros, como máximo 50 micrómetros, como máximo 40 micrómetros, como máximo 35 micrómetros, como máximo 30 micrómetros, como máximo 25 micrómetros, como máximo 20 micrómetros o como máximo 10 micrómetros. La profundidad de los micropocillos puede ser de aproximadamente 30 micrómetros.
El volumen de los micropocillos usados en los métodos, dispositivos y sistemas de la presente divulgación puede variar entre aproximadamente 200 micrómetros3 y aproximadamente 120.000 micrómetros3. El volumen de los micropocillos puede ser de por lo menos 200 micrómetros3, por lo menos 500 micrómetros3, por lo menos 1.000 micrómetros3, por lo menos 10.000 micrómetros3, por lo menos 25.000 micrómetros3, por lo menos 50.000 micrómetros3, por lo menos 100.000 micrómetros3, o por lo menos 120.000 micrómetros3. El volumen de los micropocillos puede ser de como máximo 120.000 micrómetros3, como máximo 100.000 micrómetros3, como máximo 50.000 micrómetros3, como máximo 25.000 micrómetros3, como máximo 10.000 micrómetros3, como máximo 1.000 micrómetros3, como máximo 500 micrómetros3 o como máximo 200 micrómetros3. El volumen de los micropocillos puede ser de aproximadamente 25.000 micrómetros3. El volumen de los micropocillos puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo, de aproximadamente 18.000 micrómetros3 a aproximadamente 30.000 micrómetros3).
Los volúmenes de los micropocillos usados en los métodos, dispositivos y sistemas de la presente divulgación pueden caracterizarse además en términos de la variación de volumen de un micropocillo a otro. El coeficiente de variación (expresado como porcentaje) para el volumen de los micropocillos puede variar entre aproximadamente el 1% y aproximadamente el 10%. El coeficiente de variación para el volumen de micropocillos puede ser de por lo menos el 1%, por lo menos el 2%, por lo menos el 3%, por lo menos el 4%, por lo menos el 5%, por lo menos el 6%, por lo menos el 7%, por lo menos el 8%, por lo menos el 9%, o por lo menos el 10%. El coeficiente de variación para el volumen de micropocillos puede ser como máximo del 10%, como máximo del 9%, como máximo del 8%, como máximo del 7%, como máximo del 6%, como máximo del 5%, como máximo del 4%, como máximo del 3%, como máximo del 2% o como máximo del 1%. El coeficiente de variación para el volumen de los micropocillos puede tener cualquier valor dentro de un intervalo comprendido por estos valores, por ejemplo, entre aproximadamente el 1,5% y aproximadamente el 6,5%. En algunas realizaciones, el coeficiente de variación del volumen de los micropocillos puede ser de aproximadamente el 2,5%.
La proporción del volumen de los micropocillos con el área de la superficie de las perlas (o con el área de la superficie de un soporte sólido al que pueden unirse oligonucleótidos de códigos de barras estocásticos) usada en los métodos, dispositivos y sistemas de la presente divulgación puede variar de aproximadamente 2,5 a aproximadamente 1.520 micrómetros. La proporción puede ser de por lo menos 2,5, por lo menos 5, por lo menos 10, por lo menos 100, por lo menos 500, por lo menos 750, por lo menos 1.000 o por lo menos 1.520. La proporción puede ser de como máximo 1.520, como máximo 1.000, como máximo 750, como máximo 500, como máximo 100, como máximo 10, como máximo 5 o como máximo 2,5. La proporción puede ser de aproximadamente 67,5. La proporción entre el volumen de los micropocillos y el área de la superficie de la perla (o el soporte sólido usado para la inmovilización) puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo, de aproximadamente 30 a aproximadamente 120).
Los pocillos de la matriz de micropocillos pueden disponerse en una matriz unidimensional, bidimensional o tridimensional. Puede lograrse una matriz tridimensional, por ejemplo, apilando una serie de dos o más matrices bidimensionales (es decir, apilando dos o más sustratos que comprenden matrices de micropocillos).
El patrón y la separación entre los micropocillos pueden elegirse para optimizar la eficiencia de atrapamiento de una sola célula y de un solo soporte sólido (por ejemplo, una perla) en cada pocillo, así como para maximizar el número de pocillos por unidad de área de la matriz. Los micropocillos pueden distribuirse de acuerdo con una variedad de patrones aleatorios o no aleatorios. Por ejemplo, pueden distribuirse de manera totalmente aleatoria a través de la superficie del sustrato de la matriz, o pueden disponerse en una rejilla cuadrada, una rejilla rectangular, una rejilla hexagonal o similar. La distancia de centro a centro (o separación) entre pocillos puede variar de aproximadamente 15 micrómetros a aproximadamente 75 micrómetros. En otras realizaciones, la separación entre pocillos es de por lo menos 15 micrómetros, por lo menos 20 micrómetros, por lo menos 25 micrómetros, por lo menos 30 micrómetros, por lo menos 35 micrómetros, por lo menos 40 micrómetros, por lo menos 45 micrómetros, por lo menos 50 micrómetros, por lo menos 55 micrómetros, por lo menos 60 micrómetros, por lo menos 65 micrómetros, por lo menos 70 micrómetros o por lo menos 75 micrómetros. La separación de los micropocillos puede ser de como máximo 75 micrómetros, como máximo 70 micrómetros, como máximo 65 micrómetros, como máximo 60 micrómetros, como máximo 55 micrómetros, como máximo 50 micrómetros, como máximo 45 micrómetros, como máximo 40 micrómetros, como máximo 35 micrómetros, como máximo 30 micrómetros, como máximo 25 micrómetros, como máximo 20 micrómetros o como máximo 15 micrómetros. La separación de los micropocillos puede ser de aproximadamente 55 micrómetros. La separación de los micropocillos puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo, de aproximadamente 18 micrómetros a aproximadamente 72 micrómetros).
La matriz de micropocillos puede comprender características de superficie entre los micropocillos que están diseñadas para ayudar a guiar las células y los soportes sólidos hacia los pocillos y/o evitar que se asienten sobre las superficies entre los pocillos. Los ejemplos de características superficiales adecuadas pueden incluir, pero no se limitan a, características superficiales abovedadas, estriadas o puntiagudas que rodean los pocillos o se extienden sobre la superficie entre pocillos.
El número total de pocillos en la matriz de micropocillos puede determinarse mediante el patrón y la separación de los pocillos y las dimensiones generales de la matriz. El número de micropocillos en la matriz puede variar entre aproximadamente 96 y aproximadamente 5.000.000 o más. El número de micropocillos en la matriz puede ser de por lo menos 96, por lo menos 384, por lo menos 1.536, por lo menos 5.000, por lo menos 10.000, por lo menos 25.000, por lo menos 50.000, por lo menos 75.000, por lo menos 100.000, por lo menos 500.000, por lo menos por lo menos 1.000.000, o por lo menos 5.000.000. El número de micropocillos en la matriz puede ser de como máximo 5.000.000, como máximo 1.000.000, como máximo 75.000, como máximo 50.000, como máximo 25.000, como máximo 10.000, como máximo 5.000, como máximo 1.536, como máximo 384 o como máximo 96 pocillos. El número de micropocillos en la matriz puede ser de aproximadamente 96. El número de micropocillos puede ser de aproximadamente 150.000. El número de micropocillos en la matriz puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo de aproximadamente 100 a 325.000).
Las matrices de micropocillos pueden fabricarse usando cualquiera de varias técnicas de fabricación. Los ejemplos de métodos de fabricación que pueden usarse incluyen, pero no se limitan a, técnicas de micromecanizado en masa como fotolitografía y grabado químico húmedo, grabado con plasma o grabado profundo con iones reactivos; micromoldeado y microgofrado; micromecanizado láser; Impresión 3D o cualquier otro proceso de fabricación de escritura directa usando materiales curables; y técnicas similares.
Las matrices de micropocillos pueden fabricarse a partir de varios materiales de sustrato. La elección del material puede depender de la elección de la técnica de fabricación y viceversa. Los ejemplos de materiales adecuados pueden incluir, pero no se limitan a, silicio, sílice fundida, vidrio, polímeros (por ejemplo, agarosa, gelatina, hidrogeles, polidimetilsiloxano (PDMS; elastómero), polimetilmetacrilato (PMMA), policarbonato (PC), polipropileno (PP), polietileno (PE), polietileno de alta densidad (HDPE), poliimida, polímeros olefínicos cíclicos (COP), copolímeros olefínicos cíclicos (COC), tereftalato de polietileno (PET), resinas epoxi, resinas a base de tioleno, metales o películas metálicas (por ejemplo, aluminio, acero inoxidable, cobre, níquel, cromo y titanio) y similares. Puede ser deseable un material hidrófilo para la fabricación de las matrices de micropocillos (por ejemplo para mejorar la humectabilidad y minimizar la unión no específica de células y otro material biológico). También pueden usarse materiales hidrófobos que pueden tratarse o recubrirse (por ejemplo, mediante tratamiento con plasma de oxígeno o injerto de una capa superficial de óxido de polietileno). El uso de materiales hidrófilos porosos para la fabricación de la matriz de micropocillos puede ser deseable para facilitar la evacuación/ventilación capilar de las burbujas de aire atrapadas en el dispositivo. T la matriz de micropocillos puede fabricarse a partir de un solo material. La matriz de micropocillos puede comprender dos o más materiales diferentes que se han unido entre sí o se han unido mecánicamente.
Las matrices de micropocillos pueden fabricarse usando sustratos de cualquiera de una variedad de tamaños y formas. Por ejemplo, la forma (o huella) del sustrato dentro del cual se fabrican los micropocillos puede ser de forma cuadrada, rectangular, circular o irregular. La huella del sustrato de la matriz de micropocillos puede ser similar a la de una placa de microtitulación. La huella del sustrato de la matriz de micropocillos puede ser similar a la de los portaobjetos de microscopio estándar, por ejemplo, de aproximadamente 75 mm de largo x 25 mm de ancho (aproximadamente 3’’ de largo x 1’’ de ancho), o de aproximadamente 75 mm de largo x 50 mm de ancho (aproximadamente 3’’ de largo x 2’’ de ancho). El espesor del sustrato dentro del cual se fabrican los micropocillos puede variar entre aproximadamente 0,1 mm de espesor y aproximadamente 10 mm de espesor, o más. El espesor del sustrato de la matriz de micropocillos puede ser de por lo menos 0,1 mm de espesor, por lo menos 0,5 mm de espesor, por lo menos 1 mm de espesor, por lo menos 2 mm de espesor, por lo menos 3 mm de espesor, por lo menos 4 mm de espesor, por lo menos 5 mm de espesor, por lo menos 6 mm de espesor, por lo menos 7 mm de espesor, por lo menos 8 mm de espesor, por lo menos 9 mm de espesor, o por lo menos mínimo 10 mm de espesor. El espesor del sustrato de la matriz de micropocillos puede ser de como máximo de 10 mm de espesor, como máximo de 9 mm de espesor, como máximo de 8 mm de espesor, como máximo de 7 mm de espesor, como máximo de 6 mm de espesor, como máximo de 5 mm de espesor, como máximo de 4 mm de espesor, como máximo 3 mm de espesor, como máximo 2 mm de espesor, como máximo 1 mm de espesor, como máximo 0,5 mm de espesor o como máximo 0,1 mm de espesor. El espesor del sustrato de la matriz de micropocillos puede ser de aproximadamente 1 mm de espesor. El espesor del sustrato de la matriz de micropocillos puede ser cualquier valor dentro de estos intervalos, por ejemplo, el espesor del sustrato de la matriz de micropocillos puede estar entre aproximadamente 0,2 mm y aproximadamente 9,5 mm.
Pueden usarse una variedad de tratamientos de superficie y técnicas de modificación de superficie para alterar las propiedades de las superficies de la matriz de micropocillos. Los ejemplos pueden incluir, pero no se limitan a, tratamientos con plasma de oxígeno para hacer que las superficies de los materiales hidrófobos sean más hidrófilas, el uso de técnicas de grabado en húmedo o en seco para suavizar (o hacer rugosas) las superficies de vidrio y silicio, adsorción o injerto de óxido de polietileno u otras capas de polímero (como plurónico), o albúmina de suero bovino a las superficies del sustrato para hacerlas más hidrófilas y menos propensas a la adsorción inespecífica de biomoléculas y células, el uso de reacciones de silano para injertar grupos funcionales químicamente reactivos a superficies de vidrio y silicio que de otro modo serían inertes etc. Pueden usarse técnicas de fotodesprotección para activar selectivamente grupos funcionales químicamente reactivos en localizaciones específicas en la estructura de la matriz, por ejemplo, la adición o activación selectivas de grupos funcionales químicamente reactivos como aminas primarias o grupos carboxilo en las paredes internas de los micropocillos puede usarse para acoplar covalentemente sondas de oligonucleótidos, péptidos, proteínas u otras biomoléculas a las paredes de los micropocillos. La elección del tratamiento de superficie o de la modificación de la superficie utilizada puede depender tanto del tipo de propiedad de la superficie que se desee como del tipo de material a partir del cual se fabrica la matriz de micropocillos.
Las aberturas de los micropocillos pueden sellarse, por ejemplo, durante los pasos de lisis celular para evitar la hibridación cruzada del ácido nucleico objetivo entre micropocillos adyacentes. Un micropocillo (o una matriz de micropocillos) puede sellarse o taparse usando, por ejemplo, una membrana flexible o una lámina de material sólido (es decir, una placa o platina) que se sujeta contra la superficie del sustrato de la matriz de micropocillos, o una perla adecuada, donde el diámetro de la perla es mayor que el diámetro del micropocillo.
Un sello formado usando una membrana flexible o una lámina de material sólido puede comprender, por ejemplo, membranas de nanoporos inorgánicas (por ejemplo, óxidos de aluminio), membranas de diálisis, portaobjetos de vidrio, cubreobjetos, películas elastoméricas (por ejemplo, PDMS) o películas de polímero hidrófilas (por ejemplo, una película de polímero recubierta con una película delgada de agarosa que se ha hidratado con tampón de lisis).
Los soportes sólidos (por ejemplo, perlas) usados para tapar los micropocillos pueden comprender cualquiera de los soportes sólidos (por ejemplo, perlas) de la divulgación. En algunos casos, los soportes sólidos son perlas de dextrano reticuladas (por ejemplo, Sephadex). El dextrano reticulado puede variar entre aproximadamente 10 micrómetros y aproximadamente 80 micrómetros. Las perlas de dextrano reticuladas usadas para tapar pueden tener un tamaño de 20 micrómetros a aproximadamente 50 micrómetros. En algunas realizaciones, las perlas pueden ser por lo menos aproximadamente un 10, 20, 30, 40, 50, 60, 70, 80 o 90% más grandes que el diámetro de los micropocillos. Las perlas usadas para tapar pueden ser como máximo aproximadamente un 10, 20, 30, 40, 50, 60, 70, 80 o 90% más grandes que el diámetro de los micropocillos.
El sello o la tapa pueden permitir que el tampón entre y salga del micropocillo, a la vez que evita que las macromoléculas (por ejemplo, ácidos nucleicos) migren fuera del pocillo. El sello o la tapa puede bloquear que una macromolécula de por lo menos aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14, 15, 16, 17, 18, 19 o 20 o más nucleótidos migre dentro o fuera del micropocillo. El sello o la tapa puede bloquear que una macromolécula de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 13, 14, 15, 16, 17, 18, 19 o 20 o más nucleótidos migre dentro o fuera del micropocillo.
Los soportes sólidos (por ejemplo, perlas) pueden distribuirse entre un sustrato. Los soportes sólidos (por ejemplo, perlas) pueden distribuirse entre los pocillos del sustrato, retirarse de los pocillos del sustrato o transportarse de otro modo a través de un dispositivo que comprende una o más matrices de micropocillos mediante centrifugación u otros medios no magnéticos. Puede precargarse un micropocillo de un sustrato con un soporte sólido. Un micropocillo de un sustrato puede contener por lo menos 1, 2, 3, 4 o 5, o más soportes sólidos. Un micropocillo de un sustrato puede contener como máximo 1, 2, 3, 4 o 5 o más soportes sólidos. En algunos casos, un micropocillo de un sustrato puede contener un soporte sólido.
Las células y perlas individuales pueden compartimentarse usando alternativas a los micropocillos, por ejemplo, un solo soporte sólido y una sola célula podrían confinarse dentro de una sola gotita en una emulsión (por ejemplo, en un sistema microfluídico digital de gotitas).
Las células podrían potencialmente estar confinadas dentro de perlas porosas que comprenden ellas mismas la pluralidad de códigos de barras estocásticos atados. Las células individuales y los soportes sólidos pueden compartimentarse en cualquier tipo de recipiente, microrecipiente, cámara de reacción, recipiente de reacción o similar.
El marcado con códigos de barras estocásticos de células individuales puede realizarse sin el uso de micropocillos. Los ensayos de marcado con códigos de barras estocásticos de células individuales puede realizarse sin el uso de ningún contenedor físico. Por ejemplo, el marcado con códigos de barras estocásticos sin un recipiente físico puede realizarse incrustando células y perlas muy próximas entre sí dentro de una capa de polímero o capa de gel para crear una barrera de difusión entre diferentes parejas de células/perlas. En otro ejemplo, el marcado con códigos de barras estocásticos sin un recipiente físico puede realizarse in situ, in vivo, en un tejido sólido intacto, en una célula intacta y/o subcelularmente.
Las matrices de micropocillos pueden ser un componente consumible del sistema de ensayo. Las matrices de micropocillos pueden reutilizarse. Las matrices de micropocillos pueden configurarse para su uso como un dispositivo autónomo para realizar ensayos manualmente, o pueden configurarse para comprender un componente fijo o extraíble de un sistema de instrumentos que proporcione la automatización total o parcial del procedimiento de ensayo. En algunas realizaciones de los métodos divulgados, las bibliotecas basadas en perlas de códigos de barras estocásticos pueden depositarse en los pocillos de la matriz de micropocillos como parte del procedimiento de ensayo. En algunas realizaciones, las perlas pueden precargarse en los pocillos de la matriz de micropocillos y proporcionarse al usuario como parte, por ejemplo, de un kit para realizar el marcado con códigos de barras estocásticos y recuento digital de objetivos de ácidos nucleicos.
En algunas realizaciones, pueden proporcionarse dos matrices de micropocillos emparejadas, una precargada con perlas que se mantienen en su lugar mediante un primer imán, y la otra para uso del usuario en la carga de células individuales. Después de la distribución de las células en la segunda matriz de micropocillos, las dos matrices pueden colocarse cara a cara y puede quitarse el primer imán mientras se usa un segundo imán para extraer las perlas de la primera matriz hacia los micropocillos correspondientes de la segunda matriz asegurando de este modo que las perlas descansen sobre las células en la segunda matriz de micropocillos y minimizando de este modo la pérdida por difusión de moléculas objetivo después de la lisis celular, a la vez que se maximiza la unión eficiente de moléculas objetivo a los códigos de barras estocásticos en la perla.
Sustratos tridimensionales
Una matriz tridimensional puede tener cualquier forma. Puede fabricarse un sustrato tridimensional de cualquier material usado en un sustrato de la divulgación. En algunos casos, un sustrato tridimensional comprende un origami de ADN. Las estructuras de origami de ADN incorporan ADN como material de construcción para hacer formas a nanoescala. El proceso de origami de ADN puede implicar el plegado de una o más cadenas largas de ADN de "andamiaje" en una forma particular usando una pluralidad de cadenas de ADN grapadas diseñadas racionalmente. Las secuencias de las cadenas grapadass pueden diseñarse de manera que hibriden con porciones particulares de las cadenas del andamiaje y, al hacerlo, forzar las cadenas del andamiaje a una forma particular. El origami de ADN puede incluir una cadena de andamiaje y una pluralidad de cadenas básicas diseñadas racionalmente. La cadena de andamiaje puede tener cualquier secuencia suficientemente no repetitiva.
Las secuencias de las cadenas grapadas pueden seleccionarse de tal manera que el origami de ADN tenga por lo menos una forma a la que puedan unirse marcadores estocásticos. En algunas realizaciones, el origami de ADN puede tener cualquier forma que tenga por lo menos una superficie interior y por lo menos una superficie exterior. Una superficie interior puede ser cualquier área de la superficie del origami de ADN que se evita que interactúe estéricamente con la superficie de una muestra, mientras que una superficie exterior es cualquier área de la superficie del origami de ADN que no se evita que interactúe estéricamente con la superficie de una muestra. En algunas realizaciones, el origami de ADN tiene una o más aberturas (por ejemplo, dos aberturas), de tal manera que las partículas (por ejemplo, soportes sólidos) pueden acceder a una superficie interior del origami de ADN. Por ejemplo, en ciertas realizaciones, el origami de ADN tiene una o más aberturas que permiten que partículas de menos de 10 micrómetros, 5 micrómetros, 1 micrómetro, 500 nm, 400 nm, 300 nm, 250 nm, 200 nm, 150 nm, 100 nm, 75 nm, 50 nm, 45 nm o 40 nm contacten con una superficie interna del origami de ADN.
El origami de ADN puede cambiar de forma (conformación) en respuesta a uno o más estímulos ambientales determinados. Por tanto, un área del origami de ADN puede ser una superficie interna cuando el origami de ADN adquiere algunas conformaciones, pero puede ser una superficie externa cuando el dispositivo adquiere otras conformaciones. En algunas realizaciones, el origami de ADN puede responder a ciertos estímulos ambientales adoptando una nueva conformación.
En algunas realizaciones, las cadenas grapadas del origami de ADN pueden seleccionarse de tal manera que el origami de ADN tenga sustancialmente forma de barril o tubo. Las grapas del origami de ADN pueden seleccionarse de tal manera que la forma de barril esté cerrada en ambos extremos o esté abierta en uno o ambos extremos, permitiendo de este modo que las partículas entren en el interior del barril y accedan a su superficie interior. En ciertas realizaciones, la forma de barril del origami de ADN puede ser un tubo hexagonal.
En algunas realizaciones, las cadenas grapadas del origami de ADN pueden seleccionarse de tal manera que el origami de ADN tenga un primer dominio y un segundo dominio, en donde el primer extremo del primer dominio está unido al primer extremo del segundo dominio por una o más bisagras de ADN de cadena sencilla, y el segundo extremo del primer dominio está unido al segundo dominio del segundo dominio mediante uno o más cierres moleculares. La pluralidad de grapas puede seleccionarse de tal manera que el segundo extremo del primer dominio se separe del segundo extremo del segundo dominio si todos los cierres moleculares entran en contacto con sus respectivos estímulos externos. Los cierres pueden formarse a partir de dos o más soportes de grapas, que incluyen por lo menos una cadena de grapas que tiene por lo menos un dominio de unión al estímulo que puede unirse a un estímulo externo, como un ácido nucleico, un lípido o una proteína, y por lo menos otra cadena grapada que tiene por lo menos un dominio de cierre que se une al dominio de unión al estímulo. La unión del dominio de unión al estímulo al dominio de cierre respalda la estabilidad de una primera conformación del ADN origami.
Los marcadores espaciales pueden administrarse a una muestra en tres dimensiones. Por ejemplo, una muestra puede asociarse con una matriz, en donde la matriz tiene marcadores espaciales distribuidos o distribuibles en tres dimensiones. Una matriz tridimensional puede ser un andamiaje, un sustrato poroso, un gel, una serie de canales o similares.
Puede asociarse un patrón tridimensional de marcadores espaciales con una muestra inyectando las muestras en localizaciones conocidas con la muestra, por ejemplo, usando un robot. Puede usarse una sola aguja para inyectar en serie marcadores espaciales a diferentes profundidades en una muestra. Una matriz de agujas puede inyectar marcadores espaciales a diferentes profundidades para generar una distribución tridimensional de marcadores.
En algunos casos, un soporte sólido tridimensional puede ser un dispositivo. Por ejemplo, un dispositivo de matriz de agujas (por ejemplo, un dispositivo de matriz de agujas de biopsia) puede ser un sustrato. Los códigos de barras estocásticos de la divulgación pueden unirse al dispositivo. La colocación del dispositivo en y/o sobre una muestra puede acercar los códigos de barras estocásticos de la divulgación a los objetivos dentro y/o sobre la muestra. Las diferentes partes del dispositivo pueden tener códigos de barras estocásticos con diferentes marcadores espaciales. Por ejemplo, en un dispositivo de matriz de agujas, cada aguja del dispositivo puede estar recubierta con códigos de barras estocásticos con diferentes marcadores espaciales en cada aguja. De esta manera, los marcadores espaciales pueden proporcionar información sobre la localización de los objetivos (por ejemplo, la localización en la orientación de la matriz de agujas).
Síntesis de códigos de barras estocásticos sobre soportes y sustratos sólidos
Un código de barras estocástico puede sintetizarse en un soporte sólido (por ejemplo, una cuenta). Los códigos de barras estocásticos presintetizados (por ejemplo, que comprenden la amina 5' que puede enlazar con el soporte sólido) pueden unirse a soportes sólidos (por ejemplo, perlas) a través de cualquiera de una variedad de técnicas de inmovilización que implican pares de grupos funcionales en el soporte sólido y el código de barras estocástico. El código de barras estocástico puede comprender un grupo funcional. El soporte sólido (por ejemplo, perla) puede comprender un grupo funcional. El grupo funcional de código de barras estocástico y el grupo funcional de soporte sólido pueden comprender, por ejemplo, biotina, estreptavidina, amina o aminas primarias, carboxilo o caboxilos, hidroxilo o hidroxilos, aldehído o aldehídos, cetona o cetonas y cualquier combinación de los mismos. Un código de barras estocástico puede atase a un soporte sólido, por ejemplo, mediante acoplamiento (por ejemplo, usando 1-Etil-3-(3-dimetilaminopropil)carbodiimida) un grupo amino 5' en el código de barras estocástico al grupo carboxilo del soporte sólido funcionalizado. Los códigos de barras estocásticos no acoplados residuales pueden eliminarse de la mezcla de reacción realizando varios pasos de enjuague. En algunas realizaciones, el código de barras estocástico y el soporte sólido se unen indirectamente mediante moléculas conectoras (por ejemplo, moléculas de hidrocarburo funcionalizadas cortas o moléculas de óxido de polietileno) usando químicas de unión similares. Los conectores pueden ser conectores escindibles, por ejemplo conectores lábiles a ácido o conectores fotoescindibles.
Los códigos de barras estocásticos pueden sintetizarse sobre soportes sólidos (por ejemplo, perlas) usando cualquiera de varias técnicas de síntesis de oligonucleótidos en fase sólida, como síntesis de fosfodiéster, síntesis de fosfotriéster, síntesis de triéster de fosfito y síntesis de fosforamidita. Los nucleótidos individuales pueden acoplarse de manera escalonada al código de barras estocástico atado en crecimiento. Puede acoplarse una secuencia (o bloque) corta y presintetizada de varios oligonucleótidos al código de barras estocástico atado en crecimiento.
Los códigos de barras estocásticos pueden sintetizarse intercalando reacciones de acoplamiento por pasos o bloques con una o más rondas de síntesis de grupo dividido, en las que el grupo total de perlas de síntesis se divide en varios grupos individuales más pequeños que luego se someten a una reacción de acoplamiento diferente, seguido de recombinación y mezclado de los grupos individuales para aleatorizar la secuencia de código de barras estocástica en crecimiento en el grupo total de perlas. La síntesis de grupo dividido es un ejemplo de un proceso de síntesis combinatoria en el que se sintetiza un número máximo de compuestos químicos usando un número mínimo de pasos de acoplamiento químico. La diversidad potencial de la biblioteca de compuestos creada de este modo está determinada por el número de bloques de construcción únicos (por ejemplo, nucleótidos) disponibles para cada paso de acoplamiento, y el número de pasos de acoplamiento usados para crear la biblioteca. Por ejemplo, una síntesis de grupo dividido que comprende 10 rondas de acoplamiento usando 4 nucleótidos diferentes en cada paso proporcionará 410 = 1.048.576 secuencias de nucleótidos únicas. En algunas realizaciones, la síntesis de grupo dividido puede realizarse usando métodos enzimáticos como reacciones de extensión o ligación de polimerasa en lugar de acoplamiento químico. Por ejemplo, en cada ronda de una reacción de extensión de polimerasa de grupo dividido, los extremos 3' de los códigos de barras estocásticos atados a perlas en un grupo dado pueden hibridar con los extremos 5' de un conjunto de cebadores semialeatorios, por ejemplo, cebadores que tienen una estructura de 5'-(M)k-(X)i-(N)j-3', donde (X)i es una secuencia aleatoria de nucleótidos que tiene i nucleótidos de longitud (el conjunto de cebadores comprendiendo todas las combinaciones posibles de (X)i), (N)j es un nucleótido específico (o serie de j nucleótidos) y (M)k es un nucleótido específico (o serie de k nucleótidos), en donde se añade un desoxirribonucleótido trifosfato (dNTP) diferente a cada grupo y se incorpora a los oligonucleótidos atados por la polimerasa.
El número de códigos de barras estocásticos conjugados o sintetizados en un soporte sólido puede comprender por lo menos 100, 1000, 10000 o 1000000 o más códigos de barras estocásticos. El número de códigos de barras estocásticos conjugados o sintetizados en un soporte sólido puede comprender como máximo 100, 1000, 10000 o 1000000 o más códigos de barras estocásticos. El número de oligonucleótidos conjugados o sintetizados en un soporte sólido, como una perla, puede ser por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 veces mayor que el número de ácidos nucleicos objetivo en una célula. El número de oligonucleótidos conjugados o sintetizados en un soporte sólido, como una perla, puede ser como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 veces mayor que el número de ácidos nucleicos objetivo en una célula. Por lo menos el 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100% del código de barras estocástico puede estar unido por un ácido nucleico objetivo. Como máximo el 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100% del código de barras estocástico puede estar unido por un ácido nucleico objetivo. Por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más ácidos nucleicos objetivo diferentes pueden ser capturados por el código de barras estocástico en el soporte sólido. Como máximo, 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más ácidos nucleicos objetivo diferentes pueden ser capturados por el código de barras estocástico en el soporte sólido.
Métodos de marcado con códigos de barras estocásticos
La divulgación proporciona métodos para estimar el número de objetivos distintos en localizaciones distintas en una muestra física (por ejemplo, tejido, órgano, tumor, célula). Los métodos pueden comprender colocar los códigos de barras estocásticos muy cerca de la muestra, lisar la muestra, asociar distintos objetivos con los códigos de barras estocásticos, amplificar los objetivos y/o contar digitalmente los objetivos. El método puede comprender además analizar y/o visualizar la información obtenida de los marcadores espaciales en los códigos de barras estocásticos. La Figura 23 ilustra una realización ejemplar del método de marcado con códigos de barras estocásticos de la divulgación. Una muestra (por ejemplo, sección de una muestra, segmento fino, y célula) puede ponerse en contacto con un soporte sólido que comprende un código de barras estocástico. Los objetivos de la muestra pueden asociarse con los códigos de barras estocásticos. Los soportes sólidos pueden recogerse. La síntesis de ADNc puede realizarse sobre el soporte sólido. La síntesis de ADNc puede realizarse a partir del soporte sólido. La síntesis de ADNc puede incorporar la información del marcador de los marcadores en el código de barras estocástico en la nueva molécula objetivo de ADNc que se está sintetizando, generando de este modo una molécula de código de barras objetivo. Las moléculas de códigos de barras objetivo pueden amplificarse usando PCT. La secuencia de los objetivos y los marcadores del código de barras estocástico en la molécula de código de barras objetivo puede determinarse mediante métodos de secuenciación.
Poner en contacto una muestra y un código de barras estocástico
Una muestra que comprende, por ejemplo, una célula, un órgano o una sección delgada de tejido, puede ponerse en contacto con códigos de barras estocásticos. Los soportes sólidos pueden flotar libremente. Los soportes sólidos pueden incrustarse en una matriz semisólida o sólida. Los códigos de barras estocásticos pueden no estar asociados con soportes sólidos. Los códigos de barras estocásticos pueden ser nucleótidos individuales. Los códigos de barras estocásticos pueden estar asociados con un sustrato. Cuando los códigos de barras estocásticos están muy cerca de los objetivos, los objetivos pueden hibridar con el código de barras estocástico. Los códigos de barras estocásticos pueden ponerse en contacto en una proporción que no puede reducirse, de tal manera que cada objetivo distinto pueda asociarse con un código de barras estocástico distinto de la divulgación. Para asegurar una asociación eficiente entre el objetivo y el código de barras estocástico, los objetivos pueden reticularse con el código de barras estocástico.
Lisis celular
Después de la distribución de las células y los códigos de barras estocásticos, las células pueden lisarse para liberar las moléculas objetivo. La lisis celular puede lograrse por cualquiera de una variedad de medios, por ejemplo, por medios químicos o bioquímicos, por choque osmótico o por medio de lisis térmica, lisis mecánica o lisis óptica. Las células pueden lisarse mediante la adición de un tampón de lisis celular que comprende un detergente (por ejemplo, SDS, dodecilsulfato de litio, Triton X-100, Tween-20 o NP-40), un solvente orgánico (por ejemplo, metanol o acetona) o enzimas digestivas (por ejemplo, proteinasa K, pepsina o tripsina) o cualquier combinación de los mismos. Para aumentar la asociación de un objetivo y un código de barras estocástico, la velocidad de difusión de las moléculas objetivo puede alterarse, por ejemplo, reduciendo la temperatura y/o aumentando la viscosidad del lisado.
Unión de códigos de barras estocásticos a moléculas de ácido nucleico objetivo
Después de la lisis de las células y la liberación de moléculas de ácido nucleico de las mismas, las moléculas de ácido nucleico pueden asociarse aleatoriamente con los códigos de barras estocásticos del soporte sólido colocalizado. La asociación puede comprender la hibridación de la región de reconocimiento del objetivo de un código de barras estocástico con una porción complementaria de la molécula de ácido nucleico objetivo (por ejemplo, el oligo dT del código de barras estocástico puede interactuar con una cola poli-A de un objetivo). Las condiciones de ensayo usadas para la hibridación (por ejemplo, pH del tampón, fuerza iónica, temperatura, etc.) pueden elegirse para promover la formación de híbridos estables específicos.
La unión puede comprender además la ligadura de la región de reconocimiento del objetivo de un código de barras estocástico y una porción de la molécula de ácido nucleico objetivo. Por ejemplo, la región de unión al objetivo puede comprender una secuencia de ácidos nucleicos que puede ser capaz de hibridación específica con un saliente de un sitio de restricción (por ejemplo, un saliente de extremo adhesivo de EcoRI). El procedimiento de ensayo puede comprender además tratar los ácidos nucleicos objetivo con una enzima de restricción (por ejemplo, EcoRI) para crear un saliente del sitio de restricción. El código de barras estocástico puede luego ligarse a cualquier molécula de ácido nucleico que comprenda una secuencia complementaria al saliente del sitio de restricción. Puede usarse una ligasa (por ejemplo, ADN ligasa de T4) para unir los dos fragmentos.
Los objetivos marcados de una pluralidad de células (o una pluralidad de muestras) (por ejemplo, moléculas de objetivo-código de barras) pueden agruparse posteriormente, por ejemplo recuperando los códigos de barras estocásticos y/o las perlas a las que se unen las moléculas de código de barras objetivo. La recuperación de colecciones basadas en soportes sólidos de moléculas de código de barras objetivo unidas puede implementarse mediante el uso de perlas magnéticas y un campo magnético aplicado externamente. Una vez que se han agrupado las moléculas de código de barras objetivo, todo el procesamiento adicional puede proceder en un solo recipiente de reacción. El procesamiento adicional puede incluir, por ejemplo, reacciones de transcripción inversa, reacciones de amplificación, reacciones de escisión, reacciones de disociación y/o reacciones de extensión de ácidos nucleicos. Pueden realizarse reacciones de procesamiento adicionales dentro de los micropocillos, es decir, sin agrupar primero las moléculas de ácido nucleico objetivo marcadas de una pluralidad de células.
Transcripción inversa
La divulgación proporciona un método para crear un conjugado estocástico de objetivo-código de barras usando transcripción inversa. El conjugado estocástico objetivo-código de barras comprende el código de barras estocástico y una secuencia complementaria de todo o una parte del ácido nucleico objetivo (es decir, una molécula de ADNc marcada con código de barras estocástico). La transcripción inversa de la molécula de ARN asociada puede producirse mediante la adición de un cebador de transcripción inversa junto con la transcriptasa inversa. El cebador de transcripción inversa puede ser un cebador de oligo-dT, un cebador hexanucleotídico aleatorio o un cebador oligonucleotídico específico del objetivo. Los cebadores de oligo-dT pueden tener una longitud de 12-18 nucleótidos y unirse a la cola de poli-A endógena en el extremo 3' del ARNm de mamífero. Los cebadores de hexanucleótidos aleatorios pueden unirse al ARNm en una variedad de sitios complementarios. Los cebadores oligonucleotídicos específicos del objetivo típicamente ceban selectivamente el ARNm de interés.
Amplificación
Pueden realizarse una o más reacciones de amplificación de ácidos nucleicos para crear múltiples copias de las moléculas de ácido nucleico objetivo marcadas. La amplificación puede realizarse de manera multiplexada, en donde se amplifican simultáneamente múltiples secuencias de ácido nucleico objetivo. La reacción de amplificación puede usarse para añadir adaptadores de secuenciación a las moléculas de ácido nucleico. Las reacciones de amplificación pueden comprender amplificar por lo menos una parte de un marcador de muestra, si lo hay. Las reacciones de amplificación pueden comprender amplificar por lo menos una parte del marcador celular y/o molecular. Las reacciones de amplificación pueden comprender amplificar por lo menos una parte de una etiqueta de muestra, un marcador celular, un marcador espacial, un marcador molecular, un ácido nucleico objetivo o una combinación de los mismos. Las reacciones de amplificación pueden comprender amplificar por lo menos el 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97% o 100% de la pluralidad de ácidos nucleicos. El método puede comprender además realizar una o más reacciones de síntesis de ADNc para producir una o más copias de ADNc de moléculas de código de barras objetivo que comprenden un marcador de muestra, un marcador celular, un marcador espacial y/o un marcador molecular.
En algunas realizaciones, la amplificación puede realizarse usando una reacción en cadena de la polimerasa (PCR). Como se usa en la presente, PCR puede referirse a una reacción para la amplificación in vitro de secuencias de ADN específicas mediante la extensión simultánea del cebador de cadenas complementarias de ADN. Como se usa en la presente, la PCR puede abarcar formas derivadas de la reacción, que incluyen, pero no se limitan a, RT-PCR, PCR en tiempo real, pCr anidada, PCR cuantitativa, PCR multiplexada, PCR digital y PCR de ensamblaje.
La amplificación de los ácidos nucleicos marcados puede comprender métodos no basados en PCR. Ejemplos de métodos no basados en PCR incluyen, pero no se limitan a, amplificación de desplazamiento múltiple (MDA), amplificación mediada por transcripción (TMA), amplificación basada en secuencias de ácidos nucleicos (NASBA), amplificación de desplazamiento de cadena (SDA), SDA en tiempo real, amplificación de círculo rodante o amplificación de círculo a círculo. Otros métodos de amplificación no basados en PCR incluyen múltiples ciclos de amplificación de transcripción de ARN impulsada por ARN polimerasa dependiente de ADN o síntesis y transcripción de ADN dirigida por ARN para amplificar objetivos de ADN o ARN, una reacción en cadena de ligasa (LCR) y un método de Qp replicasa (Qp), uso de sondas palindrómicas, amplificación por desplazamiento de cadena, amplificación impulsada por oligonucleótidos usando una endonucleasa de restricción, un método de amplificación en el que un cebador hibrida con una secuencia de ácidos nucleicos y el dúplex resultante se escinde antes de la reacción de extensión y amplificación, amplificación por desplazamiento de cadena usando una polimerasa de ácido nucleico que carece de actividad de exonucleasa 5', amplificación por círculo rodante y amplificación por extensión de ramificación (RAM). En algunos casos, es posible que la amplificación no produzca transcripciones circularizadas.
En algunos casos, los métodos divulgados en la presente comprenden además realizar una reacción en cadena de la polimerasa en el ácido nucleico marcado (por ejemplo, ARN marcado, ADN marcado, ADNc marcado) para producir un amplicón marcado estocásticamente. El amplicón marcado puede ser una molécula de cadena doble. La molécula de cadena doble puede comprender una molécula de ARN de cadena doble, una molécula de ADN de cadena doble o una molécula de ARN hibridada con una molécula de ADN. Una o ambas cadenas de la molécula de cadena doble pueden comprender un marcador de muestra, un marcador espacial, un marcador celular y/o un marcador molecular. El amplicón marcado estocásticamente puede ser una molécula de cadena sencilla. La molécula de cadena sencilla puede comprender ADN, ARN o una combinación de los mismos. Los ácidos nucleicos de la divulgación pueden comprender ácidos nucleicos sintéticos o alterados.
La amplificación puede comprender el uso de uno o más nucleótidos no naturales. Los nucleótidos no naturales pueden comprender nucleótidos fotolábiles o activables. Los ejemplos de nucleótidos no naturales pueden incluir, pero no se limitan a, ácido nucleico peptídico (PNA), morfolino y ácido nucleico bloqueado (LNA), así como ácido nucleico glicol (GNA) y ácido nucleico treosa (TNA). Pueden añadirse nucleótidos no naturales a uno o más ciclos de una reacción de amplificación. La adición de nucleótidos no naturales puede usarse para identificar productos como ciclos específicos o puntos temporales en la reacción de amplificación.
La realización de una o más reacciones de amplificación puede comprender el uso de uno o más cebadores. El uno o más cebadores pueden comprender por lo menos 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 o 15 o más nucleótidos. El uno o más cebadores pueden comprender por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 o 15 o más nucleótidos. El uno o más cebadores pueden comprender menos de 12-15 nucleótidos. El uno o más cebadores pueden aparearse con por lo menos una parte de la pluralidad de objetivos marcados estocásticamente. El uno o más cebadores pueden aparearse con el extremo 3' o el extremo 5' de la pluralidad de objetivos marcados estocásticamente. El uno o más cebadores pueden aparearse con una región interna de la pluralidad de objetivos marcados estocásticamente. La región interna puede tener por lo menos aproximadamente 50, 100, 150, 200, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos de los extremos 3' de la pluralidad de objetivos marcados estocásticamente. El uno o más cebadores pueden comprender un panel fijo de cebadores. El uno o más cebadores pueden comprender por lo menos uno o más cebadores personalizados. El uno o más cebadores pueden comprender por lo menos uno o más cebadores de control. El uno o más cebadores pueden comprender por lo menos uno o más cebadores específicos de genes.
El uno o más cebadores pueden comprender un cebador universal. El cebador universal puede aparearse con un sitio de unión del cebador universal. El uno o más cebadores personalizados pueden aparearse con un primer marcador de muestra, un segundo marcador de muestra, un marcador espacial, un marcador celular, un marcador molecular, un objetivo o cualquier combinación de los mismos. El uno o más cebadores pueden comprender un cebador universal y un cebador personalizado. El cebador personalizado puede diseñarse para amplificar uno o más objetivos. Los objetivos pueden comprender un subconjunto de los ácidos nucleicos totales en una o más muestras. Los objetivos pueden comprender un subconjunto del total de objetivos marcados estocásticamente en una o más muestras. El uno o más cebadores pueden comprender por lo menos 96 o más cebadores personalizados. El uno o más cebadores pueden comprender por lo menos 960 o más cebadores personalizados. El uno o más cebadores pueden comprender por lo menos 9600 o más cebadores personalizados. El uno o más cebadores personalizados pueden aparearse con dos o más ácidos nucleicos marcados diferentes. Los dos o más ácidos nucleicos marcados diferentes pueden corresponder a uno o más genes.
En los métodos de la presente divulgación puede usarse cualquier esquema de amplificación. Por ejemplo, en un esquema, la primera ronda de PCR puede amplificar moléculas unidas a la perla usando un cebador específico de gen y un cebador contra la secuencia del cebador de secuenciación 1 universal de Illumina. La segunda ronda de PCR puede amplificar los primeros productos de PCR usando un cebador específico de gen anidado flanqueado por la secuencia del cebador de secuenciación 2 de Illumina y un cebador contra la secuencia del cebador de secuenciación 1 universal de Illumina. La tercera ronda de PCR añade P5 y P7 y el índice de muestra para convertir los productos de PCR en una biblioteca de secuenciación de Illumina. La secuenciación usando secuenciación de 150 pb x 2 puede revelar el marcador de la célula y el índice molecular en la lectura 1, el gen en la lectura 2 y el índice de la muestra en la lectura 1 del índice.
La amplificación puede realizarse en una o más rondas. En algunos casos, hay múltiples rondas de amplificación. Por ejemplo, el esquema representado en la Figura 15puede tener dos rondas de amplificación. La primera amplificación puede ser una extensión de X' para generar la región específica del gen. La segunda amplificación puede producirse cuando un nucleico de muestra hibrida con la cadena X.
En algunas realizaciones, no es necesario que la hibridación se produzca al final de una molécula de ácido nucleico. En algunas realizaciones, un ácido nucleico objetivo dentro de una cadena intacta de un ácido nucleico más largo se hibrida y amplifica. Por ejemplo, un objetivo dentro de una sección más larga de ADN genómico o ARNm. El objetivo puede ser más de 50 nt, más de 100 nt o más de 1000 nt desde un extremo de un polinucleótido.
Secuenciación
Determinar el número de ácidos nucleicos marcados estocásticamente diferentes puede comprender determinar la secuencia del objetivo marcado, el marcador espacial, el marcador molecular, el marcador de la muestra y el marcador celular o cualquier producto de los mismos (por ejemplo, amplicones marcados, moléculas de ADNc marcados). Un objetivo amplificado puede someterse a secuenciación. Determinar la secuencia del ácido nucleico marcado estocásticamente o cualquier producto del mismo puede comprender realizar una reacción de secuenciación para determinar la secuencia de por lo menos una parte de un marcador de muestra, un marcador espacial, un marcador celular, un marcador molecular, por lo menos una parte del objetivo marcado estocásticamente, un complemento del mismo, un complemento inverso del mismo o cualquier combinación de los mismos.
La determinación de la secuencia de un ácido nucleico (por ejemplo, ácido nucleico amplificado, ácido nucleico marcado, copia de ADNc de un ácido nucleico marcado, etc.) puede realizarse usando una variedad de métodos de secuenciación que incluyen, pero no se limitan a, secuenciación por hibridación (SBH), secuenciación por ligación (SBL), secuenciación cuantitativa incremental de adición de nucleótidos fluorescentes (QIFNAS), ligación y escisión por pasos, transferencia de energía por resonancia de fluorescencia (FRET), balizas moleculares, digestión con sonda informadora TaqMan, pirosecuenciación, secuenciación fluorescente in situ (FISSEQ), perlas FISSEQ, secuenciación de oscilación, secuenciación multiplex, secuenciación de colonias polimerizadas (POLONY); secuenciación de círculo rodante de nanorredes (ROLONY), ensayos de oligo ligadura específicos de alelos (por ejemplo, ensayo de oigo ligadura (OLA), molécula de plantilla única OLA usando una sonda lineal ligada y una lectura de amplificación de círculo rodante (RCA), sondas de candado ligadas u OLA de molécula de plantilla única usando una sonda de candado circular ligada y una lectura de amplificación de círculo rodante (RCA), y similares.
En algunos casos, la determinación de la secuencia del ácido nucleico marcado o cualquier producto del mismo comprende secuenciación de extremos emparejados, secuenciación de nanoporos, secuenciación de alto rendimiento, secuenciación de escopeta, secuenciación de terminador de tinte, secuenciación de ADN de múltiples cebadores, caminata de cebadores, secuenciación didesoxi de Sanger, Secuenciación de Maxim-Gilbert, pirosecuenciación, secuenciación de molécula única verdadera o cualquier combinación de las mismas. Alternativamente, la secuencia del ácido nucleico marcado o cualquier producto del mismo puede determinarse mediante microscopía electrónica o una matriz de transistores de efecto de campo químico sensible (chemFET).
También pueden utilizarse métodos de secuenciación de alto rendimiento, como secuenciación de matrices cíclicas que usan plataformas como Roche 454, Illumina Solexa, ABI-SOLiD, ION Torrent, Complete Genomics, Pacific Bioscience, Helicos o la plataforma Polonator. En alguna realización, la secuenciación puede comprender la secuenciación MiSeq. En alguna realización, la secuenciación puede comprender la secuenciación HiSeq.
Los objetivos marcados estocásticamente pueden comprender ácidos nucleicos que representan de aproximadamente el 0,01% de los genes del genoma de un organismo a aproximadamente el 100% de los genes del genoma de un organismo. Por ejemplo, pueden secuenciarse de aproximadamente el 0,01% de los genes del genoma de un organismo a aproximadamente el 100% de los genes del genoma de un organismo usando una región complementaria objetivo que comprende una pluralidad de multímeros capturando los genes que contienen una secuencia complementaria de la muestra. En algunas realizaciones, los ácidos nucleicos marcados comprenden ácidos nucleicos que representan de aproximadamente el 0,01% de las transcripciones del transcriptoma de un organismo a aproximadamente el 100% de las transcripciones del transcriptoma de un organismo. Por ejemplo, pueden secuenciarse de aproximadamente el 0,501% de las transcripciones del transcriptoma de un organismo a aproximadamente el 100% de las transcripciones de un organismo usando una región complementaria al objetivo comprende una cola poli-T capturando los ARNm de la muestra.
La secuenciación puede comprender secuenciar por lo menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos o pares de bases del ácido nucleico marcado. La secuenciación puede comprender secuenciar por lo menos aproximadamente 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más nucleótidos o pares de bases del ácido nucleico marcado. La secuenciación puede comprender secuenciar por lo menos aproximadamente 1.500; 2.000; 3.000; 4000; 5.000; 6.000; 7.000; 8.000; 9.000; o 10.000 o más nucleótidos o pares de bases del ácido nucleico marcado.
La secuenciación puede comprender por lo menos aproximadamente 200, 300, 400, 500, 600, 700, 800, 900, 1.000 o más lecturas de secuenciación por ejecución. En algunos casos, la secuenciación comprende secuenciar por lo menos aproximadamente 1.500; 2.000; 3.000; 4000; 5.000; 6.000; 7.000; 8.000; 9.000; o 10.000 o más lecturas de secuenciación por ejecución. La secuenciación puede comprender menos de o igual a aproximadamente 1.600.000.000 de lecturas de secuenciación por ejecución. La secuenciación puede comprender menos de o igual a aproximadamente 200.000.000 de lecturas por ejecución.
Muestras
Células
Una muestra para su uso en el método de la divulgación puede comprender una o más células. Una muestra puede referirse a una o más células. En algunas realizaciones, las células son células cancerosas extraídas de un tejido canceroso, por ejemplo, cáncer de mama, cáncer de pulmón, cáncer de colon, cáncer de próstata, cáncer de ovario, cáncer de páncreas, cáncer de cerebro, cánceres de piel melanoma y no melanoma, y similares. En algunos casos, las células se derivan de un cáncer, pero se obtienen de un fluido corporal (por ejemplo, células tumorales circulantes). Los ejemplos no limitativos de cánceres pueden incluir adenoma, adenocarcinoma, carcinoma de células escamosas, carcinoma de células basales, carcinoma de células pequeñas, carcinoma indiferenciado de células grandes, condrosarcoma y fibrosarcoma.
En algunas realizaciones, las células son células que se han infectado con virus y contienen oligonucleótidos virales. En algunas realizaciones, la infección viral puede estar provocada por un virus seleccionado del grupo que consiste de virus de ADN de cadena doble (por ejemplo, adenovirus, virus del herpes, virus de la viruela), virus de ADN de cadena sencilla (cadena o "sentido") (por ejemplo, parvovirus), virus ARN de cadena doble (por ejemplo, reovirus), virus de ARN de cadena sencilla (cadena o sentido) (por ejemplo picornavirus, togavirus), virus de ARN de cadena sencilla (cadena - o antisentido) (por ejemplo, ortomixovirus, rabdovirus), virus de ARN de cadena sencilla ((+ cadena o sentido) con un intermedio de ADN en su ciclo de vida) virus de ARN-RT (por ejemplo, retrovirus) y virus de ADN-RT de cadena doble (por ejemplo, hepadnavirus). En algunos casos, la muestra es un virus o células infectadas con un virus. El virus puede ser VIS o VIH.
En algunas realizaciones, las células son bacterias. Estos pueden incluir bacterias grampositivas o gramnegativas. Los ejemplos de bacterias que pueden analizarse usando los métodos, dispositivos y sistemas divulgados, pero no se limitan a, Actinomedurae, Actinomyces israelí!, Bacillus anthracis, Bacillus cereus, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium tetani, Corynebacterium, Enterococcus faecalis, Listeria monocytogenes, Nocardia, Propionibacterium acnes, Staphylococcus aureus, Staphylococcus epiderm, Streptococcus mutans, Streptococcus pneumoniae and the like. Gram negative bacteria include, but are not limited to, Afipia felis, Bacteriodes, Bartonella bacilliformis, Bortadella pertussis, Borrelia burgdorferi, Borrelia recurrentis, Brucella, Calymmatobacterium granulomatis, Campylobacter, Escherichia coli, Francisella tularensis, Gardnerella vaginalis, Haemophilius aegyptius, Haemophilius ducreyi, Haemophilius influenziae, Heliobacter pylori, Legionella pneumophila, Leptospira interrogans, Neisseria meningitidia, Porphyromonas gingivalis, Providencia sturti, Pseudomonas aeruginosa, Salmonella enteridis, Salmonella typhi, Serratia marcescens, Shigella boydii, Streptobacillus moniliformis, Streptococcus pyogenes, Treponema pallidum, Vibrio cholerae, Yersinia enterocolitica, Yersinia pestis and the like. Other bacteria may include Myobacterium avium, Myobacterium leprae, Myobacterium tuberculosis, Bartonella henseiae, Chlamydia psittaci, Chlamydia trachomatis, Coxiella burnetii, Mycoplasma pneumoniae, Rickettsia akari, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia tsutsugamushi, Rickettsia typhi, Ureaplasma urealyticum, Diplococcus pneumoniae, Ehrlichia chafensis, Enterococcus faecium, Meningococci y similares.
En algunas realizaciones, las células son hongos. Los ejemplos no limitativos de hongos que pueden analizarse usando los métodos, dispositivos y sistemas divulgados incluyen, pero no se limitan a, Aspergilli, Candidae, Candida albicans, Coccidioides immitis, Cryptococci y combinaciones de los mismos.
En algunas realizaciones, las células son protozoos u otros parásitos. Ejemplos de parásitos a analizar usando los métodos, dispositivos y sistemas de la presente divulgación incluyen, pero no se limitan a, Balantidium coli, Cryptosporidium parvum, Cyclospora cayatanensis, Encephalitozoa, Entamoeba histolytica, Enterocytozoon bieneusi, Giardia lamblia, Leishmaniae, Plasmodii, Toxoplasma gondii, Trypanosomae, trapezoidal amoeba, gusanos (por ejemplo, helmintos), particularmente gusanos parasitarios, incluyendo pero no limitados a, Nematoda (gusanos redondos, por ejemplo, tricocéfalos, anquilostomas, oxiuros, ascáridos, filaridos y similares), Cestoda (por ejemplo, tenias).
Como se usa en la presente, el término "célula" puede referirse a una o más células. En algunas realizaciones, las células son células normales, por ejemplo, células humanas en diferentes etapas de desarrollo, o células humanas de diferentes órganos o tipos de tejidos (por ejemplo, glóbulos blancos, glóbulos rojos, plaquetas, células epiteliales, células endoteliales, neuronas, células gliales, fibroblastos, células del músculo esquelético, células del músculo liso, gametos o células del corazón, pulmones, cerebro, hígado, riñón, bazo, páncreas, timo, vejiga, estómago, colon, intestino delgado). En algunas realizaciones, las células pueden ser células madre humanas indiferenciadas o células madre humanas que se han inducido para que se diferencien. En algunas realizaciones, las células pueden ser células fetales humanas. Las células fetales humanas pueden obtenerse de una madre embarazada del feto. En algunas realizaciones, las células son células raras. Una célula rara puede ser, por ejemplo, una célula tumoral circulante (CTC), una célula epitelial circulante, una célula endotelial circulante, una célula endometrial circulante, una célula madre circulante, una célula madre, una célula madre indiferenciada, una célula madre cancerosa, una célula de la médula ósea, una célula progenitora, una célula espumosa, una célula mesenquimal, trofoblasto, célula del sistema inmunitario (huésped o injerto), fragmento celular, orgánulo celular (por ejemplo, mitocondrias o núcleos), célula infectada por patógenos y similares.
En algunas realizaciones, las células son células no humanas, por ejemplo, otros tipos de células de mamífero (por ejemplo, ratón, rata, cerdo, perro, vaca o caballo). En algunas realizaciones, las células son otros tipos de células animales o vegetales. En otras realizaciones, las células pueden ser cualquier célula procariota o eucariota.
En algunas realizaciones, se obtiene una primera muestra de células de una persona que no tiene una enfermedad o afección, y se obtiene una segunda muestra de células de una persona que tiene la enfermedad o afección. En algunas realizaciones, las personas son diferentes. En algunas realizaciones, las personas son las mismas, pero las muestras de células se toman en diferentes momentos. En algunas realizaciones, las personas son pacientes y las muestras de células son muestras de pacientes. La enfermedad o afección puede ser un cáncer, una infección bacteriana, una infección vírica, una enfermedad inflamatoria, una enfermedad neurodegenerativa, una enfermedad fúngica, una enfermedad parasitaria, un trastorno genético o cualquier combinación de los mismos.
En algunas realizaciones, las células adecuadas para su uso en los métodos divulgados actualmente pueden variar en tamaño de aproximadamente 2 micrómetros a aproximadamente 100 micrómetros de diámetro. En algunas realizaciones, las células pueden tener diámetros de por lo menos 2 micrómetros, por lo menos 5 micrómetros, por lo menos 10 micrómetros, por lo menos 15 micrómetros, por lo menos 20 micrómetros, por lo menos 30 micrómetros, por lo menos 40 micrómetros, por lo menos 50 micrómetros, por lo menos 60 micrómetros, por lo menos 70 micrómetros, por lo menos 80 micrómetros, por lo menos 90 micrómetros o por lo menos 100 micrómetros. En algunas realizaciones, las células pueden tener diámetros de como máximo 100 micrómetros, como máximo 90 micrómetros, como máximo 80 micrómetros, como máximo 70 micrómetros, como máximo 60 micrómetros, como máximo 50 micrómetros, como máximo 40 micrómetros, como máximo 30 micrómetros, como máximo 20 micrómetros, como máximo 15 micrómetros, como máximo 10 micrómetros, como máximo 5 micrómetros, o como máximo 2 micrómetros. Las células pueden tener un diámetro de cualquier valor dentro de un intervalo, por ejemplo, de aproximadamente 5 micrómetros a aproximadamente 85 micrómetros. En algunas realizaciones, las células tienen diámetros de aproximadamente 10 micrómetros.
En algunas realizaciones, las células se clasifican antes de asociar una célula con una perla. Por ejemplo, las células pueden clasificarse mediante clasificación de células activadas por fluorescencia o clasificación de células activadas por magnetismo, o más generalmente mediante citometría de flujo. Las células pueden filtrarse por tamaño. En algunos casos, un retenido contiene las células que se asociarán con la perla. En algunos casos, el flujo a través contiene las células que se asociarán con la perla.
En algunas realizaciones, la muestra comprende una célula inmunitaria. Una célula inmunitaria puede incluir, por ejemplo, célula T, célula B, célula madre linfoide, célula progenitora mieloide, linfocito, granulocito, progenitora de célula B, progenitora de célula T, célula asesina natural, célula Tc, célula Th, célula plasmática, célula de memoria, neutrófilo, eosinófilo, basófilo, mastocito, monocito, célula dendrítica y/o macrófago, o cualquier combinación de las mismas.
Una célula T puede ser un clon de células T, que puede referirse a células T derivadas de una única célula T o aquellas que tienen TCR idénticos. Una célula T puede ser parte de una línea de células T que puede incluir clones de células T y poblaciones mixtas de células T con diferentes TCR, todas las cuales pueden reconocer la misma objetivo (por ejemplo, antígeno, tumor, virus). Las células T pueden obtenerse de varias fuentes, incluyendo las células mononucleares de sangre periférica, la médula ósea, el tejido de los ganglios linfáticos, el tejido del bazo y los tumores. Las células T pueden obtenerse de una unidad de sangre extraída de un sujeto, por ejemplo, usando separación de Ficoll. Las células de la sangre circulante de un individuo pueden obtenerse mediante aféresis o leucoféresis. El producto de aféresis puede comprender linfocitos, incluidos células T, monocitos, granulocitos, células B, otros glóbulos blancos nucleados, glóbulos rojos y plaquetas. Las células pueden lavarse y volver a suspenderse en medio para aislar la célula de interés.
Las células T pueden aislarse de los linfocitos de sangre periférica lisando los glóbulos rojos y agotando los monocitos, por ejemplo, mediante centrifugación a través de un gradiente PERCOLL™. Una subpoblación específica de células T, como las células T CD28+, CD4+, CDC, CD45RA+ y CD45RO+, puede aislarse adicionalmente mediante técnicas de selección positiva o negativa. Por ejemplo, las células T pueden aislarse mediante incubación con anti-CD3/anti-CD28 (es decir, 3x28)-perlas conjugadas, como DYNABEADS® M-450 CD3/CD28 T, o XCYTE DYNABEADS™ durante un período de tiempo suficiente para la selección positiva de las células T deseadas. Las células inmunitarias (por ejemplo, Células T y células B) pueden ser específicas de antígeno (por ejemplo, específicas para un tumor.
En algunas realizaciones, la célula puede ser una célula presentadora de antígenos (APC), como una célula B, una célula B activada de un ganglio linfático, una célula linfoblastoide, una célula B en reposo o una célula B neoplásica, por ejemplo, de un linfoma. Una APC puede referirse a una célula B o una célula dendrítica folicular que expresa por lo menos una de las proteínas BCRC en su superficie.
Métodos inmunológicos
Los métodos de la divulgación pueden usarse para rastrear el fenotipo molecular de células T individuales. Pueden distinguirse diferentes subtipos de células T mediante la expresión de diferentes marcadores moleculares. Las células T expresan un receptor de células T (TCR) único de un repertorio diverso de TCR. En la mayoría de las células T, el TCR puede estar compuesto por un heterodímero de una cadena a y una p; cada cadena funcional puede ser un producto de eventos de recombinación de ADN somático durante el desarrollo de las células T, lo que permite la expresión de más de un millón de TCR diferentes en un solo individuo. Los TCR pueden usarse para definir la identidad de las células T individuales, lo que permite el rastreo del linaje para la expansión clonal de las células T durante una respuesta inmune. Los métodos inmunológicos de la divulgación pueden usarse de dvarias maneras, que incluyen pero no se limitan a, la identificación de emparejamientos únicos de cadenas de TCRa y TCRp en células T individuales, cuantificación de la expresión de TCR y marcadores a nivel de células individuales, identificación de la diversidad de TCR en un individuo, caracterización del repertorio de TCR expresado en diferentes poblaciones de células T, determinación de la funcionalidad de los alelos de las cadenas alfa y beta del TCR e identificación de la expansión clonal de las células T durante la respuesta inmune.
La divulgación proporciona métodos para capturar el repertorio de TCR como se muestra en las Figuras 38-40. Como se muestra en la Figura 38, un cebador de transcripción inversa puede comprender cualquier marcador de la divulgación (por ejemplo, marcador molecular y marcador de muestra) unido a un anclaje (que puede ser una secuencia universal). El cebador puede comprender una región específica de un gen. La región específica del gen puede unirse a una región C de una o más cadenas alfa del TCR, una o más cadenas beta del TCR, o una o más de las cadenas alfa y beta del TCR. Las secuencias ejemplares para la unión a la región C para el cebador son: TRAC: 5' CAGACAGACTTGT 3' (SEQ ID NO: 1); TRBC: 5' CCTTTTGGGTGTG 3' (SEQ ID NO: 2). En algunos casos, el cebador de transcripción inversa puede comprender un oligo dT que puede unirse a una cola poliA de un gen marcador. Un gen marcador puede ser un gen específico de células T. En algunos casos, un gen marcador puede referirse a por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más genes. Un gen marcador puede referirse a como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9, o 10 o más genes.
Los cebadores directos para los pasos de PCR multiplex N1 y N2 (como se muestra en la Figura 38) pueden diseñarse para dirigirse a la región V de la combinación VDJ, la región D de la combinación VDJ y/o la región J de la combinación VDJ. Los cebadores directos N1 y/o N2 pueden diseñarse para unirse al extremo 5' de la región V, el extremo 3' de la región V, en cualquier lugar de la región V o en la unión entre la región V y D. El cebador puede diseñarse de tal manera que las lecturas de secuenciación posteriores (por ejemplo, salida) puedan secuenciar una CDR de la región VDJ (por ejemplo, CDR3). Los genes ejemplares que pueden ser dirigidos en las reacciones de PCR de N1 y/o N2 se muestran en la Figura 39 y los cebadores directos usados en las reacciones de PCR de N1 y N2 se muestran en las Tablas 1 y 2, respectivamente.
En un ejemplo, los métodos de la divulgación (por ejemplo, los métodos inmunológicos de la divulgación) pueden usarse para caracterizar los linfocitos infiltrantes de tumores en un tumor, monitorizando la respuesta clínica de un paciente con un tumor antes y después del tratamiento y determinando la enfermedad residual mínima (por ejemplo, células cancerosas sobrantes) después del tratamiento.
Tabla 1. Cebadores Directos N1
Tabla 1. Cebadores Directos N1
Nombre del gen Seq. de cebador SEQ ID NO
RORC CCCAAACATTTCCATGGTGCTC SEQ ID NO: 3
RUNX1 GCAACGGGAAATGTGGTCCT SEQ ID NO: 4
RUNX3 CTGGTCCCAGGTCAGCGT SEQ ID NO: 5
TBET CTGCCCTAACTACAGTCGTTTAC SEQ ID NO: 6
GATA3 CCGTTCACCAGTTGCCGTT SEQ ID NO: 7
PDCD1 ACATCCTACGGTCCCAAGGT SEQ ID NO: 8
BCL2 TGCAAGAGTGACAGTGGATTG SEQ ID NO: 9
BCL6 TGTCCTCACGGTGCCTTTT SEQ ID NO: 10
BIRC5 TGCCACGGCCTTTCCTTAAA SEQ ID NO: 11
CCL14 TTCCTCCTCATCACCATCGC SEQ ID NO: 12
CCL17 GAGTGCTGCCTGGAGTACTT SEQ ID NO: 13
CCL18 GAAGCTGAATGCCTGAGGGG SEQ ID NO: 14
CCL20 ACTTGCACATCATGGAGGGT SEQ ID NO: 15
CCL3 TGGACTGGTTGTTGCCAAAC SEQ ID NO: 16
CCL4 CCCAGCCAGCTGTGGTATTC SEQ ID NO: 17
CCR4 CCAAAGGGAAGAGTGCAGGG SEQ ID NO: 18
CCR7 GGGGAGAGTGTGGTGTTTCC SEQ ID NO: 19
CD160 GGAAGACAGCCAGATCCAGTG SEQ ID NO: 20
CD244 GGGCTGAGAATGAGGCAGTT SEQ ID NO: 21
CD27 TGCAGAGCCTTGTCGTTACA SEQ ID NO: 22
CD28 ACCATCACAGGCATGTTCCT SEQ ID NO: 23
CD30 TTTACTCATCGGGCAGCCAC SEQ ID NO: 24
CD38 AGGTCAATGCCAGAGACGGA SEQ ID NO: 25
CD3D GAAAACGCATCCTGGACCCA SEQ ID NO: 26
CD3E AAGTTGTCCCCCATCCCAAA SEQ ID NO: 27
(continuación)
Nombre del gen Seq. de cebador SEQ ID NO
CD4 CTGGGAGAGGGGGTAGCTAG SEQ ID NO 28 CD40LG CCTCCCCCAGTCTCTCTTCT SEQ ID NO 29 CD5 ATCAATGGTCCAAGCCGCAT SEQ ID NO 30 CD69 GCTGTAGACAGGTCCTTTTCG SEQ ID NO 31 CD8A ACTGCTGTCCCAAACATGCA SEQ ID NO 32 CD8B CCACCATCTTTGCAGGTTGC SEQ ID NO 33 CDCA7 CCAGTCTAGTTTCTGGGCAGG SEQ ID NO 34 CSF2 AGCCAGTCCAGGAGTGAGAC SEQ ID NO 35 CX3CR1 CACCCGTCCAGACCTTGTT SEQ ID NO 36 CXCL12 TGGGAGTTGATCGCCTTTCC SEQ ID NO 37 CXCL13 AGGCAGATGGAACTTGAGCC SEQ ID NO 38 CXCR3 GACCTCAGAGGCCTCCTACT SEQ ID NO 39 CXCR5 CCTCCCCAGCCTTTGATCAG SEQ ID NO 40 EOMES ACTTAACAGCTGCAGGGGC SEQ ID NO 41 FAS ATTGCTGGTAGAGACCCCCA SEQ ID NO 42 FASLG CCTCAAGGGGGACTGTCTTTC SEQ ID NO 43 FOSL1 CTCCTGACAGAAGGTGCCAC SEQ ID NO 44 FOXP3 ACAGAAGCAGCGTCAGTACC SEQ ID NO 45 GAPDH GACTTCAACAGCGACACCCA SEQ ID NO 46 GZMA GGAACCATGTGCCAAGTTGC SEQ ID NO 47 GZMB AGGTGAAGATGACAGTGCAGG SEQ ID NO 48 GZMH AGTGTTGCTGACAGTGCAGA SEQ ID NO 49 GZMK TTGCCACAAAGCCTGGAATC SEQ ID NO 50 HLA-DRA GGGTCTGGTGGGCATCATTA SEQ ID NO 51 IFNG CTAGGCAGCCAACCTAAGCA SEQ ID NO 52 IL10 CCCCAACCACTTCATTCTTG SEQ ID NO 53 IL12A GGTCCCTCCAAACCGTTGTC SEQ ID NO 54 IL12B GCTATGGTGAGCCGTGATTG SEQ ID NO 55 IL13 GGAGCCAAGGGTTCAGAGAC SEQ ID NO 56 IL17A GCCTTCAAGACTGAACACCGA SEQ ID NO 57 IL17F TTGGAGAAGGTGCTGGTGAC SEQ ID NO 58 IL1A GGCATCCTCCACAATAGCAGA SEQ ID NO 59 IL1B CTTAAAGCCCGCCTGACAGA SEQ ID NO 60 IL2 TCACTTAAGACCCAGGGACTT SEQ ID NO 61 IL21 CCCAAGGTCAAGATCGCCAC SEQ ID NO 62 IL21R ATTTGAGGCTGCAGTGAGCT SEQ ID NO 63 IL22 TGGGAAGCCAAACTCCATCAT SEQ ID NO 64 IL23R AGAATCATTAGGCCAGGCGTG SEQ ID NO 65 IL24 CTCACCCCATCATCCCTTTCC SEQ ID NO 66 IL26 TACTGACGGCATGTTAGGTG SEQ ID NO 67 IL3 ACAGACGACTTTGAGCCTCG SEQ ID NO 68 IL31 GGCCATCTCTTCCTTTCGGA SEQ ID NO 69 IL32 CTTTCCAGTCCTACGGAGCC SEQ ID NO 70 IL33R TTCAGGACTCCCTCCAGCAT SEQ ID NO 71 IL4 ACCATGAGAAGGACACTCGC SEQ ID NO 72 IL4R TGAACTTCAGGGAGGGTGGT SEQ ID NO 73 IL5 GCAGTGAGAATGAGGGCCA SEQ ID NO 74 IL6 CGGCAAATGTAGCATGGGC SEQ ID NO 75 IL6R CCAGCACCAGGGAGTTTCTA SEQ ID NO 76 IRF4 CTCTTCAGCATCCCCCGTAC SEQ ID NO 77 LAG3 AGCTGTACCAGGGGGAGAG SEQ ID NO 78 LIF TCCCCATCGTCCTCCTTGTC SEQ ID NO 79 LTA AGGCAGGGAGGGGACTATTT SEQ ID NO 80 MCL1 GACTGGCTACGTAGTTCGGG SEQ ID NO 81 MKI67 TACTTTTTCGCCTCCCAGGG SEQ ID NO 82 (continuación)
Nombre del gen Seq. de cebador SEQ ID NO
MYC AGCTACGGAACTCTTGTGCG SEQ ID NO 83 NKG2D CAACACCCAGGGGATCAGTG SEQ ID NO 84 PRDM1 ACCAAAGCATCACGTTGACAT SEQ ID NO 85 PRF1 GGAGTCCAGCGAATGACGTC SEQ ID NO 86 PTPRCvl GTTCCCATGTTAAATCCCATTCAT SEQ ID NO 87 PTPRCv2 ACCCTCTCTCCCTCCCTTTC SEQ ID NO 88 SAP30 ACCAACCAGACCAGGACTTA SEQ ID NO 89 SELL GCATCTCATGAGTGCCAAGC SEQ ID NO 90 TBX21 TTATAACCATCAGCCCGCCA SEQ ID NO 91 TGFB1 TATTCCTTTGCCCGGCATCA SEQ ID NO 92 TNF AGTGGACCTTAGGCCTTCCT SEQ ID NO 93 TNFRSF9 TGGCATGTGAGTCATTGCTC SEQ ID NO 94 TYMS TCAGTCTTTAGGGGTTGGGC SEQ ID NO 95 UHRF1 CCAGTTCTTCCTGACACCGG SEQ ID NO 96 ZBED2 AATGTACCAGCCAGTCAGCG SEQ ID NO 97 ZNF683 GGAGAGCGTCCATTCCAGTG SEQ ID NO 98 TRAV1-1 TCTGGGTTTTATGGGCTGTCCTGGTA SEQ ID NO 99 TRAV1-2-01 GGACAAAACATTGACCAGCCCAC SEQ ID NO 100 TRAV1-2-02 ATCTGGGTTCAACGGGCTGTTCTGGTA SEQ ID NO 101 TRAV2 AATCACTCTGTGTCCAATGCTTACA SEQ ID NO 102 TRAV3 ATTCAGTCTCTGGAAACCCTTATC SEQ ID NO 103 TRAV4 GTAGCCACAACAACATTGCTAC SEQ ID NO 104 TRAV5 CAGCTCCTCCACCTACTTATACT SEQ ID NO 105 TRAV6 CCAGCATACTTACAGTGGTA SEQ ID NO 106 TRAV7 GCACGTACTCTGTCAGTCGTT SEQ ID NO 107 TRAV8-1 GTGGAACTGTTAATCTCTTCTGGTA SEQ ID NO 108 TRAV8-2 CT CT CTT CTGGTAT GTGCAACACC SEQ ID NO 109 TRAV8-3 GGCAACACCTTATCTCTTCTGGTA SEQ ID NO 110 TRA V8-4 CTCTTCTGGTATGTGCAATA SEQ ID NO 111 TRAV8-5 GCCATGGCAGAAGAATGTGGATT SEQ ID NO 112 TRAV8-6 AGTGTATCTCTTCTGGTATGTGCAA SEQ ID NO 113 TRAV8-7 GGAGTTCCTTCTCTCTTCTGGTA SEQ ID NO 114 TRAV9-1 GAAACCACACAGTACCCTTCCCTT SEQ ID NO 115 TRAV9-2 AGGATACCCTTCCCTTTTCTGGTA SEQ ID NO 116 TRAV10 TGAGCCCCTTCAGCAACTTAAG SEQ ID NO 117 TRAV11 CACTCTTCAATTTCCACTGGTTCCGG SEQ ID NO 118 TRAV12-1 AGTGCTTCTCAGTCTTTCTTCTGG SEQ ID NO 119 TRAV12-2 TTCCCAGTCCTTCTTCTGGTA SEQ ID NO 120 TRAV12-3 CTCTCAACTGCACTTACAGCAAC SEQ ID NO 121 TRAV13-1 GCCTCAAACTACTTCCCTTGGTA SEQ ID NO 122 TRAV13-2 CAGCGCCTCAGACTACTTCATTT SEQ ID NO 123 TRAV14 GGTCTATTCTGGTACAAGCAGC SEQ ID NO 124 TRAV15 TAACTTCTACTGGTTCTGGCAGGGTC SEQ ID NO 125 TRAV16 AACTATTCCTATTCTGGGAGTCCT SEQ ID NO 126 TRAV17 GTGGTATAGACAAAATTCAGGTAGAGG SEQ ID NO 127 TRAV18 CTGCACTTATCAGTCCAGCTATTCAAC SEQ ID NO 128 TRAV19 TTCTGGTACAAGCAACCACC SEQ ID NO 129 TRAV20 CACAGTCAGCGGTTTAAGAGG SEQ ID NO 130 TRAV21 CTGATAGCGCTATTTACAACCTCC SEQ ID NO 131 TRAV22 GCGGTGCAATTTTTCTGACTCTG SEQ ID NO 132 TRAV23 CTGCGTTTGACTACTTTCCATGGTA SEQ ID NO 133 TRAV24 CCCTTCCAGCAATTTTTATGCC SEQ ID NO 134 TRAV25 CCACGTACTGCAATTCCTCAAC SEQ ID NO 135 TRAV26-1 GTGTATTGGTATCGACAGATTCACTC SEQ ID NO 136 TRAV26-2 TACATTGGTATCGACAGCTTCCCTCC SEQ ID NO 137 (continuación)
Nombre del gen Seq. de cebador SEQ ID NO
TRAV27 ACT GTGT ACTGCAACTCCT CAAG SEQ ID NO 138 TRAV28 TGTTCT ATTT ACAT GATCCGTGTGC SEQ ID NO 139 TRAV29 TACCCTGCTGAAGGTCCTACAT SEQ ID NO 140 TRAV30 GCAGTTCCTCCAAGGCTTTATA SEQ ID NO 141 TRAV31 CGTGAAACTGGACTGTGCATACAA SEQ ID NO 142 TRAV32 TGACAGTTATACAGATGGAGCTTTG SEQ ID NO 143 TRAV33 CGTACACTTTATACTGGTACAAGCAAC SEQ ID NO 144 TRAV34 CTCACCATAAACTGCACGTCATCAA SEQ ID NO 145 TRAV35 GCATATTTAACACCTGGCTATGGTA SEQ ID NO 146 TRAV36 GTGACTAACTTTCGAAGCCTACTA SEQ ID NO 147 TRAV37 GCCCTTCAGATTTCTTCAGTGGTTC SEQ ID NO 148 TRAV38-1 GTGCAGGAGGCAGAGACTGTGA SEQ ID NO 149 TRAV38-2 TATTCTGGTACAAGCAGCCTCC SEQ ID NO 150 TRAV39 CACTTCAGACAGACTGTATTGGT SEQ ID NO 151 TRAV40 ACATACACATCCACGGGGT SEQ ID NO 152 TRAV41 ACTCGGTAGGAATAAGTGCCTTAC SEQ ID NO 153 TRBV2 CTTGGGGCAGAAAGTCGAGT SEQ ID NO 154 TRBV3-1 GGTCACACAGATGGGAAACG SEQ ID NO 155 TRBV4-1 TGGGGCACAGGGCTATGTA SEQ ID NO 156 TRBV4-2 TACGCAGACACCAAGACACC SEQ ID NO 157 TRBV4-3 ACGCAGACACCAAGACACC SEQ ID NO 158 TRBV5-1 AGCAAGTGACACTGAGCTGC SEQ ID NO 159 TRBV5-3/5/6 CCAAAGTCCCACACACCTGA SEQ ID NO 160 TRBV5-4 TCACCCAAAGTCCCACACAC SEQ ID NO 161 TRBV5-7 CAAAACGAGAGGACAGCACG SEQ ID NO 162 TRBV5-8 GCGACTCTGAGATGCTCTCC SEQ ID NO 163 TRBV6-1/9 GTGTGCCCAGGATATGAACCA SEQ ID NO 164 TRBV6- SEQ ID NO 165 2/3/5/618 GTATCGACAAGACCCAGGCA
TRBV6-4 TCACCCAGGCACCAACATC SEQ ID NO 166 TRBV6-7 ATCGACAAGACCCAGGCAAG SEQ ID NO 167 TRBV7-1 GTCCCTGAGACACAAGGTAGC SEQ ID NO 168 TRBV7-2 TCTCCCAGTCCCCCAGTAAC SEQ ID NO 169 TRBV7-3 TCTCCCAGACCCCCAGTAAC SEQ ID NO 170 TRBV7-4 CCCCAAGGTACAAAGTCGCA SEQ ID NO 171 TRBV7-6/7 TCCCAGTCTCCCAGGTACAAA SEQ ID NO 172 TRBV7-8 CCCCTAGGTACAAAGTCGCA SEQ ID NO 173 TRBV7-9 AACCGCCTTTATTGGTACCGA SEQ ID NO 174 TRBV9 GATGCTCCCCTAGGTCTGGA SEQ ID NO 175 TRBV10-1 ATCACCCAGAGCCCAAGACA SEQ ID NO 176 TRBV10-2 CAGAGACAGGAAGGCAGGTG SEQ ID NO 177 TRBV10-3 CTGGTATCGACAAGACCCGG SEQ ID NO 178 TRBV11-1 ACCCTTTACTGGTACCGGCA SEQ ID NO 179 TRBV11-2 TCTGGCCATGCTACCCTTTAC SEQ ID NO 180 TRBV11-3 GTGGCTTTTTGGTGCAATCC SEQ ID NO 181 TRBV12-3 ACAGACAGACCATGATGCGG SEQ ID NO 182 TRBV12-4 CAGACAGACCATGATGCGGG SEQ ID NO 183 TRBV12-5 CAGACACCAAGGCACAAGGT SEQ ID NO 184 TRBV13 AGGGAAACAGCCACTCTGAA SEQ ID NO 185 TRBV14 CCCAGCCACAGCGTAATAGA SEQ ID NO 186 TRBV15 AAGCCAGTGACCCTGAGTTG SEQ ID NO 187 TRBV16 CGCCCAGACTCCAAAACATC SEQ ID NO 188 TRBV17 ACCGACAGAATCTGAGGCAAG SEQ ID NO 189 TRBV18 GGAGGCAAGACTGAGATGCA SEQ ID NO 190 TRBV19 GGCAAGGGCTGAGATTGATC SEQ ID NO 191 (continuación)
Nombre del gen Seq. de cebador SEQ ID NO
TRBV20-1 GTGAAGATCGAGTGCCGTTC SEQ ID NO 192
TRBV23-1 ACCCCCGAAAAAGGACATACT SEQ ID NO: 193
TRBV24-1 ATGCTGATGTTACCCAGACCC SEQ ID NO: 194
TRBV25-1 GTTCTCAAACCATGGGCCATG SEQ ID NO: 195
TRBV27 TGGTATCGACAAGACCCAGG SEQ ID NO: 196
TRBV28 GTGAAAGTAACCCAGAGCTCG SEQ ID NO: 197
TRBV29-1 TTCTGGTACCGTCAGCAACC SEQ ID NO: 198
TRBV30 GGGAACATCAAACCCCAACC SEQ ID NO: 199
Tabla 2. Cebadores directos de N2.
Nombre del gen Seq. de cebador SEQ ID NO
RORC CAGACGTGTGCTCTTCCGATCTACCCAAGAGAAGCAGAAGTCG SEQ ID N O:
200
RUNX1 CAGACGTGTGCTCTTCCGATCTGAAAATTCGTGCGTGGGCTT SEQ ID NO 201 RUNX3 CAGACGTGTGCTCTTCCGATCTCACCTGCTGCACTCATCTGA SEQ ID NO 202 TBET CAGACGTGTGCTCTTCCGATCTGGTCAGGGAAAGGACTCACC SEQ ID NO 203 GATA3 CAGACGTGTGCTCTTCCGATCTTAAGGTGGTTGTGCTCGGAG SEQ ID NO 204 PDCD1 CAGACGT GTGCTCTTCCGATCTGCAGAAGTGCAGGCACCT A SEQ ID NO 205
BCL2 CAG ACGT GTG CT CTT CCG AT CT G CTG AT ATT CT G C A ACACT GT A SEQ ID NO 206 CA BCL6 CAGACGTGTGCTCTTCCGATCTGTAGGCAGACACAGGGACTT SEQ ID NO 207 BIRC5 CAGACGTGTGCTCTTCCGATCTTTGTCTAAGTGCAACCGCCT SEQ ID NO 208 CCL14 CAGACGTGTGCTCTTCCGATCTCTTACCACCCCTCAGAGTGC SEQ ID NO 209 CCL17 CAGACGTGTGCTCTTCCGATCTCTCACCCCAGACTCCTGACT SEQ ID NO 210 CCL18 CAGACGTGTGCTCTTCCGATCTGTCCCATCTGCTATGCCCA SEQ ID NO 211
CCL20 CAGACGT GTGCT CTT CCG AT CTT CCAT AAGCT ATTTT GGTTT AG SEQ ID NO 212 TGC CCL3 CAGACGTGTGCTCTTCCGATCTCTCTGAGAGTTCCCCTGTCC SEQ ID NO 213 CCL4 CAGACGT GTGCTCTTCCGATCTTGGAACT GAACT GAGCTGCT SEQ ID NO 214
CAGACGT GTG CT CTT CCG AT CT ATT CTGTAT A ACA CT CAT AT CTT
CCR4 SEQ ID NO 215 TGCC CCR7 CAGACGTGTGCTCTTCCGATCTCTCTTGGCTCCACTGGGATG SEQ ID NO 216 CD160 CAGACGTGTGCTCTTCCGATCTTTGTGCAGACCAAGAGCACC SEQ ID NO 217 CD244 CAGACGTGTGCTCTTCCGATCTGGAAAGCGACAAGGGTGAAC SEQ ID NO 218 CD27 CAGACGTGTGCTCTTCCGATCTCGTGACAGAGTGCCTTTTCG SEQ ID NO 219 CD28 CAGACGTGTGCTCTTCCGATCTTGTAGATGACCTGGCTTGCC SEQ ID NO 220 CD30 CAGACGT GTGCT CTTCCG AT CTT GTTTGCCCAGT GTTT GTGC SEQ ID NO 221
CAGACGT GTG CT CTT CCG AT CT AT CAG CAT ACCTTT ATT GT G AT !
CD38 SEQ ID NO 222 CTATC CD3D CAGACGTGTGCTCTTCCGATCTTGATGTCATTGCCACTCTGCT SEQ ID NO 223 CD3E CAGACGTGTGCTCTTCCGATCTCTGGGGATGGACTGGGTAAAT SEQ ID NO 224 CD4 CAGACGTGTGCTCTTCCGATCTACCACTTCCCTCAGTCCCAA SEQ ID NO 225 CD40LG CAGACGTGTGCTCTTCCGATCTGAGTCAGGCCGTTGCTAGTC SEQ ID NO 226 CD5 CAGACGTGTGCTCTTCCGATCTAGGTCACAGATCTTCCCCCG SEQ ID NO 227
CAGACGT GT G CT CTTCCG AT CTAGT GTT GG AAAAT GTGCAAT AT
CD69 SEQ ID NO 228 GTG CD8A CAGACGT GTGCTCTTCCGATCT ATGCCTGCCCATTGGAGAGAA SEQ ID NO 229 CD8B CAGACGTGTGCTCTTCCGATCTGCTGTCCAGTTCCCAGAAGG SEQ ID NO 230
CDCA7 C AG ACGTGT G CT CTT CCG AT CTATGT A A ACCATT G CTGTG CCAT SEQ ID NO 231 T
(continuación)
Nombre del gen Seq. de cebador
Figure imgf000044_0001
CSF2 CAGACGT GTGCTCTTCCGATCTGGCCACACT GACCCTGATAC
Figure imgf000044_0002
Figure imgf000044_0003
CX3CR1 CAGACGTGTGCTCTTCCGATCTTGTTTTCCTCTTAACGTTAGACC
AC CXCL12 CAGACGTGTGCTCTTCCGATCTCTCATTCTGAAGGAGCCCCAT
Figure imgf000044_0004
CXCL13 CAGACGTGTGCTCTTCCGATCTGCATTCGAAGATCCCCAGACTT
Figure imgf000044_0005
CXCR3 CAGACGTGTGCTCTTCCGATCTCCAATATCCTCGCTCCCGG
Figure imgf000044_0006
CXCR5 CAGACGTGTGCTCTTCCGATCTTCCTCGCAAGCTGGGTAATC
Figure imgf000044_0007
Figure imgf000044_0008
EOMES CAGACGT GTGCT CTT CCG AT CT ACT A ACTTG AACCGT GTTT AAG G FAS CAGACGTGTGCTCTTCCGATCTCCCCCATTTCCCCGATGT FASLG CAGACGTGTGCTCTTCCGATCTGCATATCCTGAGCCATCGGT FOSL1 CAGACGTGTGCTCTTCCGATCTGGTGATTGGACCAGGCCATT FOXP3 CAGACGTGTGCTCTTCCGATCTGGGTCTCTTGAGTCCCGTG GAPDH CAGACGTGTGCTCTTCCGATCTGCCCTCAACGACCACTTTGT GZMA CAGACGTGTGCTCTTCCGATCTCCTTTGTTGTGCGAGGGTGT GZMB CAGACGTGTGCTCTTCCGATCTAGGCCCTCTTGTGTGTAACA GZMH CAGACGTGTGCTCTTCCGATCTCCAAAGAAGACACAGACCGGT GZMK CAGACGTGTGCTCTTCCGATCTAAAGCAACCTTGTCCCGCCT HLA-DRA CAGACGTGTGCTCTTCCGATCTGCCTCTTCGATTGCTCCGTA IFNG CAGACGTGTGCTCTTCCGATCTCCTGCAATCTGAGCCAGTGC
Figure imgf000044_0009
IL10 CAGACGTGTGCTCTTCCGATCTTTCAATTCCTCTGGGAATGTT CAGACGTGTGCTCTTCCGATCTGAACTAGGGAGGGGGAAAGA
Figure imgf000044_0010
IL12A
AG IL12B CAGACGTGTGCTCTTCCGATCTTCCTCACCCCCACCTCTCTA
IL13 CAGACGTGTGCTCTTCCGATCTTGCTACCTCACTGGGGTCCT IL17A CAGACGTGTGCTCTTCCGATCTGCCCCTCAGAGATCAACAGAC IL17F CAGACGTGTGCTCTTCCGATCTCTTACCCAGTGCTCTGCAAC IL1A CAGACGTGTGCTCTTCCGATCTGCATTTTGGTCCAAGTTGTGC
Figure imgf000044_0011
IL1B CAGACGT GTGCT CTTCCG AT CT ACATT CT G AT G AGCAACCGC
Figure imgf000044_0012
IL2 CAG ACGTGTGCT CTT CCG AT CT AAG CAT CAT CT CAACACTG ACT
T IL21 CAGACGTGTGCTCTTCCGATCTCTGCCAGCTCCAGAAGATGT
IL21R CAGACGTGTGCTCTTCCGATCTAGACAAGAGCTGGCTCACCT IL22 CAGACGTGTGCTCTTCCGATCTGGAAACCAATGCCACTTTTGT IL23R CAGACGTGTGCTCTTCCGATCTCTGGCCAATATGCTGAAACCC IL24 CAGACGTGTGCTCTTCCGATCTGCCCAGTGAGACTGTGTTGT IL26 CAGACGTGTGCTCTTCCGATCTTGTGTGTGGAGTGGGATGTG IL3 CAGACGTGTGCTCTTCCGATCTATTTCACCTTTTCCTGCGGC IL31 CAGACGTGTGCTCTTCCGATCTGTGTGGGAACTCTGCCGTG IL32 CAGACGTGTGCTCTTCCGATCTTGCTCTGAACCCCAATCCTC IL33R CAGACGTGTGCTCTTCCGATCTAGGTACCAAATGCCTGTGCC IL4 CAGACGTGTGCTCTTCCGATCTCGGGCTTGAATTCCTGTCCT IL4R CAGACGTGTGCTCTTCCGATCTTCCTCGTATGCATGGAACCC IL5 CAGACGTGTGCTCTTCCGATCTAGGCATACTGACACTTTGCC IL6 CAGACGTGTGCTCTTCCGATCTGGAAAGTGGCTATGCAGTTTG IL6R CAGACGTGTGCTCTTCCGATCTACAGCATGTCACAAGGCTGT IRF4 CAGACGTGTGCTCTTCCGATCTGCCCCCAAATGAAAGCTTGA LAG3 CAGACGTGTGCTCTTCCGATCTCTTTGGAGAAGACAGTGGCGA LIF CAGACGTGTGCTCTTCCGATCTTTGCCGGCTCTCCAGAGTA LTA CAGACGTGTGCTCTTCCGATCTGGAGAAACAGAGACAGGCCC MCL1 CAGACGTGTGCTCTTCCGATCTTTTGCTTAGAAGGATGGCGC
Figure imgf000044_0013
MKI67 CAGACGTGTGCTCTTCCGATCTTCCTGCCCCACCAAGATCAT
(continuación)
Nombre del gen Seq. de cebador MYC CAGACGTGTGCTCTTCCGATCTCAACCTTGGCTGAGTCTTGA NKG2D CAGACGTGTGCTCTTCCGATCTCCACCCTCCACAGGAAATTG PRDM1 CAGACGTGTGCTCTTCCGATCTACATGTGAATGTTGAGCCCA
Figure imgf000045_0001
PRF1 CAGACGTGTGCTCTTCCGATCTCATGGCCACGTTGTCATTGT CAGACGTGTGCTCTTCCGATCTTACCAGGAATGGATGTCGCTA
Figure imgf000045_0002
PTPRCvl
ATCA PTPRCv2 CAGACGT GTGCTCTTCCGATCTT AGTTGGCT ATGCTGGCAT G
SAP30 CAGACGTGTGCTCTTCCGATCTTCACTAGGAGACGTGGAATTG SELL CAGACGTGTGCTCTTCCGATCTCCTGCCCCCAGACCTTTTATC TBX21 CAGACGTGTGCTCTTCCGATCTAGAAAAGGGGCTGGAAAGGG TGFB1 CAGACGTGTGCTCTTCCGATCTACCTTGGGCACTGTTGAAGT TNF CAGACGTGTGCTCTTCCGATCTGGCTCAGACATGTTTTCCGTG
Figure imgf000045_0003
TNFRSF9 CAGACGTGTGCTCTTCCGATCTTTTTGATGTGAGGGGCGGAT CAGACGT GTGCT CTT CCG AT CT AT GT G CATTT CA AT CCCACGT A
Figure imgf000045_0004
TYMS C UHRF1 CAGACGT GTGCT CTTCCGAT CTCCAAAGTTTGCAGCCT AT ACC
Figure imgf000045_0005
ZBED2 CAGACGTGTGCTCTTCCGATCTGGTTTTGGTGGAGCTGACGA
Figure imgf000045_0006
ZNF683 CAGACGTGTGCTCTTCCGATCTATCCACCTGAAGCTGCACC
Figure imgf000045_0007
Figure imgf000045_0008
TRAV1-1 CAGACGT GTGCT CTT CCG AT CT CCTT AGT CG CT CT G AT AGTT AT
GG CAGACGT GTGCT CTT CCG AT CT CG AAG CACCCAC ATTT CT GT CT
Figure imgf000045_0009
TRAV1-2-01
TA CAGACGTGTGCTCTTCCGATCTGTCGGTCTAAAGGGTACAGTT
Figure imgf000045_0010
TRAV1-2-02
ACC
TRAV2 CAGACGT GTGCT CTT CCG AT CT CAGG G ACG AT ACAACAT G ACC
Figure imgf000045_0011
TAT TRAV3 CAGACGTGTGCTCTTCCGATCTAACAAGAGCCAAACCTCCTTCC
Figure imgf000045_0012
Figure imgf000045_0013
TRAV4 CAGACGTGTGCTCTTCCGATCTAGAAAGTCCAGCACTCTGAGC
CT CAGACGTGTGCTCTTCCGATCTCGCATTGCAGACACCCAGACT
Figure imgf000045_0014
TRAV5
G
TRAV6 CAGACGT GTGCT CTT CCG AT CT G GT CACCTTTG AT ACCACCCTT
Figure imgf000045_0015
A
Figure imgf000045_0016
TRAV7 C AG ACGTGTG CT CTT CCG AT CTAC AG CCGT G CAG CCTG AAG AT
TCA TRAV8-1 CAGACGTGTGCTCTTCCGATCTAGGAAACCCTCTGTGCAGTGG
Figure imgf000045_0017
Figure imgf000045_0018
TRAV8-2 CAGACGT GTGCT CTT CCG AT CT CAT ATG AG CG ACG CG G CTG AG
TAC TRAV8-3 CAGACGT GTGCT CTTCCGAT CTGGAAACCCT CT GTGCATTGG
Figure imgf000045_0019
TRAV8-4 CAGACGTGTGCTCTTCCGATCTTATGAGCGACGCGGCTGAGTA
Figure imgf000045_0020
TRAV8-5 CAGACGT GT G CT CTT CCG AT CT G ACA CTT AT CACTT CCCCAAT C
Figure imgf000045_0021
AA CAGACGT GTGCT CTT CCG AT CT ACCCT CAGT CCAT AT AAG CG AC
Figure imgf000045_0022
TRAV8-6
AC
(continuación)
Nombre del gen Seq. de cebador
Figure imgf000046_0001
CAGACGTGTGCTCTTCCGATCTAAGAAGAGCGAAACCTCCTTCT
Figure imgf000046_0002
TRAV8-7
A CAG ACGTGT G CT CTT CCG AT CT G AAG CCATGTACCGT AAAG AA
Figure imgf000046_0003
TRAV9-1
AC CAG ACGT GTG CT CTT CCG AT CTTT G G AG A AAGG CT CAGTT CAA
Figure imgf000046_0004
TRAV9-2
G TRAV10 CAGACGTGTGCTCTTCCGATCTAGCCTCCCAGCTCAGCGATTCA
Figure imgf000046_0005
Figure imgf000046_0006
TRAV11 CAG ACGT GT G CT CTT CCG AT CT GTTTGG AAT AT CG C AG CCTCTC
A TRAV12-1 CAGACGTGTGCTCTTCCGATCTGAGACTCCAAGCTCAGTGATTC
Figure imgf000046_0007
TRAV12-2 CAGACGTGTGCTCTTCCGATCTGACTCCCAGCCCAGTGATTC
Figure imgf000046_0008
CAG ACGT GTGCT CTT CCG AT CT AGGTTT ACAG CACAGGT CG AT
Figure imgf000046_0009
TRAV12-3
AA TRAV13-1 CAGACGTGTGCTCTTCCGATCTCAAACATTTCTCCCTGCACATC
Figure imgf000046_0010
Figure imgf000046_0011
TRAV13-2 CAG ACGTGT G CT CTT CCG AT CT CAGT G AAACAT CT CT CT CTGCA
AAT TRAV14 CAGACGTGTGCTCTTCCGATCTATCCGCCAACCTTGTCATCT
Figure imgf000046_0012
TRAV15 CAGACGTGTGCTCTTCCGATCTGGTCTCTCATCCTGGAGATTCA
Figure imgf000046_0013
CAG ACGT GTGCT CTTCCG AT CTG AG ACAT CTTT CCACCT G AAG A
Figure imgf000046_0014
TRAV16
A CAG ACGT GTGCT CTT CCG AT CTT CCAAG AAAAGCAGTT CCTT GT
Figure imgf000046_0015
TRAV17
TG
Figure imgf000046_0016
TRAV18 CAG ACGT GTGCT CTT CCG AT CT AG AGGTTTT CAG GCCAGT CCTA
T
Figure imgf000046_0017
TRAV19 CAGACGTGTGCTCTTCCGATCTACAAGTCGTGGACTCAGCAGT
ATA TRAV20 CAGACGTGTGCTCTTCCGATCTTGCACATCACAGCCCCTAA
Figure imgf000046_0018
Figure imgf000046_0019
TRAV21 CAG ACGTGTG CT CTT CCG AT CT ATGCCT CG CTG G ATAA ATCATC
AG TRAV22 CAGACGTGTGCTCTTCCGATCTCTCTTCCCAGACCACAGACTC
Figure imgf000046_0020
TRAV23 CAG ACGT GT G CT CTT CCG AT CT G CCAAG CAGTT CT C ATT G CAT A
Figure imgf000046_0021
TC
TRAV24 CAGACGTG TG CTCTTCCG ATCTACCAAG G AG G G TTACAG CTAT
Figure imgf000046_0022
TTG CAGACGTGTGCTCTTCCGATCTCACATCACAGCCACCCAGACTA
Figure imgf000046_0023
TRAV25
C CAG ACGT GTGCT CTT CCG AT CT G ACAG AA AGT CCAG CA CCTT G
Figure imgf000046_0024
TRAV26-1
ATC TRAV26-2 CAGACGTGTGCTCTTCCGATCTTCTCTGGCAATCGCTGAAGAC
Figure imgf000046_0025
TRAV27 CAG ACGT GTGCT CTT CCG AT CT AAGG ACAGTT CT CT CCACAT CA
Figure imgf000046_0026
C CAG ACGTGTG CT CTTCCG AT CT ACTTT ATG G CCACCTAT ACAT C
Figure imgf000046_0027
TRAV28
AG
(continuación)
Nombre del gen Seq. de cebador
Figure imgf000047_0001
CAG ACGT GTGCT CTT CCG AT CT CAG CCTGG AG ACT CT G CAGT G TRAV29
Figure imgf000047_0002
TACT TRAV30 CAGACGTGTGCTCTTCCGATCTCAGCAAAGCTCCCTGTACCT
Figure imgf000047_0003
CAG ACGTGT G CT CTT CCG AT CT CACAGCCAG AAG ACCT G CAAC
Figure imgf000047_0004
TRAV31
AT
Figure imgf000047_0005
TRAV32 CAG ACGT GT G CT CTT CCG AT CTA ACAT GTCTCCCTG CAT ATT AC
AG CAG ACGTGTG CT CTT C CG AT CTTT CAT CAACCT C ACCAT CA ATT C
Figure imgf000047_0006
TRAV33
C CAG ACGT GTG CT CTT CCG AT CT CAG CAA AGTT CCCTG CAT AT CA
Figure imgf000047_0007
TRAV34
C CAG ACGT GTG CT CTT CCG AT CT AT A ACC AG AAAG G ACAG CTT C
Figure imgf000047_0008
TRAV35
C TRAV36 CAGACGTGTGCTCTTCCGATCTATCACAGCCACCCAGACCGGA
Figure imgf000047_0009
TRAV37 C GAAGCACTGTGTGCTCTTCCGATCTAGATTCACAGCCAGGCTTAAAA
Figure imgf000047_0010
TRAV38-1 CAGACGTGTGCTCTTCCGATCTTTCCAGAAAGCAGCCAAATCC
Figure imgf000047_0011
TRAV38-2 CAGACGTGTGCTCTTCCGATCTCTTCCAGAAAGCAGCCAAATCC
Figure imgf000047_0012
TRAV39 CAGACGTGTGCTCTTCCGATCTCTCAGCACCCTCCACATCAC
Figure imgf000047_0013
Figure imgf000047_0014
TRAV40 CAGACGTGTGCT CTT C CG ATCT CAA A A A CTT CGGAGGCGG A A A
TAT
Figure imgf000047_0015
TRAV41 CAGACGTGTGCTCTTCCGATCTAAAGCACAGCTCCCTGCACATC
AC
TRBV2? CAG ACGT GTGCT CTT CCG AT CTT CAA ATTT CACT CT G A AG AT CC
Figure imgf000047_0016
GGTCCACAA
Figure imgf000047_0017
TRBV3-1 CAG ACGT GTGCT CTT CCG AT CT G CT CACTT AAAT CTT CACAT CA
ATTCCCTGG
Figure imgf000047_0018
TRBV4-1 CAG ACGT GT G CT CTT CCG AT CT CTT A AACCTT CACCTACACG CC
CTGC
Figure imgf000047_0019
TRBV(4-2, 4-3)? CAG ACGT GTGCT CTT CCG AT CT CTT ATT CCTT CACCT ACACACCC
TGC
Figure imgf000047_0020
TRBV5-1? CAG ACGT GT G CT CTT CCG AT CTG CTCTG AG AT G A AT GTG AG C A
CCTTG
Figure imgf000047_0021
TRBV5-3? CAGACGTGTGCTCTTCCGATCTGCTCTGAGATGAATGTGAGTG
CCTTG TRBV(5-4, 5-5, CAG ACGTGTG CTCTTCCG ATCTG CTCTG AG CTG AATGTGAACG
Figure imgf000047_0022
5-6, 5-7, 5-8) CCTTG
Figure imgf000047_0023
TRBV6-1 CAG ACGTGTGCTCTTCCGATCTTCGCTCAGGCTGGAGTCGGCT
G TRBV(6-2, 6-3) CAGACGTGTGCTCTTCCGATCTGCTGGGGTTGGAGTCGGCTG
Figure imgf000047_0024
TRBV6-4? CAGACGTGTGCTCTTCCGATCTCCCTCACGTTGGCGTCTGCTG
Figure imgf000047_0025
TRBV6-5? CAGACGTGTGCTCTTCCGATCTGCTCAGGCTGCTGTCGGCTG
Figure imgf000047_0026
TRBV6-6? CAGACGTGTGCTCTTCCGATCTCGCTCAGGCTGGAGTTGGCTG
Figure imgf000047_0027
TRBV6-7? CAGACGTGTGCTCTTCCGATCTCCCCTCAAGCTGGAGTCAGCT
Figure imgf000047_0028
G TRBV6-8 CAGACGTGTGCTCTTCCGATCTCACTCAGGCTGGTGTCGGCTG
(continuación)
?TRBV6-9? CAGACGTGTGCTCTTCCGATCTCGCTCAGGCTGGAGTCAGCTG
Figure imgf000048_0001
Figure imgf000048_0002
TRBV7-1? CAG ACGT GTGCT CTT CCG AT CT CCACT CTG AAGTT CCAGCG CAC
AC
Figure imgf000048_0003
TRBV7-2? CAG ACGTGTG CT CTTCCG AT CT CACTCTG ACG AT CCAG CG CACA
C
Figure imgf000048_0004
TRBV7-3? CAG ACGT GTGCT CTT CCG AT CT CT CT ACTCTG AAG AT CCAG CG C
ACAG
Figure imgf000048_0005
TRBV7-4? CAG ACGT GT G CT CTT CCG AT CT CCACT CT G A AG AT CCAGCG CAC
AG
Figure imgf000048_0006
TRBV7-6? CAGACGTGTGCTCTTCCGATCTCACTCTGACGATCCAGCGCACA
G
Figure imgf000048_0007
TRBV7-7? CAG ACGT GTGCT CTT CCG AT CT CCACT CT G ACG ATT CAG CG CA C
AG
Figure imgf000048_0008
TRBV7-8? CAG ACGTGTG CT CTT CCG AT CT CCACT CT G A AG AT CCAGCG CAC
AC
Figure imgf000048_0009
TRBV7-9? CAGACGTGTGCTCTTCCGATCTCACCTTGGAGATCCAGCGCAC
AG
Figure imgf000048_0010
TRBV9? CAG ACGT GTGCT CTT CCG AT CT G CACT CT G AACTAAACCT G AG C
TCTCTG TRBV10-1 CAGACGTGTGCTCTTCCGATCTCCCCTCACTCTGGAGTCTGCTG
Figure imgf000048_0011
TRBV10-2? CAG ACGT GT G CT CTT CCG ATCTCCCCCTCACTCTG G AGTCAG CT
Figure imgf000048_0012
A
Figure imgf000048_0013
TRBV10-3 CAG ACGT GT G CT CTTCCG AT CT CCTCCTCACTCTGG AGTC CG CT
A TRBV(11-1, 1 j. CAGACGTGTGCTCTTCCGATCTCCACTCTCAAGATCCAGCCTGC
Figure imgf000048_0014
3) AG
Figure imgf000048_0015
TRBV11-2 CAG ACGT GT G CT CTT CCG AT CT CT CCACT CT CA AG AT CCAG CCT
GCAA TRBV(12-3, 1 2 - CAG ACGT GT G CT CTT CCG AT CT CCACT CT G A AG AT CCAG CCCTC
Figure imgf000048_0016
4, 12-5) AG
Figure imgf000048_0017
TRBV13 CAG ACGTGTG CT CTT CCG AT CT CATT CTG A ACT G A AC AT G AG CT
CCTTGG
TRBV14 CAG ACGT GT G CT CTTCCG AT CT CT ACT CT G A AG GT G CAG CCTG C
Figure imgf000048_0018
AG
Figure imgf000048_0019
TRBV15 CAGACGTGTGCTCTTCCGATCTGATAACTTCCAATCCAGGAGG
CCGAACA
Figure imgf000048_0020
TRBV16 CAGACGTGTGCT CTT C CG ATCTCTGT AG C CTT G AG ATC C AG G CT
ACGA
TRBV17 CAGACGTGTGCT CTT C CG ATCT CTT C C A CG CTG A AG AT CC AT CC
Figure imgf000048_0021
CG
TRBV18 CAG ACG TG TG CT CTT CCG AT CT G CAT CCTG AGG AT CCAG CAGG
Figure imgf000048_0022
TAG TRBV19 CAGACGTGTGCTCTTCCGATCTCCTCTCACTGTGACATCGGCCC
Figure imgf000048_0023
(continuación)
TRBV20-1 CAG ACGT GT G CT CTT CCG AT CT CTT GT CCACT CTG ACAGTG A CC SEQ ID NO: 388
AGTG
TRBV23-1 CAG ACGT GT G CT CTT CCG AT CT CAG CCTG G CAAT CCT GT CCT CA SEQ ID NO: 389
G
TRBV24-1 CAG ACGT GT G CT CTTCCG AT CT CTCCCTGTCCCT AG AGT CT G CC SEQ ID NO: 390
AT TRBV25-1 CAGACGTGTGCTCTTCCGATCTCCCTGACCCTGGAGTCTGCCA SEQ ID NO: 391 TRBV27 CAGACGTGTGCTCTTCCGATCTCCCTGATCCTGGAGTCGCCCA SEQ ID NO: 392 TRBV28 CAGACGTG TGCTCTTCCGATCTCTCCCTG ATTCTGGAGTCCGCC SEQ ID NO: 393
A
TRBV29-1 CAGACGTGTGCTCTTCCGATCTCTAACATTCTCAACTCTGACTG SEQ ID NO: 394
TGAGCAACA
TRBV30 CAG ACGT GT G CT CTT CCG AT CT CGG CAGTT CAT CCTG AGTTCTA SEQ ID NO: 395
AGAAGC
Métodos para construir y decodificar sustratos
Métodos para cargar marcadores espaciales en un sustrato.
Los marcadores espaciales pueden colocarse previamente en un sustrato. Se puede imprimir previamente una superficie de sustrato con códigos de barras estocásticos. En otras palabras, pueden conocerse las coordenadas de cada código de barras estocástico en la superficie del sustrato. Los códigos de barras estocásticos pueden imprimirse previamente de cualquier manera geométrica. En algunos casos, un soporte sólido que comprende códigos de barras estocásticos puede colocarse previamente en un sustrato.
En algunos casos, las coordenadas de los códigos de barras estocásticos en un sustrato pueden ser desconocidas. La localización de los códigos de barras estocásticos puede ser generada por el usuario. Cuando se desconoce la localización de los códigos de barras estocásticos en un sustrato, se puede decodificar la localización de los códigos de barras estocásticos.
La divulgación proporciona métodos para decodificar sustratos (por ejemplo, matrices) que comprenden códigos de barras estocásticos. La decodificación puede no depender únicamente del uso de firmas ópticas (aunque como se describe en la presente, el uso de perlas con firmas ópticas puede permitir la "reutilización" de las sondas de decodificación), sino más bien en el uso de ácidos nucleicos decodificadores combinatorios que se añaden durante un paso de decodificación. La decodificación puede realizarse con hibridaciones secuenciales. Los ácidos nucleicos decodificadores pueden hibridar con un ácido nucleico que codifica un identificador distinto (sonda identificadora) que se coloca en las perlas, o con el propio agente bioactivo, por ejemplo, cuando el agente bioactivo es un ácido nucleico, por lo menos una parte del cual es de cadena sencilla para permitir la hibridación con una sonda decodificadora. Los ácidos nucleicos decodificadores pueden marcarse directa o indirectamente. La decodificación se produce por la detección de la presencia del marcador.
Los ácidos nucleicos codificantes (también denominados sondas identificadoras (IP) o ácidos nucleicos identificadores) pueden comprender una secuencia de cebador y una secuencia de decodificación adyacente. Cada sonda decodificadora (o de decodificación) puede comprender una secuencia de cebado (a veces denominada en la presente una "secuencia invariante"), que puede hibridar con la secuencia de cebador, y por lo menos un nucleótido decodificador, generalmente contenido dentro de una secuencia variable. Las sondas decodificadoras pueden hacerse como conjuntos, con cada conjunto comprendiendo por lo menos cuatro subconjuntos que tienen cada uno un nucleótido decodificador diferente en la misma posición, es decir, la posición de detección (es decir, adenina, timidina (o uracilo, según se desee), citosina y guanina), comprendiendo cada nucleótido en la posición de detección (nucleótido de detección) un marcador único, preferiblemente un fluoróforo. Las sondas decodificadoras pueden añadirse en condiciones que permitan la discriminación de complementariedad perfecta y complementariedad imperfecta. Por tanto, la sonda decodificadora que comprende la base correcta para el emparejamiento de bases con el nucleótido codificante que se está interrogando puede hibridar mejor. Las otras sondas decodificadoras pueden lavarse. La detección del fluoróforo único asociado con el nucleótido de detección puede permitir la identificación del nucleótido codificante en esa posición. Repitiendo estos pasos con un nuevo conjunto de sondas de decodificación que extienden la posición del nucleótido de detección en una base, puede dilucidarse la identidad del siguiente nucleótido codificante. La decodificación puede usar una gran cantidad de sondas. Puede usarse síntesis combinatoria dividida y mixta para preparar las sondas de decodificación.
Puede usarse el análisis de paridad durante la decodificación para aumentar la solidez y precisión del sistema. El análisis de paridad puede referirse a un paso de decodificación en el que la señal de un elemento particular puede analizarse a través de una pluralidad de etapas de decodificación. Es decir, después de por lo menos un paso de decodificación, puede analizarse la señal de un elemento de matriz a través de las etapas de decodificación. La señal de una perla particular puede evaluarse a través de múltiples etapas. Aunque el análisis puede incluir cualquier parámetro que pueda obtenerse de las señales, como evaluar la señal total obtenida en las etapas, puede analizarse la paridad de las señales a través de las etapas.
La paridad puede referirse a la lectura digital o modular de señales, es decir, pares o impares, cuando se usan señales binarias. La suma de dígitos de las señales a través de una pluralidad de etapas puede traducirse en una determinación de paridad. La determinación de la paridad puede resultar útil para evaluar el proceso de decodificación. Por ejemplo, los códigos pueden diseñarse para tener un número impar de una señal particular, por ejemplo, una señal roja, cuando se ven en todas las etapas o pasos de decodificación, o una pluralidad predeterminada de etapas o pasos de decodificación. La detección de un número par de etapas rojas puede proporcionar una indicación de que se ha producido un error en algún punto de la decodificación. Cuando se obtiene este resultado, el código defectuoso puede o descartarse o repetirse el análisis.
La divulgación proporciona la introducción de una "etapa redundante" en el sistema de decodificación. Una etapa redundante puede referirse a una etapa que sirve como verificación de paridad. Es decir, después de las etapas de decodificación, puede incluirse una etapa adicional para analizar la paridad. Este análisis puede proporcionar una indicación de la competencia o validez de la decodificación. Cuando los códigos se diseñan con una paridad predeterminada, puede usarse la etapa redundante para detectar la paridad de las señales obtenidas del paso de decodificación. La etapa redundante puede detectar errores en la paridad porque si ha habido un error en la decodificación, la paridad detectada después de la etapa redundante será diferente de la paridad diseñada en los códigos.
En algunos casos, la decodificación puede producirse mediante el uso de oligonucleótidos de 8 mer unidos entre sí para crear un oligonucleótido de decodificación con unos pocos 8 mer en él. El oligonucleótido de decodificación puede comprender por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más 8-mer en él. El oligonucleótido de decodificación puede comprender como máximo 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 o más 8-mer en él. El oligonucleótido de decodificación puede hibridar con unos pocos códigos de barras estocásticos diferentes (por ejemplo, hibridando sus diferentes regiones de 8-mer con diferentes regiones de 8-mer en códigos de barras estocásticos). El oligonucleótido de decodificación puede marcarse con fluorescencia, fundirse y secuenciarse. Los oligonucleótidos de decodificación se pueden marcarse con fluorescencia en diferentes colores. Los oligonucleótidos de decodificación pueden marcarse con fluorescencia con el mismo color pero con varios niveles de intensidad fluorescente, generando de este modo un mapa de "escala de grises" de una sonda. Repetir esto puede proporcionar un mapa solucionable de dónde se encuentra cada 8-mer de un código de barras estocástico con respecto a los otros. El método puede repetirse por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más veces. El método puede repetirse como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más veces.
Difusión a través de un sustrato
Cuando una muestra (por ejemplo, una o más células) se marca estocásticamente con código de barras de acuerdo con los métodos de la divulgación, la célula puede lisarse. La lisis de una célula puede dar como resultado la difusión del contenido de la lisis (por ejemplo, contenido celular) lejos de la localización inicial de la lisis. En otras palabras, el contenido de la lisis puede moverse a un área de superficie mayor que el área de superficie ocupada por la célula.
La difusión de la mezcla de lisis de la muestra (por ejemplo, que comprende objetivos) puede modularse mediante varios parámetros que incluyen, pero no se limitan a, la viscosidad de la mezcla de lisis, la temperatura de la mezcla de lisis, el tamaño de los objetivos, el tamaño de las barreras físicas en un sustrato, la concentración de la mezcla de lisis y similares. Por ejemplo, la temperatura de la reacción de lisis puede realizarse a una temperatura de por lo menos 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 35 o 40° C o más. La temperatura de la reacción de lisis puede realizarse a una temperatura de como máximo 1,2, 3, 4, 5, 10, 15, 20, 25, 30, 35 o 40° C o más. La viscosidad de la mezcla de lisis puede alterarse, por ejemplo, añadiendo reactivos espesantes (por ejemplo, glicerol, perlas) para ralentizar la velocidad de difusión. La viscosidad de la mezcla de lisis puede alterarse, por ejemplo, añadiendo reactivos diluyentes (por ejemplo, agua) para aumentar la velocidad de difusión. Un sustrato puede comprender barreras físicas (por ejemplo, pocillos, micropocillos, microcuencas) que pueden alterar la velocidad de difusión de los objetivos de una muestra. La concentración de la mezcla de lisis puede alterarse para aumentar o disminuir la velocidad de difusión de los objetivos de una muestra. La concentración de una mezcla de lisis puede aumentarse o disminuirse en por lo menos 1, 2, 3, 4, 5, 6, 7, 8 o 9 o más veces. La concentración de una mezcla de lisis puede aumentarse o disminuirse como máximo 1,2, 3, 4, 5, 6, 7, 8 o 9 o más veces.
Puede aumentarse la velocidad de difusión. Puede reducirse la velocidad de difusión. La velocidad de difusión de una mezcla de lisis puede aumentarse o disminuirse en por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más veces en comparación con una mezcla de lisis no alterada. La velocidad de difusión de una mezcla de lisis puede aumentarse o disminuirse como máximo 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 o más veces en comparación con una mezcla de lisis no alterada. La velocidad de difusión de una mezcla de lisis puede aumentarse o disminuirse en por lo menos un 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100% en comparación con una mezcla de lisis no alterada. La velocidad de difusión de una mezcla de lisis puede aumentarse o disminuirse en por lo menos un 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100% en comparación con una mezcla de lisis no alterada.
Software de análisis y visualización de datos
Análisis y visualización de datos de resolución espacial de objetivos.
La divulgación proporciona métodos para estimar el número y la posición de los objetivos marcados con códigos de barras estocásticos y recuento digital usando marcadores espaciales. Los datos obtenidos de los métodos de divulgación pueden visualizarse en un mapa. Puede construirse un mapa del número y la localización de los objetivos de una muestra usando información generada usando los métodos descritos en la presente. El mapa puede usarse para localizar una localización física de un objetivo. El mapa puede usarse para identificar la localización de múltiples objetivos. Los múltiples objetivos pueden ser la misma especie de objetivo, o los objetivos múltiples pueden ser varios objetivos diferentes. Por ejemplo, puede construirse un mapa de un cerebro para mostrar el recuento digital y la localización de múltiples objetivos.
El mapa puede generarse a partir de datos de una sola muestra. El mapa puede construirse usando datos de múltiples muestras, generando de este modo un mapa combinado. El mapa puede construirse con datos de decenas, cientos y/o miles de muestras. Un mapa construido a partir de múltiples muestras puede mostrar una distribución de recuentos digitales de objetivos asociados con regiones comunes a las múltiples muestras. Por ejemplo, pueden mostrarse en el mismo mapa los ensayos replicados. Pueden mostrarse por lo menos 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más réplicas (por ejemplo, superpuestas) en el mismo mapa. Como máximo, pueden mostrarse 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 o más réplicas (por ejemplo, superpuestas) en el mismo mapa. La distribución espacial y el número de objetivos pueden representarse mediante una variedad de estadísticas.
La combinación de datos de varias muestras puede aumentar la resolución de localización del mapa combinado. La orientación de múltiples muestras puede registrarse mediante puntos de referencia comunes, en los que las mediciones de localizaciones individuales a través de muestras son por lo menos en parte no contiguas. Un ejemplo particular es seccionar una muestra usando un micrótomo en un eje y luego seccionar una segunda muestra a lo largo de un acceso diferente. El conjunto de datos combinado proporcionará localizaciones espaciales tridimensionales asociadas con recuentos digitales de objetivos. La multiplexación del enfoque anterior permitirá mapas tridimensionales de alta resolución de estadísticas de recuento digital.
En algunas realizaciones del sistema de instrumentos, el sistema comprenderá medios legibles por ordenador que incluyen código para proporcionar análisis de datos para los conjuntos de datos de secuencias generados mediante la realización de ensayos de códigos de barras estocásticos de células individuales. Los ejemplos de la funcionalidad de análisis de datos que puede proporcionar el software de análisis de datos incluyen, pero no se limitan a, (i) algoritmos para decodificar/demultiplexar el marcador de la muestra, el marcador de la célula, el marcador espacial y el marcador molecular, y los datos de secuencia objetivo proporcionados secuenciando la biblioteca de códigos de barras estocásticos creada al ejecutar el ensayo, (ii) algoritmos para determinar el número de lecturas por gen por célula y el número de moléculas de transcripción únicas por gen por célula, en base a los datos, y creando tablas de resumen, (iii) análisis estadístico de los datos de secuencia, por ejemplo para la agrupación de células mediante datos de expresión génica, o para predecir intervalos de confianza para la determinación del número de moléculas de transcripción por gen por célula, etc., (iv) algoritmos para identificar subpoblaciones de células raras, por ejemplo, usando análisis de componentes principales, agrupación jerárquica, agrupación por medias k, mapas autoorganizados, redes neuronales, etc., (v) capacidades de alineación de secuencias para la alineación de datos de secuencias de genes con secuencias de referencia conocidas y detección de mutaciones, marcadores polimórficos y variantes de corte y empalme, y (vi) agrupación automatizada de marcadores moleculares para compensar errores de secuenciación o amplificación. En algunas realizaciones, puede usarse software disponible comercialmente para realizar todo o una parte del análisis de datos, por ejemplo, puede usarse el software Seven Bridges (https://www.sbgenomics.com/) para compilar tablas del número de copias de uno o más genes que se encuentran en cada célula para la colección completa de células. En algunas realizaciones, el software de análisis de datos puede incluir opciones para generar los resultados de la secuenciación en formatos gráficos útiles, por ejemplo, mapas de calor que indican el número de copias de uno o más genes que se encuentran en cada célula de una colección de células. En algunas realizaciones, el software de análisis de datos puede comprender además algoritmos para extraer el significado biológico de los resultados de la secuenciación, por ejemplo, correlacionando el número de copias de uno o más genes que se encuentran en cada célula de una colección de células con un tipo de célula, un tipo de célula rara o una célula derivada de un sujeto que padece una enfermedad o afección específica. En alguna realización, el software de análisis de datos puede comprender además algoritmos para comparar poblaciones de células entre diferentes muestras biológicas.
En algunas realizaciones, toda la funcionalidad de análisis de datos puede estar empaquetada dentro de un único paquete de software. En algunas realizaciones, el conjunto completo de capacidades de análisis de datos puede comprender un conjunto de paquetes de software. En algunas realizaciones, el software de análisis de datos puede ser un paquete independiente que se pone a disposición de los usuarios independientemente del sistema de instrumentos de ensayo. En algunas realizaciones, el software puede estar basado en la web y puede permitir a los usuarios compartir datos.
Procesadores de sistema y redes
En general, el ordenador o procesador incluido en los sistemas de instrumentos divulgados actualmente, como se ilustra en la Figura 24, puede entenderse además como un aparato lógico que puede leer instrucciones del medio 511 o un puerto de red 505, que puede conectarse opcionalmente al servidor 509 que tiene un medio fijo 512.
El sistema 500, como se muestra en la Figura 24 puede incluir una CPU 501, unidades de disco 503, dispositivos de entrada opcionales como teclado 515 o ratón 516 y un monitor opcional 507. La comunicación de datos puede lograrse a través del medio de comunicación indicado a un servidor en una localización local o remota. El medio de comunicación puede incluir cualquier medio de transmisión o recepción de datos. Por ejemplo, el medio de comunicación puede ser una conexión de red, una conexión inalámbrica o una conexión a Internet. Tal conexión puede proporcionar comunicación a través de la World Wide Web. Se prevé que los datos relacionados con la presente divulgación puedan transmitirse a través de dichas redes o conexiones para su recepción o revisión por una parte 522 como se ilustra en la Figura 24.
La Figura 25 ilustra una realización ejemplar de un primer ejemplo de arquitectura de un sistema informático 100 que puede usarse en conexión con realizaciones ejemplares de la presente divulgación. Como se representa en la Figura 25, el sistema informático de ejemplo puede incluir un procesador 102 para procesar instrucciones. Ejemplos no limitativos de procesadores incluyen: procesador Intel XeonTM, procesador AMD OpteronTM, procesador Samsung RISC ArM 1176JZ(F)-S v1.0TM de 32 bits, procesador ARM Cortex-A8 Samsung S5PC100TM, procesador ARM Cortex-A8 Apple A4TM, Marvell Procesador PXA 930TM o un procesador funcionalmente equivalente. Pueden usarse varios subprocesos de ejecución para el procesamiento en paralelo. En algunas realizaciones, también pueden usarse múltiples procesadores o procesadores con múltiples núcleos, ya sea en un solo sistema informático, en un grupo o distribuidos entre sistemas a través de una red que comprende una pluralidad de ordenadores, teléfonos móviles o dispositivos de asistencia de datos personales.
Como se ilustra en la Figura 25, puede conectarse o incorporarse una memoria caché de alta velocidad 104 al procesador 102 para proporcionar una memoria de alta velocidad para instrucciones o datos que han sido usados recientemente o son usados frecuentemente por el procesador 102. El procesador 102 está conectado a un puente norte 106 mediante un bus de procesador 108. El puente norte 106 está conectado a la memoria de acceso aleatorio (RAM) 110 mediante un bus de memoria 112 y gestiona el acceso a la RAM 110 mediante el procesador 102. El puente norte 106 también está conectado a un puente sur 114 mediante un bus de chipset 116. El puente sur 114 está, a su vez, conectado a un bus de periféricos 118. El bus de periféricos puede ser, por ejemplo, PCI, PCI-X, PCI Express u otro bus de periféricos. A menudo se hace referencia al puente norte y al puente sur como chipset de procesador y administran la transferencia de datos entre el procesador, la RAM y los componentes periféricos en el bus periférico 118. En algunas arquitecturas alternativas, la funcionalidad del puente norte puede incorporarse al procesador en lugar de usar un chip de puente norte separado.
En algunas realizaciones, el sistema 100 puede incluir una tarjeta aceleradora 122 unida al bus periférico 118. La aceleradora puede incluir matrices de puertas programables en campo (FPGA) u otro hardware para acelerar cierto procesamiento. Por ejemplo, puede usarse una aceleradora para la reestructuración adaptativa de datos o para evaluar expresiones algebraicas usadas en el procesamiento de conjuntos extendidos.
El software y los datos se almacenan en el almacenamiento externo 124 y pueden cargarse en la RAM 110 o en la memoria caché 104 para su uso por el procesador. El sistema 100 incluye un sistema operativo para gestionar los recursos del sistema; los ejemplos no limitativos de sistemas operativos incluyen: Linux, WindowsTM, MACOSTM, BlackBerry OSTM, iOSTM y otros sistemas operativos funcionalmente equivalentes, así como software de aplicación que se ejecuta en la parte superior del sistema operativo para gestionar el almacenamiento de datos y la optimización de acuerdo con las realizaciones ejemplares de la presente divulgación.
En este ejemplo, el sistema 100 también incluye tarjetas de interfaz de red (NIC) 120 y 121 conectadas al bus de periféricos para proporcionar interfaces de red al almacenamiento externo, como almacenamiento conectado a la red (NAS) y otros sistemas informáticos que pueden usarse para el procesamiento paralelo distribuido.
La Figura 26 ilustra un diagrama ejemplar que muestra una red 200 con una pluralidad de sistemas informáticos 202a y 202b, una pluralidad de teléfonos móviles y asistentes de datos personales 202c, y almacenamiento conectado a la red (NAS) 204a y 204b. En realizaciones ejemplares, los sistemas 212a, 212b y 212c pueden gestionar el almacenamiento de datos y optimizar el acceso a los datos para los datos almacenados en el almacenamiento conectado a la red (NAS) 214a y 214b. Puede usarse un modelo matemático para los datos y evaluarlo usando procesamiento paralelo distribuido en los sistemas informáticos 212a y 212b, y sistemas auxiliares de datos personales y de teléfonos móviles 212c. Los sistemas informáticos 212a y 212b, y los sistemas auxiliares de datos personales y de teléfonos móviles 212c también pueden proporcionar un procesamiento paralelo para la reestructuración adaptativa de los datos almacenados en el almacenamiento conectado a la red (NAS) 214a y 214b.
La Figura 26 ilustra un ejemplo solamente, y pueden usarse una amplia variedad de otras arquitecturas y sistemas informáticos junto con las varias realizaciones de la presente invención. Por ejemplo, puede usarse un servidor Blade para proporcionar procesamiento en paralelo. Los blades del procesador se pueden conectar a través de un plano posterior para proporcionar un procesamiento paralelo. El almacenamiento también puede conectarse al plano posterior o como almacenamiento conectado a la red (NAS) a través de una interfaz de red separada.
En algunas realizaciones ejemplares, los procesadores pueden mantener espacios de memoria separados y transmitir datos a través de interfaces de red, panel posterior u otros conectores para procesamiento en paralelo por otros procesadores. En otras realizaciones, algunos o todos los procesadores pueden usar un espacio de memoria de direcciones virtuales compartido.
La Figura 27 ilustra un diagrama de bloques ejemplar de un sistema informático multiprocesador 300 que usa un espacio de memoria de dirección virtual compartida de acuerdo con una realización ejemplar. El sistema incluye una pluralidad de procesadores 302a-f que pueden acceder a un subsistema de memoria compartida 304. El sistema incorpora una pluralidad de procesadores de algoritmos de memoria de hardware programables (MAP) 306a-f en el subsistema de memoria 304. Cada MAP 306a-f puede comprender un memoria 308a-f y una o más matrices de puertas programables de campo (FPGA) 310a-f. El MAP proporciona una unidad funcional configurable y pueden proporcionarse algoritmos particulares o porciones de algoritmos a las FPGA 310a-f para procesar en estrecha coordinación con un procesador respectivo. Por ejemplo, los MAP pueden usarse para evaluar expresiones algebraicas con respecto al modelo de datos y para realizar una reestructuración adaptativa de datos en realizaciones ejemplares. En este ejemplo, todos los procesadores pueden acceder globalmente a cada MAP para estos propósitos. En una configuración, cada MAP puede usar el acceso directo a memoria (DMA) para acceder a una memoria asociada 308a-f, lo que le permite ejecutar tareas de manera independiente y asíncrona desde el microprocesador respectivo 302a-f. En esta configuración, un MAP puede enviar resultados directamente a otro MAP para la canalización y la ejecución paralela de algoritmos.
Las arquitecturas y sistemas informáticos anteriores son solo ejemplos, y puede usarse una amplia variedad de otras arquitecturas y sistemas informáticos, teléfonos móviles y asistentes de datos personales en relación con las realizaciones ejemplares, incluyendo los sistemas que usan cualquier combinación de procesadores generales, coprocesadores, FPGA y otros dispositivos lógicos programables, sistema en chips (SOC), circuitos integrados específicos de aplicación (ASIC) y otros elementos de procesamiento y lógicos. En algunas realizaciones, todo o parte del sistema informático puede implementarse en software o hardware. Puede usarse cualquier variedad de medios de almacenamiento de datos en conexión con las realizaciones ejemplares, incluyendo memoria de acceso aleatorio, discos duros, memoria flash, unidades de cinta, matrices de discos, almacenamiento conectado a la red (NAS) y otros dispositivos y sistemas de almacenamiento de datos locales o distribuidos.
En realizaciones ejemplares, el subsistema informático de la presente divulgación puede implementarse usando módulos de software que se ejecutan en cualquiera de las arquitecturas y sistemas informáticos anteriores o en otras. En otras realizaciones, las funciones del sistema pueden implementarse parcial o completamente en firmware, dispositivos lógicos programables como matrices de puertas programables en campo (FPGA), sistema en chips (SOC), circuitos integrados específicos de aplicación (ASIC) u otros elementos de procesamiento y lógicos. Por ejemplo, puede implementarse el Set Processor and Optimizer con aceleración de hardware mediante el uso de una tarjeta aceleradora de hardware, como una tarjeta aceleradora.
Kits
En la presente se divulgan kits para realizar ensayos de códigos de barras estocásticos de células individuales. El kit puede comprender uno o más sustratos (por ejemplo, matriz de micropocillos), ya sea como un sustrato (o chip) independiente que comprende una o más matrices de micropocillos, o empaquetado dentro de una o más células de flujo o cartuchos, y una o más suspensiones de soportes sólidos, en donde los soportes sólidos individuales dentro de una suspensión comprenden una pluralidad de códigos de barras estocásticos unidos de la divulgación. En algunas realizaciones, el kit puede comprender además un dispositivo mecánico para montar un sustrato independiente para crear pocillos de reacción que faciliten el pipeteo de muestras y reactivos en el sustrato. El kit puede comprender además reactivos, por ejemplo, tampones de lisis, tampones de enjuagado o tampones de hibridación, para realizar el ensayo de códigos de barras estocásticos. El kit puede comprender además reactivos (por ejemplo, enzimas, cebadores, dNTP, NTP, inhibidores de ARNasa o tampones) para realizar reacciones de extensión de ácidos nucleicos, por ejemplo, reacciones de transcripción inversa. El kit puede comprender además reactivos (por ejemplo, enzimas, cebadores universales, cebadores de secuenciación, cebadores específicos de objetivo o tampones) para realizar reacciones de amplificación para preparar bibliotecas de secuenciación.
Los kits pueden comprender una placa (por ejemplo, placa de 96 pocilios) en donde cada pocilio de la placa puede comprender uno o más cebadores de transcripción inversa. El número de tipos de cebadores de transcripción inversa en cada pocillo puede ser por lo menos 1,2, 3, 4, 5, 6, 7, 8, 9 o 10 o más. El número de tipos de cebadores de transcripción inversa en cada pocillo puede ser como máximo 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 o más. Los cebadores de transcripción inversa pueden ser específicos de un gen, por ejemplo, específicos de un gen para una o más cadenas alfa de un TCR, una o más cadenas beta de un TCR, o una o más de las cadenas alfa y beta del TCR, y/o para un marcador de TCR.
El kit puede comprender cebadores directos específicos de genes. Pueden usarse cebadores directos específicos de genes en N1 y/o N2 (por ejemplo, anidados). Los cebadores específicos de genes pueden ser específicos para cualquier gen. En algunos casos, los cebadores directos específicos de genes son específicos para las células T.
El kit puede comprender uno o más cebadores de secuenciación (por ejemplo, cebadores de célula de flujo de secuenciación) para su uso en una reacción de secuenciación.
El kit puede comprender uno o más moldes, por ejemplo, moldes que comprenden una matriz de micropilares, para moldear sustratos (por ejemplo, matrices de micropocillos) y uno o más soportes sólidos (por ejemplo, perlas), en donde las perlas individuales dentro de una suspensión comprenden una pluralidad de códigos de barras estocásticos unidos de la divulgación. El kit puede comprender además un material para su uso en sustratos de moldeo (por ejemplo, agarosa, un hidrogel, PDMS y similares).
El kit puede comprender uno o más sustratos que están precargados con soportes sólidos que comprenden una pluralidad de códigos de barras estocásticos unidos de la divulgación. En algunos casos, puede haber un soporte sólido por micropocillo del sustrato. En algunas realizaciones, la pluralidad de códigos de barras estocásticos puede unirse directamente a una superficie del sustrato, en lugar de a un soporte sólido. En cualquiera de estas realizaciones, la una o más matrices de micropocillos pueden proporcionarse en forma de sustratos (o chips) independientes, o pueden empaquetarse en células de flujo o cartuchos.
En algunas realizaciones de los kits divulgados, el kit puede comprender uno o más cartuchos que incorporan uno o más sustratos. En algunas realizaciones, el uno o más cartuchos pueden comprender además uno o más soportes sólidos precargados, en donde los soportes sólidos individuales dentro de una suspensión comprenden una pluralidad de códigos de barras estocásticos unidos de la divulgación. En algunas realizaciones, las perlas pueden distribuirse previamente en la una o más matrices de micropocillos del cartucho. En algunas realizaciones, las perlas, en forma de suspensiones, pueden precargarse y almacenarse dentro de los pocillos de reactivo del cartucho. En algunas realizaciones, el uno o más cartuchos pueden comprender además otros reactivos de ensayo que están precargados y almacenados dentro de los depósitos de reactivo de los cartuchos.
El kit puede incluir software (por ejemplo, software de la divulgación). El software puede comprender scripts que pueden ejecutarse localmente en un ordenador o desde la nube. El software puede usarse para analizar datos de secuenciación (por ejemplo, para contar el número de índices moleculares de un objetivo, para ajustar la cantidad de índices moleculares contados para un objetivo, para proporcionar secuencias del objetivo que se han contado).
Los kits pueden incluir generalmente instrucciones para llevar a cabo uno o más de los métodos descritos en la presente. Las instrucciones incluidas en los kits pueden adherirse al material de embalaje o pueden incluirse como un prospecto. Aunque las instrucciones suelen ser materiales escritos o impresos, no están limitadas a ellos. La divulgación contempla cualquier medio capaz de almacenar tales instrucciones y comunicarlas a un usuario final. Tales medios pueden incluir, pero no se limitan a, medios de almacenamiento electrónicos (por ejemplo, discos magnéticos, cintas, cartuchos, chips), medios ópticos (por ejemplo, CD ROM), etiquetas RF y similares. Como se usa en la presente, el término "instrucciones" puede incluir la dirección de un sitio de Internet que proporciona las instrucciones.
Dispositivos
Células de flujo
El sustrato de la matriz de micropocillos puede empaquetarse dentro de una célula de flujo que proporciona una interfaz conveniente con el resto del sistema de manejo de fluidos y facilita el intercambio de fluidos, por ejemplo, suspensiones de soporte sólido y celular, tampones de lisis, tampones de enjuagado etc., que se administran a la matriz de micropocillos y/o gotita de emulsión. Las características de diseño pueden incluir: (i) uno o más puertos de entrada para introducir muestras de células, suspensiones de soportes sólidos u otros reactivos de ensayo, (ii) una o más cámaras de matriz de micropocillos diseñadas para proporcionar un llenado uniforme y un intercambio de fluidos eficiente a la vez que se minimiza el retorno remolinos o zonas muertas, y (iii) uno o más puertos de salida para la administración de fluidos a un punto de recogida de muestras o un depósito de desechos.
El diseño de la célula de flujo puede incluir una pluralidad de cámaras de micromatrices que interactúan con una pluralidad de matrices de micropocillos de tal manera que una o más muestras de células diferentes pueden procesarse en paralelo. El diseño de la célula de flujo puede incluir además características para crear perfiles de velocidad de flujo uniformes, es decir, "flujo de tapón", a lo ancho de la cámara de la matriz para proporcionar una administración más uniforme de células y perlas a los micropocillos, por ejemplo, mediante el uso de un barrera porosa localizada cerca de la entrada de la cámara y en sentido ascendente de la matriz de micropocillos como un "difusor de flujo", o dividiendo cada cámara de matriz en varias subsecciones que cubren colectivamente la misma área total de la matriz, pero a través de las cuales fluye en paralelo la corriente de fluido de entrada dividida. En algunas realizaciones, la célula de flujo puede encerrar o incorporar más de un sustrato de matriz de micropocillos. En algunas realizaciones, el montaje integrado de célula de flujo/matriz de micropocillos puede constituir un componente fijo del sistema. En algunas realizaciones, el montaje de célula de flujo/matriz de micropocillos puede ser extraíble del instrumento.
En general, las dimensiones de los canales de fluido y la o las cámaras de la matriz en los diseños de célula de flujo se optimizarán para (i) proporcionar una administración uniforme de células y perlas a la matriz de micropocillos, y (ii) para minimizar el consumo de muestra y reactivo. En algunas realizaciones, la anchura de los canales de fluido estará entre 50 um y 20 mm. En otras realizaciones, la anchura de los canales de fluido puede ser de por lo menos 50 um, por lo menos 100 um, por lo menos 200 um, por lo menos 300 um, por lo menos 400 um, por lo menos 500 um, por lo menos 750 um, por lo menos 1 mm, por lo menos 2,5 mm, por lo menos 5 mm, por lo menos 10 mm, por lo menos 20 mm, por lo menos 50 mm, por lo menos 100 mm, o por lo menos 150 mm. En otras realizaciones más, la anchura de los canales de fluido puede ser de como máximo 150 mm, como máximo 100 mm, como máximo 50 mm, como máximo 20 mm, como máximo 10 mm, como máximo 5 mm, como máximo 2,5 mm, como máximo 1 mm, como máximo 750 um, como máximo 500 um, como máximo 400 um, como máximo 300 um, como máximo 200 um, como máximo 100 um o como máximo 50 um. En una realización, la anchura de los canales de fluido es de aproximadamente 2 mm. La anchura de los canales de fluido puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo, de aproximadamente 250 um a aproximadamente 3 mm).
En algunas realizaciones, la profundidad de los canales de fluido estará entre 50 um y 2 mm. En otras realizaciones, la profundidad de los canales de fluido puede ser de por lo menos 50 um, por lo menos 100 um, por lo menos 200 um, por lo menos 300 um, por lo menos 400 um, por lo menos 500 um, por lo menos 750 um, por lo menos 1 mm, por lo menos 1,25 mm, por lo menos 1,5 mm, por lo menos 1,75 mm, o por lo menos 2 mm. En otras realizaciones más, la profundidad de los canales de fluido puede ser de como máximo 2 mm, como máximo 1,75 mm, como máximo 1,5 mm, como máximo 1,25 mm, como máximo 1 mm, como máximo 750 um, como máximo 500 um, como máximo 400 um, como máximo 300 um, como máximo 200 um, como máximo 100 um, o como máximo 50 um. En una realización, la profundidad de los canales de fluido es de aproximadamente 1 mm. La profundidad de los canales de fluido puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo, de aproximadamente 800 um a aproximadamente 1 mm).
Las células de flujo pueden fabricarse usando una variedad de técnicas y materiales conocidos por los expertos en la técnica. En general, la célula de flujo se fabricará como una pieza separada y, posteriormente, se sujetará mecánicamente o se unirá permanentemente al sustrato de la matriz de micropocillos. Ejemplos de técnicas de fabricación adecuadas incluyen mecanizado convencional, mecanizado CNC, moldeado por inyección, impresión 3D, alineación y laminación de una o más capas de películas de polímero troqueladas o cortadas por láser, o cualquiera de una serie de técnicas de microfabricación como fotolitografía y grabado químico húmedo, grabado en seco, grabado profundo con iones reactivos o micromecanizado con láser. Una vez que se ha fabricado la parte de la célula de flujo, puede unirse mecánicamente al sustrato de la matriz de micropocillos, por ejemplo, sujetándola contra el sustrato de la matriz de micropocillos (con o sin el uso de una junta), o puede unirse directamente al sustrato de la matriz de micropocillos usando cualquiera de una variedad de técnicas (dependiendo de la elección de materiales usados) conocidas por los expertos en la técnica, por ejemplo, mediante el uso de unión anódica, unión térmica o cualquiera de una variedad de adhesivos o películas adhesivas, incluyendo los adhesivos a base de epoxi, a base de acrílico, a base de silicona, curables por UV, a base de poliuretano o a base de cianoacrilato.
Las células de flujo pueden fabricarse usando una variedad de materiales conocidos por los expertos en la técnica. En general, la elección del material usado dependerá de la elección de la técnica de fabricación usada y viceversa. Los ejemplos de materiales adecuados incluyen, pero no se limitan a, silicio, sílice fundida, vidrio, cualquiera de una variedad de polímeros, por ejemplo, polidimetilsiloxano (PDMS; elastómero), polimetilmetacrilato (PMMA), policarbonato (PC), polipropileno (PP), polietileno (PE), polietileno de alta densidad (HDPE), poliimida, polímeros olefínicos cíclicos (COP), copolímeros olefínicos cíclicos (COC), tereftalato de polietileno (PET), resinas epoxi, metales (por ejemplo, aluminio, acero inoxidable, cobre, níquel, cromo y titanio), un material antiadherente como el teflón (PTFE) o una combinación de estos materiales.
Cartuchos
En algunas realizaciones del sistema, la matriz de micropocillos, con o sin una célula de flujo unida, puede empaquetarse dentro de un cartucho consumible que interactúa con el sistema de instrumentos. Las características de diseño de los cartuchos pueden incluir (i) uno o más puertos de entrada para crear conexiones de fluido con el instrumento o introducir manualmente muestras de células, suspensiones de perlas u otros reactivos de ensayo en el cartucho, (ii) uno o más canales de derivación, es decir, para la automedición de muestras de células y suspensiones de perlas, para evitar el sobrellenado o el reflujo, (iii) uno o más montajes integrados de célula de flujo/matriz de micropocillos, o una o más cámaras dentro de las cuales se colocan los sustratos de la micromatriz, (iv) bombas en miniatura integradas u otros mecanismos de accionamiento de fluido para controlar el flujo de fluido a través del dispositivo, (v) válvulas en miniatura integradas (u otros mecanismos de contención) para compartimentar reactivos precargados (por ejemplo, suspensiones de perlas) o controlar el flujo de fluido a través del dispositivo, (vi) uno o más respiraderos para proporcionar una vía de escape para el aire atrapado, (vii) uno o más depósitos de desechos de muestras y reactivos, (viii) uno o más puertos de salida para crear conexiones de fluido con el instrumento o proporcionar un punto de recogida de muestras procesadas, (ix) características de interfaz mecánica para colocar de manera reproducible el cartucho consumible extraíble con respeto al sistema de instrumentos, y para proporcionar acceso de tal manera que los imanes externos puedan acercarse a la matriz de micropocillos, (x) componentes de control de temperatura integrados o una interfaz térmica para proporcionar un buen contacto térmico con el sistema de instrumentos, y (xi) características de interfaz óptica, por ejemplo una ventana transparente, para su uso en la interrogación óptica de la matriz de micropocillos.
El cartucho puede diseñarse para procesar más de una muestra en paralelo. El cartucho puede comprender además una o más cámaras de recogida de muestras extraíbles que sean adecuadas para interactuar con termocicladores de PCR independientes o instrumentos de secuenciación. El propio cartucho puede ser adecuado para interactuar con termocicladores de PCR independientes o instrumentos de secuenciación. El término "cartucho", como se usa en esta divulgación, puede significar que incluye cualquier conjunto de piezas que contenga la muestra y las perlas durante la realización del ensayo.
El cartucho puede comprender además componentes que están diseñados para crear barreras físicas o químicas que eviten la difusión de (o aumenten las trayectorias y los tiempos de difusión de) moléculas grandes para minimizar la contaminación cruzada entre micropocillos. Los ejemplos de tales barreras pueden incluir, pero no se limitan a, un patrón de canales serpentinos usados para la administración de células y soportes sólidos (por ejemplo, perlas) a la matriz de micropocillos, una pletina retráctil o una membrana deformable que se presiona en contacto con la superficie del sustrato de la matriz de micropocillos durante los pasos de lisis o incubación, el uso de perlas más grandes, por ejemplo, perlas de Sephadex como se ha descrito anteriormente, para bloquear las aberturas de los micropocillos, o la liberación de un fluido hidrófobo inmiscible de un depósito dentro del cartucho durante los pasos de lisis o de incubación, para separar y compartimentar eficazmente cada micropocillo en la matriz.
Las dimensiones de los canales de fluido y la cámara o cámaras de la matriz en los diseños de cartucho pueden optimizarse para (i) proporcionar una administración uniforme de células y perlas a la matriz de micropocillos, y (ii) para minimizar el consumo de muestra y reactivo. La anchura de los canales de fluido puede estar entre 50 micrómetros y 20 mm. En otras realizaciones, la anchura de los canales de fluido puede ser de por lo menos 50 micrómetros, por lo menos 100 micrómetros, por lo menos 200 micrómetros, por lo menos 300 micrómetros, por lo menos 400 micrómetros, por lo menos 500 micrómetros, por lo menos 750 micrómetros, por lo menos 1 mm, por lo menos 2,5 mm, por lo menos 5 mm, por lo menos 10 mm, o por lo menos 20 mm. En otras realizaciones más, la anchura de los canales de fluido puede ser de como máximo 20 mm, como máximo 10 mm, como máximo 5 mm, como máximo 2,5 mm, como máximo 1 mm, como máximo 750 micrómetros, como máximo 500 micrómetros, como máximo 400 micrómetros, como máximo 300 micrómetros, como máximo 200 micrómetros, como máximo 100 micrómetros o como máximo 50 micrómetros. La anchura de los canales de fluido puede ser de aproximadamente 2 mm. La anchura de los canales de fluido puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo, de aproximadamente 250 um a aproximadamente 3 mm).
Los canales de fluido en el cartucho pueden tener una profundidad. La profundidad de los canales de fluido en los diseños de cartucho puede estar entre 50 micrómetros y 2 mm. La profundidad de los canales de fluido puede ser de por lo menos 50 micrómetros, por lo menos 100 micrómetros, por lo menos 200 micrómetros, por lo menos 300 micrómetros, por lo menos 400 micrómetros, por lo menos 500 micrómetros, por lo menos 750 micrómetros, por lo menos 1 mm, por lo menos 1,25 mm, por lo menos 1,5 mm, por lo menos 1,75 mm o por lo menos 2 mm. La profundidad de los canales de fluido puede ser de como máximo 2 mm, como máximo 1,75 mm, como máximo 1,5 mm, como máximo 1,25 mm, como máximo 1 mm, como máximo 750 micrómetros, como máximo 500 micrómetros, como máximo 400 micrómetros, como máximo 300 micrómetros, como máximo 200 micrómetros, como máximo 100 micrómetros o como máximo 50 micrómetros. La profundidad de los canales de fluido puede ser de aproximadamente 1 mm. La profundidad de los canales de fluido puede caer dentro de cualquier intervalo limitado por cualquiera de estos valores (por ejemplo de aproximadamente 800 micrómetros a aproximadamente 1 mm).
Los cartuchos pueden fabricarse usando una variedad de técnicas y materiales conocidos por los expertos en la técnica. En general, los cartuchos se fabricarán como una serie de componentes separados (Figura 28A-C) y posteriormente se ensamblaran usando cualquiera de una serie de técnicas de ensamblaje o unión mecánicas. Los ejemplos de técnicas de fabricación adecuadas incluyen, pero no se limitan a, mecanizado convencional, mecanizado CNC, moldeado por inyección, termoformado e impresión 3D. Una vez que se han fabricado los componentes del cartucho, pueden ensamblarse mecánicamente usando tornillos, clips y similares, o unirse permanentemente usando cualquiera de una variedad de técnicas (dependiendo de la elección de los materiales usados), por ejemplo, mediante el uso de unión/soldadura térmica o cualquiera de una variedad de adhesivos o películas adhesivas, incluyendo los adhesivos a base de epoxi, a base de acrílico, a base de silicona, curables por UV, a base de poliuretano o a base de cianoacrilato.
Los componentes del cartucho pueden fabricarse usando cualquiera de varios materiales adecuados, que incluyen pero no se limitan a, silicio, sílice fundida, vidrio, cualquiera de una variedad de polímeros, por ejemplo, polidimetilsiloxano (PDMS; elastómero), polimetilmetacrilato (PMMA), policarbonato (PC), polipropileno (PP), polietileno (PE), polietileno de alta densidad (HDPE), poliimida, polímeros de olefinas cíclicas (COP), copolímeros de olefinas cíclicas (COC), tereftalato de polietileno (PET), resinas epoxi, materiales antiadherentes como teflón (PTFE), metales (por ejemplo, aluminio, acero inoxidable, cobre, níquel, cromo y titanio) o cualquier combinación de los mismos.
Las características de entrada y salida del cartucho pueden diseñarse para proporcionar conexiones de fluido convenientes y a prueba de fugas con el instrumento, o pueden servir como depósitos abiertos para pipetear manualmente muestras y reactivos dentro o fuera del cartucho. Los ejemplos de diseños mecánicos convenientes para los conectores de los puertos de entrada y salida pueden incluir, pero no se limitan a, conectores roscados, conectores Luer lock, conectores Luer slip o de “punta deslizante”, conectores de ajuste a presión y similares. Los puertos de entrada y salida del cartucho pueden comprender además tapas, cubiertas o cierres con resorte, o membranas de polímero que pueden abrirse o perforarse cuando el cartucho se coloca en el instrumento. y que sirven para evitar la contaminación de las superficies internas del cartucho durante el almacenamiento o que evitan que los fluidos se derramen cuando se retira el cartucho del instrumento. Los uno o más puertos de salida del cartucho pueden comprender además una cámara de recogida de muestras extraíble que es adecuada para interactuar con termocicladores de PCR independientes o instrumentos de secuenciación.
El cartucho puede incluir bombas en miniatura integradas u otros mecanismos de accionamiento de fluidos para controlar el flujo de fluido a través del dispositivo. Ejemplos de bombas en miniatura adecuadas o mecanismos de accionamiento de fluidos pueden incluir, pero no se limitan a, mecanismos de émbolo o jeringuilla en miniatura accionados electromecánicamente o neumáticamente, bombas de diafragma de membrana accionadas neumáticamente o por un pistón externo, bolsas o vejigas de reactivo accionadas neumáticamente, o bombas electro-osmóticas.
El cartucho puede incluir válvulas en miniatura para compartimentar reactivos precargados o controlar el flujo de fluido a través del dispositivo. Los ejemplos de válvulas en miniatura adecuadas pueden incluir, pero no se limitan a, "válvulas" de un solo paso fabricadas usando tapones de cera o polímero que pueden fundirse o disolverse, o membranas de polímero que pueden perforarse; válvulas de pinzamiento construidas usando una membrana deformable y accionamiento neumático, magnético, electromagnético o electromecánico (solenoide), válvulas unidireccionales construidas usando aletas de membrana deformable y válvulas de compuerta en miniatura.
El cartucho puede incluir respiraderos para proporcionar una vía de escape para el aire atrapado. Los respiraderos pueden construirse de acuerdo con una variedad de técnicas, por ejemplo, usando un tapón poroso de polidimetilsiloxano (PDMS) u otro material hidrófobo que permite la capilaridad del aire pero bloquea la penetración del agua.
Las características de interfaz mecánica del cartucho pueden proporcionar una colocación fácilmente extraíble pero altamente precisa y repetible del cartucho con respecto al sistema de instrumentos. Las características de interfaz mecánica adecuadas pueden incluir, pero no se limitan a, clavijas de alineación, guías de alineación, topes mecánicos y similares. Las características de diseño mecánico pueden incluir características de relieve para acercar aparatos externos, por ejemplo, imanes o componentes ópticos, cerca de la cámara de la matriz de micropocillos (Figura 28B).
El cartucho también puede incluir componentes de control de temperatura o características de interfaz térmica para acoplarse a módulos externos de control de temperatura. Los ejemplos de elementos de control de temperatura adecuados pueden incluir, pero no se limitan a, elementos de calentamiento resistivos, fuentes de luz emisoras de infrarrojos en miniatura, dispositivos de calentamiento o enfriamiento de Peltier, disipadores de calor, termistores, termopares y similares. Las características de la interfaz térmica pueden fabricarse a partir de materiales que son buenos conductores térmicos (por ejemplo, cobre, oro, plata, etc.) y pueden comprender una o más superficies planas capaces de hacer un buen contacto térmico con bloques de calentamiento externos o bloques de refrigeración.
El cartucho puede incluir características de interfaz óptica para su uso en imagenología óptica o interrogación espectroscópica de la matriz de micropocillos. El cartucho puede incluir una ventana ópticamente transparente, por ejemplo, el propio sustrato de micropocillos o el lado de la célula de flujo o la cámara de micromatrices que está opuesto a la matriz de micropocillos, fabricado con un material que cumple con los requisitos espectrales para la técnica imagenología o espectroscópica usada para sondear la matriz de micropocillos. Los ejemplos de materiales de ventana óptica adecuados pueden incluir, pero no se limitan a, vidrio, sílice fundida, polimetilmetacrilato (PMMA), policarbonato (PC), polímeros de olefinas cíclicas (COP) o copolímeros de olefinas cíclicas (COC).
Se pretende que las reivindicaciones siguientes definan el alcance de la invención.
EJEMPLOS
Aunque la presente divulgación ha sido ilustrada por los siguientes ejemplos, no debe interpretarse como limitada por los mismos;.
Ejemplo 1. Ligadura con adaptador de cebadores de secuenciación
Como se muestra en la Figura 31, los adaptadores pueden ligarse al producto amplificado específico de gen 3105. El producto amplificado específico de gen tiene un saliente de nucleótido A depositado por la polimerasa. Los adaptadores tienen un saliente T en una cadena (por ejemplo, cadena sentido) y un fosfato libre en la otra cadena (por ejemplo, cadena antisentido). Los adaptadores pueden ligarse al producto amplificado específico del gen mediante ligación. El adaptador se liga a los extremos 5' y 3' del producto amplificado específico del gen. El producto específico del gen ligado al adaptador se amplifica, por ejemplo, con cebadores de secuenciación (por ejemplo, célula de flujo). La reacción de PCR posterior que se origina a partir del cebador de secuenciación directo (por ejemplo, ILMN Lectura 1) se extiende hacia la secuencia de lectura 2 en el extremo 3'. Es posible que el cebador de secuenciación inversa (por ejemplo, ILMN Lectura 2) no se extienda hacia la secuencia de Lectura 1 (por ejemplo, el extremo 5') debido a la falta de sitio de fosforilación en la cadena sentido del adaptador. De esta manera, la reacción de amplificación inversa es lineal mientras que la reacción de amplificación directa es exponencial.
Ejemplo 2. Altas tasas de demultiplexación y mapeo de productos específicos de genes
El producto amplificado ligado al adaptador que se muestra en la Figura 31 puede someterse a secuenciación, demultiplexación y mapeo. La Figura 32 muestra una realización ejemplar de las tasas de demultiplexación y mapeo de los amplicones específicos del gen, así como los recuentos totales de lectura por muestra.
Ejemplo 3. Distribución de recuentos de lecturas entre amplicones
En los métodos específicos de genes de la divulgación, pueden amplificarse diferentes regiones (por ejemplo, amplicones) del mismo gen, por ejemplo, para la identificación de SNP. La Figura 33 muestra los recuentos de lecturas de amplicones dentro de un gen. Los genes con amplicones individuales están marcados en gris claro u oscuro. Los genes con múltiples amplicones (por ejemplo, múltiples regiones amplificadas a partir del mismo gen) se agrupan por color. En algunos casos, los recuentos de lecturas son similares para los amplicones dentro del mismo gen (por ejemplo, gen ATR). En algunos casos, los recuentos de lectura son diferentes para los amplicones dentro del mismo gen (por ejemplo, TELO2). Las diferencias en el recuento de lecturas entre amplicones en el mismo gen pueden deberse a una variación genética en el gen (por ejemplo, el gen tiene una variante que no es reconocida por el cebador diseñado). Los amplicones en un gen deben tener recuentos de lectura similares porque se originan en el mismo gen con el mismo número de copias.
Ejemplo 4. Identificación de SNP
Los métodos de la divulgación pueden usarse para identificar SNP (ya sea de múltiples amplicones dentro del mismo gen o entre genes). Los cebadores están diseñados para amplificar regiones seleccionadas de interés (por ejemplo, SNP). Los amplicones están secuenciados. Los SNP se identifican usando un algoritmo de software como se muestra en la Figura 34. Se comprueba la región alrededor de la posición de SNP esperada. Si están presentes las secuencias flanqueantes correctas, entonces el SNP es identificado por el nucleótido. Si las secuencias flanqueantes alrededor de la región esperada del SNP son incorrectas, entonces el SNP se identifica como un nucleótido 'N'. Los SNP pueden identificarse en lectura directa, lectura inversa y/o lectura directa e inversa. Cuando el SNP se identifica en ambas lecturas, se usa para la identificación la lectura directa o la lectura de mayor calidad.
La Figura 35 ilustra la expresión específica de alelos para SNP específicos en los genes de HJURP, ATR, CD82 y WRN. Los números en la tabla representan el número de lecturas que contienen la base indicada en la posición de SNP. Los valores resaltados en gris oscuro tienen recuentos muy bajos, mientras que los valores resaltados en gris claro tienen recuentos altos. HJURP y ATR contienen principalmente el SNP C. WRN, por ejemplo, tiene una mezcla de nucleótidos G y T.
Ejemplo 5. Detección de ARNm de IgG con cebadores específicos de genes dirigidos
Como se representa en la Figura 36, un método sensible para detectar ARNm de IgG puede usar un enfoque dirigido. Este método puede ser útil cuando el nivel de transcripción de ARNm de los ARNm de IgG es menos abundante (<10% del grupo de ARNm por célula); la eficiencia de una reacción de PCR multiplex puede enriquecer las regiones objetivo para un mayor número de lecturas de secuenciación. Como los genes que codifican los anticuerpos pueden mutar, el diseño de cebadores para este enfoque puede dirigirse hacia las regiones con la menor variación. Se diseñaron cebadores que contienen secuencias verificadas en la región constante (C) y FR1 de los ARNm pesados y ligeros (ver Tabla 3 para todas las secuencias objetivo) para minimizar este problema.
En el flujo de trabajo mostrado en la Figura 36, se usa un cebador inverso que reconoce la región C con una secuencia de anclaje para la transcripción inversa. El ADNc generado a partir de esta reacción sirve como plantilla para una PCR de ciclo bajo para unir índices moleculares y de muestra en el extremo 3', usando cebadores directos específicos de FR1 y cebadores inversos específicos de anclaje. Los adaptadores de secuenciación compatibles con Illumina se unen en una reacción de PCR posterior para dilucidar la secuencia V(D)J en los ARNm de IgG.
Ejemplo 6. Ligadura de adaptador para la preparación de bibliotecas para la detección de ARNm de IgG
Como se muestra en la Figura 37, este enfoque de preparación de bibliotecas es un método no sesgado para detectar y secuenciar ARNm de IgG. Este enfoque puede usarse cuando los ARNm de interés son abundantes (>10% del grupo de ARNm por célula). La ventaja de este enfoque es el enriquecimiento no sesgado de ARNm de IgG independientemente de las mutaciones que se produzcan en los extremos 5'.
En el flujo de trabajo que se muestra en la Figura 37, se usa un cebador inverso que reconoce la región C con una secuencia de anclaje para la transcripción inversa. El ADNc generado a partir de esta reacción sirve como plantilla para la síntesis de ADNc de la segunda cadena. Este ADNc de cadena doble se liga a un oligo adaptador de cadena doble y se amplifica por PCR usando un cebador de adaptador directo y un cebador de anclaje inverso para indexación molecular y de muestras. Los adaptadores de secuenciación compatibles con Illumina se unen en una reacción de PCR posterior para dilucidar la secuencia V(D)J en los ARNm de IgG.
Tabla 3. Lista de secuencias de genes usadas en los ejemplos 5 y 6. Se ha verificado que las secuencias son r l n i i n^ l r n imi n ARNm I n l B l r n .
Figure imgf000060_0002
Ejemplo 7. Detección de ARNm de TCR y ARNm de marcadores usando códigos de barras estocásticos.
El protocolo experimental mostrado en la Figura 38 se usó para caracterizar la cadena alfa y la cadena beta de TCR, así como los ARNm de marcadores fenotípicos expresados en células T depositadas en una placa de 96 pocillos usando una cantidad equivalente de 2 células de ARN de células T (20 ng) por pocillo. Los marcadores fenotípicos usados se enumeran en la Figura 39. Los cebadores específicos de genes que se unen a la región C de la cadena alfa y beta de TCR son: TRAC: 5' CAGACAGACTTGT 3' (SEQ ID NO: 1); TRBC: 5' CCTTTTGGGTGTG 3' (SEQ ID NO: 2). Las lecturas de secuenciación y los índices moleculares que se demultiplexaron para cada pocillo de muestra de marcadores de fenotipo se muestran en las Tablas 4 y 5, respectivamente. Las lecturas de secuenciación y los índices moleculares que se demultiplexaron para cada pocillo de muestra de la cadena alfa de TCR se muestran en las Tablas 6 y 7. Las lecturas de secuenciación y los índices moleculares que se demultiplexaron para cada pocillo de muestra de la cadena beta de TCR se muestran en las Tablas 8 y 9.
Tabla 4. Lecturas de secuenciación de marcadores fenotípicos para cada pocillo de muestra
Lecturas de oligodT
Figure imgf000060_0001
Tabla 5. Indices molecualares de marcadores fenotípicos para cada pocilio de muestra oli odT MI ma eadas
Figure imgf000061_0001
Tabla 6. Lecturas de secuenciación de cadena alfa de TCR para cada pocilio de muestra Lecturas de TRAC
Figure imgf000061_0002
Tabla 7. Indices moleculares de cadena alfa de TCR para cada pocilio de muestra TRAC MI
Figure imgf000061_0003
Tabla 8. Lecturas de secuenciación de cadena beta de TCR para cada pocilio de muestra TRBC
Figure imgf000061_0004
Tabla 9. Indices moleculares de cadena beta de TCR para cada pocilio de muestra
TRBC M I
Figure imgf000062_0001
Ejemplo 8. Detección del repertorio de TCR en una muestra mediante códigos de barras estocásticos.
Se usó el protocolo experimental que se muestra en la Figura 38 para caracterizar el repertorio de TCR en una muestra de ARN de células T de un donante. Los índices moleculares para los ARNm de cadena alfa y beta de TCR expresados se muestran en la Figura 40. Se identificó una amplia variedad de TCR expresados en el donante en el momento de la recogida de la muestra.
Ejemplo 9. Análisis de fenotipo de células T individuales.
Se usó el protocolo experimental que se muestra en la Figura 38 para caracterizar el fenotipo de células T activadas individuales en una muestra. Se usó el gráfico de análisis de componentes principales (PCA) mostrado en la Figura 41 para distinguir visualmente diferentes subtipos de células T. Cada punto es una célula y las células con alto contenido de IL-32 o CD28, que es un marcador de células T activado, están resaltadas en un círculo. Las células T activadas se distinguen de las células T inactivadas sin círculos.
Se usó la misma muestra para analizar la secuencia de CDR3 de una célula T CD3+ individual. Los resultados se muestran en la Tabla 10.
Tabla 10. Índices moleculares de una célula T CD3+ individual.
Figure imgf000062_0002
Ejemplo 10. Adición de códigos de barras estocásticos usandoe RT-PCR de un paso.
La Figura 42 muestra un protocolo experimental usado para caracterizar el fenotipo de células T activadas individuales en una muestra. Se usó una RT-PCR de un paso para añadir códigos de barras estocásticos al ARNm de TCR usando un primer oligonucleótido que comprende una secuencia específica del objetivo y un cebador de adaptador universal para la transcripción inversa, y un cebador directo específico del objetivo y un cebador inverso que comprende un compañero de unión para el cebador de adaptador universal y un código de barras estocástico para la PCR. Este protocolo ofrecía las ventajas de una mayor sensibilidad y un flujo de trabajo simple (datos no mostrados).
Con respecto al uso de sustancialmente cualquier término en plural y/o singular en la presente, los expertos en la técnica pueden traducir del plural al singular y/o del singular al plural según sea apropiado para el contexto y/o aplicación. Las varias permutaciones de singular/plural pueden establecerse expresamente en la presente por motivos de claridad.
Los expertos en la técnica entenderán que, en general, los términos usados en la presente, y especialmente en las reivindicaciones adjuntas (por ejemplo, los cuerpos de las reivindicaciones adjuntas) se entienden generalmente como términos "abiertos" (por ejemplo, el término "incluye" debe interpretarse como "incluye pero no se limita a", el término "tiene" debe interpretarse como "tiene por lo menos", el término "incluye" debe interpretarse como "incluye pero no se limita a" etc.). Los expertos en la técnica entenderán además que si se pretende un número específico de una enumeración de reivindicación introducida, dicha intención se enumerará explícitamente en la reivindicación y, en ausencia de dicha enumeración, dicha intención no está presente. Por ejemplo, como ayuda para la comprensión, las siguientes reivindicaciones adjuntas pueden contener el uso de las frases introductorias "por lo menos uno" y "uno o más" para presentar las enumeraciones de las reivindicaciones. Sin embargo, no debe interpretarse que el uso de tales frases implica la introducción de una enumeración de

Claims (12)

REIVINDICACIONES
1. Un método para marcar un ácido nucleico en una muestra, que comprende:
hibridar un objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo;
extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos;
hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido;
extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos;
hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la secuencia de adaptador universal, en donde el tercer oligonucleótido comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular;
extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y
amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos,
en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico,
en donde el objetivo es una molécula de ARNm; y
en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
2. Un método de marcado de un objetivo en una muestra para la cuantificación de dicho objetivo, que comprende:
hibridar dicho objetivo con un primer oligonucleótido que comprende una primera secuencia de adaptador universal y una secuencia específica del objetivo;
extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos;
hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia de adaptador universal y una segunda secuencia específica de objetivo;
extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos;
hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un primer cebador de amplificación y la primera secuencia de adaptador universal;
extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos;
hibridar dicha tercera secuencia de nucleótidos con un cuarto oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y la segunda secuencia de adaptador universal, en donde uno o ambos del tercer oligonucleótido y el cuarto oligonucleótido comprenden parte de un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular;
extender dicho cuarto oligonucleótido para generar una cuarta secuencia de nucleótidos; y
amplificar dicha cuarta secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de quintas secuencias de nucleótidos,
en donde cada una de la pluralidad de las quintas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico,
en donde el objetivo es una molécula de ARNm; y
en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
3. Un método de marcado de un objetivo en una muestra para la cuantificación de dicho objetivo, que comprende:
hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica del objetivo y un sitio de unión para un primer cebador de amplificación;
extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos;
hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una secuencia de adaptador universal y una segunda secuencia específica de objetivo;
extender dicho segundo oligonucleótido para generar una segunda secuencia de nucleótidos;
hibridar dicha segunda secuencia de nucleótidos con un tercer oligonucleótido que comprende un sitio de unión para un segundo cebador de amplificación y una secuencia que se une específicamente a la secuencia de adaptador universal, en donde el tercer oligonucleótido comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular;
extender dicho tercer oligonucleótido para generar una tercera secuencia de nucleótidos; y
amplificar dicha tercera secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de cuartas secuencias de nucleótidos,
en donde cada una de la pluralidad de las cuartas secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico,
en donde el objetivo es una molécula de ARNm,
y en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
4. El método de la reivindicación 1, 2 o 3, en donde la muestra es una célula individual y/o en donde la molécula de ARNm codifica una cadena alfa o cadena beta del receptor de células T (TCR), opcionalmente en donde la secuencia específica del objetivo se une específicamente a la región C de la cadena alfa o cadena beta de TCR.
5. El método de la reivindicación 1 o 4 cuando depende de la reivindicación 1, que comprende amplificar dicha tercera secuencia de nucleótidos usando un segundo cebador de amplificación, opcionalmente en donde el segundo cebador de amplificación se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de las mismas.
6. El método de cualquiera de las reivindicaciones 1-5, en donde el segundo oligonucleótido de la reivindicación 1 o la segunda secuencia específica del objetivo de la reivindicación 2 o 3 se une específicamente a una región seleccionada del grupo que consiste de: una región V de una cadena alfa o cadena beta de TCR, la unión de una región V y D de una cadena alfa o cadena beta de TCR, o cualquier combinación de las mismas.
7. El método de cualquiera de las reivindicaciones 1 y 4-6 cuando dependen de la reivindicación 1, en donde el segundo oligonucleótido comprende un sitio de unión para un segundo cebador de amplificación, que comprende opcionalmente además amplificar dicha tercera secuencia de nucleótidos usando el segundo cebador de amplificación.
8. El método de cualquiera de las reivindicaciones 1-7, en donde el código de barras estocástico comprende además un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos.
9. El método de cualquiera de las reivindicaciones 1 y 4-8, en donde;
(a) el primer oligonucleótido o el tercer oligonucleótido está unido a un soporte sólido; y/o
(b) la muestra comprende una pluralidad del objetivo, opcionalmente en donde cada uno de la pluralidad del objetivo está marcado con un código de barras estocástico distinto, que comprende además opcionalmente contar el número de la pluralidad del objetivo contando los códigos de barras estocásticos distintos asociados con el objetivo.
10. Un método de marcado de un objetivo en una muestra para la cuantificación de dicho objetivo, que comprende: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia específica de objetivo y una primera secuencia de cebador de amplificación en presencia de un segundo oligonucleótido que comprende una secuencia de adaptador universal;
extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos que comprende un complemento de la secuencia de adaptador universal;
hibridar dicha primera secuencia de nucleótidos con un tercer oligonucleótido que comprende la secuencia de adaptador universal, un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular y un sitio de unión para un segundo cebador de amplificación;
extender dicho tercer oligonucleótido para generar una segunda secuencia de nucleótidos; y
amplificar dicha segunda secuencia de nucleótidos usando un primer cebador de amplificación y un segundo cebador de amplificación para generar una pluralidad de terceras secuencias de nucleótidos,
en donde cada una de la pluralidad de las terceras secuencias de nucleótidos comprende dicho objetivo y el código de barras estocástico,
en donde el objetivo es una molécula de ARNm; y
en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
11. El método de la reivindicación 10, en donde:
(a) el método comprende extender el primer oligonucleótido para generar una primera secuencia de nucleótidos que comprende un complemento de la secuencia de adaptador universal mediante cambio de plantilla; y/o (b) el código de barras estocástico comprende además un marcador universal, un marcador de dimensión, un marcador celular o una combinación de los mismos.
12. Un método de marcado de un objetivo en una muestra para la cuantificación de dicho objetivo, que comprende: hibridar dicho objetivo con un primer oligonucleótido que comprende una secuencia de adaptador universal y una secuencia específica del objetivo;
extender dicho primer oligonucleótido para generar una primera secuencia de nucleótidos;
hibridar dicha primera secuencia de nucleótidos con un segundo oligonucleótido que comprende una segunda secuencia específica del objetivo y un tercer oligonucleótido que comprende un código de barras estocástico, en donde el código de barras estocástico comprende un marcador molecular y una secuencia que se une específicamente a la secuencia de adaptador universal;
amplificar dicha primera secuencia de nucleótidos para generar una pluralidad de segundas secuencias de nucleótidos,
en donde cada una de la pluralidad de las segundas secuencias de nucleótidos comprende dicho objetivo y dicho código de barras estocástico,
en donde el objetivo es una molécula de ARNm; y
en donde el marcador molecular comprende una secuencia de ácidos nucleicos que proporciona un contador para la aparición específica del ácido nucleico objetivo.
ES16710551T 2015-02-27 2016-02-26 Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación Active ES2906221T3 (es)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201562126397P 2015-02-27 2015-02-27
US201562128849P 2015-03-05 2015-03-05
US201562160976P 2015-05-13 2015-05-13
US201562173899P 2015-06-10 2015-06-10
US201562194075P 2015-07-17 2015-07-17
PCT/US2016/019971 WO2016138500A1 (en) 2015-02-27 2016-02-26 Methods and compositions for barcoding nucleic acids for sequencing

Publications (1)

Publication Number Publication Date
ES2906221T3 true ES2906221T3 (es) 2022-04-13

Family

ID=55543072

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16710551T Active ES2906221T3 (es) 2015-02-27 2016-02-26 Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación

Country Status (5)

Country Link
US (1) US20160257993A1 (es)
EP (1) EP3262189B1 (es)
CN (1) CN107208157B (es)
ES (1) ES2906221T3 (es)
WO (1) WO2016138500A1 (es)

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US8825412B2 (en) 2010-05-18 2014-09-02 Natera, Inc. Methods for non-invasive prenatal ploidy calling
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
PT2556171E (pt) 2010-04-05 2015-12-21 Prognosys Biosciences Inc Ensaios biológicos codificados espacialmente
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
EP2656263B1 (en) 2010-12-22 2019-11-06 Natera, Inc. Methods for non-invasive prenatal paternity testing
JP6153874B2 (ja) 2011-02-09 2017-06-28 ナテラ, インコーポレイテッド 非侵襲的出生前倍数性呼び出しのための方法
SG11201405274WA (en) 2012-02-27 2014-10-30 Cellular Res Inc Compositions and kits for molecular counting
WO2014210223A1 (en) 2013-06-25 2014-12-31 Prognosys Biosciences, Inc. Spatially encoded biological assays using a microfluidic device
SG10201806890VA (en) 2013-08-28 2018-09-27 Cellular Res Inc Massively parallel single cell analysis
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US9582877B2 (en) 2013-10-07 2017-02-28 Cellular Research, Inc. Methods and systems for digitally counting features on arrays
RU2717641C2 (ru) 2014-04-21 2020-03-24 Натера, Инк. Обнаружение мутаций и плоидности в хромосомных сегментах
ES2824700T3 (es) 2015-02-19 2021-05-13 Becton Dickinson Co Análisis unicelular de alto rendimiento que combina información proteómica y genómica
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
EP3277843A2 (en) 2015-03-30 2018-02-07 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
CN107532207B (zh) * 2015-04-10 2021-05-07 空间转录公司 生物样本的空间区别、多重核酸分析
CN107580632B (zh) 2015-04-23 2021-12-28 贝克顿迪金森公司 用于全转录组扩增的方法和组合物
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
WO2017044574A1 (en) 2015-09-11 2017-03-16 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
US10822643B2 (en) 2016-05-02 2020-11-03 Cellular Research, Inc. Accurate molecular barcoding
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
CN109074430B (zh) 2016-05-26 2022-03-29 贝克顿迪金森公司 分子标记计数调整方法
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
EP4050112A1 (en) 2016-06-21 2022-08-31 10X Genomics, Inc. Nucleic acid sequencing
WO2018053365A1 (en) 2016-09-15 2018-03-22 ArcherDX, Inc. Methods of nucleic acid sample preparation for analysis of cell-free dna
EP3933039A1 (en) 2016-09-15 2022-01-05 ArcherDX, LLC Methods of nucleic acid sample preparation
EP3516078A1 (en) * 2016-09-23 2019-07-31 Life Technologies Corporation Compositions and methods for assessing immune response
WO2018058073A2 (en) 2016-09-26 2018-03-29 Cellular Research, Inc. Measurement of protein expression using reagents with barcoded oligonucleotide sequences
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
EP4198140A1 (en) * 2016-11-02 2023-06-21 ArcherDX, LLC Methods of nucleic acid sample preparation for immune repertoire sequencing
EP3539035B1 (en) 2016-11-08 2024-04-17 Becton, Dickinson and Company Methods for expression profile classification
KR20190077061A (ko) 2016-11-08 2019-07-02 셀룰러 리서치, 인크. 세포 표지 분류 방법
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10550429B2 (en) 2016-12-22 2020-02-04 10X Genomics, Inc. Methods and systems for processing polynucleotides
US20210087610A9 (en) * 2017-01-12 2021-03-25 Massachusetts Institute Of Technology Methods for analyzing t cell receptors and b cell receptors
JP7104048B2 (ja) 2017-01-13 2022-07-20 セルラー リサーチ, インコーポレイテッド 流体チャネルの親水性コーティング
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
CA3049139A1 (en) 2017-02-21 2018-08-30 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
CN107083423B (zh) * 2017-03-27 2022-01-28 北京极客基因科技有限公司 一种药物靶点预测和药物全方面评价方法
CA3059559A1 (en) 2017-06-05 2018-12-13 Becton, Dickinson And Company Sample indexing for single cells
WO2019010486A1 (en) * 2017-07-07 2019-01-10 Board Of Regents, The University Of Texas System ULTRA-ACCURATE AND HIGH COVERAGE OF IMMUNE REPERTOIRE USING MOLECULAR IDENTIFIERS
US11339424B2 (en) * 2017-09-06 2022-05-24 Dxome Co., Ltd. Method for amplification and quantitation of small amount of mutation using molecular barcode and blocking oligonucleotide
CN107488738B (zh) * 2017-10-12 2020-04-28 中国医学科学院肿瘤医院 一种预测乳腺癌对曲妥珠单抗联合化疗治疗敏感性的生物标志物
WO2019090621A1 (zh) * 2017-11-09 2019-05-16 深圳华大智造科技有限公司 钩状探针、核酸连接方法以及测序文库的构建方法
EP3720605A1 (en) * 2017-12-07 2020-10-14 Massachusetts Institute Of Technology Single cell analyses
EP3728636A1 (en) * 2017-12-19 2020-10-28 Becton, Dickinson and Company Particles associated with oligonucleotides
WO2019157529A1 (en) 2018-02-12 2019-08-15 10X Genomics, Inc. Methods characterizing multiple analytes from individual cells or cell populations
JP7358388B2 (ja) 2018-05-03 2023-10-10 ベクトン・ディキンソン・アンド・カンパニー 反対側の転写物末端における分子バーコーディング
US11773441B2 (en) 2018-05-03 2023-10-03 Becton, Dickinson And Company High throughput multiomics sample analysis
US11702653B2 (en) 2018-05-21 2023-07-18 Battelle Memorial Institute Control compositions and methods for sequencing
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
JP7456637B2 (ja) * 2018-07-06 2024-03-27 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 脂質修飾オリゴヌクレオチドおよびその使用方法
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
US11639517B2 (en) 2018-10-01 2023-05-02 Becton, Dickinson And Company Determining 5′ transcript sequences
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
WO2020123319A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Methods of using master / copy arrays for spatial detection
EP3894553A4 (en) 2018-12-13 2022-06-29 Battelle Memorial Institute Methods and control compositions for a quantitative polymerase chain reaction
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
EP3666904A1 (en) 2018-12-14 2020-06-17 Lexogen GmbH Nucleic acid amplification and identification method
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11371076B2 (en) 2019-01-16 2022-06-28 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
EP3914728B1 (en) 2019-01-23 2023-04-05 Becton, Dickinson and Company Oligonucleotides associated with antibodies
WO2020176548A1 (en) * 2019-02-25 2020-09-03 Matthew Hill Methods of using microfluidic positional encoding devices
US11965208B2 (en) 2019-04-19 2024-04-23 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
US20220195502A1 (en) * 2019-04-24 2022-06-23 Genepath Diagnostics Inc. Method for detecting specific nucleic acids in samples
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
AU2020282024A1 (en) 2019-05-31 2021-11-11 10X Genomics, Inc. Method of detecting target nucleic acid molecules
US11939622B2 (en) 2019-07-22 2024-03-26 Becton, Dickinson And Company Single cell chromatin immunoprecipitation sequencing assay
WO2021091611A1 (en) 2019-11-08 2021-05-14 10X Genomics, Inc. Spatially-tagged analyte capture agents for analyte multiplexing
CN114729350A (zh) 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
CN110938674B (zh) * 2019-12-05 2024-03-19 广州金域医学检验集团股份有限公司 甲基化测序dna文库的构建方法及其应用
SG11202106899SA (en) 2019-12-23 2021-09-29 10X Genomics Inc Methods for spatial analysis using rna-templated ligation
WO2021146207A1 (en) 2020-01-13 2021-07-22 Becton, Dickinson And Company Methods and compositions for quantitation of proteins and rna
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11821035B1 (en) 2020-01-29 2023-11-21 10X Genomics, Inc. Compositions and methods of making gene expression libraries
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11835462B2 (en) 2020-02-11 2023-12-05 10X Genomics, Inc. Methods and compositions for partitioning a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
US11926863B1 (en) 2020-02-27 2024-03-12 10X Genomics, Inc. Solid state single cell method for analyzing fixed biological cells
US11768175B1 (en) 2020-03-04 2023-09-26 10X Genomics, Inc. Electrophoretic methods for spatial analysis
EP4242325A3 (en) 2020-04-22 2023-10-04 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021231779A1 (en) 2020-05-14 2021-11-18 Becton, Dickinson And Company Primers for immune repertoire profiling
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
EP4158054A1 (en) 2020-06-02 2023-04-05 10X Genomics, Inc. Spatial transcriptomics for antigen-receptors
WO2021247543A2 (en) 2020-06-02 2021-12-09 10X Genomics, Inc. Nucleic acid library methods
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
EP4162077A1 (en) * 2020-06-09 2023-04-12 Simsen Diagnostics AB Lymphocyte clonality determination
WO2021252591A1 (en) 2020-06-10 2021-12-16 10X Genomics, Inc. Methods for determining a location of an analyte in a biological sample
CN116034166A (zh) 2020-06-25 2023-04-28 10X基因组学有限公司 Dna甲基化的空间分析
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
EP4121557A4 (en) 2020-08-06 2024-05-01 Singular Genomics Systems Inc SPATIAL SEQUENCING
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
CN116635533A (zh) 2020-11-20 2023-08-22 贝克顿迪金森公司 高表达的蛋白和低表达的蛋白的谱分析
AU2021409136A1 (en) 2020-12-21 2023-06-29 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
EP4301870A1 (en) 2021-03-18 2024-01-10 10X Genomics, Inc. Multiplex capture of gene and protein expression from a biological sample
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
US20230366020A1 (en) * 2022-05-13 2023-11-16 Integrated Dna Technologies, Inc. Use of unique molecular identifiers for improved accuracy of long read sequencing and characterization of crispr editing

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU774952B2 (en) * 1999-02-23 2004-07-15 Baylor College Of Medicine T cell receptor Vbeta-Dbeta-Jbeta sequence and methods for its detection
EP2344678A4 (en) * 2008-09-05 2012-06-06 Life Technologies Corp METHODS AND SYSTEMS FOR VALIDATION, CALIBRATION AND NORMALIZATION OF NUCLEIC ACID SEQUENCING
EP2742347B1 (en) * 2011-08-12 2020-03-04 Life Technologies Corporation Apparatuses, methods, computer program products, and kits for hi-throughput glycan analysis
CA2873585C (en) * 2012-05-14 2021-11-09 Cb Biotechnologies, Inc. Method for increasing accuracy in quantitative detection of polynucleotides
EP2861761A1 (en) * 2012-06-15 2015-04-22 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
ES2637538T3 (es) * 2012-07-17 2017-10-13 Counsyl, Inc. Sistema y métodos para la detección de una variación genética
GB2525568B (en) * 2013-03-15 2020-10-14 Abvitro Llc Single cell barcoding for antibody discovery
US9708657B2 (en) * 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
SG10201806890VA (en) * 2013-08-28 2018-09-27 Cellular Res Inc Massively parallel single cell analysis
ES2912183T3 (es) * 2013-12-30 2022-05-24 Atreca Inc Análisis de ácidos nucleicos asociados a células individuales utilizando códigos de barras de ácidos nucleicos
CA2938080A1 (en) * 2014-01-27 2015-07-30 The General Hospital Corporation Methods of preparing nucleic acids for sequencing
CN104263818B (zh) * 2014-09-02 2016-06-01 武汉凯吉盈科技有限公司 基于高通量测序技术的全血免疫组库探测方法
EP3763825B1 (en) * 2015-01-23 2023-10-04 Qiagen Sciences, LLC High multiplex pcr with molecular barcoding

Also Published As

Publication number Publication date
US20160257993A1 (en) 2016-09-08
EP3262189B1 (en) 2021-12-08
WO2016138500A1 (en) 2016-09-01
EP3262189A1 (en) 2018-01-03
CN107208157B (zh) 2022-04-05
CN107208157A (zh) 2017-09-26

Similar Documents

Publication Publication Date Title
ES2906221T3 (es) Métodos para el marcado con códigos de barras de ácidos nucleicos para secuenciación
US20220333185A1 (en) Methods and compositions for whole transcriptome amplification
US20230083422A1 (en) Methods and compositions for combinatorial barcoding
US20230193372A1 (en) Error correction in amplification of samples
US11124823B2 (en) Methods for RNA quantification
USRE48913E1 (en) Spatially addressable molecular barcoding
US20180073073A1 (en) Methods and compositions for labeling targets and haplotype phasing
WO2016118915A1 (en) Devices and systems for molecular barcoding of nucleic acid targets in single cells
US10722880B2 (en) Hydrophilic coating of fluidic channels
US20200157600A1 (en) Methods and compositions for whole transcriptome amplification
CN113557090B (zh) 成分进入流体的精确递送
JP2024056705A (ja) コンビナトリアルバーコーディングのための方法および組成物