ES2895750T3

ES2895750T3 - Secuenciación de alto rendimiento de colecciones de nucleótidos

Info

Publication number: ES2895750T3
Application number: ES18214901T
Authority: ES
Inventors: Francois Vigneault; Briggs Adrian Wrangham; Christopher Ryan Clouser; Stephen Jacob Goldfless; Sonia Timberlake
Original assignee: Abvitro LLC
Current assignee: Abvitro LLC
Priority date: 2014-09-15
Filing date: 2015-09-15
Publication date: 2022-02-22
Anticipated expiration: 2035-09-15
Also published as: ES2727656T3; JP7278352B2; JP2017527313A; KR102541849B1; AU2015318011B2; JP6672310B2; JP2020108382A; SG11201702060VA; IL251123B; NZ730044A; CN107002076A; AU2015318011A1; KR20170063726A; AU2020204449B2; EP3194593A1; AU2020204449A1; IL251123A0; EP3536786B1; EP3950944A1; US20200239955A1

Abstract

Un procedimiento que comprende: (a) producir un primer polinucleótido complementario a partir de un primer polinucleótido celular y un segundo polinucleótido complementario a partir de un segundo polinucleótido celular a partir de una pluralidad de células inmunitarias de una muestra con: (i) un primer cebador diana que comprende una región complementaria a una misma región de los primeros polinucleótidos celulares de la pluralidad de células inmunitarias; (ii) un segundo cebador diana que comprende una región complementaria a una misma región de los segundos polinucleótidos celulares de la pluralidad de células inmunitarias; (iii) una transcriptasa inversa que comprende una actividad de transferasa terminal no matricial, donde se añaden 3 o más nucleótidos no matriciales idénticos al extremo 3' del primer y segundo polinucleótidos complementarios; (iv) una pluralidad de polinucleótidos con código de barras molecular, comprendiendo cada uno: (A) un código de barras molecular, (B) una región terminal 5' complementaria a una región de un polinucleótido con código de barras del recipiente, y (C) una región terminal 3' complementaria a los 3 o más nucleótidos no matriciales; y (v) un polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras único de una única célula; (b) amplificar el polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras doble de una única célula; (c) amplificar el primer y segundo polinucleótidos con código de barras doble de una única célula, formando de ese modo una colección de secuencias que comprenden una región variable de los primeros polinucleótidos celulares o los segundos polinucleótidos celulares, o una combinación de las mismas; y (d) secuenciar una o más de las secuencias de la colección, donde (a) se realiza en un recipiente de una pluralidad de recipientes, donde el recipiente comprende una única célula inmunitaria de la pluralidad de células inmunitarias.

Description

DESCRIPCIÓN

Secuenciación de alto rendimiento de colecciones de nucleótidos

ANTECEDENTES

Las tecnologías actuales de presentación de anticuerpos (fagos, levaduras, ribosomas, mamíferos, etc.) están limitadas porque la calidad de los anticuerpos candidatos seleccionados está limitada por la colección de partida a partir de la cual se generan. Las estrategias, tales como las estrategias de diseño de anticuerpos combinatorias e “inteligentes” y las estrategias de descubrimiento de hibridomas, a menudo producen anticuerpos sintéticos que presentan complicaciones posteriores, que incluyen dificultades de expresión a gran escala, riesgo alto de inmunogenicidad en los pacientes y falta de función inmunitaria suficiente aparte de las afinidades de unión altas. Pocos anticuerpos obtenidos a partir de tecnologías de presentación han superado satisfactoriamente los ensayos clínicos en la última década, incluso cuando demostraron características preclínicas positivas. Actualmente, la capacidad de predecir o comprender el mecanismo por el cual una secuencia de anticuerpo particular reconoce y activa la respuesta inmunitaria contra una diana extraña sigue siendo imprecisa. Por tanto, hay una necesidad en la técnica de procedimientos para descubrir y generar anticuerpos que tengan afinidades de unión altas, que se puedan generar a gran escala y que tengan una función inmunitaria suficiente. Los procedimientos descritos en esta memoria tienen como objetivo utilizar los millones de años de evolución del repertorio inmunitario para satisfacer estas necesidades y fomentar la comprensión de estos conceptos y cómo se relacionan con la generación de anticuerpos. Los procedimientos descritos en esta memoria se pueden usar para producir una colección de secuencias de anticuerpos y/o anticuerpos para la selección de anticuerpos candidatos de alta calidad.

El repertorio de anticuerpos humanos es casi ilimitado en cuanto a su complejidad y tamaño. Como resultado, se ha demostrado estadísticamente que las colecciones combinatorias rara vez producen un apareamiento correcto de las cadenas pesadas (V^h) o ligeras (V^l). Otros se han centrado en barajar la única de las familias de regiones armazón de las regiones determinantes de complementariedad (CDR) expresada más frecuentemente (tal como V3-23, Vl-69 o las frecuencias de V^hy V^lcomplementarias) y, por lo tanto, una diversidad de repertorio limitada a un tamaño manejable. Se esperaba que la familia expresada más frecuentemente se seleccionaría y evolucionaría más frecuentemente durante una respuesta inmunitaria. Sorprendentemente, mediante el uso de la secuenciación inmunitaria de repertorios de anticuerpos humanos, se ha descubierto que hay ninguna relación entre las frecuencias de expresión de las regiones armazón de los anticuerpos y el potencial de activación de un anticuerpo en respuesta a un problema inmunitario. Los procedimientos descritos en esta memoria se pueden usar para diseñar y/o generar una colección de anticuerpos no limitante para vencer estos problemas para el descubrimiento y la selección de anticuerpos. Se pueden generar colecciones de donantes con enfermedades autoinmunitarias, cáncer, enfermedades infecciosas y normales/sanos para que la medicina personalizada aborde las necesidades biológicas fundamentales insatisfechas.

RESUMEN

En un aspecto, se proporciona en esta memoria un procedimiento que comprende: formar una pluralidad de recipientes, que comprenden cada uno de ellos una única célula de una muestra que comprende una pluralidad de células, una pluralidad de polinucleótidos con código de barras molecular y un polinucleótido con código de barras del recipiente; producir: un primer polinucleótido complementario que es complementario a un primer polinucleótido celular de la única célula y un segundo polinucleótido complementario que es complementario a un segundo polinucleótido celular de la única célula; fijar: un primer polinucleótido con código de barras molecular de la pluralidad al primer polinucleótido complementario y un segundo polinucleótido con código de barras molecular al segundo polinucleótido complementario, formando de ese modo un primer y un segundo polinucleótido con código de barras único de la única célula; y fijar el polinucleótido con código de barras del recipiente, o un producto amplificado del mismo, al primer polinucleótido con código de barras único de la única célula y al segundo polinucleótido con código de barras de la única célula, formando de ese modo una primera y una segunda secuencias con código de barras doble de la única célula.

En un aspecto, se proporciona en esta memoria una composición que comprende: una pluralidad de recipientes que comprenden cada uno de ellos una única célula de una muestra que comprende una pluralidad de células, una pluralidad de polinucleótidos con código de barras molecular, un polinucleótido con código de barras del recipiente; un primer polinucleótido complementario que es complementario a un primer polinucleótido celular de la única célula y un segundo polinucleótido complementario que es complementario a un segundo polinucleótido celular de la única célula; donde el primer polinucleótido complementario comprende un primer código de barras molecular de la pluralidad de polinucleótidos con código de barras molecular y el código de barras del recipiente del polinucleótido con código de barras del recipiente o un producto amplificado del polinucleótido con código de barras del recipiente, y donde el segundo polinucleótido complementario comprende un segundo código de barras molecular de la pluralidad de polinucleótidos con código de barras molecular y el código de barras del recipiente del polinucleótido con código de barras del recipiente o un producto amplificado del polinucleótido con código de barras del recipiente.

En un aspecto, se proporciona en esta memoria un procedimiento que comprende: (a) formar una pluralidad de recipientes, que comprenden cada uno de ellos una única célula de una muestra que comprende una pluralidad de células, una pluralidad de polinucleótidos con código de barras molecular y un polinucleótido con código de barras del recipiente; (b) producir: un primer polinucleótido complementario que es complementario a un primer polinucleótido celular de la única célula y un segundo polinucleótido complementario que es complementario a un segundo polinucleótido celular de la única célula; (c) fijar: un primer polinucleótido con código de barras molecular de la pluralidad al primer polinucleótido complementario y un segundo polinucleótido con código de barras molecular al segundo polinucleótido complementario, formando de ese modo un primer y un segundo polinucleótido con código de barras único de la única célula; y (d) fijar el polinucleótido con código de barras del recipiente, o un producto amplificado del mismo, al primer polinucleótido con código de barras único de la única célula y al segundo polinucleótido con código de barras único de la única célula, formando de ese modo una primera y una segunda secuencias con código de barras doble de la única célula.

En un aspecto, se proporciona en esta memoria un procedimiento que comprende: (a) producir un primer polinucleótido complementario a partir de un polinucleótido de cadena pesada de inmunoglobulina (IgH) y un segundo polinucleótido complementario a partir de un polinucleótido de cadena ligera de inmunoglobulina (IgL) de una pluralidad de células inmunitarias de una muestra con: un primer cebador diana que comprende una región complementaria a una misma región de los polinucleótidos de IgH de la pluralidad de células inmunitarias; un segundo cebador diana que comprende una región complementaria a una misma región de los polinucleótidos de IgL de la pluralidad de células inmunitarias; una transcriptasa inversa que comprende una actividad de transferasa terminal no matricial, donde se añaden 3 o más nucleótidos no matriciales idénticos al extremo 3' del primer y segundo polinucleótidos complementarios; una pluralidad de polinucleótidos con código de barras molecular, que comprenden cada uno de ellos: un código de barras molecular, una región terminal 5' complementaria a una región de un polinucleótido con código de barras del recipiente y una región terminal 3' complementaria a los 3 o más nucleótidos no matriciales; y un polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras único de la única célula; (b) amplificar el polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras doble de la única célula; (c) amplificar el primer y segundo polinucleótido con código de barras doble de la única célula, formando de ese modo una colección de secuencias que comprenden una región variable de los polinucleótidos de IgH o IgL, o una combinación de las mismas; y (d) secuenciar una o más de las secuencias de la colección, donde (a) se realiza en un recipiente de una pluralidad de recipientes, donde el recipiente comprende una única célula inmunitaria de la pluralidad de células inmunitarias.

En un aspecto, se proporciona en esta memoria un procedimiento que comprende: (a) producir un primer polinucleótido complementario a partir de un polinucleótido de receptor alfa de células T (TCRa) y un segundo polinucleótido complementario a partir de un polinucleótido de receptor beta de células T (TCRp) de una pluralidad de células inmunitarias de una muestra con: un primer cebador diana que comprende una región complementaria a una misma región de los polinucleótidos de TCRa de la pluralidad de células inmunitarias; un segundo cebador diana que comprende una región complementaria a una misma región de los polinucleótidos de TCRp de la pluralidad de células inmunitarias; una transcriptasa inversa que comprende una actividad de transferasa terminal no matricial, donde se añaden 3 o más nucleótidos no matriciales idénticos al extremo 3' del primer y segundo polinucleótidos complementarios; una pluralidad de polinucleótidos con código de barras molecular, que comprenden cada uno de ellos: un código de barras molecular, una región terminal 5' complementaria a una región de un polinucleótido con código de barras del recipiente y una región terminal 3' complementaria a los 3 o más nucleótidos no matriciales; y un polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras único de la única célula; (b) amplificar el polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras doble de la única célula; (c) amplificar el primer y segundo polinucleótidos con código de barras doble de la única célula, formando de ese modo una colección de secuencias que comprenden una región variable de los polinucleótidos de TCRa o TCRp, o una combinación de las mismas; y (d) secuenciar una o más de las secuencias de la colección, donde (a) se realiza en un recipiente de una pluralidad de recipientes, donde el recipiente comprende una única célula inmunitaria de la pluralidad de células inmunitarias.

En un aspecto, se proporciona en esta memoria un procedimiento que comprende: (a) producir un primer polinucleótido complementario a partir de un polinucleótido de receptor gamma de células T (TCRy) y un segundo polinucleótido complementario a partir de un polinucleótido de receptor delta de células T (TCR8) de una pluralidad de células inmunitarias de una muestra con: un primer cebador diana que comprende una región complementaria a una misma región de los polinucleótidos de TCR^yde la pluralidad de células inmunitarias; un segundo cebador diana que comprende una región complementaria a una misma región de los polinucleótidos de TCRS de la pluralidad de células inmunitarias; una transcriptasa inversa que comprende una actividad de transferasa terminal no matricial, donde se añaden 3 o más nucleótidos no matriciales idénticos al extremo 3' del primer y segundo polinucleótidos complementarios; una pluralidad de polinucleótidos con código de barras molecular, que comprenden cada uno de ellos: un código de barras molecular, una región terminal 5' complementaria a una región de un polinucleótido con código de barras del recipiente y una región terminal 3' complementaria a los 3 o más nucleótidos no matriciales; y un polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras doble de la única célula; (b) amplificar el polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras doble de la única célula; (c) amplificar el primer y segundo polinucleótidos con código de barras doble de la única célula, formando de ese modo una colección de secuencias que comprenden una región variable de los polinucleótidos de TCRy o TCR8, o una combinación de las mismas; y (d) secuenciar una o más de las secuencias de la colección, donde (a) se realiza en un recipiente de una pluralidad de recipientes, donde el recipiente comprende una única célula inmunitaria de la pluralidad de células inmunitarias.

En algunas realizaciones, la colección representa un estado inmunitario de la muestra. En algunas realizaciones, la primera y segunda secuencias con código de barras doble de la única célula son una colección de primera y segunda secuencias con código de barras doble de la única célula. En algunas realizaciones, el código de barras molecular del primer y segundo polinucleótidos con código de barras molecular es diferente. En algunas realizaciones, el primer y segundo polinucleótidos con código de barras único de la única célula comprenden un código de barras molecular diferente. En algunas realizaciones, la primera y segunda secuencias con código de barras doble de la única célula comprenden un código de barras molecular diferente. En algunas realizaciones, la primera y segunda secuencias con código de barras doble de la única célula comprenden el mismo código de barras del recipiente. En algunas realizaciones, la pluralidad de polinucleótidos con código de barras molecular no son productos amplificados. En algunas realizaciones, el código de barras molecular de un polinucleótido con código de barras molecular de un primer recipiente es diferente del código de barras molecular de un polinucleótido con código de barras molecular de un segundo recipiente. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de un primer recipiente de la pluralidad de recipientes es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de un segundo recipiente de la pluralidad de recipientes es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de un primer recipiente y un segundo recipiente es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de un tercer recipiente de la pluralidad de recipientes es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular del primer recipiente, el segundo recipiente y el tercer recipiente es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de cualquier recipiente individual de la pluralidad de recipientes es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de uno cualquiera de los recipientes de la pluralidad de recipientes es diferente del código de barras molecular de cada polinucleótido con código de barras molecular de otro cualquiera de los recipientes de la pluralidad de recipientes. En algunas realizaciones, el código de barras molecular de un polinucleótido con código de barras molecular de un primer recipiente es el mismo que el código de barras molecular de un polinucleótido con código de barras molecular de un segundo recipiente. En algunas realizaciones, el código de barras molecular de un polinucleótido con código de barras molecular de un primer recipiente es el mismo que el código de barras molecular de un polinucleótido con código de barras molecular del primer recipiente. En algunas realizaciones, el código de barras molecular de un polinucleótido con código de barras molecular de un segundo recipiente es el mismo que el código de barras molecular de un polinucleótido con código de barras molecular del segundo recipiente. En algunas realizaciones, el código de barras del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es diferente del código de barras del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de un segundo recipiente de la pluralidad de recipientes. En algunas realizaciones, el código de barras del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es un primer mismo código de barras del recipiente. En algunas realizaciones, el código de barras del recipiente de cada polinucleótido con código de barras del recipiente o amplicón del mismo de un segundo recipiente de la pluralidad de recipientes es un segundo mismo código de barras del recipiente. En algunas realizaciones, el primer código de barras del mismo recipiente es diferente del segundo código de barras del mismo recipiente. En algunas realizaciones, el código de barras del recipiente de cada polinucleótido con código de barras del recipiente o amplicón del mismo de un recipiente individual de la pluralidad de recipientes comprende un mismo código de barras del recipiente. En algunas realizaciones, el código de barras del recipiente de cada polinucleótido con código de barras del recipiente y amplicón del mismo de cualquier recipiente individual de la pluralidad de recipientes es exclusivo con respecto al código de barras del recipiente de cada polinucleótido con código de barras del recipiente y amplicón del mismo de cualquier otro recipiente individual de la pluralidad de recipientes.

En algunas realizaciones, el polinucleótido con código de barras del recipiente de (a) está presente en un recipiente como una única molécula. En algunas realizaciones, el polinucleótido con código de barras del recipiente de (a) está presente en cada recipiente de la pluralidad de recipientes como una única molécula. En algunas realizaciones, el polinucleótido con código de barras del recipiente de (a) está presente en un recipiente de la pluralidad de recipientes como al menos una única molécula. En algunas realizaciones, el polinucleótido con código de barras del recipiente de (a) está presente en cada recipiente de la pluralidad de recipientes como al menos una única molécula.

En algunas realizaciones, una primera secuencia común del recipiente de un primer polinucleótido con código de barras del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente. En algunas realizaciones, una segunda secuencia común del recipiente del primer polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente de la pluralidad de recipientes es la misma que una segunda secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente. En algunas realizaciones, una primera secuencia común del recipiente de un primer polinucleótido con código de barras del recipiente o amplicón del mismo de cualquier recipiente individual de la pluralidad de recipientes es la misma que una primera secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo del recipiente individual. En algunas realizaciones, cada polinucleótido con código de barras del recipiente de un único recipiente de la pluralidad de recipientes comprende una misma primera secuencia común del recipiente. En algunas realizaciones, cada polinucleótido con código de barras del recipiente de un único recipiente de la pluralidad de recipientes comprende una misma segunda secuencia común del recipiente. En algunas realizaciones, una primera secuencia común del recipiente de un primer polinucleótido con código de barras del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo de un segundo recipiente de la pluralidad de recipientes. En algunas realizaciones, una segunda secuencia común del recipiente del primer polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente es la misma que una segunda secuencia común del recipiente del segundo polinucleótido con código de barras del recipiente o amplicón del mismo. En algunas realizaciones, cada polinucleótido con código de barras del recipiente o amplicón del mismo de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una primera secuencia de común del recipiente que comprende la misma secuencia que una primera secuencia común del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, cada polinucleótido con código de barras del recipiente o amplicón del mismo de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una segunda secuencia de común del recipiente que comprende la misma secuencia que una segunda secuencia común del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, una primera secuencia molecular común de un primer polinucleótido con código de barras molecular de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia molecular común de un segundo polinucleótido con código de barras molecular del primer recipiente. En algunas realizaciones, una segunda secuencia molecular común del primer polinucleótido con código de barras molecular del primer recipiente de la pluralidad de recipientes es la misma que una segunda secuencia molecular común de un segundo polinucleótido con código de barras molecular del primer recipiente. En algunas realizaciones, una primera secuencia molecular común de un primer polinucleótido con código de barras molecular de cualquier recipiente individual de la pluralidad de recipientes es la misma que una primera secuencia molecular común de un segundo polinucleótido con código de barras molecular del recipiente individual. En algunas realizaciones, cada polinucleótido con código de barras molecular de un recipiente individual de la pluralidad de recipientes comprende una misma primera secuencia molecular común. En algunas realizaciones, cada polinucleótido con código de barras molecular de un recipiente individual de la pluralidad de recipientes comprende una misma segunda secuencia molecular común. En algunas realizaciones, una primera secuencia molecular común de un primer polinucleótido con código de barras molecular de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia molecular común de un segundo polinucleótido con código de barras molecular de un segundo recipiente de la pluralidad de recipientes. En algunas realizaciones, una segunda secuencia molecular común del primer polinucleótido con código de barras molecular es la misma que una segunda secuencia molecular común del segundo polinucleótido con código de barras molecular. En algunas realizaciones, cada polinucleótido con código de barras molecular de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una primera secuencia molecular común que comprende la misma secuencia que una primera secuencia molecular común de un polinucleótido con código de barras molecular de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, cada polinucleótido con código de barras molecular de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una segunda secuencia molecular común que comprende la misma secuencia que una segunda secuencia molecular común de un polinucleótido con código de barras molecular de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, la primera secuencia común del recipiente comprende una secuencia que comprende la misma secuencia que la primera secuencia molecular común. En algunas realizaciones, la primera secuencia común del recipiente comprende una secuencia complementaria a la primera secuencia molecular común o un complemento de la misma. En algunas realizaciones, la segunda secuencia molecular común comprende una región complementaria a tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario. En algunas realizaciones, la región complementaria a tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario es una región terminal.

En algunas realizaciones, un primer y un segundo polinucleótido con código de barras molecular no están fusionados entre sí. En algunas realizaciones, el primer y segundo polinucleótidos con código de barras único de la única célula no están fusionados entre sí. En algunas realizaciones, la primera y segunda secuencias con código de barras doble de la única célula no están fusionadas entre sí.

En algunas realizaciones, el primer polinucleótido celular es ADN. En algunas realizaciones, el segundo polinucleótido celular es ADN. En algunas realizaciones, el primer polinucleótido celular es ARN. En algunas realizaciones, el segundo polinucleótido celular es ARN. En algunas realizaciones, el ARN es ARNm. En algunas realizaciones, el primer polinucleótido complementario de (b) es ADNc. En algunas realizaciones, el segundo polinucleótido complementario de (b) es ADNc.

En algunas realizaciones, (b) comprende extender un primer cebador diana hibridado al primer polinucleótido celular y extender un segundo cebador diana hibridado al segundo polinucleótido celular. En algunas realizaciones, la extensión comprende la transcripción inversa del primer polinucleótido celular con un primer cebador diana y la transcripción inversa del segundo polinucleótido celular con un segundo cebador diana. En algunas realizaciones, el primer cebador diana comprende una secuencia complementaria a una secuencia diana del primer polinucleótido celular. En algunas realizaciones, el segundo cebador diana comprende una secuencia complementaria a una secuencia diana del segundo polinucleótido celular. En algunas realizaciones, el primer cebador diana comprende una secuencia de poli (T). En algunas realizaciones, el segundo cebador diana comprende una secuencia de poli (T). En algunas realizaciones, la secuencia diana del primer polinucleótido celular es una secuencia de cadena pesada de inmunoglobulina (IgH), una secuencia de TCRa, una secuencia de TCR^yo una combinación de las mismas. En algunas realizaciones, la secuencia diana del primer polinucleótido celular es una secuencia de región constante de cadena pesada (C^h), una secuencia de región constante de TCRa (Ca), una secuencia de región constante de TCR^y(Cy) o una combinación de las mismas. En algunas realizaciones, la secuencia diana del primer polinucleótido celular es una secuencia de cadena ligera de inmunoglobulina (IgL), una secuencia de TCRp, una secuencia de TCR8 o una combinación de las mismas. En algunas realizaciones, la secuencia diana del segundo polinucleótido celular es una secuencia de región constante de cadena ligera (Cl), una secuencia de región constante de TCRp (Cp), una secuencia de región constante de TCRS (CS) o una combinación de las mismas. En algunas realizaciones, el primer cebador diana comprende una pluralidad de primeros cebadores diana. En algunas realizaciones, el segundo cebador diana comprende una pluralidad de segundos cebadores diana. En algunas realizaciones, la pluralidad de primeros cebadores diana comprende una pluralidad de secuencias complementarias a una pluralidad de secuencias de cadena pesada de inmunoglobulina (IgH), secuencias de TCRa, secuencias de TCRy o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de cadena pesada de inmunoglobulina (IgH), secuencias de TCRa o secuencias de TCR^ycomprende una pluralidad de secuencias de región constante de cadena pesada (C^h), secuencias de región constante de TCRa (Ca), secuencias de región constante de TCRy (Cy) o una combinación de los mismos. En algunas realizaciones, la pluralidad de secuencias de región constante de cadena pesada (C^h) comprende dos o más secuencias seleccionadas del grupo que consiste en secuencias de región constante de cadena pesada (C^h) de IgM, IgD, IgA, IgE, IgG y combinaciones de las mismas. En algunas realizaciones, la pluralidad de segundos cebadores diana comprende una pluralidad de secuencias complementarias a una pluralidad de secuencias de cadena ligera de inmunoglobulina (IgL), secuencias de TCRp, secuencias de TCRS o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de cadena ligera de inmunoglobulina (IgL), secuencias de TCRp o secuencias de TCRS comprende una pluralidad de secuencias de región constante de cadena ligera (C^l), secuencias de región constante de TCRp (Cp), secuencias de regiones constante de TCRS (CS) o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de región constante de cadena ligera (C^l) comprende dos o más secuencias seleccionadas del grupo que consiste en secuencias de región constante de cadena ligera (C^l) de IgK, IgA y combinaciones de las mismas. En algunas realizaciones, en (b), la extensión comprende el uso de una transferasa terminal no matricial, donde se añaden tres o más nucleótidos no matriciales al extremo 3' del primer polinucleótido complementario. En algunas realizaciones, la transferasa terminal no matricial es una transcriptasa inversa o una polimerasa. En algunas realizaciones, la transferasa terminal no matricial es una transcriptasa inversa, y donde la transcriptasa inversa se selecciona del grupo que consiste en transcriptasa inversa Superscript II, transcriptasa inversa Maxima, transcriptasa inversa Protoscript II, transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV-RT), transcriptasa inversa HighScriber, transcriptasa inversa del virus de la mieloblastosis aviar (AMV), cualquier transcriptasa inversa que comprenda actividad de desoxinucleotidil transferasa terminal y combinaciones de las mismas. En algunas realizaciones, se añaden tres o más nucleótidos no matriciales al extremo 3' del segundo polinucleótido complementario.

En algunas realizaciones, en (c), la fijación comprende hibridar una región de un primer polinucleótido con código de barras molecular a los tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario. En algunas realizaciones, en (c), la fijación comprende hibridar una región de un segundo polinucleótido con código de barras molecular a los tres o más nucleótidos no matriciales añadidos al extremo 3' del segundo polinucleótido complementario. En algunas realizaciones, en (c), un primer polinucleótido con código de barras molecular fijado al primer polinucleótido complementario comprende una región complementaria a los tres o más nucleótidos no matriciales del extremo 3' del primer polinucleótido complementario. En algunas realizaciones, en (c), un segundo polinucleótido con código de barras molecular fijado al segundo polinucleótido complementario comprende una región complementaria a los tres o más nucleótidos no matriciales del extremo 3' del segundo polinucleótido complementario. En algunas realizaciones, los tres o más nucleótidos no matriciales son idénticos. En algunas realizaciones, al menos uno de los tres o más nucleótidos no matriciales no es idéntico a otro nucleótido de los tres o más nucleótidos no matriciales. En algunas realizaciones, al menos un nucleótido de la región hibridada del primer polinucleótido con código de barras molecular no es idéntico a otro ácido nucleico de la región hibridada del primer polinucleótido con código de barras molecular. En algunas realizaciones, al menos un nucleótido de la región hibridada del segundo polinucleótido con código de barras molecular no es idéntico a otro ácido nucleico de la región hibridada del segundo polinucleótido con código de barras molecular. En algunas realizaciones, el al menos un nucleótido no idéntico es un desoxirribonucleótido o un análogo del mismo. En algunas realizaciones, el al menos un nucleótido no idéntico no es un ribonucleótido o un análogo del mismo. En algunas realizaciones, el al menos un nucleótido no idéntico es una desoxirriboguanosina. En algunas realizaciones, el al menos un nucleótido no idéntico es un análogo de desoxirriboguanosina. En algunas realizaciones, el al menos un nucleótido no idéntico es un nucleótido terminal del primer o segundo polinucleótido con código de barras molecular. En algunas realizaciones, el al menos un nucleótido no idéntico es un ribonucleótido o un análogo del mismo. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es un desoxirribonucleótido o un análogo del mismo. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular no es un ribonucleótido o un análogo del mismo.

En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es una desoxirriboguanosina. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es un análogo de desoxirriboguanosina. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es un ribonucleótido o un análogo del mismo. En algunas realizaciones, al menos dos nucleótidos no terminales de la región hibridada del primer o segundo polinucleótido con código de barras molecular son ribonucleótidos o análogos de los mismos. En algunas realizaciones, al menos dos nucleótidos no terminales de la región hibridada del primer o segundo polinucleótido con código de barras molecular no son desoxirribonucleótidos o análogos de los mismos. En algunas realizaciones, al menos dos nucleótidos no terminales de la región hibridada del primer o segundo polinucleótido con código de barras molecular son desoxirribonucleótidos o análogos de los mismos. En algunas realizaciones, (c) comprende además extender el primer polinucleótido complementario y el segundo polinucleótido complementario después de la fijación. En algunas realizaciones, el primer polinucleótido complementario comprende una región complementaria a un primer polinucleótido con código de barras molecular. En algunas realizaciones, el segundo polinucleótido complementario comprende una región complementaria a un segundo polinucleótido con código de barras molecular. En algunas realizaciones, el primer polinucleótido complementario comprende una región complementaria a un segundo polinucleótido con código de barras molecular. En algunas realizaciones, la región del primer polinucleótido complementario que es complementaria al primer o segundo polinucleótido con código de barras molecular no es complementaria a una secuencia de código de barras molecular. En algunas realizaciones, la región del primer polinucleótido complementario que es complementaria al primer o segundo polinucleótido con código de barras molecular no es complementaria a una región del polinucleótido con código de barras del recipiente o un producto amplificado a partir del mismo. En algunas realizaciones, la región del primer polinucleótido complementario complementaria al primer o segundo polinucleótido con código de barras molecular comprende tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario. En algunas realizaciones, la región del segundo polinucleótido complementario que es complementaria al segundo polinucleótido con código de barras molecular comprende tres o más nucleótidos no matriciales añadidos al extremo 3' del segundo polinucleótido complementario. En algunas realizaciones, el primer polinucleótido complementario no es complementario al polinucleótido con código de barras del recipiente. En algunas realizaciones, el segundo polinucleótido complementario no es complementario al polinucleótido con código de barras del recipiente. En algunas realizaciones, una región de un complemento de un primer polinucleótido con código de barras molecular es complementaria a una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, una región de un complemento de un segundo polinucleótido con código de barras molecular es complementaria a una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, una región del primer polinucleótido con código de barras único de la única célula es complementaria a una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, una región del segundo polinucleótido con código de barras único de la única célula es complementaria a una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, una región del primer polinucleótido con código de barras único de la única célula es complementaria a la región del polinucleótido con código de barras del recipiente a la que es complementario el segundo polinucleótido con código de barras único de la única célula. En algunas realizaciones, el procedimiento comprende además amplificar el polinucleótido con código de barras del recipiente con un primer conjunto de cebadores, donde la amplificación se realiza antes de fijar el polinucleótido con código de barras del recipiente o simultáneamente a la fijación del polinucleótido con código de barras del recipiente. En algunas realizaciones, el polinucleótido con código de barras del recipiente comprende un primer y un segundo polinucleótido con código de barras del recipiente seleccionados del grupo que consiste en el polinucleótido con código de barras del recipiente, un complemento del polinucleótido con código de barras del recipiente, un producto amplificado a partir del polinucleótido con código de barras del recipiente y cualquier combinación de los mismos. En algunas realizaciones, fijar el polinucleótido con código de barras del recipiente comprende: hibridar una región del polinucleótido con código de barras del recipiente o producto amplificado del mismo a una región del primer polinucleótido con código de barras único de la única célula e hibridar una región del polinucleótido con código de barras del recipiente o producto amplificado del mismo a una región del segundo polinucleótido con código de barras único de la única célula.

En algunas realizaciones, el procedimiento comprende además extender la primera secuencia con código de barras único de la única célula y el segundo polinucleótido de secuencia con código de barras único de la única célula después de fijar el polinucleótido con código de barras del recipiente, formando de ese modo la primera y segunda secuencias con código de barras doble de la única célula. En algunas realizaciones, la primera secuencia con código de barras doble de la única célula comprende una región complementaria al polinucleótido con código de barras del recipiente. En algunas realizaciones, la segunda secuencia con código de barras doble de la única célula comprende una región complementaria al polinucleótido con código de barras del recipiente. En algunas realizaciones, las regiones de la primera y segunda secuencias con código de barras doble de la única célula que son complementarias al polinucleótido con código de barras del recipiente son la misma secuencia. En algunas realizaciones, la región del primer polinucleótido con código de barras único de la única célula que es complementaria al primer o segundo polinucleótido con código de barras molecular no es complementaria a una región del polinucleótido con código de barras del recipiente o un producto amplificado a partir del mismo. En algunas realizaciones, un primer cebador del primer conjunto de cebadores es complementario a una región de un primer polinucleótido con código de barras molecular, un complemento del primer polinucleótido con código de barras único de la única célula, un complemento de la primera secuencia con código de barras doble de la única célula o cualquier combinación de los mismos. En algunas realizaciones, el primer cebador del primer conjunto de cebadores es complementario a una región de un segundo polinucleótido con código de barras molecular, un complemento del segundo polinucleótido con código de barras único de la única célula, un complemento de la segunda secuencia con código de barras doble de la única célula o cualquier combinación de los mismos. En algunas realizaciones, un primer cebador del primer conjunto de cebadores no es complementario del primer polinucleótido celular o un complemento del mismo. En algunas realizaciones, el primer cebador del primer conjunto de cebadores no es complementario del segundo polinucleótido celular o un complemento del mismo. En algunas realizaciones, un primer cebador del primer conjunto de cebadores es complementario a una región de un complemento de la primera secuencia con código de barras único de la única célula que está aguas abajo del código de barras molecular. En algunas realizaciones, el primer cebador del primer conjunto de cebadores es complementario a una región de un complemento del segundo polinucleótido con código de barras único de la única célula que está aguas abajo del código de barras molecular. En algunas realizaciones, un primer cebador del primer conjunto de cebadores es complementario a una región de un complemento de la primera secuencia con código de barras doble de la única célula que está aguas arriba del código de barras del recipiente. En algunas realizaciones, el primer cebador del primer conjunto de cebadores es complementario a una región de un complemento del segundo polinucleótido con código de barras doble de la única célula que está aguas arriba del código de barras molecular. En algunas realizaciones, un segundo cebador del primer conjunto de cebadores no es complementario a una región del primer polinucleótido celular o un complemento del mismo, el primer polinucleótido complementario o un complemento del mismo, un primer polinucleótido con código de barras molecular o un complemento del mismo, el primer polinucleótido con código de barras único de la única célula o un complemento del mismo, o cualquier combinación de los mismos. En algunas realizaciones, el segundo cebador del primer conjunto de cebadores no es complementario a una región del segundo polinucleótido celular o un complemento del mismo, el segundo polinucleótido complementario o un complemento del mismo, un segundo polinucleótido con código de barras molecular o un complemento del mismo, el segundo polinucleótido con código de barras único de la única célula o un complemento del mismo, o cualquier combinación de los mismos. En algunas realizaciones, un segundo cebador del primer conjunto de cebadores es complementario a una región de la primera secuencia con código de barras doble de la única célula. En algunas realizaciones, un segundo cebador del primer conjunto de cebadores es complementario a una región de la segunda secuencia con código de barras doble de la única célula. En algunas realizaciones, un segundo cebador del primer conjunto de cebadores es complementario a una región de la primera secuencia con código de barras doble de la única célula que está aguas arriba del código de barras molecular. En algunas realizaciones, el segundo cebador del primer conjunto de cebadores es complementario a una región del segundo polinucleótido con código de barras molecular que está aguas arriba del código de barras molecular. En algunas realizaciones, un segundo cebador del primer conjunto de cebadores es complementario a una región de la primera secuencia con código de barras doble de la única célula que está aguas arriba del código de barras molecular. En algunas realizaciones, el segundo cebador del primer conjunto de cebadores es complementario a una región del segundo polinucleótido con código de barras molecular que está aguas arriba del código de barras del recipiente.

En algunas realizaciones, el procedimiento comprende además romper dos o más recipientes de la pluralidad de recipientes. En algunas realizaciones, el procedimiento comprende además agrupar la primera y segunda secuencias con código de barras doble de la única célula de los dos o más recipientes rotos.

En algunas realizaciones, el procedimiento comprende además amplificar la primera y segunda secuencias con código de barras doble de la única célula. En algunas realizaciones, la amplificación de la primera y segunda secuencias con código de barras doble de la única célula se realiza fuera de un recipiente de la pluralidad de recipientes. En algunas realizaciones, el procedimiento comprende además amplificar la primera y segunda secuencias con código de barras doble de la única célula con un segundo conjunto de cebadores. En algunas realizaciones, un primer cebador del segundo conjunto de cebadores no es complementario a una región del primer polinucleótido celular o un complemento del mismo, el primer polinucleótido complementario o un complemento del mismo, un primer polinucleótido con código de barras molecular o un complemento del mismo, el primer polinucleótido con código de barras único de la única célula o un complemento del mismo, o cualquier combinación de los mismos. En algunas realizaciones, el primer cebador del segundo conjunto de cebadores no es complementario a una región del segundo polinucleótido celular o un complemento del mismo, el segundo polinucleótido complementario o un complemento del mismo, un segundo polinucleótido con código de barras molecular o un complemento del mismo, el segundo polinucleótido con código de barras único de la única célula o un complemento del mismo, o cualquier combinación de los mismos. En algunas realizaciones, un primer cebador del segundo conjunto de cebadores es complementario a una región de la primera secuencia con código de barras doble de la única célula. En algunas realizaciones, el primer cebador del segundo conjunto de cebadores es complementario a una región de la segunda secuencia con código de barras doble de la única célula. En algunas realizaciones, un primer cebador del segundo conjunto de cebadores es complementario a una región de la primera secuencia con código de barras doble de la única célula que está aguas arriba del código de barras molecular. En algunas realizaciones, el primer cebador del segundo conjunto de cebadores es complementario a una región de la segunda secuencia con código de barras doble de la única célula que está aguas arriba del código de barras molecular. En algunas realizaciones, un primer cebador del segundo conjunto de cebadores es complementario a una región de la primera secuencia con código de barras doble de la única célula que está aguas arriba del código de barras del recipiente. En algunas realizaciones, el primer cebador del segundo conjunto de cebadores es complementario a una región de la segunda secuencia con código de barras doble de la única célula que está aguas arriba del código de barras del recipiente. En algunas realizaciones, el segundo cebador del primer conjunto de cebadores es el primer cebador del segundo conjunto de cebadores. En algunas realizaciones, un segundo cebador del segundo conjunto de cebadores es complementario a una región del primer y segundo polinucleótido celular, un complemento del primer y segundo polinucleótido complementario, un complemento del primer y segundo polinucleótido con código de barras único de la única célula, un complemento de la primera y segunda secuencia con código de barras doble de la única célula, o cualquier combinación de los mismos. En algunas realizaciones, el segundo cebador del segundo conjunto de cebadores comprende una secuencia de poli (T). En algunas realizaciones, un segundo cebador del segundo conjunto de cebadores es complementario a una región del primer o segundo polinucleótido celular, un complemento del primer o segundo polinucleótido complementario, un complemento del primer o segundo polinucleótido con código de barras único de la única célula, un complemento de la primera o segunda secuencia con código de barras doble de la única célula, o cualquier combinación de los mismos. En algunas realizaciones, el segundo cebador del segundo conjunto de cebadores no es complementario a un primer o segundo polinucleótido con código de barras molecular o un complemento del mismo, el polinucleótido con código de barras del recipiente o un complemento del mismo, o cualquier combinación de los mismos. En algunas realizaciones, un tercer cebador del segundo conjunto de cebadores es complementario a una región del segundo polinucleótido celular, un complemento del segundo polinucleótido complementario, un complemento del segundo polinucleótido con código de barras único de la única célula, un complemento de la segunda secuencia con código de barras doble de la única célula, o cualquier combinación de los mismos. En algunas realizaciones, el segundo cebador del segundo conjunto de cebadores es complementario a una región del primer polinucleótido celular, un complemento del primer polinucleótido complementario, un complemento del primer polinucleótido con código de barras único de la única célula, un complemento de la primera secuencia con código de barras doble de la única célula, o cualquier combinación de los mismos. En algunas realizaciones, el tercer cebador del segundo conjunto de cebadores no es complementario a una región del primer polinucleótido celular, un complemento del primer polinucleótido complementario, un complemento del primer polinucleótido con código de barras único de la única célula, un complemento de la primera secuencia con código de barras doble de la única célula, o cualquier combinación de los mismos. En algunas realizaciones, el tercer cebador del segundo conjunto de cebadores no es complementario a un primer o segundo polinucleótido con código de barras molecular o un complemento del mismo, el polinucleótido con código de barras del recipiente o un complemento del mismo, o cualquier combinación de los mismos. En algunas realizaciones, el segundo cebador del segundo conjunto de cebadores comprende una secuencia específica de la diana. En algunas realizaciones, el tercer cebador del segundo conjunto de cebadores comprende una secuencia específica de la diana. En algunas realizaciones, la secuencia específica de la diana del segundo cebador del segundo conjunto de cebadores se dirige a una secuencia de cadena pesada de inmunoglobulina (IgH), una secuencia de TCRa, una secuencia de TCRy o una combinación de las mismas. En algunas realizaciones, la secuencia específica de la diana del segundo cebador del segundo conjunto de cebadores se dirige a una secuencia de región constante de cadena pesada (C^h), una secuencia de región constante de TCRa (Ca), una secuencia de región constante de TCR^y(C^y) o una combinación de las mismas. En algunas realizaciones, la secuencia específica de la diana del segundo cebador se selecciona del grupo que consiste en GGGTTGGGGCGGATGCAC, CATCCGGAGCCTTGGTGG, CCTTGGGGCTGGTCGGGG, CGGATGGGCTCTGTGTGG, CCGATGGGCCCTTGGTGG, GGATTTAGAGTCTCTCAGCTG, CACGGCAGGGTCAGGGTTC y GGGGAAACATCTGCATCAAGT. En algunas realizaciones, la secuencia específica de la diana del tercer cebador del segundo conjunto de cebadores se dirige a una secuencia de cadena ligera de inmunoglobulina (IgL), una secuencia de TCRp, una secuencia de TCR8 o una combinación de las mismas. En algunas realizaciones, la secuencia específica de la diana del tercer cebador del segundo conjunto de cebadores se dirige a una secuencia de región constante de cadena ligera (CL), una secuencia de región constante de TCRp (Cp), una secuencia de región constante de TCRS (CS) o una combinación de las mismas. En algunas realizaciones, la secuencia específica de la diana del tercer cebador se selecciona del grupo que consiste en TTTGATCTCCACCTTGGTCCCTCCGC, TTTGATCTCCAGCTTGGTCCCCTGG, TTTGATATCCACTTTGGTCCCAGGGC, TTTGATTTCCACCTTGGTCCCTTGGC, TTTAATCTCCAGTCGTGTCCCTTGGC, GAGGACGGTCACCTTGGTGCCA, TAGGACGGTCAGCTTGGTCCCTCC, GAGGACGGTCAGCTGGGTGCC, TAAAATGATCAGCTGGGTTCCTCCAC, TAGGACGGTGACCTTGGTCCCAG, GGGAGATCTCTGCTTCTGATG, CGACCTCGGGTGGGAACAC y CGGATGGTTTGGTATGAGGC. En algunas realizaciones, el segundo cebador del segundo conjunto de cebadores comprende una pluralidad de segundos cebadores. En algunas realizaciones, el tercer cebador del segundo conjunto de cebadores comprende una pluralidad de terceros cebadores. En algunas realizaciones, las secuencias específicas de la diana de la pluralidad de segundos cebadores se dirigen a una pluralidad de secuencias de cadena pesada de inmunoglobulina (IgH), secuencias de TCRa, secuencias de TCRy o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de cadena pesada de inmunoglobulina (IgH), secuencias de TCRa o secuencias de TCRy comprende una pluralidad de secuencias de región constante de cadena pesada (C^h), secuencias de región constante de TCRa (Ca), secuencias de región constante de TCR^y(C^y) o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de región constante de cadena pesada (C^h) comprende dos o más secuencias seleccionadas del grupo que consiste en secuencias de región constante de cadena pesada (C^h) de IgM, IgD, IgA, IgE, IgG y combinaciones de las mismas. En algunas realizaciones, las secuencias específicas de la diana de la pluralidad de terceros cebadores se dirigen a una pluralidad de secuencias de cadena ligera de inmunoglobulina (IgL), secuencias de TCRp, secuencias de TCRS o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de cadena ligera de inmunoglobulina (IgL), secuencias de TCRp o secuencias de TCRS comprende una pluralidad de secuencias de región constante de cadena ligera (C^l), secuencias de región constante de TCRp (Cp), secuencias de región constante de TCRS (C5) o una combinación de las mismas. En algunas realizaciones, la pluralidad de secuencias de región constante de cadena ligera (C^l) comprende dos o más secuencias seleccionadas del grupo que consiste en secuencias de región constante de cadena ligera (C^l) de IgK, IgA y combinaciones de las mismas.

En algunas realizaciones, un primer cebador diana, un segundo cebador diana, el polinucleótido con código de barras del recipiente, un polinucleótido con código de barras molecular, o cualquier combinación de los mismos, no está unido a un soporte sólido. En algunas realizaciones, un primer cebador diana, un segundo cebador diana, un cebador del primer conjunto de cebadores, un cebador del segundo conjunto de cebadores, o cualquier combinación de los mismos, no comprende un código de barras molecular, un código de barras del recipiente, un código de barras o cualquier combinación de los mismos. En algunas realizaciones, un primer cebador diana, un segundo cebador diana, un cebador del primer conjunto de cebadores, un cebador del segundo conjunto de cebadores, o cualquier combinación de los mismos, no comprende una región protuberante. En algunas realizaciones, cada recipiente de la pluralidad de recipientes no comprende un soporte sólido. En algunas realizaciones, el polinucleótido con código de barras del recipiente está fijado a un soporte sólido. En algunas realizaciones, el polinucleótido con código de barras del recipiente está fijado a una perla. En algunas realizaciones, el polinucleótido con código de barras del recipiente, un polinucleótido con código de barras molecular o cualquier combinación de los mismos no es un cebador. En algunas realizaciones, el polinucleótido con código de barras del recipiente, un polinucleótido con código de barras molecular o cualquier combinación de los mismos no es está extendido.

En algunas realizaciones, (a)-(d) se realizan en el recipiente individual.

En algunas realizaciones, (a)-(d) se realizan en una única reacción.

En algunas realizaciones, el procedimiento comprende además lisar la única célula. En algunas realizaciones, la lisis libera el primer y segundo polinucleótido celular de la única célula. En algunas realizaciones, la única célula se lisa después de (a). En algunas realizaciones, la única célula se lisa después de (b). En algunas realizaciones, la única célula se lisa en el recipiente. En algunas realizaciones, la lisis comprende lisis química. En algunas realizaciones, la lisis comprende congelación-descongelación.

En algunas realizaciones, el código de barras del recipiente se amplifica antes de (d). En algunas realizaciones, el código de barras del recipiente se amplifica simultáneamente a (d). En algunas realizaciones, el código de barras del recipiente y el primer polinucleótido con código de barras de la única célula se amplifican o extienden simultáneamente. En algunas realizaciones, el código de barras del recipiente, el primer polinucleótido con código de barras único de la única célula y el segundo polinucleótido con código de barras único de la única célula se amplifican o extienden simultáneamente. En algunas realizaciones, el primer polinucleótido con código de barras de la única célula y el segundo polinucleótido con código de barras único de la única célula se amplifican o extienden simultáneamente. En algunas realizaciones, el primer polinucleótido con código de barras doble de la única célula y el segundo polinucleótido con código de barras doble de la única célula se amplifican o extienden simultáneamente. En algunas realizaciones, la pluralidad de recipientes comprende una pluralidad de pocillos. En algunas realizaciones, la pluralidad de recipientes comprende una pluralidad de emulsiones. En algunas realizaciones, cada emulsión de la pluralidad de emulsiones tiene un volumen de aproximadamente 0,01 picolitros a 10 microlitros. En algunas realizaciones, la pluralidad de recipientes comprende una pluralidad de envases. En algunas realizaciones, el primer cebador diana, el segundo cebador diana, un cebador del primer conjunto de cebadores o un cebador del segundo conjunto de cebadores comprende un código de barras de la muestra. En algunas realizaciones, el procedimiento comprende además recuperar el primer polinucleótido con código de barras doble de la única célula, el segundo polinucleótido con código de barras doble de la única célula y los productos amplificados de los mismos del recipiente. En algunas realizaciones, el procedimiento comprende además secuenciar el primer polinucleótido con código de barras doble de la única célula, el segundo polinucleótido con código de barras doble de la única célula, los productos amplificados de los mismos o cualquier combinación de los mismos. En algunas realizaciones, el primer polinucleótido con código de barras doble de la única célula, el segundo polinucleótido con código de barras doble de la única célula, los productos amplificados de los mismos o cualquier combinación de los mismos se secuencian simultáneamente. En algunas realizaciones, el primer polinucleótido con código de barras doble de la única célula, el segundo polinucleótido con código de barras doble de la única célula, los productos amplificados de los mismos o cualquier combinación de los mismos se secuencian en la misma reacción.

En algunas realizaciones, el procedimiento comprende además determinar que el origen celular del primer polinucleótido celular y el segundo polinucleótido celular es el mismo en base al código de barras del recipiente. En algunas realizaciones, la determinación comprende emparejar la secuencia del código de barras del recipiente del primer polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo con la secuencia del código de barras del recipiente del segundo polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo. En algunas realizaciones, el procedimiento comprende además determinar varias moléculas de partida con una secuencia del primer polinucleótido celular, el segundo polinucleótido celular, o ambos, en base al código de barras molecular. En algunas realizaciones, la determinación comprende determinar el número de secuencias con un mismo primer código de barras molecular, un mismo segundo código de barras molecular o ambos. En algunas realizaciones, cuando una primera secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo y una segunda secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo contienen un mismo código de barras del recipiente o un complemento del mismo, son del mismo recipiente individual o de la misma célula individual. En algunas realizaciones, cuando la primera secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo y la segunda secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo contienen un código de barras molecular diferente o un complemento del mismo, son de una molécula de polinucleótido celular diferente. En algunas realizaciones, cuando la primera secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo y la segunda secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo contienen un mismo código de barras molecular o un complemento del mismo, son de una misma molécula de polinucleótido celular. En algunas realizaciones, cuando la primera secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo y la segunda secuencia de un polinucleótido con código de barras doble de la única célula o un producto amplificado del mismo contienen un código de barras del recipiente diferente o un complemento del mismo, son de un recipiente individual o una célula individual diferentes.

En algunas realizaciones, la única célula comprende una célula inmunitaria. En algunas realizaciones, la pluralidad de células comprende una pluralidad de células inmunitarias. En algunas realizaciones, la célula inmunitaria es un linfocito o un subtipo del mismo, una célula B o un subtipo de la misma, una célula T o un subtipo de la misma, o una combinación de las mismas. En algunas realizaciones, la pluralidad de células está enriquecida en células B de memoria, células B indiferenciadas, células B de plasmablastos, células T indiferenciadas, células T de plasmablastos, cualquier subtipo de célula B, cualquier subtipo de célula T o cualquier combinación de las mismas. En ciertas realizaciones, la única célula comprende una célula cancerosa. En algunas realizaciones, la pluralidad de células comprende una pluralidad de células cancerosas. En algunas realizaciones, la célula cancerosa es una célula de carcinoma de células escamosas, una célula de adenocarcinoma, una célula de carcinoma de células transicionales, una célula de sarcoma óseo, una célula de sarcoma cartilaginoso, una célula de sarcoma muscular, una célula de leucemia, una célula de linfoma, una célula de glioma o cualquier combinación de las mismas. En algunas realizaciones, la pluralidad de células cancerosas está enriquecida en células cancerosas circulantes, células cancerosas endoteliales, células cancerosas epiteliales, células cancerosas raras o cualquier tipo o subtipo de célula cancerosa. En algunas realizaciones, la muestra es una muestra biológica. En algunas realizaciones, la muestra biológica es de un sujeto. En algunas realizaciones, el procedimiento comprende además diagnosticar que el sujeto tiene una enfermedad o afección. En algunas realizaciones, el sujeto es un animal. En algunas realizaciones, el animal es un ser humano. En algunas realizaciones, el procedimiento comprende además determinar si un sujeto es homocigoto o heterocigoto para un alelo. En algunas realizaciones, el procedimiento comprende además diagnosticar, pronosticar o tratar a un sujeto con una enfermedad o afección. En algunas realizaciones, la muestra es una muestra de sangre. En algunas realizaciones, el primer o segundo polinucleótido celular se aísla de la muestra. En algunas realizaciones, el primer o segundo polinucleótido celular no se aísla de la muestra.

En algunas realizaciones, la muestra comprende una pluralidad de muestras que comprenden una primera muestra y una segunda muestra. En algunas realizaciones, la pluralidad de muestras comprende al menos 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más muestras. En algunas realizaciones, la pluralidad de muestras comprende al menos aproximadamente 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 o más muestras. En algunas realizaciones, la pluralidad de muestras comprende al menos aproximadamente 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 muestras, 9000, o 10000 muestras, o 100000 muestras, o 1000000 o más muestras. En algunas realizaciones, la pluralidad de muestras comprende al menos aproximadamente 10000 muestras. En algunas realizaciones, la primera muestra es de un primer sujeto y la segunda muestra es de un segundo sujeto. En algunas realizaciones, el primer sujeto es un sujeto con una enfermedad o afección. En algunas realizaciones, el segundo sujeto es un sujeto sin una enfermedad o afección. En algunas realizaciones, el primer o segundo polinucleótido celular comprende una variante de secuencia. En algunas realizaciones, la variante de secuencia comprende una mutación, un polimorfismo, una deleción o una inserción. En algunas realizaciones, el polimorfismo es un polimorfismo de un único nucleótido. En algunas realizaciones, el primer o segundo polinucleótido celular es un biomarcador para una enfermedad o afección. En algunas realizaciones, el primer o segundo polinucleótido celular es de un patógeno. En algunas realizaciones, el patógeno es un virus, una bacteria o un hongo.

En algunas realizaciones, el procedimiento comprende además comparar las secuencias de una colección del primer y segundo polinucleótidos con código de barras doble de la única célula de un sujeto con una colección del primer y segundo polinucleótidos con código de barras doble de la única célula del mismo sujeto en un momento diferente. En algunas realizaciones, el procedimiento comprende además comparar las secuencias de una colección del primer y segundo polinucleótidos con código de barras doble de la única célula de un sujeto con una enfermedad o afección con una colección del primer y segundo polinucleótidos con código de barras doble de la única célula de un sujeto sin la enfermedad o afección.

En algunas realizaciones, el procedimiento comprende además determinar una secuencia de la línea germinal del primer polinucleótido celular, el segundo polinucleótido celular, o ambos, donde el primer polinucleótido celular comprende una secuencia de IgH o V^hy donde el segundo polinucleótido celular comprende una secuencia de IgL o V^l, o cualquier combinación de las mismas. En algunas realizaciones, el procedimiento comprende además determinar una varianza de la secuencia de IgL IgH, V^h, V^lo cualquier combinación de las mismas a partir de una secuencia de las de la línea germinal. En algunas realizaciones, el procedimiento comprende además determinar al menos uno de: el número total de secuencias de IgH exclusivas; el número total de secuencias de IgL exclusivas; el número total de secuencias de IgH e IgL exclusivas; el número total de secuencias de IgL e IgH emparejadas exclusivas; la frecuencia de una secuencia de IgH o una secuencia de IgL; o la frecuencia de una combinación de una secuencia de IgH y una secuencia de IgL frente a una o más distintas. En algunas realizaciones, el procedimiento comprende además determinar una secuencia de la línea germinal del primer polinucleótido celular, el segundo polinucleótido celular, o ambos, donde el primer polinucleótido celular comprende una secuencia de TCRa o Va y donde el segundo polinucleótido celular comprende una secuencia de TCRp o Vp, o cualquier combinación de las mismas. En algunas realizaciones, el procedimiento comprende además determinar una varianza de la secuencia del TCRa, TCRp, Va, Vp o cualquier combinación de los mismos a partir de una secuencia de las de la línea germinal. En algunas realizaciones, el procedimiento comprende además determinar al menos uno de: el número total de secuencias de TCRa exclusivas; el número total de secuencias de TCRp exclusivas; el número total de secuencias de IgH e IgL exclusivas; el número total de secuencias de TCRa y TCRp emparejadas exclusivas; la frecuencia de una secuencia de TCRa o una secuencia de TCRp; o la frecuencia de una combinación de una secuencia de TCRa y una secuencia de TCRp frente a una o más distintas. En algunas realizaciones, el procedimiento comprende además determinar una secuencia de la línea germinal del primer polinucleótido celular, el segundo polinucleótido celular, o ambos, donde el primer polinucleótido celular comprende una secuencia de TCR^yo V^yy donde el segundo polinucleótido celular comprende una secuencia de TCR8 o VS, o cualquier combinación de las mismas. En algunas realizaciones, el procedimiento comprende además determinar una varianza de la secuencia de TCR^y, TCRS, V^y, VS o cualquier combinación de los mismos a partir de una secuencia de las de la línea germinal. En algunas realizaciones, el procedimiento comprende además determinar al menos uno de: el número total de secuencias de TCRy exclusivas; el número total de secuencias de TCRS exclusivas; el número total de secuencias de TCRy y TCRS exclusivas; el número total de secuencias de TCRS y TCRy emparejadas exclusivas; la frecuencia de una secuencia de TCRy o una secuencia de TCRS; o la frecuencia de una combinación de una secuencia de TCR^yy una secuencia de TCR^sfrente a una o más distintas. En algunas realizaciones, el procedimiento comprende además determinar al menos uno de: el número total de secuencias de un primer gen; el número total de secuencias de un segundo gen; el número total de secuencias exclusivas de un primer gen; el número total de secuencias exclusivas de un segundo gen; o la frecuencia de una secuencia de un primer gen o una secuencia de un segundo gen. En algunas realizaciones, el procedimiento comprende además seleccionar un anticuerpo o un TCR en base a una cantidad total de uno o más pares de secuencias de IgL e IgH, o secuencias de TCRa y TCRp, o secuencias de TCRy y TCRS emparejadas individualmente, y una varianza de una línea germinal. En algunas realizaciones, el procedimiento comprende además seleccionar un anticuerpo o un TCR en base a una o más secuencias de IgL e IgH, secuencias de TCRa y TCRp, o secuencias de TCRy y TCR5, y una varianza de una línea germinal. En algunas realizaciones, el procedimiento comprende además seleccionar un anticuerpo o un TCR en base a uno o más de patrones de secuencia, análisis de varianza, dinámica o frecuencia. En algunas realizaciones, el procedimiento comprende además seleccionar un anticuerpo o un TCR en base a la frecuencia.

En algunas realizaciones, el anticuerpo o TCR seleccionado se une a un epítopo de TCR con una KD menor de aproximadamente, o igual a, 1 x 10-7, 1 x 10-8, 1 x 10-9, 1 x 10-1°, 1 x 10-11 o 1 x 10-12 M.

En algunas realizaciones, el anticuerpo o TCR seleccionado es un anticuerpo o TCR terapéutico humano. En algunas realizaciones, el anticuerpo o TCR seleccionado es un anticuerpo o TCR neutralizante. En algunas realizaciones, se desconoce una diana a la que se une el anticuerpo o TCR seleccionado. En algunas realizaciones, se desconoce una diana a la que se une el anticuerpo o TCR seleccionado en el momento en que se selecciona el anticuerpo o TCR seleccionado.

En algunas realizaciones, el procedimiento comprende además poner en contacto el anticuerpo o TCR seleccionado con al menos un biomarcador candidato para descubrir un biomarcador. En algunas realizaciones, el biomarcador candidato está sobre un soporte sólido. En algunas realizaciones, el biomarcador está en solución. En algunas realizaciones, el anticuerpo o TCR está sobre un soporte sólido. En algunas realizaciones, el anticuerpo o TCR está en solución. En algunas realizaciones, el soporte sólido es una matriz. En algunas realizaciones, el soporte sólido es una perla.

En algunas realizaciones, el procedimiento comprende además introducir el primer polinucleótido celular en un vector. En algunas realizaciones, el procedimiento comprende además introducir el segundo polinucleótido celular en el vector. En algunas realizaciones, el vector es un vector de clonación. En algunas realizaciones, el vector es un vector de expresión.

En algunas realizaciones, el procedimiento comprende además emparejar secuencias con códigos de barras moleculares idénticos. En algunas realizaciones, el procedimiento comprende además formar secuencias consenso a partir de la colección. En algunas realizaciones, los errores de secuenciación y PCR se minimizan, eliminan o son inferiores a 0,01 %, 0,001 %, 0,0001 %, 0,00001 %, 0,000001 % o 0,0000001 %. En algunas realizaciones, el número de ciclos de una reacción de amplificación se limita a cualquiera de 1 a 40 ciclos.

En un aspecto, se proporciona en esta memoria un anticuerpo o TCR aislado y purificado identificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un anticuerpo de tipo IgL, un TCRp o un TCRS aislado y purificado identificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un anticuerpo de tipo IgH, un TCRa o un TCR^yaislado y purificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un fragmento Fab de un anticuerpo o un TCR aislado y purificado identificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un fragmento Fab2 de un anticuerpo o un TCR aislado y purificado identificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un fragmento Fv de un anticuerpo o un TCR aislado y purificado identificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un fragmento ScFv de un anticuerpo o un TCR aislado y purificado identificado mediante cualquiera de los procedimientos descritos en esta memoria. En un aspecto, se proporciona en esta memoria un procedimiento para tratar a un sujeto que lo necesita, que comprende administrar el anticuerpo o TCR seleccionado, o un fragmento del mismo, a un sujeto que lo necesita. En algunas realizaciones, el anticuerpo, TCR o fragmento de los mismos se identifica a partir del sujeto que lo necesita. En algunas realizaciones, el anticuerpo, TCR o fragmento de los mismos no se identifica a partir del sujeto que lo necesita. En algunas realizaciones, el sujeto que lo necesita presenta uno o más síntomas de una enfermedad. En algunas realizaciones, el sujeto que lo necesita tiene una enfermedad. En algunas realizaciones, la enfermedad es desconocida. En algunas realizaciones, la enfermedad es conocida. En algunas realizaciones, la muestra comprende una primera muestra de un sujeto tomada en un primer momento y una segunda muestra del sujeto tomada en un segundo momento. En algunas realizaciones, el procedimiento comprende además determinar un aumento o una disminución en la cantidad del primer o segundo polinucleótido celular a partir de las muestras tomadas en el primer y segundo momentos. En algunas realizaciones, el aumento o la disminución en la cantidad es un aumento o una disminución que varía desde al menos aproximadamente: 0,1 veces, 0,2 veces, 0,3 veces, 0,4 veces, 0,5 veces, 0,6 veces, 0,7 veces, 0,8 veces, 0,9 veces, 1,5 veces, 2 veces, 3 veces, 5 veces, 10 veces, 50 veces, 100 veces, 1000 veces, 10000 veces, 100000 veces, 1 000 000 veces o más. En algunas realizaciones, el tiempo entre el primer y el segundo momentos es aproximadamente, o al menos aproximadamente: 1 hora, 2 horas, 3 horas, 4 horas, 5 horas, 6 horas 7 horas, 8 horas, 9 horas, 10 horas, 11 horas, 12 horas 13 horas, 14 horas, 15 horas, 16 horas, 17 horas, 18 horas, 19 horas, 20 horas, 21 horas, 22 horas, 23 horas, 1 día, 2 días, 3 días, 4 días, 5 días, 6 días, 1 semana, 2 semanas, 3 semanas, 4 semanas, 5 semanas, 6 semanas, 7 semanas, 8 semanas, 9 semanas, 10 semanas, 11 semanas, 12 semanas, 4 meses, 5 meses, 6 meses , 7 meses, 8 meses, 9 meses, 10 meses, 11 meses, 12 meses o más.

En algunas realizaciones, la secuenciación es de alto rendimiento. En algunas realizaciones, el procedimiento no comprende múltiples cebadores y/o múltiples cebadores fijados a un soporte sólido. En algunas realizaciones, el procedimiento no emplea una multitud de cebadores de segmento V que comprenden una secuencia que es complementaria a un único segmento V funcional o una pequeña familia de segmentos V. En algunas realizaciones, el procedimiento no emplea una etapa de aislar el primer o segundo polinucleótido celular. En algunas realizaciones, la secuenciación se hace mediante síntesis masiva paralela.

En algunas realizaciones, el procedimiento comprende además comparar las lecturas de secuencia con una secuencia de la línea germinal y determinar una acumulación de hipermutaciones somáticas de las lecturas de secuencia. En algunas realizaciones, el procedimiento comprende además determinar una distribución de isotipos de secuencias de anticuerpo para seleccionar un isotipo específico. En algunas realizaciones, el anticuerpo seleccionado comprende un isotipo de Ig específico. En algunas realizaciones, el isotipo de Ig es IgA, IgG, IgM, IgD o IgE.

En algunas realizaciones, el procedimiento comprende además generar una colección de secuencias de IgH e IgL de anticuerpo o secuencias de TCRa y TCRp apareadas. En algunas realizaciones, la colección es una base de datos. En algunas realizaciones, el primer y segundo polinucleótidos con código de barras doble de la única célula comprenden una región CDR1, CDR2, CDR3 y/o una región de hipermutación en las secuencias codificantes de anticuerpos o TCR.

En algunas realizaciones, el procedimiento comprende además clonar el anticuerpo o TCR seleccionado directamente mediante tecnología de presentación en superficie. En algunas realizaciones, el procedimiento comprende además desarrollar el anticuerpo o TCR seleccionado mediante evolución dirigida. En algunas realizaciones, el procedimiento comprende además cribar el anticuerpo o TCR seleccionado para determinar la especificidad funcional, afinidad o capacidad de neutralización. En algunas realizaciones, las mutaciones somáticas se determinan con 99 % de confianza o superior. En algunas realizaciones, se identifica cada segmento V, D y J de cada molécula de polinucleótido.

En algunas realizaciones, el código de barras del recipiente comprende al menos 2 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 3, 4, 5, 6, 7, 8 o 9 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 10 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 15 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 50 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende de 10-30 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende una secuencia degenerada. En algunas realizaciones, el código de barras del recipiente comprende una secuencia degenerada completa o parcial. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNNNNNNNNNNN, donde N es cualquier ácido nucleico. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNWNNNNNWNNNNN, donde N es cualquier ácido nucleico y W es adenina o timina. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNXNNNNNXNNNNN, donde N es cualquier ácido nucleico y X es cualquier nucleótido conocido. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNNNNNNNNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son W, donde W es adenina o timina. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNNNNNNNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son X, donde X es cualquier nucleótido conocido. En algunas realizaciones, el código de barras molecular comprende al menos 2 nucleótidos. En algunas realizaciones, el código de barras molecular comprende al menos 3, 4, 5, 6, 7, 8 o 9 nucleótidos. En algunas realizaciones, el código de barras molecular comprende al menos 10 nucleótidos. En algunas realizaciones, el código de barras molecular comprende al menos 15 nucleótidos. En algunas realizaciones, el código de barras molecular comprende como máximo 50 nucleótidos. En algunas realizaciones, el código de barras molecular comprende de 10-30 nucleótidos. En algunas realizaciones, el código de barras molecular comprende una secuencia degenerada. En algunas realizaciones, el código de barras molecular comprende una secuencia degenerada completa o parcial. En algunas realizaciones, el código de barras molecular comprende la secuencia NNNNNNNN, donde N es cualquier ácido nucleico. En algunas realizaciones, el código de barras molecular comprende la secuencia NNTNNANN, donde N es cualquier ácido nucleico. En algunas realizaciones, el código de barras molecular comprende la secuencia NNWNNWNN, donde N es cualquier ácido nucleico y W es adenina o timina. En algunas realizaciones, el código de barras molecular comprende la secuencia NNXNNXNN, donde N es cualquier ácido nucleico y X es cualquier nucleótido conocido. En algunas realizaciones, el código de barras molecular comprende la secuencia NNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son W, donde W es adenina o timina. En algunas realizaciones, el código de barras molecular comprende la secuencia NNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son X, donde X es cualquier nucleótido conocido.

En algunas realizaciones, el procedimiento comprende además corregir errores de amplificación. En algunas realizaciones, el procedimiento comprende además corregir errores de secuenciación. En algunas realizaciones, el procedimiento comprende además la agrupación o “binning” de secuencias que comprenden el mismo código de barras molecular. En algunas realizaciones, el procedimiento comprende además la agrupación o “binning” de secuencias que comprenden el mismo código de barras molecular usando un ordenador o un algoritmo. En algunas realizaciones, el procedimiento comprende además la agrupación o “binning” de secuencias que comprenden el mismo código de barras del recipiente usando un ordenador o un algoritmo. En algunas realizaciones, el procedimiento comprende además agrupar secuencias con al menos aproximadamente 90 %, 95 % o 99 % de homología de secuencia. En algunas realizaciones, el procedimiento comprende además alinear secuencias con al menos aproximadamente 90 %, 95 % o 99 % de homología de secuencia. En algunas realizaciones, la agrupación o alineación se realiza con la ayuda de un ordenador o un algoritmo. En algunas realizaciones, el procedimiento comprende determinar el número de lecturas de secuencia que contienen el mismo código de barras molecular. En algunas realizaciones, el procedimiento comprende determinar el número de lecturas de secuencia que contienen tanto el mismo código de barras molecular como una misma secuencia del primer polinucleótido celular con al menos aproximadamente 90 %, 95 % o 99 % de homología de secuencia. En algunas realizaciones, el procedimiento comprende determinar el número de lecturas de secuencia que contienen tanto el mismo código de barras molecular como una misma secuencia del segundo polinucleótido celular con al menos aproximadamente 90 %, 95 % o 99 % de homología de secuencia. En algunas realizaciones, el procedimiento comprende determinar la cantidad de un primer 0 segundo polinucleótido celular en la muestra. En algunas realizaciones, el procedimiento comprende formar una secuencia consenso a partir de dos o más secuencias, lecturas de secuencia, secuencias de amplicones, secuencias agrupadas mediante “binning”, secuencias alineadas, secuencias agrupadas o secuencias de conjuntos de amplicones que comprenden el mismo código de barras molecular o código de barras del recipiente, o ambos. En algunas realizaciones, el procedimiento comprende determinar la secuencia de un primer o segundo polinucleótido celular con al menos aproximadamente 80 %, 81 %, 82 %, 83 %, 84 %, 85 %,86 %, 87 %, 88 %, 89 %, 90 %,91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 %, 99,5 %, 99,6 %, 99,7 %, 99,8 %, 99,9 %, 99,99 % o 100 % de exactitud o confianza. En algunas realizaciones, los errores de secuenciación y PCR se minimizan, eliminan o son inferiores a 0,01 %, 0,001 %, 0,0001 %, 0,00001 %, 0,000001 % o 0,0000001 %. En algunas realizaciones, la tasa de error de la secuenciación es menor o igual a 0,00001 %, 0,0001 %, 0,001 %, 0,01 % o 0 %. En algunas realizaciones, la tasa de error de la secuenciación no es 0. En algunas realizaciones, se secuencian al menos 1000, 100000, 1 x 106, 1 x 107, 1 x 108, 1 x 109, 1 x 101°, 1 x 1011, 1 x 1012 o 9 x 1012 polinucleótidos. En algunas realizaciones, el procedimiento se realiza en un periodo positivo de tiempo menor o igual a 4 semanas, 3 semanas, 2 semanas, 1 semana, 6 días, 5 días, 5 días, 4 días, 3 días, 2 días, 1 día, 18 horas, 12 horas, 9 horas, 6 horas, 3 horas, 2 horas o 1 hora. En algunas realizaciones, el número de lecturas usadas para conseguir una confianza o exactitud en la identificación de nucleótidos particular es al menos aproximadamente 1,1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 5,5; 6; 6,5; 7; 7,5; 8; 8,5; 9; 9,5; 10; 11; 12; 13; 14; 15; 16; 17; 18; 19; 20; 30; 40; 50; 60; 70; 80; 90; 100; 200; 300; 400; 500; 600; 700; 800; 900 o 1000 veces inferior al número de lecturas usadas para conseguir una confianza o exactitud en la identificación de nucleótidos igual, similar o superior usando un procedimiento similar sin el uso de códigos de barras moleculares, códigos de barras del recipiente o ambos. En algunas realizaciones, el número de lecturas usadas para conseguir una confianza 0 exactitud en la identificación de nucleótidos particular es al menos aproximadamente 1000, 100000, 1 x 106, 1 x 107, 1 x 108, 1 x 109, 1 x 101°, 1 x 1011, 1 x 1012 o 9 x 1012 lecturas menos que el número de lecturas usadas para conseguir una confianza o exactitud en la identificación de nucleótidos igual, similar o superior usando un procedimiento similar sin el uso de códigos de barras moleculares, códigos de barras del recipiente o ambos. En algunas realizaciones, la pluralidad de recipientes comprende al menos 1000, 100000, 1 x 106, 1 x 107, 1 x 108, 1 x 109, 1 x 101°, 1 x 1011, 1 x 1012 o 9 x 1012 o más recipientes. En algunas realizaciones, la pluralidad de polinucleótidos celulares comprende al

menos 1000, 100000, 1 x 106, 1 x 107, 1 x 108, 1 x 109, 1 x 101°, 1 x 1011, 1 x 1012 o 9 celulares.

En un aspecto, se proporciona en esta memoria una composición que comprende: una pluralidad de recipientes que

comprenden cada uno de ellos una única célula de una muestra que comprende una pluralidad de células, una

pluralidad de polinucleótidos con código de barras molecular, un polinucleótido con código de barras del recipiente; un

primer polinucleótido complementario que es complementario a un primer polinucleótido celular de la única célula y un

segundo polinucleótido complementario que es complementario a un segundo polinucleótido celular de la única célula;

donde el primer polinucleótido complementario comprende un primer código de barras molecular de la pluralidad de

polinucleótidos con código de barras molecular y el código de barras del recipiente del polinucleótido con código de

barras del recipiente o un producto amplificado del polinucleótido con código de barras del recipiente, y donde el

segundo polinucleótido complementario comprende un segundo código de barras molecular de la pluralidad de

barras del recipiente o un producto amplificado del polinucleótido con código de barras del recipiente.

En algunas realizaciones, el código de barras molecular del primer y segundo polinucleótidos con código de barras

molecular es diferente. En algunas realizaciones, el primer y segundo polinucleótidos complementarios comprenden

un código de barras molecular diferente. En algunas realizaciones, el primer y segundo polinucleótidos

complementarios comprenden el mismo código de barras del recipiente. En algunas realizaciones, la pluralidad de

polinucleótidos con código de barras molecular no son productos amplificados. En algunas realizaciones, el código de

barras molecular de un polinucleótido con código de barras molecular de un primer recipiente es diferente del código

de barras molecular de un polinucleótido con código de barras molecular de un segundo recipiente. En algunas

realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de un primer

recipiente de la pluralidad de recipientes es exclusivo. En algunas realizaciones, el código de barras molecular de cada

polinucleótido con código de barras molecular de un segundo recipiente de la pluralidad de recipientes es exclusivo.

En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular de un

primer recipiente y un segundo recipiente es exclusivo. En algunas realizaciones, el código de barras molecular de

cada polinucleótido con código de barras molecular de un tercer recipiente de la pluralidad de recipientes es exclusivo.

En algunas realizaciones, el código de barras molecular de cada polinucleótido con código de barras molecular del

primer recipiente, el segundo recipiente y el tercer recipiente es exclusivo. En algunas realizaciones, el código de

barras molecular de cada polinucleótido con código de barras molecular de cualquier recipiente individual de la

pluralidad de recipientes es exclusivo. En algunas realizaciones, el código de barras molecular de cada polinucleótido

con código de barras molecular de uno cualquiera de los recipientes de la pluralidad de recipientes es diferente del

código de barras molecular de cada polinucleótido con código de barras molecular de otro cualquiera de los recipientes

de la pluralidad de recipientes. En algunas realizaciones, el código de barras molecular de un polinucleótido con código

de barras molecular de un primer recipiente es el mismo que el código de barras molecular de un polinucleótido con

código de barras molecular de un segundo recipiente. En algunas realizaciones, el código de barras molecular de un

polinucleótido con código de barras molecular de un primer recipiente es el mismo que el código de barras molecular

de un polinucleótido con código de barras molecular del primer recipiente. En algunas realizaciones, el código de

barras molecular de un polinucleótido con código de barras molecular de un segundo recipiente es el mismo que el

código de barras molecular de un polinucleótido con código de barras molecular del segundo recipiente. En algunas

realizaciones, el código de barras del recipiente de un polinucleótido con código de barras del recipiente o amplicón

del mismo de un primer recipiente de la pluralidad de recipientes es diferente del código de barras del recipiente de

un polinucleótido con código de barras del recipiente o amplicón del mismo de un segundo recipiente de la pluralidad

de recipientes. En algunas realizaciones, el código de barras del recipiente de un polinucleótido con código de barras

del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es un primer mismo código

de barras del recipiente. En algunas realizaciones, el código de barras del recipiente de cada polinucleótido con código

de barras del recipiente o amplicón del mismo de un segundo recipiente de la pluralidad de recipientes es un segundo

mismo código de barras del recipiente. En algunas realizaciones, el primer código de barras del mismo recipiente es

diferente del segundo código de barras del mismo recipiente. En algunas realizaciones, el código de barras del

recipiente de cada polinucleótido con código de barras del recipiente o amplicón del mismo de un recipiente individual

de la pluralidad de recipientes comprende un mismo código de barras del recipiente. En algunas realizaciones, el

código de barras del recipiente de cada polinucleótido con código de barras del recipiente y amplicón del mismo de

cualquier recipiente individual de la pluralidad de recipientes es exclusivo con respecto al código de barras del

recipiente de cada polinucleótido con código de barras del recipiente y amplicón del mismo de cualquier otro recipiente

individual de la pluralidad de recipientes. En algunas realizaciones, el polinucleótido con código de barras del recipiente

está presente en un recipiente como una única molécula. En algunas realizaciones, el polinucleótido con código de

barras del recipiente está presente en cada recipiente de la pluralidad de recipientes como una única molécula. En

algunas realizaciones, el polinucleótido con código de barras del recipiente está presente en un recipiente de la

pluralidad de recipientes como al menos una única molécula. En algunas realizaciones, el polinucleótido con código

de barras del recipiente está presente en cada recipiente de la pluralidad de recipientes como al menos una única

molécula. En algunas realizaciones, una primera secuencia común del recipiente de un primer polinucleótido con

código de barras del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es la

misma que una primera secuencia común del recipiente de un segundo polinucleótido con código de barras del

recipiente o amplicón del mismo del primer recipiente. En algunas realizaciones, una segunda secuencia común del recipiente del primer polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente de la pluralidad de recipientes es la misma que una segunda secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente. En algunas realizaciones, una primera secuencia común del recipiente de un primer polinucleótido con código de barras del recipiente o amplicón del mismo de cualquier recipiente individual de la pluralidad de recipientes es la misma que una primera secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo del recipiente individual. En algunas realizaciones, cada polinucleótido con código de barras del recipiente de un único recipiente de la pluralidad de recipientes comprende una misma primera secuencia común del recipiente. En algunas realizaciones, cada polinucleótido con código de barras del recipiente de un único recipiente de la pluralidad de recipientes comprende una misma segunda secuencia común del recipiente. En algunas realizaciones, una primera secuencia común del recipiente de un primer polinucleótido con código de barras del recipiente o amplicón del mismo de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia común del recipiente de un segundo polinucleótido con código de barras del recipiente o amplicón del mismo de un segundo recipiente de la pluralidad de recipientes. En algunas realizaciones, una segunda secuencia común del recipiente del primer polinucleótido con código de barras del recipiente o amplicón del mismo del primer recipiente es la misma que una segunda secuencia común del recipiente del segundo polinucleótido con código de barras del recipiente o amplicón del mismo. En algunas realizaciones, cada polinucleótido con código de barras del recipiente o amplicón del mismo de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una primera secuencia de común del recipiente que comprende la misma secuencia que una primera secuencia común del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, cada polinucleótido con código de barras del recipiente o amplicón del mismo de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una segunda secuencia de común del recipiente que comprende la misma secuencia que una segunda secuencia común del recipiente de un polinucleótido con código de barras del recipiente o amplicón del mismo de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, una primera secuencia molecular común de un primer polinucleótido con código de barras molecular de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia molecular común de un segundo polinucleótido con código de barras molecular del primer recipiente. En algunas realizaciones, una segunda secuencia molecular común del primer polinucleótido con código de barras molecular del primer recipiente de la pluralidad de recipientes es la misma que una segunda secuencia molecular común de un segundo polinucleótido con código de barras molecular del primer recipiente. En algunas realizaciones, una primera secuencia molecular común de un primer polinucleótido con código de barras molecular de cualquier recipiente individual de la pluralidad de recipientes es la misma que una primera secuencia molecular común de un segundo polinucleótido con código de barras molecular del recipiente individual. En algunas realizaciones, cada polinucleótido con código de barras molecular de un recipiente individual de la pluralidad de recipientes comprende una misma primera secuencia molecular común. En algunas realizaciones, cada polinucleótido con código de barras molecular de un recipiente individual de la pluralidad de recipientes comprende una misma segunda secuencia molecular común. En algunas realizaciones, una primera secuencia molecular común de un primer polinucleótido con código de barras molecular de un primer recipiente de la pluralidad de recipientes es la misma que una primera secuencia molecular común de un segundo polinucleótido con código de barras molecular de un segundo recipiente de la pluralidad de recipientes. En algunas realizaciones, una segunda secuencia molecular común del primer polinucleótido con código de barras molecular es la misma que una segunda secuencia molecular común del segundo polinucleótido con código de barras molecular. En algunas realizaciones, cada polinucleótido con código de barras molecular de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una primera secuencia molecular común que comprende la misma secuencia que una primera secuencia molecular común de un polinucleótido con código de barras molecular de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, cada polinucleótido con código de barras molecular de uno cualquiera de los recipientes de la pluralidad de recipientes comprende una segunda secuencia molecular común que comprende la misma secuencia que una segunda secuencia molecular común de un polinucleótido con código de barras molecular de cualquier otro recipiente de la pluralidad de recipientes. En algunas realizaciones, la primera secuencia común del recipiente comprende una secuencia que comprende la misma secuencia que la primera secuencia molecular común. En algunas realizaciones, la primera secuencia común del recipiente comprende una secuencia complementaria a la primera secuencia molecular común o un complemento de la misma. En algunas realizaciones, la segunda secuencia molecular común comprende una región complementaria a tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario. En algunas realizaciones, la región complementaria a tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario es una región terminal.

En algunas realizaciones, un primer y un segundo polinucleótido con código de barras molecular no están fusionados entre sí. En algunas realizaciones, el primer y segundo polinucleótidos complementarios no están fusionados entre sí.

En algunas realizaciones, el primer polinucleótido celular es ADN. En algunas realizaciones, el segundo polinucleótido celular es ADN. En algunas realizaciones, el primer polinucleótido celular es ARN. En algunas realizaciones, el segundo polinucleótido celular es ARN. En algunas realizaciones, el ARN es ARNm. En algunas realizaciones, el primer polinucleótido complementario es ADNc. En algunas realizaciones, el segundo polinucleótido complementario es ADNc.

En algunas realizaciones, la composición comprende además una transferasa terminal no matricial, una transcriptasa inversa, una polimerasa o cualquier combinación de las mismas. En algunas realizaciones, el primer y/o segundo polinucleótidos complementarios comprenden tres o más nucleótidos no matriciales añadidos al extremo 3'. En algunas realizaciones, la transferasa terminal no matricial es una transcriptasa inversa, y donde la transcriptasa inversa se selecciona del grupo que consiste en transcriptasa inversa Superscript II, transcriptasa inversa Maxima, transcriptasa inversa Protoscript II, transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV-RT), transcriptasa inversa HighScriber, transcriptasa inversa del virus de la mieloblastosis aviar (^aM^v), cualquier transcriptasa inversa que comprende actividad de desoxinucleotidil transferasa terminal y combinaciones de las mismas. En algunas realizaciones, un primer polinucleótido con código de barras molecular comprende una región complementaria a los tres o más nucleótidos no matriciales del extremo 3' del primer polinucleótido complementario. En algunas realizaciones, un segundo polinucleótido con código de barras molecular comprende una región complementaria a tres o más nucleótidos no matriciales del extremo 3' del segundo polinucleótido complementario. En algunas realizaciones, los tres o más nucleótidos no matriciales son idénticos. En algunas realizaciones, al menos uno de los tres o más nucleótidos no matriciales no es idéntico a otro nucleótido de los tres o más nucleótidos no matriciales. En algunas realizaciones, al menos un nucleótido de la región complementaria del primer polinucleótido con código de barras molecular no es idéntico a otro ácido nucleico de la región complementaria del primer polinucleótido con código de barras molecular. En algunas realizaciones, al menos un nucleótido de la región complementaria del segundo polinucleótido con código de barras molecular no es idéntico a otro ácido nucleico de la región complementaria del segundo polinucleótido con código de barras molecular. En algunas realizaciones, el al menos un nucleótido no idéntico es un desoxirribonucleótido o un análogo del mismo. En algunas realizaciones, el al menos un nucleótido no idéntico no es un ribonucleótido o un análogo del mismo. En algunas realizaciones, el al menos un nucleótido no idéntico es una desoxirriboguanosina. En algunas realizaciones, el al menos un nucleótido no idéntico es un análogo de desoxirriboguanosina. En algunas realizaciones, el al menos un nucleótido no idéntico es un nucleótido terminal del primer o segundo polinucleótido con código de barras molecular. En algunas realizaciones, el al menos un nucleótido no idéntico es un ribonucleótido o un análogo del mismo. En algunas realizaciones, un nucleótido terminal de la región complementaria del primer o segundo polinucleótidos con código de barras molecular es un desoxirribonucleótido o un análogo del mismo. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular no es un ribonucleótido o un análogo del mismo. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es una desoxirriboguanosina. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es un análogo de desoxirriboguanosina. En algunas realizaciones, un nucleótido terminal de la región hibridada del primer o segundo polinucleótido con código de barras molecular es un ribonucleótido o un análogo del mismo. En algunas realizaciones, al menos dos nucleótidos no terminales de la región hibridada del primer o segundo polinucleótido con código de barras molecular son ribonucleótidos o análogos de los mismos. En algunas realizaciones, al menos dos nucleótidos no terminales de la región hibridada del primer o segundo polinucleótido con código de barras molecular no son desoxirribonucleótidos o análogos de los mismos. En algunas realizaciones, al menos dos nucleótidos no terminales de la región hibridada del primer o segundo polinucleótido con código de barras molecular son desoxirribonucleótidos o análogos de los mismos. En algunas realizaciones, el primer polinucleótido complementario comprende una región complementaria a un primer polinucleótido con código de barras molecular. En algunas realizaciones, el segundo polinucleótido complementario comprende una región complementaria a un segundo polinucleótido con código de barras molecular. En algunas realizaciones, el primer polinucleótido complementario comprende una región complementaria a un segundo polinucleótido con código de barras molecular. En algunas realizaciones, la región del primer polinucleótido complementario que es complementaria al primer o segundo polinucleótido con código de barras molecular no es complementaria a una secuencia de código de barras molecular. En algunas realizaciones, la región del primer polinucleótido complementario que es complementaria al primer o segundo polinucleótido con código de barras molecular no es complementaria a una región del polinucleótido con código de barras del recipiente o un producto amplificado a partir del mismo. En algunas realizaciones, la región del primer polinucleótido complementario complementaria al primer o segundo polinucleótido con código de barras molecular comprende tres o más nucleótidos no matriciales añadidos al extremo 3' del primer polinucleótido complementario. En algunas realizaciones, la región del segundo polinucleótido complementario que es complementaria al segundo polinucleótido con código de barras molecular comprende tres o más nucleótidos no matriciales añadidos al extremo 3' del segundo polinucleótido complementario. En algunas realizaciones, el primer polinucleótido complementario no es complementario al polinucleótido con código de barras del recipiente. En algunas realizaciones, el segundo polinucleótido complementario no es complementario al polinucleótido con código de barras del recipiente. En algunas realizaciones, una región de un complemento de un primer polinucleótido con código de barras molecular es complementaria a una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, una región de un complemento de un segundo polinucleótido con código de barras molecular es complementaria a una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, la composición comprende además uno cualquiera o más cebadores de los procedimientos anteriores. En algunas realizaciones, cada recipiente de la pluralidad de recipientes no comprende un soporte sólido. En algunas realizaciones, el polinucleótido con código de barras del recipiente está fijado a un soporte sólido. En algunas realizaciones, el polinucleótido con código de barras del recipiente está fijado a una perla. En algunas realizaciones, el polinucleótido con código de barras del recipiente, un polinucleótido con código de barras molecular o cualquier combinación de los mismos no es un cebador. En algunas realizaciones, el polinucleótido con código de barras del recipiente, un polinucleótido con código de barras molecular o cualquier combinación de los mismos no es un polinucleótido extendido. En algunas realizaciones, la célula se lisa. En algunas realizaciones, la pluralidad de recipientes comprende una pluralidad de pocillos. En algunas realizaciones, la pluralidad de recipientes comprende una pluralidad de emulsiones. En algunas realizaciones, cada emulsión de la pluralidad de emulsiones tiene un volumen de aproximadamente 0,01 picolitros a 10 microlitros.

En algunas realizaciones, la única célula comprende una célula inmunitaria. En algunas realizaciones, la pluralidad de células comprende una pluralidad de células inmunitarias. En algunas realizaciones, la célula inmunitaria es un linfocito o un subtipo del mismo, una célula B o un subtipo de la misma, una célula T o un subtipo de la misma, o una combinación de las mismas. En algunas realizaciones, la pluralidad de células está enriquecida en células B de memoria, células B indiferenciadas, células B de plasmablastos, células T indiferenciadas, células T de plasmablastos, cualquier subtipo de célula B, cualquier subtipo de célula T o cualquier combinación de las mismas. En ciertas realizaciones, la única célula comprende una célula cancerosa. En algunas realizaciones, la pluralidad de células comprende una pluralidad de células cancerosas. En algunas realizaciones, la célula cancerosa es una célula de carcinoma de células escamosas, una célula de adenocarcinoma, una célula de carcinoma de células transicionales, una célula de sarcoma óseo, una célula de sarcoma cartilaginoso, una célula de sarcoma muscular, una célula de leucemia, una célula de linfoma, una célula de glioma o cualquier combinación de las mismas. En algunas realizaciones, la pluralidad de células cancerosas está enriquecida en células cancerosas circulantes, células cancerosas endoteliales, células cancerosas epiteliales, células cancerosas raras o cualquier tipo o subtipo de célula cancerosa. En algunas realizaciones, el primer o segundo polinucleótido celular comprende una variante de secuencia. En algunas realizaciones, la variante de secuencia comprende una mutación, un polimorfismo, una deleción o una inserción. En algunas realizaciones, el polimorfismo es un polimorfismo de un único nucleótido. En algunas realizaciones, el primer o segundo polinucleótido celular es un biomarcador para una enfermedad o afección. En algunas realizaciones, el primer o segundo polinucleótido celular es de un patógeno. En algunas realizaciones, el primer y segundo polinucleótidos complementarios comprenden una región CDR1, CDR2, CDR3 y/o una región de hipermutación en las secuencias codificantes de anticuerpos o TCR.

En algunas realizaciones, el código de barras del recipiente comprende al menos 2 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 3, 4, 5, 6, 7, 8 o 9 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 10 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 15 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende al menos 50 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende de 10-30 nucleótidos. En algunas realizaciones, el código de barras del recipiente comprende una secuencia degenerada. En algunas realizaciones, el código de barras del recipiente comprende una secuencia degenerada completa o parcial. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNNNNNNNNNNN, donde N es cualquier ácido nucleico. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNWNNNNNWNNNNN, donde N es cualquier ácido nucleico y W es adenina o timina. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNXNNNNNXNNNNN, donde N es cualquier ácido nucleico y X es cualquier nucleótido conocido. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNNNNNNNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son W, donde W es adenina o timina. En algunas realizaciones, el código de barras del recipiente comprende la secuencia NNNNNNNNNNNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son X, donde X es cualquier nucleótido conocido. En algunas realizaciones, el código de barras molecular comprende al menos 2 nucleótidos. En algunas realizaciones, el código de barras molecular comprende al menos 3, 4, 5, 6, 7, 8 o 9 nucleótidos. En algunas realizaciones, el código de barras molecular comprende al menos 10 nucleótidos. En algunas realizaciones, el código de barras molecular comprende al menos 15 nucleótidos. En algunas realizaciones, el código de barras molecular comprende como máximo 50 nucleótidos. En algunas realizaciones, el código de barras molecular comprende de 10-30 nucleótidos. En algunas realizaciones, el código de barras molecular comprende una secuencia degenerada. En algunas realizaciones, el código de barras molecular comprende una secuencia degenerada completa o parcial. En algunas realizaciones, el código de barras molecular comprende la secuencia NNNNNNNN, donde N es cualquier ácido nucleico. En algunas realizaciones, el código de barras molecular comprende la secuencia NNTNNANN, donde N es cualquier ácido nucleico. En algunas realizaciones, el código de barras molecular comprende la secuencia NNWNNWNN, donde N es cualquier ácido nucleico y W es adenina o timina. En algunas realizaciones, el código de barras molecular comprende la secuencia NNXNNXNN, donde N es cualquier ácido nucleico y X es cualquier nucleótido conocido. En algunas realizaciones, el código de barras molecular comprende la secuencia NNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son W, donde W es adenina o timina. En algunas realizaciones, el código de barras molecular comprende la secuencia NNNNNNNN, donde N es cualquier ácido nucleico y al menos uno o dos N de la secuencia son X, donde X es cualquier nucleótido conocido.

En algunas realizaciones, la pluralidad de recipientes comprende al menos 1000, 100000, 1 x 106, 1 x 107, 1 x 108, 1 x 109, 1 x 101°, 1 x 1011, 1 x 1012 o 9 x 1012 o más recipientes. En algunas realizaciones, la pluralidad de polinucleótidos celulares comprende al menos 1000, 100000, 1 x 106, 1 x 107, 1 x 108, 1 x 109, 1 x 101°, 1 x 1011, 1 x 1012 o 9 x 1012 o más polinucleótidos celulares.

En un aspecto, se proporciona en esta memoria un procedimiento para marcar polinucleótidos con códigos de barras que comprende (a) hibridar un polinucleótido con código de barras molecular con cada uno de una pluralidad de polinucleótidos de una única célula, donde el polinucleótido con código de barras molecular hibridado es de una pluralidad de polinucleótidos con código de barras molecular exclusivo de un recipiente que comprende la única célula; (b) extender un polinucleótido de la única célula que está hibridado a un polinucleótido con código de barras molecular para formar un polinucleótido celular con código de barras molecular; (c) hibridar un polinucleótido con código de barras del recipiente a un polinucleótido celular con código de barras molecular, donde el polinucleótido con código de barras del recipiente es exclusivo de un recipiente individual de una pluralidad de recipientes; (d) extender un polinucleótido celular con código de barras molecular que está hibridado a un polinucleótido con código de barras de recipiente para formar un polinucleótido celular con código de barras doble y (e) secuenciar el polinucleótido celular con código de barras doble. En algunas realizaciones, la hibridación de (a) no se realiza mediante el apareamiento de bases de una secuencia de origen natural de los polinucleótidos de una única célula. En algunas realizaciones, el polinucleótido con código de barras del recipiente hibridado al polinucleótido celular con código de barras molecular es un producto amplificado. En algunas realizaciones, la hibridación de (c) no se realiza mediante el apareamiento de bases de un complemento de una secuencia de origen natural de los polinucleótidos de una única célula. En algunas realizaciones, la hibridación de (c) se realiza mediante el apareamiento de bases a una región del polinucleótido de la única célula que se extendió en (b). En algunas realizaciones, (a)-(d) se realizan en el recipiente individual. En algunas realizaciones, (a)-(d) se realizan en una única reacción.

BREVE DESCRIPCIÓN DE LOS DIBUJOS

Las características novedosas descritas en esta memoria se exponen con particularidad en las reivindicaciones adjuntas. Se obtendrá una mejor comprensión de las características y ventajas de las características descritas en esta memoria por referencia a la siguiente descripción detallada, que expone ejemplos ilustrativos, en los que se utilizan los principios de las características descritas en esta memoria, y a los dibujos adjuntos de los cuales:

La FIG. 1A representa un esquema de una fase de marcado con códigos de barras de un procedimiento ejemplar descrito en esta memoria. El dibujo representa un procedimiento para amplificar y marcar con códigos de barras a dos o más polinucleótidos, tales como secuencias variables de Ig (p. ej., ARNm de V^hy V^l) y TCR (p. ej., ARNm de Va/Vp y Vy/VS) apareadas, tal como para la preparación de colecciones y la secuenciación inmunitaria. Código de barras del recipiente (CBG); Código de barras molecular (CBM). (Parte superior) Una única gota (de una pluralidad de gotas) de una emulsión que contiene una única célula y otros componentes de la reacción (p. ej., enzimas, tampones, oligonucleótidos). (Centro) Lisis celular y transcripción inversa de ARN de células lisadas. (Parte inferior) Marcado con código de barras molecular (CBM) de moléculas individuales durante la transcripción inversa.

La FIG. 1B representa un esquema de una fase de amplificación de un procedimiento ejemplar descrito en esta memoria. El dibujo representa un procedimiento para amplificar y marcar con códigos de barras a dos o más polinucleótidos, tales como secuencias variables de Ig (p. ej., ARNm de V^hy V^l) y TCR (p. ej., ARNm de Va/Vp y Vy/VS) apareadas, tal como para la preparación de colecciones y la secuenciación inmunitaria. (Parte superior) La amplificación independiente de códigos de barras del recipiente (CBR) genera una pluralidad de copias de CBR idénticos en cada gota. Las moléculas de ADNc-CBM se marcan simultáneamente con los CBR durante las fases de hibridación y extensión de la amplificación. (Centro) Amplificación simultánea de moléculas de ADNc con código de barras doble durante el ciclo de amplificación. (Parte inferior) Productos de la amplificación recuperados de gotas de la emulsión.

La FIG. 2 ejemplifica un esquema que demuestra que la identidad de secuencia del código de barras del recipiente (CBG) permite la identificación de la célula de origen para cada ARN.

La FIG. 3 ejemplifica un esquema que demuestra que, si se encuentra el mismo código de barras molecular (CBM) fijado a las mismas secuencias de ARN idénticas, entonces esta especie de ARN-CBM-CBG es probablemente el resultado de la duplicación por PCR. Cuando se encuentran dos CBM diferentes fijados a las mismas secuencias de ARN idénticas, entonces estas especies de ARN1-CBM1-CBG y ARN1-CBM2-CBG son la observación real de dos moléculas de origen de ARN independientes y no de la duplicación por PCR.

La FIG. 4A representa un esquema de un procedimiento ejemplar descrito en esta memoria. El dibujo representa un procedimiento para amplificar y marcar con códigos de barras secuencias variables de Ig (p. ej., V^hy V^l) y TCR (p. ej., Va/Vp y Vy/VS) apareadas para la preparación de colecciones y la secuenciación inmunitaria. Código de barras del recipiente (CBG); Código de barras molecular (CBM). Cada una de las reacciones mostradas se puede realizar en una única fase de emulsión y se muestran independientemente para facilitar la representación.

La FIG. 4B representa un esquema de un procedimiento ejemplar descrito en esta memoria. El dibujo representa un procedimiento para amplificar y marcar con códigos de barras ARNm de V^hy V^lde anticuerpo para la preparación de colecciones y la secuenciación inmunitaria.

La FIG. 4C representa un esquema de un procedimiento ejemplar descrito en esta memoria. El dibujo ejemplifica un procedimiento para amplificar y marcar con códigos de barras ARNm de V^hy V^lde anticuerpo para la preparación de colecciones y la secuenciación inmunitaria.

La FIG. 4D representa un esquema de un procedimiento ejemplar descrito en esta memoria. El dibujo ejemplifica un procedimiento para amplificar y marcar con códigos de barras secuencias variables de Ig (p. ej., V^hy V^l) y TCR (p.

ej., Va/Vp y Vy/V8) apareadas para la preparación de colecciones y la secuenciación inmunitaria. Una etapa opcional de la amplificación de ADNc antes de marcar los ADNc con un código de barras del recipiente (CBG).

La FIG. 5 ejemplifica un esquema que demuestra que la identidad de secuencia del código de barras del recipiente (CBG) permite la identificación de la célula de origen para cada ARN. Los procedimientos se pueden usar con una emulsión que contiene una pluralidad de gotas que contienen cada una de ellas una única célula para producir ADNc con código de barras doble en una única reacción.

La FIG. 6 ejemplifica un esquema que demuestra que, si se encuentra el mismo código de barras molecular (CBM) fijado a las mismas secuencias de ARN idénticas, entonces esta especie de ARN-CBM-CBG es probablemente el resultado de la duplicación por PCR. Cuando se encuentran dos CBM diferentes fijados a las mismas secuencias de ARN idénticas, entonces estas especies de ARN1-CBM1-CBG y ARN1-CBM2-CBG son la observación real de dos moléculas de origen de ARN independientes y no de la duplicación por PCR.

La FIG. 7A representa un esquema de un procedimiento ejemplar descrito en esta memoria. El dibujo representa una leyenda de los términos de las reclamaciones.

La FIG. 7B representa un esquema de un procedimiento ejemplar descrito en esta memoria. El dibujo representa un procedimiento para amplificar y marcar con códigos de barras a dos o más polinucleótidos, tales como secuencias variables de Ig (p. ej., ARNm de V^hy V^l) y TCR (p. ej., ARNm de Va/Vp y V^y/VS) apareadas, tal como para la preparación de colecciones y la secuenciación inmunitaria.

DESCRIPCIÓN DETALLADA

A continuación se describen varios aspectos con referencia a aplicaciones de los ejemplos con fines ilustrativos. Se debe entender que se exponen numerosos detalles, relaciones y procedimientos específicos para proporcionar una comprensión completa de las características descritas en esta memoria. Sin embargo, un experto en la técnica pertinente reconocerá fácilmente que las características descritas en esta memoria se pueden poner en práctica sin uno o más de los detalles específicos o con otros procedimientos. Las características descritas en esta memoria no están limitadas por el orden ilustrado de los actos o acontecimientos, ya que algunos actos se pueden producir en diferente orden y/o simultáneamente a otros actos o acontecimientos. Asimismo, no todos los actos o acontecimientos ilustrados son necesarios para implementar una metodología según las características descritas en esta memoria. La terminología usada en esta invención solo tiene como objetivo describir casos particulares y no está destinada a ser limitante. Como se emplean en esta memoria, las formas en singular “un”, “uno”, “una”, “el” y “la” están destinadas a incluir también las formas en plural, a menos que el contexto lo indique claramente de otro modo. Asimismo, en la medida en que los términos “que incluye”, “incluye”, “que tiene”, “tiene”, “con”, o variantes de los mismos, se usan en la descripción detallada y/o las reivindicaciones, tales términos están destinados a ser inclusivos de una manera similar al término “que comprende”.

El término “aproximadamente” puede significar dentro de un intervalo de error aceptable para el valor particular como lo determina un experto en la materia, que dependerá en parte de cómo se mide o determina el valor, es decir, de las limitaciones del sistema de medición. Por ejemplo, “aproximadamente” puede significar dentro de 1 o más de 1 desviación estándar, conforme a la práctica en la técnica. Alternativamente, “aproximadamente” puede significar un intervalo de hasta 20 %, hasta 10 %, hasta 5 % o hasta 1 % de un valor determinado. Alternativamente, en particular con respecto a los sistemas o procesos biológicos, el término puede significar dentro de un orden de magnitud, dentro de 5 veces y más preferiblemente dentro de 2 veces, de un valor. Cuando se describen valores particulares en la solicitud y las reivindicaciones, a menos que se indique de otro modo, el término “aproximadamente” significa que se debe asumir que el valor particular está dentro de un intervalo de error aceptable.

Tanto los pares de cadenas de receptor de células T y como los pares de cadenas de anticuerpo de inmunoglobulina son tipos de receptores inmunitarios y están relacionados evolutivamente. Un objetivo de la invención es generar colecciones de polinucleótidos para la secuenciación de alto rendimiento y el diagnóstico. También es un objetivo de la invención desarrollar grupos de colecciones obtenidas de seres humanos para el descubrimiento de anticuerpos y/o TCR de pacientes o cohortes con atributos comunes específicos. El material de partida puede ser sangre periférica o de una biopsia tisular, a partir de la cual las células inmunitarias se aíslan globalmente o se subclasifican como indiferenciadas, de memoria y ASC, si se desea. La invención descrita se puede aplicar a múltiples tipos diferentes de secuencias variables apareadas, p. ej., pares de cadenas de receptor de células T y pares de cadenas de anticuerpo de inmunoglobulina.

Se pueden encapsular células aisladas, tal como células inmunitarias, en recipientes, tales como emulsiones de agua en aceite (gotas), de tal manera que se creen compartimentos individuales de picolitros que contienen una única célula inmunitaria o menos por gota. Se pueden procesar millones de células para cada muestra, tal como una muestra biológica de un sujeto, lo que permite un alto rendimiento en la tecnología de secuenciación de células individuales. El uso de un soporte sólido, tal como una perla, se puede evitar usando los procedimientos descritos en esta memoria. La necesidad de generar poblaciones independientes de recipientes también se puede evitar usando los procedimientos descritos en esta memoria. Por ejemplo, se pueden generar colecciones de secuencias en una misma o única reacción, o en una única pluralidad o población de recipientes. Durante la formación de los recipientes, se introducen polinucleótidos complementarios a los polinucleótidos celulares, tales como cadenas V^hy V^lde anticuerpo y/o cadenas Va/Vp y Vy/V8 de receptor de células T (TCR). También se puede introducir un polinucleótido que alberga un código de barras del recipiente durante la formación de los recipientes. Estos polinucleótidos con código de barras del recipiente pueden llevar códigos de barras degenerados, de tal manera que cada polinucleótido celular que contiene un código de barras del recipiente contiene un código identificativo exclusivo que corresponde al recipiente en el que se encuentra. También se pueden introducir una pluralidad de polinucleótidos que albergan un código de barras molecular durante la formación de los recipientes. Estos polinucleótidos con código de barras molecular pueden llevar códigos de barras degenerados, de tal manera que cada molécula de polinucleótido celular que contiene un código de barras molecular contiene un código identificativo exclusivo que corresponde a una molécula de polinucleótido de la única célula de la que proviene. Los millones de células inmunitarias individuales se pueden lisar dentro de la emulsión y las transcripciones celulares, tales como las transcripciones de cadenas V^hy V^ly/o Va/Vp y/o Vy/V5, se pueden someter a transcripción inversa o copiar usando cebadores, seguida del marcado con un código de barras del recipiente y un código de barras molecular y la amplificación por PCR de los polinucleótidos con código de barras. Cada una de las cadenas V^hy V^ly/o Va/Vp y/o Vy/VS provenientes de una célula inmunitaria individual (p. ej., una célula B o una célula T) se puede enlazar virtualmente entre sí con el mismo código de barras identificador del recipiente.

Las cadenas V^hy V^ly/o Va/Vp y/o V^y/VS se pueden recuperar a continuación de los recipientes y enriquecer por PCR con el fin de añadir marcadores de secuenciación de nueva generación (NGS). La colección se puede secuenciar usando una plataforma de secuenciación de alto rendimiento, seguida del análisis de la diversidad del repertorio, la frecuencia de los anticuerpos, la caracterización de CDR3, el análisis filogenético de las hipermutaciones somáticas, etc. Se puede generar una base de datos de pares de V^hy V^ly/o Va/Vp y/o Vy/VS emparejadas correctamente deconvolucionando las secuencias de los códigos de barras moleculares y del recipiente. Como cada célula inmunitaria individual está aislada en su recipiente correspondiente, para cada código de barras del recipiente observado dos veces, las transcripciones secuenciadas proceden de las mismas gotas de emulsión y, por lo tanto, de una única célula exclusiva. Para cada código de barras molecular diferente observado, para las secuencias que contienen el mismo código de barras del recipiente, las transcripciones secuenciadas proceden de una molécula de transcripción diferente de una única célula. Para cada código de barras molecular igual observado, para las secuencias que contienen el mismo código de barras del recipiente, las transcripciones secuenciadas proceden de una misma molécula de transcripción de una única célula (p. ej., duplicados por PCR).

En paralelo a la secuenciación, puede clonarse una colección de cadenas V^hy V^ly/o Va/Vp y/o V^y/VS recuperadas de los recipientes en vectores de expresión de anticuerpos y cotransfectarse para el cribado mediante presentación en levaduras. La clonación de este grupo de colecciones idénticas es el procedimiento preferido, en comparación con la división de una muestra biológica al principio, ya que algunas células inmunitarias raras solo serían capturadas en uno o el otro ensayo. La colección de cadenas V^hy V^ly/o Va y Vp y/o V^yy VS obtenidas de seres humanos se puede expresar independientemente del apareamiento correcto o incorrecto de pares, como ocurre con los ensayos de presentación clásicos. A continuación, se puede realizar la presentación en levaduras contra una o más dianas antigénicas para enriquecerla en posibles anticuerpos candidatos.

Los anticuerpos candidatos positivos que se obtienen de las tecnologías de presentación, tales como una presentación en levaduras, se pueden secuenciar y contrastar con la base de datos de códigos de barras de pares emparejados. Cada cadena V^hy/o Va y/o V^ypresentada en levaduras se puede volver a emparejar con su cadena V^l, Vp o VS correspondiente, respectivamente, y cada cadena V^ly/o Vp y/o VS presentada en levaduras se puede volver a emparejar con su cadena V^h, Va o V^ycorrespondiente, respectivamente. Estos candidatos correctamente apareados pueden sintetizarse genéticamente, expresarse en líneas celulares de mamíferos y validarse funcionalmente contra la diana de interés. Estos candidatos pueden ser anticuerpos y/o TCR totalmente humanos.

Un “anticuerpo” se refiere a una inmunoglobulina (Ig), ya sea natural o producida parcial o totalmente de forma sintética. Un “receptor de células T” (“TCR”) se refiere a una molécula, ya sea natural o producida parcial o totalmente de forma sintética, que se encuentra sobre la superficie de los linfocitos T (células T) que reconoce antígenos unidos a moléculas del complejo principal de histocompatibilidad (MHC). Los polipéptidos o proteínas que tienen un dominio de unión que es un dominio de unión al antígeno o es homólogo a un dominio de unión al antígeno están incluidos. El término incluye además “fragmentos de unión al antígeno” y otros términos equivalentes para fragmentos de unión similares, tales como los descritos más adelante. Estos términos también contemplan anticuerpos y TCR injertados a regiones determinantes de la complementariedad (CDR) y otros anticuerpos y TCR humanizados (que incluyen modificaciones de CDR y modificaciones de regiones armazón). Cabe señalar que, aunque se puede hacer referencia solo a cadenas de inmunoglobulina (p. ej., cadenas pesadas y cadenas ligeras), la invención descrita se puede aplicar a otros múltiples tipos diferentes de secuencias apareadas, p. ej., pares de cadenas de receptor de células T (cadenas de TCRa y TCRp y cadenas de TCR^yy TCRS) y no se limita a las inmunoglobulinas.

Los anticuerpos naturales y las inmunoglobulinas naturales son normalmente glucoproteínas heterotetraméricas de aproximadamente 150 000 daltons, compuestas por dos cadenas ligeras (L) idénticas y dos cadenas pesadas (H) idénticas. Cada cadena ligera está enlazada habitualmente a una cadena pesada mediante un enlace disulfuro covalente, aunque el número de enlaces disulfuro varía entre las cadenas pesadas de diferentes isotipos de inmunoglobulina. Cada cadena pesada y ligera también tiene puentes disulfuro intracadena espaciados regularmente. Cada cadena pesada tiene en un extremo un dominio variable (V^h) seguido de varios dominios constantes (C^h). Cada cadena ligera tiene un dominio variable (V^l) en un extremo y un dominio constante (CL) en su otro extremo; el dominio constante de la cadena ligera está alineado con el primer dominio constante de la cadena pesada y el dominio variable de la cadena ligera está alineado con el dominio variable de la cadena pesada. Se cree que residuos aminoacídicos particulares forman una interfase entre los dominios variables de las cadenas ligeras y pesadas. Los anticuerpos se pueden asignar a diferentes clases en función de la secuencia aminoacídica del dominio constante de sus cadenas pesadas, que incluyen IgA, IgD, IgE, IgG e IgM, y varios de estos se pueden dividir además en subclases (isotipos), p. ej., IgG1, IgG2, IgG³, IgG⁴, IgA e IgA2. Las cadenas pesadas (IgH) de los anticuerpos corresponden a diferentes clases de inmunoglobulinas, denominadas a, 8, £, ^yy M, respectivamente, en base a las secuencias aminoacídicas de sus dominios constantes. Las cadenas ligeras (IgL) de los anticuerpos de cualquier especie de vertebrados se pueden asignar a uno de dos tipos claramente diferentes, denominados kappa (k) y lambda (A), en función de las secuencias aminoacídicas de sus dominios constantes.

La capacidad de las células T para reconocer antígenos asociados a diversos cánceres u organismos infecciosos es conferida por su TCR, que está compuesto por una cadena alfa (a) y una cadena beta (p) o una gamma (y) y una cadena delta (8). Las proteínas que componen estas cadenas están codificadas por ADN, que emplea un mecanismo exclusivo para generar la enorme diversidad de TCR. Este receptor de reconocimiento inmunitario de múltiples subunidades se asocia con el complejo CD3 y une péptidos presentados por las proteínas de clase I y clase II del MHC sobre la superficie de células presentadoras de antígeno (APC). La unión de un TCR al péptido antigénico sobre la APC es un acontecimiento crucial en la activación de las células T, que se produce en una sinapsis inmunológica en el punto de contacto entre la célula T y la APC.

Cada TCR contiene regiones determinantes de la complementariedad (CDR) variables, así como regiones marco (FR) y una región constante. La secuencia aminoacídica de los bucles de la tercera región determinante de la complementariedad (CDR3) de los dominios variables de las cadenas a y p determina en gran medida la diversidad de secuencia de las células T ap que provienen de la recombinación entre segmentos génicos variables (Vp), de diversidad (Dp) y de unión (Jp) en el locus de la cadena p y entre segmentos génicos Va y Ja análogos en el locus de la cadena a, respectivamente. La existencia de tales múltiples segmentos génicos en los locus de las cadenas a y p de los TCR permite codificar un gran número de secuencias de CDR3 distintas. La adición y deleción independiente de nucleótidos en las uniones Vp-Dp, Dp-Jp y Va-Ja durante el proceso de reordenamiento génico de los TCR aumenta adicionalmente la diversidad de secuencias de CDR3. A este respecto, la inmunocompetencia se refleja en la diversidad de TCR.

El TCR ^y8 se diferencia del TCR ap en que codifica un receptor que interactúa estrechamente con el sistema inmunitario innato. El TCR^y8, se expresa de forma precoz en el desarrollo, tiene una distribución anatómica especializada, tiene especificidades exclusivas para patógenos y moléculas pequeñas y tiene un amplio espectro de interacciones celulares innatas y adaptativas. Al inicio de la ontogenia, a medida que los subconjuntos restringidos de células de TCR^y8 pueblan diversos tejidos prenatalmente, se establece un patrón sesgado de expresión de los segmentos V y J de TCRy. Por tanto, la amplia expansión periférica posterior a la estimulación por exposición ambiental a patógenos y moléculas tóxicas causa gran parte del diverso repertorio de TCR^yen los tejidos adultos.

Las Ig expresadas por las células B son proteínas que consisten en cuatro cadenas polipeptídicas, dos cadenas pesadas (IgH) y dos cadenas ligeras (IgL), que forman una estructura H2L2. Cada par de cadenas IgH e IgL contiene un dominio hipervariable, que consiste en una región V^ly una V^hy en un dominio constante. Las cadenas IgH de las Ig son de varios tipos, m, 8, y, a y p. La diversidad de Ig en un individuo está determinada principalmente por el dominio hipervariable. De manera similar al TCR, el dominio V de las cadenas IgH se crea mediante la unión combinatoria de los segmentos génicos V^h, DHy J^h. La adición y deleción independiente de nucleótidos en las uniones V^h-D^h, DH-JHy V^h-J^hdurante el proceso de reordenación génica de las Ig aumenta adicionalmente la diversidad de secuencias del dominio hipervariable. En este caso, la inmunocompetencia se refleja en la diversidad de Ig.

“Variable”, en referencia a las cadenas de anticuerpo, p. ej., cadenas pesadas y ligeras, o cadenas de TCR, p. ej., cadenas alfa (a) y beta o cadenas gamma (^y) y delta (8), se refiere a porciones de las cadenas de anticuerpo o TCR que se diferencian en la secuencia entre los anticuerpos o TCR y participan en la unión y especificidad de cada anticuerpo o TCR particular para su antígeno particular. Tal variabilidad se concentra en tres segmentos denominados regiones hipervariables, tanto en los dominios variables de las cadenas ligeras y las cadenas pesadas como en los dominios variables alfa y beta. Las porciones más conservadas de los dominios variables se denominan regiones armazón (FR). Los dominios variables de las cadenas pesadas y ligeras naturales comprenden cada uno cuatro FR (FR1, FR2, FR3 y FR4, respectivamente), conectadas por tres regiones hipervariables. Las regiones hipervariables de cada cadena se mantienen juntas en estrecha proximidad mediante las FR y, con las regiones hipervariables de la otra cadena, contribuyen a la formación del sitio de unión al antígeno de los anticuerpos (véase, ,Kabat y col., Sequences of Proteins of Immunological Interest, 5a ed. Public Health Service, National Institutes of Health, Bethesda, Md. (1991), páginas 647-669). Los dominios constantes no están implicados directamente en la unión de un anticuerpo o un TCR a un antígeno, pero presentan diversas funciones efectoras, p. ej., la participación del anticuerpo en la toxicidad celular dependiente de anticuerpos.

Una “región hipervariable” se refiere a los residuos aminoacídicos de un anticuerpo o TCR que son responsables de la unión al antígeno. La región hipervariable comprende residuos aminoacídicos de una “región determinante de la complementariedad” o “CDR”. Los residuos de la “región armazón” o “FR” son aquellos residuos del dominio variable diferentes de los residuos de la región hipervariable como se define en esta memoria.

Los “fragmentos de anticuerpo” y “fragmentos de TCR” comprenden una porción de un anticuerpo o TCR de longitud total, generalmente el dominio variable o de unión al antígeno del mismo. Los ejemplos de fragmentos de anticuerpo o TCR incluyen, pero no se limitan a, fragmentos Fab, Fab', F(ab')2, Fv y scFv, anticuerpos o TCR lineales, anticuerpos o moléculas de TCR monocatenarios, dianticuerpos y anticuerpos o TCR multiespecíficos formados a partir de fragmentos de anticuerpo o TCR.

Un “anticuerpo monoclonal” se refiere a una molécula de anticuerpo sintetizada por un único clon de células inmunitarias. El modificador “monoclonal” indica que el anticuerpo se obtiene a partir de una población de anticuerpos sustancialmente homogénea y no se debe interpretar como que requiere la producción del anticuerpo mediante ningún procedimiento particular. Por tanto, los anticuerpos monoclonales se pueden producir mediante el procedimiento del hibridoma, descrito por primera vez por Kohler y Milstein, Nature 256:495 (1975); Eur. J. Immunol. 6:511 (1976), mediante técnicas de ADN recombinante, o también se pueden aislar a partir de colecciones de anticuerpos de fagos. Un “anticuerpo policlonal” se refiere a una población de moléculas de anticuerpo sintetizada por una población de células inmunitarias.

Un “Fv monocatenario” o “scFv” se refiere a fragmentos de anticuerpo o TCR que comprenden los dominios variables de cadena pesada (V^h) y los dominios variables de cadena ligera (V^l) de un anticuerpo o los dominios variables de cadena alfa o gamma (Va o V^y) y los dominios variables de cadena beta o delta (Vp o V8) de un TCR, donde estos dominios están presentes en una única cadena polipeptídica. Generalmente, el polipéptido de Fv comprende además un enlazador polipeptídico entre los dominios V^hy V^l, o los dominios Va y Vp, o los dominios V^yy VS que hace posible que el scFv forme la estructura deseada para la unión al antígeno.

Un “diacuerpo” se refiere a fragmentos de anticuerpo y/o TCR pequeños con dos sitios de unión al antígeno, estos fragmentos comprenden un V^hconectado a un V^len la misma cadena polipeptídica (V^h-V^l), o un Va conectado a un Vp en la misma cadena polipeptídica (Va-Vp), o un V^yconectado a un Vs en la misma cadena polipeptídica (V^y-V5). Usando un enlazador que es demasiado corto para permitir el apareamiento entre los dos dominios sobre la misma cadena, los dominios se ven forzados a aparearse con los dominios complementarios de otra cadena y crear dos sitios de unión al antígeno. Los diacuerpos ejemplares se describen más pormenorizadamente en, por ejemplo, los documentos EP404097 y WO93111161.

Un “anticuerpo biespecífico” o “TCR biespecífico” se refiere a un anticuerpo o TCR que presenta especificidad para dos tipos diferentes de antígenos. Los términos, como se emplean en esta memoria, incluyen específicamente, sin limitación, anticuerpos y TCR que presentan especificidad de unión para un antígeno diana y para otra diana que facilita la administración a un tejido particular. Similarmente, los anticuerpos y TCR multiespecíficos tienen dos o más especificidades de unión.

Un “anticuerpo lineal” o un “TCR lineal” se refiere a un par de segmentos Fd en tándem (p. ej., V^h-C^h1-V^h-C^h1 o Va-Ca1-Va-Ca1) que forman un par de regiones de unión al antígeno. Los anticuerpos y TCR lineales pueden ser biespecíficos o monoespecíficos, por ejemplo, como describen Zapata y col., Protein Eng. 8(10):1057-1062 (1995). Un “dominio de unión al antígeno” se refiere a uno o más fragmentos de un anticuerpo o TCR que conservan la capacidad de unirse específicamente a un antígeno. Los ejemplos no limitantes de fragmentos de anticuerpo incluidos en tales términos incluyen, pero no se limitan a, (i) un fragmento Fab, un fragmento monovalente que consiste en los dominios V^l, V^h, C^ly Cm; (ii) un fragmento F(ab')2, un fragmento bivalente que contiene dos fragmentos Fab enlazados mediante un puente disulfuro en la región bisagra; (iii) un fragmento Fd que consiste en los dominios V^hy Cm; (iv) un fragmento Fv que contiene los dominios V^ly V^hde un único brazo de un anticuerpo, (v) un fragmento dAb (Ward y col., (1989) Nature 341:544546) que contiene un dominio V^h; y (vi) una CDR aislada. Se incluyen adicionalmente en esta definición los anticuerpos que comprenden una única cadena pesada y una única cadena ligera o los TCR con una única cadena alfa o una única cadena beta.

Los restos “F(ab')V y “Fab” se pueden producir tratando una Ig con una proteasa, tal como pepsina y papaína, e incluyen fragmentos de anticuerpo generados digiriendo la inmunoglobulina cerca de los enlaces disulfuro que existen entre las regiones bisagra en cada una de las dos cadenas pesadas. Por ejemplo, la papaína escinde la IgG aguas arriba de los enlaces disulfuro que existen entre las regiones bisagra de cada una de las dos cadenas pesadas para generar dos fragmentos de anticuerpo homólogos en los que una cadena ligera compuesta por V^ly C^ly un fragmento de cadena pesada compuesto por V^hy C^hY1 (región y1 de la región constante de la cadena pesada) están conectados en sus regiones carboxiterminales a través de un enlace disulfuro. Cada uno de estos dos fragmentos de anticuerpo homólogos se denomina “Fab”. La pepsina también escinde la IgG aguas abajo de los enlaces disulfuro que existen entre las regiones bisagra de cada una de las dos cadenas pesadas para generar un fragmento de anticuerpo ligeramente más grande que el fragmento en el que los dos “Fab” antes mencionados están conectados en la región bisagra. Este fragmento de anticuerpo se denomina F(ab')2. El fragmento Fab también contiene el dominio constante de la cadena ligera y el primer dominio constante (C^h1) de la cadena pesada. Los fragmentos Fab' se diferencian de los fragmentos Fab por la adición de unos cuantos residuos en el extremo carboxílico del dominio de cadena pesada C^h1 que incluye una o más cisteínas de la región bisagra del anticuerpo. Fab'-SH es la denominación en esta memoria para el Fab' en el que el uno o más residuos de cisteína de los dominios constantes llevan un grupo tiol libre. Los fragmentos de anticuerpo F(ab')2 se producen originalmente como pares de fragmentos Fab' que tienen cisteínas bisagra entre ellos.

“Fv” se refiere a un fragmento de anticuerpo o TCR que contiene un sitio de reconocimiento del antígeno y unión al antígeno completo. Esta región consiste en un dímero de un dominio variable de cadena pesada y un dominio variable de cadena ligera, o una cadena de TCRa y una cadena de TCRp, o una cadena t CRy y una cadena TCR8 en asociación no covalente estrecha. Es en esta configuración donde las tres CDR de cada dominio variable interactúan para definir un sitio de unión al antígeno sobre la superficie del dímero V^h-V^l. o el dímero Va-Vp, o el dímero Vy-VS. Colectivamente, una combinación de una o más de las CDR de cada una de las cadenas V^hy V^l, o las cadenas Va-Vp, o las cadenas Vy-VS confiere especificidad de unión al antígeno al anticuerpo o TCR. Por ejemplo, se entenderá que, por ejemplo, la CDRH3 y CDRL3 podrían ser suficientes para conferir especificidad de unión al antígeno a un anticuerpo o TCR cuando se transfieren a cadenas V^hy V^l, o cadenas de Va y Vp, o cadenas Vy-VS de un anticuerpo, TCR o fragmento de unión al antígeno de los mismos seleccionados del receptor y que esta combinación de CDR se puede ensayar para determinar la unión, afinidad, etc. Incluso un único dominio variable (o la mitad de un Fv que comprende solo tres CDR específicas para un antígeno) tiene la capacidad para reconocer y unir el antígeno, aunque probablemente con una afinidad inferior que cuando se combina con un segundo dominio variable. Asimismo, aunque los dos dominios de un fragmento Fv (V^ly V^h, o Va y Vp, o Vy y VS) están codificados por genes independientes, estos se pueden unir, usando procedimientos recombinantes, mediante un enlazador sintético que hace posible producirlos como una única cadena proteica en la que las regiones de cadenas V^ly V^h, o Va y Vp, o V^yy VS se aparean para formar moléculas monovalentes (conocidas como Fv monocatenarios (scFv); Bird y col. (1988) Science 242:423-426; Huston y col. (1988) Proc. Natl. Acad. Sci. USA 85:5879-5883 y Osbourn y col. (1998) Nat. Biotechnol.

16:778). Tales scFv también están destinados a estar abarcados en el término “porción de unión al antígeno” de un anticuerpo. Cualquier secuencia de V^hy V^lde un scFv específico se puede enlazar a una región Fc de ADNc o secuencias genómicas con el fin de generar los vectores de expresión que codifican moléculas de Ig (p. ej., IgG) completas u otros isotipos. También se pueden usar V^hy V^len la generación de Fab, Fv u otros fragmentos de Ig usando química proteica o tecnología de ADN recombinante.

Los polipéptidos de unión al antígeno también incluyen dímeros de cadena pesada tales como, por ejemplo, anticuerpos de camélidos y tiburones. Los anticuerpos de camélidos y tiburones comprenden un par homodimérico de dos cadenas de dominios similares a V y similares a C (ninguno tiene una cadena ligera). Como la región V^hde una IgG de dímero de cadena pesada de un camélido no tiene que realizar interacciones hidrófobas con una cadena ligera, la región de la cadena pesada que normalmente entra en contacto con una cadena ligera se cambia a residuos de aminoácidos hidrófilos en un camélido. Los dominios V^hde las IgG de dímeros de cadena pesada se denominan dominios V^hh. Las Ig-NAR de tiburón comprenden un homodímero de un dominio variable (denominado un dominio V-NAR) y cinco dominios constantes similares a C (dominios C-NAR). En los camélidos, la diversidad del repertorio de anticuerpos está determinada por las CDR 1, 2 y 3 de las regiones V^ho V^hh. La CDR3 de la región V^hhde camello está caracterizada por su longitud relativamente larga, con un promedio de 16 aminoácidos (Muyldermans y col., 1994, Protein Engineering 7 (9): 1129).

Las formas “humanizadas” de anticuerpos o TCR no humanos (p. ej., murinos) incluyen anticuerpos o TCR quiméricos que contienen una secuencia mínima obtenida de una Ig o un TCR no humanos. En su mayor parte, los anticuerpos o TCR humanizados son Ig o TCR humanos (anticuerpos o TCR del receptor) en los que una o más de las CDR del receptor se sustituyen por CDR de un anticuerpo o TCR de una especie no humana (anticuerpo o TCR del donante), tal como de ratón, rata, conejo o primate no humano, que tienen la especificidad, afinidad y función de unión deseadas. En algunos casos, uno o más residuos aminoacídicos de FR de la Ig o el TCR humanos se sustituyen por los residuos aminoacídicos no humanos correspondientes. Asimismo, los anticuerpos o TCR humanizados pueden contener residuos que no se encuentran en el anticuerpo o TCR del receptor ni en el anticuerpo o TCR del donante. Estas modificaciones se pueden realizar para refinar las prestaciones de los anticuerpos o TCR, si es necesario. Un anticuerpo o TCR humanizado puede comprender sustancialmente todos de al menos un, y en algunos casos dos, dominios variables, en los que todas o sustancialmente todas las regiones hipervariables corresponden a las de una inmunoglobulina o un TCR no humanos y todas o sustancialmente todas las FR son las de una secuencia de inmunoglobulina o TCR humano. El anticuerpo o TCR humanizado también puede incluir opcionalmente al menos una porción de una región constante (Fc) de inmunoglobulina o TCR, normalmente de una inmunoglobulina o un TCR humanos. Véase, p. ej., Jones y col., Nature, 321: 522-525 (1986); Riechmann y col., Nature, 332: 323-329 (1988) y Presta, Curr. Op. Struct. Biol. 2: 593-596 (1992).

Una “secuencia de la línea germinal” se refiere a una secuencia genética de la línea germinal (los gametos haploides y las células diploides a partir de las cuales se forman). El ADN de la línea germinal contiene múltiples segmentos génicos que codifican una única cadena pesada o ligera de Ig, o una única cadena de TCRa o TCRp, o una única cadena de TCR^yo TCRS. Estos segmentos génicos se transportan en las células germinales, pero no se pueden transcribir y traducir hasta que se organizan en genes funcionales. Durante la diferenciación de las células B y las células T en la médula ósea, estos segmentos génicos se barajan aleatoriamente mediante un sistema genético dinámico capaz de generar más de 108 especificidades. La mayoría de estos segmentos génicos están publicados y recogidos en la base de datos de líneas germinales.

“Afinidad” se refiere a la constante de equilibrio para la unión reversible de dos agentes y se expresa como K^d. La afinidad de una proteína diana a un ligando, tal como la afinidad de un anticuerpo por un epítopo, puede ser, por ejemplo, de aproximadamente 100 nanomolar (nM) a aproximadamente 0,1 nM, de aproximadamente 100 nM a aproximadamente 1 picomolar (pM) o de aproximadamente 100 nM a aproximadamente 1 femtomolar (fM). El término “avidez” se refiere a la resistencia de un complejo de dos o más agentes a la disociación después de la dilución. Un “epítopo” se refiere a esa porción de un antígeno u otra macromolécula capaz de formar una interacción de unión con la cavidad de unión de la región variable de un anticuerpo o TCR. Tales interacciones de unión se pueden manifestar como un contacto intermolecular con uno o más residuos aminoacídicos de una o más CDR. La unión al antígeno puede implicar, por ejemplo, una CDR3, un par de CDR3 o, en algunos casos, interacciones de hasta las seis CDR de las cadenas V^hy V^l. Un epítopo puede ser una secuencia peptídica lineal (es decir, “continua”) o puede estar compuesto por secuencias aminoacídicas no contiguas (es decir, “conformacionales” o “discontinuas”). Un anticuerpo o TCR puede reconocer una o más secuencias aminoacídicas; por lo tanto, un epítopo puede definir más de una secuencia aminoacídica distinta. Los epítopos reconocidos por anticuerpos y TCR se pueden determinar mediante técnicas de identificación genética y análisis de secuencias muy conocidas por un experto en la materia. Las interacciones de unión se manifiestan como contactos intermoleculares con uno o más residuos aminoacídicos de una CDR.

“Específico” se refiere a una situación en la que un anticuerpo o TCR no presentará ninguna unión significativa a moléculas distintas del antígeno que contiene el epítopo reconocido por el anticuerpo o TCR. El término también es aplicable cuando, por ejemplo, un dominio de unión al antígeno es específico para un epítopo particular que llevan varios antígenos, en este caso, el anticuerpo, TCR o fragmento de unión a antígeno de los mismos seleccionado que llevan el dominio de unión al antígeno será capaz de unirse a los diversos antígenos que llevan el epítopo. Las expresiones “se une preferentemente” o “se une específicamente” significan que los anticuerpos, TCR o fragmentos de los mismos se unen a un epítopo con mayor afinidad de la que se unen a secuencias aminoacídicas no relacionadas y, si presentan reactividad cruzada con otros polipéptidos que contienen el epítopo, no son tóxicos a los niveles a los que están formulados para la administración en seres humanos. En un aspecto, tal afinidad es al menos1 vez mayor, al menos 2 veces mayor, al menos 3 veces mayor, al menos 4 veces mayor, al menos 5 veces mayor, al menos 6 veces mayor, al menos 7 veces mayor, al menos 8 veces mayor, al menos 9 veces mayor, al menos 10 veces mayor, al menos 20 veces mayor, al menos 30 veces mayor, al menos 40 veces mayor, al menos 50 veces mayor, al menos 60 veces mayor, al menos 70 veces mayor, al menos 80 veces mayor, al menos 90 veces mayor, al menos 100 veces mayor o al menos 1000 veces mayor que la afinidad del anticuerpo, TCR o fragmento de los mismos por secuencias aminoacídicas no relacionadas. El término “unión” se refiere a una asociación directa entre dos moléculas, debido a, por ejemplo, interacciones covalentes, electrostáticas, hidrófobas, iónicas y/o de enlaces de hidrógeno en condiciones fisiológicas, e incluye interacciones tales como puentes salinos y puentes acuosos, así como cualquier otro medio convencional de unión.

“Farmacéuticamente aceptable” se refiere a entidades y composiciones moleculares que son fisiológicamente tolerables y habitualmente no producen una reacción alérgica o adversa similar, tal como molestias gástricas, mareos y similares, cuando se administran a un ser humano.

Una “dosis unitaria”, cuando se usa en referencia a una composición terapéutica, se refiere a unidades físicamente independientes adecuadas como dosis unitaria para los seres humanos, conteniendo cada unidad una cantidad predeterminada de material activo calculada para producir el efecto terapéutico deseado en asociación con el diluyente, es decir, vehículo, excipiente, requerido.

Un “material de envasado” se refiere a una estructura física que alberga los componentes del kit. El material de envasado puede mantener los componentes de forma estéril y puede estar hecho de material usado habitualmente para tales fines (p. ej., papel, fibra corrugada, vidrio, plástico, papel, lámina de aluminio, ampollas, etc.). La etiqueta o el prospecto pueden incluir instrucciones escritas apropiadas. Por lo tanto, los kits pueden incluir adicionalmente etiquetas o instrucciones para usar los componentes del kit en cualquier procedimiento de la invención. Un kit puede incluir un compuesto en un paquete, o un dispensador junto con instrucciones para administrar el compuesto en un procedimiento descrito en esta memoria.

“Prevención” se refiere a la profilaxis, la prevención de la aparición de síntomas o la prevención de la progresión de una enfermedad o un trastorno asociado a niveles excesivos de proteína o correlacionado con la actividad proteica. “Inhibición”, “tratamiento” y “tratar” se usan indistintamente y se refieren a, por ejemplo, la estasis de los síntomas, la prolongación de la supervivencia, la mejora parcial o total de los síntomas y la erradicación parcial o total de una afección, enfermedad o trastorno asociado a niveles excesivos de proteína o correlacionado con la actividad proteica. Por ejemplo, el tratamiento del cáncer incluye, pero no se limita a, la estasis, la eliminación parcial o total de un tumor o crecimiento canceroso. El tratamiento o eliminación parcial incluye, por ejemplo, una reducción en veces en el crecimiento o el tamaño y/o volumen tumoral tal como de aproximadamente 2 veces, aproximadamente 3 veces, aproximadamente 4 veces, aproximadamente 5 veces, aproximadamente 10 veces, aproximadamente 20 veces, aproximadamente 50 veces o cualquier reducción intermedia. Similarmente, el tratamiento o eliminación parcial puede incluir una reducción porcentual en el crecimiento o el tamaño y/o volumen tumoral de aproximadamente 1 %, 2 %, 3 %, 4 %, 5 %, 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 %, 95 % o cualquier reducción porcentual intermedia.

Un “anticuerpo neutralizante” o “TCR neutralizante” se refiere a cualquier anticuerpo o TCR que inhibe la replicación de un patógeno, tal como un virus o una bacteria, independientemente del mecanismo mediante el cual se consigue la neutralización.

Un “repertorio de anticuerpos” o “repertorio de TCR” se refiere a una colección de anticuerpos, TCR o fragmentos de los mismos. Un repertorio de anticuerpos se puede usar, por ejemplo, para seleccionar un anticuerpo particular o cribar para seleccionar una propiedad particular, tal como capacidad de unión, especificidad de unión, capacidad de transporte gastrointestinal, estabilidad, afinidad y similares. El término incluye específicamente colecciones de anticuerpos y TCR, que incluyen todas las formas de colecciones combinatorias, tales como, por ejemplo, colecciones de presentación en fagos de anticuerpos, que incluyen, sin limitación, colecciones de presentación en fagos de Fv (scFv) y Fab de anticuerpos de cualquier fuente, lo que incluye colecciones de animales no inmunizados, sintéticas y semisintéticas.

Una “molécula de ácido nucleico diana”, una “molécula diana”, un “polinucleótido diana” o una “molécula de polinucleótido diana” se refiere a cualquier ácido nucleico de interés.

Una reacción en cadena de la polimerasa (PCR) se refiere a una reacción de amplificación in vitro de secuencias de polinucleótidos mediante la extensión del cebador simultánea de cadenas complementarias de un polinucleótido bicatenario. Las reacciones PCR producen copias de un polinucleótido matriz flanqueado por sitios de unión del cebador. El resultado, con dos cebadores, es un aumento exponencial en el número de copias del polinucleótido matriz de ambas cadenas con cada ciclo, porque con cada ciclo se replican ambas cadenas. El dúplex de polinucleótidos tiene extremos que corresponden a los extremos de los cebadores usados. La PCR puede comprender una o más repeticiones de desnaturalizar un polinucleótido matriz, hibridar cebadores con sitios de unión del cebador y extender los cebadores mediante una ADN o ARN polimerasa en presencia de nucleótidos. Las temperaturas, las duraciones de cada etapa y las velocidades de cambio entre las etapas dependen de muchos factores muy conocidos por los expertos en la materia. (McPherson y col., IRL Press, Oxford (1991 y 1995)). Por ejemplo, en una PCR convencional que usa ADN polimerasa Taq, un polinucleótido matriz bicatenario se puede desnaturalizar a una temperatura >90 °C, los cebadores se pueden hibridar a una temperatura en el intervalo de 50-75 °C y los cebadores se pueden extender a una temperatura en el intervalo de 72-78 °C. En algunas realizaciones, la PCR comprende PCR con transcripción inversa (RT-PCR), PCR en tiempo real, PCR anidada, PCR cuantitativa, PCR múltiple o similares. En algunas realizaciones, la PCR no comprende RT-PCR. (Patentes de los Estados Unidos n.° 5168038, 5210015, 6174670, 6 569 627 y 5925517; Mackay y col., Nucleic Acids Research, 30: 1292-1305 (2002)). La RT-PCR comprende una reacción pCr precedida de una reacción de transcripción inversa y se amplifica un ADNc resultante, la pCr anidada comprende una PCR de dos etapas donde un amplicón de una primera reacción PCR que usa un primer conjunto de cebadores se convierte en la muestra para una segunda reacción PCR que usa un segundo conjunto de cebadores, al menos uno de los cuales se une a una posición interior de un amplicón de una primera reacción PCR. La PCR múltiple comprende una reacción PCR, donde se somete simultáneamente una pluralidad de secuencias de polinucleótidos a PCR en la misma mezcla de reacción. Los volúmenes de la reacción PCR pueden estar comprendidos entre 0,2 pL-1000 pL. La PCR cuantitativa comprende una reacción PCR diseñada para medir una cantidad, abundancia o concentración absoluta o relativa de una o más secuencias en una muestra. Las mediciones cuantitativas pueden incluir comparar una o más secuencias o estándares de referencia con una secuencia de polinucleótidos de interés. (Freeman y col., Biotechniques, 26: 112-126 (1999); Becker-Andre y col., Nucleic Acids Research, 17: 9437-9447 (1989); Zimmerman y col., Biotechniques, 21: 268-279 (1996); Diviacco y col., Gene, 122: 3013-3020 (1992); Becker-Andre y col., Nucleic Acids Research, 17: 9437-9446 (1989)).

En otras realizaciones, los procedimientos, los kits y las composiciones descritos en esta memoria pueden comprender un soporte. En algunas realizaciones, los procedimientos, los kits y las composiciones descritos en esta memoria no comprenden un soporte. Habitualmente, un soporte sólido comprende uno o más materiales que comprenden una o más superficies rígidas o semirrígidas. En algunas realizaciones, el soporte es un soporte que no es sólido. El soporte o sustrato puede comprender una membrana, papel, plástico, una superficie recubierta, una superficie plana, vidrio, un portaobjetos, un chip o cualquier combinación de los mismos. En algunas realizaciones, una o más superficies de un soporte son sustancialmente planas, aunque en algunas realizaciones puede ser deseable separar físicamente las regiones de síntesis para compuestos diferentes con, por ejemplo, pocillos, regiones elevadas, pasadores, depresiones grabadas o similares. En algunas realizaciones, los soportes sólidos comprenden perlas, resinas, geles, microesferas u otras configuraciones geométricas. Alternativamente, los soportes sólidos pueden comprender chips, micropartículas, nanopartículas, placas y matrices de sílice. El soporte sólido puede comprender el uso de perlas que se autoensamblan en micropocillos. Por ejemplo, el soporte sólido comprende la tecnología BeadArray de Illumina. Alternativamente, el soporte sólido comprende la tecnología Bead Array de Abbott Molecular y el sistema FlexiPlex™ de Applied Microarray. En otras realizaciones, el soporte sólido es una placa. Los ejemplos de placas incluyen, pero no se limitan a, placas de matriz múltiple de MSD, placas Multi-Spot®, de MSD, microplaca, microplaca ProteOn, AlphaPlate, placa DELFIA, IsoPlate y LumaPlate. En algunas realizaciones, un soporte puede comprender una pluralidad de perlas. En algunas realizaciones, un soporte puede comprender una matriz. En algunas realizaciones, un soporte puede comprender un portaobjetos de vidrio. Procedimientos, sustratos y técnicas aplicables a polímeros (patentes de los Estados Unidos n.° 5744305, 5143854, 5242974, 5252743, 5324633, 5384261, 5405783, 5 424 186, 5451 683, 5482867, 5491 074, 5527681, 5550215, 5571 639, 5578832, 5593839, 5599695, 5624 711, 5631 734, 5795716, 5831 070, 5837832, 5856 101, 5858659, 5936324, 5968740, 5974164, 5981 185, 5 981 956, 6025601, 6033860, 6040 193, 6090555, 6136269, 6269 846 y 6428752; publicaciones de patente de los Estados Unidos n.° 20090149340, 20080038559, 20050074787; y publicaciones PCT n.° WO 00/58516, WO 99/36760 y WO 01/58593). La unión de los polinucleótidos a un soporte puede comprender reticulación con aminatiol, reticulación con maleimida, N-hidroxisuccinimida o N-hidroxisulfosuccinimida, Zenon o SiteClick. Fijar los ácidos nucleicos marcados al soporte puede comprender fijar biotina a la pluralidad de polinucleótidos y recubrir la una o más perlas con estreptavidina. En algunas realizaciones, el soporte sólido es una perla. Los ejemplos de perlas incluyen, pero no se limitan a, perlas de estreptavidina, perlas de agarosa, perlas magnéticas, Dynabeads®, microperlas MACS®, perlas conjugadas a anticuerpos (p. ej., microperlas antiinmunoglobulina), perlas conjugadas a proteína A, perlas conjugadas a proteína G, perlas conjugadas a proteína A/G, perlas conjugadas a proteína L, perlas conjugadas a polinucleótido dT, perlas de sílice, perlas similares a la sílice, microperlas de antibiotina, microperlas de antifluorocromo y perlas magnéticas terminadas en carboxi BcMag™. El diámetro de las perlas puede ser aproximadamente 5 pm, 10 pm, 20 pm, 25 pm, 30 pm, 35 pm, 40 pm, 45 pm o 50 pm. El soporte sólido puede ser una matriz o una micromatriz. El soporte sólido puede comprender regiones independientes. El soporte sólido puede ser una matriz, p. ej., una matriz direccionable.

“Nucleótido”, “nucleósido”, “residuo nucleotídico” y “residuo nucleosídico”, como se emplean en esta memoria, puede significar un residuo de desoxirribonucleótido o ribonucleótido, u otro análogo nucleosídico similar capaz de actuar como un componente de un cebador adecuado para su uso en una reacción de amplificación (p. ej., una reacción PCR). Tales nucleósidos y derivados de los mismos se pueden usar como componentes de los cebadores descritos en esta memoria, excepto cuando se indique de otro modo. Nada de lo contenido en esta solicitud está destinado a excluir la utilización de bases o derivados nucleosídicos que han sido modificados químicamente para mejorar su estabilidad o utilidad en una reacción de amplificación, siempre que la modificación química no interfiera con su reconocimiento por una polimerasa como la desoxiguanina, desoxicitosina, desoxitimidina o desoxiadenina, según proceda. En algunas realizaciones, los análogos nucleotídicos pueden estabilizar la formación de híbridos. En algunas realizaciones, los análogos nucleotídicos pueden desestabilizar la formación de híbridos. En algunas realizaciones, los análogos nucleotídicos pueden mejorar la especificidad de la hibridación. En algunas realizaciones, los análogos nucleotídicos pueden reducir la especificidad de la hibridación.

Un “ácido nucleico”, o sus equivalentes gramaticales, se refiere a un único nucleótido o al menos dos nucleótidos enlazados covalentemente entre sí.

Un “polinucleótido” o “polinucleótido” o “polinucleótido”, o sus equivalentes gramaticales, se refiere a al menos dos nucleótidos enlazados covalentemente entre sí. Un polinucleótido comprende una molécula que contiene dos o más nucleótidos. Un polinucleótido comprende una forma polimérica de nucleótidos de cualquier longitud, ya sean ribonucleótidos, desoxirribonucleótidos o ácidos nucleicos peptídicos (PNA), que comprenden bases de purina y pirimidina, u otras bases nucleotídicas naturales, modificadas química o bioquímicamente, no naturales o derivados de bases nucleotídicas. La cadena principal del polinucleótido puede comprender glúcidos y grupos fosfato, o glúcidos o grupos fosfato modificados o sustituidos. Un polinucleótido puede comprender nucleótidos modificados, tal como nucleótidos metilados y análogos nucleotídicos. La secuencia de nucleótidos puede estar interrumpida por componentes no nucleotídicos. Un polinucleótido puede incluir otras moléculas, tales como otro polinucleótido hibridado. Los polinucleótidos incluyen secuencias de ácido desoxirribonucleico (ADN), ácido ribonucleico (ARN) o ambos. Los ejemplos no limitantes de polinucleótidos incluyen un gen, un fragmento génico, un exón, un intrón, ADN intergénico (que incluye, sin limitación, ADN heterocromático), ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ribozimas, ARN de interferencia pequeño (siARN), ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de una secuencia, ARN aislado de una secuencia, sondas de ácidos nucleicos y cebadores. Los polinucleótidos pueden aislarse de fuentes naturales, recombinantes o sintetizarse artificialmente.

Un polinucleótido comprende una secuencia específica de cuatro bases nucleotídicas: adenina (A); citosina (C); guanina (G); y timina (T) (uracilo (U) por timina (T) cuando el polinucleótido es ARN). Por tanto, una secuencia de polinucleótido es la representación alfabética de una molécula de polinucleótido; alternativamente, el término se puede aplicar a la propia molécula de polinucleótido. Esta representación alfabética puede introducirse en bases de datos de un ordenador que tenga una unidad central de procesamiento y usarse para aplicaciones bioinformáticas tales como genómica funcional, búsqueda de homologías, agrupación de secuencias, alineación de secuencias y determinación de secuencias consenso.

Los polinucleótidos pueden incluir nucleótidos no convencionales, tales como análogos nucleotídicos o nucleótidos modificados. En algunas realizaciones, los nucleótidos no convencionales pueden estabilizar la formación de híbridos.

En algunas realizaciones, los nucleótidos no convencionales pueden desestabilizar la formación de híbridos. En algunas realizaciones, los nucleótidos no convencionales pueden mejorar la especificidad de la hibridación. En algunas realizaciones, los nucleótidos no convencionales pueden reducir la especificidad de la hibridación. Los ejemplos de modificaciones de los nucleótidos no convencionales incluyen 2' O-Me, 2' O-alilo, 2' O-propargilo, 2' O-alquilo, 2' fluoro, 2' arabino, 2' xilo, 2' fluoroarabino, fosforotioato, fosforoditioato, fosforoamidatos, 2' amino, pirimidina sustituida con 5-alquilo, 3' desoxiguanosina, pirimidina sustituida con 5-halo, purina sustituida con alquilo, purina sustituida con halo, nucleótidos bicíclicos, 2'MOE, moléculas de PNA, moléculas de LNA, moléculas similares a LNA, diaminopurina, S2T, 5-fluorouracilo, 5-bromouracilo, 5-clorouracilo, 5-yodouracilo, hipoxantina, xantina, 4-acetilcitosina, 5-(carboxihidroxilmetil)uracilo, 5-carboximetilaminometil-2-tiouridina, 5-carboximetilaminometiluracilo, dihidrouracilo, beta-D-galactosilqueosina, inosina, N6-isopenteniladenina, 1-metilguanina, 1-metilinosina, 2,2-dimetilguanina, 2-metiladenina, 2-metilguanina, 3-metilcitosina, 5-metilcitosina, N6-adenina, 7-metilguanina, 5-metilaminometiluracilo, 5-metoxiaminometil-2-tiouracilo, beta-D-manosilqueosina, 5'-metoxicarboximetiluracilo, 5-metoxiuracilo, 2-metiltio-D46-isopenteniladenina, ácido uracil-5-oxiacético (v), wibutoxosina, pseudouracilo, queosina, 2-tiocitosina, 5-metil-2-tiouracilo, 2-tiouracilo, 4-tiouracilo 5-metiluracilo, éster metílico de ácido uracil-5-oxiacético, ácido uracil-5-oxiacético (v), 5-metil-2-tiouracilo, 3-(3-amino-3-N-2-carboxipropil)uracilo, (acp3)w, 2,6-diaminopurina y derivados de los mismos.

Un “sujeto”, “individuo”, “hospedador” o “paciente” se refiere a organismos vivos tales como mamíferos. Los ejemplos de sujetos y hospedadores incluyen, pero no se limitan a, caballos, vacas, camellos, ovejas, cerdos, cabras, perros, gatos, conejos, cobayas, ratas, ratones (p. ej., ratones humanizados), jerbos, primates no humanos (p. ej., macacos), seres humanos y similares, no mamíferos, que incluyen, p. ej., vertebrados no mamíferos, tales como aves (p. ej., pollos o patos) peces (p. ej., tiburones) o ranas (p. ej., Xenopus) e invertebrados no mamíferos, así como especies transgénicas de los mismos. En ciertos aspectos, un sujeto se refiere a un único organismo (p. ej., un ser humano). En ciertos aspectos, se proporciona un grupo de individuos que componen una pequeña cohorte que tienen un factor inmunitario a estudiar y/o enfermedad común y/o una cohorte de individuos sin la enfermedad (p. ej., control negativo/normal). Un sujeto del que se obtienen muestras puede estar afectado por una enfermedad y/o un trastorno (p. ej., una o más alergias, infecciones, neoplasias malignas o trastornos autoinmunitarios o similares) y se puede comparar con un sujeto de control negativo que no se está afectado por la enfermedad.

Un “kit” se refiere a un sistema de suministro para suministrar materiales o reactivos para llevar a cabo un procedimiento descrito en esta memoria. En algunas realizaciones, los kits incluyen sistemas que permiten el almacenamiento, el transporte o el suministro de reactivos de reacción (p. ej., sondas, enzimas, etc., en envases apropiados) y/o materiales de soporte (p. ej., tampones, instrucciones escritas para realizar el ensayo, etc.) de una posición a otra. Por ejemplo, los kits incluyen uno o más envases (p. ej., cajas) que contienen los reactivos de reacción y/o materiales de soporte relevantes. Tales contenidos se pueden suministrar al receptor previsto juntos o individualmente. Por ejemplo, un primer envase puede contener una enzima para uso en un ensayo, mientras que un segundo recipiente contiene una pluralidad de cebadores.

Un “polipéptido” se refiere a una molécula que comprende al menos dos aminoácidos. En algunas realizaciones, el polipéptido consiste en un único péptido. En algunas realizaciones, un polipéptido comprende dos o más péptidos. Por ejemplo, un polipéptido puede comprender al menos aproximadamente 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 péptidos o aminoácidos. Los ejemplos de polipéptidos incluyen, pero no se limitan a, cadenas aminoacídicas, proteínas, péptidos, hormonas, sacáridos polipeptídicos, lípidos, glucolípidos, fosfolípidos, anticuerpos, enzimas, cinasas, receptores, factores de transcripción y ligandos.

Una “muestra” se refiere a una muestra biológica, ambiental, médica, de un sujeto o de un paciente, o a una muestra que contiene un polinucleótido, tal como un polinucleótido diana.

MUESTRAS

Cualquier muestra biológica que contenga polinucleótidos se puede usar en los procedimientos descritos en esta memoria. Por ejemplo, una muestra puede ser una muestra biológica de un sujeto que contiene ARN o ADN. Los polinucleótidos se pueden extraer de la muestra biológica, o la muestra se puede someter directamente a los procedimientos sin extracción o purificación de los polinucleótidos. La muestra puede ser ADN o ARN extraído o aislado. Una muestra también puede ser ARN o ADN total extraído de una muestra biológica, una colección de ADNc, ADN vírico o ADN genómico. En una realización, los polinucleótidos se aíslan de una muestra biológica que contiene un abanico de componentes diferentes, tales como proteínas, lípidos y ácidos nucleicos no matriciales. Las moléculas de matrices de ácido nucleico se pueden obtener de cualquier material celular, obtenido de un animal, una planta, una bacteria, un hongo o cualquier otro organismo celular. En ciertas realizaciones, los polinucleótidos se obtienen de una única célula. Los polinucleótidos se pueden obtener directamente de un organismo o de una muestra biológica obtenida de un organismo. Se puede usar cualquier muestra de tejido o fluido corporal como fuente de un ácido nucleico para uso en la invención. Los polinucleótidos también se pueden aislar de células cultivadas, tales como un cultivo celular primario o una línea celular. Las células o los tejidos de los que se obtienen los ácidos nucleicos matriciales se pueden infectar con un virus u otro patógeno intracelular.

En ciertas realizaciones, se pueden aislar células inmunitarias productoras de anticuerpos o TCR de la sangre u otras muestras biológicas de un sujeto u hospedador, tal como un ser humano u otro animal, tal como un ser humano u otro animal que ha sido inmunizado o que está padeciendo una infección, cáncer, una afección autoinmunitaria o cualquier otra enfermedad para identificar un patógeno, un tumor y/o un anticuerpo o TCR específico de la enfermedad de posible importancia clínica. Por ejemplo, el ser humano puede ser diagnosticado de una enfermedad, presentar síntomas de una enfermedad, no ser diagnosticado de una enfermedad o no presentar síntomas de una enfermedad. Por ejemplo, el ser humano puede ser uno que estuvo expuesto a, y/o que puede producir anticuerpos o TCR útiles contra, un agente infeccioso (p. ej., virus, bacterias, parásitos, priones, etc.), un antígeno o una enfermedad. Por ejemplo, el animal puede ser uno que estuvo expuesto a, y/o que puede producir anticuerpos o TCR útiles contra, un agente infeccioso (p. ej., virus, bacterias, parásitos, priones, etc.), un antígeno o una enfermedad. Ciertas células inmunitarias de hospedadores inmunizados producen anticuerpos o TCR contra uno o más antígenos diana en cuestión y/o uno o más antígenos desconocidos. En la presente invención, el grupo de linfocitos se puede enriquecer en las células inmunitarias deseadas mediante cualquier procedimiento adecuado, tal como cribado y clasificación de las células mediante clasificación de células activadas por fluorescencia (FACS), clasificación de células activadas magnéticamente (MACS), enriquecimiento cíclico mediante “panning” u otro procedimiento de cribado para generar una pluralidad de células inmunitarias a partir de una muestra, tal como una colección de células inmunitarias, antes de secuenciar las cadenas de anticuerpo, producir los anticuerpos o generar una colección de expresión. A diferencia de los procedimientos de enriquecimiento de la técnica anterior, que proporcionan solo unos cuantos subconjuntos de células inmunitarias que expresan diferentes anticuerpos y, por lo tanto, solo unas cuantas combinaciones de origen natural de dominios variables, la colección de células inmunitarias de la presente invención contiene al menos 2 subconjuntos de células inmunitarias individuales que expresan diferentes anticuerpos o TCR. Por ejemplo, la colección de células inmunitarias de la presente invención puede contener al menos 5, 10, 100, 250, 500, 750, 1000, 2500, 5000, 10000, 25000, 50000, 75000, 10000, 250000, 500000, 750000, 1000000, 2500000, 5000000, 7 500 000 o 10000 000 de subconjuntos de células inmunitarias individuales que expresan diferentes anticuerpos o TCR. Los procedimientos de la presente invención maximizan la recuperación de células inmunitarias y proporcionan una diversidad muy alta.

En algunas realizaciones, se utilizan células inmunitarias de donantes humanos o no humanos no inmunizados. El repertorio antes de la inmunización de un animal (el repertorio antes de la exposición al antígeno) proporciona al animal anticuerpos o TCR que se pueden unir con afinidad moderada (K^ade aproximadamente 1 x 10-6 a 1 x 10-7 M) a esencialmente cualquier molécula que no sea propia. La diversidad de secuencias de los sitios de unión de anticuerpos o TCR no se codifican directamente en la línea germinal, sino que se ensamblan de manera combinatoria a partir de segmentos génicos V. Las inmunizaciones desencadenan que cualquier célula inmunitaria produzca una combinación de V^h-V^l, o Va-Vp, o V^y-V8, que se une al inmunógeno para proliferar (expansión clonal) y secretar el anticuerpo correspondiente como se indicó anteriormente. Sin embargo, el uso de células del bazo y/o células inmunitarias u otros linfocitos de sangre periférica (PBL) de un sujeto no inmunizado puede proporcionar una representación mejor del posible repertorio de anticuerpos o TCR, y también permite la construcción de una colección posterior de anticuerpos o TCR de células B o células T usando cualquier especie animal.

En algunos casos, con el fin de obtener suficiente ácido nucleico para el ensayo, se extrae un volumen de sangre de al menos 0,001; 0,005; 0,01; 0,05; 0,1; 0,5; 1; 2; 3; 4; 5; 10; 20; 25; 30; 35; 40; 45 o 50 mL.

En algunos casos, el material de partida es sangre periférica. Las células de sangre periférica se pueden enriquecer en un tipo de célula particular (p. ej., células mononucleares; glóbulos rojos; células CD4+; células CD8+; células inmunitarias; células T, linfocitos citolíticos naturales o similares). Las células de sangre periférica también se pueden reducir selectivamente en un tipo de célula particular (p. ej., células mononucleares; glóbulos rojos; células CD4+; células CD8+; células inmunitarias; células T, linfocitos citolíticos naturales o similares).

En algunos casos, el material de partida puede ser una muestra de tejido que comprende un tejido sólido, con ejemplos no limitantes que incluyen el cerebro, hígado, pulmón, riñón, próstata, ovario, bazo, ganglio linfático (que incluye la amígdala), tiroides, páncreas, corazón, músculo esquelético, intestino, laringe, esófago y estómago. En otros casos, el material de partida puede ser células que contienen ácidos nucleicos, células inmunitarias y, en particular, células B o células T. En algunos casos, el material de partida puede ser una muestra que contiene ácidos nucleicos, de cualquier organismo, de los que se puede obtener material genético. En algunos casos, una muestra es un fluido, p. ej., sangre, saliva, linfa u orina.

Se puede tomar una muestra de un sujeto con una afección. En algunos casos, el sujeto del que se toma una muestra puede ser un paciente, por ejemplo, un paciente con cáncer o un paciente que se sospecha que tiene cáncer. El sujeto puede ser un mamífero, p. ej., un ser humano, y puede ser macho o hembra. En algunos casos, la hembra está embarazada. La muestra puede ser una biopsia tumoral. La biopsia puede realizarla, por ejemplo, un profesional sanitario, lo que incluye un médico, auxiliar médico, enfermero, veterinario, dentista, quiropráctico, paramédico, dermatólogo, oncólogo, gastroenterólogo o cirujano.

En algunos casos, los materiales que no son ácidos nucleicos se pueden retirar del material de partida usando tratamientos enzimáticos (tales como digestión con proteasas).

En algunos casos, la sangre se puede recoger en un aparato que contiene un quelante de magnesio que incluye, pero no se limita a, EDTA, y se almacena a 4 °C. Opcionalmente, se puede añadir un quelante de calcio, que incluye, pero no se limita a, EGTA. En otro caso, se añade un inhibidor de la lisis celular a la sangre que incluye, pero no se limita a, formaldehído, derivados de formaldehído, formalina, glutaraldehído, derivados de glutaraldehído, un agente de reticulación de proteína, un agente de reticulación de ácido nucleico, un agente de reticulación de proteína y ácido nucleico, agentes de reticulación reactivos de amina primaria, agentes de reticulación reactivos de sulfhidrilo, adición de sulfhidrilo o reducción de disulfuro, agentes de reticulación reactivos de carbohidrato, agentes de reticulación reactivos de carboxilo, agentes de reticulación fotorreactivos o agentes de reticulación escindibles.

En algunos casos, cuando el material extraído comprende ARN monocatenario, ARN bicatenario o híbrido de ADN-ARN, estas moléculas se pueden convertir en ADN bicatenario usando técnicas conocidas en el campo. Por ejemplo, se puede emplear transcriptasa inversa para sintetizar ADN a partir de moléculas de ARN. En algunos casos, la conversión de ARN en ADN puede requerir una etapa de ligación previa, para ligar un fragmento de enlazador al ARN, permitiendo de ese modo el uso de cebadores universales para iniciar la transcripción inversa. En otros casos, se puede usar la cola de poli-A de una molécula de ARNm, por ejemplo, para iniciar la transcripción inversa. Después de la conversión a ADN, los procedimientos detallados en esta memoria se pueden usar, en algunos casos, para capturar, seleccionar, marcar o aislar adicionalmente una secuencia deseada.

Las moléculas de ácido nucleico incluyen ácido desoxirribonucleico (ADN) y/o ácido ribonucleico (ARN). Las moléculas de ácido nucleico pueden ser sintéticas u obtenidas de fuentes naturales. En una realización, las moléculas de ácido nucleico se aíslan de una muestra biológica que contiene un abanico de componentes diferentes, tales como proteínas, lípidos y ácidos nucleicos no matriciales. Las moléculas de matrices de ácido nucleico se pueden obtener de cualquier material celular, obtenido de un animal, una planta, una bacteria, un hongo o cualquier otro organismo celular. En ciertas realizaciones, las moléculas de ácido nucleico se obtienen de una única célula. Las muestras biológicas para uso en la presente invención incluyen partículas o preparados víricos. Las moléculas de ácido nucleico se pueden obtener directamente de un organismo o de una muestra biológica obtenida de un organismo, p. ej., de sangre, orina, líquido cefalorraquídeo, líquido seminal, saliva, esputo, heces y tejido. Se puede usar cualquier muestra de tejido o fluido corporal como fuente de un ácido nucleico para uso en la invención. Las moléculas de ácido nucleico también se pueden aislar de células cultivadas, tales como un cultivo celular primario o una línea celular. Las células o los tejidos de los que se obtienen los ácidos nucleicos matriciales se pueden infectar con un virus u otro patógeno intracelular.

Una muestra también puede ser ARN o ADN total extraído de una muestra biológica, una colección de ADNc, ADN vírico o ADN genómico. En ciertas realizaciones, las moléculas de ácido nucleico están unidas a otras moléculas diana tales como proteínas, enzimas, sustratos, anticuerpos, agentes de unión, perlas, moléculas pequeñas, péptidos o cualquier otra molécula. Generalmente, el ácido nucleico se puede extraer de una muestra biológica mediante un abanico de técnicas, tales como las descritas por Sambrook y Russell, Molecular Cloning: A Laboratory Manual, tercera edición, Cold Spring Harbor, NY (2001). Las moléculas de ácido nucleico pueden ser monocatenarias, bicatenarias o bicatenarias con regiones monocatenarias (por ejemplo, estructuras de tallo y bucle).

Los procedimientos de extracción de ADN son muy conocidos en la técnica. Un protocolo clásico de aislamiento de ADN se basa en la extracción usando disolventes orgánicos tales como una mezcla de fenol y cloroformo, seguida de precipitación con etanol (J. Sambrook y col., “Molecular Cloning: A Laboratory Manual”, 1989, 2a ed. , Cold Spring Harbor Laboratory Press: Nueva York, N.Y). Otros procedimientos incluyen: extracción de ADN por precipitación salina (P. Sunnucks y col., Genetics, 1996, 144: 747-756; SM Aljanabi y col., Nucl. Acids Res. 1997, 25: 4692-4693), extracción de ADN con sales de bromuro de trimetilamonio (S. Gustincich y col., BioTechniques, 1991, 11: 298-302) y extracción de ADN con tiocianato de guanidinio (JBW Hammond y col., Biochemistry, 1996, 240: 298-300). Un abanico de kits para extraer ADN de muestras biológicas están comercializados (p. ej., b D Biosciences Clontech (Palo Alto, CA): Epicenter Technologies (Madison, WI); Gentra Systems, Inc. (Mineápolis, MN); MicroProbe Corp. (Bothell, WA); Organon Teknika (Durham, NC) y Qiagen Inc. (Valencia, CA)).

Los procedimientos de extracción de ARN también son muy conocidos en la técnica (p. ej., J. Sambrook y col., “Molecular Cloning: A Laboratory Manual” 1989, 211d ed., Cold Spring Harbour Laboratory Press: Nueva York) y se comercializan kits para la extracción de ARN de fluidos corporales (p. ej., Ambion, Inc. (Austin, TX); Amersham Biosciences (Piscataway, NJ); BD Biosciences Clontech (Palo Alto, CA); BioRad Laboratories (Hercules, CA); Dynal Biotech Inc. (Lake Success, NY); Epicenter Technologies (Madison, WI); Gentra Systems, Inc. (Minneapolis, Mⁿ); GIBCO BRL (Gaithersburg, MD); Invitrogen Life Technologies (Carlsbad, CA); MicroProbe Corp. (Bothell, WA); Organon Teknika (Durham, NC); Promega, Inc. (Madison, WI) y Qiagen Inc. (Valencia, CA)).

Una o más muestras pueden ser de una o más fuentes. Una o más muestras pueden ser de dos o más fuentes. Una o más muestras pueden ser de uno o más sujetos. Una o más muestras pueden ser de dos o más sujetos. Una o más muestras pueden ser del mismo sujeto. Uno o más sujetos pueden ser de la misma especie. Uno o más sujetos pueden ser de diferentes especies. El uno o más sujetos pueden estar sanos. El uno o más sujetos pueden estar afectados por una enfermedad, trastorno o afección.

En algunas realizaciones, una muestra es un fluido, tal como sangre, saliva, linfa, orina, líquido cefalorraquídeo, líquido seminal, esputo, heces u homogeneizados tisulares.

Una muestra se puede tomar de un sujeto con una afección. En algunas realizaciones, el sujeto del que se toma una muestra puede ser un paciente, por ejemplo, un paciente con cáncer o un paciente que se sospecha que tiene cáncer.

El sujeto puede ser un mamífero, p. ej., un ser humano, y puede ser macho o hembra. En algunas realizaciones, la hembra está embarazada. La muestra puede ser una biopsia tumoral. La biopsia puede realizarla, por ejemplo, un profesional sanitario, lo que incluye un médico, auxiliar médico, enfermero, veterinario, dentista, quiropráctico, paramédico, dermatólogo, oncólogo, gastroenterólogo o cirujano.

En algunas realizaciones, los polinucleótidos están unidos a otras moléculas diana tales como proteínas, enzimas, sustratos, anticuerpos, agentes de unión, perlas, moléculas pequeñas, péptidos o cualquier otra molécula. En algunas realizaciones, los polinucleótidos no están unidos a un soporte sólido. Los ácidos nucleicos se pueden extraer de una muestra biológica mediante un abanico de técnicas (Sambrook y col., Molecular Cloning: A Laboratory Manual, tercera edición, Cold Spring Harbor, NY (2001)).

En algunas realizaciones, la muestra es saliva. En algunas realizaciones, la muestra es sangre entera. En algunas realizaciones, con el fin de obtener suficiente cantidad de polinucleótidos para el ensayo, se extrae un volumen de sangre de al menos 0,001; 0,005; 0,01; 0,05; 0,1; 0,5; 1; 2; 3; 4; 5; 10; 20; 25; 30; 35; 40; 45 o 50 mL. En algunas realizaciones, la sangre se puede recoger en un aparato que contiene un quelante de magnesio que incluye, pero no se limita a, EDTA, y se almacena a 4 °C. Opcionalmente, se puede añadir un quelante de calcio, que incluye, pero no se limita a, EGTA.

En algunas realizaciones, se añade un inhibidor de la lisis celular a la sangre que incluye, pero no se limita a, formaldehído, derivados de formaldehído, formalina, glutaraldehído, derivados de glutaraldehído, un agente de reticulación de proteína, un agente de reticulación de ácido nucleico, un agente de reticulación de proteína y ácido nucleico, agentes de reticulación reactivos de amina primaria, agentes de reticulación reactivos de sulfhidrilo, adición de sulfhidrilo o reducción de disulfuro, agentes de reticulación reactivos de carbohidrato, agentes de reticulación reactivos de carboxilo, agentes de reticulación fotorreactivos o agentes de reticulación escindibles. En algunas realizaciones, los materiales que no son ácidos nucleicos se pueden retirar del material de partida usando tratamientos enzimáticos (tales como digestión con proteasas).

Una pluralidad de muestras puede comprender al menos 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más muestras. La pluralidad de muestras puede comprender al menos aproximadamente 100, 200, 300, 400, 500, 600,

700, 800, 900 o 1000 o más muestras. La pluralidad de muestras puede comprender al menos aproximadamente

1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 muestras, 9000, o 10000 muestras, o 100000 muestras, o 1000

000 o más muestras. La pluralidad de muestras puede comprender al menos aproximadamente 10000 muestras.

El uno o más polinucleótidos de una primera muestra pueden ser diferentes de uno o más polinucleótidos de una segunda muestra. El uno o más polinucleótidos de una primera muestra pueden ser diferentes de uno o más polinucleótidos de una pluralidad de muestras. Uno o más polinucleótidos de una muestra pueden comprender al menos aproximadamente 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de identidad de secuencia. En algunas realizaciones, uno o más polinucleótidos de una muestra pueden ser diferentes en menos de aproximadamente 100, 90, 80, 70, 60, 50, 40, 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2 o 1 nucleótidos o pares de bases.

Una pluralidad de polinucleótidos de una o más muestras de la pluralidad de muestras pueden comprender dos o más secuencias idénticas. Al menos aproximadamente 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %,

25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 %, 98 %, 99 % o 100 % de los polinucleótidos totales de una o más de la pluralidad de muestras pueden comprender la misma secuencia. Una pluralidad de polinucleótidos de una o más muestras de la pluralidad de muestras pueden comprender al menos dos secuencias diferentes. Al menos aproximadamente 5 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %,

45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %,

91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 %, 99 % o 100 % de los polinucleótidos totales de una o más de la pluralidad de muestras pueden comprender al menos dos secuencias diferentes. En algunas realizaciones, uno o más polinucleótidos son variantes uno del otro. Por ejemplo, uno o más polinucleótidos pueden contener polimorfismos de un único nucleótido u otros tipos de mutaciones. En otro ejemplo, uno o más polinucleótidos son variantes de empalme.

Una primera muestra puede comprender una o más células y la segunda muestra puede comprender una o más células. La una o más células de la primera muestra pueden ser del mismo tipo de célula que la una o más células de la segunda muestra. La una o más células de la primera muestra pueden ser de un tipo de célula diferente que una o más células diferentes de la pluralidad de muestras.

La pluralidad de muestras se puede obtener simultáneamente. Una pluralidad de muestras se puede obtener simultáneamente. La pluralidad de muestras se puede obtener secuencialmente. Una pluralidad de muestras se puede obtener en el transcurso de años, p. ej., 100 años, 10 años, 5 años, 4 años, 3 años, 2 años o 1 año de obtención de una o más muestras diferentes. Una o más muestras se pueden obtener en un plazo de aproximadamente un año de obtención de una o más muestras diferentes. Una o más muestras se pueden obtener en un plazo de 12 meses, 11 meses, 10 meses, 9 meses, 8 meses, 7 meses, 6 meses, 4 meses, 3 meses, 2 meses o 1 mes de obtención de una o más muestras diferentes. Una o más muestras se pueden obtener en un plazo de 30 días, 28 días, 26 días, 24 días,

21 días, 20 días, 18 días, 17 días, 16 días, 15 días, 14 días, 13 días, 12 días, 11 días, 10 días, 9 días, 8 días, 7 días, 6 días, 5 días, 4 días, 3 días, 2 días o 1 día de obtención de una o más muestras diferentes. Una o más muestras se pueden obtener en un plazo de aproximadamente 24 horas, 22 horas, 20 horas, 18 horas, 16 horas, 14 horas, 12 horas, 10 horas, 8 horas, 6 horas, 4 horas, 2 horas o 1 hora de obtención de una o más muestras diferentes. Una o más muestras se pueden obtener en un plazo de 60 segundos, 45 segundos, 30 segundos, 20 segundos, 10 segundos, 5 segundos, 2 segundos o 1 segundo de obtención de una o más muestras diferentes. Una o más muestras se pueden obtener en un plazo inferior a un segundo de obtención de una o más muestras diferentes.

Los diferentes polinucleótidos de una muestra pueden estar presentes en la muestra en diferentes concentraciones o cantidades (p. ej., diferente número de moléculas). Por ejemplo, la concentración o cantidad de un polinucleótido puede ser mayor que la concentración o cantidad de otro polinucleótido en la muestra. En algunas realizaciones, la concentración o cantidad de al menos un polinucleótido en la muestra es al menos aproximadamente 1,5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más veces mayor que la concentración o cantidad de al menos otro polinucleótido en la muestra. En otro ejemplo, la concentración o cantidad de un polinucleótido es menor que la concentración o cantidad de otro polinucleótido en la muestra. La concentración o cantidad de al menos un polinucleótido en la muestra puede ser al menos aproximadamente 1,5; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15; 20; 25; 30; 35; 40; 45; 50; 60; 70; 80; 90; 100; 200; 300; 400; 500; 600; 700; 800; 900; 1000 o más veces menor que la concentración o cantidad de al menos otro polinucleótido en la muestra.

En algunas realizaciones, dos o más muestras pueden contener diferentes cantidades o concentraciones de polinucleótidos. En algunas realizaciones, la concentración o cantidad de un polinucleótido en una muestra puede ser mayor que la concentración o cantidad del mismo polinucleótido en una muestra diferente. Por ejemplo, una muestra de sangre podría contener una cantidad de un polinucleótido particular mayor que una muestra de orina. Alternativamente, una única muestra se puede dividir en dos o más submuestras. Las submuestras pueden contener diferentes cantidades o concentraciones del mismo polinucleótido. La concentración o cantidad de al menos un polinucleótido en una muestra puede ser al menos aproximadamente 1,5; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15; 20; 25; 30; 35; 40; 45; 50; 60; 70; 80; 90; 100; 200; 300; 400; 500; 600; 700; 800; 900; 1000 o más veces mayor que la concentración o cantidad del mismo polinucleótido en otra muestra. Alternativamente, la concentración o cantidad de un polinucleótido en una muestra puede ser menor que la concentración o cantidad del mismo polinucleótido en una muestra diferente. Por ejemplo, la concentración o cantidad de al menos un polinucleótido en una muestra puede ser al menos aproximadamente 1,5; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12; 13; 14; 15; 20; 25; 30; 35; 40; 45; 50; 60; 70; 80; 90; 100; 200; 300; 400; 500; 600; 700; 800; 900; 1000 o más veces menor que la concentración o cantidad del mismo polinucleótido en otra muestra.

POLINUCLEÓTIDOS DIANA

En algunos casos, los procedimientos proporcionados en esta memoria se refieren a la amplificación y secuenciación de una molécula de polinucleótido diana, tal como una molécula de polinucleótido de una célula. En algunos casos, los procedimientos proporcionados en esta memoria se refieren a la amplificación y secuenciación de dos o más regiones de una molécula de polinucleótido diana. En algunos casos, los procedimientos proporcionados en esta memoria se refieren a la amplificación y secuenciación de dos o más moléculas de polinucleótido diana. En un aspecto, los polinucleótidos diana son ARN. En un aspecto, los polinucleótidos diana son ácidos nucleicos genómicos. El ADN obtenido del material genético de los cromosomas de un organismo particular puede ser ADN genómico. En realizaciones preferidas, los polinucleótidos diana incluyen secuencias que comprenden regiones variables de un anticuerpo o TCR producido por una célula inmunitaria. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena pesada de un anticuerpo producido por una célula inmunitaria. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena ligera de un anticuerpo producido por una célula inmunitaria. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena alfa de un TCR producido por una célula inmunitaria. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena beta de un TCR producido por una célula inmunitaria. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena gamma de un TCR producido por una célula inmunitaria. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una región variable de una cadena delta de un TCR producido por una célula inmunitaria.

Los polinucleótidos diana se pueden obtener de prácticamente cualquier fuente y se pueden preparar usando procedimientos conocidos en la técnica. Por ejemplo, los polinucleótidos diana se pueden aislar directamente sin amplificación usando procedimientos conocidos en la técnica, que incluyen, sin limitación, extraer un fragmento de ADN o ARNm genómico de un organismo o una célula (p. ej., una célula inmunitaria) para obtener polinucleótidos diana. Un polinucleótido diana también puede abarcar ADNc generado a partir de ARN (tal como ARNm) mediante PCR con transcripción inversa. En algunos casos, un polinucleótido diana es una molécula de ARN. En algunos casos, un polinucleótido diana es una molécula de ARNm o un ADNc producido a partir de la molécula de ARNm. En algunos casos, un polinucleótido diana es una molécula de ARNm, o una molécula de ADNc producida a partir de la molécula de ARNm, de una única célula inmunitaria. En algunos casos, los polinucleótidos diana son moléculas de ARNm, o moléculas de ADNc producidas a partir de las moléculas de ARNm, de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia de anticuerpo de una única célula inmunitaria. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias de cadena pesada de anticuerpo de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia de cadena pesada de anticuerpo de una única célula inmunitaria. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias de cadena ligera de anticuerpo de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia de cadena ligera de anticuerpo de una única célula inmunitaria. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de anticuerpos de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia variable de anticuerpo de una única célula inmunitaria. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de cadena ligera de anticuerpo de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia variable de cadena ligera de anticuerpo de una única célula inmunitaria. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias variables de cadena pesada de anticuerpo de células inmunitarias individuales. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican una secuencia variable de cadena pesada de anticuerpo de una única célula inmunitaria. En algunos casos, un polinucleótido diana puede ser un ácido nucleico exento de células, p. ej., ADN o ARN. En algunos casos, los polinucleótidos diana son moléculas de ARNm que codifican secuencias de cadena alfa, beta, gamma y/o delta de TCR de células inmunitarias individuales.

Los procedimientos descritos en esta memoria se pueden usar para generar una colección de polinucleótidos a partir de uno o más polinucleótidos diana para la secuenciación. Los polinucleótidos diana incluyen todos los polinucleótido de interés que no son productos de una reacción de amplificación. Por ejemplo, un polinucleótido diana puede incluir un polinucleótido de una muestra biológica. Por ejemplo, los polinucleótidos diana no incluyen productos de una reacción PCR. Por ejemplo, los polinucleótidos diana pueden incluir una matriz polinucleotídica usada para generar productos de una reacción de amplificación, pero no incluyen los propios productos de la amplificación. Por ejemplo, los polinucleótidos diana pueden incluir una matriz polinucleotídica para generar productos de una reacción de transcripción inversa o una reacción de extensión del cebador, y también incluir los propios productos de la reacción de transcripción inversa o la reacción de extensión del cebador. Por ejemplo, los polinucleótidos diana incluyen polinucleótidos de interés que se pueden someter a una reacción de transcripción inversa o una reacción de extensión del cebador. Por ejemplo, los polinucleótidos diana incluyen ARN o ADN. Por ejemplo, los polinucleótidos diana incluyen ADNc. En algunas realizaciones, los polinucleótidos diana de ARN son ARNm. En algunas realizaciones, los polinucleótidos diana de ARN están poliadenilados. En algunas realizaciones, los polinucleótidos de ARN no están poliadenilados. En algunas realizaciones, los polinucleótidos diana son polinucleótidos de ADN. Los polinucleótidos de ADN pueden ser ADN genómico. Los polinucleótidos de ADN pueden comprender exones, intrones, regiones no traducidas o cualquier combinación de los mismos.

En algunas realizaciones, se pueden generar colecciones a partir de dos o más regiones de un polinucleótido diana. En algunas realizaciones, se pueden generar colecciones de procedimientos a partir de dos o más polinucleótidos diana. En algunas realizaciones, los polinucleótidos diana son ácidos nucleicos genómicos o ADN obtenido de cromosomas. En algunas realizaciones, los polinucleótidos diana incluyen secuencias que comprenden una variante, tal como un polimorfismo o una mutación. En algunas realizaciones, los polinucleótidos diana incluyen ADN y no ARN. En algunas realizaciones, los polinucleótidos diana incluyen ARN y no ADN. En algunas realizaciones, los polinucleótidos diana incluyen ADN y ARN. En algunas realizaciones, un polinucleótido diana es una molécula de ARNm. En algunas realizaciones, un polinucleótido diana es una molécula de ADN. En algunas realizaciones, un polinucleótido diana es un polinucleótido monocatenario. En algunas realizaciones, un polinucleótido diana es un polinucleótido bicatenario. En algunas realizaciones, un polinucleótido diana es una única cadena de un polinucleótido bicatenario.

Los polinucleótidos diana pueden obtenerse de cualquier muestra biológica y prepararse usando procedimientos conocidos en la técnica. En algunas realizaciones, los polinucleótidos diana se aíslan directamente sin amplificación. Los procedimientos para el aislamiento directo se conocen en la técnica. Los ejemplos no limitantes incluyen la extracción de ADN o ARNm genómico de una muestra biológica, un organismo o una célula.

En algunas realizaciones, uno o más polinucleótidos diana se purifican a partir de una muestra biológica. En algunas realizaciones, un polinucleótido diana no se purifica a partir de la muestra biológica en la que está contenido. En algunas realizaciones, un polinucleótido diana se aísla de una muestra biológica. En algunas realizaciones, un polinucleótido diana no se aísla de la muestra biológica en la que está contenido. En algunas realizaciones, un polinucleótido diana puede ser un ácido nucleico exento de células. En algunas realizaciones, un polinucleótido diana puede ser un ácido nucleico fragmentado. En algunas realizaciones, un polinucleótido diana puede ser un ácido nucleico transcrito. En algunas realizaciones, un polinucleótido diana es un polinucleótido modificado. En algunas realizaciones, un polinucleótido diana es un polinucleótido no modificado.

En algunas realizaciones, un polinucleótido diana es un polinucleótido de una única célula. En algunas realizaciones, los polinucleótidos diana son de células individuales. En algunas realizaciones, un polinucleótido diana es un polinucleótido de una muestra que contiene una pluralidad de células.

En algunas realizaciones, un polinucleótido diana codifica una secuencia de biomarcador. En algunas realizaciones, un polinucleótido diana codifica dos o más secuencias de biomarcador. En algunas realizaciones, una pluralidad de polinucleótidos diana codifica una secuencia de biomarcador. En algunas realizaciones, una pluralidad de polinucleótidos diana codifican dos o más secuencias de biomarcador. En algunas realizaciones, una pluralidad de polinucleótidos diana codifica 3, 4, 5, 6 , 7, 8 , 9, 10, 20, 30, 40, 50, 60, 70, 80, 90 o 100 o más secuencias de biomarcador.

En algunas realizaciones, una pluralidad de polinucleótidos diana comprende un grupo de secuencias de inmunoglobulina. En algunas realizaciones, una pluralidad de polinucleótidos diana comprende un grupo de secuencias de TCR. Por ejemplo, un grupo de secuencias de inmunoglobulina puede ser secuencias de V^hy/o V^l. En algunas realizaciones, un grupo de secuencias de inmunoglobulina o TCR contiene 1, 2, 3, 4, 5, 6 , 7, 8 , 9 o 10 secuencias de inmunoglobulina o TCR. En algunas realizaciones, un grupo de secuencias de inmunoglobulina o TCR contiene al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12 000, 13000, 14000, 15000, 16000 , 17000, 18000, 19000, 20000, 25000, 30000, 35000, 40000, 45000, 50 000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900 000, 1 x 106, 2 x 106, 3 x 106, 4 x 106, 5 x 106, 6 x 106, 7 x 106, 8 x 106, 9 x 106, 1 x 107, 2 x 107, 3 x 107, 4 x 107, 5 x 107, 6 x 1077 x 107, 8 x 107, 9 x 107, 1 x 108, 2 x 108, 3 x 108, 4 x 108, 5 x 108, 6 x 108, 7 x 108, 8 x 108, 9 x 108, 1 x 109, 2 x 109, 3 x 109, 4 x 109, 5 x 109, 6 x 109, 7 x 109, 8 x 109, 9 x 109, 1 x 101°, 2 x 101°, 3 x 101°, 4 x 101°, 5 x 101°, 6 x 101°, 7 x 101°, 8 x 101°, 9 x 101°, 1 x 1011, 2 x 1011, 3 x 1011, 4 x 1011, 5 x 1011, 6 x 1011, 7 x 1011, 8 x 1011, 9 x 1011, 1 x 1012, 2 x 1012, 3 x 1012, 4 x 1012, 5 x 1012, 6 x 1012, 7 x 1012, 8 x 1012 o 9 x 1012 secuencias de inmunoglobulina o TCR. En algunas realizaciones, un grupo de secuencias de inmunoglobulina o TCR contiene como máximo aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 16000 , 17000, 18000, 19000, 20000, 25000, 30000, 35000, 40000, 45000, 50000, 60000, 70000, 80000, 90000, 100 000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1 x 106, 2 x 106, 3 x 106, 4 x 106, 5 x 106, 6 x 106, 7 x 106, 8 x 106, 9 x 106, 1 x 107, 2 x 107, 3 x 107, 4 x 107, 5 x 107, 6 x 1077 x 107, 8 x 107, 9 x 107, 1 x 108, 2 x 108, 3 x 108, 4 x 108, 5 x 108, 6 x 108, 7 x 108, 8 x 108, 9 x 108, 1 x 109, 2 x 109, 3 x 109, 4 x 109, 5 x 109, 6 x 109, 7 x 109, 8 x 109, 9 x 109, 1 x 101°, 2 x 101°, 3 x 101°, 4 x 101°, 5 x 101°, 6 x 101°, 7 x 101°, 8 x 101°, 9 x 101°, 1 x 1011, 2 x 1011, 3 x 1011, 4 x 1011, 5 x 1011, 6 x 1011, 7 x 1011, 8 x 1011, 9 x 1011, 1 x 1012, 2 x 1012, 3 x 1012, 4 x 1012, 5 x 1012, 6 x 1012, 7 x 1012, 8 x 1012 o 9 x 1012 secuencias de inmunoglobulina o TCR. En algunas realizaciones, un grupo de secuencias de inmunoglobulina o TCR contiene de aproximadamente 10-20, 10-30, 10-40, 10-30, 10-40, 10-50, 10-60, 10-70, 10-80, 10-90, 10-100, 50-60, 50-70, 50-80, 50-90, 50-100, 100-200, 100-300, 100-400, 100-300, 100 400, 100- 500, 100-600, 100-700, 100-800, 100-900, 100-1000, 500-600, 500-700, 500-800, 500-900, 500-1000, 1000 2000, 1000-3000, 1000-4000, 1000-3000, 1000-4000, 1000-5000, 1000-6000, 1000-7000, 1000-8000, 1000-9000, 1000-10000, 5000-6000, 5000-7000, 5000-8000, 5000-9000, 5000-10000, 1-1 x 105, 1-2 x 105, 1-3 x 105, 1-4 x 105, 1-5 x 105, 1-6 x 105, 1-7 x 105, 1-8 x 105, 9 x 105, 1-1 x 106, 1-2 x 106, 1-3 x 106, 1-4 x 106, 1-5 x 106, 1-6 x 106, 1-7 x 106, 1-8 x 106, 9 x 106, 1 x 107, 1-2 x 107, 1-3 x 107, 1-4 x 107, 1-5 x 107, 1-6 x 107, 1-7 x 107, 1-8 x 107, 1-9 x 107, 1-1 x 108, 1-2 x 108, 1-3 x 108, 1-4 x 108, 1-5 x 108, 1-6 x 108, 1-7 x 108, 1-8 x 108, 1-9 x 108, 1-1 x 109, 1-2 x 109, 1-3 x 109, 1-4 x 109, 1-5 x 109, 1-6 x 109, 1-7 x 109, 1-8 x 109, 1-9 x 109, 1-1 x 101°, 1-2 x 101°, 1-3 x 101°, 1-4 x 101°, 1-5 x 101°, 1 6 x 101°, 1-7 x 101°, 1-8 x 101°, 1-9 x 101°, 1-1 x 1011, 1-2 x 1011, 1-3 x 1011, 1-4 x 1011, 1-5 x 1011, 1-6 x 1011, 1-7 x 1011, 1-8 x 1011, 1-9 x 1011, 1-1 x 1012, 1-2 x 1012, 1-3 x 1012, 1-4 x 1012, 1-5 x 1012, 1-6 x 1012, 1-7 x 1012, 1-8 x 1012 o 1-9 x 1012 secuencias de inmunoglobulina o TCR.

En algunas realizaciones, un polinucleótido diana tiene aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, 19000 o 20000 bases o pares de bases de longitud. En algunas realizaciones, un polinucleótido diana tiene al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11 000, 12000, 13000, 14000, 15000, 16 000, 17000, 18000, 19000 o 20000 bases o pares de bases de longitud. En algunas realizaciones, un polinucleótido diana tiene como máximo aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11 000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, 19000 o 20000 bases o pares de bases de longitud. En algunas realizaciones, un polinucleótido diana tiene aproximadamente de 10-20, 10-30, 10-40, 10-30, 10-40, 10 50, 10-60, 10-70, 10-80, 10-90, 10-100, 50-60, 50-70, 50-80, 50-90, 50-100, 100-200, 100-300, 100-400, 100-300, 100-400, 100-500, 100- 600, 100-700, 100-800, 100-900, 100-1000, 500-600, 500-700, 500-800, 500-900, 500-1000, 1000-2000, 1000-3000, 1000-4000, 1000-3000, 1000-4000, 1000-5000, 1000-6000, 1000-7000, 1000-8000, 1000 9000, 1000-10000, 5000-6000, 5000-7000, 5000-8000, 5000-9000 o 5000-10000 bases o pares de bases de longitud. En algunas realizaciones, la longitud promedio de los polinucleótidos diana, o fragmentos de los mismos, puede ser menor de aproximadamente 100, 200, 300, 400, 500 u 800 pares de bases, o menor de aproximadamente 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200 nucleótidos, o menor de aproximadamente 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 kilobases. En algunas realizaciones, una secuencia diana de una matriz relativamente corta, tal como una muestra que contiene un polinucleótido diana, tiene aproximadamente 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 bases. En ciertas realizaciones, los datos de secuenciación se alinean contra secuencias conocidas o esperadas usando una base de datos que contiene secuencias o secuencias de inmunoglobulina o TCR asociadas a una enfermedad o afección.

SECUENCIACIÓN DEL DE REPERTORIO INMUNITARIO

La presente invención utiliza etapas en las que se manipulan ácidos nucleicos con el fin de generar colecciones de polinucleótidos para la secuenciación. En algunas realizaciones, la presente invención utiliza etapas en las que se manipulan ácidos nucleicos con el fin de producir anticuerpos monoclonales recombinantes. En un sentido general, en algunas realizaciones de la invención, se emplea la amplificación de material genético de células inmunitarias y/o células T, p. ej., reacción en cadena de la polimerasa con transcripción inversa (PCR con transcripción inversa) para generar la amplificación de ADNc de material genético de células inmunitarias. Para las moléculas de anticuerpo, los genes de inmunoglobulina se pueden obtener de ADN o ARNm genómico de células inmunitarias o células T. El ARN puede ser de cadena pesada (segmentos V, D, J) o cadena ligera (segmentos V, J). En algunas realizaciones, el material de partida es ARN de células inmunitarias compuesto por segmentos génicos V, D, J que codifica un anticuerpo y contiene una región constante.

El material de partida polinucleotídico, tal como ARN, se puede someter a transcripción inversa a ADNc usando uno o un grupo de polinucleótidos. Los polinucleótidos pueden comprender una porción complementaria a una región del ARN, tal como en una región constante, o a una cola de poli-A del ARNm. Un código de barras de recipiente, puede ser un tramo de ~ 20 nucleótidos degenerados, con o sin una posición de bases de intercalación conocida, tal como NNNNWNNNNWNNNNWNNNNW, donde W significa A o T.

El ADNc resultante de la transcripción inversa se puede marcar con uno o más códigos de barras, por ejemplo, con un código de barras del recipiente y un código de barras molecular. Se pueden usar diversos oligonucleótidos de diseño particular para el marcado. El ADNc marcado resultante de la transcripción inversa se puede amplificar una o más veces, tal como mediante amplificación por PCR. Se pueden usar diversos cebadores de diseño particular para la amplificación. Un producto de una primera reacción de amplificación, tal como una PCR, se puede amplificar usando una segunda reacción de amplificación, tal como una primera o una segunda fase de PCR. Se pueden usar diversos cebadores para la etapa de amplificación. Se puede generar una colección de polinucleótidos amplificados usando los procedimientos descritos en esta memoria. Una colección resultante puede comprender una secuencia de anticuerpo o TCR completa o parcial con códigos de barras moleculares y del recipiente apropiados.

En otras realizaciones, se puede usar el cambio de matriz para generar colecciones, tal como para secuenciar el repertorio inmunitario. Por ejemplo, se puede emplear el cambio de matriz durante la transcripción inversa para generar una región sobre el producto de la transcripción inversa que es complementaria a un polinucleótido que alberga un código de barras, tal como un polinucleótido con código de barras del recipiente o un polinucleótido con código de barras molecular. Se puede emplear el cambio de matriz durante la transcripción inversa para eliminar los problemas de sesgo de la PCR. Estos procedimientos se pueden usar para secuenciar anticuerpos, tal como mediante el uso de una plataforma de secuenciación de alto rendimiento.

El material de partida puede ser ARN o ADN, tal como de células inmunitarias o células T que comprende los segmentos génicos V, D, J que codifican un anticuerpo, y contiene la región constante. En algunas realizaciones, el polinucleótido diana comprende segmentos de cadena pesada (segmentos V, D, J) o segmentos de cadena ligera (segmentos V, J).

Los polinucleótidos diana se pueden someter a transcripción inversa en ADNc usando uno o un grupo de polinucleótidos. Los ejemplos de cebadores de un grupo de polinucleótidos para la transcripción inversa de un polinucleótido diana pueden comprender una porción complementaria a una región del polinucleótido diana. En algunas realizaciones, la porción complementaria a una región del polinucleótido diana puede ser complementaria a una región constante o a una cola de poli-A del polinucleótido diana, tal como ARNm. Se pueden usar múltiples oligonucleótidos, tales como cebadores, para hibridar una o más regiones constantes. Se puede emplear una transcriptasa inversa para llevar a cabo la reacción de transcripción inversa. En realizaciones particulares, una transcriptasa inversa puede comprender una actividad de transferasa terminal no matricial. Cuando una transcriptasa inversa que comprende actividad de transferasa terminal no matricial alcanza el final de una matriz, puede añadir tres o más residuos no matriciales, tales como tres o más residuos de citosina no matriciales. En algunas realizaciones, se usa la transcriptasa inversa Superscipt II™ para este fin. En algunas realizaciones, se usa la transcriptasa inversa Maxima™ para este fin. En algunas realizaciones, se usa la transcriptasa inversa Protoscript II™ para este fin. En algunas realizaciones, se usa transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV-RT) se usa para este fin. En algunas realizaciones, se usa la transcriptasa inversa HighScriber™ para este fin. En algunas realizaciones, se usa una desoxinucleotidil transferasa terminal para este fin. En algunas realizaciones, se usa transcriptasa del virus de la mieloblastosis aviar (AMV) para este fin. Se puede usar cualquier transcriptasa inversa capaz de transcribir ARN que tenga actividad de transferasa terminal no matricial. Se puede usar cualquier polimerasa inversa capaz de transcribir ARN que tenga actividad de transferasa terminal no matricial. Se puede usar cualquier polimerasa inversa capaz de transcribir ADN que tenga actividad de transferasa terminal no matricial.

Las reacciones de transcripción inversa, tales como las descritas anteriormente, se pueden realizar en presencia de un polinucleótido de marcado en 3'. Un polinucleótido de marcado en 3' puede ser un polinucleótido usado para añadir ácidos nucleicos a un extremo 3' de un polinucleótido diana, tal como un ADNc. Un polinucleótido de marcado en 3' puede ser un polinucleótido usado como matriz para añadir ácidos nucleicos a un extremo 3' de un polinucleótido diana, tal como un ADNc. Un polinucleótido de marcado en 3' puede ser un polinucleótido que se hibrida a un extremo 3' de un polinucleótido diana, tal como un ADNc. Un polinucleótido de marcado en 3' puede ser un polinucleótido que contiene una región 3', tal como una región terminal 3', que se hibrida a un extremo 3' de un polinucleótido diana, tal como un ADNc. Por ejemplo, un polinucleótido de marcado en 3' puede comprender un segmento, tal como un segmento que se hibrida a tres o más residuos no matriciales. En algunas realizaciones, un polinucleótido de marcado en 3' es un polinucleótido con código de barras molecular. En algunas realizaciones, un polinucleótido de marcado en 3' puede comprender un código de barras molecular. En algunas realizaciones, un polinucleótido de marcado en 3' puede comprender 3 residuos de riboguanina o análogos de los mismos en el extremo 3' (rGrGrG) (bases de ARN) que son complementarios a, y se hibridan a, la cadena producida por la enzima de transcripción inversa. En algunas realizaciones, se pueden usar tres o más residuos de guanina en lugar de riboguanina (nucleótido de ADN, en lugar de nucleótido de ARN). En algunas realizaciones, un polinucleótido de marcado en 3' puede comprender 1 o 2 residuos de riboguanina en el extremo 3' y un residuo de desoxirriboguanina o un análogo del mismo en el extremo 3' (rGrGG) que son complementarios a, y se hibridan a, la cadena producida por la enzima de transcripción inversa.

T ras la hibridación de un polinucleótido de marcado en 3' a un CCC de la cadena de ADNc, una transcriptasa inversa puede continuar extendiendo el ADNc en el polinucleótido de marcado, fijando de ese modo un código de barras molecular, o un complemento del mismo, a una población diana de polinucleótidos, tales como ADNc, en la reacción. Por ejemplo, el polinucleótido de marcado en 3' puede ser un polinucleótido que contiene una región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender una región que no es complementaria al polinucleótido diana, tal como un ADNc. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender un código de barras molecular. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana puede comprender una región complementaria a un polinucleótido con código de barras del recipiente o un complemento del mismo. En otros experimentos, el cambio de matriz se puede realizar en reacciones independientes. Por ejemplo, se puede añadir un polinucleótido de marcado en 3' después de la reacción de transcripción inversa y se pueden usar enzimas, tales como una transcriptasa inversa o una polimerasa, para extenderlo en un polinucleótido de marcado. Como un polinucleótido de marcado puede albergar un código de barras molecular degenerado exclusivo sobre cada molécula de un recipiente, cada ADNc de un recipiente puede estar marcado exclusivamente con un código de barras molecular. En algunas realizaciones, el cambio de matriz se puede realizar al mismo tiempo que se realiza una reacción de transcripción inversa.

En algunas realizaciones, un polinucleótido de marcado en 3', tal como un polinucleótido de código de barras molecular, puede comprender además una región 5', tal como una región terminal 5' que es complementaria a un polinucleótido de marcado en 3' o un complemento del mismo que contiene otro código de barras, tal como un código de barras del recipiente. En algunas realizaciones, un polinucleótido diana que contiene un código de barras molecular o un complemento del mismo, tal como una molécula de ADNc marcada, puede comprender una región 3', tal como una región terminal 3', que es complementaria a un polinucleótido de marcado en 3' o un complemento del mismo que contiene otro código de barras, tal como un código de barras del recipiente.

En algunas realizaciones, un polinucleótido de marcado en 3' es un polinucleótido con código de barras del recipiente. Tras la generación de un polinucleótido que contiene un código de barras molecular o un complemento del mismo a partir de un polinucleótido diana, se puede añadir un código de barras del recipiente al polinucleótido diana con código de barras molecular. Un polinucleótido de marcado en 3' puede ser un polinucleótido usado para añadir ácidos nucleicos a un extremo 3' de un polinucleótido diana, tal como un polinucleótido diana con código de barras molecular. Un polinucleótido de marcado en 3' puede ser un polinucleótido usado como matriz para añadir ácidos nucleicos a un extremo 3' de un polinucleótido diana, tal como un polinucleótido diana con código de barras molecular. Un polinucleótido de marcado en 3' puede ser un polinucleótido que se hibrida a un extremo 3' de un polinucleótido diana, tal como un polinucleótido diana con código de barras molecular. Un polinucleótido de marcado en 3' puede ser un polinucleótido que contiene una región 3', tal como una región terminal 3', que se hibrida a un extremo 3' de un polinucleótido diana, tal como un polinucleótido diana con código de barras molecular. Un polinucleótido con código de barras del recipiente puede comprender una región 3', tal como una región terminal 3', que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular.

Tras la hibridación de un polinucleótido de marcado en 3' a un polinucleótido diana con código de barras molecular, una transcriptasa inversa puede continuar extendiendo el ADNc en el polinucleótido de marcado en 3', tal como un polinucleótido con código de barras del recipiente, fijando de ese modo un código de barras del recipiente, o un complemento del mismo, a un población diana de polinucleótidos, tales como polinucleótidos diana con código de barras molecular, en la reacción. Por ejemplo, el polinucleótido de marcado en 3' puede ser un polinucleótido que contiene una región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región que no es complementaria al polinucleótido diana o el polinucleótido diana con código de barras molecular. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender un código de barras del recipiente.

En algunas realizaciones, un polinucleótido de marcado en 3' es un producto amplificado. En algunas realizaciones, un polinucleótido de marcado en 3' es un producto amplificado que procede de una única molécula. En algunas realizaciones, un polinucleótido de marcado en 3' es un producto amplificado de un polinucleótido con código de barras del recipiente. En algunas realizaciones, un polinucleótido de marcado en 3' es un producto amplificado que procede de un único polinucleótido con código de barras del recipiente. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región complementaria a un cebador o un complemento del mismo. La región 5' a la región 3' que se hibrida a un extremo 3' de un polinucleótido diana con código de barras molecular puede comprender una región complementaria a un cebador o un complemento del mismo que se usó para amplificar el polinucleótido con código de barras del recipiente.

A continuación, se puede amplificar, tal como por PCR, un polinucleótido diana con código de barras doble, tal como un ADNc que contiene un código de barras molecular y un código de barras del recipiente. La PCR se puede realizar a continuación, por ejemplo, usando un conjunto de cebadores. Un producto de la reacción PCR antes mencionada puede amplificarse continuación una o más veces, tal como mediante una o más rondas de PCR, o secuenciarse directamente.

Una colección producida según los procedimientos descritos en esta memoria puede ser una colección que comprende una secuencia de anticuerpo o TCR grande o completa con códigos de barras apropiados, tales como códigos de barras del recipiente y códigos de barras moleculares, que están secuenciados. En algunas realizaciones, una colección producida según los procedimientos descritos en esta memoria puede contener segmentos de agrupación apropiados para la secuenciación. En algunas realizaciones, se pueden generar muchas copias de códigos de barras moleculares idénticos. En algunas realizaciones, se pueden generar muchas copias de polinucleótidos que contienen códigos de barras moleculares idénticos para cada molécula de polinucleótido diana exclusiva de partida. En algunas realizaciones, se pueden generar muchas copias de polinucleótidos que contienen códigos de barras moleculares idénticos para cada molécula de polinucleótido diana exclusiva de partida marcada con un código de barras del recipiente.

Tras la secuenciación, se pueden emparejar o aparear las secuencias con códigos de barras moleculares idénticos. Tras la secuenciación, se pueden emparejar o aparear las secuencias con códigos de barras del recipiente idénticos. Tras la secuenciación, se pueden emparejar o aparear las secuencias con secuencias diana idénticas. En algunas realizaciones, las lecturas de la secuenciación se pueden condensar en secuencias consenso. La condensación de las lecturas de la secuenciación emparejadas o apareadas en una secuencia consenso puede reducir o eliminar de ese modo los errores de secuenciación y PCR. La secuenciación se puede realizar usando un primer sitio del cebador para una primera lectura. La secuenciación se puede realizar usando el primer sitio del cebador para una segunda lectura. La secuenciación se puede realizar usando un segundo sitio del cebador para una segunda lectura.

Las cadenas pesadas y ligeras de anticuerpo que contienen los mismos códigos de barras del recipiente se pueden aparear y, en algunas realizaciones, clonar en un sistema vectorial de mamífero. La construcción de anticuerpo se puede expresar en otras líneas celulares de hospedadores mamíferos o humanos. La construcción se puede validar a continuación mediante ensayos de transfección transitoria y análisis de electroinmunotransferencia del anticuerpo o TCR de interés expresado.

Los procedimientos de amplificación de ARN o ADN son muy conocidos en la técnica y se pueden usar según la presente invención sin una experimentación excesiva, en base a las enseñanzas y directrices presentadas en esta memoria. Los procedimientos conocidos de amplificación de ADN o ARN incluyen, pero no se limitan a, la reacción en cadena de la polimerasa (PCR) y procedimientos de amplificación relacionados (véanse, p. ej., las patentes de los Estados Unidos n.° 4683 195, 4683202, 4800 159, 4965 188, de Mullis y col.; 4795699 y 4921 794 de Tabor y col.; 5142033 de Innis; 5122464 de Wilson y col.; 5091 310 de Innis; 5066 584 de Gyllensten y col.; 4889818 de Gelfand y col.; 4994370 de Silver y col.; 4766067 de Biswas; 4656134 de Ringold) y la amplificación mediada por ARN que usa ARN antisentido a la secuencia diana como una matriz para la síntesis de ADN bicatenario (patente de los Estados Unidos n.° 5130238 de Malek y col., con el nombre comercial NASBA), (véase, p. ej., Ausubel, arriba; o Sambrook, arriba).

Convenientemente, las etapas del procedimiento descritas en esta memoria, tales como amplificación, secuenciación y similares, se pueden o no llevar a cabo en un formato de ensayo múltiple que emplea una fase sólida sobre la que se inmovilizan una pluralidad de sustratos, p. ej., antígenos y similares, tal como una matriz. En algunas realizaciones, la matriz es un biochip de proteínas. Usando biochips de proteínas, se pueden cribar cientos e incluso miles de antígenos. Como se emplea en esta memoria, “matriz”, “micromatriz” o “biochip” se refiere a un sustrato sólido que tiene una superficie generalmente plana a la que se fija un adsorbente. Frecuentemente, la superficie del biochip comprende una pluralidad de posiciones accesibles, cada una de las cuales tiene el adsorbente unido allí. Los biochips se pueden adaptar para acoplar una interfase de sonda y, por lo tanto, actuar como sondas. Un “biochip de proteínas” se refiere a un biochip adaptado para la captura de polipéptidos. En la técnica están descritos muchos biochips de proteínas. Los procedimientos para producir matrices de polipéptidos se describen en, p. ej., De Wildt y col., 2000, Nat. Biotechnol. 18:989-994; Lueking y col., 1999, Anal. Biochem. 270:103-111; Ge, 2000, Nucleic Acids Res. 28, e3, 1-V^h; MacBeath y Schreiber, 2000, Science 289: 1760-1763; el documento WO 01/40803 y el documento WO 99/51773A1. El uso de matrices permite realizar varias etapas, tales como el cribado, robóticamente y/o con alto rendimiento. Los polipéptidos para la matriz se pueden depositar a alta velocidad, p. ej., usando un aparato robótico comercializado, p. ej., de Genetic MicroSystems o BioRobotics. El sustrato de la matriz puede ser, por ejemplo, nitrocelulosa, plástico, vidrio, p. ej., vidrio modificado superficialmente. La matriz también puede incluir una matriz porosa, p. ej., acrilamida, agarosa u otro polímero. Tras la captura sobre un biochip, los analitos pueden detectarse mediante un abanico de procedimientos de detección seleccionados de entre, por ejemplo, un procedimiento de espectrometría iónica en fase gaseosa, un procedimiento óptico, un procedimiento electroquímico, microscopía de fuerza atómica y un procedimiento de radiofrecuencia. De particular interés es el uso de la espectrometría de masas, y en particular SELDI. Los procedimientos ópticos incluyen, por ejemplo, detección de la fluorescencia, luminiscencia, quimioluminiscencia, absorbancia, reflectancia, transmitancia, birrefringencia o el índice de refracción (p. ej., resonancia de plasmones superficiales, elipsometría, un procedimiento de espejo resonante, un procedimiento de guía de onda de tipo acoplador de superficie o interferometría). Los procedimientos ópticos incluyen microscopía (tanto confocal como no confocal), procedimientos de adquisición de imágenes y procedimientos sin adquisición de imágenes. Los inmunoanálisis de varios formatos (p. ej., ELISA) son procedimientos populares para la detección de analitos capturados sobre una fase sólida. Los procedimientos electroquímicos incluyen procedimientos de voltamperometría y amperometría. Los procedimientos de radiofrecuencia incluyen la espectroscopia de resonancia multipolar.

En algunas realizaciones de la invención, se emplea, p. ej., la estrategia de la diversidad natural para preparar anticuerpos monoclonales, técnicas que se han creado para trabajar con células individuales. Una técnica incorpora un accesorio especial que se puede usar en FACS para desviar células individuales a recipientes independientes. Tales accesorios están comercializados y son muy conocidos en la técnica. Tales accesorios son útiles para distribuir células individuales en compartimentos seleccionados de, por ejemplo, placas de cultivo de microtitulación estándar de 96 pocillos. Alternativamente, se pueden depositar células en una placa de microtitulación en una dilución limitante para garantizar la deposición de una única célula.

Una segunda técnica es la PCR realizada sobre células inmunitarias individuales para amplificar los segmentos V^hy V^l. En la estrategia de la diversidad natural, se usa la PCR unicelular para conservar el apareamiento natural de V^ly V^hen la célula individual. La especificidad de un anticuerpo está determinada por las regiones determinantes de la complementariedad (CDR) en la región V^ly la región V^h.

Los procedimientos para realizar la PCR unicelular son muy conocidos en la técnica (p. ej., Larrick, J.W. Y col., Bio/Technology 7:934 (1989)). Por ejemplo, las células B productoras de anticuerpos de la colección de células B o las células T productoras de TCR de la colección de células T se pueden fijar con una solución fijadora o una solución que contiene un producto químico tal como formaldehído, glutaraldehído o similares. Las células se permeabilizan a continuación con una solución de permeabilización que comprende, por ejemplo, un detergente. El procedimiento de fijación y permeabilización debe proporcionar suficiente porosidad para permitir la entrada de enzimas, nucleótidos y otros reactivos en las células sin destrucción excesiva de los compartimentos celulares o los ácidos nucleicos contenidos en los mismos. La adición de enzimas y nucleótidos puede entrar a continuación en las células para realizar la transcripción inversa del ARNm celular de V^hy V^l, o Va y Vp, o Vy y V8 , por ejemplo, en las correspondientes secuencias de ADNc. La transcripción inversa se puede realizar en una única etapa u opcionalmente junto con un procedimiento de PCR, usando una transcriptasa inversa, cantidades suficientes de los cuatro dNTP y cebadores que se unen al ARNm proporcionando un grupo hidroxilo 3' para que la transcriptasa inversa inicie la polimerización. Se puede usar cualquier cebador complementario al ARNm, pero se prefiere usar cebadores complementarios a un extremo terminal 3' de las moléculas de V^hy V^l, o Va y Vp, o Vy y VS para facilitar la selección de ARNm de la región variable. Numerosos estudios han indicado que se pueden preparar polinucleótidos degenerados para que actúen como cebadores del extremo 5' para V^hy V^l, o Va y Vp, o V^yy VS. El procedimiento de colecciones combinatorias para producir moléculas de direccionamiento se basa en tales cebadores. Asimismo, numerosos experimentos han demostrado que la PCR puede amplificar los segmentos génicos de interés, tales como V^hy V^l, o Va y Vp, o Vy y VS de una única célula. Gracias a la capacidad de trabajar incluso con una única célula, esta estrategia de PCR puede generar anticuerpos incluso cuando las células inmunitarias de interés se producen con baja frecuencia.

En la realización de la diversidad alta, después de la clasificación mediante FACS, se agrupan las células de la colección de células inmunitarias y se realiza la PCR con transcripción inversa en el grupo completo de células. La generación de ARNm con el fin de clonar anticuerpos o TCR se logra fácilmente mediante procedimientos muy conocidos para la preparación y caracterización de anticuerpos o TCR (véase, p. ej., Antibodies: A Laboratory Manual, 1988; incorporado en esta memoria por referencia). Por ejemplo, se extrae A^rN total de la colección de células B mediante procedimientos apropiados que son estándar y convencionales en la técnica. A continuación, se sintetiza ADNc a partir del ARN mediante procedimientos apropiados, p. ej., usando polinucleótidos hexaméricos aleatorios, o cebadores específicos del gen C o la familia del gen C, o cebadores específicos del gen V o la familia del gen V. De nuevo, estos son procedimientos conocidos por los expertos en la materia, como se explicó anteriormente. Las colecciones de moléculas de ácido nucleico obtenidas de colecciones de células B o células T, p. ej., una colección de moléculas de ARN o ADNc obtenidas de tales linfocitos B o T, se pueden clonar en vectores de expresión para formar colecciones de expresión. En algunas realizaciones, solo se amplifica el dominio V^h, o Va o V^y, obtenido de la colección de células inmunitarias para generar una colección de dominios V^h, o Va o Vy. Se usa una colección de V^l, o Vp o VS, de otra fuente en combinación con la colección de V^h, o Va o V^y, para generar anticuerpos o TCR usando procedimientos descritos en esta memoria. Se pueden construir colecciones de fragmentos de anticuerpo o TCR combinando colecciones de V^hy V^l, o Va y Vp, o Vy y V8 entre sí de cualquier número de maneras conocidas por el experto en la materia. Por ejemplo, cada biblioteca puede crearse en diferentes vectores y los vectores recombinarse in vitro o in vivo. Alternativamente, las colecciones pueden clonarse secuencialmente en el mismo vector o ensamblarse mediante PCR y a continuación clonarse. El ensamblaje por PCR también se puede usar para unir ADN de V^hy V^l, o Va y Vp, o V^yy VS con ADN que codifica un espaciador peptídico flexible para formar colecciones de Fv monocatenarios (scFv) como se describe en otra parte de esta memoria. En otra técnica más, se usa el ensamblaje por PCR en la célula para combinar genes de V^hy V^l, o Va y Vp, o V^yy VS en los linfocitos mediante PCR y a continuación clonar repertorios de genes enlazados.

MARCADO CON CÓDIGOS DE BARRAS DE CÉLULAS INDIVIDUALES

Para el marcado de células individuales con un código de barras del recipiente y un código de barras molecular, se pueden crear recipientes, tales como emulsiones de agua en aceite, de tal manera que los recipientes resultantes contienen 1 célula o menos por recipiente. Los recipientes se pueden crear de tal manera que los recipientes resultantes también contienen 1 código de barras del recipiente por recipiente. Los recipientes se pueden crear de tal manera que los recipientes resultantes también contienen 1 polinucleótido con código de barras molecular por recipiente. Los recipientes se pueden crear de tal manera que los recipientes resultantes también contienen dos o más, o una pluralidad de, polinucleótidos con código de barras molecular por recipiente. Las células/los recipientes se puede someter a un protocolo de marcado con código de barras único de ARN o ADN como se describe en esta memoria, y el código de barras del recipiente y uno o más códigos de barras moleculares de cada recipiente se pueden fusionar con una diana de interés, tal como un polinucleótido celular. En algunas realizaciones, los polinucleótidos con código de barras del recipiente coincidente se pueden fusionar a componentes celulares presentes en el mismo recipiente que el uno o más polinucleótidos con código de barras molecular. Después de la secuenciación, se puede usar la deconvolución del código de barras del recipiente y el código de barras molecular para identificar qué ARN (o ADN) procede de cada célula. En algunas realizaciones, se pueden crear recipientes, tales como emulsiones de agua en aceite, de tal manera que las emulsiones resultantes contienen 1 célula o más por emulsión. En algunas realizaciones, se pueden crear emulsiones de agua en aceite de tal manera que las emulsiones resultantes contienen 1 polinucleótido con código de barras del recipiente y dos o más polinucleótidos con código de barras molecular por recipiente. En algunas realizaciones, se pueden crear recipientes de tal manera que los recipientes resultantes contienen más de 1 polinucleótido con código de barras del recipiente y dos o más polinucleótidos con código de barras molecular por recipiente. En algunas realizaciones, se puede introducir un código de barras del recipiente y un código de barras molecular en los recipientes cuando están en solución. En algunas realizaciones, se puede introducir un código de barras del recipiente y un código de barras molecular en los recipientes cuando no están fijados a un soporte sólido, tal como una perla.

En algunos aspectos, se pueden aislar células individuales en el interior de una emulsión, que puede actuar como un compartimento. Las células se pueden lisar y las transcripciones de la célula se pueden marcar con códigos de barras. Cada una de las transcripciones se puede fusionar con un código de barras molecular o un código de barras del recipiente, de tal manera que, cuando se detectan dos o más transcripciones de ARN con el mismo código de barras de recipiente, se puede determinar que proceden de la misma célula de partida. Esto se puede aplicar a muchos tipos diferentes de secuencias. Una aplicación particular puede ser enlazar cadenas V^hy V^l, o Va y Vp, o Vy y VS de secuencias de anticuerpo y TCR.

Se pueden aislar una o más células individuales en una o más emulsiones, en presencia de un código de barras del recipiente y códigos de barras moleculares, de manera que una gota de la una o más emulsiones puede contener un máximo de 1 célula o menos. Las células se pueden lisar químicamente mediante un tampón contenido en una emulsión o mediante congelación-descongelación, liberando de ese modo el contenido de una célula en una emulsión.

Se puede realizar la transcripción inversa de los ARN de una única célula en ADNc. Se puede realizar una reacción de transcripción inversa con una transcriptasa inversa que posee actividad de transferasa terminal no matricial que añade aproximadamente 3 residuos de citosina como se describió anteriormente. Todos los tampones, enzimas y nucleótidos de la transcripción inversa pueden estar presentes cuando se forma una emulsión. En algunas realizaciones, se puede generalizar un cebador (tal como un polinucleótido que comprende una secuencia de poli dT) para que se dirige a todo el ARNm. En algunas realizaciones, se puede usar ADN. En algunas realizaciones, se pueden direccionar más de 2 ARN.

En algunas realizaciones, se puede enlazar un código de barras del recipiente a un ARN durante la transcripción inversa. En algunas realizaciones, se puede enlazar un código de barras molecular a un ARN durante la transcripción inversa. En algunas realizaciones, se puede enlazar un código de barras del recipiente y uno molecular a un ARN durante la transcripción inversa.

Se puede realizar una reacción de transcripción inversa en presencia de un polinucleótido de marcado en 3'. Un polinucleótido de marcado en 3' puede comprender un segmento P7 que se puede usar para hibridar un cebador de secuenciación. Un polinucleótido de marcado en 3' puede comprender un código de barras del recipiente o un código de barras molecular. Un polinucleótido de marcado en 3' puede comprender 3 residuos de riboguanina en un extremo 3' (rGrGrG) (bases de ARN) que pueden ser complementarios a, e hibridarse a, una cadena producida por una enzima de transcripción inversa. Por tanto, se puede añadir un código de barras del recipiente y un código de barras molecular a un extremo terminal de un ADNc en esta misma emulsión mediante enzimas de transcripción inversa. En algunas realizaciones, se pueden usar residuos de guanina en lugar de riboguanina (nucleótido de ADN, en lugar de nucleótido de ARN). Tras la hibridación de un polinucleótido de marcado en 3' a un CCC de una cadena de ADNc, una transcriptasa inversa continúa extendiendo un ADNc en un polinucleótido de marcado en 3', creando de ese modo un marcador de código de barras molecular para todos los ADNc en una reacción. T ras la hibridación de un polinucleótido de marcado en 3' a una región de un ADNc con código de barras molecular, una transcriptasa o polimerasa inversa continúa extendiendo un ADNc con código de barras molecular en otro polinucleótido de marcado en 3', creando de ese modo un marcador de código de barras del recipiente para todos los ADNc en una reacción. En algunas realizaciones, el cambio de matriz puede realizarse en una reacción independiente en lugar de realizarse al mismo tiempo que se puede realizar una reacción de transcripción inversa. Por ejemplo, se puede añadir un polinucleótido de marcado en 3' después de una reacción de transcripción inversa y se pueden usar enzimas, tales como una transcriptasa o polimerasa inversa, para extenderlo en un polinucleótido de marcado de una manera similar. Como un polinucleótido de marcado en 3' puede albergar un código de barras molecular degenerado exclusivo en cada molécula individual, cada ADNc se puede marcar exclusivamente con un código de barras molecular. Como un polinucleótido de marcado en 3' puede albergar un mismo código de barras del recipiente degenerado en cada molécula de un recipiente individual, cada ADNc se puede marcar con un código de barras del recipiente exclusivo del recipiente.

CLONACIÓN Y EXPRESIÓN DE MATERIAL GENÉTICO DE COLECCIONES DE CÉLULAS B

“Colección de expresión de anticuerpos” o “colección de expresión de TCR” o “colección de expresión”, como se emplea en esta memoria, puede referirse a una colección de moléculas (es decir, dos o más moléculas) a nivel de ácido nucleico o a nivel de proteína. Por tanto, este término puede referirse a una colección de vectores de expresión que codifican una pluralidad de moléculas de anticuerpo o TCR (es decir, a nivel de ácido nucleico) o puede referirse a una colección de moléculas de anticuerpo o TCR después de que se han expresado en un sistema de expresión apropiado (es decir, a nivel de proteína). Alternativamente, la colección de vectores de expresión/expresión puede estar contenida en células hospedadoras adecuadas en las que se puede expresar. Las moléculas de anticuerpo que están codificadas o expresadas en las colecciones de expresión de la invención pueden estar en cualquier formato apropiado, p. ej., pueden ser moléculas completas de anticuerpo o TCR o pueden ser fragmentos de anticuerpo o TCR, p. ej., anticuerpos monocatenarios (p. ej., anticuerpos scFv), anticuerpos Fv, anticuerpos Fab', fragmentos (Fab')2, diacuerpos, etc. El término “que codifica”, como en secuencia de ácido nucleico “que codifica” o una secuencia de ADN codificante de, o una secuencia de nucleótidos “que codifica”, una enzima particular, así como otros términos sinónimos, se refiere a una secuencia de ADN que se transcribe y traduce en una enzima cuando se coloca bajo el control de secuencias reguladoras apropiadas. Una “secuencia promotora” es una región reguladora de ADN capaz de unir ARN polimerasa en una célula e iniciar la transcripción de una secuencia codificante aguas abajo (dirección 3'). El promotor es parte de la secuencia de ADN. Esta región de la secuencia tiene un codón de iniciación en su extremo 3'. La secuencia promotora incluye el número mínimo de bases con elementos necesarios para iniciar la transcripción a niveles detectables por encima del nivel de fondo. Sin embargo, después de que la ARN polimerasa une la secuencia y se inicia la transcripción en el codón de iniciación (extremo 3' con un promotor), la transcripción continúa aguas abajo en la dirección 3'. Dentro de la secuencia promotora se encontrará un sitio de iniciación de la transcripción (convenientemente definido mediante cartografía con nucleasa S1), así como dominios de unión de proteínas (secuencias consenso) responsables de la unión de la ARN polimerasa.

Las moléculas de anticuerpo o TCR identificadas mediante, obtenidas de, seleccionadas de entre, u obtenibles de, las colecciones de expresión de anticuerpos o TCR de la invención forman otro aspecto adicional de la invención. De nuevo, estas moléculas de anticuerpo o TCR pueden ser proteínas o ácidos nucleicos que codifican moléculas de anticuerpo o TCR, cuyos ácidos nucleicos se pueden incorporar a su vez en un vector de expresión apropiado y/o contener en una célula hospedadora adecuada.

El grupo de ADNc se puede someter a una reacción PCR con polinucleótidos que se hibridan a una región constante de la cadena pesada de genes de anticuerpo y con polinucleótidos que se hibridan al extremo 5' de la región de cadena V^h, o Va o Vy, de genes de anticuerpo o TCR. El grupo de ADNc se puede someter a una reacción PCR con polinucleótidos que se hibridan a una región constante de la cadena pesada, o la cadena alfa o gama, de genes de anticuerpo o TCR y con polinucleótidos que se hibridan a la región 5' al extremo 5' de la región de cadena V^h, o Va o Vy, de un polinucleótido con código de barras que comprende una secuencia de anticuerpo o TCR. También se puede configurar una reacción PCR para la amplificación del grupo de cadenas V^l, o Vp o V8 , de, p. ej., las clases kappa y lambda. El grupo de ADNc se puede someter a una reacción PCR con polinucleótidos que se hibridan a una región constante de la cadena ligera de genes de anticuerpo y con polinucleótidos que se hibridan al extremo 5' de la región de cadena V^l, o Vp o VS, de genes de anticuerpo o TCR. El grupo de ADNc se puede someter a una reacción PCR con polinucleótidos que se hibridan a una región constante de la cadena ligera de genes de anticuerpo y con polinucleótidos que se hibridan a la región 5' al extremo 5' de la región de cadena V^l, o Vp o VS, de un polinucleótido con código de barras que comprende una secuencia de anticuerpo o TCR. Tales oligonucleótidos o cebadores se pueden diseñar en base a información conocida y disponible públicamente de base de datos de secuencias génicas de inmunoglobulinas o TCR.

En algunas realizaciones, se pueden obtener convenientemente secuencias de V^hy V^l, o Va y Vp, o Vy y VS de una colección de secuencias de V^hy V^l, o Va y Vp, o V^yy VS producidas mediante amplificación por PCR usando uno o más cebadores que no son específicos para los genes de las cadenas pesadas o ligeras y, en particular, para una o ambas regiones terminales de los polinucleótidos de V^hy V^l, o Va y Vp, o Vy y VS. En algunas realizaciones, se pueden obtener convenientemente secuencias de V^hy V^lde una colección de secuencias de V^hy V^l, o Va y Vp, o V^yy VS producidas mediante amplificación por PCR usando cebadores específicos para una región del polinucleótido con código de barras del recipiente. En algunas realizaciones, se pueden obtener convenientemente secuencias de V^hy V^lde una colección de secuencias de V^hy V^l, o Va y Vp, o Vy y VS producidas mediante amplificación por PCR usando cebadores específicos de la familia del gen C o cebadores específicos del gen C. En algunas realizaciones, se pueden obtener convenientemente secuencias de V^hy V^lde una colección de secuencias de V^hy V^l, o Va y Vp, o Vy y VS producidas mediante amplificación por PCR usando un conjunto de cebadores con un primer cebador específico para una región del polinucleótido con código de barras del recipiente y un segundo cebador o una pluralidad de segundos cebadores que son cebadores específicos de la familia del gen C o cebadores específicos del gen C. En algunas realizaciones, se pueden obtener convenientemente secuencias de V^hy V^l, o Va y Vp, o Vy y VS de una colección de secuencias de V^hy V^l, o Va y Vp, o V^yy VS producidas mediante amplificación por PCR usando un primer conjunto con un primer cebador específico para una región del polinucleótido con código de barras del recipiente y un segundo cebador específico para una secuencia universal.

En algunas realizaciones, tras la transcripción inversa, las secuencias de ADNc resultantes se pueden amplificar mediante PCR usando uno o más cebadores específicos para genes de inmunoglobulina y, en particular, para una o ambas regiones terminales de los polinucleótidos de V^hy V^l, o Va y Vp, o Vy y VS. En algunas realizaciones, se pueden obtener secuencias de V^hy V^lde una colección de secuencias de V^hy V^l, o Va y Vp, o V^yy VS producidas mediante amplificación por PCR usando cebadores específicos de la familia del gen V o cebadores específicos del gen V (Nicholls y col., J. Immunol. Meth., 1993, 165:81; WO93/12227) o se diseñan según procedimientos estándar conocidos en la técnica en base a la información disponible de las secuencias. (Las secuencias de V^hy V^l, o Va y Vp o Vy, y VS se pueden ligar, normalmente con una secuencia espaciadora intermedia (p. ej., que codifica un espaciador peptídico dentro del marco de lectura), formando un casete que codifica un anticuerpo monocatenario). Las secuencias de la región V se pueden clonar convenientemente como ADNc o productos de la amplificación por PCR para células individuales que expresan inmunoglobulinas. Las regiones V^hy V^l, o Va y Vp, o Vy y VS se secuencian, opcionalmente, en los procedimientos descritos en esta memoria y particularmente después de ciertas etapas como se indica (p. ej., después de la PCR unicelular; después de la presentación en la superficie de células de mamífero u otras, después del cribado mediante FACS y similares). La secuenciación se puede usar, entre otras razones, para verificar que el nivel de diversidad está a un nivel aceptable. La secuenciación puede incluir secuenciación de alto rendimiento, secuenciación masiva (en la que se secuencia el mismo gen a partir de una pluralidad de muestras individuales para identificar diferencias en las secuencias) o combinaciones de las dos.

En algunas realizaciones, no es necesario enlazar físicamente las combinaciones de V^hy V^l, o Va y Vp, o Vy y VS naturales usando los procedimientos descritos en esta memoria. En algunas realizaciones, los ADNc, los polinucleótidos con código de barras o los ADNc con código de barras amplificados por PCR no están enlazados físicamente. En algunas realizaciones, los ADNc, los polinucleótidos con código de barras o los ADNc con código de barras amplificados por PCR no están enlazados físicamente en la misma reacción o el mismo recipiente.

En algunas realizaciones, las combinaciones de V^hy V^l, o Va y Vp, o V^yy VS naturales están enlazadas físicamente, usando, además de los cebadores de ADNc, un cebador o una pluralidad de cebadores para el extremo 5' del gen de V^h, o Va o V^y, y otro cebador u otra pluralidad de cebadores para el extremo 5' del gen de V^l, o Vp o VS. Estos cebadores también contienen colas complementarias de secuencia adicionales, para permitir el autoensamblaje de los genes de V^hy V^l, o Va y Vp, o V^yy VS. Después de la amplificación por PCR y el enlace, la posibilidad de obtener productos mixtos, en otras palabras, regiones variables mixtas, es mínima porque las reacciones de amplificación y enlace se realizaron dentro de cada célula. El riesgo de mezcla se puede reducir adicionalmente utilizando reactivos voluminosos, tales como nucleótidos marcados con digoxigenina, para garantizar además que los pares de ADNc de la región V no abandonen el compartimento celular y se entremezclen, sino que permanezcan dentro de la célula para la amplificación por PCR y el enlace. Las secuencias amplificadas se enlazan mediante la hibridación de secuencias terminales complementarias. Después del enlace, las secuencias se pueden recuperar de las células para su uso en etapas posteriores del procedimiento descritas en esta memoria. Por ejemplo, el ADN recuperado puede amplificarse por PCR usando cebadores terminales, si es necesario, y clonarse en vectores que pueden ser plásmidos, fagos, cósmidos, fagémidos, vectores víricos o combinaciones de los mismos como se detalla más adelante. Se pueden incorporar sitios de enzimas de restricción convenientes en las secuencias hibridadas para facilitar la clonación. Estos vectores también se pueden guardar como una colección de regiones variables enlazadas para su uso posterior.

En algunas realizaciones en las que se desea proporcionar combinaciones adicionales de VH y VL, o Va y Vp, o Vy y VS se elige un sistema de expresión para facilitarlo. Por ejemplo, los sistemas de expresión de bacteriófagos permiten la recombinación aleatoria de secuencias de cadena pesada y ligera. Los expertos en la materia conocen otros sistemas de expresión adecuados.

Cabe señalar que, en el caso de las secuencias de V^hy V^l, o Va y Vp, o V^yy VS no obtenidas de seres humanos, en algunas realizaciones, puede ser preferible quimerizar estas secuencias con un Fc completamente humano. Como se emplea en esta memoria, “quimerizado/a” se refiere a una inmunoglobulina o un TCR, donde las regiones variables de las cadenas pesadas y ligeras, o las regiones Va y Vp, o Vy y V8 no son de origen humano y donde las regiones constantes de las cadenas pesadas y ligeras, o las cadenas Va y Vp, o Vy y VS son de origen humano. Esto se realiza amplificando y clonando los dominios variables en un Fc humano. El Fc humano puede ser parte del vector, o de una molécula independiente, y también se podría usar una colección de Fc. En una realización preferida, las moléculas quimerizadas que se han hecho crecer en células de mamífero, tales como células CHO, se criban con FACS dos veces para enriquecer la población celular en células que expresan el anticuerpo de interés. Los anticuerpos o TCR quimerizados se caracterizan mediante secuenciación seguida de caracterización funcional o mediante caracterización funcional directa o cinética. El crecimiento, el cribado y la caracterización se describen detalladamente a continuación.

Es importante tener en cuenta que las reacciones PCR descritas anteriormente se describen para clonar los anticuerpos en forma de IgG. Estos son preferidos porque que generalmente están asociados a una respuesta inmunitaria más madura y generalmente presentan mayor afinidad que los anticuerpos de IgM, haciéndolos de ese modo más deseables para ciertas aplicaciones terapéuticas y de diagnóstico. Evidentemente, sin embargo, se pueden diseñar polinucleótidos que permiten la clonación de una o más de las otras formas de las moléculas de inmunoglobulina, p. ej., IgM, IgA, IgE e IgD, si se desea o procede.

Una vez que se ha identificado un anticuerpo o un TCR y se ha aislado la población apropiada de dichas células en un momento apropiado y opcionalmente se ha enriquecido como se describió anteriormente, las bibliotecas de expresión de anticuerpos o TCR no necesitan generarse inmediatamente, siempre que el material genético contenido en las células pueda mantenerse intacto, permitiendo de ese modo que la colección se genere en una fecha posterior. Por tanto, por ejemplo, las células, un lisado celular o un ácido nucleico, p. ej., ARN o ADN obtenido a partir del mismo, se pueden almacenar hasta una fecha posterior mediante procedimientos apropiados, p. ej., mediante congelación, y generar las colecciones de expresión en una fecha posterior, cuando se desee.

Una vez que se ha generado la colección de vectores de expresión, las moléculas de anticuerpo codificadas pueden expresarse a continuación en un sistema de expresión apropiado y cribarse usando técnicas apropiadas que son muy conocidas y están documentadas en la técnica. Por tanto, el procedimiento de la invención definido anteriormente puede comprender las etapas adicionales de expresar la colección de vectores de expresión en un sistema de expresión apropiado y cribar la colección expresada para seleccionar anticuerpos con las propiedades deseadas, como se explica con más detalle más adelante.

Como se indica en esta memoria, los polinucleótidos preparados mediante los procedimientos de la descripción que comprenden un polinucleótido que codifica secuencias de anticuerpo o TCR pueden incluir, pero no se limitan a, aquellos que codifican la secuencia aminoacídica de un fragmento de anticuerpo o TCR, por sí misma, la secuencia no codificante para el anticuerpo o TCR completo o una porción del mismo, la secuencia codificante para un anticuerpo o TCR, un fragmento o una porción, así como secuencias adicionales, tales como la secuencia codificante de al menos un péptido líder o de fusión señal, con o sin las secuencias codificantes adicionales antes mencionadas, tales como al menos un intrón, junto con secuencias no codificantes adicionales, que incluyen, pero no se limitan a, secuencias 5' y 3' no codificantes, tales como las secuencias transcritas y no traducidas que desempeñan una función en la transcripción, el procesamiento de ARNm, lo que incluye señales de empalme y poliadenilación (por ejemplo, unión de ribosomas y estabilidad del ARNm); una secuencia codificante adicional que codifica aminoácidos adicionales, tales como los que proporcionan funcionalidades adicionales. Por tanto, la secuencia que codifica un anticuerpo se puede fusionar a una secuencia de marcador, tal como una secuencia que codifica un péptido que facilita la purificación del anticuerpo o TCR fusionado que comprende un fragmento o una porción de anticuerpo o TCR.

Los productos primarios de la PCR se pueden someter opcionalmente a continuación a una reacción PCR secundaria con nuevos conjuntos de polinucleótidos que se hibridan a los extremos 5' y 3' de los dominios variables de anticuerpo o TCR V^h, V^lkappa y V^llambda, o Va y Vp, o V^yy VS (según proceda en función de si la reacción PCR primaria con la que se usan los nuevos conjuntos de polinucleótidos se diseñó para amplificar porciones de los genes de cadena pesada o ligera de anticuerpo, o los genes de Va o Vp de TCR, o los genes de Vy o VS de TCR). Estos polinucleótidos incluyen ventajosamente secuencias de ADN específicas para un conjunto definido de enzimas de restricción (es decir, sitios de enzimas de restricción) para la clonación posterior. Las enzimas de restricción seleccionadas se deben seleccionar para que no corten dentro de los segmentos génicos V del anticuerpo o TCR humano. Tales polinucleótidos se pueden diseñar en base a la información conocida y disponible públicamente de base de datos de secuencias génicas de inmunoglobulinas o TCR y enzimas de restricción. Sin embargo, los sitios de enzimas de restricción preferidos que se deben incluir son Ncol, Hind III, Mlul y Notl. Los productos de tales reacciones PCR secundarias son repertorios de diversos fragmentos/dominios de V-pesadas, V-ligeras kappa y V-ligeras lambda de anticuerpo. Por lo tanto, este tipo de reacción PCR secundaria generalmente se lleva a cabo generalmente cuando el formato de la colección de expresión de interés es un formato de scFv o Fv, donde solo están presentes los dominios de un anticuerpo o de TCR V^hy V^l, o Va y Vp, o Vy y VS.

Los productos de la PCR también pueden someterse a una reacción PCR con nuevos conjuntos de cebadores que se hibridan a los extremos 5' y 3' de los polinucleótidos con código de barras. Estos polinucleótidos pueden incluir ventajosamente secuencias de ADN específicas para un conjunto definido de enzimas de restricción (es decir, sitios de enzimas de restricción) para la clonación posterior. Las enzimas de restricción seleccionadas se deben seleccionar para que no corten dentro de los segmentos génicos V del anticuerpo o TCR humano. Tales polinucleótidos se pueden diseñar en base a la información conocida y disponible públicamente de base de datos de secuencias génicas de inmunoglobulinas o TCR y enzimas de restricción. Sin embargo, los sitios de enzimas de restricción preferidos que se deben incluir son NcoI, Hind III, MIuI y NotI. Los productos de tales reacciones PCR secundarias son repertorios de diversos fragmentos/dominios de V^h, V^lkappa y V^llambda de anticuerpo o fragmentos/dominios de Va y Vp, o V^yy V5, de TCR.

Un experto en la técnica reconocerá que también se pueden usar fragmentos Fv o Fab de cadenas pesadas o ligeras, o cadenas Va o Vp, o cadenas Vy o V8 , o anticuerpos o TCR monocatenarios con este sistema. Se puede someter a mutagénesis una cadena pesada o ligera, o una cadena Va o Vp, o una cadena Vy o V8 , seguida de la adición de la cadena complementaria a la solución. A continuación, se permite que las dos cadenas se combinen y formen un fragmento de anticuerpo funcional. La adición de secuencias de cadena ligera o pesada, o cadena Va o Vp, o cadena Vy o VS no específicas aleatorias permite la producción de un sistema combinatorio para generar una colección de miembros distintos.

Las colecciones de tales repertorios de fragmentos clonados que comprenden regiones variables de cadena pesada, o cadena Va o cadena Vy, o fragmentos de las mismas y/o regiones variables de cadena ligera, o cadena Vp o cadena VS, o fragmentos de las mismas, de genes de anticuerpos o TCR obtenidos a partir de los linfocitos B o T de hospedadores inmunodeprimidos, como se definen en esta memoria, forman aspectos adicionales de la invención. Estas colecciones que comprenden regiones variables clonadas se pueden insertar opcionalmente en vectores de expresión para formar colecciones de expresión.

En algunas realizaciones, las reacciones PCR se pueden configurar para conservar todas o parte de las regiones constantes de las diversas cadenas de anticuerpo o TCR contenidas en la población de células inmunitarias aislada. Esto es deseable cuando el formato de la colección de expresión es un formato de Fab, donde el componente de cadena pesada, o alfa o gamma, comprende dominios V^h, o Va o Vy, y C^h, o Ca o Cy, y el componente de cadena ligera, o cadena Vp o cadena VS, comprende dominios V^l, o Vp o VS, y C^l, o Cp o CS. De nuevo, las colecciones de tales fragmentos clonados que comprenden todas o parte de las regiones constantes de las cadenas de anticuerpo o TCR forman aspectos adicionales de la invención.

Estos ácidos nucleicos pueden comprender convenientemente secuencias, además de un polinucleótido de la presente invención. Por ejemplo, se puede insertar un sitio de clonación múltiple que comprende uno o más sitios de restricción de endonucleasas en el ácido nucleico para ayudar al aislamiento del polinucleótido. Asimismo, se pueden insertar secuencias traducibles para ayudar al aislamiento del polinucleótido traducido de la presente invención. Por ejemplo, una secuencia de marcador de hexahistidina proporciona un medio conveniente para purificar las proteínas de la presente invención. El ácido nucleico de la presente invención, excluyendo la secuencia codificante, es opcionalmente un vector, adaptador o enlazador para la clonación y/o expresión de un polinucleótido de la presente invención.

Se pueden añadir secuencias adicionales a tales secuencias de clonación y/o expresión para optimizar su función en la clonación y/o expresión, para ayudar al aislamiento del polinucleótido o para mejorar la introducción del polinucleótido en una célula. El uso de vectores de clonación, vectores de expresión, adaptadores y enlazadores es muy conocido en la técnica. (véase, p. ej., Ausubel, arriba; o Sambrook, arriba).

Las colecciones descritas en esta memoria se pueden usar en un abanico de aplicaciones. Como se emplea en esta memoria, una colección comprende una pluralidad de moléculas. En algunas realizaciones, una colección comprende una pluralidad de polinucleótidos. En algunas realizaciones, una colección comprende una pluralidad de cebadores. En algunas realizaciones, una colección comprende una pluralidad de lecturas de secuencia de uno o más polinucleótidos, amplicones o conjuntos de amplicones. Una colección se puede almacenar y usar múltiples veces para generar muestras para el análisis. Algunas aplicaciones incluyen, por ejemplo, genotipificación de polimorfismos, estudio del procesamiento de ARN y selección de representantes clonales para realizar la secuenciación según los procedimientos proporcionados en esta memoria. Se pueden generar colecciones que comprenden una pluralidad de polinucleótidos, tales como cebadores, o colecciones para la secuenciación o amplificación, donde una pluralidad de polinucleótidos comprende al menos aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, l l , 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, 19000, 20000, 30000, 40000, 50 000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900 000, 1000000, 50000000, 100000000 o más códigos de barras moleculares o códigos de barras del recipiente. En algunas realizaciones, las colecciones de polinucleótidos comprenden una pluralidad de al menos aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13 000, 14000, 15000, 16000, 17000, 18000, 19000, 20000, 30000, 40000, 50000, 60000, 70000, 80000, 90 000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 50000000, 100 000 000 o más polinucleótidos exclusivos, donde cada polinucleótido exclusivo comprende uno o más códigos de barras moleculares o códigos de barras del recipiente.

CÓDIGOS DE BARRAS

Un código de barras puede ser un código de barras molecular o un código de barras del recipiente. En algunas realizaciones, un código de barras, tal como un código de barras molecular o un código de barras del recipiente, puede tener una longitud en un intervalo de 2 a 36 nucleótidos, 4 a 36 nucleótidos, o de 6 a 30 nucleótidos, o de 8 a 20 nucleótidos, 2 a 20 nucleótidos, 4 a 20 nucleótidos, o de 6 a 20 nucleótidos. En ciertos aspectos, las temperaturas de fusión de los códigos de barras de un conjunto están a 10 °C entre sí, a 5 °C entre sí o a 2 °C entre sí. En ciertos aspectos, las temperaturas de fusión de los códigos de barras de un conjunto no están a 10 °C entre sí, a 5 °C entre sí o a 2 °C entre sí. En otros aspectos, los códigos de barras son miembros de un conjunto de hibridación cruzada mínima. Por ejemplo, la secuencia de nucleótidos de cada miembro de tal conjunto puede ser suficientemente diferente de la de todos los demás miembros del conjunto de manera que ningún miembro puede formar un dúplex estable con el complemento de cualquier otro miembro en condiciones de hibridación estrictas. En algunas realizaciones, la secuencia de nucleótidos de cada miembro de un conjunto de hibridación cruzada mínima difiere de las de todos los demás miembros en al menos dos nucleótidos. Las tecnologías de marcado con códigos de barras se describen en Winzeler y col. (1999) Science 285:901; Brenner (2000) Genome Biol.1:1 Kumar y col. (2001) Nature Rev. 2:302; Giaever y col. (2004) Proc. Natl. Acad. Sci. USA 101:793; Eason y col. (2004) Proc. Natl. Acad. Sci. USA 101:11046 y Brenner (2004) Genome Biol. 5:240.

Como se emplea en esta memoria, un código de barras molecular comprende información que es exclusiva de una única molécula de una única célula o de un único recipiente, o de dos o más moléculas de una pluralidad o colección de moléculas de dos o más células individuales o de dos o más recipientes individuales. Como se emplea en esta memoria, un código de barras del recipiente comprende información que es exclusiva de los polinucleótidos de una única célula o de un único recipiente, en comparación con polinucleótidos de una célula individual diferente o de un recipiente individual diferente. En algunas realizaciones, la información exclusiva comprende una secuencia de nucleótidos exclusiva. Por ejemplo, la secuencia del código de barras molecular o un código de barras del recipiente se puede determinar determinando la identidad y el orden de la secuencia de nucleótidos exclusiva o aleatoria que comprende el código de barras molecular o un código de barras del recipiente. En algunas realizaciones, la información exclusiva no se puede usar para identificar la secuencia de un polinucleótido diana. Por ejemplo, se puede fijar un código de barras molecular a un polinucleótido diana, pero el código de barras molecular no se puede usar para determinar el polinucleótido diana al que está fijado. En algunas realizaciones, la información exclusiva no es una secuencia conocida vinculada a la identidad de la secuencia de un polinucleótido diana. Por ejemplo, se puede fijar el código de barras del recipiente a uno o más polinucleótidos diana, pero el código de barras del recipiente no se puede usar para determinar a cuál del uno o más polinucleótidos diana está fijado. En algunas realizaciones, la información exclusiva comprende una secuencia de nucleótidos aleatoria. En algunas realizaciones, la información exclusiva comprende una o más secuencias de nucleótidos exclusivas en un polinucleótido. En algunas realizaciones, la información exclusiva comprende una secuencia de nucleótidos degenerada o un código de barras degenerado. Un código de barras degenerado puede comprender una composición o secuencia de base nucleotídicas variable. Por ejemplo, un código de barras degenerado puede ser una secuencia aleatoria. En algunas realizaciones, una secuencia de complemento de un código de barras molecular o un código de barras del recipiente también es una secuencia de un código de barras molecular o un código de barras del recipiente.

Un código de barras molecular o un código de barras del recipiente puede comprender cualquier longitud de nucleótidos. Por ejemplo, un código de barras molecular o un código de barras del recipiente puede comprender al menos aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos. Por ejemplo, un código de barras molecular o un código de barras del recipiente puede comprender como máximo aproximadamente 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos. En algunas realizaciones, un código de barras molecular o un código de barras del recipiente tiene una longitud de nucleótidos particular. Por ejemplo, un código de barras molecular o un código de barras del recipiente puede tener aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos de longitud.

En algunas realizaciones, cada código de barras molecular o un código de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente tiene al menos aproximadamente 2 nucleótidos. Por ejemplo, cada código de barras molecular o un código de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente puede tener aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos de longitud. En algunas realizaciones, cada código de barras molecular o un código de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente tiene como máximo aproximadamente 1000 nucleótidos. Por ejemplo, cada código de barras molecular o un código de barras del recipiente puede comprender como máximo aproximadamente 5, 6 , 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos. En algunas realizaciones, cada código de barras molecular o un código de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente tiene la misma longitud de nucleótidos. Por ejemplo, cada código de barras molecular o un código de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente puede tener 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos de longitud. En algunas realizaciones, uno o más códigos de barras moleculares o códigos de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente tienen una longitud de nucleótidos diferente. Por ejemplo, uno o más primeros códigos de barras moleculares o códigos de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras del recipiente pueden tener aproximadamente, o al menos aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos y uno o más segundos códigos de barras moleculares o códigos de barras del recipiente de una pluralidad de códigos de barras moleculares o códigos de barras de recipientes pueden tener aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500 o 1000 nucleótidos, donde el número de nucleótidos del uno o más primeros códigos de barras moleculares o códigos de barras del recipiente es diferente del uno o más segundos códigos de barras moleculares o códigos de barras del recipiente.

El número de códigos de barras moleculares puede estar en exceso con respecto al número total de moléculas que se van a marcar en una pluralidad de recipientes. El número de códigos de barras del recipiente puede estar en exceso con respecto al número total de moléculas que se van a marcar en una pluralidad de recipientes. Por ejemplo, el número de códigos de barras moleculares o códigos de barras del recipiente puede ser al menos aproximadamente 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, o 100 veces mayor que el número total de moléculas que se van a marcar en una pluralidad de recipientes.

El número de códigos de barras moleculares diferentes puede estar en exceso con respecto al número total de moléculas que se van a marcar en una pluralidad de recipientes. En algunas realizaciones, el número de códigos de barras moleculares diferentes es al menos aproximadamente 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 6 ; 7; 8 ; 9; 10; 15; 20; 30; 40; 50; 60; 70; 80; 90 o 100 veces mayor que número total de moléculas que se van a marcar en una pluralidad de recipientes.

El número de códigos de barras moleculares diferentes en un recipiente individual puede estar en exceso con respecto al número de moléculas diferentes que se van a marcar en el recipiente individual. En algunas realizaciones, el número de códigos de barras moleculares diferentes en un recipiente individual es al menos aproximadamente 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 6 ; 7; 8 ; 9; 10; 15; 20; 30; 40; 50; 60; 70; 80; 90 o 100 veces mayor que el número total de moléculas diferentes que se van a marcar en el recipiente individual.

El número de códigos de barras del recipiente diferentes puede ser inferior al número total de moléculas que se van a marcar en una pluralidad de recipientes. En algunas realizaciones, el número de códigos de barras del recipiente diferentes es al menos aproximadamente 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 6 ; 7; 8 ; 9; 10; 15; 20; 30; 40; 50; 60; 70; 80; 90 o 100 veces inferior al número total de moléculas que se van a marcar en una pluralidad de recipientes.

El número de moléculas de producto amplificado a partir de una molécula de polinucleótido con código de barras del recipiente en un recipiente individual puede estar en exceso con respecto al número de moléculas diferentes que se van a marcar en el recipiente individual. En algunas realizaciones, el número de moléculas de producto amplificado a partir de una molécula de polinucleótido con código de barras del recipiente en un recipiente individual es al menos aproximadamente 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 6 ; 7; 8 ; 9; 10; 15; 20; 30; 40; 50; 60; 70; 80; 90 o 100 veces mayor que el número de moléculas diferentes que se van a marcar en el recipiente individual.

El número de moléculas de polinucleótido con código de barras del recipiente en un recipiente individual puede ser inferior al número de moléculas diferentes que se van a marcar en el recipiente individual. En algunas realizaciones, el número de moléculas con código de barras del recipiente en un recipiente individual es al menos aproximadamente 1; 1,5; 2; 2,5; 3; 3,5; 4; 4,5; 5; 6 ; 7; 8 ; 9; 10; 15; 20; 30; 40; 50; 60; 70; 80; 90 o 100 veces inferior al número de moléculas diferentes que se van a marcar en el recipiente individual.

El número de moléculas de polinucleótido con código de barras del recipiente en un recipiente individual puede ser una molécula. El número de moléculas de polinucleótido con código de barras del recipiente no amplificado en un recipiente individual puede ser una molécula.

En algunas realizaciones, al menos aproximadamente 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras moleculares diferentes tienen la misma concentración. En algunas realizaciones, al menos aproximadamente 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras del recipiente diferentes tienen la misma concentración.

En algunas realizaciones, al menos aproximadamente 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %,

20 %, 25 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 %

de los códigos de barras moleculares diferentes tienen una concentración diferente. En algunas realizaciones, al menos aproximadamente 1 %, 2 %, 3 %, 4 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 25 %, 30 %, 35 %, 40 %,

45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 97 % o 100 % de los códigos de barras del recipiente diferentes tienen una concentración diferente.

Los códigos de barras moleculares o códigos de barras del recipiente de una población de códigos de barras moleculares o códigos de barras del recipiente pueden tener al menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80,

90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más secuencias diferentes. Por ejemplo, los códigos de barras moleculares o códigos de barras del recipiente de una población pueden tener al menos 2000, 3000, 4000, 5000,

6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000, 45000, 50000, 60000, 70000, 80

000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000 o más secuencias diferentes. Por tanto, se puede usar una pluralidad de códigos de barras moleculares o códigos de barras del recipiente para generar al menos 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600,

700, 800, 900, 1000 o más secuencias diferentes de uno o más polinucleótidos, tales como polinucleótidos diana. Por ejemplo, se puede usar una pluralidad de códigos de barras moleculares o códigos de barras del recipiente para generar al menos 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000,

40 000, 45000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700

000, 800000, 900000, 1 x 106, 2 x 106, 3 x 106, 4 x 106, 5 x 106, 6 x 106, 7 x 106, 8 x 106, 9 x 106, 9 x 107, 2 x 107, 3 x

107, 4 x 1075 x 107, 6 x 107, 7 x 107, 8 x 107, 9 x 107, 1 x 108, 2 x 108, 3 x 108, 4 x 108, 5 x 108, 6 x 108, 7 x 108, 8 x 108,

9 x 108, 1 x 109, 2 x 109, 3 x 109, 4 x 109, 5 x 109, 6 x 109, 7 x 109, 8 x 109, 9 x 109, 1 x 101°, 2 x 101°, 3 x 101°, 4 x 101°,

5 x 101°, 6 x 101°, 7 x 101°, 8 x 101°, 9 x 101°, 1 x 1011, 2 x 1011, 3 x 1011, 4 x 1011, 5 x 1011, 6 x 1011, 7 x 1011, 8 x 1011,

9 x 1011, 1 x 1012, 2 x 1012, 3 x 1012, 4 x 1012, 5 x 1012, 6 x 1012, 7 x 1012, 8 x 1012, 9 x 1012 o más secuencias diferentes de uno o más polinucleótidos, tal como polinucleótidos diana. Por ejemplo, se puede usar una pluralidad de códigos de barras moleculares o códigos de barras de recipientes para generar al menos aproximadamente 10, 15, 20, 25, 30,

35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300. , 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000,

7000, 8000, 9000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000 , 70.000, 80.000, 90.000, 100.000, 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000, 900.000, 1x106, 2x106, 3x106, 4x106, 5x106, 6x106, 7x106, 8x106, 9x106, 1x106, 2x107, 3x107, 4x107, 5x107, 6x107, 7x107, 8x107, 9x107, 1x108, 2x108, 3x108, 4x108, 5x108, 6x108, 7x108, 8x108, 9x108, 1x109, 2x109, 3x109, 4x109, 5x109, 6x109, 7x109, 8x109, 9x109, 1x101°, 2x101°, 3x101°, 4x101°, 5x101°, 6x101°, 7x101°, 8x101°, 9x101°, 1x1011, 2x1011, 3x1011, 4x1011, 5x1011, 6x1011, 7x10 8x1011, 9x1011 1xx1012, 2x1012, 3x1012, 4x1012, 5x1012, 6x1012, 7x1012, 8x1012, 9x1012 o más secuencias diferentes de al menos aproximadamente 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800,

900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 15000, 20000, 25000, 30000, 35000, 40000,

45 000, 50000, 60000, 70000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800

000, 900000, 1 x 106, 2 x 106, 3 x 106, 4 x 106, 5 x 106, 6 x 106, 7 x 106, 8 x 106, 9 x 106, 1 x 107, 2 x 107, 3 x 107, 4 x

107, 5 x 107, 6 x 107, 7 x 107, 8 x 107, 9 x 107, 1 x 108, 2 x 108, 3 x 108, 4 x 108, 5 x 108, 6 x 108, 7 x 108, 8 x 108, 9 x

108, 1 x 109, 2 x 109, 3 x 109, 4 x 109, 5 x 109, 6 x 109, 7 x 109, 8 x 109, 9 x 109, 1 x 101°, 2 x 101°, 3 x 101°, 4 x 101°, 5 x

101°, 6 x 101°, 7 x 101°, 8 x 101°, 9 x 101°, 1 x 1011, 2 x 1011, 3 x 1011, 4 x 1011, 5 x 1011, 6 x 1011, 7 x 1011, 8 x 1011, 9 x

1011, 1 x 1012, 2 x 1012, 3 x 1012, 4 x 1012, 5 x 1012, 6 x 1012, 7 x 1012, 8 x 1012, 9 x 1012 o más polinucleótidos diana.

En algunas realizaciones, se usan uno o más códigos de barras moleculares para la agrupación o “binning” de secuencias. En algunas realizaciones, se usan uno o más códigos de barras moleculares para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” contienen el mismo código de barras molecular. En algunas realizaciones, se usan uno o más códigos de barras moleculares para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” contienen un conjunto de amplicones. En algunas realizaciones, se san uno o más códigos de barras moleculares para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” comprenden una pluralidad de secuencias donde los polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se obtuvieron de la misma molécula de polinucleótido en una reacción de amplificación.

En algunas realizaciones, se usan uno o más códigos de barras del recipiente para la agrupación o “binning” de secuencias. En algunas realizaciones, se usan uno o más códigos de barras del recipiente para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” contienen el mismo código de barras del recipiente. En algunas realizaciones, se usan uno o más códigos de barras del recipiente para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” contienen uno o más conjunto de amplicones. En algunas realizaciones, se usan uno o más códigos de barras del recipiente para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” comprenden una pluralidad de secuencias donde los polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se obtuvieron de los polinucleótidos de un único recipiente o una única célula.

En algunas realizaciones, se usan uno o más códigos de barras moleculares para la agrupación o “binning” de secuencias. En algunas realizaciones, se usan uno o más códigos de barras moleculares y códigos de barras del recipiente para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” contienen el mismo código de barras molecular y el mismo código de barras del recipiente. En algunas realizaciones, se usan uno o más códigos de barras moleculares y códigos de barras del recipiente para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” contienen uno o más conjunto de amplicones. En algunas realizaciones, se san uno o más

códigos de barras moleculares y códigos de barras del recipiente para la agrupación o “binning” de secuencias, donde las secuencias de cada “bin” comprenden una pluralidad de secuencias donde los polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se obtuvieron de los mismos polinucleótidos en una reacción de amplificación y de la misma célula o el mismo recipiente individuales. En algunas realizaciones, no se usan uno o más códigos de barras moleculares y códigos de barras del recipiente para alinear secuencias.

En algunas realizaciones, no se usan uno o más códigos de barras moleculares para la alineación de secuencias. En algunas realizaciones, se usan uno o más códigos de barras moleculares para la alineación de secuencias. En algunas realizaciones, se usan uno o más códigos de barras moleculares para la agrupación o “binning” de secuencias, y se usa una región específica de la diana para la alineación de secuencias. En algunas realizaciones, no se usan uno o más códigos de barras del recipiente para la alineación de secuencias. En algunas realizaciones, se usan uno o más códigos de barras del recipiente para la alineación de secuencias. En algunas realizaciones, se usan uno o más códigos de barras del recipiente para la agrupación o “binning” de secuencias, y se usa una región específica de la diana para la alineación de secuencias. En algunas realizaciones, se usan uno o más códigos de barras moleculares y códigos de barras del recipiente para la alineación de secuencias. En algunas realizaciones, se usan uno o más códigos de barras moleculares y códigos de barras del recipiente para la agrupación o “binning” de secuencias, y se usa una región específica de la diana para la alineación de secuencias.

En algunas realizaciones, las secuencias alineadas contienen el mismo código de barras molecular. En algunas realizaciones, las secuencias alineadas contienen el mismo código de barras del recipiente. En algunas realizaciones, las secuencias alineadas contienen el mismo código de barras molecular y el mismo código de barras del recipiente. En algunas realizaciones, se usan uno o más códigos de barras moleculares o códigos de barras del recipiente para la alineación de secuencias, donde las secuencias alineadas comprenden dos o más secuencias de un conjunto de amplicones. En algunas realizaciones, se san uno o más códigos de barras moleculares o códigos de barras del recipiente para la alineación de secuencias, donde las secuencias alineadas comprenden una pluralidad de secuencias donde los polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se obtuvieron de la misma molécula de polinucleótido en una reacción de amplificación. En algunas realizaciones, se usan uno o más códigos de barras moleculares y códigos de barras del recipiente para la alineación de secuencias, donde las secuencias alineadas comprenden una pluralidad de secuencias donde los polinucleótidos a partir de los cuales se generó la pluralidad de secuencias se obtuvieron de una única célula o un único recipiente.

GENERACIÓN DE GOTAS

La división de una muestra de una pluralidad de células en pequeños volúmenes de reacción, acoplada al marcado con códigos de barras moleculares y del recipiente de polinucleótidos de, u obtenidos de, una célula individual de la pluralidad de células puede permitir la secuenciación de alto rendimiento de un repertorio de secuencias, tales como secuencias de biomarcadores.

La división de una muestra de una pluralidad de células en pequeños volúmenes de reacción, acoplada al marcado con códigos de barras moleculares y del recipiente de polinucleótidos de, u obtenidos de, una célula individual de la pluralidad de células puede permitir la secuenciación de alto rendimiento de un repertorio de secuencias, tales como las secuencias que representan un porcentaje del transcriptoma de un organismo. Por ejemplo, un repertorio de secuencias puede comprender una pluralidad de secuencias que representan al menos aproximadamente 0,00001 %, 0,00005 %, 0,00010 %, 0,00050 %, 0,001 %, 0,005 %, 0,01 %, 0,05 %, 0,1 %, 0,5 %, 1 %, 2 %, 2,5 %, 3 %, 3,5 %, 4 %, 4,5 %, 5 %, 6 %, 7 %, 8 %, 9 %, 10 %, 15 %, 20 %, 30 %, 35 %, 40 %, 45 %, 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % o 100 % del transcriptoma de un organismo.

La división de una muestra de células inmunitarias en pequeños volúmenes de reacción, acoplada al marcado con códigos de barras moleculares y del recipiente de polinucleótidos de, u obtenidos de, una célula inmunitaria individual de la pluralidad de células puede permitir la secuenciación de alto rendimiento de un repertorio de secuencias de cadena pesada y cadena ligera. Estos procedimientos también pueden permitir el apareamiento de las cadenas pesadas y ligeras después de la secuenciación en base a las secuencias con código de barras. La división de una muestra en pequeños volúmenes de reacción como se describe en esta memoria también puede permitir el uso de cantidades reducidas de reactivos, reduciendo de ese modo el coste de materiales del análisis.

En algunos casos, la reacción de transcripción inversa y/o la reacción de amplificación (p. ej., PCR) se lleva a cabo en gotas, tal como en la PCR digital de gotas. En ciertos aspectos, la invención proporciona compartimentos fluídicos para contener toda o una porción de un material diana. En algunas realizaciones, un compartimento es una gota. Aunque se hace referencia a “gotas” en toda la memoria descriptiva, ese término se usa de forma equivalente a compartimento de fluidos y partición de fluidos a menos que se indique de otro modo. Excepto donde se indique de otro modo, “gota” se usa por conveniencia y se puede usar cualquier partición o compartimento de fluidos. Las gotas usadas en esta memoria pueden incluir composiciones de emulsión (o mezclas de dos o más fluidos inmiscibles), como se describe en la patente de los Estados Unidos n.° 7622280. Las gotas pueden ser generadas por dispositivos descritos en el documento WO/2010/036352. El término emulsión, como se emplea en esta memoria, se puede referir a una mezcla de líquidos inmiscibles (tales como aceite y agua). Las emulsiones en fase oleosa y/o de agua en aceite permiten la compartimentalización de mezclas de reacción en gotas acuosas. Las emulsiones pueden comprender gotas acuosas en una fase oleosa continua. Las emulsiones proporcionadas en esta memoria pueden ser emulsiones de aceite en agua, donde las gotas son gotas de aceite en una fase continua acuosa. Las gotas proporcionadas en esta memoria están diseñadas para impedir la mezcla entre compartimentos, protegiendo cada compartimento su contenido de la evaporación y coalescencia con el contenido de otros compartimentos.

Las mezclas o emulsiones descritas en esta memoria pueden ser estables o inestables. Las emulsiones pueden ser relativamente estables y tener una coalescencia mínima. La coalescencia se produce cuando se combinan gotas pequeñas para formar progresivamente gotas más grandes. En algunos casos, menos de 0,00001 %, 0,00005 %, 0,00010 %, 0,00050 %, 0,001 %, 0,005 %, 0,01 %, 0,05 %, 0,1 %, 0,5 %, 1 %, 2 %, 2,5 %, 3 %, 3,5 %, 4 %, 4,5 %, 5 %, 6 %, 7 %, 8 %, 9 % o 10 % de las gotas generadas desde un generador de gotas coalescen con otras gotas. Las emulsiones también pueden tener floculación limitada, un proceso mediante el cual la fase dispersa sale de la suspensión en escamas.

Se pueden generar gotas que tienen un diámetro promedio de aproximadamente, menos de aproximadamente o más de aproximadamente, o al menos aproximadamente 0,001; 0,01; 0,05; 0,1; 1; 5; 10; 20; 30; 40; 50; 60; 70; 80; 100, 120; 130; 140; 150; 160; 180; 200; 300; 400 o 500 micrómetros. Las gotas pueden tener un diámetro promedio de aproximadamente 0,001 a aproximadamente 500, de aproximadamente 0,01 a aproximadamente 500, de aproximadamente 0,1 a aproximadamente 500, de aproximadamente 0,1 a aproximadamente 100, de aproximadamente 0,01 a aproximadamente 100 o de aproximadamente 1 a aproximadamente 100 micrómetros. Se sabe que los procedimientos microfluídicos para producir gotas de emulsión que usan el enfoque de flujo cruzado a través de microcanales o la agitación física producen emulsiones monodispersas o polidispersas. Las gotas pueden ser gotas monodispersas. Las gotas se pueden generar de tal manera que el tamaño de las gotas no varía en más de más o menos 5 % del tamaño promedio de las gotas. En algunos casos, las gotas se generan de tal manera que el tamaño de las gotas no varía en más de más o menos 2 % del tamaño promedio de las gotas. Un generador de gotas puede generar una población de gotas a partir de una muestra individual, donde ninguna de las gotas varía en tamaño en más de más o menos aproximadamente 0,1 %, 0,5 %, 1 %, 1,5 %, 2 %, 2,5%, 3 %, 3,5 %, 4 %, 4,5 %, 5 %, 5,5 %, 6 %, 6,5 %, 7 %, 7,5 %, 8 %, 8,5 %, 9 %, 9,5 % o 10 % del tamaño promedio de la población total de gotas.

La estabilidad mecánica superior puede ser útil para las manipulaciones microfluídicas y el procesamiento fluídico de cizallamiento superior (p. ej., en capilares microfluídicos o mediante giros de 90 grados, tal como válvulas, en la trayectoria fluídica). Las gotas o cápsulas pre- y postratadas térmicamente pueden ser mecánicamente estables a las manipulaciones y la centrifugación de pipetas estándar.

Se puede formar una gota haciendo fluir una fase oleosa a través de una muestra acuosa. La fase acuosa puede comprender una solución tamponada y reactivos para realizar una reacción de amplificación, lo que incluye células, nucleótidos, análogos de nucleótidos, polinucleótidos con código de barras molecular, cebadores de polinucleótidos con código de barras del recipiente, ácidos nucleicos matriciales y enzimas, tales como una ADN polimerasa, una ARN polimerasa y/o una transcriptasa inversa.

La fase acuosa puede comprender una solución tamponada y reactivos para realizar una reacción de amplificación con o sin una superficie sólida, tal como una perla. La solución tamponada puede comprender aproximadamente, más de aproximadamente o menos de aproximadamente 1, 5, 10, 15, 20, 30, 50, 100 o 200 mM de T ris. En algunos casos, la concentración de cloruro de potasio puede ser aproximadamente, más de aproximadamente o menos de aproximadamente 10, 20, 30, 40, 50, 60, 80, 100 o 200 mM. La solución tamponada puede comprender aproximadamente 15 mM de Tris y 50 mM de KCl. Los nucleótidos pueden comprender moléculas de desoxirribonucleótido trifosfato, que incluyen dATP, dCTP, dGTP y dTTP, en concentraciones de aproximadamente, más de aproximadamente o menos de aproximadamente 50, 100, 200, 300, 400, 500, 600 o 700 pm cada una. En algunos casos, se añade dUTP en la fase acuosa en una concentración de aproximadamente, más de aproximadamente o menos de aproximadamente 50, 100, 200, 300, 400, 500, 600 o 700, 800, 900 o 1000 pm. En algunos casos, se añade cloruro de magnesio (MgCb) o acetato de magnesio a la fase acuosa en una concentración de aproximadamente, más de aproximadamente o menos de aproximadamente 1,0; 2,0; 3,0; 4,0 o 5,0 mM. La concentración de MgCb puede ser aproximadamente 3,2 mM. En algunos casos, se usa acetato de magnesio o magnesio. En algunos casos, se usa sulfato de magnesio.

Se puede usar un agente bloqueante inespecífico, tal como BSA o gelatina de piel bovina, donde la gelatina o la BSA está presente en un intervalo de concentración de aproximadamente 0,1-0,9 % p/v. Otros posibles agentes bloqueantes pueden incluir betalactoglobulina, caseína, leche en polvo u otros agentes bloqueantes habituales. En algunos casos, las concentraciones preferidas de BSA y gelatina son aproximadamente 0,1 % p/v.

Los cebadores para amplificación en la fase acuosa pueden tener una concentración de aproximadamente, más de aproximadamente o menos de aproximadamente 0,05; 0,1 ; 0 ,2 ; 0,3; 0,4; 0,5; 0 ,6 ; 0,7; 0 ,8; 0,9; 1 ,0 ; 1 ,2 ; 1,5; 1,7 o 2,0 |jm. La concentración de cebador en la fase acuosa puede ser de aproximadamente 0,05 a aproximadamente 2, aproximadamente 0,1 a aproximadamente 1,0, aproximadamente 0,2 a aproximadamente 1,0, aproximadamente 0,3 a aproximadamente 1,0, aproximadamente 0,4 a aproximadamente 1,0 o aproximadamente 0,5 a aproximadamente 1,0 jm. La concentración de cebadores puede ser aproximadamente 0,5 jm. Los intervalos aceptables para las concentraciones de ácido nucleico diana en la PCR incluyen, pero no se limitan a, entre aproximadamente 1 pg y aproximadamente 500 ng.

En algunos casos, la fase acuosa puede comprender también aditivos que incluyen, pero no se limitan a, ácidos nucleicos de interferencia/bloqueo inespecíficos (p. ej., ADN de esperma de salmón), bioconservantes (p. ej., azida de sodio), potenciadores de la PCR (p. ej., betaína, trehalosa, etc.) e inhibidores (p. ej., inhibidores de RNasa). Otros aditivos pueden incluir, p. ej., dimetilsulfóxido (DMSO), glicerol, betaína (mono)hidratada (W,W,W-trimetilglicina = [caroboximetil]trimetilamonio), trehalosa, trifosfato de 7-desaza-2'-desoxiguanosina (dC7GTP o 7-desaza-2'-dGTP), BSA (albúmina sérica bovina), formamida (metanamida), cloruro de tetrametilamonio (TMAC), otros derivados de tetraalquilamonio (p. ej., cloruro de tetraetilamonio (TEA-Cl) y cloruro de tetrapropilamonio (TPrA-Cl), detergente no iónico (p. ej., Triton X-100, Tween 20, Nonidet P-40 (NP-40)) o PREXCEL-Q. En algunos casos, la fase acuosa puede comprender 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9 o 10 aditivos diferentes. En otros casos, la fase acuosa puede comprender al menos 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9 o 10 aditivos diferentes.

En algunos casos, se puede añadir un copolímero de bloques de óxido de etileno/óxido de propileno no iónico a la fase acuosa en una concentración de aproximadamente 0,1 %, 0,2 %, 0,3 %, 0,4 %, 0,5 %, 0,6 %, 0,7 %, 0,8 %, 0,9 % o 1,0 %. Los biotensioactivos habituales incluyen tensioactivos no iónicos tales como Pluronic F-68 , Tetronics y Zonyl FSN. El Pluronic F-68 puede estar presente en una concentración de aproximadamente 0,5 % p/v.

En algunos casos, el sulfato de magnesio se puede sustituir por cloruro de magnesio, en concentraciones similares. Una amplia gama de tampones de PCR comerciales y habituales de diversos proveedores se pueden sustituir por la solución tamponada.

La emulsión se puede formular para producir gotas muy monodispersas que tienen una película interfacial similar a un líquido que se puede convertir mediante calentamiento en microcápsulas que tienen una película interfacial similar a un sólido; tales microcápsulas que pueden comportarse como biorreactores capaces de retener su contenido a través de un procedimiento de reacción tal como la amplificación por PCR. La conversión a la forma de microcápsulas se puede producir tras el calentamiento. Por ejemplo, tal conversión se puede producir a una temperatura superior a aproximadamente 50 °C, 60 °C, 70 °C, 80 °C, 90 °C o 95 °C. En algunos casos, este calentamiento se produce usando un termociclador. Durante el procedimiento de calentamiento, se puede usar un revestimiento de fluido o aceite mineral para impedir la evaporación. El exceso de aceite de la fase continua se puede o no retirar antes del calentamiento. Las cápsulas biocompatibles pueden ser resistentes a la coalescencia y/o floculación en un amplio abanico de procedimientos térmicos y mecánicos. Después de la conversión, las cápsulas se pueden almacenar a aproximadamente, más de aproximadamente o menos de aproximadamente 3 °C, 4 °C, 5 °C, 6 °C, 7 °C, 8 °C, 9 °C, 10 °C, 15 °C, 20 °C, 25 °C, 30 °C, 35 °C o 40 °C. Estas cápsulas pueden ser útiles en aplicaciones biomédicas, tales como la encapsulación digitalizada y estable de macromoléculas, particularmente de fluidos biológicos acuosos que contienen una mezcla de ácidos nucleicos o proteína, o ambos; la administración de fármacos y vacunas; las colecciones biomoleculares; las aplicaciones de adquisición de imágenes clínicas y otras aplicaciones.

Las microcápsulas pueden contener uno o más polinucleótidos y pueden resistir la coalescencia, particularmente a temperaturas altas. Por consiguiente, las reacciones de amplificación por PCR se pueden producir a una densidad muy alta (p. ej., número de reacciones por unidad de volumen). En algunos casos, se pueden producir más de 100 000, 500000, 1000000, 1500000, 2000000, 2500 000, 5000000 o 10000000 reacciones independientes por ml. En algunos casos, las reacciones se producen en un único pocillo, p. ej., un pocillo de una placa de microtitulación, sin entremezclar los volúmenes de reacción. Las microcápsulas también pueden contener otros componentes necesarios para permitir que se produzca una reacción de transcripción inversa, extensión del cebador y/o PCR, p. ej., cebadores, sondas, dNTP, ADN o ARN polimerasas, etc. Estas cápsulas presentan resistencia a la coalescencia y la floculación en un amplio abanico de procesamientos térmicos y mecánicos.

En algunos casos, la etapa de amplificación se lleva a cabo realizando una PCR digital, tal como una PCR digital microfluídica o PCR digital de gotas.

Las gotas se pueden generar usando sistemas o dispositivos microfluídicos. Como se emplea en esta memoria, el prefijo “micro-” (por ejemplo, como “microcanal” o “microfluídico”), se refiere en general a elementos o artículos que tienen anchuras o diámetros inferiores a aproximadamente 1 mm, e inferiores a aproximadamente 100 micrómetros (micras) en algunos casos. En algunos casos, el elemento o artículo incluye un canal a través del cual puede fluir un fluido. Además, “microfluídico”, como se emplea en esta memoria, se refiere a un dispositivo, aparato o sistema que incluye al menos un canal a escala microscópica.

Los sistemas y dispositivos microfluídicos se han descrito en un abanico de contextos, habitualmente en el contexto de los análisis de laboratorio miniaturizadoss (p. ej., clínicos). También se han descrito otros usos. Por ejemplo, las solicitudes de patente internacional de n.° de publicación WO 01/89788; WO 2006/040551; WO 2006/040554; WO 2004/002627; WO 2008/063227; WO 2004/091763; WO 2005/021151; WO 2006/096571; WO 2007/089541; WO 2007/081385 y WO 2008/063227.

Una gota generalmente incluye una cantidad de un primer fluido de muestra en un segundo fluido portador. Se puede usar cualquier técnica conocida en la técnica para formar gotas con los procedimientos de la invención. Un procedimiento ejemplar implica hacer fluir una corriente del fluido de muestra que contiene el material diana (p. ej., una célula inmunitaria) de tal manera que se cruce con dos corrientes opuestas de fluido portador fluyente. El fluido portador es inmiscible con el fluido de muestra. La intersección del fluido de muestra con las dos corrientes opuestas de fluido portador fluyente da como resultado la división del fluido de muestra en gotas de muestra individuales que contienen el material diana.

El fluido portador puede ser cualquier fluido que es inmiscible con el fluido de muestra. Un fluido portador ejemplar es el aceite. En ciertas realizaciones, el fluido portador incluye un tensioactivo.

El mismo procedimiento se puede aplicar para crear gotas individuales que contienen otros reactivos, tales como reactivos para una reacción de amplificación, tal como una reacción en cadena de la polimerasa (PCR), o una reacción de amplificación no basada en PCR, tal como la amplificación por desplazamiento de múltiples cadenas, u otros procedimientos conocidos por un experto en la materia. Los reactivos adecuados para realizar reacciones de amplificación por PCR son conocidos por los expertos en la materia e incluyen, pero no se limitan a, ADN polimerasas, cebadores directos e inversos, desoxinucleótido trifosfatos (dNTP) y uno o más tampones.

En ciertas realizaciones, se forman compartimentos fluídicos proporcionando una primera división del fluido (p. ej., una gota) que comprende un material diana (p. ej., una célula inmunitaria y/o un soporte sólido tal como una perla) y un segundo fluido (p. ej., como una corriente de fluido o en gotas). El primer y segundo fluidos se fusionan para formar una gota. La fusión se puede lograr mediante la aplicación de un campo eléctrico a los dos fluidos. En ciertas realizaciones, el segundo fluido contiene reactivos para realizar una reacción de amplificación, tal como una reacción en cadena de la polimerasa o una reacción de amplificación.

En ciertos aspectos, la invención proporciona un procedimiento para generar una colección de secuencias de cadena ligera y pesada de anticuerpo con códigos de barras exclusivos y/o secuencias de cadena alfa y beta de TCR y/o secuencias de cadena gamma y delta de TCR que incluye obtener una pluralidad de construcciones de ácido nucleico en la que cada construcción incluye un N-mer exclusivo y un N-mer funcional. El N-mer funcional puede ser un N-mer aleatorio, un cebador de PCR, un cebador universal, un anticuerpo, un extremo adhesivo o cualquier otra secuencia. El procedimiento puede incluir preparar M conjuntos de un número N de compartimentos de fluido que contienen cada uno de ellos una o más copias de una construcción exclusiva. El procedimiento puede crear colecciones de códigos de barras de mayor complejidad añadiendo una construcción adicional a cada compartimento de un conjunto y repitiendo esto para cada conjunto para producir N * M compartimentos que contienen cada uno de ellos un par exclusivo de construcciones. Los pares se pueden hibridar o ligar para producir nuevas construcciones. En cada construcción de una colección de códigos de barras, cada N-mer exclusivo se puede adaptar para la identificación mediante secuenciación, hibridación de sondas, otros procedimientos o una combinación de procedimientos.

COLECCIONES DE GOTAS

En general, una colección de gotas se compone de varios elementos de la colección que se agrupan en una única colección. La complejidad de las colecciones puede variar de un único elemento de la colección a 1 x 1015 elementos de la colección o más. Cada elemento de la colección consiste en uno o más componentes determinados a una concentración fija. El elemento puede ser, pero no se limita a, células, perlas, aminoácidos, proteínas, polipéptidos, ácidos nucleicos, polinucleótidos o compuestos químicos de molécula pequeña. El elemento puede contener un identificador, tal como un código de barras molecular, un código de barras del recipiente o ambos.

Un elemento de la colección celular puede incluir, pero no se limita a, hibridomas, células B, células T, células primarias, líneas celulares cultivadas, células cancerosas, células madre o cualquier otro tipo de célula. Los elementos de la colección celular se preparan encapsulando varias células, de una a decenas de miles, en gotas individuales. El número de células encapsuladas normalmente viene dado por la estadística de Poisson de la densidad numérica de células y el volumen de la gota. Sin embargo, en algunos casos, el número se desvía de la estadística de Poisson como se describe en Edd y col., “Controlled encapsulation of single-cells into monodisperse picolitre drops”. Lab Chip, 8(8): 1262-1264, 2008. La naturaleza diferente de las células permite preparar colecciones en masa con una pluralidad de variantes celulares, tales como células inmunitarias que producen un anticuerpo o TCR cada una, todas ellas presentes en un único medio de partida y a continuación descomponer ese medio en cápsulas de gotas individuales que contienen como máximo una celda. A continuación, las células del interior de las cápsulas de gotas individuales se lisan, los polinucleótidos de cadena pesada y cadena ligera y/o los polinucleótidos de cadena alfa y beta y/o los polinucleótidos de cadena gamma y delta de las células lisadas se marcan con códigos de barras moleculares y códigos de barras del recipiente, se amplifican y a continuación se combinan o agrupan para formar una colección que consiste en elementos de la colección de cadenas pesadas y ligeras y/o cadenas alfa y beta y/o cadenas gamma y delta.

Un elemento de una colección a base de perlas contiene una o más perlas y también puede contener otros reactivos, tales como anticuerpos, enzimas u otras proteínas. En el caso en el que todos los elementos de la colección contienen diferentes tipos de perlas, pero el mismo medio circundante, todos los elementos de la colección pueden prepararse a partir de un único fluido de partida o tener un abanico de fluidos de partida. En el caso de las colecciones celulares preparadas en masa a partir de una colección de variantes, los elementos de la colección se prepararán a partir de un abanico de fluidos de partida. Es deseable tener exactamente una célula por gota, con solo algunas gotas que contienen más de una célula, cuando se parte de una pluralidad de células. En algunos casos, se pueden conseguir variaciones de la estadística de Poisson para proporcionar una carga mejorada de las gotas de tal manera que haya más gotas con exactamente una célula por gota y pocas excepciones de gotas vacías o gotas que contienen más de una célula.

En algunas realizaciones, es deseable tener exactamente un polinucleótido con código de barras del recipiente por gota, con solo algunas gotas que contienen más de un polinucleótido con código de barras del recipiente, cuando se parte de una pluralidad de polinucleótidos con código de barras del recipiente. En algunos casos, se pueden conseguir variaciones de la estadística de Poisson para proporcionar una carga mejorada de las gotas de tal manera que haya más gotas con exactamente un polinucleótido con código de barras del recipiente por gota y pocas excepciones de gotas vacías o gotas que contienen más de un polinucleótido con código de barras del recipiente.

Los ejemplos de colecciones de gotas son colecciones de gotas que tienen diferentes contenidos, que varían de perlas a células, moléculas pequeñas, ADN, cebadores, anticuerpos y polinucleótidos con códigos de barras. Las gotas varían en tamaño desde aproximadamente 0,5 micrómetros hasta 500 micrómetros de diámetro, lo que corresponde a de aproximadamente 1 picolitro a 1 nanolitro. Sin embargo, las gotas pueden ser tan pequeñas como de 5 micrómetros y tan grandes como de 500 micrómetros. Preferiblemente, las gotas tienen menos de 100 micrómetros, de aproximadamente 1 micrómetro a aproximadamente 100 micrómetros de diámetro. El tamaño más preferido es de aproximadamente 20 a 40 micrómetros de diámetro (10 a 100 picolitros). Las propiedades preferidas examinadas de las colecciones de gotas incluyen el equilibrio de presión osmótica, el tamaño uniforme y los intervalos de tamaño. Las gotas comprendidas en la colección de gotas proporcionada por la presente invención son preferiblemente de tamaño uniforme. Es decir, el diámetro de cualquier gota de la colección variará menos de 5 %, 4 %, 3 %, 2 %, 1 % o 0,5 % cuando se compara con el diámetro de otras gotas de la misma colección. El tamaño uniforme de las gotas de la colección puede ser crítico para mantener la estabilidad e integridad de las gotas y también puede ser esencial para el uso posterior de las gotas de la colección para los diversos ensayos biológicos y químicos descritos en esta memoria.

La invención proporciona una colección de gotas que comprende una pluralidad de gotas acuosas en un fluido inmiscible, donde cada gota es preferiblemente de tamaño sustancialmente uniforme y comprende un elemento diferente de la colección. La invención proporciona un procedimiento para formar la colección de gotas que comprende proporcionar un único fluido acuoso que comprende diferentes elementos de la colección, encapsular cada elemento de la colección en una gota acuosa de un fluido inmiscible.

En ciertas realizaciones, se agrupan diferentes tipos de elementos (p. ej., células o perlas) en una única fuente contenida en el mismo medio. Después del agrupamiento inicial, los elementos se encapsulan a continuación en gotas para generar una colección de gotas donde cada gota con un tipo diferente de perla o célula es un elemento diferente de la colección. La dilución de la solución inicial hace posible el procedimiento de encapsulación. En algunas realizaciones, las gotas formadas contendrán un único elemento o no contendrán nada, es decir, estarán vacías. En otras realizaciones, las gotas formadas contendrán múltiples copias de un elemento de la colección. Los elementos que se encapsulan son generalmente variantes de un tipo. En un ejemplo, los elementos son células inmunitarias de una muestra de sangre, y cada célula inmunitaria se encapsula para amplificar y marcar con código de barras las secuencias de anticuerpo de los nucleótidos en las células inmunitarias.

Por ejemplo, en un tipo de colección de emulsiones, hay elementos de la colección que tienen diferentes partículas, es decir, células o polinucleótidos con código de barras, en un medio diferente y se encapsulan antes del agrupamiento. En un ejemplo, un número especificado de elementos de la colección, es decir, n número de células o polinucleótidos con códigos de barras diferentes, está contenido en medios diferentes. Cada uno de los elementos de la colección se emulsiona y agrupa independientemente, momento en el que cada uno del n número de elementos diferentes de la colección agrupados se combina y agrupa en un único grupo. El grupo resultante contiene una pluralidad de gotas de emulsión de agua en aceite que contienen cada una de ellas un tipo diferente de partícula. En algunas realizaciones, las gotas formadas contendrán un único elemento de la colección o no contendrán nada, es decir, estarán vacías. En otras realizaciones, las gotas formadas contendrán múltiples copias de un elemento de la colección. El contenido de las perlas sigue una distribución de Poisson, en la que hay una distribución discreta de la probabilidad que expresa la probabilidad de que se produzcan varios acontecimientos en un periodo de tiempo fijo si estos acontecimientos se producen con una tasa promedio conocida e independientemente del tiempo transcurrido desde el último acontecimiento. Los aceites y tensioactivos usados para crear las colecciones impiden el intercambio del contenido de la colección entre gotas.

TRANSCRIPCIÓN INVERSA

En algunos casos, los polinucleótidos diana se preparan a partir de un ARN mediante transcripción inversa. En algunos casos, los polinucleótidos diana se preparan a partir de un ADN mediante la extensión del cebador, tal como usando una polimerasa.

Los procedimientos descritos en esta memoria se pueden usar en la PCR acoplada a transcripción inversa (PCR con transcripción inversa). Por ejemplo, la transcripción inversa y la PCR se pueden llevar a cabo en dos etapas distintas. En primer lugar, se puede sintetizar una copia de ADNc del ARNm de la muestra usando un cebador de polinucleótido dT, un cebador específico de la secuencia, un cebador universal o cualquier cebador descrito en esta memoria. La transcripción inversa y la PCR se pueden llevar a cabo en una única reacción en recipiente cerrado. Por ejemplo, se pueden emplear tres cebadores, uno para la transcripción inversa y dos para la PCR. El cebador para la transcripción inversa se puede unir al ARNm 3' a la posición del amplicón de la PCR. Aunque no es esencial, el cebador de la transcripción inversa puede incluir residuos de ARN o análogos modificados, tales como bases de 2'-O-metilo ARN, que no formarán un sustrato para la ribonucleasa H cuando se hibridan al ARNm.

La temperatura para llevar a cabo la reacción de transcripción inversa depende de la transcriptasa inversa que se está usando. En algunos casos, se usa una transcriptasa inversa termoestable y la reacción de transcripción inversa se lleva a cabo de aproximadamente 37 °C a aproximadamente 75 °C, de aproximadamente 37 °C a aproximadamente 50 °C, de aproximadamente 37 °C a aproximadamente 55 °C , de aproximadamente 37 °C a aproximadamente 60 °C, de aproximadamente 55 °C a aproximadamente 75 °C, de aproximadamente 55 °C a aproximadamente 60 °C, a aproximadamente 37 °C o a aproximadamente 60 °C. En algunos casos, se usa una transcriptasa inversa que transfiere 3 o más nucleótidos terminales no matriciales a un extremo del producto transcrito.

Una reacción de transcripción inversa y la reacción PCR descritas en esta memoria se pueden llevar a cabo en diversos formatos conocidos en la técnica, tal como en tubos, placas de microtitulación, dispositivos microfluídicos o, preferiblemente, gotas.

Se puede llevar a cabo una reacción de transcripción inversa en volúmenes que varían de 5 pL a 100 pL, o en volúmenes de reacción de 10 pL a 20 pL. En las gotas, los volúmenes de reacción pueden variar de 1 pL a 100 nL, o 10 pL a 1 nL. En algunos casos, la reacción de transcripción inversa se lleva a cabo en una gota que tiene un volumen que es aproximadamente 1 nL o menos. En algunos casos, una reacción PCR se lleva a cabo en una gota que tiene un volumen de reacción que varía de 1 pL a 100 nL, preferiblemente 10 pL a 1 nL. En algunos casos, la reacción PCR se lleva a cabo en una gota que tiene un volumen que es aproximadamente 1 nL o menos. En algunos casos, una reacción de transcripción inversa y una reacción PCR se llevan a cabo en la misma gota que tiene un volumen de reacción que varía de 1 pL a 100 nL o 10 pL a 1 nL. En algunos casos, la reacción de transcripción inversa y la reacción PCR se llevan a cabo en una gota que tiene un volumen que es aproximadamente 1 nL o menos o en un volumen que es aproximadamente 1 pL o menos. En algunos casos, una reacción de transcripción inversa y una reacción PCR se llevan a cabo en una gota diferente. En algunos casos, una reacción de transcripción inversa y una reacción PCR se llevan a cabo en una pluralidad de gotas que tienen cada una un volumen de reacción que varía de 1 pL a 100 nL o 10 pL a 1 nL. En algunos casos, la reacción de transcripción inversa y la reacción ^pC^rse llevan a cabo en una pluralidad de gotas que tienen cada una de ellas un volumen que es aproximadamente 1 nL o menos.

En algunos casos, una primera reacción PCR se lleva a cabo en una primera gota que tiene un volumen de reacción que varía de 1 pL a 100 nL, preferiblemente 10 pL a 1 nL, y una segunda reacción PCR se lleva a cabo en una segunda gota que tiene un volumen de reacción que varía de 1 pL a 100 nL, preferiblemente 10 pL a 1 nL. En algunos casos, una primera reacción PCR se lleva a cabo en una primera gota que tiene un volumen que es aproximadamente 1 nL o menos y una segunda reacción PCR se lleva a cabo en una segunda gota que tiene un volumen que es aproximadamente 1 nL o menos.

En algunos casos, una reacción PCR y una segunda reacción PCR se llevan a cabo en una pluralidad de gotas que tienen cada una de ellas un volumen de reacción que varía de 1 pL a 100 nL o 10 pL a 1 nL. En algunos casos, una primera reacción PCR y una segunda reacción PCR se llevan a cabo en una pluralidad de gotas que tienen cada una de ellas un volumen de aproximadamente 1 nL o menos.

Los polinucleótidos diana, tales como ARN, se pueden someter a transcripción inversa a ADNc usando uno o más cebadores de transcripción inversa. El uno o más cebadores de transcripción inversa pueden comprender una región complementaria a una región del ARN, tal como una región constante (p. ej., una región constante de cadena pesada o ligera o una cola de poli-A de ARNm). En algunas realizaciones, los cebadores de transcripción inversa pueden comprender un primer cebador de transcripción inversa con una región complementaria a una región constante de un primer ARN y un segundo cebador de transcripción inversa con una región complementaria a una región constante de un segundo ARN. En algunas realizaciones, los cebadores de transcripción inversa pueden comprender un primer cebador de transcripción inversa con una región complementaria a una región constante de un primer ARN y uno o más cebadores de transcripción inversa con una región complementaria a una región constante de uno o más ARN, respectivamente.

En algunas realizaciones, los cebadores de transcripción inversa no comprenden un código de barras. Los cebadores de transcripción inversa pueden comprender además una región que no es complementaria a una región del ARN. En algunas realizaciones, la región que no es complementaria a una región del ARN es 5' a una región de los cebadores que es complementaria al ARN. En algunas realizaciones, la región que no es complementaria a una región del ARN es 3' a una región de los cebadores que es complementaria al ARN. En algunas realizaciones, la región que no es complementaria a una región del ARN es una región protuberante 5'. En algunas realizaciones, la región que no es complementaria a una región del ARN comprende un sitio de cebado para la amplificación y/o una reacción de secuenciación. Usando el uno o más cebadores descritos en esta memoria, las moléculas de ARN se someten a transcripción inversa usando reactivos adecuados conocidos en la técnica.

Después de realizar las reacciones de transcripción inversa de las moléculas de ARN, las moléculas de ADNc resultantes se pueden marcar con un código de barras molecular y un código de barras de recipiente y amplificar mediante una o más reacciones PCR, tal como una primera y/o una segunda reacción PCR. La primera y/o segunda reacción PCR puede utilizar un par de cebadores o una pluralidad de pares de cebadores. La primera y/o segunda reacción PCR puede utilizar una pluralidad de cebadores directos/inversos y un cebador inverso. La primera y/o segunda reacción PCR puede utilizar una pluralidad de cebadores directos/inversos y un cebador directo. Un primer y/o segundo cebador de una pluralidad de cebadores directos/inversos puede ser un cebador directo/inverso que contiene una región complementaria a las moléculas de ADNc o las moléculas de ADNc con código de barras. Un primer y/o segundo cebador de una pluralidad de cebadores directos/inversos puede ser un cebador directo/inverso que contiene una región complementaria a las moléculas de ADNc con código de barras.

En algunas realizaciones, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos de la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc de código de barras y uno o más cebadores directos/inversos distintos que comprenden una región complementaria a una o más regiones distintas aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc de código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región distinta aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc de código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc de código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc de código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región aguas arriba o aguas abajo de un segmento V de los ADNc o los ADNc de código de barras, etc. Los cebadores de la pluralidad de cebadores directos/inversos se pueden usar para hibridarse a todas las posibles regiones aguas arriba o aguas abajo de todos los segmentos V expresados por las células, tales como células B o células T inmunitarias, de la muestra.

En algunas realizaciones, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos de la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc de código de barras y uno o más cebadores directos/inversos distintos que comprenden una región complementaria a una o más regiones distintas aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc de código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región distinta aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc de código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc de código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc de código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región aguas arriba o aguas abajo de un segmento C de los ADNc o los ADNc de código de barras, etc. Los cebadores de la pluralidad de cebadores directos/inversos se pueden usar para hibridarse a todas las posibles regiones aguas arriba o aguas abajo de todos los segmentos C expresados por las células, tales como células B o células T inmunitarias, de la muestra.

En algunas realizaciones, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos de la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones aguas arriba o aguas abajo de un código de barras molecular de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región aguas arriba o aguas abajo de un código de barras molecular de los ADNc de código de barras y uno o más cebadores directos/inversos distintos que comprenden una región complementaria a una o más regiones aguas arriba o aguas abajo de un código de barras molecular de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un código de barras molecular de los ADNc de código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región aguas arriba o aguas abajo de un código de barras molecular de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un código de barras molecular de los ADNc de código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región aguas arriba o aguas abajo de un código de barras molecular de los ADNc de código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región aguas arriba o aguas abajo de un código de barras molecular de los ADNc de código de barras, etc. La pluralidad de cebadores directos/inversos se puede usar para hibridarse a todas las posibles regiones aguas arriba o aguas abajo de todos los códigos de barras moleculares expresados por las células, tales como células B o células T inmunitarias, de la muestra.

En algunas realizaciones, una pluralidad de cebadores directos/inversos comprende uno o más cebadores directos/inversos donde cada uno de los cebadores directos/inversos de la pluralidad de cebadores directos/inversos comprende una región complementaria a una o más regiones aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un cebador directo/inverso que comprende una región complementaria a una región aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc de código de barras y uno o más cebadores directos/inversos distintos que comprenden una región complementaria a una o más regiones aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc de código de barras y un segundo cebador directo/inverso que comprende una región complementaria a una segunda región aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc con código de barras. Por ejemplo, una pluralidad de cebadores directos/inversos comprende un primer y/o segundo cebador directo/inverso que comprende una región complementaria a una primera y/o segunda región aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc de código de barras, un segundo cebador directo/inverso que comprende una región complementaria a una segunda región aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc de código de barras, y un tercer cebador directo/inverso que comprende una región complementaria a una tercera región aguas arriba o aguas abajo de un código de barras del recipiente de los ADNc de código de barras, etc. Los cebadores de la pluralidad de cebadores directos/inversos se pueden usar para hibridarse a todas las posibles regiones aguas arriba o aguas abajo de todos los códigos de barras del recipiente expresados por las células, tales como células B o células T inmunitarias, de la muestra.

Los cebadores directos/inversos de la pluralidad de cebadores directos/inversos comprenden además una región que no es complementaria a una región del ARN. En algunas realizaciones, la región que no es complementaria a una región del ARN es 5' a una región de los cebadores directos/inversos que es complementaria al ARN (es decir, una región aguas arriba o aguas abajo de un segmento V). En algunas realizaciones, la región que no es complementaria a una región del ARN es 3' a una región de los cebadores directos/inversos que es complementaria al ARN. En algunas realizaciones, la región que no es complementaria a una región del ARN es una región protuberante 5'. En algunas realizaciones, la región que no es complementaria a una región del ARN comprende un sitio de cebado para la amplificación y/o una segunda reacción de secuenciación. En algunas realizaciones, la región que no es complementaria a una región del ARN comprende un sitio de cebado para la amplificación y/o una tercera reacción de secuenciación. En algunas realizaciones, la región que no es complementaria a una región del ARN comprende un sitio de cebado para una segunda y una tercera reacción de secuenciación. En algunas realizaciones, la secuencia del sitio de cebado para la segunda y la tercera reacción de secuenciación es la misma. Usando el uno o más cebadores directos/inversos y un cebador inverso como se describe en esta memoria, se amplifican las moléculas de ADNc usando reactivos adecuados conocidos en la técnica. En algunas realizaciones, una región es complementaria a una región del ARN, tal como la región constante o una cola de poli-A de ARNm.

AMPLIFICACIÓN

La muestra que contiene el polinucleótido diana puede comprender ARNm, o fragmentos del mismo, que se pueden amplificar. En algunos casos, la longitud promedio del ARNm, o fragmentos del mismo, puede ser menor de aproximadamente 100, 200, 300, 400, 500 u 800 pares de bases, o menor de aproximadamente 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 o 200 nucleótidos, o menor de aproximadamente 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 kilobases. En algunos casos, se amplifica una secuencia diana de una matriz relativamente corta, tal como una muestra que contiene una matriz que es de aproximadamente 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 bases.

Una reacción de amplificación puede comprender uno o más aditivos. En algunos casos, el uno o más aditivos son dimetilsulfóxido (DMSO), glicerol, betaína (mono)hidratada (W,W,N-trimetilglicina = [caroboximetil]trimetilamonio), trehalosa, trifosfato de 7-desaza-2'-desoxiguanosina (dC7GTP o 7-desaza-2'-dGTP), BSA (albúmina sérica bovina), formamida (metanamida), cloruro de tetrametilamonio (TMAC), otros derivados de tetraalquilamonio (p. ej., cloruro de tetraetilamonio (TEA-Cl) y cloruro de tetrapropilamonio (TPrA-Cl), detergente no iónico (p. ej., Triton X-100, Tween 20, Nonidet P-40 (NP-40)) o PREXCEL-Q. En algunos casos, una reacción de amplificación comprende 0, 1, 2, 3, 4, 5, 6 , 7, 8, 9 o 10 aditivos diferentes. En otros casos, una reacción de amplificación comprende al menos 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9 o 10 aditivos diferentes.

Las reacciones de termociclado se pueden realizar en muestras contenidas en volúmenes de reacción (p. ej., gotas). Los expertos en la materia pueden polidispersar o preferiblemente monodispersar las gotas, generarlas mediante agitación, sonicación o microfluídicamente mediante una intersección de canales en T u otros medios. Las densidades pueden superar 20 000 gotas/40 ul (gotas de 1 nL), 200 000 gotas/40 ul (gotas de 100 pL). Las gotas pueden permanecer intactas durante el termociclado. Las gotas pueden permanecer intactas durante el termociclado a densidades mayores de aproximadamente 10000 gotas/pL, 100000 gotas/pL, 200000 gotas/pL, 300000 gotas/pL, 400 000 gotas/pL, 500000 gotas/pL, 600 000 gotas/pL, 700 000 gotas/pL, 800 000 gotas/pL, 900000 gotas/pL o 1 000 000 gotas/pL. En otros casos, dos o más gotas no coalescen durante el termociclado. En otros casos, más de 100 o más de 1000 gotas no coalescen durante el termociclado.

Se puede usar cualquier ADN polimerasa que cataliza la extensión del cebador, lo que incluye, pero no se limita a, ADN polimerasa de E. coli, fragmento de Klenow de ADN polimerasa 1 de E. coli, ADN t 7, ADN polimerasa T4, polimerasa Taq, ADN polimerasa Pfu, ADN polimerasa Vent , bacteriófago 29, REDTaq™, ADN polimerasa genómica o secuenasa. En algunos casos, se usa una ADN polimerasa termoestable. También se puede realizar una PCR de inicio en caliente donde la reacción se calienta a 95 °C durante dos minutos antes de la adición de la polimerasa, o la polimerasa se puede mantener inactiva hasta la primera etapa de calentamiento en el ciclo 1. La PCR de inicio en caliente se puede usar para minimizar amplificación inespecífica. Se puede usar cualquier número de ciclos de PCR para amplificar el ADN, p. ej., aproximadamente, más de aproximadamente o menos de aproximadamente 1, 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13. , 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38 , 39, 40, 41, 42, 43, 44 o 45 ciclos. El número de ciclos de amplificación puede ser de aproximadamente 1-45, 10-45, 20-45, 30-45, 35-45, 10-40, 10-30, 10-25, 10-20, 10-15, 20- 35, 25-35, 30-35 o 35-40.

La amplificación de ácidos nucleicos diana se puede realizar por cualquier medio conocido en la técnica. Los ácidos nucleicos diana se pueden amplificar mediante reacción en cadena de la polimerasa (PCR) o amplificación isotérmica de ADN. Los ejemplos de técnicas de PCR que se pueden usar incluyen, pero no se limitan a, PCR cuantitativa, PCR fluorescente cuantitativa (QF-PCR), PCR fluorescente múltiple (MF-PCR), PCR en tiempo real (PCR con transcripción inversa), PCR unicelular, PCR de fragmentos de restricción de longitud polimórfica (PCR-RFLP), PCR-RFLP/transcripción inversa-PCR-RFLP, PCR de inicio en caliente, PCR anidada, PCR de colonias de polimerasa in situ, amplificación por círculo rodante (RCA) in situ, PCR digital (dPCR), PCR digital de gotas (ddPCR), PCR en puente, PCR en picolitros y PCR en emulsión. Otros procedimientos de amplificación adecuados incluyen la reacción en cadena de la ligasa (LCR), la amplificación de la transcripción, la PCR con sonda de inversión molecular (MIP), la replicación de secuencias autosostenida, la amplificación selectiva de secuencias de polinucleótidos diana, la reacción en cadena de la polimerasa cebada con secuencias consenso (CP-PCR), la reacción en cadena de la polimerasa cebada arbitrariamente (AP-PCR), la PCR cebada con polinucleótidos degenerados (DOP-PCR) y la amplificación de secuencias basada en ácidos nucleicos (NABSA). Otros procedimientos de amplificación que se pueden usar en esta memoria incluyen los descritos en las patentes de los Estados Unidos n.° 5242794; 5494810; 4988617; y 6 582 938 y también incluyen la amplificación de ARN mediada por la replicasa Q beta. La amplificación puede ser una amplificación isotérmica, p. ej., una amplificación lineal isotérmica.

En algunas realizaciones, la amplificación no se produce sobre un soporte sólido. En algunas realizaciones, la amplificación no se produce sobre un soporte sólido en una gota. En algunas realizaciones, la amplificación no se produce sobre un soporte sólido cuando la amplificación no se lleva a cabo en una gota.

Una reacción de amplificación puede comprender uno o más aditivos. En algunas realizaciones, el uno o más aditivos pueden son dimetilsulfóxido (DMSO), glicerol, betaína (mono)hidratada (N,W,W-trimetilglicina = [caroboximetil]trimetilamonio), trehalosa, trifosfato de 7-desaza-2'-desoxiguanosina (dC7GTP o 7-desaza-2'-dGTP), BSA (albúmina sérica bovina), formamida (metanamida), cloruro de tetrametilamonio (TMAC), otros derivados de tetraalquilamonio (p. ej., cloruro de tetraetilamonio (TEA-Cl) y cloruro de tetrapropilamonio (TPrA-Cl), detergente no iónico (p. ej., Triton X-100, Tween 20, Nonidet P-40 (NP-40)) o PREXCEL-Q. En algunas realizaciones, una reacción de amplificación comprende 0, 1, 2, 3, 4, 5, 6 , 7, 8, 9 o 10 aditivos diferentes. En otros casos, una reacción de amplificación puede comprender al menos 0, 1, 2, 3, 4, 5, 6 , 7, 8 , 9 o 10 aditivos diferentes.

CEBADORES

En general, se pueden usar uno o más pares de cebadores en una reacción de amplificación; un cebador de un par de cebadores puede ser un cebador directo y un cebador de un par de cebadores puede ser un cebador inverso. En algunos casos, se puede usar un primer par de cebadores en la reacción de amplificación; un cebador del primer par puede ser un cebador directo complementario a una secuencia de una primera molécula de polinucleótido diana y un cebador del primer par puede ser un cebador inverso complementario a una segunda secuencia de la primera molécula de polinucleótido diana, y un primer locus de la diana puede encontrarse entre la primera secuencia y la segunda secuencia. En algunas realizaciones, el primer locus de la diana comprende una secuencia de V^h, o Va o V^y.

En algunos casos, se puede usar un segundo par de cebadores en la reacción de amplificación; un cebador del segundo par puede ser un cebador directo complementario a una primera secuencia de una segunda molécula de polinucleótido diana y un cebador del segundo par puede ser un cebador inverso complementario a una segunda secuencia de la primera molécula de polinucleótido diana, y un segundo locus de la diana puede encontrarse entre la primera secuencia y la segunda secuencia. En algunas realizaciones, el segundo locus de la diana comprende una secuencia V^l, o Vp o V8.

En algunos casos, se puede usar un tercer par de cebadores en la reacción de amplificación; un cebador del tercer par puede ser un cebador directo complementario a una primera secuencia de una tercera molécula de polinucleótido diana y un cebador del tercer par puede ser un cebador inverso que puede ser complementario a una segunda secuencia de la tercera molécula de polinucleótido diana, y un tercer locus de la diana puede encontrarse entre la primera secuencia y la segunda secuencia. En algunas realizaciones, el tercer locus de la diana comprende un código de barras, tal como un código de barras molecular o un código de barras del recipiente.

La longitud del cebador directo y el cebador inverso puede depender de la secuencia del polinucleótido diana y del locus de la diana. Por ejemplo, la longitud y/o la Tf del cebador directo y el cebador inverso se puede optimizar. Por ejemplo, un cebador puede tener aproximadamente, más de aproximadamente o menos de aproximadamente 10 , 11 , 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 o 60 nucleótidos de longitud. En algunos casos, un cebador es de aproximadamente 15 a aproximadamente 20, aproximadamente 15 a aproximadamente 25, aproximadamente 15 a aproximadamente 30, aproximadamente 15 a aproximadamente 40, aproximadamente 15 a aproximadamente 45, aproximadamente 15 a aproximadamente 50, aproximadamente 15 a aproximadamente 55, aproximadamente 15 a aproximadamente 60, aproximadamente 20 a aproximadamente 25, aproximadamente 20 a aproximadamente 30, aproximadamente 20 a aproximadamente 35, aproximadamente 20 a aproximadamente 40, aproximadamente 20 a aproximadamente 45, aproximadamente 20 a aproximadamente 50, aproximadamente 20 a aproximadamente 55, o aproximadamente 20 a aproximadamente 60 nucleótidos de longitud.

Un cebador puede ser un ADN monocatenario antes de unir un polinucleótido matricial. En algunos casos, el cebador comprende inicialmente una secuencia bicatenaria. La longitud apropiada de un cebador puede depender del uso previsto del cebador, pero puede variar de aproximadamente 6 a aproximadamente 50 nucleótidos, o de aproximadamente 15 a aproximadamente 35 nucleótidos. Las moléculas de cebador cortas generalmente requieren temperaturas más frías para formar complejos híbridos suficientemente estables con una matriz. En alguna realizaciones, un cebador no necesita reflejar la secuencia exacta del ácido nucleico matricial, pero debe ser suficientemente complementaria para hibridarse con una matriz. En algunos casos, un cebador puede ser parcialmente bicatenario antes de unirse a un polinucleótido matricial. Un cebador con secuencia bicatenaria puede tener una horquilla de aproximadamente, más de aproximadamente o menos de aproximadamente 3, 4, 5, 6 , 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 , 17, 18, 19 o 20 bases. Una porción bicatenaria de un cebador puede tener aproximadamente, más de aproximadamente o menos de aproximadamente 3, 4, 5, 6 , 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 o 50 pares de bases. El diseño de cebadores adecuados para la amplificación de una secuencia diana determinada es muy conocido en la técnica.

Los cebadores pueden incorporar características adicionales que permiten la detección o inmovilización del cebador, pero no alteran una propiedad básica del cebador (p. ej., actuar como un punto de iniciación de la síntesis de ADN). Por ejemplo, los cebadores pueden contener una secuencia de ácido nucleico adicional en el extremo 5' que no se hibrida a un ácido nucleico diana, pero que facilita la clonación o amplificación adicional, o la secuenciación de un producto amplificado. Por ejemplo, la secuencia adicional puede comprender un sitio de unión del cebador, tal como un sitio de unión del cebador universal. Una región del cebador que es suficientemente complementaria a una matriz para hibridarse se puede denominar en esta memoria una región de hibridación.

En otro caso, un cebador utilizado en los procedimientos y las composiciones descritos en esta memoria puede comprender uno o más nucleósidos universales. Los ejemplos no limitantes de nucleósidos universales son 5-nitroindol e inosina, como se describe en las solicitudes de patente de los Estados Unidos n.° 2009/0325169 y 2010/0167353.

Los cebadores se pueden diseñar según parámetros conocidos para evitar las estructuras secundarias y la autohibridación. Diferentes pares de cebadores pueden templarse y fundirse aproximadamente a las mismas temperaturas, por ejemplo, a 1 °C, 2 °C, 3 °C, 4 °C, 5 °C, 6 °C, 7 °C, 8 °C, 9 °C o 10 °C de otro par de cebadores. En algunos casos, se usan inicialmente más de 1, 2, 3, 4, 5, 6 , 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 500, 1000, 5000, 10000 o más cebadores. Tales cebadores pueden hibridarse a polinucleótidos diana descritos en esta memoria.

Los cebadores se pueden preparar mediante un abanico de procedimientos que incluyen, pero no se limitan a, la clonación de secuencias apropiadas y la síntesis química directa usando procedimientos muy conocidos en la técnica (Narang y col., Methods Enzymol. 68:90 (1979); Brown y col., Methods Enzymol. 68:109 (1979)). Los cebadores también se pueden obtener de proveedores comerciales. Los cebadores pueden tener una temperatura de fusión idéntica. Los cebadores pueden tener temperaturas de fusión que no son idénticas. Las longitudes de los cebadores se pueden extender o acortar en el extremo 5' o el extremo 3' para producir cebadores con las temperaturas de fusión deseadas. Uno de los cebadores de un par de cebadores puede ser más largo que el otro cebador. Las longitudes de hibridación 3' de los cebadores, de un par de cebadores, pueden ser diferentes. Asimismo, la posición de hibridación de cada par de cebadores se puede diseñar de tal manera que la secuencia y longitud de los pares de cebadores producen la temperatura de fusión deseada. Una ecuación para determinar la temperatura de fusión de los cebadores menores de 25 pares de bases es la regla de Wallace (Tf = 2(A T) 4(G C)). También se pueden usar programas informáticos para diseñar los cebadores. La Tf (temperatura de fusión o hibridación) de cada cebador se puede calcular usando programas informáticos. La temperatura de hibridación de los cebadores se puede recalcular y aumentar después de cualquier ciclo de amplificación, lo que incluye, pero no se limita a, los ciclos 1,2, 3, 4, 5, ciclos 6-10, ciclos 10-15, ciclos 15-20, ciclos 20. -25, ciclos 25-30, ciclos 30-35 o ciclos 35-40. Después de los ciclos iniciales de amplificación, la mitad 5' de los cebadores se puede incorporar a los productos de cada locus de interés; por tanto, la Tf se puede recalcular en base a las secuencias tanto de la mitad 5' como de la mitad 3' de cada cebador.

Realizar la una o más reacciones de los procedimientos descritos en esta memoria puede comprender el uso de uno o más cebadores. Como se emplea en esta memoria, un cebador comprende un polinucleótido bicatenario, monocatenario o parcialmente monocatenario que es suficientemente complementario para hibridarse a un polinucleótido matricial. Un cebador puede ser un ADN monocatenario antes de unir un polinucleótido matricial. En algunas realizaciones, el cebador comprende inicialmente una secuencia bicatenaria. El sitio del cebador incluye el área de la matriz a la que se hibrida un cebador. En algunas realizaciones, los cebadores son capaces de actuar como un punto de iniciación para la síntesis de ácidos nucleicos dirigida por la matriz. Por ejemplo, los cebadores pueden iniciar la síntesis de ácidos nucleicos dirigida por la matriz cuando hay cuatro nucleótidos diferentes y un agente o una enzima de polimerización, tal como una ADN o ARN polimerasa o una transcriptasa inversa. Un par de cebadores incluye 2 cebadores: un primer cebador con una región 5' aguas arriba que se hibrida con un extremo 5' de una secuencia de la matriz, y un segundo cebador con una región 3' aguas abajo que se hibrida con el complemento del extremo 3' de la secuencia de la matriz. Un conjunto de cebadores incluye dos o más cebadores: un primer cebador o una primera pluralidad de cebadores con una región 5' aguas arriba que se hibrida con un extremo 5' de una secuencia de la matriz o una pluralidad de secuencias de la matriz, y un segundo cebador o una segunda pluralidad de cebadores con una región 3' aguas abajo que se hibrida con el complemento del extremo 3' de la secuencia de la matriz o la pluralidad de secuencias de la matriz. En algunas realizaciones, un cebador comprende una secuencia específica de la diana. En algunas realizaciones, un cebador comprende una secuencia de código de barras de la muestra. En algunas realizaciones, un cebador comprende una secuencia de hibridación universal. En algunas realizaciones, un cebador comprende una secuencia de hibridación por PCR. En algunas realizaciones, un cebador comprende una secuencia de hibridación por PCR usada para iniciar la amplificación de un polinucleótido. (Dieffenbach, PCR Primer: A Laboratory Manual, 2a edición (Cold Spring Harbor Press, Nueva York (2003)). El sitio o secuencia de unión del cebador universal permite la fijación de un cebador universal a un polinucleótido y/o amplicón. Los cebadores universales son muy conocidos en la técnica e incluyen, pero no se limitan a, 47F (M13F), alfaMF, AOX3', AOX5', BGHr, CMV-30, CMV-50, CVMf, LACrmt, lambda gt10F, lambda gt 10R, lambda gt11F, lambda gt11R, M13 rev, M13Forward(-20), M13Reverse, male, p10SEQPpQE, pA-120, pet4, pGAP Forward, pGLRVpr3, pGLpr2R, pKLAC14, pQEFS, pQERs, pucU1, pucU2, reversA, seqIREStam, seqIRESzpet, seqori, seqPcR, seqplRES-, seqpIRES+, seqpSecTag, seqpSecTag+, seqretro+PSI, SP6 , T3-prom, T7-prom y T7-termInv. Como se emplea en esta memoria, fijar se puede referir tanto a interacciones covalentes como a interacciones no covalentes. La fijación del cebador universal al sitio de unión del cebador universal se puede usar para la amplificación, detección y/o secuenciación del polinucleótido y/o amplicón. El sitio de unión del cebador universal puede comprender al menos aproximadamente 1, 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 o 1000 nucleótidos o pares de bases. En otro ejemplo, el sitio de unión del cebador universal comprende al menos aproximadamente 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500 o 10000 nucleótidos. o pares de bases. En algunas realizaciones, el sitio de unión del cebador universal comprende 1-10, 10-20, 10-30 o 10-100 nucleótidos o pares de bases. En algunas realizaciones, el sitio de unión del cebador universal comprende de aproximadamente 1-90, 1-80, 1-70, 1-60, 1-50, 1 40, 1-30, 1-20, 1-10, 2- 90, 2-80, 2-70, 2-60, 2-50, 2-40, 2-30, 2-20, 2-10, 1-900, 1-800, 1-700, 1-600, 1-500, 1-400, 1 300, 1-200, 1-100, 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 5-90, 5-80, 5-70, 5-60, 5-50, 5-40, 5-30, 5-20, 5-10, 10-90, 10-80, 10-70, 10-60, 10-50, 10-40, 10-30, 10-20, 10-10, 5-900, 5-800, 5-700, 5-600, 5-500, 5 400, 5-300, 5-200, 5-100, 10-900, 10-800, 10-700, 10-600, 10-500, 10-400, 10-300, 10-200, 10-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25-400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100-800, 100- 700, 100-600, 100-500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400- 600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900, 700-800, 800-1000, 800-900 o 900-1000 nucleótidos o pares de bases.

Los cebadores pueden tener una longitud compatible con su uso en la síntesis de productos de la extensión del cebador. Un cebador puede ser un polinucleótido que tiene de 8 a 200 nucleótidos de longitud. La longitud de un cebador puede depender de la secuencia del polinucleótido matricial y del locus de la matriz. Por ejemplo, la longitud y/o temperatura de fusión (Tf) de un cebador o un conjunto de cebadores se puede optimizar. Por ejemplo, un cebador puede tener aproximadamente, más de aproximadamente o menos de aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59 o 60 nucleótidos de longitud. En algunas realizaciones, los cebadores tienen aproximadamente 8-100 nucleótidos de longitud, por ejemplo, 10-75, 15-60, 15-40, 18-30, 20-40, 21-50, 22-45, 25-40, 7. -9, 12-15, 15-20, 15-25, 15-30, 15-45, 15-50, 15-55, 15-60, 20-25, 20-30, 20-35, 20-45, 20-50, 20-55 o 20 60 nucleótidos de longitud y cualquier longitud intermedia. En algunas realizaciones, los cebadores tienen como máximo 10, 12, 15, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 o 100 nucleótidos de longitud.

En general, se pueden usar uno o más pares de cebadores en una reacción de amplificación exponencial; un cebador de un par de cebadores puede ser un cebador directo y un cebador de un par de cebadores puede ser un cebador inverso. En algunas realizaciones, se puede usar un primer par de cebadores en la reacción de amplificación exponencial; un cebador del primer par puede ser un cebador directo complementario a una secuencia de una primera molécula de polinucleótido matricial y un cebador del primer par puede ser un cebador inverso complementario a una segunda secuencia de la primera molécula de polinucleótido matricial, y un primer locus de la matriz puede encontrarse entre la primera secuencia y la segunda secuencia. En algunas realizaciones, se puede usar un segundo par de cebadores en la reacción de amplificación; un cebador del segundo par puede ser un cebador directo complementario a una primera secuencia de una segunda molécula de polinucleótido diana y un cebador del segundo par puede ser un cebador inverso complementario a una segunda secuencia de la segunda molécula de polinucleótido diana, y un segundo locus de la diana puede encontrarse entre la primera secuencia y la segunda secuencia. En algunas realizaciones, el segundo locus de la diana comprende una secuencia variable de cadena ligera de anticuerpo. En algunas realizaciones, se puede usar un tercer par de cebadores en la reacción de amplificación; un cebador del tercer par puede ser un cebador directo complementario a una primera secuencia de una tercera molécula de polinucleótido matriz y un cebador del tercer par puede ser un cebador inverso complementario a una segunda secuencia de la tercera molécula de polinucleótido matriz, y un tercer locus de la matriz puede encontrarse entre la primera secuencia y la segunda secuencia.

El uno o más cebadores pueden hibridarse al menos a una porción de una pluralidad de polinucleótidos matriciales. El uno o más cebadores pueden hibridarse al extremo 3' y/o el extremo 5' de la pluralidad de polinucleótidos matriciales. El uno o más cebadores pueden hibridarse a una región interior de la pluralidad de polinucleótidos matriciales. La región interior puede tener al menos aproximadamente 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41,42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 150, 200, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos desde los extremos 3' o los extremos 5' de la pluralidad de polinucleótidos matriciales. El uno o más cebadores pueden comprender un grupo fijo de cebadores. El uno o más cebadores pueden comprender al menos uno o más cebadores personalizados. El uno o más cebadores pueden comprender al menos uno o más cebadores de control. El uno o más cebadores pueden comprender al menos uno o más cebadores de genes constitutivos. El uno o más cebadores pueden comprender un cebador universal. El cebador universal puede hibridarse a un sitio de unión del cebador universal. En algunas realizaciones, el uno o más cebadores personalizados se hibridan a una SBC, una región específica de la diana, complementos de las mismas o cualquier combinación de las mismas. El uno o más cebadores pueden comprender un cebador universal. El uno o más cebadores se pueden diseñar para amplificar o realizar la extensión del cebador, la transcripción inversa, la extensión lineal, la amplificación no exponencial, la amplificación exponencial, la PCR o cualquier otro procedimiento de amplificación de uno o más polinucleótidos diana o matriciales.

La región específica de la diana puede comprender al menos aproximadamente 1, 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 150, 200, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 o 1000 nucleótidos o pares de bases. En otro ejemplo, la región específica de la diana comprende al menos aproximadamente 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500 o 10000 nucleótidos o pares de bases. En algunas realizaciones, la región específica de la diana comprende aproximadamente 5-10, 10-15, 10-20, 10-30, 15-30, 10-75, 15-60, 15-40, 18-30, 20-40, 21-50, 22-45, 25-40, 7-9, 12-15, 15-20, 15-25, 15-30, 15-45, 15-50, 15-55, 15-60, 20-25, 20-30, 20-35, 20-45, 20-50, 20-55, 20-60, 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25 400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100-800, 100-700, 100-600, 100-500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900, 700-800, 800-1000, 800-900 o 900 1000 nucleótidos o pares de bases.

Los cebadores se pueden diseñar según parámetros conocidos para evitar las estructuras secundarias y la autohibridación. En algunas realizaciones, diferentes pares de cebadores pueden hibridarse y fundirse aproximadamente a las mismas temperaturas, por ejemplo, a 1 °C, 2 °C, 3 °C, 4 °C, 5 °C, 6 °C, 7 °C, 8 °C, 9 °C o 10 °C de otro par de cebadores. En algunas realizaciones, uno o más cebadores de una pluralidad de cebadores pueden hibridarse y fundirse aproximadamente a las mismas temperaturas, por ejemplo, a 1, 2, 3, 4, 5, 6 , 7, 8, 9 o 10 °C de otro cebador de la pluralidad de cebadores. En algunas realizaciones, uno o más cebadores de una pluralidad pueden hibridarse y fundirse a diferentes temperaturas que otro cebador de la pluralidad de cebadores.

Una pluralidad de cebadores para una o más etapas de los procedimientos descritos en esta memoria puede comprender una pluralidad de cebadores que comprende aproximadamente, como máximo aproximadamente o al menos aproximadamente 1, 2, 3, 4, 5, 6 , 7, 8 , 9 , 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700 , 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11 000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, 19000, 20000, 30000, 40000 , 50000, 60000, 70 000, 80000, 90000, 100000, 200000, 300000, 400000, 500000, 600000, 700000, 800000, 900000, 1000000, 50 000 000, 100000 000 cebadores diferentes. Por ejemplo, cada cebador de una pluralidad de cebadores puede comprender una región o secuencia específica de la diana o la matriz diferente.

SECUENCIACIÓN

Después de realizar uno o más de los procedimientos o etapas de los procedimiento descritos en esta memoria, se puede secuenciar una colección de polinucleótidos generada.

La secuenciación se puede realizar mediante cualquier procedimiento de secuenciación conocido en la técnica. En algunas realizaciones, la secuenciación se puede realizar con alto rendimiento. Las tecnologías de secuenciación de nueva generación adecuadas incluyen la plataforma de 454 Life Sciences (Roche, Branford, CT) (Margulies y col., Nature, 437, 376-380 (2005)); el analizador de genoma de Illumina, el ensayo de metilación GoldenGate o ensayos de metilación Infinium, es decir, la matriz de perlas Infinium HumanMethylation 27K o la matriz de metilación VeraCode GoldenGate (Illumina, San Diego, CA; Bibkova y col., Genome Res. 16, 383-393 (2006); y las patentes de los Estados Unidos n.° 6306597, 7598035, 7232656), o la secuenciación de ADN mediante ligación, el sistema SOLiD (aplicado Biosystems/Life Tecnologías; las patentes de los Estados Unidos n.° 6 797470, 7083917, 7166434, 7320865, 7 332 285, 7364 858 y 7429 453); o la tecnología de secuenciación de ADN True Single-Molecule Sequencing de Helicos (Harris y col., Science, 320, 106-109 (2008); y las patentes de los Estados Unidos n.° 7037687, 7645596, 7 169 560 y 7769 400), la tecnología secuenciación de moléculas individuales en tiempo real (SMRTTm) de Pacific Biosciences, y la secuenciación (Soni y col., Clin. Chem. 53, 1996-2001 (2007)). Estos sistemas permiten la secuenciación múltiple en paralelo de muchos polinucleótidos aislados de una muestra (Dear, Brief Funct. Genomic Proteomic, 1(4), 397-416 (2003) y McCaughan y col., J. Pathol., 220, 297-306 (2010)). En algunas realizaciones, los polinucleótidos se secuencian mediante secuenciación por ligación de sondas modificadas con colorantes, pirosecuenciación o secuenciación de moléculas individuales. La determinación de la secuencia de un polinucleótido se puede realizar mediante procedimientos de secuenciación tales como la secuenciación de moléculas individuales Helioscope™, la secuenciación de ADN por nanoporos, la secuenciación paralela masiva de la firma (MPSS) de Lynx Therapeutics, la pirosecuenciación 454, la secuenciación en tiempo real de moléculas individuales (RNAP), la secuenciación Illumina (Solexa), la secuenciación SOLiD, Ion Torrent™, la secuenciación mediante semiconductores iónicos, la secuenciación SMRT™ de moléculas individuales, la secuenciación de colonias de polimerasa, la secuenciación mediante nanoesferas de ADN y la estrategia de VisiGen Biotechnologies. Alternativamente, la determinación de la secuencia de polinucleótidos puede usar plataformas de secuenciación, que incluyen, pero no se limitan a, Genome Analyzer IIx, HiSeq y MiSeq ofrecidas por Illumina, la tecnología de secuenciación en tiempo real de moléculas individuales (SMRT™), tal como el sistema PacBio RS ofrecido por Pacific Biosciences (California) y el Solexa Sequencer, la tecnología de secuenciación de moléculas individuales reales (tSMS™), tal como el secuenciador HeliScope™ Sequencer ofrecido por Helicos Inc. (Cambridge, MA). La secuenciación puede comprender secuenciación en MiSeq. La secuenciación puede comprender secuenciación en HiSeq. En algunas realizaciones, la determinación de la secuencia de un polinucleótido comprende la secuenciación de extremos apareados, la secuenciación de nanoporos, la secuenciación de alto rendimiento, la secuenciación aleatoria, la secuenciación con terminador de colorante, la secuenciación de ADN con múltiples cebadores, el paseo con cebador, la secuenciación con terminadores didesoxi de Sanger, la secuenciación de Maxim-Gilbert, la pirosecuenciación, la secuenciación de moléculas individuales reales o cualquier combinación de las mismas. Alternativamente, la secuencia de un polinucleótido se puede determinar mediante microscopía electrónica o mediante una matriz de transistores de efecto de campo químicamente sensibles (chemFET).

Un procedimiento puede comprender además secuenciar uno o más polinucleótidos de la colección. Un procedimiento puede comprender además alinear una o más secuencias de polinucleótidos, lecturas de secuencias, secuencias de amplicones o secuencias de conjuntos de amplicones de la colección entre sí.

Como se emplea en esta memoria, alinear comprende comparar una secuencia de prueba, tal como una lectura de secuencia, con una o más secuencias de prueba distintas, secuencias de referencia o una combinación de las mismas. En algunas realizaciones, la alineación se puede usar para determinar una secuencia consenso a partir de una pluralidad de secuencias o secuencias alineadas. En algunas realizaciones, alinear comprende determinar una secuencia consenso a partir de una pluralidad de secuencias que tienen cada una de ellas un código de barras molecular o un código de barras del recipiente idéntico. En algunas realizaciones, la longitud de una secuencia alineada a efectos comparativos es al menos 30 %, al menos 40 %, al menos 50 %, al menos 60 %, al menos 70 %, al menos 80 %, al menos 90 %, o al menos 95 % de la longitud de una secuencia de referencia. La comparación real de las dos o más secuencias se puede lograr mediante procedimientos muy conocidos, por ejemplo, usando un algoritmo matemático. Un ejemplo no limitante de tal algoritmo matemático se describe en Karlin, S. y Altschul, S., Proc. Natl. Acad. Sci. USA, 90-5873-5877 (1993). Tal algoritmo está incorporado en los programas NBLAST y XBLAST (versión 2.0), como se describe en Altschul, S. y col., Nucleic Acids Res., 25:3389-3402 (1997). Cuando se utilizan los programas BLAST y Gapped BLAST, se pueden usar todos los parámetros relevantes de los programas correspondientes (p. ej., NBLAST). Por ejemplo, los parámetros para la comparación de secuencias se pueden ajustar a puntuación = 100, longitud de la palabra = 12, o se pueden variar (p. ej., W = 5 o W = 20). Otros ejemplos incluyen el algoritmo de Myers y Miller, cAb IOS (1989), AdVa NCE, ADAM, b La T y FASTA. En algunas realizaciones, el porcentaje de identidad entre dos secuencias aminoacídicas se puede lograr usando, por ejemplo, el programa GAP del paquete de software GCG (Accelrys, Cambridge, Reino Unido).

La secuenciación puede comprender secuenciar al menos aproximadamente 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 o más nucleótidos o pares de bases de los polinucleótidos. En algunas realizaciones, la secuenciación comprende secuenciar al menos aproximadamente 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más nucleótidos o pares de bases de los polinucleótidos. En otros casos, la secuenciación comprende secuenciar al menos aproximadamente 1500, 2000 , 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10 000 o más nucleótidos o pares de bases de los polinucleótidos.

La secuenciación puede comprender secuenciar al menos aproximadamente 200, 300, 400, 500, 600, 700, 800, 900, 1000 o más lecturas de secuenciación por ciclo. Como se emplea en esta memoria, una lectura de secuencia comprende una secuencia de nucleótidos determinada a partir de una secuencia o un flujo de datos generados mediante una técnica de secuenciación. En algunas realizaciones, la secuenciación comprende secuenciar al menos aproximadamente 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000 o más lecturas de secuenciación por ciclo. La secuenciación puede comprender más de, menos de o igual a, aproximadamente 1000000000 lecturas de secuenciación por ciclo. La secuenciación puede comprender más de, menos de o igual a, aproximadamente 200 000 000 lecturas de secuenciación por ciclo.

En algunas realizaciones, el número de lecturas de secuencia usadas para determinar una secuencia consenso es de aproximadamente 2-1000 lecturas de secuencia. Por ejemplo, el número de lecturas de secuencia usadas para determinar una secuencia consenso puede ser de aproximadamente 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25-400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100- 800, 100-700, 100-600, 100-500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400- 700, 400-600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900, 700-800, 800-1000, 800-900 o 900-1000 lecturas de secuencia. En algunas realizaciones, el número de lecturas de secuencia usadas para determinar una secuencia consenso es al menos aproximadamente 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11 000, 12000, 13000, 14000, 15000, 16 000, 17000, 18000, 19000, 20000, 25000, 30000, 35000, 40000, 45000, 50000, 55000, 60000, 65000, 70000, 75 000, 80000, 85000, 90000, 95000, 100000, 150000, 200000, 250000, 300000, 350000, 400000, 450000, 500 000, 550000, 600000, 650000, 700000, 750000, 800000, 850000, 900000, 950000, 1000000, 50000000 o 100000000 lecturas. En algunas realizaciones, el número de lecturas de secuencia usadas para determinar una secuencia consenso es como máximo aproximadamente 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11 000, 12000, 13000, 14000, 15000, 16000, 17000, 18000, 19000, 20000, 25000, 30000, 35 000, 40000, 45000, 50000, 55000, 60000, 65000, 70000, 75000, 80000, 85000, 90000, 95000, 100000, 150 000, 200000, 250000, 300000, 350000, 400000, 450000, 500000, 550000, 600000, 650000, 700000, 750000, 800 000, 850000, 900000, 950000, 1000000, 50000000 o 100000000 lecturas.

Un procedimiento puede comprender la secuenciación de lecturas erróneas. Un procedimiento puede comprender determinar el número de lecturas erróneas, tal como para determinar una condición de reacción o diseñar secuencias de cebadores. La comparación del número de lecturas erróneas generadas con una o más primeras condiciones o conjuntos de condiciones se puede usar para determinar una condición o un conjunto de condiciones preferido. Por ejemplo, se puede llevar a cabo un primer procedimiento con una concentración salina alta durante una reacción PCR y se puede llevar a cabo un segundo procedimiento con una concentración salina baja durante una reacción PCR, donde el primer y segundo procedimientos se llevan a cabo sustancialmente de la misma manera, aparte de la diferencia de concentración salina. Si el primer procedimiento da como resultado un número superior de lecturas erróneas, tal como un número superior de lecturas erróneas para una secuencia de polinucleótidos diana o un cebador particular, se puede determinar que una condición salina inferior de reacción es preferida para esa secuencia de polinucleótidos diana o ese cebador particular.

DIAGNOSTICO

En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto. En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto, en base a la presencia, la ausencia o el nivel de un polinucleótido diana. En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto, en base a la presencia, la ausencia o el nivel de uno o más polinucleótidos diana.

En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto en base a la presencia, la ausencia, el nivel o la secuencia de una o más de las secuencias obtenidas usando los procedimientos descritos en esta memoria. Por ejemplo, un diagnóstico de una enfermedad se puede hacer en base a la presencia, la ausencia, el nivel o la secuencia de una variante de secuencia obtenida usando los procedimientos descritos en esta memoria. En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto en base a la presencia, la ausencia, el nivel o la secuencia, o una o más de las lecturas de secuencia obtenidas usando los procedimientos descritos en esta memoria. En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto en base a la presencia, la ausencia, el nivel o la secuencia de una o más de las secuencias consenso obtenidas usando los procedimientos descritos en esta memoria. En algunas realizaciones, un procedimiento puede comprender además diagnosticar, pronosticar, monitorizar, tratar, mejorar y/o impedir una enfermedad, trastorno, síntoma y/o afección en un sujeto en base a la determinación de un nivel (p. ej., una cantidad o concentración) de un polinucleótido diana en una muestra. El nivel de un polinucleótido diana en una muestra se puede determinar en base a una o más lecturas de secuencia, secuencias, secuencias consenso o cualquier combinación de las mismas. Un nivel de cada uno de una pluralidad de polinucleótidos diana en una muestra se puede determinar usando los procedimientos descritos en esta memoria. Un nivel de cada uno de una pluralidad de polinucleótidos diana en una muestra se puede determinar en base a varias lecturas de secuencia, secuencias, secuencias consenso o cualquier combinación de las mismas de cada polinucleótido diana de la pluralidad. Por ejemplo, un nivel de un primer polinucleótido diana y un nivel de un segundo polinucleótido diana se puede determinar usando los procedimientos descritos en esta memoria.

En algunas realizaciones, el primer y segundo polinucleótidos diana de una pluralidad de polinucleótidos diana son iguales. Por ejemplo, un primer polinucleótido diana puede comprender una primera copia de una molécula de ARNm y un segundo polinucleótido diana puede comprender una segunda copia de una molécula de ARNm. En algunas realizaciones, el primer y segundo polinucleótidos diana son diferentes. Por ejemplo, un primer polinucleótido diana puede comprender una primera molécula de ARNm y un segundo polinucleótido diana puede comprender una segunda molécula de ARNm transcrita a partir de un gen diferente al de la primera molécula de ARNm. Por ejemplo, un primer polinucleótido diana puede comprender un primer alelo y un segundo polinucleótido diana puede comprender un segundo alelo. Por ejemplo, un primer polinucleótido diana puede comprender una secuencia de tipo natural y un segundo polinucleótido diana puede comprender una variante de secuencia.

En algunas realizaciones, un procedimiento puede comprender además diagnosticar o pronosticar una enfermedad, trastorno, síntoma y/o afección a un sujeto con al menos 50 % de confianza. Por ejemplo, un diagnóstico o pronóstico de una enfermedad, trastorno, síntoma y/o afección de un sujeto se puede determinar con al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % o 100 % de confianza. En algunas realizaciones, un diagnóstico o pronóstico de una enfermedad, trastorno, síntoma y/o afección de un sujeto se puede determinar con un 50 %-100 % de confianza. Por ejemplo, un diagnóstico o pronóstico de una enfermedad, trastorno, síntoma y/o afección de un sujeto se puede determinar con un 60 %-100 %, 70 %-100 %, 80 %-100 %, 90 %-100 %, 50 %-90 %, 50 %-80 %, 50 %-70 %, 50 %-60 %, 60 %-90 %, 60 %-80 %, 60 %-70 %, 70 %-90 %, 70 %-80 % u 80 %-90 % de confianza.

En algunas realizaciones, la presencia, ausencia, nivel, secuencia, o cualquier combinación de los mismos, de un polinucleótido diana en el sujeto, tal como un biomarcador, se puede determinar con al menos 50 % de confianza. Por ejemplo, la presencia, ausencia, nivel, secuencia, o cualquier combinación de los mismos, de un polinucleótido diana en el sujeto se puede determinar con al menos 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 98 %, 99 % o 100 % de confianza. En algunas realizaciones, la presencia, ausencia, nivel, secuencia, o cualquier combinación de los mismos, de un polinucleótido diana en el sujeto se puede determinar con un 50 %-100 % de confianza. Por ejemplo, la presencia, ausencia, nivel, secuencia, o cualquier combinación de los mismos, de un polinucleótido diana en el sujeto se puede determinar con un 60 %-100 %, 70 %-100 %, 80 %-100 %, 90 %-100 %, 50 %-90 %, 50 %-80 %, 50 %-70 %, 50 %-60 %, 60 %-90 %, 60 %-80 %, 60 %-70 %, 70 %-90 %, 70 %-80 % u 80 %-90 % de confianza.

ENZIMAS

Los procedimientos y kits descritos en esta memoria pueden comprender una o más enzimas. Los ejemplos de enzimas incluyen, pero no se limitan a ligasas, transcriptasas inversas, polimerasas y nucleasas de restricción. En algunas realizaciones, la fijación de un adaptador a loa polinucleótidos comprende el uso de una o más ligasas. Los ejemplos de ligasas incluyen, pero no se limitan a, ADN ligasas, tales como ADN ligasa I, ADN ligasa III, ADN ligasa IV y ADN ligasa T4, y ARN ligasas, tales como ARN ligasa I T4 y ARN ligasa II T4.

Los procedimientos y kits descritos en esta memoria pueden comprender además el uso de una o más transcriptasas inversas. En algunas realizaciones, la transcriptasa inversa es una transcriptasa inversa de VIH-1, una transcriptasa inversa de M-MLV, una transcriptasa inversa de AMV y una transcriptasa inversa de telomerasa. En algunas realizaciones, la transcriptasa inversa es la transcriptasa inversa de M-MLV.

En algunas realizaciones, los procedimientos y kits descritos en esta memoria comprenden el uso de una o más proteasas.

En algunas realizaciones, los procedimientos y kits descritos en esta memoria comprenden el uso de una o más polimerasas. Los ejemplos de polimerasas incluyen, pero no se limitan a, ADN polimerasas y ARN polimerasas. En algunas realizaciones, la ADN polimerasa es una ADN polimerasa I, ADN polimerasa II, holoenzima de ADN polimerasa III y ADN polimerasa IV. Las ADN polimerasas comercializadas incluyen, pero no se limitan a, ADN polimerasa Bst 2.0, ADN polimerasa Bst 2.0 WarmStart™, ADN polimerasa Bst, A^dN polimerasa IV Sulfolobus, ADN polimerasa Taq, ADN polimerasa 9°N™m, ADN polimerasa Deep VentR™ (exo-), ^aDⁿpolimerasa Deep VentR™, Hemo KlenTaq™, ADN polimerasa Taq LongAmp®, ADN polimerasa OneTaq®, ADN polimerasa Phusion®, ADN polimerasa de alta fidelidad Q5™, ADN polimerasa ^yTherminator™, ADN polimerasa Therminator™, ADN polimerasa II Therminator™, ADN polimerasa III Therminator™, ADN polimerasa VentR®, ADN polimerasa VentR® (exo-), ADN polimerasa Bsu, ADN polimerasa phi29, ADN polimerasa T4, ADN polimerasa T7, transferasa terminal, polimerasa Taq Titanium®, ADN polimerasa Taq KAPA y ADN polimerasa de inicio en caliente KAPA.

En algunas realizaciones, la polimerasa es una ARN polimerasa, tal como ARN polimerasa I, ARN polimerasa II, ARN polimerasa III, poli(A) polimerasa de E. coli Poli, ARN polimerasa phi6 (RdRP), poli(U) polimerasa, ARN polimerasa SP6 y ARN polimerasa T7.

REACTIVOS ADICIONALES

Los procedimientos y kits descritos en esta memoria pueden comprender el uso de uno o más reactivos. Los ejemplos de reactivos incluyen, pero no se limitan a, reactivos de PCR, reactivos de ligación, reactivos de transcripción inversa, reactivos enzimáticos, reactivos de hibridación, reactivos de preparación de muestras, reactivos de captura por afinidad, soportes sólidos, tales como perlas, y reactivos para la purificación y/o el aislamiento de ácidos nucleicos.

Un soporte sólido puede comprender prácticamente cualquier material insoluble o sólido, y a menudo se selecciona una composición de soporte sólido que es insoluble en agua. Por ejemplo, un soporte sólido puede comprender o consistir esencialmente en gel de sílice, vidrio (p. ej., vidrio de poro controlado (CPG)), nailon, Sephadex®, Sepharose®, celulosa, una superficie metálica (p. ej., acero, oro, plata, aluminio, silicio y cobre), un material magnético, un material plástico (p. ej., polietileno, polipropileno, poliamida, poliéster, difluoruro de polivinilideno (PVDF)) y similares. Los ejemplos de perlas para uso según las realizaciones pueden incluir un resto de afinidad que permite que la perla interactúe con una molécula de ácido nucleico. Una fase sólida (p. ej., una perla) puede comprender un miembro de un par de unión (p. ej., avidina, estreptavidina o un derivado de las mismas). Por ejemplo, la perla puede ser una perla recubierta con estreptavidina y una molécula de ácido nucleico para la inmovilización sobre la perla puede incluir un resto de biotina. En algunos casos, cada molécula de polinucleótido puede incluir dos restos de afinidad, tales como biotina, para estabilizar adicionalmente el polinucleótido. Las perlas pueden incluir características adicionales para su uso en la inmovilización de ácidos nucleicos o que se pueden usar en procedimientos de cribado o selección posteriores. Por ejemplo, la perla puede incluir un resto de unión, un marcador fluorescente o un extintor de la fluorescencia. En algunos casos, la perla puede ser magnética. En algunos casos, el soporte sólido es una perla. Los ejemplos de perlas incluyen, pero no se limitan a, perlas de estreptavidina, perlas de agarosa, perlas magnéticas, Dynabeads®, microperlas MACS®, perlas conjugadas a anticuerpos (p. ej., microperlas antiinmunoglobulina), perlas conjugadas a proteína A, perlas conjugadas a proteína G, perlas conjugadas a proteína A/G, perlas conjugadas a proteína L, perlas conjugadas a polinucleótido-dT, perlas de sílice, perlas similares a la sílice, microperlas de antibiotina, microperlas de antifluorocromo y perlas magnéticas terminadas en carboxi BcMag™. Las perlas o partículas pueden hinchables (p. ej., perlas poliméricas tales como la resina Wang) o no hinchables (p. ej., CPG). En algunas realizaciones, una fase sólida es sustancialmente hidrófila. En algunas realizaciones, una fase sólida (p. ej., una perla) es sustancialmente hidrófoba. En algunas realizaciones, una fase sólida comprende un miembro de un par de unión (p. ej., avidina, estreptavidina o un derivado de las mismas) y es sustancialmente hidrófoba o sustancialmente hidrófila. En algunas realizaciones, una fase sólida comprende un miembro de un par de unión (p. ej., avidina, estreptavidina o un derivado de las mismas) y tiene una capacidad de unión mayor de aproximadamente 1350 picomoles de agente de captura libre (p. ej., biotina libre) por mg de soporte sólido. En algunas realizaciones, la capacidad de unión de la fase sólida que comprende un miembro de un par de unión es mayor de 800, 900, 1000, 1100, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1600, 1800, 2000 picomoles de agente de captura libre por mg de soporte sólido. Otros ejemplos de perlas que son adecuadas para la invención son coloides de oro o perlas, tales como perlas de poliestireno o perlas de sílice. Se puede usar sustancialmente cualquier radio de las perlas. Los ejemplos de perlas pueden incluir perlas que tienen un radio que varía de 150 nanómetros a 10 micrómetros. También se pueden usar otros tamaños.

Los procedimientos y kits descritos en esta memoria pueden comprender el uso de uno o más tampones. Los ejemplos de tampones incluyen, pero no se limitan a, tampones de lavado, tampones de ligación, tampones de hibridación, tampones de amplificación y tampones de transcripción inversa. En algunas realizaciones, el tampón de hibridación es un tampón comercializado, tal como solución TMAC Hyb, solución de hibridación SSPE y tampón de hibridación ECONO™. Los tampones descritos en esta memoria pueden comprender uno o más detergentes.

Los procedimientos y kits descritos en esta memoria pueden comprender el uso de uno o más vehículos. Los vehículos pueden potenciar o mejorar la eficacia de una o más reacciones descritas en esta memoria (p. ej., reacción de ligación, transcripción inversa, amplificación, hibridación). Los vehículos pueden disminuir o impedir la pérdida inespecífica de las moléculas o cualquier producto de las mismas (p. ej., un polinucleótido y/o amplicón). Por ejemplo, el vehículo puede disminuir la pérdida inespecífica de un polinucleótido mediante la absorción a superficies. El vehículo puede disminuir la afinidad de un polinucleótido por una superficie o un sustrato (p. ej., envase, tubo Eppendorf, punta de pipeta). Alternativamente, el vehículo puede aumentar la afinidad de un polinucleótido por una superficie o un sustrato (p. ej., envase, matriz, vidrio, portaobjetos, chip). Los vehículos pueden proteger al polinucleótido de la degradación. Por ejemplo, los vehículos pueden proteger a una molécula de ARN de las ribonucleasas. Alternativamente, los vehículos pueden proteger a una molécula de ADN de una desoxirribonucleasa. Los ejemplos de vehículos incluyen, pero no se limitan a, polinucleótidos, tales como ADN y/o ARN, o polipéptidos. Los ejemplos de vehículos de ADN incluyen plásmidos, vectores, ADN poliadenilado y polinucleótidos de ADN. Los ejemplos de vehículos de ARN incluyen A^rN poliadenilado, ARN de fago, ARN de fago MS2, ARN de E. coli, ARN de levadura, ARNt de levadura, ARN de mamífero, ARNt de mamífero, ribonucleótidos sintéticos poliadenilados cortos y polinucleótidos de ARN. El vehículo de ARN puede ser un ARN poliadenilado. Alternativamente, el vehículo de ARN puede ser un ARN no poliadenilado. En algunas realizaciones, el vehículo es de una bacteria, una levadura o un virus. Por ejemplo, el vehículo puede ser un polinucleótido o un polipéptido obtenido de una bacteria, una levadura o un virus. Por ejemplo, el vehículo es una proteína de Bacillus subtilis. En otro ejemplo, el vehículo es un polinucleótido de Escherichia coli. Alternativamente, el vehículo es un polinucleótido o un péptido de un mamífero (p. ej., humano, ratón, cabra, rata, vaca, oveja, cerdo, perro o conejo), ave, anfibio o reptil.

Los procedimientos y kits descritos en esta memoria pueden comprender el uso de uno o más agentes de control. Los agentes de control pueden incluir polinucleótidos de control, enzimas inactivas, competidores inespecíficos. Alternativamente, los agentes de control comprenden hibridación brillante, controles de sondas brillantes, matrices de ácido nucleico, controles de enriquecimiento, controles de amplificación por PCR. Los controles de amplificación por PCR pueden ser controles positivos. En otros casos, los controles de amplificación por PCR son controles negativos. Los controles de matriz de ácido nucleico pueden ser de concentraciones conocidas. Los agentes de control pueden comprender uno o más marcadores.

Los controles de enriquecimiento pueden ser matrices que se añaden a una reacción o una muestra. Por ejemplo, se puede añadir una matriz de enriquecimiento a una reacción de amplificación. La matriz de enriquecimiento se puede añadir a la reacción de amplificación en cualquier momento después del primer ciclo de amplificación. En algunas realizaciones, la matriz de enriquecimiento se añade a una reacción de amplificación después del ciclo número 2, 3, 4, 5, 6 , 7, 8 , 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45 o 50. La matriz de enriquecimiento se puede añadir a la reacción de amplificación en cualquier momento antes del último ciclo de amplificación. La matriz de enriquecimiento puede comprender uno o más nucleótidos o pares de bases de ácidos nucleicos. La matriz de enriquecimiento puede comprender ADN, ARN o cualquier combinación de los mismos. La matriz de enriquecimiento puede comprender uno o más marcadores.

En esta memoria se describen moléculas, materiales, composiciones y componentes que se pueden usar para, se pueden usar junto con, se pueden usar en la preparación de, o son productos de procedimientos y composiciones descritos en esta memoria. Se entiende que, cuando se describen combinaciones, subconjuntos, interacciones, grupos, etc., de estos materiales y aunque no se pueda describir explícitamente una referencia específica de cada una de las diversas combinaciones y permutaciones individuales y colectivas de estas moléculas y compuestos, cada una se contempla específicamente y se describe en esta memoria. Por ejemplo, si se describe y menciona un nucleótido o un ácido nucleico y se describen varias modificaciones que se pueden hacer a varias moléculas que incluyen el nucleótido o el ácido nucleico, todas y cada una de las combinaciones y permutaciones del nucleótido o el ácido nucleico y las modificaciones que sean posibles están contempladas específicamente, a menos que se indique específicamente lo contrario. Este concepto se aplica a todos los aspectos de esta solicitud lo que incluye, pero no se limita a, las etapas de los procedimientos para realizar y usar los procedimientos y las composiciones descritos. Por tanto, si hay un abanico de etapas adicionales que se pueden realizar, se entiende que cada una de estas etapas adicionales se puede realizar con cualquier realización o combinación de realizaciones específica de los procedimientos descritos, y que cada una de tales combinaciones está específicamente contemplada y se debe considerar descrita.

Aunque algunas realizaciones descritas en esta memoria se han presentado y descrito en esta memoria, tales realizaciones se proporcionan solo a modo de ejemplo. A los expertos en la materia se les ocurrirán numerosas variaciones, cambios y sustituciones sin apartarse de la descripción proporcionada en esta memoria. Se debe entender que se pueden emplear diversas alternativas a las realizaciones descritas en esta memoria para poner en práctica las realizaciones descritas en esta memoria.

A menos que se indique de otro modo, todos los términos técnicos y científicos usados en esta memoria tienen el mismo significado que entiende habitualmente un experto en la materia a la que pertenece esta descripción. Las siguientes referencias describen procedimientos y composiciones que se pueden usar en esta invención: The Merck Manual of Diagnosis and Therapy, 18a edición, publicado por Merck Research Laboratories, 2006 (ISBN 0-9119102); Benjamin Lewin, Genes IX, publicado por Jones & Bartlett Publishing, 2007 (ISBN-13: 9780763740634); Kendrew y col. (eds.), The Encyclopedia of Mol. Biology, published by Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9) y Robert A. Meyers (ed.), Mol. Biology and Biotechnology: a Comprehensive Desk Reference, publicada por VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8).

Los procedimientos estándar de la presente descripción se describen en, p. ej., Maniatis y col., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., EE. UU. (1982); Sambrook y col., Molecular Cloning: A Laboratory Manual (2a ed.), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., EE. UU. (1989); Davis y col., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., Nueva York, EE. UU. (1986) o Methods in Enzymology: Guide to Molecular Cloning Techniques Vol. 152, S. L. Berger and A. R. Kimmerl (eds.), Academic Press Inc., San Diego, EE. UU. (1987)). Current Protocols in Molecular Biology (CPMB) (Fred M. Ausubel, y col. Ed., John Wiley and Sons, Inc.), Current Protocols in Protein Science (CPPS) (John E. Coligan, y col., ed., John Wiley and Sons, Inc.), Current Protocols in Immunology (CPI) (John E. Coligan y col., ed. John Wiley and Sons, Inc.), Current Protocols in Cell Biology (CPCB) (Juan S. Bonifacino y col.. Ed., John Wiley and Sons, Inc.), Culture of Animal Cells: A Manual of Basic Technique by R. Ian Freshney, Publisher: Wiley-Liss; 5a edición (2005) y en los procedimientos de cultivo de células animales (Methods in Cell Biology, Vol. 57, Jennie P. Mather y David Barnes editors, Academic Press, 1a edición, 1998).

EJEMPLOS

Ejemplo 1a - Protocolo para preparar células para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsiones.

Se obtuvieron poblaciones de células de interés. Estas incluyeron PBMC totales, células clasificadas, células B o T enriquecidas con anticuerpos u otros tipos de células. Las células tenían una membrana plasmática intacta para que no filtraran cantidades excesivas de ARNm al medio circundante. Las células no necesitaban ser viables.

Las células se lavaron mediante centrifugación (200 g durante 10 min para las células T o células B) dos veces en tampón celular: 1 x solución salina tamponada con fosfato de Dulbecco (PBS). Las células se diluyeron a continuación en tampón celular hasta una concentración de células de 3,5 x 106/mL. La solución se pipeteó a continuación a través de un filtro celular de 20 pm.

Ejemplo 1b - Protocolo para preparar tejidos sólidos para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsiones.

Se trató un tejido sólido (p. ej., una muestra de biopsia tumoral o no tumoral) con diversas proteasas, que incluían colagenasa III (200 U/mL), DNasa I (200 U/mL) y tripsina (5 mg/mL), y un NEDB (Invitrogen) para producir una mezcla de células individuales y agregados que contienen más de una célula. Brevemente, los tumores extraídos de ratones se añadieron a medios de cultivo fríos y se extrajo el tejido mamario y la grasa circundante de los ratones. Los tumores se trituraron en fragmentos de 2-4 mm, que a continuación se incubaron con las soluciones o enzimas de disociación apropiadas durante 30 min a 37 °C. Los fragmentos tumorales se mezclaron agitando hacia arriba y hacia abajo cada 10 min usando una micropipeta de 1000 mL con un corte en la punta a un diámetro adaptado al tamaño del fragmento tumoral. Después de cada período de incubación, los fragmentos se filtraron a través de un filtro celular de malla de nailon de 40 mm. Las células liberadas se centrifugaron a 1200 r.p.m. durante 2 min y se almacenaron en medio frío con 30 % de FCS a 4 °C. Se añadió solución de disociación recién preparada a los fragmentos de tejido restantes durante 30 min. La disociación se detuvo cuando no se liberaban células adicionales. Los fragmentos se hicieron pasar a través de un tamiz y todas las células de todos los períodos de incubación se agruparon y contaron. Las suspensiones celulares se filtraron a continuación a través de un filtro (p. ej., 10, 20, 30, 40 pm) para retirar los agregados grandes. Las células se lavaron mediante centrifugación (200 g durante 10 min para las células T o células B) dos veces en tampón celular: 1 x solución salina tamponada con fosfato (PBS) de Dulbecco. La población de células no se tiñó, clasificó ni separó de otro modo antes del análisis mediante emulsión.

También se realizó un procedimiento alternativo para preparar los tumores retirados. Los tumores retirados se colocaron en 1 mL de tampón de disociación 1 (100 U/ml de colagenasa tipo IV y 100 pg/mL de DNasa en RPMI 10 % de FBS) o tampón de disociación 2 (medio RPMI suplementado con 5 % de FBS, colagenasa tipo I (200 U/mL) y DNasa I (100 pg/mL)) y se incubaron durante 30 min a 37 °C. Si se iban a aislar posteriormente células mieloides, el 5 % de FBS y la colagenasa tipo I se sustituían en el tampón de disociación 2 por 10 % de FBS y colagenasa tipo IV (200 U/ml), respectivamente. Los fragmentos tumorales se mezclaron agitando hacia arriba y hacia abajo usando una micropipeta de 1000 mL. La suspensión se filtró a continuación a través de un filtro de 70 pm y se lavó 3x con tampón de separación MACS suplementado con 10 % de FBS para el aislamiento de células mieloides. Para tumores muy grandes (>300 mm2), las células inflamatorias se pueden enriquecer previamente mediante centrifugación en gradiente de densidad (Percoll o Ficoll). La suspensión celular filtrada se centrifugó a continuación a 400 g durante 10 min. El sedimento se lavó con 10 mL de tampón MACS y se centrifugó de nuevo con los mismos ajustes.

Ejemplo 2 - Protocolo para preparar la mezcla de reacción de emulsión para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Se mezcló una mezcla de reacción de emulsión que contenía los reactivos y oligonucleótidos de la Tabla 1 siguiente a temperatura ambiente en una campana limpia de PCR.

Tabla 1

Ejemplo 3 - Protocolo para generar emulsiones para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Una vez preparadas las células y la mezcla de reacción, se formó la emulsión. Se usó una jeringa Hamilton Microliter de 100 ^L para sobrecargar un circuito de muestra de PEEK de 100 ^L en dos inyecciones de ~100 ^L cada una de la mezcla de reacción. Se usó una jeringa Hamilton Gastight de 100 ^L para cargar ~110 ^L de la suspensión celular en un circuito de tubos de FEP de diámetro interior 0,2 mm y ~100 ^L. El circuito se fijó a un rotador mecánico que invertía constantemente el circuito de células aproximadamente una vez cada 1-2 segundos para impedir que las células se asentaran y se concentraran. La emulsión se formó mediante chorro de flujo enfocado a través de un chip de reactivo Dolomite 2 con recubrimiento fluorófilo interior. Los canales de aceite exteriores contenían 0,5-5,0 % (p/v) de tensioactivo a base de polietilenglicol en aceite de fluorocarbono HFE7500 (Novec 7500). El chorro de emulsión se hizo funcionar a un caudal constante (igual en los canales de la fase celular y la fase de reacción). La salida del chip de emulsión se recogió a través de un tubo PEEK de 12 cm y 0,5 mm de diámetro interior, dejándola caer en tubos de PCR de polipropileno que se mantienen a aproximadamente 0 °C en un bloque refrigerado. Se recogieron cuatro fracciones que contenían cada una de ellas 50 ^L de material acuoso en emulsión (5 minutos de tiempo de ciclo por fracción). La mayor parte del aceite sedimentado se retiró del fondo de cada tubo con una micropipeta capilar. Cada fracción de emulsión se revistió cuidadosamente con 40 pL de solución de revestimiento: EDTA-Na 50 mM, pH 8,0, 0,002 % (p/v) de rojo cresol. Las emulsiones se incubaron en un termociclador con el siguiente programa (minutos:segundos):

1.42,0 °C durante 30:00 (transcripción inversa)

2. 95,0 °C durante 05:00 (desnaturalización de la transcriptasa inversa y las matrices de ADN)

3. 95,0 °C durante 00:10

4. 65,0 °C durante 00:30

5. 72,0 °C durante 00:30

6. Ir a 3, total 55 ciclos (amplificación del código de barras del recipiente y fusión a ADNc)

7. 4,0 °C sin límite de tiempo

La emulsión se mantuvo a 4,0 °C durante la noche.

Ejemplo 4 - Protocolo para descomponer emulsiones para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Usando una punta de micropipeta capilar, se retiró tanta cantidad de solución de revestimiento como fue posible sin retirar el material de emulsión. A cada tubo, se añadieron 12,5 pL de solución de proteasa Qiagen y 2,5 pL de Na-EDTA 0,5 M, pH 8,0. La emulsión se descompuso añadiendo 40 pL de FC-40:perfluorooctanol 1:1 e invirtiendo cuidadosamente aproximadamente 10 veces.

El contenido del tubo se centrifugó cuidadosamente y se incubó en un termociclador con el siguiente programa (minutos:segundos):

1. 50 °C durante 15:00 (digestión con proteasa)

2. 70 °C durante 10:00 (inactivación con proteasa)

3. 95 °C durante 03:00 (inactivación con proteasa y desnaturalización de ADN)

4. 4,0 °C sin límite de tiempo

El tubo se centrifugó y la fase acuosa superior y la interfase se movieron a un tubo de microcentrífuga nuevo y se centrifugaron a 15000 g durante 1 minuto. La fase acuosa superior se transfirió a un nuevo tubo, sin alterar la interfase. Ejemplo 5 - Protocolo para lavar polinucleótidos de emulsiones para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Se añadieron 0,25 V de perlas de estreptavidina NEB en 2 x BW (Tris-Cl 10 mM, pH 8,0, EDTA 1 mM, NaCl 2 M, 0,2 % de Tween-20) y se incubaron a TA durante 15 min. Las perlas se lavaron a continuación con 1 x BW, se lavaron tres veces con 0,001 % de Tween-20 y se eluyeron añadiendo 0,25 V de 0,001 % de Tween-20 y calentando a 95 °C durante 3 min. Se añadieron 5 volúmenes de tampón PB de Qiagen y se aplicaron a una columna de sílice Zyppy. Las perlas se lavaron a continuación con 0,7 mL de tampón de lavado Zyppy y se eluyeron en 180 pL de: Tris-Cl 5 mM, pH 8,8, EDTA 0,1 mM, 0,001 % de Tween-20.

Ejemplo 6 - Protocolo para una primera reacción PCR (PCR1) de polinucleótidos para secuenciación de nueva generación para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Se usaron 163,2 pL de ADNc purificado para la PCR1. Una configuración ejemplar para la primera reacción PCR se presenta en la Tabla 2 siguiente.

Tabla 2

Cuatro reacciones de 60 pL se repartieron el alícuotas en tubos de PCR y se ejecutó el siguiente programa en un termociclador:

1. 98 °C durante 01:00

2. 98 °C durante 00:10

3. 64 °C durante 00:20

4. 72 °C durante 00:20

5. Ir a 2 para un total de 6 ciclos

6. 4 °C sin límite de tiempo

El producto de la PCR se purificó con 1,2 volúmenes de AMPure XP, se lavó con 80 % de etanol y se eluyó en 60 pL de tampón de dilución (Tris-Cl 10 mM, pH 8,0, EDTA 0,1 mM).

Ejemplo 7 - Protocolo para una segunda reacción PCR (PCR2) de polinucleótidos para secuenciación de nueva generación para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Se usaron 20 pL de producto de la PCR1 purificado para cada subcolección (p. ej., cadena de IgL o IgH, o cadena TCRa o TCRp, o cadena TCR^yo TCRS). Una configuración ejemplar para la segunda reacción PCR se presenta en la Tabla 3 siguiente.

Se usó un cebador “P7-index-C7” que comprende la concatenación de Illumina C7, código de barras de 6 bases y secuencias P7:

5 ’ C A A G C A G A A G A C G G C A T A C G A G A T [N N N N N N ]G T G A C T G G A G T T C A G A C G T G T G C T C T

T C C G A T C T 3 ’ .

Se ejecutó el siguiente programa en un termociclador:

1. 98 °C durante 01:00

2. 98 °C durante 00:10

3. 64 °C durante 00:20

4. 72 °C durante 00:20

5. Ir a 2 para un total de 6 ciclos

6. 4 °C sin límite de tiempo

El producto de la PCR se purificó con 1,2 volúmenes de AMPure y se eluyó en 40 pL de tampón de dilución.

Ejemplo 8 - Protocolo para una tercera reacción PCR (PCR3) de polinucleótidos para secuenciación de nueva generación para realizar la secuenciación masiva de alto rendimiento de polinucleótidos de células individuales en emulsión.

Se utilizaron 8 pL de producto de la PCR2 purificado para la qPCR para determinar un número final de ciclos de amplificación. Una configuración para la tercera reacción PCR se presenta en la Tabla 4 siguiente.

Tabla 4

Se ejecutó el siguiente programa en una máquina de qPCR:

1. 98 °C durante 01:00

2. 98 °C durante 00:10

3. 64 °C durante 00:20

4. 72 °C durante 00:20

5. Lectura de la placa

6. Ir a 2 para un total de 25 ciclos

7. 4 °C sin límite de tiempo

Se inspeccionó la gráfica de intensidad de qPCR para determinar el ciclo de amplificación en el que la intensidad de fluorescencia era máxima, pero en el que la amplificación exponencial del ADN todavía no había finalizado. Este fue el número final de ciclos para el punto final de la PCR3.

Se usaron 24,0 pL de producto de la PCR2 purificado para la PCR3 final. Una configuración ejemplar de la reacción PCR para determinar el número de ciclos del punto final de la tercera PCR se presenta en la Tabla 5 siguiente.

Tabla 5

Se ejecutó el siguiente programa en un termociclador:

1. 98 °C durante 01:00

2. 98 °C durante 00:10

3. 64 °C durante 00:20

4. 72 °C durante 00:20

5. Ir a 2 para el número determinado de ciclos.

6. 4 °C sin límite de tiempo

El producto de la PCR se purificó con 1,2 volúmenes de AMPure y se eluyó en 20 pL de tampón de dilución. Las colecciones estaban listas para la secuenciación. Se agruparon según se deseaba, con o sin purificación con gel de agarosa para retirar los amplicones truncados contaminantes y a continuación se secuenciaron usando una plataforma de tecnología de secuenciación de nueva generación.

Ejemplo 9 - Procesamiento de lecturas y asignación de isotipos

Las lecturas del MiSeq de Illumina se procesaron usando conductos personalizados construidos alrededor del paquete pRESTO 1 para generar secuencias consenso de longitud completa para las moléculas de ARNm y las gotas, se anotaron con IgBLAST e IMGT/HighV-QUEST, y se procesaron con comandos personalizados y el paquete Change-O para generar estadísticas y figuras. Las lecturas del MiSeq se desmultiplexaron usando el software de Illumina. Las posiciones con calidad Phred inferior a 5 se enmascararon con nucleótidos. Se identificaron cebadores específicos del isotipo, códigos de barras de las gotas (BG) y códigos de barras moleculares (CBM) en el amplicón y se cortaron, usando el modo de corte de pRESTO MaskPrimers con un error máximo de 0,2. Se generó una secuencia de consenso de la lectura 1 y una secuencia de consenso de la lectura 2 independientemente para cada ARNm de las lecturas agrupadas por identificador molecular exclusivo (IME), que comprende el CBG y el CBM juntos, que son réplicas de la PCR que se generan a partir la misma molécula de ARNm de origen. Los grupos de lecturas de IME se alinearon con MUSCLE y se usó pRESTO para construir secuencias consenso con los parámetros siguientes: maxdiv = 0,1; bf PRIMER; prfreq = 0,6; maxmiss = 0,5; q = 5; >60 % de concordancia de las secuencias de cebador de PCR identificadas para el grupo de lectura; diversidad de nucleótidos máxima = 0,1; usando la regla de la mayoría en las posiciones indel; y enmascarando las de columnas de alineación con calidad posterior (consenso) baja. A continuación, se cosieron las secuencias consenso terminales apareadas en dos rondas. Primero, la alineación sin espacios del extremo de la secuencia consenso de cada par de lectura se optimizó utilizando una aproximación de la puntuación Z y se puntuó con un valor p binomial como se implementó en el modo de alineación de pRESTO AssemblePairs con los parámetros siguientes: longitud mínima = 8; alfa 1 x 10-5 y error máximo = 0,3. Para los pares de lectura que no se lograron coser de esta manera, esto se intentó usando los exones V de la línea germinal de BCR y TCR humanos para hacer de armazón de cada lectura antes de coser o unir las lecturas con espacios, usando los parámetros del modo de referencia de pRESTO AssemblePairs: identidad mínima = 0,5; valor e 1 x 10-5.

Ejemplo 10 - Anotación de segmentos V(D)J y confirmación del isotipo

Se usaron IgBLAST, Change-O y comandos personalizados para identificar los genes V(D)J de la línea germinal de origen, cortar las secuencias de ARNm a una región de V(D)J, identificar las regiones CDR3 y calcular la mutación a partir de las secuencias de nucleótidos V de la línea germinal. IgBLAST cuenta los nucleótidos como emparejamientos incorrectos, pero las secuencias de ARNm con más de 6 nucleótidos en la región V se filtraron para los análisis de mutaciones y los análisis de precisión del apareamiento de fracciones cruzadas. Para las cadenas pesadas de Ig, la identidad del isotipo se confirmó emparejando las regiones C que no eran de cebador (exones de la región constante) con las secuencias esperadas usando los parámetros de puntuación de pRESTO MaskPrimers: inicio = 0; error máximo = 0,2. Los amplicones con identificaciones de regiones C de cebador/no de cebador discordantes se descartaron, excepto dos combinaciones de cebador/no cebador en las que un acontecimiento de interferencia específico del cebador se resolvió mediante inspección visual.

Ejemplo 11 - Agrupación de secuencias V(D)J en linajes clonales.

Las secuencias V(D)J se agruparon en clones usando la agrupación de linajes individuales con una distancia intraclonal ponderada. La agrupación se realizó con el paquete de Change-O DefineClones mediante los parámetros de grupo: modelo = mln; gen = primero; dist = 4,0; norm = ninguno. Primero, todas las secuencias consenso de gotas de cadenas V^hde Ig funcionales se sometieron a “binning” agrupándolas en “bins” de unión V-J, de tal manera que las secuencias que posiblemente procedían del mismo acontecimiento de recombinación inicial se agruparon entre sí (en base al gen de V^hde Ig de mejor emparejamiento, el gen de J^hde Ig de mejor emparejamiento y a la longitud de unión como se identifica mediante IMGT/HighV-QUEST. El umbral de distancia intraclonal se eligió generando un histograma de distancias vecinas más próximas dentro de cada “bin” de V^hde Ig usando la función distToNearest del paquete shm de Change-O, e inspeccionando visualmente el histograma para un detectar una distancia de corte natural (en el valle de un histograma bimodal). Las agrupaciones clonales de cadenas ligeras se definieron usando el mismo modelo y umbral de distancia.

Ejemplo 12 - Filtrado de gotas, cálculo de la fidelidad de apareamiento

La confianza del apareamiento de cadenas ligeras se evaluó de dos formas independientes: usando la concordancia de secuencias de ARNm intragota y la concordancia de pares interréplica. La concordancia de secuencias de ARNm intragota se definió como la diferencia media de nucleótidos por pares (pi de Nei < 0,02) de las secuencias V(D)J en un locus. Las secuencias de ARNm se cortaron a secuencias codificantes de nucleótidos de V(D)J usando anotaciones de IgBLAST. Dentro de cada gota, todas las secuencias de ARNm productivas se agruparon por locus V. Dentro de cada grupo, se alinearon múltiples secuencias usando MUSCLE como se implementó en pRESTO AlignSets usando parámetros predeterminados. Se construyeron cadenas consenso de las gotas a partir de múltiples ARNm por locus usando los parámetros de pRESTO: BuildConsensus.py; div máxima = 0,2; ausencia máxima = 0,5. Se usaron gotas barajadas aleatoriamente para seleccionar el valor de corte de la diversidad pi < 0,02. En las gotas barajadas, menos de 0,01 % de los locus de las cadenas pesadas (<0,2 % de los locus de las cadenas ligeras) cumplieron estos criterios. Se separaron las gotas con múltiples células o receptores inmunitarios incluidos para el análisis de precisión posterior.

La precisión del apareamiento se calculó en base a la observación del mismo par de clones en múltiples réplicas (experimentos de emulsión independientes), centrándose en los grupos de VDJ que probablemente contenían solo un único linaje, es decir, que procedían de un único reordenamiento de V(D)J y VJ seguido de expansión. Pueden surgir reordenamientos de VDJ similares en un individuo en múltiples momentos independientes, que conducen al mismo reordenamiento de V(D)J de las cadenas pesadas apareados naturalmente con múltiples reordenamientos de VJ de las cadenas ligeras diferentes. Como los reordenamientos de V(D)J raros proporcionarían una medida más exacta de la precisión técnica lograda por los procedimientos descritos en esta memoria, se utilizaron CDR3 pesadas largas (CDR3^h) para un enfoque para este análisis (como un proxy para reordenamientos V(D)J más raros). Las secuencias con >6 nucleótidos también se retiraron para aumentar la confianza de la asignación clonal. La precisión del apareamiento aumentó con la longitud de las CDR3^hhasta más de 96 % para el cuartil de clones más largos observados en las fracciones (2604 clones con longitud de unión >54 nucleótidos). Como la probabilidad de concordancia de los pares de clones es la probabilidad de unión de pares verdaderos en dos experimentos independientes, la precisión del apareamiento se estimó como la raíz cuadrada de la concordancia de apareamiento

en las réplicas, calculada como se indica a continuación, donde d f es el número de códigos de barras de las gotas d con clon pesado h y clon ligero 1 apareados, y encontrados en la fracción física f. La precisión de apareamiento media (cuadrática) para cada experimento se estima promediando, sobre los clones pesados h y todos los pares de fracciones (f, g), la concordancia de los clones ligeros apareados (l, k):

(p recisió n 2) = m ed ia (P ;P J

pares de cadenas pesadas concordantes entre la s fracciones

total de pares en los que se observa un clon pesado en todas las fracciones

■ 3157

(precisión2) — -

Por lo tanto, la precisión media de cada experimento (dentro de la varianza de la precisión entre experimentos) fue 96,1 % según este experimento ejemplar.

Ejemplo 13 - Análisis filogenético del VIH.

Se descubrieron nuevos anticuerpos ampliamente neutralizantes (bNAb) contra el VIH extrayendo nuestras secuencias de anticuerpos apareadas procesadas con alto rendimiento para obtener la similitud con bNAb conocidos. Los bNAb conocidos anteriormente de donantes de PGT y otros donantes se extrajeron de la bibliografía. Todos los ARNm de IgH contra el VIH recuperados de las emulsiones se puntuaron en cuanto a su similitud con secuencias aminoacídicas de CDR3 conocidas mediante tblastx 10. Usando secuencias de ARNm de IgH de un donante sano para generar una distribución de referencia de las similitudes de secuencia, se usó un límite de corte del bit score de 27 para segregar las CDR3 de anticuerpos similares a los bNAb candidatas para realizar análisis adicionales. Las secuencias V(D)J de las secuencias candidatas se alinearon con bNAb conocidos usando MUSCLE 11 con los parámetros predeterminados, y en particular con linajes de donantes de PGT usando los parámetros predeterminados, excepto: gapopen = -15. Se generaron árboles con los parámetros predeterminados de PhyML, se manipularon y visualizaron con Newick Utils y Dendroscope y se inspeccionaron manualmente para seleccionar secuencias de cadena pesada de inmunoglobulina intercaladas con secuencias de bNAb conocidas. Las secuencias consenso para cada gota se construyeron como se describió anteriormente con la inspección manual de las alineaciones de cualquier conflicto de aminoácidos dentro de la gota usando JALVIEW. Se seleccionaron ocho secuencias de cadena pesada y sus secuencias de cadena ligera de anticuerpo apareadas de forma natural para la síntesis, la clonación, la expresión y los ensayos de neutralización.

Ejemplo 14 - Análisis y representación gráfica de los datos.

Se generaron diagramas usando los paquetes de R dplyr y ggplot2. Los datos se submuestrearon y/o se procesaron con la función jitter en R con fines de visualización solo en las figuras de los diagramas de dispersión. El submuestreo mínimo fue 20000 gotas por isotipo o como se indicara de otro modo. Los puntos se procesaron con la función jitter añadiendo el ruido vertical y horizontal extraído de la misma distribución de probabilidad uniforme, con máximos <0,2 para las unidades de ARNm y <0,6 % para la mutación.

Claims

REIVINDICACIONES

1. Un procedimiento que comprende:

(a) producir un primer polinucleótido complementario a partir de un primer polinucleótido celular y un segundo polinucleótido complementario a partir de un segundo polinucleótido celular a partir de una pluralidad de células inmunitarias de una muestra con:

(i) un primer cebador diana que comprende una región complementaria a una misma región de los primeros polinucleótidos celulares de la pluralidad de células inmunitarias;

(ii) un segundo cebador diana que comprende una región complementaria a una misma región de los segundos polinucleótidos celulares de la pluralidad de células inmunitarias;

(iii) una transcriptasa inversa que comprende una actividad de transferasa terminal no matricial, donde se añaden 3 o más nucleótidos no matriciales idénticos al extremo 3' del primer y segundo polinucleótidos complementarios;

(iv) una pluralidad de polinucleótidos con código de barras molecular, comprendiendo cada uno:

(A) un código de barras molecular,

(B) una región terminal 5' complementaria a una región de un polinucleótido con código de barras del recipiente, y

(C) una región terminal 3' complementaria a los 3 o más nucleótidos no matriciales; y

(v) un polinucleótido con código de barras del recipiente,

formando de ese modo un primer y un segundo polinucleótido con código de barras único de una única célula; (b) amplificar el polinucleótido con código de barras del recipiente, formando de ese modo un primer y un segundo polinucleótido con código de barras doble de una única célula;

(c) amplificar el primer y segundo polinucleótidos con código de barras doble de una única célula, formando de ese modo una colección de secuencias que comprenden una región variable de los primeros polinucleótidos celulares o los segundos polinucleótidos celulares, o una combinación de las mismas; y

(d) secuenciar una o más de las secuencias de la colección,

donde (a) se realiza en un recipiente de una pluralidad de recipientes, donde el recipiente comprende una única célula inmunitaria de la pluralidad de células inmunitarias.

2. El procedimiento de la reivindicación 1, donde el primer polinucleótido celular es un polinucleótido de cadena pesada de inmunoglobulina (IgH), un polinucleótido de receptor alfa de células T (TCRa) o un polinucleótido de receptor gamma de células T (TCRy); y donde el segundo polinucleótido celular es un polinucleótido de cadena ligera de inmunoglobulina (IgL), un polinucleótido de receptor beta de células T (TCRp) o un polinucleótido de receptor delta de células T (TCR8).

3. El procedimiento de cualquiera de las reivindicaciones 1-2, donde el código de barras molecular de cada polinucleótido con código de barras molecular de la pluralidad es exclusivo, y donde cada polinucleótido con código de barras del recipiente de la pluralidad de recipientes es exclusivo.

4. El procedimiento de cualquiera de las reivindicaciones 1-3, donde (a) comprende extender el primer cebador diana hibridado al primer polinucleótido celular y extender el segundo cebador diana hibridado al segundo polinucleótido celular con la transcriptasa inversa de (a)(iii).

5. El procedimiento de cualquiera de las reivindicaciones 1-4, donde (a) comprende además:

(i) hibridar una región terminal 3' de un polinucleótido con código de barras molecular de la pluralidad a los tres o más nucleótidos no matriciales presentes en el extremo 3' del primer polinucleótido complementario e hibridar una región terminal 3' de un polinucleótido con código de barras molecular de la pluralidad a los tres o más nucleótidos no matriciales presentes en el extremo 3' del segundo polinucleótido complementario; y

(ii) extender el extremo 3' del primer y segundo polinucleótido complementario.

6. El procedimiento de cualquiera de las reivindicaciones 1-5, donde la etapa de amplificación de (b) se realiza antes de fijar el polinucleótido con código de barras del recipiente o simultáneamente a la fijación del polinucleótido con código de barras del recipiente.

7. El procedimiento de cualquiera de las reivindicaciones 1-6, donde la transcriptasa inversa que comprende una actividad de transferasa terminal no matricial se selecciona del grupo que consiste en transcriptasa inversa Superscript II, transcriptasa inversa Maxima, transcriptasa inversa Protoscript II, transcriptasa inversa del virus de la leucemia murina de Moloney (MMLV-RT), transcriptasa inversa HighScriber, transcriptasa inversa del virus de la mieloblastosis aviar (AMV), cualquier transcriptasa inversa que comprende actividad de desoxinucleotidil transferasa terminal y combinaciones de las mismas.

8. El procedimiento de cualquiera de las reivindicaciones 1-7, donde el primer cebador diana o el segundo cebador diana comprende una secuencia de poli(T).

9. El procedimiento de cualquiera de las reivindicaciones 1-8, donde el primer cebador diana comprende una pluralidad de primeros cebadores diana y/o el segundo cebador diana comprende una pluralidad de segundos cebadores diana.

10. El procedimiento de cualquiera de las reivindicaciones 1-9, donde el primer cebador diana comprende una secuencia complementaria a una secuencia de cadena pesada de inmunoglobulina (IgH), una secuencia de región constante de cadena pesada (^ch), una secuencia de TCRa, una secuencia de región constante de TCRa (Ca), una secuencia de TCR^y, una secuencia de región constante de TCR^y(C^y), o una combinación de las mismas, y donde el segundo cebador diana comprende una secuencia complementaria a una secuencia de cadena ligera de inmunoglobulina (IgL), una secuencia de región constante de cadena ligera (C^l), una secuencia de TCRp, una secuencia de región constante de TCRp (Cp), una secuencia de TCR8, una secuencia de región constante de TCRS (CS), o una combinación de las mismas.

11. El procedimiento de la reivindicación 10, donde el procedimiento comprende además determinar, a partir de la secuenciación, pares exclusivos de secuencias de IgL e IgH, pares exclusivos de secuencias de TCRa y TCRp, o pares exclusivos de secuencias de TCR^yy TCRS; donde las secuencias apareadas son secuencias con los mismos códigos de barras del recipiente.

12. El procedimiento de las reivindicaciones 10 u 11, donde el procedimiento comprende además determinar al menos uno de:

(a) el número total de secuencias de IgH, TCRa o TCRy exclusivas;

(b) el número total de secuencias de IgL, TCRp o TCRS exclusivas;

(c) el número total de secuencias de IgH, IgL, TCRa, TCRy, TCRp y TCRS exclusivas;

(d) el número total de secuencias de IgL e IgH apareadas exclusivas, secuencias de TCRa y TCRp apareadas exclusivas o secuencias de TCR^yy TCRS apareadas exclusivas; donde las secuencias apareadas son secuencias con los mismos códigos de barras del recipiente.

(e) la frecuencia de una secuencia de IgH, una secuencia de IgL, una secuencia de TCRa, una secuencia de TCR^y, una secuencia de TCRp o una secuencia de TCRS; o

(f) la frecuencia de una combinación de una secuencia de IgH y una secuencia de IgL frente a una o más distintas, una combinación de una secuencia de TCRa y una secuencia de TCRp frente a una o más distintas, o una combinación de una secuencia de TCRy y una secuencia de TCRS frente a una o más distintas.

13. El procedimiento de cualquiera de las reivindicaciones 1-12, donde la pluralidad de células inmunitarias está enriquecida en células B de memoria, células B indiferenciadas, células B de plasmablastos, células T indiferenciadas, células T de plasmablastos, cualquier subtipo de célula B, cualquier subtipo de célula T, o cualquier combinación de las mismas.

14. El procedimiento de cualquiera de las reivindicaciones 1-13, que comprende además clonar la colección de secuencias apareadas en vectores de expresión de anticuerpos y cotransfectar para el cribado mediante presentación en levaduras.